BR112012009249B1 - Aparelho e método para gerar um sinal de áudio de alta frequência usando sobreamostragem conformável - Google Patents

Aparelho e método para gerar um sinal de áudio de alta frequência usando sobreamostragem conformável Download PDF

Info

Publication number
BR112012009249B1
BR112012009249B1 BR112012009249-9A BR112012009249A BR112012009249B1 BR 112012009249 B1 BR112012009249 B1 BR 112012009249B1 BR 112012009249 A BR112012009249 A BR 112012009249A BR 112012009249 B1 BR112012009249 B1 BR 112012009249B1
Authority
BR
Brazil
Prior art keywords
spectral
factor
input
frequency
input signal
Prior art date
Application number
BR112012009249-9A
Other languages
English (en)
Other versions
BR112012009249A2 (pt
Inventor
Lars Villemoes
Per Ekstrand
Sascha Disch
Frederik Nagel
Stephan Wilde
Original Assignee
Dolby International Ab
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International Ab, Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Dolby International Ab
Publication of BR112012009249A2 publication Critical patent/BR112012009249A2/pt
Publication of BR112012009249B1 publication Critical patent/BR112012009249B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

APARELHO E MÉTODO PARA GERAR UM SINAL DE ÁUDIO DE ALTA FREQUÊNCIA USANDO SOBREAMOSTRAGEM CONFORMÁVEL Um aparelho para gerar um sinal de áudio de alta frequência que contém um analisador (12) para analisar um sinal de entrada para determinar uma informação transiente conformável. Além disto, um conversor espectral (14) é provido para converter o sinal de entrada em uma representação espectral de entrada. Um processador espectral (13) processa a representação para gerar uma representação espectral processada que contém valores de frequências mais altas que a representação espectral de entrada. Um conversor de tempo (17) é configurado para converter a representação espectral processada a uma representação de tempo, em que o conversor espectral ou o conversor de tempo são controláveis para fazer uma sobreamostragem de domínio de frequência para a primeira porção do sinal de entrada que tem a informação transiente associada e para não fazer a sobreamostragem no domínio de frequência para a segunda porção do sinal de entrada que não tem a informação transiente associada.

Description

Especificação
A presente invenção refere-se a codificar sinais de áudio, e em particular a métodos de reconstrução de alta frequência que incluem um transmutador de dominio de frequência como um transmutador harmônico.
Na especialidade, até agora, há vários métodos para reconstruir alta frequência usando transposição harmônica ou estiramento de tempo ou similar. Um método usado baseia-se em codificador de vozes de fase. Estes trabalham segundo o principio de fazer uma análise de frequência com resolução de frequência suficientemente alta, e com a decodificação de sinal no dominio de frequência antes de sintetizar o sinal. O tempo de estiramento ou, ou transposição, depende da combinação de curvas de análise, passos de curvas de análise, curvas de sintese, passos de curvas de sintese, assim como de ajuste de fase do sinal analisado.
Um dos problemas que inevitavelmente existem com estes métodos é a contradição entre a resolução de frequência 20 necessária para conseguir uma transposição de alta qualidade para sons estacionários, e a resposta transiente do sistema para o som transiente.
Um algoritmo que emprega codificador de voz de fase como, por exemplo, descrito em M. Puckette. Codificador de voz de fase bloqueada. IEEE ASSP Conferencia sobre Aplicações de Processamento de Sinal para Áudio e Acústica, Mohonk 1995.", Rõbel, A.: Transient detecção e preservação no codificador de voz de fase; citeseer.ist.psu.edu/67924 6.html; Laroche L., Dolson M. :
"Modificação de Escala Temporal de Áudio por Codificador de voz Melhorado de Fase ”, IEEE Trans. Processamento de Voz e Áudio, vol. 7, no. 3, pp. 323—332 e Patente USA 6549884 Laroche, J. & Dolson, M. : Um codificador de voz de fase de comutação de passo para geração de conexão, foi apresentado em Frederik Nagel, Sascha Disch "Um método para estirar a largura de faixa (banda) harmônica para codecs de áudio," ICASSP Conferência Internacional sobre Acústica, Processamento de Voz e Sinal, IEEE CNF, Taipei, Taiwan, Abril 2009. No entanto, este método chamado "estiramento harmônico de largura de faixa" (HBE) é propenso a degradações de qualidade de transientes contidos em sinais de áudio, conforme descrito em Frederik Nagel, Sascha Disch, Nikolaus Rettelbach, Abril 2009. "Um método de estiramento de largura de faixa comandado por codificador de voz com inusitado manuseio de transiente para codecs de áudio," 126th Convenção AES, Munich, Alemanha, Maio 2009, uma vez que não se garante que a coerência vertical sobre sub-faixas seja preservada na fase padrão, o algoritmo do codificador de voz de fase e, mais ainda, o recálculo das fases da Transformação Descontinua de Fourier (DFT) deve ser feito em blocos de tempo isolados de uma transformação que implicitamente assume periodicidade circular.
Sabe-se que especificamente, dois tipos de artefatos devidos ao processamento de codificador de voz de fase podem ser vistos. Estes, em particular, são uma dispersão da forma de onda e aliasing temporário devido a efeitos de convolução ciclica temporária do sinal devido à aplicação das recém calculadas fases.
Em outras palavras, por causa da aplicação de uma modificação de fase nos valores espectrais do sinal de áudio no algoritmo BWE, um transiente contido em um bloco do sinal de áudio pode ser envolto em volta do bloco, ou seja, convolvido de retorno ao bloco. Isto resulta em um aliasing temporário e, consequentemente, leva a uma degradação do sinal de áudio.
Portanto, devem-se empregar métodos para tratamento especial de partes de sinal que contêm transientes. No entanto, especialmente uma vez que o algoritmo BWE é feito do lado do decodificador de uma corrente de codecs, a complexidade computacional é um assunto sério. Destarte, medidas contra a degradação de sinal que se acaba de mencionar não devem, de preferência, aparecer ao custo uma complexidade computacional largamente incrementada.
É objetivo da presente invenção prover um conceito eficiente e de alta qualidade de geração de um sinal de áudio de alta frequência.
Este objetivo é alcançado por meio de um aparelho para gerar um sinal de áudio de alta frequência conforme a reivindicação 1, um método para gerar um sinal de áudio conforme a reivindicação 14 ou um programa de computador conforme a reivindicação 15.
A presente invenção usa a característica de tratar os transientes separadamente, ou seja, de maneira diferente das porções não transientes do sinal de áudio. Para este fim, um aparelho para gerar um sinal de áudio de alta frequência compõe-se de um analisador para analisar o sinal de entrada para determinar a informação transiente, ao qual se associa, para uma primeira porção do sinal de entrada, uma informação transiente e onde uma segunda porção retardada do sinal de entrada não tem a informação transiente. 0 analisador pode realmente analisar o próprio sinal de áudio, ou seja, analisando sua distribuição de energia ou alteração em energia para determinar uma porção transiente. Isto 5 requer um determinado olhar à frente de tal forma que, por exemplo, um sinal de saida de codificador de núcleo é analisado num determinado momento antecipado de tal forma que o resultado da análise pode ser usado para gerar o sinal de áudio de alta frequência com base no sinal de saida do codificador de núcleo.
Uma alternativa diferente é fazer uma detecção de transiente do lado do codificador e associar uma determinada informação lateral, como um determinado bit em um fluxo de bits, a uma porção de tempo do sinal que tem a característica de transiente. Então, o analisador é configurado para extrair este bit de informação 15 transiente do fluxo de bits para determinar se uma determinada porção deste sinal de entrada de áudio é transiente ou não. Além disto, o aparelho para gerar um sinal de áudio de alta frequência contém um conversor espectral para converter o sinal de entrada na representação espectral de entrada. A reconstrução da alta 20 frequência é feita dentro do dominio do banco de filtragem, ou seja, subsequente à conversão espectral que usa o conversor espectral. Para este fim, o processador espectral processa a representação espectral de entrada para gerar uma representação espectral processada que contém valores de frequência mais altos que a representação espectral de entrada. Uma conversão de retorno para o domínio de tempo é feita por um conversor de tempo subsequentemente conectado para converter a representação espectral processada a uma representação de tempo. Conforme a presente invenção, o conversor espectral e/ou o conversor de tempo são controláveis para fazer uma sobreamostragem de dominio de frequência para a primeira porção do sinal de entrada que tem associada à informação transiente e para não fazer a sobreamostragem de dominio de frequência para a segunda porção do sinal de entrada que não tem informação transiente associada.
A presente invenção é vantajosa por resultar numa redução de complexidade enquanto, no entanto, retém um bom desempenho transiente para transposições tais como as transposições harmônicas nos bancos de filtragem combinados. A presente invenção, portanto, contém um aparelho e um método conformável de sobreamostragem em frequência de transmutadores combinados em banco de filtragem, onde a sobreamostragem é controlada por um detector transiente de acordo com uma configuração proposta.
Numa configuração proposta, o processador espectral faz uma transposição harmônica de faixas altas adicionais como três ou quatro porções de faixa alta. Em uma configuração, cada porção de faixa alta tem um banco de filtragem separado como uma FFT invertida. Em outra configuração, que é computacionalmente mais eficiente, usa-se um único banco de filtragem de sintese como um único FFT 1024 invertido. Em ambos os casos, a sobreamostragem do dominio de frequência é obtida aumentando o tamanho da transformação por meio de um fator tal como fator 1,5. A entrada adicional FFT é obtida preferivelmente por enchimento de zeros, ou seja, adicionando um determinado número de zeros antes do primeiro valor de um quadro plotado e por adicionar outro número de zeros no fim de um quadro plotado. Em resposta a um sinal de controle FFT, o tamanho do FFT é aumentado por uma sobreamostragem e preferivelmente faz-se um enchimento de zeros apesar de outros valores como determinados valores de ruido diferentes de zero podem também ser adicionados a quadros plotados.
O processo espectral pode, além disto, ser controlado pelo sinal de saida do analisador, ou seja, pela informação transiente de forma que para o caso de porção transiente em que o FFT é mais longo em comparação com o caso não transiente ou não preenchido, iniciar valores de índice para o mapeamento de curvas em um banco de filtragem, ou seja, para transposições diferentes "rounds" ou iterações de transposição são trocadas dependendo do fator de sobreamostragem, onde esta troca consiste preferivelmente de uma multiplicação do índice usado de domínio de transformação pelo fator de sobreamostragem para obter o novo índice de início para a operação de preenchimento para o caso sobreamostrado de domínio de frequência.
Configurações propostas são subsequentemente explicadas em relação aos desenhos anexos nos quais:
Fig. 1 é um diagrama de blocos de um aparelho para a geração de um sinal de áudio de alta frequência;
Fig. 2a é uma configuração do aparelho para gerar um sinal de áudio de alta frequência;
Fig. 2b mostra um processador de replicação de faixa espectral, que contém o aparelho para gerar um sinal de alta frequência da Fig. 1 ou da Fig. 2a como um bloco para processamento de todo o SBR para finalmente obter um sinal de largura de banda estirada;
Fig. 3 mostra uma configuração de ações/passos de processamento feitas dentro do processador espectral;
Fig. 4 é uma configuração da presente invenção em um quadro de vários bancos de filtragem de sintese;
Fig. 5 mostra outra configuração em que se usa um único banco de filtragem de sintese;
Fig. 6 mostra a transposição de um espectro e o respectivo mapeamento de curvas em um banco de filtragem para a configuração da Fig. 5;
Fig. 7a mostra o estiramento transiente de um evento transiente perto do centro de uma curva;
Fig. 7b mostra o estiramento de um transiente perto da borda de uma curva; e
Fig. 7c mostra um estiramento transiente com sobreamostragem que ocorre na primeira porção do sinal de entrada que tem associada uma informação transiente.
A Fig. 1 mostra um aparelho para gerar um sinal de áudio de alta frequência conforme uma configuração. Um sinal de entrada é provido via uma curva de sinal de entrada 10 para um analisador 12 e um conversor espectral 14. O analisador é configurado para analisar o sinal de entrada para determinar uma informação transiente a ser emitida em uma curva de informação transiente 16. Além disto, o analisador descobre se há uma segunda porção posterior do sinal de entrada que não tem a informação transiente. Não há sinais que são sempre transientes. Devido a razões de complexidade, propõe-se fazer a detecção transiente de forma que a porção transiente, ou seja, "uma primeira porção" do sinal de entrada acontece bastante raramente, uma vez que a sobreamostragem engenhosa de dominio de frequência reduz a eficiência, mas é necessário para uma boa qualidade de processamento de áudio. De acordo com a presente invenção, a sobreamostragem de dominio de frequência só é acionada quando ela é realmente necessária e é desligada quando não é necessária, ou seja, é um sinal não transiente, apesar de que sobreamostragem do dominio de frequência pode até ser desligada para sinais transientes que têm eventos transientes perto de um centro da curva como foi comentado no contexto da Fig. 7a. Por razões de eficiência e de complexidade, no entanto, prefere-se marcar a porção determinada como porção transiente quando esta porção inclui um transiente independentemente deste evento transiente ser próximo a um centro de curva ou não. Devido ao processamento de múltiplas sobreposições como comentado no contexto das Figs. 4 e 5, cada transiente, para algumas curvas, estão próximos ao centro, ou seja, é um "bom" transiente, mas está, para outro número de curvas, perto da borda da curva e, portanto, é um "mau" transiente para estas curvas.
O conversor espectral 14 é configurado para converter o sinal de entrada numa representação de sinal de saida on line (conectada) 11. O processador espectral 13 é conectado ao conversor espectral por meio de curva 11.
O conversor espectral 13 é configurado para processar a representação espectral de entrada para gerar uma representação espectral processada que contém valores de frequências mais altas que a representação espectral de entrada. Dito de maneira diferente, o processador espectral 13 faz a transposição, e, preferivelmente, faz uma transposição harmônica, apesar de que outras transposições podem ser feitas também no processador espectral 13. A representação processada espectral sai do processador 13 por uma curva 15 a um conversor de tempo 17, em que o conversor de tempo 17 é configurado para converter a representação espectral processada a uma representação de tempo. Preferivelmente, a representação espectral é um dominio de frequência ou representação de dominio de banco de filtragem e a representação de tempo é uma simples largura de faixa total de representação de dominio de tempo, apesar do conversor de tempo poder ser também configurado para transformar diretamente a representação espectral processada 15 num dominio de banco de filtragem que tem sinais de sub-faixa individual cada uma com largura de faixa maior que um banco de filtragem FFT. Portanto, a representação de tempo de saida na curva de saida 18 pode também conter um ou vários sinais de sub-faixa, onde cada sinal de sub- faixa tem uma largura de faixa maior que uma curva ou valor de frequência na representação espectral processada.
O conversor espectral 14 ou o conversor de tempo 17 ou ambos os elementos são controláveis no que se refere ao tamanho do algoritmo de conversão espectral para fazer a sobreamostragem do dominio de frequência para a primeira porção do sinal de áudio que tem associada à informação transiente e para não fazer a sobreamostragem do dominio e frequência para a segunda porção do sinal de entrada que não tem a informação transiente para prover uma alta eficiência e uma complexidade reduzida sem qualquer perda de qualidade de áudio.
De preferência, o conversor espectral é configurado para fazer a sobreamostragem do dominio de frequência pela aplicação de um comprimento de transformação maior para a primeira porção que tem informação transiente associada comparado ao comprimento de transformação aplicado à segunda porção, em que o comprimento de transformação maior contém dados de enchimento. A diferença no comprimento entre dois comprimentos de transformação é representada pelo fator de sobreamostragem de dominio de frequência que pode estar no intervalo de 1.3 a 3, e, preferivelmente, é tão baixo quanto possivel, mas suficientemente grande para assegurar que "maus transientes" como mostrado na Fig. 7 não introduzem qualquer pré-eco ou apenas introduzem pequenos pré-ecos toleráveis. O valor proposto de sobreamostragem está entre 1.4 e 1.9.
Subsequentemente, a Fig. 2a é descrita para prover mais detalhes sobre o conversor espectral 14, o processador espectral 13 ou o conversor de tempo 17 da Fig. 1 conforme a configuração proposta.
O conversor espectral 14 contém um plotador de análise 14a e um processador FFT 14b. Além disto, o conversor de tempo contém um módulo FFT invertido 17a, um plotador de sintese 17b e um processador de sobrepor-adicionar em 17c. Um aparelho engenhoso pode conter um único conversor de tempo 17 como, por exemplo, mostrado em relação às Fig. 5 e Fig. 6, ou pode conter um único conversor espectral 14 e vários conversores como mostrado na Fig. 4. O processador espectral 13 contém, preferivelmente, um módulo de processamento/transposição de fase 13a, que é a seguir descrito com maiores detalhes. O módulo de transporte/processamento pode, no entanto, ser implementado porqualquer um dos algoritmos de adesão conhecidos de alta frequência de curvas de baixa frequência dentro de um banco de filtragem tal como sabido de M. Dietz, S. Liljeryd, K. Kjoerling e O. Kunz "Replicação de Faixa Espectral, uma Nova Abordagem em Codificação de Audio", na 112th Convenção AES, Munich, Maio 2002. Um algoritmo de adesão é, além disto, descrito em ISO/IEC 14496-3:2001 (norma MPEG-4). Em contraste ao algoritmo de adesão na norma MPEG-4, no entanto, propõe-se que o processador espectral 13 faça uma transposição harmônica em vários "rounds" ou iterações como comentado em detalhes em relação à Fig. 6 e à configuração de único banco de filtragem de sintese da Fig. 5.
A Fig. 2b mostra uma SBR (replicação espectral de faixa) para um processador de reconstrução de alta frequência. Numa curva de entrada 10 um decodificador de núcleo de sinal de saida que pode, por exemplo, ser um sinal de saida de dominio de tempo é provido para o bloco 20, que simboliza o processamento da Fig. 1 ou da Fig. 2a. Nesta configuração o conversor de tempo 18 finalmente emite um sinal de dominio de tempo real. Este sinal de dominio de tempo real é subsequentemente introduzido em um passo de análise QMF (Filtro Menor de Quadrature) 21, que provê uma pluralidade de sinais de sub-faixa na curva 22. Estes sinais de sub-faixas individuais são introduzidos num processador SBR 23, que, adicionalmente, recebe parâmetros SBR 24, que são tipicamente deduzidos de um fluxo de bits de entrada, ao qual pertence o sinal codificado de baixa faixa é introduzido dentro do decodificador de núcleo (não mostrado na Fig. 2b) . O processador SBR 23 emite um envelope calibrado e em outros respeitos sinais manuseados de alta frequência para uma passo de sintese QMF 25, que, finalmente,emite na curva 26 um sinal de áudio de faixa alta no dominio de tempo. O sinal da curva 26 é encaminhado a um combinador 27, que, em adição, recebe o sinal de baixa faixa por meio de uma curva de desvio (by-pass) 28. Prefere-se que a curva de desvio 28 ou o combinador introduza um retardamento suficiente no sinal de baixa faixa de tal forma que o sinal de faixa alta correto 26 é combinado com o sinal correto de faixa baixa 28. Alternativamente, o passo QMF de síntese 25 pode prover a função de um passo de síntese e de um combinador, quando o sinal de baixa faixa está também disponível na representação QMF e quando a representação QMF da faixa baixa é provida aos canais mais baixos do passo de síntese QMF 25 como mostrado pela curva 29. Neste caso, o combinador 27 não é necessário. Ou na saída do passo de síntese QMF 25 ou na saída do combinador 27, o sinal estendido de largura de faixa é emitido. Este sinal pode ser armazenado, transmitido ou substituído por meio de um amplificador e um alto-falante.
A Fig. 4 mostra uma configuração da presente invenção baseada na pluralidade dos diversos conversores de tempo 170a, 170b, 170c. Adicionalmente, a Fig. 4 mostra o processamento do plotador de análise 14a da Fig. 2a com um passo largo de análise a, que é de 128 amostras nesta configuração. Quando se considera um comprimento de 1024 amostras para uma curva de análise, significa um processamento de sobreposição de 8-dobras do plotador de análise 14a.
Na saída do bloco 14, há uma representação espectral que é processada por meio de processadores paralelos de fase 41, 42, 43. O processador de fase 41, que faz parte do processador espectral 13 na Fig. 1 recebe, como entrada, valores espectrais de preferência complexos do conversor espectral 14 e processa cada valor de tal modo que cada fase de cada valor é multiplicada por dois. Na saida do processador de fase 14, há a representação espectral processada que tem a mesma amplitude de antes do bloco 41, mas que tem cada fase multiplicada por 2. De 5 modo semelhante, o processador de fase 42 determina a fase de cada curva espectral de entrada e a multiplica por um fator 3. Analogamente, o processador de fase 43 novamente recupera a fase de cada saída de curva complexa de saida por meio deste conversor espectral e multiplica a fase de cada curva espectral por 4.
Então, as saídas dos processadores de fase são encaminhadas aos respectivos conversores de tempo 170a, 170b, 170c. Além disto, os infra-amostradores 44 e 45 são providos, onde o infra-amostrador 44 tem um fator de infra-amostragem 3/2 e o infra-amostrador 45 tem um fator 2 de infra-amostragem. Na saída dos infra- amostradores 44, 45 e na saída do conversor de tempo 170a, todos os sinais estão na mesma taxa de amostragem que é igual a 2fs e pode, portanto, ser somada a uma amostra simplesmente por meio do adicionador 46. Daqui, o sinal de saída no adicionador 46 tem dupla frequência de amostragem do sinal de saída fs à esquerda da Fig. 4. Uma vez que o sinal de saída do conversor espectral de tempo 170a está no dobro de tamanho da taxa de amostragem de entrada, faz-se um processo de sobreposição-adição com passo diferente de, neste exemplo, 256 no bloco 170a. Consequentemente, forma-se outro processamento de sobreposição-adição identificado 25 por "3" no conversor b de tempo, e um passo ainda maior 512 é aplicado pelo conversor de tempo 170c. Apesar de que os itens 44 e 45 fazem uma infra-amostragem 3/2 e 4/2, esta infra-amostragem corresponde em certo sentido a uma infra-amostragem tripla e a uma infra-amostragem quádrupla como se sabe da teoria do codificador de voz de fase. O fator 1/2 provém do fato que a saída do elemento 170a está, de qualquer maneira, na frequência de dupla amostragem versus a entrada, e o primeiro processamento como pelo combinador 46 é feito no dobro da taxa de amostragem. Neste contexto, deve-se salientar que o aumento da taxa de amostragem para o dobro da taxa de amostragem ou para outra taxa mais alta de amostragem pode do sinal de áudio de alta frequência ser necessário, uma vez que o conteúdo espectral do sinal de áudio de alta frequência é maior e, para produzir um sinal sem aliasing, a taxa de amostragem também deve aumentar de acordo com o teorema da amostragem.
A geração de frequências altas é feita alimentando os diversos conversores de tempo 170a, 170b, 170c, de tal forma que os sinais de saída dos processadores espectrais 41, 42, 43 são introduzidos nos canais respectivos de frequência. Além disto, os conversores de tempo 170a, 170b, 170c têm um espaçamento ampliado de frequência comparado contra o banco de filtragem de entrada 14, de tal forma que, em vez do mesmo tamanho destes processadores, ou seja, o mesmo tamanho FFT, o sinal gerado por este processador representa um maior conteúdo espectral, ou, dito de maneira diferente, uma frequência máxima alta.
O analisador 12 é configurado para recuperar a informação transiente do sinal de entrada e para controlar os processadores 14, 170a, 170b, 170c no uso de um tamanho maior de transformação e para usar valores inflados antes do começo do quadro plotado e após o fim do quadro plotado, de tal forma que a sobreamostragem de domínio de frequência é feita de modo conformável. Numa configuração alternativa mostrada na Fig. 5, emprega-se um único banco de filtragem 17 em vez de três bancos de filtragem de sintese 170a, 170b, 170c. Para este fim, o conversor de fase 13 faz, coletivamente, um processamento de fase correspondente às multiplicações por 2, por 3 e por 4 como identificado nos blocos 41 to 43 na Fig. 4. Além disto, o conversor espectral 14 faz uma operação de plotagem com um passo de análise 128, e o conversor de tempo 17 faz um processamento de sobreposição-adição com um passo de sintese 256. O conversor de tempo 17 faz uma conversão de frequência-tempo enquanto aplica um espaçamento duplo entre curvas individuais de frequência. Uma vez que a saida do bloco 17 tem, para cada curva, 1024 valores, e uma vez que a taxa de amostragem é duplicada, o comprimento de tempo de um quadro plotado é metade do montante de comprimento de tempo de um quadro de entrada. Esta redução no comprimento é equilibrada pela aplicação de um passo de sintese 256 ou, dito de maneira geral, um passo de sintese duas vezes o passo de análise. De maneira geral, o passo de sintese deve ser maior que o passo de análise por um fator que pode ser igual ao fator de aumento da frequência de amostragem.
A Fig. 5 mostra uma estrutura eficiente combinada de banco de filtragem para o transmutador, em que os dois ramos mais baixos da Fig. 4 são omitidos. A terceira e a quarta ordem harmônica são então produzidas no banco de segunda ordem como mostrado na Fig. 5. Devido à troca dos parâmetros do banco de filtragem T=3, 4, o simples mapeamento 1 a 1 de sub-faixas na Fig. 3 deve ser generalizado para regras de interpolação como comentado no contexto da Fig. 6. Em principio, se o espaçamento fisico do banco de filtragem de sintese de sub-faixas é o dobro daquele do banco de filtragem de análise, a entrada para a faixa de sintese com o indice n é obtida das faixas de análise com indice k e k+1. Adicionalmente, para fins de definição, admite-se que k+r representa as representações inteira e fracionária de nQ/T. Uma interpolação geométrica das magnitudes é aplicada com poderes (1- r) e r, e as fases são linearmente combinadas com o peso T(l-r) e Tr. Para o caso de exemplo onde Q é igual a 2, os mapeamentos de fase para cada fator de transposições são mostrados graficamente na Fig. 6. Especificamente, a Fig. 6 mostra, à esquerda, uma representação gráfica do espectro de transposição e, do lado direito, o mapeamento das curvas no domínio dos bancos de filtragem, ou seja, a alimentação de uma curva de fonte a uma curva de alvo, onde a curva de fonte é uma saída do banco de filtragem de análise, ou seja, um conversor espectral, e onde a curva de alvo ou caixa ou caixa de alvos é uma entrada em uma síntese ou conversor de tempo. Esta "reconexão" ou alimentação de caixas de fonte a caixas de alvo na realidade gera frequências mais altas, uma vez que, por exemplo, um índice de frequência k é, como pode ser visto no meio e na porção mais baixa do lado esquerdo, transmudado para uma frequência 3/2k ou 2k, mas em sistema que tem dupla taxa de amostragem de tal forma que, no fim, a transposição de uma frequência física correspondente a, por exemplo, k numa porção da Fig. 6 identificado por fs a uma frequência alvo k, 3/2k ou 2k corresponde a uma transposição ou a uma frequência física por 2, 3, ou 4, respectivamente.
Além do mais, a primeira porção à esquerda da Fig. 6 mostra uma transposição por um fator 2, apesar de que a curva de frequência com índice k é mapeada a uma curva de frequência com o mesmo índice k. A transposição, no entanto, toma lugar devido à taxa de mesma amostragem por um fator 2 implicitamente feita pelo uso do mesmo tamanho de núcleo FFT, mas com espaçamento diferente, ou seja, com um duplo espaçamento de frequência. Em vista disto, o mapeamento de curvas no banco de filtragem do banco de filtragem de análises (caixa de fonte) às entradas do banco de filtragem de síntese (caixas de alvo) serve simplesmente para o primeiro caso, uma vez que os mesmos índices k são mapeados aos mesmos índices k, mas as fases de cada curva espectral de caixa de fonte são multiplicadas por dois como mostrado pelas setas 62 multiplique por dois. Isto resulte em uma segunda ordem de transposição com um fator 2 de transposição.
Para realmente implementar ou aproximar a terceira ordem de transposição, a caixa de alvo estende-se de 3/2k para cima em relação à frequência. O resultado para as caixas de alvo 3/2k e 3/2 (k+2) é, de novo, simples, uma vez que as respectivas curvas espectrais nas caixas de fonte k, k+2, podem ser tomadas como são, e suas fases são respectivamente multiplicadas por 3 como mostrado pelas setas 63 "multiplicar fases". No entanto, as caixas de alvo 3/2 (k+1) não têm uma contrapartida direta nas caixas de fonte. Quando, por exemplo, o exemplo é considerado pequeno onde k é igual a 4 e k+1 é igual a 5, então l,3/2k corresponde a 6 que, dividido por 1.5, resulta em k=4. No entanto, a próxima caixa de alvo é igual a 7, e 7 dividido por 1.5 é igual ao 4.66. Uma caixa de fonte que tem um índice 4.66, no entanto, não existe, uma vez que só existem caixas de fonte inteiras. Portanto, faz-se uma interpolação entre as caixas de fonte vizinhas ou adjacentes k e k+1. Uma vez, no entanto, que 4.66 é mais próximo a 5 (k+1) que a 4 (k) , a informação de fase de caixa de fonte k+1 é multiplicada por 2 como mostrado pela seta 62 e a informação de fase da caixa de fonte k (no exemplo igual a 4) é multiplicada por 1 como mostrado pela seta de fase 61, que representa uma multiplicação de fase por 1. Isto, naturalmente, corresponde a apenas tomar a fase como ela é. Preferivelmente, estas fases, que são obtidas fazendo as operações simbolizadas pelas setas 61 e 62 são combinadas, como somadas junto e, ainda mais preferivelmente, a multiplicação de fase feita por ambas as setas junto resulta num valor de multiplicação 3, que é necessário para a terceira ordem de transposição. Os valores de fase para 3/2k+2 e 3/2 (k+2) +1 são analogamente calculados.
Um cálculo semelhante é feito para a quarta ordem de transposição, onde os valores interpolados são, como mostrado pelas setas 62 calculados por duas caixas de fonte, onde a fase de cada caixa de fonte é multiplicada por dois. Por outro lado, as fases para as caixas de alvo diretamente correspondentes que são múltiplos inteiros não é preciso ser interpoladas, mas calculadas usando as fases de caixas de fonte multiplicadas por quatro.
Deve-se salientar que, numa configuração proposta, onde há cálculo direto de caixa de alvo de uma caixa de fonte, as fases são somente modificadas em relação às caixas de fonte e as amplitudes das caixas de fonte são mantidas como são. Em relação aos valores interpolados, prefere-se fazer uma interpolação entre as amplitudes das duas caixas de fonte, mas outras maneiras de combinar estas duas caixas de fonte podem também ser feita, tal como, tomando sempre a maior amplitude das duas caixas de fonte adjacentes ou a mais baixa amplitude das duas caixas de fonte adjacentes ou o valor da média geométrica ou o valor da média aritmética ou qualquer outra combinação de amplitudes de caixas de fonte adjacentes.
A Fig. 3 mostra uma configuração proposta num fluxograma para o procedimento na Fig. 6. No passo 30, uma caixa de alvo é selecionada. Então, no passo 31, uma fase é calculada multiplicando uma única fase usando um fator de transposição, se possivel. O passo 31, portanto, aplica-se às ocorrências, em que uma fase de multiplicação 3-vezes pode ser feita na terceira ordem de transposição ou onde se faz uma multiplicação por 4 (setas 64) na quarta ordem de transposição. Para calcular as caixas de alvo interpoladas, não é possivel calcular diretamente estes valores de uma única caixa de fonte. Ao invés, caixas de fonte adjacentes a serem usadas para a interpolação são selecionadas como mostrado no passo 32. Numa configuração, a caixa de fonte adjacente as caixas adjacentes de fonte são a dois inteiros que englobam números não inteiros obtidos dividindo a caixa de alvo a ser calculada pelo fator de transposição inteiro ou pelo fator fracionário de transposição no caso de uma amostragem combinada na Fig. 5. Donde, no passo 33, os fatores correspondentes de fase são aplicados às fases de caixas adjacentes de fonte para calcular a fase de caixa de alvo. A soma dos fatores de fase aplicada às caixas adjacentes de fonte é igual ao fator de transposição como foi mostrado na porção média, por exemplo, aplicando uma "multiplicação" de fase de vez única pela seta 61 e duas vezes de multiplicação de fase pela seta 62 para obter uma multiplicação de fase (1 + 2) correspondente ao fator de transposição T igual a 3 para a terceira ordem.
Então, no passo 34, a amplitude da caixa de alvo é determinada preferivelmente interpolando as amplitudes da caixa de fonte. Em uma configuração alternativa, as amplitudes da caixa de alvo podem ser aleatoriamente selecionadas dependendo das amplitudes da caixa de fonte ou de uma amplitude média de caixas de alvo calculadas diretamente. Quando uma seleção aleatória é aplicada, um valor médio ou uma das duas caixas de fonte podem ser prescritos como valor médio para o processo aleatório.
A resposta melhorada transiente do transmutador é obtida por meio de sobreamostragem de dominio de frequência, que é implementada usando núcleos DFT de comprimento 1024F e por nenhum enchimento das curvas de análise e de sintese simetricamente àquele comprimento. Aqui, F é o fator de sobreamostragem no dominio de frequência.
Por razões de complexidade, é importante manter mínimo o montante de sobreamostragem, donde a teoria subjacente ser explicada a seguir por uma sequencia de figuras.
Considere-se o sinal de protótipo transiente, um pulso de Dirac no tempo t=t0. Assim, multiplicando a fase por T parece ser coisa correta a fazer para conseguir a transformação de um pulso em t=Tt0. De fato, tal transmutador teórico com uma curva de duração infinita daria o estiramento correto de um pulso. Para a análise da curva de duração finita, a situação fica embaralhada pelo fato que cada bloco de análise deve ser interpretado como um intervalo de um período de um sinal periódico com período igual ao tamanho do DFT.
Na Fig. 7a, as curvas estilizadas de análise e de síntese são representadas no topo e na base do gráfico respectivamente. O pulso de entrada em t=t0 é representado no topo do gráfico com uma seta vertical. Admitindo-se que o bloco de transformação DFT é do tamanho L, o efeito da multiplicação de fase por T produz a análise DFT de um pulso em t=Tt0 (sólido) e cancela as outras contribuições (tracejadas). Na próxima curva, o pulso tem outra posição em relação ao centro e o comportamento desejado é mover o pulso a T vezes sua posição em relação ao dentro da curva. Este comportamento garante que todas as contribuições somam-se a um único pulso sintetizado de tempo alongado.
O problema aparece para a situação da Fig. 7b, onde o pulso se move mais para fora na direção da borda do bloco DFT. O componente pego pela curva de sintese é um pulso em t=Tt0- L. O efeito final sobre o áudio é a ocorrência de um re-eco a uma distância de tempo comparável á escala das (bastante longas) curvas do transmutador.
O efeito benéfico da sobreamostragem do dominio de frequência é demonstrado pela Fig. 7c. O tamanho da transformação DFT é ampliado a FL onde L é a duração da curva e F21.
Agora, o periodo dos trens de pulso é FL e as contribuições indesejadas ao estiramento o do pulso podem ser canceladas selecionando um valor grande de F. Para qualquer pulso na posição t=to <L/2 a indesejada imagem em t=Tt0-FL deve ser localizada à esquerda da borda esquerda da curva de sintese em t=- L/2. Equivalentemente, TL/2-FL^L/2, levando à regra
Figure img0001
Uma análise mais quantitativa revela que pré-ecos são ainda reduzidos usando sobreamostragem de dominio de frequência levemente inferior ao valor imposto pela desigualdade, simplesmente porque as curvas consistem de valores pequenos perto das bordas.
Na transposição como na Fig. 2, a dedução acima implica o uso de um fator de sobreamostragem F=2.5 para cobrir todos os casos T=2,3,4. Numa contribuição anterior foi mostrado que o uso de F=2 já leva a uma melhoria significativa de qualidade. Na implementação do banco de filtragem combinado da Fig. 3 é suficiente o uso do menor valor F=1.5.
Uma vez que a sobreamostragem é somente necessária em partes transientes do sinal, uma detecção de transiente é feita no codificador e uma sinalização de transiente é enviada ao decodificador para cada quadro de codificador de núcleo para controlar o montante de sobreamostragem no decodificador. Quando a sobreamostragem está em ação, o fator F=1.5 é usado pelo menos para todos os grânulos de transmutadores para os quais a curva de análise parte no quadro corrente codificador de núcleo.
Na Fig. 7c, o "enchimento nulo" é mostrado como uma porção 70 antes do primeiro valor não nulo da curva e uma porção 71 após o último valor não nulo da curva. Portanto, pode-se interpretar a curva na Fig. 7c como uma nova curva maior que tem fatores de peso nulo no começo e no seu fim. Isto significa que, quando esta curva que tem um comprimento maior é aplicada pela curva de análise 14a ou pela curva de sintese 17b, um passo separado de "enchimento nulo" não é necessário, uma vez que o enchimento nulo é automaticamente feito peia aplicação de uma curva que tem porção nula no começo e uma porção nula no fim. Numa alternativa proposta, no entanto, as curvas não são mudadas, mas são sempre usadas da mesma forma, mas, assim que uma detecção de transiente tem sucesso, zeros são adicionados antes do começo do quadro plotado ou depois do fim do quadro da curva ou antes do começo e depois do fim do quadro da curva, e isto pode ser considerado um passo separado que é separado da plotagem, e que é também separado do cálculo e que é também separado do cálculo da transformação. No caso de um evento transiente, preferivelmente zeros, de tal forma que o resultado, ou seja, o quadro plotado e os zeros adicionados são exatamente os mesmos que seriam obtidos quando a curva que tem zero porções 70 e 71 mostradas na Fig. 7c for aplicada.
Semelhantemente, no caso de sintese, pode-se aplicar tanto uma curva mais longa especificada de sintese no caso de um evento transiente, que traz para zero os valores principais e os últimos valores de um quadro gerado pelo processador invertido FFT 17a. No entanto, prefere-se sempre aplicar a mesma curva de sintese, mas para simplesmente apagar, ou seja, cancelar valores do começo da saida FFT"1, onde o número de valores nulos (valores enchidos) é apagado no começo e no fim da saida do bloco pelo processador 17a corresponde ao número de valores zero enchidos.
Além disto, a detecção de um evento transiente dá partida a um indice de controle através de uma linha de controle de indice de partida 29 na Fig. 2a. Para este fim, os indices de partida k, e consequentemente, também os indices 3/2k e 2k são multiplicados pelo fator de sobreamostragem do dominio de frequência. Quando este fator é, por exemplo, um fator 2, cada k na porção esquerda da Fig. 6 é substituído por 2k. Os outros procedimentos, no entanto, são feitos da mesma maneira como mostrado.
Preferivelmente, o transiente é sinalizado para um quadro que é usado para gerar o sinal realçado de alta frequência, ou seja, um assim chamado quadro SBR. Então a primeira porção seria um quadro SBR contendo um evento transiente e a segunda porção do sinal de entrada seria um quadro SBR atrasado no tempo que não contém um transiente. Cada curva, que tem pelo menos um único valor de amostra deste quadro transiente, portanto seria enchida de zeros de tal forma que quando um quadro tem o comprimento de uma curva e quando o evento transiente é uma simples amostra, isto resulta em oito curvas sendo transformadas usando um transformador mais longo com valores de enchimento.
A presente invenção pode também ser considerada como um aparelho para transposição de dominio de frequência, onde é feita uma sobreamostragem conformável de dominio de frequência em um banco de filtragem de transmutadores combinados, que é controlada por um detector de transiente.
Apesar de que alguns aspectos têm sido descritos no contexto de um aparelho, fica claro que estes aspectos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa de método ou uma característica de uma etapa de método. Analogamente, aspectos descritos no contexto de uma etapa de método também representam uma descrição de um bloco respectivo ou item ou característica de um aparelho correspondente.
Dependendo de determinadas exigências de implementação, configurações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser feita pelo uso de meio de armazenamento digital, por exemplo, um floppy disk, um DVD, um Blue-Ray, um CD, um ROM, um PROM, um EPROM, um EEPROM ou uma memória FLASH, que têm sinais de controle eletronicamente legiveis armazenados, que cooperam (ou são capazes de cooperar) com um sistema de computador programável tal que o respectivo método é executado.
Algumas configurações conforme a invenção contém uma portadora de dados que tem sinais de controle eletronicamente legiveis, que são capazes de cooperar com um sistema de computador programável, tal que um dos métodos aqui descritos é executado.
Em geral, configurações da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, o código de programa sendo operacional para executar um dos métodos quando o produto de programa de computador roda em um computador. O código do programa pode, por exemplo, ser armazenado em uma máquina portadora legivel.
Outras configurações compreendem o programa de computador para executar um dos métodos aqui descritos, armazenados em uma máquina transportadora legível.
Em outras palavras, uma configuração do engenhoso método é, portanto, um programa de computador que tem um código de programa para executar um dos métodos aqui descritos, quando o programa de computador roda em um computador.
Outra configuração do engenhoso método é, portanto uma portadora de dados (ou um meio de armazenamento digital, ou um meio legivel de computação) contendo, nele gravados, o programa de computador para executar um dos métodos aqui descritos.
Outra configuração do engenhoso método é, portanto, um fluxo de dados ou uma sequência de sinais representando o programa de computador para executar um dos métodos aqui descritos. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurada para ser transferido via uma conexão de comunicação de dados, por exemplo, via a Internet.
Outra configuração do engenhoso método é, portanto, um fluxo de dados ou uma sequência de sinais representando o programa de computador para executar um dos métodos aqui descritos.
Outra configuração contém um computador que tem nele instalado o programa de computador para executar um dos métodos aqui descritos.
Em algumas configurações, um dispositivo lógico programável (por exemplo, uma matriz programável de portal de campo) pode ser usado para executar alguma ou todas as funcionalidades dos métodos aqui descritos. Em algumas configurações, uma matriz programável de portal de campo pode cooperar com um microprocessador para executar um dos métodos aqui descritos. Em geral, aqueles métodos são preferivelmente executados por qualquer aparelho de hardware.
As configurações acima descritas são meramente ilustrativas para os princípios da presente invenção. Fica entendido que modificações e variações dos arranjos e os detalhes aqui descritos são evidentes para outros peritos no ofício. È intenção, portanto, ser limitada apenas ao escopo das reivindicações das patentes pendentes e não aos detalhes específicos apresentados por meio de descrições e explicações das 5 configurações aqui contidas.

Claims (8)

1. Aparelho para gerar um sinal de áudio de alta frequência (18), compreendendo:um analisador (12) para analisar um sinal de entrada para determinar uma informação transitória, em que uma primeira parte do sinal de entrada associou a informação transitória e a segunda parte posterior do sinal de entrada não possui a informação transitória;um conversor espectral (14) para converter o sinal de entrada em uma representação espectral de entrada (11);um processador espectral (13) para processar a representação espectral de entrada para gerar uma representação espectral processada (15) compreendendo valores para frequências sendo mais altas do que frequências da representação espectral de entrada; eum conversor de tempo (17) para converter a representação espectral processada em uma representação de tempo,caracterizado por:o conversor espectral (14) ou o conversor de tempo (17) são controláveis para realizar uma sobreamostragem no domínio da frequência para a primeira parte do sinal de entrada tendo associado a informação transitória e não realizar a sobreamostragem no domínio da frequência para a segunda parte do sinal de entrada ou para realizar uma sobreamostragem de domínio de frequência com um fator de sobreamostragem menor em comparação com a primeira parte do sinal de entrada, eo processador espectral (13) é configurado para calcular um valor para uma frequência mais alta, combinando dois valores adjacentes de frequência da representação espectral de entrada.
2. Aparelho conforme a reivindicação 1, caracterizado por o processador espectral (13) ser configurado para fazer uma transposição usando um fator de transposição processando uma porção espectral da representação do sinal de entrada começando em um determinado índice, epor o determinado índice de frequência ser mais alto para a primeira porção do sinal de entrada e mais baixo para a segunda porção do sinal de entrada.
3. Aparelho conforme a reivindicação 2, caracterizado por por o conversor espectral (14) ou o conversor de tempo (17) serem configurados para fazer uma sobreamostragem no domínio de frequência para a primeira porção da entrada usando um fator de sobreamostragem, epor o processador espectral (13) ser configurado para multiplicar o determinado índice de frequência pelo fator de sobreamostragem para a primeira porção do sinal de entrada.
4. Aparelho conforme a reivindicação 1, caracterizado por o processador espectral (13) ser configurado para calcular uma fase por interpolação de fases (33) dos dois valores de frequência adjacentes, ou para calcular uma amplitude (34) por interpolação de amplitudes dos dois valores de frequência adjacentes.
5. Aparelho conforme qualquer uma das reivindicações anteriores, caracterizado por o processador espectral (13) ser configurado para fazer uma transposição usando um fator de transposição, em que (32) para um alvo de frequência não sendo um número inteiro do fator de transposição dividido por um fator de amostragem provido pelo conversor de tempo (17), o processador espectral (13) é configurado para calcular a fase para a frequência alvo usando fases de pelo menos dois valores espectrais adjacentes, cada um multiplicado por um fator de fase individual, os fatores de fase sendo determinados de tal forma que a soma dos fatores de fase é igual ao fator de transposição.
6. Aparelho conforme qualquer uma das reivindicações anteriores, caracterizado por o processador espectral (13) ser configurado para fazer uma transposição usando um fator de transposição, em que para uma frequência alvo não sendo um múltiplo inteiro do fator de transposição dividido por um fator de sobreamostragem provido pelo conversor de tempo (17), o processador espectral (13) sendo configurado para calcular a fase para a frequência alvo usando fases de pelo menos dois valores espectrais adjacentes cada um multiplicado por um fator de fase individual, em que o fator de fase é determinado de tal forma que o fator de fase para um primeiro valor de um valor espectral de entrada é mais baixo que o fator de fase para um segundo valor de representação espectral de entrada, quando um índice para a frequência alvo dividido pelo fator de transposição ou dividido por uma fração do fator de transposição e o fator de sobreamostragem é mais próximo do segundo valor da representação espectral de entrada.
7. Método de geração de um sinal de áudio de alta frequência (18), compreendendo:analisar (12) um sinal de entrada para determinar uma informação transitória, em que uma primeira parte do sinal de entrada associou a informação transitória e a segunda parte posterior do sinal de entrada não possui a informação transitória;converter (14) o sinal de entrada em uma representação espectral de entrada (11);processar (13) a representação espectral de entrada para gerar uma representação espectral processada (15) compreendendo valores para frequências sendo mais altas do que as frequências da representação espectral de entrada; e converter (17) a representação espectral processada em uma representação de tempo,caracterizado por:a etapa de conversão (14) em uma representação espectral de entrada ou a etapa de conversão (17) em uma representação de tempo de uma sobreamostragem de domínio de frequência controlável é realizada para a primeira parte do sinal de entrada tendo a informação transitória, em que a sobreamostragem de domínio de frequência para a segunda parte do sinal de entrada não é realizada ou em que uma sobreamostragem do domínio de frequência com um fator de sobreamostragem menor em comparação com a primeira parte do sinal de entrada é realizada para a segunda parte do sinal de entrada, ea etapa de processamento (13) da representação espectral de entrada compreende o cálculo de um valor para uma frequência mais alta combinando dois valores adjacentes de frequência da representação espectral de entrada.
8. Meio de Armazenamento digital tendo nele armazenado instruções caracterizado por executar, quando rodando em um computador, o método para gerar um sinal de áudio de alta frequência conforme a reivindicação 7.
BR112012009249-9A 2009-10-21 2010-05-25 Aparelho e método para gerar um sinal de áudio de alta frequência usando sobreamostragem conformável BR112012009249B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US25377609P 2009-10-21 2009-10-21
US61/253,776 2009-10-21
PCT/EP2010/057130 WO2011047886A1 (en) 2009-10-21 2010-05-25 Apparatus and method for generating a high frequency audio signal using adaptive oversampling

Publications (2)

Publication Number Publication Date
BR112012009249A2 BR112012009249A2 (pt) 2020-12-22
BR112012009249B1 true BR112012009249B1 (pt) 2021-11-09

Family

ID=42470889

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112012009249-9A BR112012009249B1 (pt) 2009-10-21 2010-05-25 Aparelho e método para gerar um sinal de áudio de alta frequência usando sobreamostragem conformável

Country Status (16)

Country Link
US (1) US9159337B2 (pt)
EP (1) EP2486564B1 (pt)
JP (1) JP5844266B2 (pt)
KR (1) KR101341115B1 (pt)
CN (1) CN102648495B (pt)
AR (1) AR078717A1 (pt)
AU (1) AU2010310041B2 (pt)
BR (1) BR112012009249B1 (pt)
CA (1) CA2778205C (pt)
ES (1) ES2461172T3 (pt)
HK (1) HK1174733A1 (pt)
MX (1) MX2012004623A (pt)
PL (1) PL2486564T3 (pt)
RU (1) RU2547220C2 (pt)
TW (1) TWI431614B (pt)
WO (1) WO2011047886A1 (pt)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011047887A1 (en) 2009-10-21 2011-04-28 Dolby International Ab Oversampling in a combined transposer filter bank
US9312969B2 (en) * 2010-04-15 2016-04-12 North Eleven Limited Remote server system for combining audio files and for managing combined audio files for downloading by local systems
MX2012001696A (es) * 2010-06-09 2012-02-22 Panasonic Corp Metodo de extension de ancho de banda, aparato de extension de ancho de banda, programa, circuito integrado, y aparato de descodificacion de audio.
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
EP4016527B1 (en) 2010-07-19 2023-02-22 Dolby International AB Processing of audio signals during high frequency reconstruction
US9530424B2 (en) 2011-11-11 2016-12-27 Dolby International Ab Upsampling using oversampled SBR
MY197538A (en) 2012-03-29 2023-06-22 Ericsson Telefon Ab L M Bandwidth extension of harmonic audio signal
WO2013172588A1 (ko) * 2012-05-14 2013-11-21 엘지전자 주식회사 무선 통신 시스템에서 위치 측정 방법
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US9704486B2 (en) 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
PL2951815T3 (pl) 2013-01-29 2018-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodery audio, dekodery audio, systemy, sposoby i programy komputerowe wykorzystujące zwiększoną rozdzielczość czasową w otoczeniu czasowym początków lub końców spółgłosek szczelinowych lub spółgłosek zwarto-szczelinowych
SG11201505925SA (en) 2013-01-29 2015-09-29 Fraunhofer Ges Forschung Decoder for generating a frequency enhanced audio signal, method of decoding, encoder for generating an encoded signal and method of encoding using compact selection side information
TWI557727B (zh) 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
CN114566183A (zh) * 2013-04-05 2022-05-31 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
ES2727462T3 (es) * 2016-01-22 2019-10-16 Fraunhofer Ges Forschung Aparatos y procedimientos para la codificación o decodificación de una señal multicanal de audio mediante el uso de repetición de muestreo de dominio espectral
US9947323B2 (en) * 2016-04-01 2018-04-17 Intel Corporation Synthetic oversampling to enhance speaker identification or verification
TWI809289B (zh) 2018-01-26 2023-07-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
CN111835600B (zh) * 2019-04-16 2022-09-06 达发科技(苏州)有限公司 多模式超高速数字用户线路收发器设备及其执行方法
CN114582814A (zh) * 2020-11-30 2022-06-03 泽鸿(广州)电子科技有限公司 支撑结构

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SU980133A1 (ru) * 1981-02-06 1982-12-07 Московский Ордена Трудового Красного Знамени Электротехнический Институт Связи Устройство анализа и синтеза речевого сигнала
SU1316030A1 (ru) * 1986-01-06 1987-06-07 Акустический институт им.акад.Н.Н.Андреева Способ анализа и синтеза речи и устройство дл его осуществлени
US5029509A (en) 1989-05-10 1991-07-09 Board Of Trustees Of The Leland Stanford Junior University Musical synthesizer combining deterministic and stochastic waveforms
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
KR100528325B1 (ko) 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US8374365B2 (en) * 2006-05-17 2013-02-12 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
EP3273442B1 (en) 2008-03-20 2021-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for synthesizing a parameterized representation of an audio signal
US8879643B2 (en) * 2008-04-15 2014-11-04 Qualcomm Incorporated Data substitution scheme for oversampled data
CN102137777B (zh) 2008-08-28 2015-07-29 Trw汽车美国有限责任公司 用于控制可致动的安全设备的方法和装置
EP2234103B1 (en) 2009-03-26 2011-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device and method for manipulating an audio signal

Also Published As

Publication number Publication date
KR20120094916A (ko) 2012-08-27
CA2778205C (en) 2015-11-24
RU2012119259A (ru) 2013-11-27
US20120281859A1 (en) 2012-11-08
EP2486564A1 (en) 2012-08-15
JP5844266B2 (ja) 2016-01-13
CN102648495A (zh) 2012-08-22
AR078717A1 (es) 2011-11-30
TWI431614B (zh) 2014-03-21
BR112012009249A2 (pt) 2020-12-22
TW201133471A (en) 2011-10-01
ES2461172T3 (es) 2014-05-19
JP2013508758A (ja) 2013-03-07
MX2012004623A (es) 2012-05-08
US9159337B2 (en) 2015-10-13
CN102648495B (zh) 2014-05-28
RU2547220C2 (ru) 2015-04-10
AU2010310041A1 (en) 2012-06-14
HK1174733A1 (en) 2013-06-14
EP2486564B1 (en) 2014-04-09
AU2010310041B2 (en) 2013-08-15
WO2011047886A1 (en) 2011-04-28
PL2486564T3 (pl) 2014-09-30
CA2778205A1 (en) 2011-04-28
KR101341115B1 (ko) 2013-12-13

Similar Documents

Publication Publication Date Title
BR112012009249B1 (pt) Aparelho e método para gerar um sinal de áudio de alta frequência usando sobreamostragem conformável
ES2377551T3 (es) Aparato, método y programa informático para generar una representación de una señal de ancho de banda ampliado basándose en una representación de señal de entrada usando una combinación de una ampliación de ancho de banda armónica y una ampliación de ancho de banda no armónica
ES2522171T3 (es) Aparato y método para procesar una señal de audio usando alineación de borde de patching
JP5854520B2 (ja) オーディオ信号用の位相ボコーダに基づく帯域幅拡張方法における改善された振幅応答及び時間的整列のための装置及び方法
CA3200142C (en) Improved subband block based harmonic transposition
BR122019025142B1 (pt) Sistema e método para gerar um sinal de tempo alongado e/ou um sinal de frequência transposta a partir de um sinal de entrada e meio de armazenamento legível por computador não transitório
BR122017018557B1 (pt) Método e aparelho para a determinação de um fator de escala otimizado
ES2950408T3 (es) Decodificación con reducción de escala de señales de audio
BR122021012290B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BRPI1001239B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BR122019025118B1 (pt) Sistema e método para gerar um sinal de tempo alongado e/ou um sinal de frequência transposta a partir de um sinal de entrada e meio de armazenamento legível por computador
BR122021012145B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BR122021012115B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BR122021012125B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BR122021012137B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 25/05/2010, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.

B25G Requested change of headquarter approved

Owner name: FRAUNHOFER-GESELLSCHAFT ZUR FOERDERUNG DER ANGEWANDTEN FORSCHUNG E.V. (DE) ; DOLBY INTERNATIONAL AB (IE)