BR122015019030A2 - codificador de áudio e decodificador de extensão de largura de banda - Google Patents

codificador de áudio e decodificador de extensão de largura de banda Download PDF

Info

Publication number
BR122015019030A2
BR122015019030A2 BR122015019030A BR122015019030A BR122015019030A2 BR 122015019030 A2 BR122015019030 A2 BR 122015019030A2 BR 122015019030 A BR122015019030 A BR 122015019030A BR 122015019030 A BR122015019030 A BR 122015019030A BR 122015019030 A2 BR122015019030 A2 BR 122015019030A2
Authority
BR
Brazil
Prior art keywords
signal
high frequency
bandwidth extension
audio signal
parameter
Prior art date
Application number
BR122015019030A
Other languages
English (en)
Other versions
BR122015019030B1 (pt
Inventor
Griebel Christian
Nagel Frederik
Fuchs Guillaume
Herre Jürgen
Disch Sascha
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of BR122015019030A2 publication Critical patent/BR122015019030A2/pt
Publication of BR122015019030B1 publication Critical patent/BR122015019030B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Abstract

codificador de audio e decodificador de extensão de largura de banda codificador de áudio para prover um sinal de saída usando um sinal de áudio de entrada que compreende um gerador de correção, um comparador e uma interface de saída. 0 gerador de correção gera, no mínimo, um sinal de alta frequência de extensão de largura de banda, onde um sinal de alta frequência de extensão de largura de banda compreende uma banda de alta frequência. a banda de alta frequência, do sinal de alta frequência de extensão de largura de banda, está baseada em uma banda de baixa frequência do sinal de áudio de entrada. um comparador calcula uma pluralidade de parâmetros de comparação. um parâmetro de comparação é calculado com base em uma comparação do sinal de áudio de entrada e em um sinal gerado de alta frequência de extensão de largura de banda. cada parâmetro de comparação, da pluralidade de parâmetros de comparação, está calculado com base em uma frequência desviada diferente entre o sinal de áudio de entrada e um sinal gerado de alta frequência de extensão de largura de banda. ademais, o comparador determina um parâmetro de comparação proveniente da pluralidade de parâmetros de comparação, onde o parâmetro de comparação determinado atende um critério pré-definido.

Description

CODIFICADOR DE ÁUDIO E DECODIFICADOR DE
EXTENSÃO DE LARGURA DE BANDA do PI 0917762-0 depositado em
Pedido Dividido
11/12/2009. DESCRIÇÃO
[0001] Configurações, de acordo com a invenção,
relativas ao processamento de sinal de áudio e, em
particular, a um codificador de áudio, um método para prover
um sinal de saída, um decodifiçador de extensão de largura de
banda e um método para prover um sinal de áudio estendido de
largura de banda.
[0002] A codificação adaptada de escuta de sinais de
áudio, para redução de dados, para um armazenamento eficiente e para a transmissão dos referidos sinais ganhou aceitação em vários campos. Os algoritmos de codificação são conhecidos, por exemplo, como MPEG 1/2 LAYER 3 MP3 ou MPEG 4 AAC. O algoritmo de codificação utilizado para tanto, em particular quando atingidas as mais baixas taxas de bits, leva à redução da qualidade do áudio, que causada com frequência principalmente por uma limitação do lado codificador da largura de banda do sinal de áudio a ser transmitido. Um sinal filtrado de passa-baixas é codificado usando-se um, assim chamado, codificador central e a região com frequências mais altas é parametrizada, assim as frequências podem ser, aproximadamente, reconstruídas a partir do sinal filtrado de passa-baixas.
[0003] É conhecido, devido à patente WO 98 57436, submeter o sinal de áudio para uma limitação de banda, em cuja situação no lado codificador e para codificar apenas uma banda
2/69 mais baixa do sinal de áudio, por meio de um codificador de áudio de alta qualidade. Entretanto, a banda mais alta, somente é aproximadamente caracterizada, ou seja, por um conjunto de parâmetros que permite a reprodução do envelope espectral original da banda mais alta. No lado decodificador, a banda mais alta é, em seguida, sintetizada. Para esta finalidade, é proposta a transposição harmônica, onde a banda mais baixa do sinal de áudio decodificado é provida por um banco de filtros. Os canais do banco de filtros da banda mais baixa são conectados aos canais do banco de filtros da banda mais alta, ou são corrigidos, e cada sinal de passa-faixas corrigido é submetido a um ajuste de envelope. 0 banco de filtros de síntese, pertencente a um banco de filtros de análise especial, ora recebe sinais de passa-faixas do sinal de áudio na banda mais baixa e os sinais de passa-faixas de envelope ajustado da banda mais baixa, que foram harmonicamente corrigidos na banda mais alta. O sinal de saída do banco de filtros de síntese é um sinal de áudio estendido em relação a sua largura de banda de áudio, que foi transmitido do lado codificador para o lado decodificador, com uma taxa de dados bastante baixa. Em particular, os cálculos do banco de filtros e a correção no domínio do banco de filtros podem se tornar um alto esforço computacional.
[0004] Os métodos de complexidade reduzida para uma extensão de largura de banda dos sinais de áudio de banda limitada, em vez do uso de uma função de cópia de porções de sinal de baixa frequência (BF) na faixa de alta frequência (AF), para aproximar a informação ausente devido à limitação de banda. Os referidos métodos estão descritos em Spectral
3/69
Band Replication a novel approach in audio coding, [Replicação de Banda Espectral, uma nova abordagem na codificação de áudio] de M. Dietz, L. Liljeryd, K. Kjõling e 0. Kunz, na 112- Convenção AES, Munique, maio de 2002; SBR enhanced audio codecs for digital broadcasting such as Digital Radio Mondiale (DRM) [Codificadores de áudio aprimorados para replicação de banda espectral (SBR) para transmissão digital como Digital Radio Mondiale (DRM), de S. Meltzer, R. Bõhm e F. Henn, na 112- Convenção AES, Munique, maio de 2002; Enhancing mp3 with SBR: Features and Capabilities of the new mp3PR0 Algorithm, [Aprimorando o mp3 com SBR: características e capacidades do novo algoritmo mp3PRO], de T. Ziegler, A. Ehret, P. Ekstrand e M. Lutzky, na 112- Convenção AES, Munique, maio de 2002; Norma Internacional ISO/IEC 14496-3:2001/FPDAM 1, Bandwidth Extension, [Extensão de banda], ISO/IEC, 2002 ou Speech bandwidth extension method and apparatus [Extensão de largura de banda de voz, método e aparelho], de Vasu Iyengar et al., patente norte-americana n- 5.455.888.
[0005] Nos referidos métodos, nenhuma transposição harmônica é realizada, mas os canais de banco de filtros de passa-faixas adjacente da banda mais baixa são artificialmente introduzidos nos canais de banco de filtros adjacentes da banda mais alta. Isso leva a uma rude aproximação da banda mais alta do sinal de áudio. Esta rude aproximação do sinal é, então, em uma etapa adicional, refinada por meio da definição de parâmetros adicionais de controle, deduzidos do sinal original. Como exemplo, o Padrão
4/69
MPEG-4 utiliza fatores de escala para ajustar o envelope espectral, uma combinação de filtragem inversa e a adição de um patamar de ruído para adaptação da tonalidade, bem como inserções de porções de sinal sinusoidal para complementação dos componentes de tonais.
[0006] A parte disto, há métodos adicionais, como a assim denominada extensão cega de largura de banda, descrita em Efficient high-frequency bandwidth extenslon of music and speech [Extensão eficiente de largura de banda de alta frequência para música e voz], de E. Larsen, R.M. Aarts e M. Danessis, na 112- Convenção AES, Munique, Alemanha, maio de 2002, onde não é utilizada nenhuma informação sobre a faixa de AF original. Ademais, há também o método denominado Artificial bandwidth extension [Extensão artificial de largura de banda], que é descrito no relatório de pesquisa A
Robust Wideband Enhancement for Narrowband Speech Signal [Um robusto aprimoramento de banda larga para sinal de voz de banda estreita], de K. Kãyhkõ, Helsinki University of Technology, Laboratory of Ãcoustics and Audio Signal
Processing, 2001.
[0007]
Em AMR-WB+i a new audio coding standard for
3rd generation mobile audio services Broadcasts, IEEE, ICASSP ' 05, [AMR-WB+: um novo padrão de codificação de áudio para transmissões de serviços de áudio móvel de 3- geração], é descrito um método para extensão de largura de banda, onde a operação de cópia dos componentes de baixa frequência, na banda alta, é realizada por meio da operação de espelhamento obtida, por exemplo, por meio de upsampling do sinal filtrado
5/69 de passa-baixas.
[0008] Como uma alternativa, uma modulação de banda de lado único pode ser empregada, que é basicamente equivalente a uma operação de cópia no domínio de banco de filtros. Os métodos que permitem uma extensão harmônica de largura de banda, geralmente empregam uma etapa de determinação do tom (rastreio de tom), uma etapa de distorção não linear (consulte, por exemplo, Spectral widening of the excitation signal for telephone-band speech enhancement [Ampliação espectral do sinal de excitação para aprimoramento de voz de banda telefônica], de U. Kornagel, em Proceedings of the IWAENC, Darmstadt, Germany, September 2001, pp. 215218 ou utilizam os vocoders [codificadores de fala] de fase, como, por exemplo, ilustrado no pedido de solicitação de patente norte-americana provisória Apparatus and method of harmonic bandwidth extension in audio signals [Aparelho e método de extensão harmônica de largura de banda em sinais de áudio] de F. Nagel, S. Disch, sob o número de solicitação US 61/025129.
[0009] A patente WO 02/41302 Al, por exemplo, ilustra um método para aprimorar o desempenho de sistemas de codificação que utilizam métodos de reconstrução de alta frequência. Ela ilustra como melhorar o desempenho geral dos referidos sistemas por meio de uma adaptação durante o tempo da frequência do crossover entre a banda baixa codificada por um codificador central e a banda alta codificada por um sistema de reconstrução de alta frequência. Para este método, o codificador central deve ser capaz de funcionar com
6/69 diferentes frequências do crossover no lado codificador, bem como no lado decodificador. Portanto, a complexidade do codificador central é aumentada.
[0010] Tecnologias adicionais para a extensão de largura banda são descritas, por exemplo, em A unified approach to low- and high-frequency bandwidth extension [Uma abordagem unificada para extensão de largura de banda de baixa frequência e de alta frequência] de R. M. Aarts, E. Larsen e O. Ouweltjes, na 115- Convenção AES, New York, EUA, outubro de 2003, Áudio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004, de E. Larsen e R. M. Aarts”, Efficient high-frequency bandwidth extension of music and speech [Extensão eficiente de largura de banda de alta frequência] de E. Larsen, R. M. Aarts e M. Danessis. Na 112Convenção AES, Munique, Alemanha, maio de 2002, J. Makhoul:
Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21 (3), June
1973, pedido de solicitação de patente norte-americana 08/951,029, Ohmori et al.: Audio band width extending system and method [Sistema e método de extensão de largura de banda de áudio” e o pedido de solicitação de patente norteamericana 6895375, Malah, D & Cox, R. VS.: System for bandwidth extension of Narrow-band speech [Sistema para extensão de largura de banda de banda estreita de voz] .
[0011] Os métodos de extensão harmônica de largura de banda frequentemente apresentam uma alta complexidade, ao passo que métodos de extensão de banda de complexidade
7/69 reduzida ilustram perdas de qualidade. No caso particular onde uma baixa taxa de bits é combinada a uma largura de banda pequena de banda baixa, podem ocorrer artefatos como irregularidades e um timbre percebido como desagradável. Uma razão para isso é o fato de que a porção de AF aproximada está baseada em uma operação de cópia que não mantém as relações harmônicas entre as porções de sinal tonal. Isso se aplica à relação harmônica entre BF e AF, bem com também à relação harmônica entre correções sucessivas entre a própria porção de AF. Por exemplo, dentro da SBR [replicação de banda espectral], a justaposição dos componentes codificados e dos componentes replicados, que ocorre no limite entre as bandas altas e baixas, pode provocar rudes impressões sonoras. A razão é ilustrada na Figura 18, onde as porções tonais copiadas da faixa BF na faixa AF são espectralmente adjacentes, de modo denso, às porções tonais da faixa BF.
[0012] A Figura 18a ilustra o espectrograma original 1800a de um sinal que consiste de três tons. De modo adequado, a Figura 18b ilustra um diagrama 1800b do sinal estendido de largura de banda referente ao sinal original da Figura 18a. A abscissa indica o tempo e a ordenada indica a frequência. Em particular, no último tom, podem ser observados problemas potenciais 1810 (linhas indistintas 1810) .
[0013] Se as relações harmônicas são consideradas pelos métodos conhecidos, isso sempre é realizado com base em uma estimativa Fo. Nestes casos, o sucesso dos referidos métodos depende, primariamente, da confiança desta
8/69 estimativa.
[0014] Em geral, os métodos conhecidos de extensão de largura de banda provêem sinais de áudio em uma baixa taxa de bits, mas com baixa qualidade de sinal ou uma boa qualidade de sinal em taxas de bits altas.
[0015] Este é o objetivo da presente invenção em prover um esquema aperfeiçoado de codificação para sinais de áudio.
[0016] Este objetivo é obtido por meio de um codificador de áudio, de acordo com a reivindicação 1, um decodifiçador de extensão de largura de banda, de acordo com a reivindicação 3 e com a reivindicação 8, e um método, de acordo com as reivindicações 12, 13 e 14.
[0017] Uma configuração da invenção provê um codificador de áudio para oferecer um sinal de saída que utiliza um sinal de áudio de entrada. O codificador de áudio compreende um gerador de correção, um comparador e uma interface de saída.
[0018] 0 gerador de correção está configurado para gerar, no mínimo, um sinal de alta frequência de extensão de largura de banda. O sinal de alta frequência de extensão de largura de banda compreende uma banda de alta frequência, onde a banda de alta frequência, do sinal de alta frequência de extensão de largura de banda, está baseada em uma banda de baixa frequência do sinal de áudio de entrada. Diferentes sinais de alta frequência de extensão de largura de banda compreendem diferentes frequências dentro de bandas de alta frequência, se forem gerados diferentes sinais de alta
9/69 frequência de largura de banda.
[0019] O comparador está configurado para calcular uma pluralidade de parâmetros de comparação. Um parâmetro de comparação é calculado com base em uma comparação do sinal de áudio de entrada e do sinal gerado de alta frequência de extensão de largura de banda. Cada parâmetro de comparação, da pluralidade de parâmetros de comparação, é calculado com base em uma frequência desviada diferente entre o sinal de áudio de entrada e um sinal gerado de alta frequência de extensão de largura de banda. Ademais, o comparador é configurado para determinar um parâmetro de comparação proveniente da pluralidade de parâmetros de comparação, onde o parâmetro de comparação determinado atende um critério prédefinido.
[0020] Assim, por exemplo, o comparador pode ser configurado para determinar o parâmetro de comparação entre a pluralidade dos parâmetros de comparação que melhor atende um critério pré-definido.
[0021] A interface de salda está configurada para prover o sinal de saida para transmissão ou armazenamento. O sinal de saida compreende uma indicação de parâmetro com base em uma frequência desviada referente ao parâmetro de comparação determinado.
[0022] Assim, o sinal de saida pode compreender o parâmetro de comparação selecionado que indica a frequência desviada ideal.
[0023] Outra configuração da invenção oferece um decodifiçador de extensão de largura de banda para prover um
10/69 sinal estendido de largura de banda, com base em um sinal de áudio de entrada e em um sinal de parâmetro. 0 sinal de parâmetro compreende uma indicação de uma frequência desviada e uma indicação de um parâmetro de densidade de potência. 0 decodifiçador de extensão de largura de banda compreende um gerador de correção, um combinador e uma interface de saída.
[0024] O gerador de correção está configurado para gerar um sinal de alta frequência de extensão de largura de banda que compreende uma banda de alta frequência. A banda de alta frequência, do sinal de alta frequência de extensão de largura de banda, é gerada com base em um ou mais deslocamentos de frequência, de uma banda de frequência do sinal de áudio de entrada. Os deslocamentos de frequência baseiam-se na frequência desviada.
[0025] Ademais, o gerador de correção está configurado para ser capaz de amplificar ou atenuar a banda de alta frequência do sinal de alta frequência de extensão de largura de banda por meio de um fator igual ao valor do parâmetro de densidade de potência ou igual ao valor recíproco do parâmetro de densidade de potência, respectivamente.
[0026] O combinador está configurado para combinar o sinal de alta frequência de extensão de largura de banda e o sinal de áudio de entrada para obter o sinal de áudio estendido de largura de banda.
[0027] A interface de saída está configurada para prover o sinal de áudio estendido de largura de banda.
[0028] Uma configuração adicional da invenção
11/69 oferece um decodificador de extensão da largura de banda para prover um sinal de áudio estendido de largura de banda com base em um sinal de áudio de entrada. 0 decodif icador de extensão de largura de banda compreende um gerador de correção, um comparador, um combinador e uma interface de saída.
[0029] O gerador de correção está configurado para gerar, no mínimo, um sinal de alta frequência de extensão de largura de banda que compreende uma banda de alta frequência, com base no sinal de áudio de entrada, onde uma frequência de corte mais baixa, da banda de alta frequência, de um sinal gerado de alta frequência de extensão de largura de banda, é mais baixa que uma frequência de corte mais alta do sinal de áudio de entrada. Diferentes sinais gerados de alta frequência de extensão de largura de banda compreendem diferentes frequências dentro das respectivas bandas de alta frequência, se forem gerados diferentes sinais de alta frequência de extensão de largura de banda.
[0030] O comparador está configurado para calcular uma pluralidade de parâmetros de comparação. Um parâmetro de comparação é calculado com base em uma comparação do sinal de áudio de entrada e um sinal gerado de alta frequência de extensão de largura de banda. Cada parâmetro de comparação, da pluralidade de parâmetros de comparação, é calculado com base em uma frequência desviada diferente entre o sinal de áudio de entrada e o sinal gerado de alta frequência de extensão de largura de banda. Ademais, o comparador está configurado para determinar um parâmetro de comparação
12/69 proveniente da pluralidade de parâmetros de comparação, onde o parâmetro de comparação determinado atende um critério prédefinido.
[0031] Assim, por exemplo, o comparador está configurado para determinar o parâmetro de comparação entre a pluralidade de parâmetros de comparação que melhor atende um critério pré-definido.
[0032]
O combinador está configurado para combinar o sinal de áudio de entrada e um sinal de alta frequência de extensão de largura de banda, para obter o sinal de áudio estendido de largura de banda, onde o sinal de alta frequência de extensão de largura de banda utilizado para obter o sinal de áudio estendido de largura de banda está baseado em uma frequência desviada referente a um parâmetro de comparação determinado.
[0033] A interface de saída está configurada para prover o sinal de áudio estendido de largura de banda.
[0034] As configurações, de acordo com a presente invenção, estão baseadas na idéia central de que um sinal de alta frequência de extensão de largura de banda, que também é denominado correção, pode ser gerado e comparado a um sinal de áudio de entrada original. Por meio do uso de uma frequência desviada diferente de sinal de alta frequência de extensão de largura de banda ou de vários sinais de alta frequência de extensão de largura de banda, com diferentes frequências desviadas, pode ser calculada uma pluralidade de parâmetros de comparação referentes a diferentes frequências desviadas. Os parâmetros de comparação podem estar
13/69 relacionados a uma quantidade associada à qualidade de áudio. Portanto, um parâmetro de comparação pode ser determinado garantindo-se a compatibilidade do sinal de alta frequência de extensão de largura de banda e o sinal de áudio de entrada, e como uma consequência que realiza o aperfeiçoamento da qualidade de áudio.
[0035] A taxa de bits para transmissão ou armazenamento do sinal de áudio codificado pode ser reduzida por meio do uso de uma indicação de parâmetro, com base na frequência desviada, referente ao parâmetro de comparação determinado para uma reconstrução da banda de alta frequência do sinal de áudio de entrada original. Neste modo, somente uma porção de baixa frequência do sinal de áudio de entrada e da indicação de parâmetro deve ser armazenada ou transmitida.
[0036] Os termos parâmetro de comparação, frequência do crossover e indicação de parâmetro serão definidos adiante.
[0037] Algumas configurações, de acordo com a invenção, se referem a um comparador que utiliza uma correlação cruzada para comparação do sinal de áudio de entrada e do sinal gerado de alta frequência de extensão de largura de banda para calcular o parâmetro de comparação.
[0038] Algumas configurações adicionais, de acordo com a invenção, se referem a um gerador de correção, que gera o sinal de alta frequência de extensão de largura de banda no domínio de tempo, com base em uma modulação de banda de lado único.
[0039] Uma vantagem das configurações preferidas da
14/69 invenção é prover um esquema de codificação aperfeiçoado para sinais de áudio que permite aumentar a qualidade de áudio e/ou reduzir a taxa de bits para transmissão ou armazenamento.
[0040]
As configurações, de acordo com a invenção, serão detalhadas de modo subsequente, em relação aos desenhos anexados, nos quais:
[0041] A Figura 1 é um diagrama em bloco de um codificador de áudio;
[0042] A Figura 2 é uma ilustração esquemática de uma geração de sinal de alta frequência de extensão de largura de banda, uma comparação do sinal de áudio de entrada e um sinal gerado de alta frequência de extensão de largura de banda e uma adaptação de potência do sinal de alta frequência de extensão de largura de banda;
[0043] A Figura 3 é uma ilustração esquemática da geração do sinal de alta frequência de extensão de largura de banda, uma comparação do sinal de áudio de entrada e um sinal de alta frequência de extensão de largura de banda e uma adaptação de potência do sinal de alta frequência de extensão de largura de banda;
[0044] A Figura 4 é um diagrama em bloco de um
codificador de extensão de largura de banda;
[0045] A Figura 5 é um diagrama em bloco de um
decodificador de extensão de largur a de banda
[0046] A Figura 6 é um diagrama em bloco de um
decodificador de extensão de largura de banda;
[0047]
A Figura 7 é um fluxograma de um método para
15/69 prover um sinal de saída com base em um sinal de áudio de entrada;
[0048] A Figura 8 é um fluxograma de um método para prover um sinal de áudio estendido de largura de banda;
[0049] A Figura 9 é um fluxograma de um método para prover um sinal de saída com base em um sinal de áudio de entrada;
[0050] A Figura 10 é um fluxograma de um método para calcular um parâmetro de comparação;
[0051] A Figura 11 é uma ilustração esquemática de uma interpolação da frequência desviada;
[0052] A Figura 12 é um diagrama em bloco de um decodifiçador de extensão de largura de banda;
[0053] A Figura 13 é um fluxograma de um método para prover um sinal de áudio estendido de largura de banda;
[0054] A Figura 14 é um diagrama em bloco de um
método para prover um sinal de áudio estendido de largura de
banda;
[0055] A Figura 15 é um diagrama em bloco de um
codificador de extensão de largura de banda;
[0056] A Figura 16a é uma espectrograma de três tons que utiliza uma frequência variável do crossover;
[0057] A Figura 16b é uma espectrograma do sinal de áudio original de três tons,* [0058] A Figura 17 é um diagrama de espectro de potência de um sinal de áudio original, um sinal de áudio estendido de largura de banda que utiliza uma frequência constante do crossover e um sinal de áudio estendido de
16/69 largura de banda que usa uma frequência variável do crossover;
[0059] A Figura 18a é um espectrograma de três tons
que utilizada um método de extensão de largura de banda
conhecido; e
[0060] A Figura 18b é um espectrograma do sinal de
áudio original de três tons.
[0061] Adiante, os mesmos números de referência são parcialmente utilizados para objetivos e unidades funcionais que contam com as mesmas ou com propriedades funcionais semelhantes, bem como a respectiva descrição em relação a uma figura também será aplicável a outras figuras, para reduzir a redundância na descrição das configurações.
[0062] A Figura 1 ilustra um diagrama em bloco de um codificador de áudio 100 para prover um sinal de saída 132, de acordo com uma configuração da invenção, usando um sinal de áudio de entrada 102. O sinal de áudio de saída é adequado para uma extensão de largura de banda em um decodifiçador. Portanto, o codificador de áudio também é denominado codificador de extensão de largura de banda. 0 codificador de extensão de largura de banda 100 compreende um gerador de correção 110, um comparador 120 e uma interface de saída 130. O gerador de correção 110 está conectado a um comparador 120 e o comparador 120 está conectado a uma interface de saída 130 .
[0063] O gerador de correção 110 gera, no mínimo, um sinal de alta frequência de extensão de largura de banda 112. Um sinal de alta frequência de extensão de largura de banda
17/69
112 compreende uma banda de alta frequência, onde a banda de alta frequência, do sinal de alta frequência de extensão de largura de banda 112, está baseada em uma banda de baixa frequência do sinal de áudio de entrada 102. Se forem gerados diferentes sinais de alta frequência de extensão de largura de banda 112, os diferentes sinais de alta frequência de extensão de largura de banda 112 compreenderão diferentes frequências dentro das respectivas bandas de alta frequência.
[0064] 0 comparador 120 calcula uma pluralidade de
parâmetros de comparação. Um parâmetro de comparação é
calculado com base em uma comparação de sinal de áudio de
entrada 102 e em um sinal gerado de alta frequência de
extensão de largura de banda 112. Cada parâmetro de
comparação, da pluralidade de parâmetros de comparação, é
calculado com base em uma frequência desviada diferente entre o sinal de áudio de entrada 102 e um sinal gerado de alta frequência de extensão de largura de banda 112. Ademais, o comparador 120 determina um parâmetro de comparação a partir da pluralidade de parâmetros de comparação, onde o parâmetro de comparação determinado atende um critério pré-definido.
[0065] A interface de saída 130 provê o sinal de saída 132 para transmissão ou armazenamento. O sinal de saída 132 compreende uma indicação de parâmetro com base em uma
frequência desviada referente a um parâmetro de comparação
determinado
[0066] Por meio do cálculo de uma pluralidade de
parâmetros de comparação para frequências desviadas
diferentes, um sinal de alta frequência de extensão de
18/69 largura de banda 112 pode ser encontrado, que se adapta bem ao sinal de áudio original 102. Isso pode ser feito por meio da geração de uma pluralidade de sinais de alta frequência de extensão de largura de banda 112, cada um com uma frequência desviada diferente ou por meio da geração de um sinal de alta frequência de extensão de largura de banda e deslocamento da banda de alta frequência do sinal de alta frequência de extensão de largura de banda 112 por meio de frequências desviadas diferentes. Ademais, também é possível uma combinação de geração de uma pluralidade de sinais de alta frequência de extensão de largura de banda
112 com frequências banda de alta frequência destas por outras frequências desviadas diferentes. Por exemplo, cinco sinais diferentes de alta frequência de extensão de largura de banda 112 são gerados e cada um é deslocado cinco vezes por meio de um desvio constante de frequência.
[0067] A Figura 2 ilustra uma ilustração esquemática 200 de uma geração de sinal de alta frequência de extensão de largura de banda, uma comparação de sinal de alta frequência de extensão de largura de banda e do sinal de áudio de entrada e uma adaptação opcional de potência do sinal de alta frequência de extensão de largura de banda para o caso de que apenas um sinal de alta frequência de extensão de largura de banda seja gerado e deslocado por diferentes frequências desviadas.
[0068] O primeiro diagrama esquemático potência comparada à frequência” 210 ilustra, esquematicamente, um
19/69 sinal de áudio de entrada 102. Com base neste sinal de áudio de entrada 102, o gerador de correção 110 pode gerar o sinal de alta frequência de extensão de largura de banda 112, por exemplo, por meio do deslocamento 222 de uma banda de baixa frequência do sinal de áudio de entrada 102 para frequências mais altas (conforme indicado pelo número de referência). Por exemplo, a banda de baixa frequência é deslocada por uma frequência igual a uma frequência do crossover do codificador central, não ilustrado na Figura 1, que pode ser uma parte do codificador de extensão de largura de banda 100 ou outra frequência pré-definida.
[0069] O sinal gerado de alta frequência de extensão de largura de banda 112 pode, em seguida, ser deslocado por frequências desviadas diferentes 232 e, para cada frequência desviada 232 (conforme indicado pelo número de referência 230), um parâmetro de comparação pode ser calculado por meio do comparador 120. A frequência desviada 232 pode ser, por exemplo, definida em relação a uma frequência do crossover de um codificador central, relativa à outra frequência especifica ou pode ser definida como um valor absoluto de frequência.
[0070] Em seguida, o comparador 120 determina um parâmetro de comparação que atende o critério pré-definido. Neste modo, pode ser determinado um sinal de alta frequência de extensão de largura de banda 112 com uma frequência desviada 242 referente a um parâmetro de comparação determinado (conforme ilustrado no número de referência 240). [0071] De modo adicional, também pode ser
20/69 determinado um parâmetro de densidade de potência 252 (conforme indicado pelo número de referência 250). O parâmetro de densidade de potência 252 pode indicar uma razão da banda de alta frequência, do sinal de alta frequência de extensão de largura de banda, com a frequência desviada referente ao parâmetro de comparação determinado e a banda de frequência referente ao sinal de áudio de entrada. Por exemplo, a razão pode ser relativa à proporção de densidade de potência, uma razão de potência ou outra razão de uma quantidade relativa à densidade de potência de uma banda de frequência.
[0072] Alternativamente, a Figura 3 ilustra uma ilustração esquemática 300 de uma geração de sinal de alta frequência de extensão de largura de banda, uma comparação de sinais gerados de alta frequência de extensão de largura de banda e o sinal de áudio de entrada e uma adaptação opcional
de potência do sinal de alta frequência de extensão de
largura de banda para o caso de que seja gerada uma
pluralidade de sinais de alta frequência de extensão de
largura de banda, com diferentes frequências desviadas.
[0073] Diferentemente da sequência ilustrada na Figura 2, o gerador de correção 110 gera uma pluralidade de sinais de alta frequência de extensão de largura de banda 112 com frequências desviadas diferentes 232 (conforme indicado pelo número de referência 320) . Novamente, isso pode ser realizado por meio de um deslocamento de frequência 222 de uma banda de baixa frequência do sinal de áudio de entrada 102 para frequências mais altas. A banda de baixa frequência,
21/69 do sinal de áudio de entrada 102, pode ser deslocada por meio de uma frequência constante acrescida da frequência desviada individual 232 de cada sinal de alta frequência de extensão de largura de banda 112. A frequência constante pode ser igual à frequência do crossover do codificador central ou de outra frequência específica.
[0074] Um parâmetro de comparação para cada sinal gerado de alta frequência de extensão de largura de banda 112 pode, assim, ser calculado, e o parâmetro de comparação, que atende o critério pré-definido, pode ser determinado 240 por meio do comparador 120.
[0075] O parâmetro de densidade de potência pode ser determinado 250 conforme descrito anteriormente.
[0076] Os conceitos ilustrados nas Figuras 2 e 3 também podem ser combinados.
[0077] A comparação do sinal de áudio de entrada 102 e o sinal gerado de alta frequência de extensão de largura de banda 112 pode ser realizada por meio de uma correlação cruzada dos dois sinais. Neste caso, um parâmetro de comparação pode, por exemplo, ser o resultado de uma correlação cruzada para uma frequência desviada especifica entre o sinal de áudio de entrada 102 e um sinal gerado de alta frequência de extensão de largura de banda 112.
[0078] A indicação de parâmetro do sinal de saída 132 pode ser a própria frequência desviada, uma frequência desviada quantizada ou outra quantidade com base na frequência desviada.
[0079] Por meio da transmissão ou armazenamento
22/69 somente da indicação de parâmetro, em vez da banda de alta frequência do sinal de áudio de entrada 102, a taxa de bits para transmissão ou armazenamento poderá ser reduzida. Por meio da escolha do parâmetro, com base na frequência desviada referente a um parâmetro de comparação que atende um critério pré-definido, isso pode resultar em uma melhor qualidade de áudio que a decodificação apenas do sinal de áudio de banda limitada.
[0080] Um critério pré-definido pode estar para determinar um parâmetro de comparação da pluralidade dos parâmetros de comparação que indicam, por exemplo, um sinal de alta frequência de extensão de largura de banda 112 com uma frequência desviada respectiva que combina o sinal de áudio de entrada 102 melhor que 70% dos sinais de alta frequência de extensão de largura de banda 112 com outras frequências desviadas, indicando um sinal de alta frequência de extensão de largura de banda 112 com uma frequência desviada referente sendo uma das três melhores combinações para o sinal de áudio de entrada 102 ou indicando um sinal de alta frequência de extensão de largura de banda 112 de melhor combinação com uma frequência desviada respectiva.
Isso se refere ao caso onde uma pluralidade de sinais de alta frequência de extensão de largura de banda
112, com frequências desviadas diferentes, é gerada, assim como para o caso onde somente um sinal de alta frequência de extensão de largura de banda 112 é gerado e deslocado por frequências desviadas diferentes ou uma combinação destes dois casos.
[0081]
Um parâmetro de comparação pode ser o
23/69 resultado de uma correlação cruzada ou de outra quantidade que indica quão bem um sinal de alta frequência de extensão de largura de banda 112, com uma frequência desviada especifica, combina com o sinal de áudio de entrada 102.
[0082] O codificador de extensão de largura de banda 100 pode compreender um codificador central para codificação de uma banda de baixa frequência do sinal de áudio de entrada 102. Este codificador central pode compreender uma frequência do crossover que pode referir-se a uma frequência de corte mais alta da banda de baixa frequência codificada do sinal de áudio de entrada 102. A frequência do crossover do codificador central pode ser constante ou variável durante o tempo. Implementar uma frequência do crossover variável pode aumentar a complexidade do codificador central, mas também pode aumentar a flexibilidade para codificação.
[0083] O processo ilustrado na Figura 2 e/ou na
Figura 3 pode ser repetido para bandas de frequência mais altas ou para correções. Por exemplo, a banda de baixa frequência do sinal de áudio de entrada 102 compreende um a frequência de corte mais alta de 4 kHz. Portanto, se a banda de baixa frequência do sinal de áudio de entrada 102 for deslocada por meio da frequência de corte mais alta da banda de baixa frequência para gerar o sinal de alta frequência de extensão de largura de banda 112, o sinal de alta frequência de extensão de largura de banda 112 compreende uma banda de alta frequência com uma frequência de corte mais baixa que 4 kHz e uma frequência de corte mais alta que 8 kHz. O processo pode ser repetido por meio do deslocamento de uma banda de
24/69 baixa frequência do sinal de áudio de entrada 102 por duas vezes a frequência de corte mais alta da banda de baixa frequência. Assim, o novo sinal gerado de alta frequência de extensão de largura de banda 112 compreende uma banda de alta frequência com uma frequência de corte mais baixa que 8 kHz e uma frequência de corte mais alta que 12 kHz. Isso pode ser
repetido até que a frequência mais alta desejada seja
atingida.
[0084] Alternativamente, isso também pode ser
considerado por meio da geração de um sinal de alta
frequência de extensão de largura de banda com uma
pluralidade de diferentes bandas de alta frequência.
[0085] Conforme ilustrado neste exemplo, a largura de banda da banda de baixa frequência do sinal de áudio de entrada e a largura de banda da banda de alta frequência de um sinal de alta frequência de extensão de largura de banda podem ser as mesmas. Alternativamente, a banda de baixa frequência do sinal de áudio de entrada pode ser propagada e deslocada para gerar o sinal de alta frequência de extensão de largura de banda.
[0086] Determinar um sinal de alta frequência de extensão de largura de banda 112, com uma frequência desviada 232 referente a um parâmetro de comparação determinado, pode deixar uma lacuna entre a banda de baixa frequência do sinal de áudio de entrada 102 e a banda de alta frequência do sinal de alta frequência de extensão de largura de banda 112, conforme a frequência desviada 242. Esta lacuna pode ser preenchida por meio da geração de porções de frequência que
25/69 se adaptam a esta lacuna que contém, por exemplo, ruído limitado de banda. Alternativamente, a lacuna pode ser deixada vazia, uma vez que a qualidade de áudio não deve sofrer dramaticamente.
[0087] A Figura 4 ilustra um diagrama em bloco de um codificador de extensão de largura de banda 400 para prover um sinal de saída 132 usando um sinal de áudio de entrada 102, de acordo com uma configuração da invenção. O codificador de extensão de largura de banda 400 compreende um gerador de correção 110, um comparador 120, uma interface de saída 130, um codificador central 410, um filtro de passafaixas 420 e uma unidade de extração de parâmetro 430. O codificador central 410 está conectado a uma interface de saída 130 e ao gerador de correção 110, o gerador de correção 110 está conectado ao comparador 120, o comparador 120 está conectado a uma unidade de extração de parâmetro 430, a unidade de extração de parâmetro 430 está conectada a uma interface de saída 130 e o filtro de passa-faixas 420 está conectado ao comparador 120.
[0088] 0 gerador de correção 110 pode ser considerado como um modulador para a geração do sinal de alta frequência de extensão de largura de banda 112, com base no sinal de áudio de entrada 102. O comparador 120 pode realizar a comparação do sinal de áudio de entrada 102 filtrado por meio do filtro passa-faixas 420 e o sinal gerado de alta frequência de extensão de largura de banda 112 por meio de uma correlação cruzada destes. A determinação do parâmetro de comparação, que atende o critério pré-definido, também pode
26/69 se denominada estimativa de latência.
[0089] A interface de saida 130 também pode incluir uma funcionalidade do formatador do fluxo de bits e pode compreender um combinador para a combinação de um sinal de baixa frequência provido pelo codificador central 410 e um sinal de parâmetro 432 que compreende a indicação de parâmetro com base na frequência desviada provida pela unidade de extração de parâmetro 430. Ademais, a interface de saida 130 pode compreender um codificador de entropia ou um codificador diferencial para reduzir a taxa de bits do sinal de saída 132. 0 combinador e o codificador de entropia ou diferencial pode ser parte da interface de saída 130, conforme ilustrado neste exemplo ou podem ser unidades independentes.
[0090] O sinal de áudio 102 pode ser dividido em uma parte de baixa frequência e uma parte de alta frequência. Isso pode ser realizado por meio de um filtro passa-baixas do codificador central 410 e o filtro passa-faixas 420. O filtro passa-baixas pode ser parte do codificador central 410 ou um filtro passa-baixas independente, conectado a um codificador central 410.
[0091] A parte de baixa frequência é processada por um codificador central 410, que pode ser um codificador de áudio, por exemplo, conforme o padrão MPEG 1/2 Layer 3 MP3 ou MPEG 4 AAC ou um codificador de voz.
[0092] A parte de baixa frequência pode ser deslocada por meio de um valor fixado, por exemplo, por meio de uma modulação de lado de banda ou por uma Transformada
27/69
Rápida de Fourier (FFT) no domínio de frequência, assim ela é localizada acima da região de baixa frequência original, na área determinada da correção respectiva. De modo opcional, a parte de baixa frequência pode ser obtida diretamente a partir do sinal de entrada 102. Isso pode ser realizado por meio de um filtro passa-baixas independente, conectado a um gerador de correção 110.
[0093] Em intervalos regulares de tempo, a correlação cruzada entre os espectros de amplitude das seções de sinal janelado, entre a parte original de alta frequência (do sinal de áudio de entrada) e da parte obtida de alta frequência (o sinal de alta frequência de extensão de largura de banda), pode ser calculada. Neste modo, pode ser determinada a latência (a frequência desviada) para a correlação máxima. Esta latência pode ter o significado de um fator de correção, em termo da modulação original de banda de lado único, ou seja, a modulação de banda de lado único pode ser adicionalmente corrigida pela latência para maximizar a correlação cruzada, ou seja, a frequência desviada, que também é denominada latência, referente ao parâmetro de comparação que atende o critério pré-definido, pode ser determinada, onde o parâmetro de comparação corresponde à correlação cruzada, e o critério pré-definido pode encontrar a correlação máxima.
[0094] Ademais, podem ser determinadas as razões dos valores absolutos dos espectros de amplitude. Assim, podem ser derivadas por qual fator obtido o sinal de alta frequência deve ser atenuado ou amplificado. Assim, um
28/69 parâmetro de densidade de potência pode ser determinado, indicando uma razão de potência, as densidades de potência, os valores absolutos dos espectros de amplitude ou outro valor relativo a uma razão de densidade de potência entre a banda de alta frequência do sinal de alta frequência de extensão de largura de banda 112 e uma banda de frequência referente ao sinal original de áudio de entrada 102. Isso pode ser realizado por meio de um comparador de densidade de potência, que pode ser parte da unidade de extração de parâmetro 430, como no exemplo ilustrado ou uma unidade independente. Para determinar o parâmetro de densidade de potência, por exemplo, o sinal de alta frequência de extensão de largura de banda 112, que foi gerado por meio do deslocamento da banda de baixa frequência do sinal de áudio de entrada 102, por uma frequência constante ou pelo sinal de alta frequência de extensão de a um parâmetro de comparação gerado de alta frequência de largura de banda 112 referente determinado ou a outro sinal extensão de largura de banda
112, pode ser utilizado. Uma banda de frequência respectiva, neste caso, significa, por exemplo, uma banda de frequência com a mesma faixa de frequência. Por exemplo, se a banda de alta frequência do sinal de alta frequência de extensão de largura de banda compreende frequências de 4 kHz a 8kHz, então, a banda de frequência respectiva do sinal de áudio de entrada compreende também a faixa de 4 kHz a 8 kHz.
[0095] Os fatores de correção obtidos (frequência desviada, parâmetro de densidade de potência) referentes à latência e referentes ao valor absoluto da amplitude podem
29/69 ser interpolados durante o tempo, ou seja, um parâmetro determinado para uma seção de sinal janelado (para um período de tempo) pode ser interpolado para cada fase de tempo da seção de sinal.
[0096] Este sinal (sinal de parâmetro) de modulação (controle), ou sua representação parametrizada, pode ser armazenado ou transmitido para um decodifiçador, ou seja, o sinal de parâmetro 432 pode ser combinado com a banda de baixa frequência do sinal de áudio de entrada 102, processada pelo codificador central 410 para obter o sinal de saida 132, que poderá ser armazenado ou transmitido a um decodifiçador.
[0097] Adicionalmente, os parâmetros adicionais para adaptar, por exemplo, um nível de ruído e/ou a tonalidade, podem ser determinados. Isso pode ser realizado pela unidade de extração de parâmetro 430. Os parâmetros adicionais podem ser adicionados ao sinal de parâmetro 432.
[0098] O exemplo ilustrado na Figura 4 ilustra um cálculo do lado codificador de uma modulação variável de tempo. A modulação variável de tempo, neste caso, se refere aos sinais de alta frequência de extensão de largura de banda 112, com frequências desviadas diferentes. A frequência desviada, referente ao parâmetro de comparação determinado, que atende o critério pré-definido, pode variar com o tempo.
[0099] A Figura 5 ilustra um diagrama em bloco de um decodifiçador de extensão de largura de banda 500 para prover um sinal de áudio estendido de largura de banda 532, com base em um sinal de áudio de entrada 502 e um sinal de parâmetro 504, de acordo com uma configuração da invenção. 0 sinal de
30/69 parâmetro 504 compreende uma indicação de uma frequência desviada e uma indicação de um parâmetro de densidade de potência. O decodifiçador de extensão de largura de banda 500 compreende um gerador de correção 510, um combinador 520 e uma interface de saída 530. O gerador de correção 510 está conectado a um combinador 520 e o combinador 520 está conectado a uma interface de saída 530.
[0100] O gerador de correção 510 gera um sinal de alta frequência de extensão de largura de banda 512 que compreende uma banda de alta frequência com base no sinal de áudio de entrada 502. Ά banda de alta frequência, do sinal de alta frequência de extensão de largura de banda 512, é gerada com base em um deslocamento de frequência de uma banda de frequência do sinal de áudio de entrada 502, onde o deslocamento de frequência está baseado na frequência desviada.
[0101]
Ademais, o gerador de correção 510 amplifica ou atenua banda de alta frequência do sinal de alta frequência de extensão de largura de banda 512 por meio de um fator igual ao valor do parâmetro de densidade de potência ou igual ao valor reciproco do parâmetro de densidade de potência.
O combinador 520 combina sinal de alta frequência de extensão de largura de banda
512 e o sinal de áudio de entrada 502 para obter o sinal de áudio estendido de largura de banda 532 e a interface de saída 530 provê o sinal de áudio estendido de largura de banda 532.
[0103] Gerar o sinal de alta frequência de extensão
31/69 de largura de banda 112, com base na frequência desviada, pode permitir uma continuação melhorada da faixa de frequência do sinal de áudio de entrada, na região de alta frequência, por exemplo, se a frequência desviada for determinada conforme anteriormente descrito. Isso pode aumentar a qualidade de áudio do sinal de áudio estendido de largura de banda 532.
[0104] Adicionalmente, a densidade de potência da continuação de alta frequência do sinal de áudio de entrada 502 pode ser realizada de modo bastante eficiente por meio da amplificação ou atenuação da banda de alta frequência do sinal de alta frequência de extensão de largura de banda 512, por meio do parâmetro de densidade de potência. Neste modo, pode não ser necessária uma normalização.
[0105] O gerador de correção 510 pode gerar o sinal de alta frequência de extensão de largura de banda 512 por meio do deslocamento da banda de frequência do sinal de áudio de entrada 512, por meio de uma frequência constante acrescida da frequência desviada. Se a frequência desviada indica um deslocamento de frequência para frequências mais baixas, o combinador pode ignorar uma parte da banda de alta frequência do sinal de alta frequência de extensão de largura de banda 512 que compreende frequências mais baixas que a frequência de corte mais alta do sinal de áudio de entrada 502.
[0106] O gerador de correção 510 pode gerar o sinal de alta frequência de extensão de largura de banda 512 no mesmo domínio de tempo ou no domínio de frequência. No
32/69 domínio de tempo, o gerador de correção 510 pode gerar o sinal de alta frequência de extensão de largura de banda 512 com base em uma modulação de banda de lado único.
[0107] Adicionalmente, a interface de saída pode amplificar o sinal de saída antes de provê-lo.
[0108] A Figura 6 ilustra um diagrama em bloco de um decodifiçador de extensão de largura de banda 600 para prover um sinal de áudio estendido de largura de banda 532 com base em um sinal de áudio de entrada 502 e um sinal de parâmetro 504, de acordo com uma configuração da invenção. O decodifiçador de extensão de largura de banda 600 compreende um gerador de correção 510, um combinador 520, uma interface de saída 530, um decodifiçador central 610 e uma unidade de extração de parâmetro 620. O decodificar central 610 está conectado a um gerador de correção 510 e ao combinador 520, a unidade de extração de parâmetro 620 está conectada ao gerador de correção 510 e à interface de saída 530, o gerador de correção 510 está conectado a um combinador 520 e o combinador 520 está conectado a uma interface de saída 530.
[0109] O decodifiçador central 610 pode decodificar o fluxo de bits recebidos 602 e prover o sinal de áudio de entrada 502 para o gerador de correção 510 e para o combinador 520. O sinal de áudio de entrada 502 pode compreender uma frequência de corte mais alta, igual a uma frequência do crossover do decodifiçador central 610. Esta frequência do crossover pode ser constante ou variável com o tempo. Variável com o tempo significa, por exemplo, variável para diferentes intervalos de tempo, mas constante para um
33/69 intervalo de tempo ou período de tempo.
[0110] A unidade de extração de parâmetro 620 pode separar o sinal de parâmetro 504 do fluxo de bits recebidos 602 e provê-lo para o gerador de correção 510. Adicionalmente, o sinal de parâmetro 504 ou um ruído extraído e/ou tonalidade de parâmetro pode ser provido para a interface de saída 530.
[0111] O gerador de correção 510 pode modular o sinal de áudio de entrada 502, com base na frequência desviada, para obter o sinal de alta frequência de extensão de largura de banda 512 e pode amplificar ou atenuar o sinal de alta frequência de extensão de largura de banda 512, com base no parâmetro de densidade de potência compreendido no sinal de parâmetro 504 . Este sinal de alta frequência de extensão de largura de banda 512 é provido para o combinador 530, ou seja, o gerador de correção 510 pode modular o sinal de áudio de entrada 502 com base na frequência desviada e no parâmetro de densidade de potência para obter um sinal de alta frequência. Isso pode ser realizado, por exemplo, no domínio de tempo por meio de uma modulação de banda de lado único 634 com uma interpolação e/ou filtragem 632 para cada etapa de tempo.
[0112] 0 combinador 520 combina o sinal de áudio de
entrada 502 e o sinal gerado de alta frequência de extensão
de largura de banda 512 para obter o sinal de áudio de
extensão de largura de banda 532
[0113] A interface de saída 530 provê o sinal de
áudio estendido de largura de banda 532 e pode,
34/69 adicionalmente, compreender uma unidade de correção. A unidade de correção pode realizar uma correção de tonalidade e/ou uma correção de ruído com base nos parâmetros providos pela unidade de extração de parâmetro 620. A unidade de correção pode ser parte da interface de saída 530, conforme ilustrado na Figura 6 ou pode ser uma unidade independente. A unidade de correção também pode ser organizada entre o gerador de correção 510 e o combinador 520. Neste modo, a unidade de correção somente pode corrigir a tonalidade e/ou ruído do sinal gerado de alta frequência de extensão de largura de banda 512. Uma correção de tonalidade ou de ruído
do sinal de áudio de entrada 512 não é necessária, uma vez
que o sinal de áudio de entrada 502 se refere ao sinal de
áudio original.
[0114] Resumido brevemente, o decodificador de
extensão de largura de banda 600 pode sintetizar e, de modo espectral, formar um sinal de alta frequência fora de um sinal de saída do decodificador de áudio ou decodificador central (o sinal de áudio de entrada) por meio da função de modulação transmitida. A função de modulação transmitida, por exemplo, significa uma função de modulação com base na frequência desviada e no parâmetro de densidade de potência. Em seguida, o sinal de alta frequência e o sinal de baixa frequência podem ser combinados e podem ser aplicados parâmetros adicionais para adaptação do nível de ruído e de tonalidade.
[0115] A Figura 7 ilustra um fluxograma de um método 700 para prover um sinal de saída com base em um sinal de
35/69 áudio de entrada, de acordo com uma configuração da invenção. 0 método compreende a geração 710 de, no mínimo, um sinal de alta frequência de extensão de largura de banda, calcular 720 uma pluralidade de parâmetros de comparação, determinar 730 um parâmetro de comparação proveniente da pluralidade de parâmetros de comparação e prover 740 o sinal de saída para transmissão ou armazenamento.
[0116] Um sinal gerado de alta frequência de extensão de largura de banda compreende uma banda de alta frequência. Ά banda de alta frequência, do sinal de alta frequência de extensão de largura de banda, está baseada em uma banda de baixa frequência do sinal de áudio de entrada. Sinais diferentes de alta frequência de extensão de largura de banda compreendem frequências diferentes dentro das respectivas bandas de alta frequência, se forem gerados sinais diferentes de alta frequência de extensão de largura de banda.
[0117] Um parâmetro de comparação é calculado com base em uma comparação do sinal de áudio de entrada e um sinal gerado de alta frequência de extensão de largura de banda. Cada parâmetro de comparação, da pluralidade de parâmetros de comparação, é calculado com base em uma frequência desviada diferente entre o sinal de áudio de entrada e o sinal gerado de alta frequência de extensão de largura de banda.
[0118] O parâmetro de comparação determinado atende um critério pré-definido.
[0119] O sinal de saída compreende uma indicação de
36/69 parâmetro com base em uma frequência desviada referente ao parâmetro de comparação determinado.
[0120] A Figura 8 ilustra um fluxograma de um método
800 para prover um sinal de áudio estendido de largura de banda, com base em um sinal de áudio de entrada e um sinal de parâmetro, de acordo com uma configuração da invenção. O sinal de parâmetro compreende uma indicação de uma frequência desviada e uma indicação de um parâmetro de densidade de potência. O método compreende a geração 810 de um sinal de alta frequência de extensão de largura de banda, amplificação 820 ou atenuação de banda de alta frequência do sinal de alta frequência de extensão de largura de banda, combinação 830 do sinal de alta frequência de extensão de largura de banda e o sinal de áudio de entrada para obter o sinal de áudio estendido de largura de banda e prover 840 o sinal de áudio estendido de largura de banda.
[0121] O sinal de alta frequência de extensão de largura de banda compreende uma banda de alta frequência. A
banda de alta frequência, do sinal de alta frequência de
extensão de largura de banda, é gerada 810 com base em um
deslocamento de frequência de uma band a de frequência do
sinal de áudio de entrada. 0 deslocamento de frequência é baseado na frequência desviada.
[0122] A banda de alta frequência, do sinal de alta frequência de extensão de largura de banda, é amplificada 820 ou atenuada por meio de um fator igual ao valor do parâmetro de densidade de potência ou igual ao valor reciproco do parâmetro de densidade de potência.
37/69 [0123] A Figura 9 ilustra um fluxograma de um método
900 para prover e o sinal de saída com base em um sinal de áudio de entrada, de acordo com uma configuração da invenção. Ele ilustra uma possibilidade para a sequência do algoritmo no codificador. Ele também pode ser formal e matematicamente descrito a seguir. Os sinais em tempo real podem ser indicados por meio de letras latinas minúsculas, sinais da transformada de Hilbert com correspondentes sinais gregos e sinais da transformada de Fourier com letras latinas maiúsculas ou suas alternativas gregas.
[0124] O sinal de entrada pode ser denominado f (n) , o sinal de saída o(n). '< k< ^max indica a transformada de Fourier, j indica o número imaginário e a transformada de Hilbert H(.) geralmente é definida:
í/?(m) := sgn(tu) [0125] com
F(» := ^(f(n)) [0126] xOver [crossover] pode ser a frequência de corte do codificador central, neN pode indicar um tempo. kmax>keN pode indicar a extensão ou correção k-th. ak descreve um limite de banda de bandas perceptuais relativas ao xOver, por exemplo, de acordo com Bark ou a escala ERB. Alternativamente, pode, por exemplo, aumentar linearmente, ou seja, ak+i-oík = constante. A transformada de Hilbert também pode ser calculada, de modo computacionalmente eficiente, por meio de filtragem do sinal com um filtro de passa-baixas modulado.
[0127] Primeiramente, pode ser gerada uma função de
38/69 modulador analítico 902 com as frequências de modulaçao ak e
a.
os resultantes aumentos de fase v. :=— com o aumento de * Fs tempo — (Fs indica a taxa de ailustragem) . Isso pode ser
Fs matematicamente descrito nas seguintes fórmulas:
2^Σ^ /zA(n):=e m=l = e 2^tn *max Arax //(«):= ^6 - =
Á: = l /: = 1 [0128] A soma somente pode ser substituída por n, se for independente de n.
[0129] O sinal de áudio de entrada 102 ou sinal de áudio real f pode ser filtrado por passa-faixas para uma largura de banda de Oík+i-ak que pode ser expressa por:
[0130] Neste caso, cada correção compreenderá a mesma largura de banda.
[0131] Alternativamente, o sinal de áudio de entrada f 102 pode ser filtrado por passa-faixas para larguras de banda de ak com diferentes larguras de banda, que podem ser descritas por:
0, = [0132] Em seguida, as áreas do sinal original podem ser determinadas, que devem ser reconstruídas por este método. Estas regiões limitadas de banda podem ser indicadas como:
[0133] e estão localizadas em intervalos (ak, ak+i) .
[0134] A modulação dos sinais de entrada filtrados
39/69 por passa-baixas 904 pode ser realizada no domínio de frequência ou no domínio de tempo.
[0135] No domínio de frequência, os sinais de entrada pode ser primeiramente janelados, o que pode ser descrito por:
f. (η) = ί(ξ + mod(n, NFFT) +1) win(mod(n, NFFT) +1)
[0136] onde NFFT é o número de bins da transformada
rápida de Fourier (por exemplo, 512 bins), ξ é o número de
janela e win ( .) é uma função de j anela. As janelas ou
períodos de tempo podem compreender uma sobreposição
temporária Por exemplo, a fórmula dada acima descreve uma
sobreposição temporária de metade de uma janela . Assim, NeN
bloqueia o sinal original e com ele conectou quantos
espectros de amplitude Fç (ω) com ξ < N quantos valores
absolutos da transformada de Fourier
 :=Lz. -Nffrj
[0137] descreve o índice de limite de banda k na
transformada de Fourier.
[0138] Em seguida, o sinal é modulado no domínio de frequência, por meio do deslocamento de bins de FFT (bins da transformada rápida de Fourier). A transformada de Hilbert implícita não é necessária aqui, mas faz uma descrição formal igual das seguintes etapas possíveis:
+ := />(«); ΦΧω) := [0139] para ω á 0 e
Φ. (/»):= :b0Vw<0 [0140] No domínio de tempo, primeiramente é
40/69 realizada uma transformada de Hilbert 906 do sinal de áudio de entrada f 102 para gerar um sinal analítico 908.
<p:=f + [0141] e [0142] em seguida, o sinal analítico φ/7? é modulado em banda de lado único 710, com um modulador μ(η) 902:
k=1 [0143] ou y/(n).= vLF(n) μ(η)
[0144] Neste modo, o sinal de alta frequência de
extensão de largura de banda, que também é denominado sinal
modulado 910, pode ser gerado.
[0145] A seguir, são realizados um janelamento
também possível com sobreposição) do sinal de entrada 912 e
do sinal estendido 914 e uma transformada de Fourier 916: (n) = φ-f (ç · - + n)
[0146] e ψ/η) = ψ{ξ NFFT + mod(n, NFFT) +1) · win(mod(n, NFFT) +1)
[0147] onde NFFT é, novamente, o número de bins da transformada rápida de Fourier (por exemplo, 256, 512, 1024 bins ou outro número entre 24 e 232) , ξ é o número de janela e win (.) é uma função de janela. Assim, os blocos NeN 914 são criados fora do sinal original e em relação aos espectros de amplitude Φζ(ω), Ψξ(ω) com ξ £ N como valores absolutos da transformada de Fourier 916.
ή -NfFT\
41/69 [0148] podem descrever o índice do limite de banda k na transformada de Fourier.
O processo, no domínio de tempo, é ilustrado na Figura 9.
[0150]
A próxima etapa é o cálculo 720 da correlação cruzada (o parâmetro de comparação pode ser igual ao resultado da correlação cruzada) dos espectros parciais de amplitude do sinal original e do estendido, que podem ser matematicamente expressos por:
i' < 0 [0151] com δ pode indicar a latência máxima (a máxima frequência a qual uma correlação cruzada é calculada.
Se a correlação cruzada deve ser calculada com um desvio, ou seja, pequenas latências e, portanto, grandes sobreposições devem ser preferidas, então β=0 deve ser selecionado. Por outro lado, deve ser compensado que poucos bins de FFT (bins da transformada rápida sobrepostos para as grandes latências do que para as pequenas latências, então β=1 deve ser escolhido.
Em geral, Ο^βεΡ pode ser arbitrariamente escolhido.
Alternativa ou adicionalmente, 2<<>eN;modí<)’,2)=0 pode ser escolhido para selecionar uma região da correlação maior que uma correção. Com isso, a cruzada, que é um pouco região que é considerada
42/69 pela correlação cruzada pode ser estendida por nas duas extremidades espectrais da correção particular.
[0153]
Com base nos referidos resultados da correlação cruzada, a correlação cruzada máxima 730 íA :=max(K./r))
I ’ * e a latência clç, k da correlação máxima [0155] podem ser determinadas.
[0156]
Adicionalmente, as razões 920 de energias ou potências nas correções podem ser determinadas pelos espectros de densidade de potência:
[0157]
Se um máximo claro não puder ser determinado
924, a latência é colocada de volta (conforme ilustrado no número de referência 922). De outro modo, a latência estimada 918 pode ser a latência referente à correlação cruzada máxima. Para tanto, pode ser determinado um critério de limite adequado dí;k > τ com τ a ser selecionado. De modo alternativo, pode ser observada a curvatura ou o nivelamento espectral (SFN) da correlação cruzada Rç,k; por exemplo:
r .
?·* . «di.i * [0158] ou
Figure BR122015019030A2_D0001
43/69
[0159] com cr ' cr
[0160] As latências dí(k e os parâmetros de densidade
de potência ζξ,ΐς podem ser interpolados 926 para obter um valor para cada fase de tempo:
çk(n) := interp(ç^);Âi;(n) = interp(ctfc)
[0161] Assim modificada, a amplitude modulada e a
função de modulação geral de frequência modulada podem ser
geradas: 2,17^(7,(111)+.¾ ím)) μ/n) = ç/n)e ·’ n *=1
[0162] Esta função de modulação geral ou os
parâmetros da função de modulação geral podem ser providos
740 com o sinal de saída para armazenamento ou transmissão.
[0163] Adicionalmente, podem ser determinados parâmetros adicionais para correção de ruído e/ou correção de tonalidade.
[0164] A modulação no decodifiçador pode ser realizada por meio de:
ι/(η).=φσ{η)·μ(η) [0165] e adição das modulações parciais k (se houver
mais de uma correção). Para esta função de modulação geral
Pk(n) ou μ (n) ou os parâmetros ζκ (n) e Àk (n) ou c?/k e dí/k da
função de modulação geral podem ser adequadamente
codificados, por exemplo, por quantização. De modo opcional, a taxa de ailustragem pode ser reduzida e uma histerese pode
44/69 ser introduzida.
[0166] 0 cálculo das latências pode ser omitido, se não houver nenhum sinal tonal, por exemplo, em silêncio, transientes ou ruído. Nestes casos, a latência pode ser estabelecida em zero.
[0167] A Figura 10 ilustra, em mais detalhes, um exemplo 1000 para determinar a latência.
[0168] Para um período de tempo ou janela ξ=ί 1010, a latência v é estabelecida para menos λ, como valor inicial. Em seguida, é calculada a correlação cruzada 720 Rç,x(v) . Se v for menor que A 1030, então v é aumentado 1032 e, em seguida, é calculado o parâmetro de comparação, em termos de correlação cruzada 720. Se v for igual ou maior que Λ 1030, então a latência referente à correlação cruzada máxima calculada pode ser determinada 730. Se o máximo é claramente identificável 924, a latência determinada é utilizada como parâmetro dí<k 918. Caso contrário, a latência é estabelecida em 0 e utilizada como parâmetro d;,k=- 922.
[0169] Em seguida, todo o processo é repetido 1040 para o próximo período de tempo ξ = ξ + 1 1050. As latências determinadas podem ser interpeladas 926 para obter um parâmetro para cada fase de tempo N.
[0170] O cálculo da pluralidade de parâmetros de comparação, por exemplo, o resultado da correlação cruzada, também pode ser feito em paralelo, se for utilizada uma pluralidade de comparadores. Ademais, o processamento de diferentes períodos de tempo pode ser feito em paralelo, se o hardware necessário estiver disponível, diversas vezes. O
45/69 circuito para calcular a correlação cruzada também pode iniciar em +Λ e pode ser reduzido a cada circuito até v í Λ. [0171] A Figura 11 ilustra uma ilustração esquemática da interpolação 926 das frequências desviadas de diferentes períodos de tempo, intervalos de tempo ou janelas. A Figura 11a ilustra a interpolação 1100, se os períodos de tempo não se sobrepuserem. A latência dç,k é determinada para um período de tempo inteiro 1110. O modo mais simples para interpolar um parâmetro, para cada fase de tempo 1120, pode ser considerado estabelecendo-se os parâmetros para todas as fases de tempo 1120 de um período de tempo 1110 igual à latência dírk respectiva. Nos limites de um período de tempo, pode ser selecionada a latência de período de tempo anterior ou posterior. Por exemplo, os parâmetros Àk(n) a Àk(n+3) são iguais a dç,k, e os parâmetros Àk(n+4) a Àk(n+7) são iguais a dç+i,k[0172] De modo alternativo, as latências dos períodos de tempo 1110 podem ser interpoladas linearmente entre os períodos de tempo. Por exemplo:
λ, (w+i)=3'h,+ri<-u λ1(„+3)=1ήΑΑϋ λ, (κ+ 4) = Ã*-tÃ'.->.
[0173] De modo adequado, a Figura 11B ilustra um exemplo 1150 para sobreposição de períodos de tempo 1110.
46/69
Neste caso, uma fase de tempo 1120 está associada a mais de
um período de tempo 1110. Portanto, mais de uma latência
determinada pode ser associada com uma fase de tempo 1120.
Assim, as latências determinadas podem ser interpoladas 926 para obter um parâmetro para cada etapa de tempo 1120. Por exemplo, as latências determinadas, referentes a uma fase de tempo 1120, podem ser linearmente interpoladas. Por exemplo, uma interpolação possível pode ser:
[0174] λί(π) = ί/ξ_λ, („+ 1)=^+4-1 (η + 2) = λί(„ + 3)=5..+Αυ Alternativamente, a interpolação também pode
ser realizada, por exemplo, por meio de uma filtragem da mediana.
[0175] A interpolação pode ser realizada por um meio
de interpolação. O meio de interpolação pode ser parte da unidade de extração de parâmetro, da interface de saída ou pode ser uma unidade separada.
[0176] No lado decodificador, a extensão de largura
de banda pode ser realizada por:
[0177] Depois da decodificação de μ(«) e çLF(N), como
resultado do codificador central. Adicionalmente, ψ(η) pode ser adaptado com os dos parâmetros anteriormente obtidos provenientes do sinal original para o nível de tonalidade e/ou ruído.
7/69 [0178] O cálculo para a função de modulação geral no decodifiçador é realizado de acordo com uma das seguintes fórmulas:
*...
y/(n) =Σ ^¢1))-//^(/1) + 170156(/7)
K»s1 [0179] e i//(n) = (pLF (n) · //(/i) + noise(n) [0180] A parte imaginária do sinal pode ser ignorada:
o(n) = Re(^(n)) [0181] Em seguida, conforme mencionado anteriormente, pode seguir-se uma correção de tonalidade, por exemplo, por filtragem inversa.
[0182] A Figura 12 ilustra um diagrama em bloco de um decodifiçador de extensão de largura de banda 1200 para prover um sinal de áudio estendido de largura de banda 532, com base em um sinal de áudio de entrada 502, de acordo com uma configuração da invenção. 0 decodifiçador de extensão de largura de banda 1200 compreende um gerador de correção 1210, um comparador 1220, um combinador 1230 e uma interface de saída 1240. O gerador de correção 1210 está conectado ao comparador 1220, o comparador 1220 está conectado ao combinador 1230 e o combinador 1230 está conectado à interface de saída 1240.
[0183] 0 gerador de correção 1210 gera, no mínimo, um sinal de alta frequência de extensão de largura de banda, com base no sinal de áudio de entrada 502, onde uma frequência de corte mais baixa da banda de alta frequência,
48/69 de um sinal de alta frequência de extensão de largura de banda 1212, é mais baixa que uma alta do sinal de áudio de entrada frequência de corte mais
502. Diferentes sinais de alta frequência de extensão de largura de banda
1212 compreendem diferentes frequências dentro das bandas de alta frequência, se forem gerados diferentes sinais de alta frequência de extensão de largura de banda
1212.
uma pluralidade comparador 1220 calcula de [0184]
parâmetros de comparação. Um parâmetro de comparação é
calculado com base em uma comparação do sinal de áudio de
entrada 502 e em um sinal gerado de alta frequência de
extensão de largura de banda 1212. Cada parâmetro de
comparação, da pluralidade de parâmetros de comparação, é
calculado com base em uma frequência desviada diferente entre o sinal de áudio de entrada 502 e um sinal gerado de alta frequência de extensão de largura de banda 1212. Ademais, o comparador determina um parâmetro de comparação proveniente da pluralidade de parâmetros de comparação, onde o parâmetro de comparação determinado atende um critério pré-definido.
[0185] Um combinador 1230 combina o sinal de áudio de entrada 502 e o sinal de alta frequência de extensão de largura de banda 1212 para obter o sinal de áudio estendido de largura de banda 532, onde o sinal de alta frequência de extensão de largura de banda 1212 está baseado em uma frequência desviada referente ao parâmetro de comparação determinado.
[0186] A interface de saída 1240 provê o sinal de áudio estendido de largura de banda 532.
49/69
Em comparação ao decodificador ilustrado na
Figura 5, o decodificador descrito
1200 determina frequência desviada por conta própria.
Portanto, não necessário receber este parâmetro com o sinal de áudio de entrada 502, Neste modo, a taxa de bits para transmissão ou armazenamento de sinais de áudio pode ser adicionalmente reduzida.
[0188]
Conforme descrito na Figura 1, o gerador de correção 1210 pode gerar uma pluralidade de sinais de alta frequência de extensão de largura de banda com frequências desviadas diferentes ou somente um sinal de alta frequência de extensão de largura de banda, que é deslocado por diferentes frequências desviadas. Novamente, também pode ser utilizada uma combinação destas duas possibilidades.
[0189] A Figura 13 ilustra um fluxograma de um método 1300 para prover um sinal de áudio estendido de largura de banda, de acordo com uma configuração da invenção. O método 1300 compreende a geração 1310 de, no mínimo, um sinal de alta frequência de extensão de largura de banda, que calcula 1320 uma pluralidade de parâmetros de comparação, que determina 1330 um parâmetro de comparação a partir da pluralidade de parâmetros de comparação, que combina 1340 o sinal de áudio de entrada e um sinal de alta frequência de extensão de largura de banda e prover 1350 o sinal de áudio estendido de largura de banda.
[0190] Um sinal estendido de alta frequência de largura de banda compreende uma banda de alta frequência com base no sinal de áudio de entrada. Uma frequência de corte
50/69 mais baixa, da banda de alta frequência, de um sinal estendido de alta frequência de largura de banda é mais baixa que uma frequência de corte mais alta do sinal de áudio de entrada. Diferentes sinais de alta frequência de extensão de largura de banda compreendem diferentes frequências dentro das respectivas bandas de alta frequência, se forem gerados diferentes sinais de alta frequência de extensão de largura de banda.
[0191] Um parâmetro de comparação é calculado com base na comparação do sinal de áudio de entrada e no sinal gerado de alta frequência de extensão de largura de banda. Cada parâmetro de comparação, da pluralidade de parâmetros de comparação, é calculado com base em uma frequência desviada diferente entre o sinal de áudio de entrada e o sinal gerado de alta frequência de extensão de largura de banda.
[0192] O parâmetro de comparação determinado atende um critério pré-definido.
[0193] 0 sinal de alta frequência de extensão de
largura de banda, que é combinado ao sinal de áudio de
entrada para obter o sinal de áudio de largura de banda, está
baseado em uma frequência desviada que corresponde ao
parâmetro de comparação determinado.
[0194] A Figura 14 ilustra um fluxograma de um método 1400 para prover um sinal de áudio estendido de largura de banda, de acordo com uma configuração da invenção.
[0195] Depois de receber 1402 um fluxo de bits que compreende o sinal de áudio de entrada, um decodifiçador central decodifica 1410 o sinal de áudio de entrada. Com base
51/69 em um sinal de áudio de entrada, um sinal de alta frequência de extensão de largura de banda é gerado 1310 e é calculada a pluralidade de parâmetros de comparação, em termos de uma correlação cruzada entre o sinal de áudio de entrada e um sinal gerado de alta frequência de extensão de largura de banda, com diferentes frequências desviadas 1320. Em seguida, o parâmetro de comparação que atende o critério pré-definido é determinado 1330, que também é denominado estimativa de latência.
[0196]
Com base na frequência desviada referente ao parâmetro de comparação determinado, um modulador pode modular 1420 o sinal de áudio de entrada. Adicionalmente, um parâmetro pode ser extraído 1430 do fluxo de bits recebidos
1402 para adaptar, por exemplo, a densidade de potência do sinal modulado. O sinal modulado é, assim, combinado 1340 com o sinal de áudio de entrada. Adicionalmente, a tonalidade e o ruído do sinal de áudio estendido de largura de banda podem ser corrigidos 1440. Isso também pode ser realizado antes da combinação com o sinal de áudio de entrada. Em seguida, os dados de áudio, em termos do sinal de áudio estendido de largura de banda, são providos 1350, por exemplo, para reprodução acústica.
[0197] Neste modo, o cálculo da modulação variável de tempo é realizado no lado decodificador.
[0198] Alternativamente, para o modulador modular 1420 o sinal de áudio de entrada, para gerar uma correção, por exemplo, o sinal de alta frequência de extensão de largura de banda anteriormente gerado pode ser utilizado ou o
52/69 gerador de correção pode gerar um sinal de alta frequência de extensão de largura de banda (correção) com base em uma frequência desviada referente ao parâmetro de comparação determinado.
[0199] Ou seja, se uma baixa taxa de dados é mais importante que uma baixa complexidade do lado decodifiçador, a determinação da modulação de frequência dos moduladores também pode ser realizada no lado decodifiçador. Para tanto, o algoritmo ilustrado na Figura 9 pode ser executado no decodifiçador com apenas algumas alterações. Uma vez que o sinal original não está disponível para o cálculo da correlação cruzada no decodifiçador, as correlações podem ser calculadas entre o sinal original (sinal de áudio de entrada) e um sinal original deslocado (sinal de áudio de entrada), dentro de uma faixa de sobreposição. Por exemplo, o sinal pode ser deslocado entre zero e ak, por exemplo, ak dividido por 2, ak dividido por 3 ou ak dividido por 4. ak indica, novamente, o limite de banda k-th, por exemplo, og indica a frequência do crossover do codificador central.
[0200] Por exemplo, isso pode acontecer da mesma forma no codificador e no decodifiçador. No codificador, os parâmetros para formação espectral, correção de ruído e/ou correção de tonalidade podem ser extraídos e transmitidos para o decodifiçador.
[0201] Adequadamente, a Figura 15 ilustra um diagrama em bloco de um codificador de extensão de largura de banda 1500 para prover um sinal de saída que utiliza um sinal de áudio de entrada, de acordo com uma configuração da
53/69 invenção. O codificador 1500 se refere ao codificador ilustrado na Figura 4. Entretanto, o codificador 1500 não provê o sinal de saída 132 com uma indicação de parâmetro, com base na própria frequência desviada. Ele somente pode determinar um parâmetro de densidade de potência e os parâmetros opcionais para correção de tonalidade e para correção de ruído e inclui uma indicação do parâmetro dos referidos parâmetros para o sinal de saida 132. Entretanto, o parâmetro de densidade de potência (e também outros parâmetros, se forem determinados) está determinado com base na frequência desviada referente ao parâmetro de comparação determinado.
[0202] Por exemplo, o parâmetro de densidade de potência pode indicar uma razão entre o sinal de áudio de entrada 102 e o sinal de alta frequência de extensão de largura de banda com uma frequência desviada referente ao parâmetro de comparação determinado. Portanto, a indicação de parâmetro que está relacionada ao parâmetro de densidade de potência, e opcional aos parâmetros para correção de tonalidade e/ou correção de ruido, está baseada na frequência desviada referente ao parâmetro de comparação determinado.
[0203] Uma diferença adicional entre o codificador 1500 e codificador ilustrado na Figura 4 é que o gerador de correção 110 gera um sinal de alta frequência de extensão de largura de banda do mesmo modo que é realizado pelo gerador de correção do decodificador 1400. Neste modo, o codificador 1500 e o decodificador podem obter as mesmas frequências desviadas e, portanto, os parâmetros extraídos pelo
54/69 codificador 1500 são válidos para as correções geradas pelo decodificador.
[0204] Algumas configurações, de acordo com a invenção, se referem a um dispositivo e a um método para extensão de largura de banda de sinais de áudio, no domínio de tempo, usando-se moduladores variáveis, ou seja, uma correção pode ser gerada com variação de frequência de corte, por exemplo, para cada fase de tempo, cada período de tempo, uma parte de um período de tempo ou para grupos de períodos de tempo.
[0205] O método descrito para extensão de largura de um sinal de áudio pode ser utilizado no lado codificador e no lado decodificador, bem como somente no lado decodificador. Em oposição aos métodos conhecidos, o novo método descrito pode realizar a denominada extensão harmônica da largura de banda, sem a necessidade de informações exatas sobre a frequência fundamental do sinal de áudio. Ademais, em oposição às denominadas extensões de largura de banda como, por exemplo, ilustradas pelo pedido de solicitação de patente norte-americana provisória Apparatus and method of harmonia bandwidth extension in audio signals [Aparelho e método de extensão harmônica de largura de banda em sinais de áudio] de F. Nagel, S. Disch com o número de solicitação US 61/025129, que são realizadas por meio de vocoders de voz, o espectro pode não ser propagado e, portanto, também a densidade pode não ser alterada. Para garantir a harmonia, são exploradas as correlações entre a banda estendida e a base. Esta correlação pode ser calculada no codificador, assim como no
55/69 decodifiçador, conforme a demanda de processamento e complexidade de memória, bem como taxa de dados.
[0206] Por exemplo, a extensão de largura de banda em si pode ser realizada pelo uso de uma modulação de amplitude (AM) e por um deslocamento de frequência por meio de uma modulação de banda de lado único (SSB), com uma pluralidade de transportadores lentos, adaptativo único e variável de tempo. Pode-se tentar um pós-processamento posterior, em conformidade com os parâmetros adicionais, para aproximar o envelope espectral e o nível de ruído, bem como outras propriedades dos sinais originais.
[0207] O novo método para transformação de sinais pode evitar os problemas que surgem devido a uma cópia simples ou operação de espelhamento, por meio de uma continuação harmônica correta do espectro, por meio de um crossover de frequência de corte de tempo variável entre a região de baixa frequência (BF) e a alta frequência (AF), bem como entre as seguintes regiões de alta frequência, as denominadas correções. Estas frequências de corte são escolhidas, assim as correções geradas se adaptam a uma varredura harmônica existente, uma vez que ela existe no original da melhor forma possível.
[0208] A Figura 16 ilustra um modulador com 3 amplitudes variáveis de tempo e frequências de corte pelas quais podem ser geradas 3 correções, por meio de uma modulação de banda de lado único das bandas de base. A Figura 16a ilustra um diagrama 1600a do espectro do sinal estendido de largura de banda que utiliza frequências de corte de tempo
56/69 variável 1610. A Figura 16b ilustra um diagrama 1600b do espectro do sinal de áudio de três tons. Em comparação com o espectrograma descrito na Figura 18b, as linhas 1620 são significativamente menos indistintas.
[0209] A Figura 17 ilustra o efeito por meio de um diagrama 1700 do período. O espectro de densidade de potência, dos terceiros tons do sinal de áudio, é ilustrado como original 1710, com uma frequência de corte constante 1720 e com uma frequência de corte variável 1730. Em oposição ao uso da frequência de corte constante 1720, a estrutura harmônica permanece por meio do uso da frequência de corte variável 1730.
[0210] Por meio da continuação harmônica do espectro, podem ser evitados os problemas nos pontos de transição entre a banda de base (codificador central) e a banda estendida, e entre as sucessivas correções. Sem uma estimativa Fo, como requisito para a função do sistema, os sinais arbitrários podem ser continuados harmônicos, sem a existência de artefatos audíveis, nem tampouco por meio da violação da harmonia ou por eventos sonoros temporários.
[0211] Algumas configurações, de acordo com a invenção, se referem a um método adequado para todas as aplicações de áudio, onde a largura de banda completa não está disponível. Por exemplo, para a transmissão de conteúdo de áudio como, por exemplo, com rádio digital, stream de internet ou em aplicações de comunicação de áudio, pode ser utilizado o método descrito.
[0212] Configurações adicionais, de acordo com a
57/69 invenção, se referem a um decodifiçador de extensão de largura de banda para prover um sinal de áudio estendido de largura de banda, com base em um sinal de áudio de entrada e um sinal de parâmetro, onde o sinal de parâmetro compreende uma indicação de uma frequência desviada e uma indicação de um parâmetro de densidade de potência. 0 decodifiçador de extensão de largura de banda compreende um gerador de correção, um combinador e uma interface de saída. 0 gerador de correção está configurado para gerar um sinal de alta frequência de extensão de largura de banda que compreende uma banda de alta frequência, onde a banda de alta frequência, do sinal de alta frequência de extensão de largura de banda, é gerada com base em um deslocamento de frequência de uma banda de frequência do sinal de áudio de entrada, onde o deslocamento de frequência está baseado na frequência desviada, e onde o gerador de correção está configurado para amplificar ou atenuar a banda de alta frequência do sinal de alta frequência de extensão de largura de banda por meio de um fator igual ao valor do parâmetro de densidade de potência ou igual ao valor recíproco do parâmetro de densidade de potência. 0 combinador está configurado para combinar o sinal de alta frequência de extensão de largura de banda e o sinal de áudio de entrada para obter o sinal de áudio estendido de largura de banda. A interface de saída está configurada para prover o sinal de áudio estendido de largura de banda.
[0213] Algumas configurações adicionais, de acordo com a invenção, se referem a um decodifiçador de extensão de largura de banda, conforme descrito anteriormente, onde o
58/69 gerador de correção está configurado para amplificar ou atenuar a banda de alta frequência do sinal de alta frequência de extensão de largura de banda por meio de um fator igual ao valor de um parâmetro de densidade de potência ou igual ao valor recíproco do parâmetro de densidade de potência, onde uma indicação do parâmetro de densidade de potência está contida pelo sinal de áudio de entrada.
[0214] Outros exemplos de incorporações são descritos subsequentemente:
[0215] Codificador de áudio (100), (400), (1500) para fornecer um sinal de áudio (132) utilizando um sinal de áudio de entrada (102), compreendendo:
[0216] um gerador de correção (110) configurado para gerar, pelo menos, um sinal de alta frequência de extensão de largura de banda (112), sendo um sinal de alta frequência de extensão de largura de banda (112) que compreende uma banda de alta frequência, em que a banda de alta frequência de um sinal de alta frequência de extensão de largura de banda (112) tem base em uma banda de baixa frequência do sinal de áudio de entrada (102) e em que diferentes sinais de alta frequência de extensão de largura de banda (112) compreendem diferentes frequências dentro das suas bandas de alta frequência, se diferentes sinais de alta frequência de extensão de largura de banda (112) forem gerados;
[0217] um comparador (120) configurado para calcular uma pluralidade de parâmetros de comparação, em que um parâmetro de comparação é calculado com base em uma comparação do sinal de áudio de entrada (102) e um sinal de
59/69 alta frequência de extensão de largura de banda (112) gerado, em que cada parâmetro de comparação da pluralidade de parâmetros de comparação é calculado com base em uma diferente frequência desviada entre o sinal de áudio de entrada (102) e um sinal de alta frequência de extensão de largura de banda (112) gerado, e em que o comparador (120) é configurado para determinar um parâmetro de comparação da pluralidade de parâmetros de comparação, em que o parâmetro de comparação determinado atende a um critério predefinido; e [0218] uma interface de saída (130) configurada para fornecer o sinal de áudio (132) para transmissão ou armazenamento, em que o sinal de áudio (132) compreende uma indicação de parâmetro com base em uma frequência desviada correspondente ao parâmetro de comparação determinado.
[0219] Um codificador de áudio, ainda compreende um comparador de densidade de parâmetro (430) configurado para comparar um parâmetro com base em uma densidade de potência da banda de alta frequência de um sinal de alta frequência de extensão de largura de banda (112) gerado e uma banda de frequência correspondente do sinal de áudio de entrada (102) para obter um parâmetro de densidade de potência, caracterizado pelo parâmetro de densidade de potência indicar um índice com base na densidade de potência da banda de alta frequência do sinal de alta frequência de extensão de largura de banda (112) gerado e da banda de frequência correspondente do sinal de áudio de entrada (102), e em que a indicação de parâmetro do sinal de áudio 132 tem base no parâmetro de densidade de potência.
60/69 [0220]
Um decodifiçador de extensão da largura de banda (500), (600) para fornecer um sinal de áudio estendido de largura de banda com base em um. sinal de áudio de sinal de parâmetro (504), sendo que o sinal de parâmetro (504) compreende uma indicação de uma frequência desviada e uma indicação de um parâmetro de densidade de potência, o decodifiçador de extensão da largura de banda compreendendo:
[0221] um gerador de correção (510) configurado para gerar um sinal de alta frequência de extensão de largura de banda (512) compreendendo uma banda de alta frequência, em que a banda de alta frequência do sinal de alta frequência de extensão de largura de banda (512) é gerada com base em um deslocamento de frequência de uma banda de frequência do sinal de áudio de entrada (502), caracterizado pelo deslocamento de frequência ter base na frequência desviada e em que o gerador de correção (510) é configurado para amplificar ou atenuar a banda de alta frequência do sinal de alta frequência de extensão de largura de banda (512) por um fator igual ao valor do parâmetro de densidade de potência ou igual ao valor recíproco do parâmetro de densidade de potência, respectivamente;
[0222] um combinador (529) configurado para combinar o sinal de alta frequência de extensão de largura de banda (512) com o sinal de áudio de entrada (502) para obter o sinal de áudio estendido de largura de banda (532); e [0223] uma interface de saída (530) configurada para fornecer o sinal de áudio estendido de largura de banda
61/69 (532) .
[0224] 0 Decodificador de extensão da largura de
banda, de acordo com o exemplo acima, compreende um
combinador (520)que é configurado para ignorar uma parte da
banda de alta frequência do sinal de alta frequência de extensão de largura de banda (512), em que a parte ignorada da banda de alta frequência do sinal de alta frequência de extensão de largura de banda (512) compreende frequências menores que uma frequência de corte superior do sinal de áudio de entrada (502) .
[0225] 0 Decodificador de extensão da largura de
banda, de acordo com os exemplos acima, compreendendo um
decodificador central (610) configurado para gerar o sinal de áudio de entrada (502) com base em um sinal de áudio de entrada codificado (602), caracterizado pelo decodificador central (610) gerar o sinal de áudio de entrada (502) com uma
frequência de corte superior constante e em que o gerador de
correção ( 510) é configurado para gerar a banda de alta
frequência do sinal de alta frequência de extensão de largura de banda (512) deslocando a banda de frequência do sinal de áudio de entrada (502) por uma frequência igual à frequência de corte superior do sinal de áudio de entrada (502) mais a
frequência desviada.
[0226] 0 Decodificador de extensão da largura de
banda, em conformidade com qualquer um dos exemplos acima,
onde o gerador de correção (510) é configurado para gerar o sinal de alta frequência de extensão de largura de banda (512) no domínio de tempo.
62/69 [0227] O Decodifiçador de extensão da largura de banda, em conformidade com o exemplo acima, onde o gerador de correção (510) é configurado para gerar o sinal de alta frequência de extensão de largura de banda (512) com base em uma modulação de banda de lado único.
[0228] O Decodifiçador de extensão da largura de banda (1200) para fornecer um sinal de áudio estendido de largura de banda (532) com base em um sinal de áudio de entrada (502), compreende:
[0229] um gerador de correção (1210) configurado para gerar, pelo menos, um sinal de alta frequência de extensão de largura de banda (1212) compreendendo uma banda de alta frequência baseado no sinal de áudio de entrada (502), caracterizado por uma frequência da banda de alta frequência de corte inferior de um sinal de alta frequência de extensão de largura de banda (1212) ser menor que uma frequência de corte superior do sinal de áudio de entrada (502) e em que diferentes sinais de alta frequência de extensão de largura de banda (1212) compreendem diferentes frequências dentro das suas bandas de alta frequência, se diferentes sinais de alta frequência de extensão de largura de banda (1212) forem gerados;
[0230] um comparador (1220) configurado para calcular uma pluralidade de parâmetros de comparação, em que um parâmetro de comparação é calculado com base em uma comparação do sinal de áudio de entrada (502) e um sinal de alta frequência de extensão de largura de banda gerado (1212), em que cada parâmetro de comparação da pluralidade de
63/69 parâmetros de comparação é calculado com base em uma diferente frequência desviada entre o sinal de áudio de entrada (502) e um sinal de alta frequência de extensão de largura de banda gerado (1212), e em que o comparador (1220) é configurado para determinar um parâmetro de comparação da pluralidade de parâmetros de comparação, em que o parâmetro de comparação determinado atende a um critério predefinido;
[0231] um combinador (1230) configurado para combinar o sinal de áudio de entrada (502) com um sinal de alta frequência de extensão de largura de banda para obter o sinal de áudio estendido de largura de banda (532), em que o sinal de alta frequência de extensão de largura de banda utilizado para obter o sinal de áudio da extensão da largura de banda (532) tem base em uma frequência desviada correspondente ao parâmetro de comparação determinado; e [0232] uma interface de saida (1240) configurada para fornecer o sinal de áudio estendido de largura de banda (532) .
[0233] 0 Decodificador de extensão da largura de banda, de acordo com o exemplo acima sendo que o gerador de correção (1210) é configurado para amplificar ou atenuar a banda de alta frequência do sinal de alta frequência de extensão de largura de banda (1212) por um fator igual ao valor de um parâmetro de densidade de potência ou igual ao valor reciproco do parâmetro de densidade de potência, respectivamente, em que uma indicação do parâmetro de densidade de potência é contida pelo sinal de áudio de entrada (502).
64/69 [0234]
O Decodificador de extensão da largura de banda, em conformidade com os exemplos acima, compreende um meio de interpolação, onde por um período de tempo compreende uma pluralidade de fases de tempo, em que cada período de tempo compreende uma frequência desviada correspondente, em que o meio de interpolação é configurado para interpolar uma frequência desviada de um período de tempo ou uma pluralidade de frequências desviadas de diferentes períodos de tempo para cada fase de tempo de um pe frequência desviada interpolac [0235] O Codificador extensão da largura de banda, acima onde o comparador é comparação do sinal de áudio frequência de extensão de cálculo de um resultado da c iodo de tempo para obter uma i para cada fase de tempo.
de áudio ou decodificador de de acordo com um dos exemplos configurado para realizar a de entrada e o sinal de alta argura de banda gerado pelo orrelação cruzada do sinal de áudio de entrada e do sinal de alta frequência de extensão de largura de banda gerado, em que o parâmetro de comparação a ser calculado tem base no resultado da correlação cruzada, em que um parâmetro da correlação cruzada é uma frequência desviada do sinal de alta frequência de extensão de largura de banda e é, assim, associado ao parâmetro de comparação calculado.
[0236] Um método (700) para fornecer um sinal de áudio utilizando um sinal de áudio de entrada, sendo que o método compreende:
[0237] gerar (710), pelo menos, um sinal de alta frequência de extensão de largura de banda, sendo que um
65/69 sinal de alta frequência de extensão de largura de banda compreende uma banda de alta frequência, em que a banda de alta frequência do sinal de alta frequência de extensão de largura de banda tem base em uma banda de baixa frequência do sinal de áudio de entrada, e em que diferentes sinais de alta frequência de extensão de largura de banda compreendem diferentes frequências dentro de suas bandas de alta frequência, se diferentes sinais de alta frequência de extensão de largura de banda forem gerados;
[0238] calcular (720) uma pluralidade de parâmetros de comparação, em que um parâmetro de comparação é calculado com base em uma comparação do sinal de áudio de entrada e um sinal de alta frequência de extensão de largura de banda gerado, em que cada parâmetro de comparação da pluralidade de parâmetros de comparação é calculado com base em uma diferente frequência desviada entre o sinal de áudio de entrada e um sinal de alta frequência de extensão de largura de banda gerado;
[0239] determinar (730) um parâmetro de comparação da pluralidade de parâmetros de comparação, em que o parâmetro de comparação determinado atende a um critério
predefinido; e
[0240] fornecer (740) o sinal de áudio para
transmissão ou armazenamento, em que o sinal de áudio
compreende uma indicaçao de parâmetro com base em uma
frequência desviada correspondente ao parâmetro de comparação determinado.
[0241] O Método (800) para fornecer um sinal de
66/69 áudio estendido de largura de banda com base em um sinal de áudio de entrada e um sinal de parâmetro, onde o sinal de parâmetro compreende uma indicação de uma frequência desviada e uma indicação de um parâmetro de densidade de potência, o método compreendendo:
[0242] gerar (810) um sinal de alta frequência de extensão de largura de banda compreendendo uma banda de alta frequência, em que a banda de alta frequência do sinal de alta frequência de extensão de largura de banda é gerada com base no deslocamento de frequência de uma banda de frequência do sinal de áudio de entrada, em que o deslocamento de frequência tem base na frequência desviada;
[0243] amplificar (820) ou atenuar a banda de alta frequência do sinal de alta frequência de extensão de largura de banda por um fator igual ao valor do parâmetro de densidade de potência ou igual ao valor reciproco do parâmetro de densidade de potência;
combinar frequência de extensão de largura de banda com o sinal de áudio de entrada para obter um sinal de áudio estendido de largura de banda; e [0245] fornecer (840) o sinal de áudio estendido de largura de banda.
[0246] O Método (1300) para fornecer um sinal de áudio estendido de largura de banda com base em um sinal de áudio de entrada, o método compreendendo:
[0247] gerar (1310) , pelo menos, um sinal de alta frequência de extensão de largura de banda compreendendo uma banda de alta frequência com base no sinal de áudio de
67/69 entrada, caracterizado por uma frequência da banda de alta frequência de corte inferior de um sinal de alta frequência de extensão de largura de banda ser menor que uma frequência de corte superior do sinal de áudio de entrada, e em que diferentes sinais de alta frequência de extensão de largura de banda compreendem diferentes frequências dentro de suas bandas de alta frequência, se diferentes sinais de alta frequência de extensão de largura de banda forem gerados;
[0248] calcular (1320) uma pluralidade de parâmetros de comparação, em que um parâmetro de comparação é calculado com base em uma comparação do sinal de áudio de entrada e um sinal de alta frequência de extensão de largura de banda gerado, em que cada parâmetro de comparação da pluralidade de parâmetros de comparação é calculado com base em uma diferente frequência desviada entre o sinal de áudio de entrada e um sinal de frequência de extensão da largura de banda gerado;
[0249] determinar (1330) um parâmetro de comparação da pluralidade de parâmetros de comparação, em que o parâmetro de comparação determinado atende a um critério predefinido;
[0250] combinar (1340) o sinal de áudio de entrada com um sinal de alta frequência de extensão de largura de banda para obter o sinal de áudio estendido de largura de banda, em que o sinal de alta frequência estendido da largura de banda utilizado para obter o sinal de áudio estendido de largura de banda tem base em uma frequência desviada correspondente ao parâmetro de compensação determinado; e
68/69 [0251] fornecer (1350) o sinal de áudio estendido de largura de banda.
[0252] Um programa de computador com um código de programa para realizar o método, de acordo com um dos exemplos acima, quando o programa de computador é executado em um computador ou um microcontrolador.
[0253] Enquanto esta invenção foi descrita em termos de várias configurações, há alterações, trocas e equivalentes que recaem dentro do escopo desta invenção. Também deve ser observado que há várias formas alternativas de implementar os métodos e composições da presente invenção. Portanto, é esperado que as seguintes reivindicações anexas sejam interpretadas como incluindo todas as referidas alterações, trocas e equivalentes que recaem dentro do verdadeiro espirito e escopo da presente invenção.
[0254] Em particular, é enfatizado que, conforme as condições, o esquema inventivo também possa ser implementado em software. A implementação pode ser em um meio de armazenamento digital, particularmente um disco flexível ou um CD com sinais de controle passíveis de leitura eletrônica, capaz de atuar em um sistema de informática programável, para que assim o referido método seja executado. Em geral, a invenção também consiste de um produto de programa para computador com um código de programa armazenado em um dispositivo transportador passível de leitura em máquina para realizar o método inventivo, quando o produto de programa para computador seja executado em um computador. De outro modo informado, a invenção pode, assim, também ser
69/69 considerada como um programa para computador com um programa para executar o método, quando o produto d< para computador seja executado em um computador.
código de programa

Claims (8)

1. Codificador de áudio para fornecer um sinal de áudio (132) utilizando um sinal de áudio de entrada (102), compreendendo:
um gerador de correção (110) configurado para gerar um sinal de alta frequência de extensão de largura de banda (112), caracterizado pelo sinal de alta frequência de extensão de largura de banda (112) compreender uma banda de alta frequência, em que a banda de alta frequência do sinal de alta frequência de extensão de largura de banda (112) é derivada de uma banda de baixa frequência do sinal de áudio de entrada (102) deslocando a parte de baixa frequência por um valor fixo utilizando uma modulação da banda lateral;
um comparador (120) configurado para realizar uma comparação do sinal de áudio de entrada filtrada por um filtro passa-faixa (420) e o sinal de alta frequência de extensão de largura de banda (112) utilizando um cálculo de correlação cruzada em intervalos de tempo regulares entre os espectros de amplitude das seção de sinal janelado do sinal de áudio de entrada filtrado pelo filtro passa-faixa (420) e o sinal de alta frequência de extensão de largura de banda (112) para determinar uma latência para uma correlação máxima para uma seção de sinal; e uma interface de saída (130) configurada para fornecer o sinal de áudio (132) para transmissão ou armazenamento, em que o sinal de áudio (132) compreende uma indicação de parâmetro com base na latência para a correlação máxima.
2/8
2. Codificador de áudio, de acordo com a reivindicação 1, compreendendo um comparador de densidade de parâmetro (430) configurado para comparar um parâmetro com base em uma densidade de potência da banda de alta frequência de um sinal de alta frequência de extensão de largura de banda (112) gerado e uma banda de frequência correspondente do sinal de áudio de entrada (102) para obter um parâmetro de densidade de potência, em que o parâmetro de densidade de potência indica um índice com base na densidade de potência da banda de alta frequência do sinal de alta frequência de extensão de largura de banda (112) gerado e da banda de
frequência correspondente do sinal de áudio de entrada (102), e em que a interface de saída (130) é configurada para fornecer o sinal de áudio, de modo que a indicação de parâmetro do sinal de áudio (132) tenha bas e no parâmetro de densidade de potência. 3. Codificador de áudio, de acordo com a
reivindicação 1, caracterizado pela modulação da banda lateral ser uma modulação única de banda lateral.
4. Codificador de áudio, de acordo com a reivindicação 1 ou 2, sendo configurado para interpolar, caracterizado pela latência para a correlação máxima determinada para uma seção de sinal janelado ser interpolada para cada fase de tempo da seção de sinal janelado.
5. Codificador de áudio, de acordo com uma das reivindicações de 1 a 4, caracterizado pelo gerador de correção (110) ser configurado para aplicar uma transformada de Hilbert (906) ao sinal de entrada de áudio, o sinal de
3/8 áudio de entrada sendo um sinal de valor real, de modo que um sinal analítico (908) é obtido e o sinal analítico é filtrado passa-baixo (904).
6. Codificador de áudio, de acordo com a reivindicação 5, caracterizado pelo gerador de correção ser configurado para gerar uma função do modulador analítico (902) e para modular (710) um sinal analítico filtrado passabaixo para obter um sinal modulado (910) .
Codificador de áudio, de acordo com a reivindicação 6, caracterizado pelo comparador ser configurado para realizar um janelamento (912, 914) com ou sem sobreposição e do sinal modulado (910) para obter a seção de sinal janelado e uma transformada de Fourier (916) subsequente da seção de sinal janelado para obter os espectros de amplitude da seção de sinal janelado do sinal de áudio de entrada filtrado pelo filtro passa-faixa (420) e do sinal de alta frequência de extensão de largura de banda (112) .
8. Decodifiçador de extensão da largura de banda para fornecer um sinal de áudio estendido de largura de banda (532) com base em um sinal de áudio de entrada (502) e um sinal de parâmetro (504), caracterizado pelo sinal de parâmetro (504) compreender uma indicação de uma frequência
desviada e uma indicação de um parâmetro de densidade de potência, o decodifiçador de extensão da largura de banda compreendendo: um gerador de correção (510) configurado para
gerar um sinal de alta frequência de extensão de largura de
4/8 banda (512) compreendendo uma banda de alta frequência, em que a banda de alta frequência do sinal de alta frequência de extensão de largura de banda (512) é gerada por uma modulação do sinal de áudio de entrada (502) com base na frequência desviada e no parâmetro de densidade de potência para obter o sinal de alta frequência de extensão de largura de banda, em que o gerador de correção (501) é configurado para realizar a modulação em um domínio de tempo;
um combinador (529) configurado para combinar o sinal de alta frequência de extensão de largura de banda (512) com o sinal de áudio de entrada (502) para obter o sinal de áudio estendido de largura de banda (532); e uma interface de saída (530) configurada para fornecer o sinal de áudio estendido de largura de banda (532) .
9. Decodificador de extensão da largura de banda, de acordo com a reivindicação 8, caracterizado pelo gerador de correção (510) ser configurado para gerar o sinal de alta frequência de extensão de largura de banda (512) com base em uma modulação de banda de lado único.
10. Decodificador de extensão da largura de banda, de acordo com uma das reivindicações de 8 a 9, compreendendo um meio de interpolação, caracterizado por um período de tempo compreender uma pluralidade de fases de tempo, em que cada período de tempo compreende uma frequência desviada correspondente, em que o meio de interpolação é configurado para interpolar uma frequência desviada de um período de tempo ou uma pluralidade de frequências desviadas
5/9 de diferentes períodos de tempo para cada fase de tempo de um período de tempo para obter uma frequência desviada interpolada para cada fase de tempo.
11. Decodifiçador de extensão da largura de banda, de acordo com uma das reivindicações 8 ou 9 ou 10, caracterizado pelo gerador de correção ser configurado para calcular o sinal de alta frequência de extensão de largura de banda (512) com base nas seguintes equações:
=Σ φίΛ(η) · pk{n) + no ise(n>
OU i//(n) = (píf (η) · μ(η) + noise(n), e
o(n) = Re(i//(n)) em que n é um índice de tempo, k é um índice de correção, □ é um sinal completo do domínio de tempo,□□ é o sinal de áudio de entrada (502), □ é uma função de modulação, ruído é um sinal de ruído, o é o sinal de alta frequência de extensão de largura de banda e Re é uma função para fazer a parte real.
12. Decodifiçador de extensão da largura de banda, de acordo com uma das reivindicações de 8 a 11, caracterizado pelo gerador de correção ser configurado para utilizar uma função de modulação a ser multiplicada pelo sinal de áudio de entrada (502), em que a função de modulação tem base na seguinte equação:
{<
2 ,τ j V (i m λ, (m)) = çk(n)e
6/8 em que k é um índice de correção, n é um índice de tempo, p(n) é um valor de uma função de modulação para um índice de tempo n, θ um parâmetro de densidade de potência interpolado para um índice de tempo n e um índice de correção k, m é um índice de número inteiro, j é o número complexo, /*(w) ® um aumento de fase para o índice de correção k e o índice de número inteiro m, e ^(m) é um valor de latência interpolado para o índice de correção k e o índice de número inteiro m, o valor de latência interpolado sendo derivado do sinal de parâmetro (504) compreendendo uma indicação de uma frequência desviada.
13. Decodifiçador de extensão da largura de banda, de acordo com uma das reivindicações de 8 a 11, caracterizado pelo gerador de correção ser configurado para usar uma função de modulação a ser multiplicada pelo sinal de áudio de entrada (502), em que a função de modulação é com base na seguinte equação:
//(n) = £çjn)e
K = 1 t
em que k é um índice de correção, kmax é um número máximo de correções, n é um índice de tempo, χϊ(λϊ) θ um valor de uma função de modulação para um índice de tempo n, ç*(n) é um parâmetro de densidade de potência interpolado para um índice de tempo n e um índice de correção k, m é um índice de número inteiro, j é o número complexo, Ykijn} é um aumento da fase para o índice de correção k e o índice de número inteiro m, e 2k(m) é um valor de latência interpolado para o índice de correção k e o índice de número inteiro m, o
7/8 valor de latência interpolado sendo derivado do sinal de parâmetro (504) compreendendo uma indicação de uma frequência desviada.
14. Método (700) para fornecer um sinal de áudio utilizando um sinal de áudio de entrada, o método compreendendo: gerar (710) um sinal de alta frequência de
extensão de largura de banda (112), caracterizado pelo sinal de alta frequência de extensão de largura de banda (112) compreender uma banda de alta frequência, em que a banda de alta frequência do sinal de alta frequência de extensão de largura de banda (112) é derivada de uma banda de baixa frequência do sinal de áudio de entrada (102) deslocando a parte de baixa frequência por um valor fixo utilizando uma modulação da banda lateral;
realizar (720) uma comparação do sinal de áudio de entrada filtrada por um filtro passa-faixa (420) e do sinal de alta frequência de extensão de largura de banda (112) utilizando um cálculo de correlação cruzada em intervalos de tempo regulares entre os espectros de amplitude da seção de sinal janelado do sinal de áudio de entrada filtrado pelo filtro passa-faixa (420) e o sinal de alta frequência de extensão de largura de banda (112) para determinar uma latência para uma correlação máxima para uma seção de sinal; e fornecer (740) o sinal de áudio (132) para transmissão ou armazenamento, em que o sinal de áudio (132) compreende uma indicação de parâmetro com base na latência
8/8 para a correlação máxima.
15. Método (800) para fornecer um sinal de áudio estendido de largura de banda com base em um sinal de áudio de entrada e um sinal de parâmetro, caracterizado pelo sinal de parâmetro compreender uma indicação de uma frequência desviada e uma indicação de um parâmetro de densidade de potência, o método compreendendo:
gerar (810) um sinal de alta frequência de extensão de largura de banda compreendendo uma banda de alta frequência, em que a banda de alta frequência do sinal de alta frequência de extensão de largura de banda é gerada por uma modulação do sinal de áudio de entrada (502) com base na frequência desviada e no parâmetro de densidade de potência para obter o sinal de alta frequência de extensão de largura de banda, em que o gerador de correção (501) é configurado para realizar a modulação em um domínio de tempo;
combinar (830) o sinal de alta frequência de extensão de largura de banda e com o sinal de áudio de entrada (502) para obter um sinal de áudio estendido de largura de banda; e fornecer (840) o sinal de áudio estendido de
largura de banda.
BR122015019030A 2008-12-15 2009-12-11 codificador de audio e decodificador de extensão de largura de banda BR122015019030B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US12255208P 2008-12-15 2008-12-15
US61/122,552 2008-12-15
PCT/EP2009/066980 WO2010069885A1 (en) 2008-12-15 2009-12-11 Audio encoder and bandwidth extension decoder
BRPI0917762-0A BRPI0917762B1 (pt) 2008-12-15 2009-12-11 Codificador de áudio e decodificador de extensão de largura de banda

Publications (2)

Publication Number Publication Date
BR122015019030A2 true BR122015019030A2 (pt) 2019-08-27
BR122015019030B1 BR122015019030B1 (pt) 2020-05-05

Family

ID=42104496

Family Applications (2)

Application Number Title Priority Date Filing Date
BRPI0917762-0A BRPI0917762B1 (pt) 2008-12-15 2009-12-11 Codificador de áudio e decodificador de extensão de largura de banda
BR122015019030A BR122015019030B1 (pt) 2008-12-15 2009-12-11 codificador de audio e decodificador de extensão de largura de banda

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BRPI0917762-0A BRPI0917762B1 (pt) 2008-12-15 2009-12-11 Codificador de áudio e decodificador de extensão de largura de banda

Country Status (16)

Country Link
US (13) US8401862B2 (pt)
EP (12) EP4231291B1 (pt)
JP (3) JP2012512437A (pt)
KR (2) KR101369267B1 (pt)
CN (1) CN102246231B (pt)
AU (1) AU2009328247B9 (pt)
BR (2) BRPI0917762B1 (pt)
CA (5) CA2908847C (pt)
DK (1) DK3364414T3 (pt)
ES (4) ES2613941T3 (pt)
HK (2) HK1217810A1 (pt)
MX (1) MX2011006163A (pt)
PL (8) PL4231290T3 (pt)
PT (3) PT2359366T (pt)
TR (1) TR201808500T4 (pt)
WO (1) WO2010069885A1 (pt)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6992481B2 (en) 2003-05-29 2006-01-31 Timex Group B. V. Method for compensating for predictable generated signals in an electronic device
EP4231291B1 (en) * 2008-12-15 2023-11-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder, corresponding method and computer program
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
JP5649084B2 (ja) 2010-03-09 2015-01-07 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 再生速度またはピッチを変更する際にオーディオ信号における過渡音声事象を処理するための装置および方法
KR101414736B1 (ko) * 2010-03-09 2014-08-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 캐스케이드 필터뱅크들을 이용한 입력 오디오 신호를 처리하는 장치 및 방법
WO2011110494A1 (en) 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals
FR2961938B1 (fr) * 2010-06-25 2013-03-01 Inst Nat Rech Inf Automat Synthetiseur numerique audio ameliore
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
JP5714180B2 (ja) 2011-05-19 2015-05-07 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーディング方式の鑑識検出
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US20140046670A1 (en) * 2012-06-04 2014-02-13 Samsung Electronics Co., Ltd. Audio encoding method and apparatus, audio decoding method and apparatus, and multimedia device employing the same
KR101990884B1 (ko) * 2012-09-04 2019-06-19 에스케이 텔레콤주식회사 이종망 간의 통신품질 향상 방법 및 장치
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US9258428B2 (en) * 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing
EP2950308B1 (en) * 2013-01-22 2020-02-19 Panasonic Corporation Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
PL3067890T3 (pl) 2013-01-29 2018-06-29 Fraunhofer Ges Forschung Koder audio, dekoder audio, sposób dostarczania zakodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i zakodowana reprezentacja, wykorzystujące adaptacyjne względem sygnału powiększanie szerokości pasma
ES2899781T3 (es) 2013-01-29 2022-03-14 Fraunhofer Ges Forschung Aparato y procedimiento para generar una señal de refuerzo de frecuencia mediante la configuración de la señal de refuerzo
CN103971694B (zh) * 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
RU2622872C2 (ru) * 2013-04-05 2017-06-20 Долби Интернэшнл Аб Аудиокодер и декодер для кодирования по форме волны с перемежением
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
EP2830056A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US10083708B2 (en) * 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
JP6593173B2 (ja) * 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
JP6576934B2 (ja) * 2014-01-07 2019-09-18 ハーマン インターナショナル インダストリーズ インコーポレイテッド 圧縮済みオーディオ信号の信号品質ベース強調及び補償
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
EP3128513B1 (en) * 2014-03-31 2019-05-15 Fraunhofer Gesellschaft zur Förderung der Angewand Encoder, decoder, encoding method, decoding method, and program
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
EP2963645A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Calculator and method for determining phase correction data for an audio signal
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9852744B2 (en) * 2014-12-16 2017-12-26 Psyx Research, Inc. System and method for dynamic recovery of audio data
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
KR101677137B1 (ko) * 2015-07-17 2016-11-17 국방과학연구소 변조 스펙트로그램을 이용한 수중 방사체의 데몬 및 lofar 특징을 동시 추출하는 방법 및 장치
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3182410A3 (en) * 2015-12-18 2017-11-01 Dolby International AB Enhanced block switching and bit allocation for improved transform audio coding
JP6790114B2 (ja) * 2016-03-18 2020-11-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング
TW202341126A (zh) * 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
EP3382702A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
GB2562253B (en) * 2017-05-09 2021-11-03 Imagination Tech Ltd Efficient detection of ranging code correlation function of a GNSS signal
US10896684B2 (en) * 2017-07-28 2021-01-19 Fujitsu Limited Audio encoding apparatus and audio encoding method
CN109729585B (zh) * 2017-10-27 2022-04-15 成都鼎桥通信技术有限公司 网络处理方法和装置
US11158297B2 (en) * 2020-01-13 2021-10-26 International Business Machines Corporation Timbre creation system
EP4211701A1 (en) * 2020-09-09 2023-07-19 Sparrow Acoustics Inc. Method and system for performing time-domain processing of a waveform signal
US20230110255A1 (en) * 2021-10-12 2023-04-13 Zoom Video Communications, Inc. Audio super resolution

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2512908A (en) 1947-10-16 1950-06-27 Mina M Arndt Telephone switchboard mounting plate with plug-in components
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
WO1997029549A1 (fr) 1996-02-08 1997-08-14 Matsushita Electric Industrial Co., Ltd. Codeur, decodeur, codeur-decodeur et support d'enregistrement de signal audio large bande
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) * 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
DE60230856D1 (de) * 2001-07-13 2009-03-05 Panasonic Corp Audiosignaldecodierungseinrichtung und audiosignalcodierungseinrichtung
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
AU2002352182A1 (en) 2001-11-29 2003-06-10 Coding Technologies Ab Methods for improving high frequency reconstruction
US20040002844A1 (en) 2002-06-27 2004-01-01 Jess Jochen A.G. System and method for statistical modeling and statistical timing analysis of integrated circuits
US8090577B2 (en) 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP3861770B2 (ja) 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
DE10328777A1 (de) 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
CN101800049B (zh) * 2003-09-16 2012-05-23 松下电器产业株式会社 编码装置和译码装置
DE10345996A1 (de) 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
JP4254479B2 (ja) * 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
DE102004046746B4 (de) * 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
EP1686564B1 (en) * 2005-01-31 2009-04-15 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited acoustic signals
JP4604864B2 (ja) 2005-06-14 2011-01-05 沖電気工業株式会社 帯域拡張装置及び不足帯域信号生成器
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US20080004866A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Artificial Bandwidth Expansion Method For A Multichannel Signal
PL2109098T3 (pl) * 2006-10-25 2021-03-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób do generowania próbek audio w dziedzinie czasu
JP2008158300A (ja) * 2006-12-25 2008-07-10 Sony Corp 信号処理装置、信号処理方法、再生装置、再生方法、電子機器
US7912729B2 (en) * 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
MX2010009932A (es) * 2008-03-10 2010-11-30 Fraunhofer Ges Forschung Metodo y dispositivo para manipular una señal de audio que tiene un evento transitorio.
US7977562B2 (en) * 2008-06-20 2011-07-12 Microsoft Corporation Synthesized singing voice waveform generator
AU2009267525B2 (en) * 2008-07-11 2012-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal synthesizer and audio signal encoder
US8880410B2 (en) * 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
WO2010036062A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP4231291B1 (en) * 2008-12-15 2023-11-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder, corresponding method and computer program
EP3246919B1 (en) * 2009-01-28 2020-08-26 Dolby International AB Improved harmonic transposition
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
PL2581905T3 (pl) * 2010-06-09 2016-06-30 Panasonic Ip Corp America Sposób rozszerzania pasma częstotliwości, urządzenie do rozszerzania pasma częstotliwości, program, układ scalony oraz urządzenie dekodujące audio
WO2012113035A1 (en) 2011-02-25 2012-08-30 Polyline Piping Systems Pty Ltd Mobile plastics extrusion plant
CN103928029B (zh) * 2013-01-11 2017-02-08 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same

Also Published As

Publication number Publication date
EP2945159A1 (en) 2015-11-18
US8401862B2 (en) 2013-03-19
EP4224474A1 (en) 2023-08-09
CA2908550C (en) 2018-02-13
PL2359366T3 (pl) 2017-04-28
US20230049083A1 (en) 2023-02-16
ES2613941T3 (es) 2017-05-29
KR20130133914A (ko) 2013-12-09
EP3364414B1 (en) 2022-04-13
EP4231291C0 (en) 2023-11-15
ES2674386T3 (es) 2018-06-29
CA2908847C (en) 2018-02-13
EP4231293C0 (en) 2023-11-15
EP4231290C0 (en) 2023-11-15
EP4053838A1 (en) 2022-09-07
PT3364414T (pt) 2022-07-04
US10229696B2 (en) 2019-03-12
BR122015019030B1 (pt) 2020-05-05
US20230041923A1 (en) 2023-02-09
AU2009328247B9 (en) 2013-12-05
US20150243293A1 (en) 2015-08-27
HK1259024A1 (zh) 2019-11-22
AU2009328247A1 (en) 2011-07-07
US11646043B2 (en) 2023-05-09
MX2011006163A (es) 2011-11-02
EP4231292B1 (en) 2023-11-15
CA2746837A1 (en) 2010-06-24
CA2908576C (en) 2018-11-27
US20210151063A1 (en) 2021-05-20
EP4231294A1 (en) 2023-08-23
PT2945159T (pt) 2018-06-26
WO2010069885A1 (en) 2010-06-24
EP4053838B1 (en) 2023-06-21
JP5970014B2 (ja) 2016-08-17
BRPI0917762B1 (pt) 2020-09-29
US20230072871A1 (en) 2023-03-09
CA2908847A1 (en) 2010-06-24
KR20110095354A (ko) 2011-08-24
PL4231290T3 (pl) 2024-04-02
EP4224474C0 (en) 2023-11-01
US11664039B2 (en) 2023-05-30
US9058802B2 (en) 2015-06-16
US11626124B2 (en) 2023-04-11
US20190156845A1 (en) 2019-05-23
US11631418B2 (en) 2023-04-18
BRPI0917762A2 (pt) 2016-07-26
CA2989886A1 (en) 2010-06-24
CA2746837C (en) 2016-09-20
KR101369267B1 (ko) 2014-03-04
EP4231294C0 (en) 2023-11-15
EP4231290B1 (en) 2023-11-15
PL4224475T3 (pl) 2024-03-18
PL4053838T3 (pl) 2023-11-13
EP2359366B1 (en) 2016-11-02
ES2921059T3 (es) 2022-08-17
CA2989886C (en) 2020-05-05
DK3364414T3 (da) 2022-06-27
US20230032124A1 (en) 2023-02-02
EP4231294B1 (en) 2023-11-15
US20230051135A1 (en) 2023-02-16
CA2908576A1 (en) 2010-06-24
EP2945159B1 (en) 2018-03-21
US20130185082A1 (en) 2013-07-18
US11594237B2 (en) 2023-02-28
JP2015187747A (ja) 2015-10-29
EP4231291A1 (en) 2023-08-23
CN102246231B (zh) 2013-07-10
EP4231290A1 (en) 2023-08-23
EP3364414A1 (en) 2018-08-22
JP2012512437A (ja) 2012-05-31
US20230053046A1 (en) 2023-02-16
US11670316B2 (en) 2023-06-06
TR201808500T4 (tr) 2018-07-23
US10937437B2 (en) 2021-03-02
EP4231295A1 (en) 2023-08-23
US11741978B2 (en) 2023-08-29
US11705146B2 (en) 2023-07-18
EP4231291B1 (en) 2023-11-15
EP4224474B1 (en) 2023-11-01
EP2359366A1 (en) 2011-08-24
EP4231293B1 (en) 2023-11-15
EP4224475C0 (en) 2023-10-11
JP6076407B2 (ja) 2017-02-08
PL2945159T3 (pl) 2018-08-31
EP4231292C0 (en) 2023-11-15
PL4231292T3 (pl) 2024-04-02
PT2359366T (pt) 2017-01-20
CN102246231A (zh) 2011-11-16
AU2009328247B2 (en) 2013-06-06
CA2908550A1 (en) 2010-06-24
EP4231295B1 (en) 2024-02-21
US20230377590A1 (en) 2023-11-23
PL3364414T3 (pl) 2022-08-16
EP4231293A1 (en) 2023-08-23
ES2951163T3 (es) 2023-10-18
JP2014142653A (ja) 2014-08-07
HK1217810A1 (zh) 2017-01-20
EP4053838C0 (en) 2023-06-21
US20230037621A1 (en) 2023-02-09
EP4224475B1 (en) 2023-10-11
PL4224474T3 (pl) 2024-04-02
KR101424944B1 (ko) 2014-08-01
EP4231295C0 (en) 2024-02-21
EP4224475A1 (en) 2023-08-09
US20110288873A1 (en) 2011-11-24
EP4231292A1 (en) 2023-08-23

Similar Documents

Publication Publication Date Title
BR122015019030A2 (pt) codificador de áudio e decodificador de extensão de largura de banda
AU2015203736C1 (en) Audio encoder and bandwidth extension decoder

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 05/05/2020, OBSERVADAS AS CONDICOES LEGAIS.