BR112015031605B1 - Decodificador de áudio tendo um módulo de extensão de largura de banda com um módulo de ajuste de energia - Google Patents

Decodificador de áudio tendo um módulo de extensão de largura de banda com um módulo de ajuste de energia Download PDF

Info

Publication number
BR112015031605B1
BR112015031605B1 BR112015031605-0A BR112015031605A BR112015031605B1 BR 112015031605 B1 BR112015031605 B1 BR 112015031605B1 BR 112015031605 A BR112015031605 A BR 112015031605A BR 112015031605 B1 BR112015031605 B1 BR 112015031605B1
Authority
BR
Brazil
Prior art keywords
audio
current
signal
gain factor
frame
Prior art date
Application number
BR112015031605-0A
Other languages
English (en)
Other versions
BR112015031605A2 (pt
Inventor
Jérémie Lecomte
Fabian Bauer
Ralph Sperschneider
Arthur Tritthart
Original Assignee
Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. filed Critical Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V.
Publication of BR112015031605A2 publication Critical patent/BR112015031605A2/pt
Publication of BR112015031605B1 publication Critical patent/BR112015031605B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

DECODIFICADOR DE ÁUDIO TENDO UM MÓDULO DE EXTENSÃO DE LARGURA DE BANDA COM UM MÓDULO DE AJUSTE DE ENERGIA. Um decodificador de áudio configurado para produzir um sinal de áudio de um fluxo de bits contendo quadros de áudio é proporcionado, o decodificador de áudio compreende: um módulo de decodificação de banda de núcleo configurado para derivar um sinal de áudio de banda de núcleo diretamente decodificado do fluxo de bits; um módulo de extensão de largura de banda configurado para derivar um sinal de áudio de extensão de largura de banda parametricamente decodificado do sinal de áudio de banda de núcleo e do fluxo de bits, em que o sinal de áudio de extensão de largura de banda é baseado em um sinal no domínio de frequência tendo pelo menos uma banda de frequências; e um combinador configurado para combinar o sinal de áudio de banda de núcleo e o sinal de áudio de extensão de largura de banda de modo a produzir o sinal de áudio; em que o módulo de extensão de largura de banda compreende um módulo de ajuste de energia sendo configurado de tal maneira que em um quadro de áudio corrente, em que uma (...).

Description

Descrição
[001] SBR (Spectral Band Replication), como outras técnicas de extensão de largura de banda, significa codificar e decodificar partes de banda alta espectral de sinais de áudio no topo de um estágio de codificador de núcleo. SBR é padronizado em [ISO09] e usado conjuntamente com AAC no MPEG-4 Profile HE-AAC, que é empregado em vários padrões de aplicação, por exemplo, 3GPP [3GP12a], DAB+ [EBU10] e DRM [EBU12].
[002] O estado da técnica de decodificação SBR em conjunto com AAC é descrito em [ISO09, seção 4.6.18].
[003] A figura 1 ilustra o estado da técnica do decodificador SBR, que compreende um banco de filtros de análise e um de síntese, decodificação de dados de SBR de um gerador de HF e de um ajustador de HF.
[004] No estado da técnica de decodificação SBR, a saída do codificador de núcleo é uma representação de filtro de passagem baixa do sinal original. É a entrada Xpcm para o banco de filtros de análise QMF do decodificador SBR.
[005] A saída desse banco de filtros xQMF_ana é entregue para o gerador de HF, onde o remendo ocorre. O remendo, basicamente, é uma replica do espectro de banda baixa nas bandas altas.
[006] O espectro remendado xHF_patched é dado agora para o ajustador de HF, junto com a informação espectral das bandas altas (envelopes),obtida da decodificação dos dados de SBR. A informação de envelope será decodificada por Huffman, então, decodificada diferencialmente e, finalmente, de- quantizada, a fim de obter os dados de envelope (veja a figura 2).Os dados de envelope obtidos são um conjunto de fatores de escala, que cobre uma certa quantidade de tempo, por exemplo, um quadro ou partes completes do mesmo. O ajustador de HF ajusta, adequadamente, as energias das bandas altas remendadas a fim de corresponder tão bem quanto possível com as energias de banda alta originais no lado do codificador para cada banco K. A Equação 1 e a figura 2 esclarecem isso: gsbr [k] = ERef [k] / EEstAvg [l] EAdj [k] = EEst [k] x gsbr [k] (1)
[007] onde
[008] ERef [k] denota a energia para uma banda k, sendo transmitida na forma codificada no fluxo de bits de SBR;
[009] EEst [k] denota a energia de uma banda alta k, remendada pelo gerador de HF;
[010] EEstAvg [l] denota a energia média de banda alta no interior de uma banda de fator de escala I sendo definido como uma faixa de bandas entre uma banda inicial e uma banda de parada :
Figure img0001
[011] EAdj [k] denota a energia de uma banda alta k, ajustada pelo ajustador de HF, usando gainsbr;
[012] gsbr [k] denota um fator de ganho, resultando da divisão mostrada na equação (1).
[013] O banco de filtros de Síntese QMF decodifica as amostras QMF processadas xHF_ adj para o áudio de PCM xpcm_out.
[014] Se o espectro reconstruído tiver uma ausência de ruído, o que estava presente nas bandas altas originais, mas não remendado pelo gerador de HF, existe a possibilidade de adicionar algum ruído adicional com um certo piso de ruído Q para cada banda k.
Figure img0002
[015] Além disso, o estado da técnica SBR permite mover as bordas de quadro dentro de certos limites e múltiplos envelopes por quadro.
[016] A decodificação de SBR em conjunto com CELP/HVXC é descrita em [EBU12, seção 5.6.2.2]. O decodificador SBR + CELP/HVXC está intimamente relacionado com o estado da técnica de decodificação SBR em HEAAC, descrita na seção 1.1.1. Basicamente, a figura1se aplica
[017] A decodificação de informação de envelope é adaptada às propriedades espectrais de sinais semelhantes à fala, como descrito em [EBU12, seção 5.6.2.2.4].
[018] Na decodificação regular de AMR-WB, a excitação de banda alta é obtida pela geração de ruído branco uHB1(n). A energia da excitação de banda alta é ajustada igual à energia da excitação de banda mais baixa u2(n), o que significa que:
Figure img0003
[019] Finalmente, a excitação de banda alta é encontrada por
Figure img0004
[020] onde HB é um fator de ganho.
[021] No modo 23,85 kbits/s, HB é decodificado do índice de ganho recebido (informação de lado).
[022] Nos modos 6,60, 8,85, 12,65, 14,25, 15,85, 18,25, 19,85 e 23,05 kbit/s, HB é estimado usando informação de voz delimitada por [0,1, 1,0]. Primeiro, a inclinação de síntese etilt é encontrada:
Figure img0005
[023] onde hp é a síntese de fala de banda mais baixa filtrada por passagem alta hp12,8(n) com frequência de corte de 400 Hz. HB é, então, encontrado por:
Figure img0006
[024] onde gSP = 1-etilt é o ganho para o sinal de fala, gBG = 1,25 gSP é o ganho para o sinal de ruído de fundo e wSP é uma função de ponderação definida em 1, quando a detecção de atividade de voz (VAD) está ON (LIGADA) e 0, quando VAD está OFF (DESLIGADA). GHB é delimitado entre [0,1, 1,0]. Em caso de segmentos de voz, onde menos energia está presente em altas frequências, etilt se aproxima de 1, resultando em um ganho menor gHB. Isso reduz a energia do ruído gerado em caso de segmentos de voz.
[025] Então, o filtro de sínteses de LP de banda alta AHB(z) é derivado do filtro de síntese de LP de banda baixa ponderado.
Figure img0007
[026] Onde Â(z) é o filtro de síntese de LP interpolado. Â(z) foi computado analisando o sinal com a taxa de amostragem de 12,8 kHz, mas é usado agora para um sinal de 16 kHz. Isso significa que a banda 5,1 - 5,6 kHz no domínio de 12,8 kHz será mapeada para 6,4 - 7,0 kHz no domínio de 16 jHz.
[027] UHB (n) é, então, filtrado através de AHB (z). A saída dessa síntese de banda alta SHB (n) é filtrada através de um filtro de FIR de passagem de banda HHB (z), que tem a banda de passagem de 6 a 7 kHz. Finalmente, SHB é adicionado à fala sintetizada para produzir o sinal de fala de saída sintetizada.
[028] Em AMR-WB+, o sinal de HF é composto dos componentes de frequência acima (fs/4) do sinal de entrada. Para representar o sinal e HF em uma taxa baixa, uma abordagem de extensão de largura de banda (BWE) é empregada. Em BWE, a informação de energia é enviada para o decodificador na forma de envelope espectral e energia de quadro, mas a estrutura fina do sinal é extrapolada no decodificador do sinal de excitação recebido (decodificado) no sinal de LF.
[029] O espectro do sinal amostrado descendente SHf pode ser visto como uma versão dobrada da banda de alta frequência antes da amostragem descendente. Uma análise de LP é realizada em SHF (n) para obter um conjunto de coeficientes, que modelam o envelope espectral desse sinal. Tipicamente, menos parâmetros são necessários do que no sinal de LF. Aqui, um filtro de ordem 8 é usado. Os coeficientes de LP são, então, transformados em representação de ISP e quantizados para transmissão.
[030] A síntese do sinal de HF implementa uma espécie de mecanismo d extensão de largura de banda (BWE) e usa alguns dados do decodificador de LF. É um evolução do mecanismo de BWE usado no decodificador de fala de AMR-WB (veja acima). O decodificador de HF é detalhado na figura 3.
[031] O sinal de HF é sintetizado em duas etapas: 1. Cálculo da excitação de HF; 2. Computação do sinal de HF da excitação de HF.
[032] A excitação de HF é obtida pela moldagem do sinal de excitação de LF em domínio de tempo com fatores (ou ganhos) escalares em uma base de subquadro de 64 amostras. Essa excitação de HF é pós-processada para reduzir o “zumbido” da saída e, então, filtrada por um filtro de síntese preditivo linear de HF 1/AHF (Z).O resultado é ainda pós-processado para suavizar as variações de energia. Para informação adicional, por favor, refira-se a [3GP09 [.
[033] A ocultação de perda de pacote em SBR em conjunto com AAC é especificada em 3GPP TS 26.402 [3GP12a, seção 5.2] e foi reutilizada em DRM [EBU12, seção 5.6.3.1] e DAB [EBU10, seção A2].
[034] Em caso de uma perda de quadro, o número de envelopes por quadro é definido em um e os últimos dados válidos de envelope recebidos são reutilizados e diminuídos em energia por uma relação constante para cada quadro oculto.
[035] Os dados de envelope resultantes são, então, alimentados no processo normal de decodificação, onde o ajustador de HF os usa para calcular os ganhos, que são usados para ajustar as bandas altas remendadas do gerador de HF. O resto de decodificação de SBR ocorre como usual.
[036] Além disso, os valores delta de piso de ruído codificados estão sendo definidos em zero, que leva o piso de ruído delta decodificado a permanecer estático. No final do processo de decodificação, isso significa que a energia do piso de ruído segue a energia do sinal de HF.
[037] Além disso, os flags para adição de senos são apagados.
[038] A ocultação de SBR do estado da técnica também cuida da recuperação. Ela atende a uma transição suave do sinal oculto para o sinal decodificado corretamente em termos de gaps de energia que podem resultar de bordas de quadro incompatíveis.
[039] A ocultação de SBR do estado da técnica em conjunto com CELP/HVXC é descrita em [EBU12, seção 5.6.3.2] e esboçada brevemente no seguinte:
[040] Quando um quadro corrompido é detectado, um conjunto predeterminado de valores de dados é aplicado ao decodificador de SBR. Isso produz um envelope espectral estático de banda alta em um baixo nível de reprodução relativo, exibindo um roll-off em direção às frequências mais altas”. [EBU12, seção 5.6.3.2]. aqui, a ocultação de SBR insere uma espécie de ruído confortável, que não tem desvanecimento dedicado no domínio de SBR. Isso impede as orelhas do ouvinte de rajadas de áudio potencialmente altas e mantém a impressão de uma largura de banda constante.
[041] A ocultação do estado da técnica do BWE de G.718 é descrita em [ITU08, 7.11.1.7.] e esboçada brevemente como segue?
[042] No modo e baixo retardo, que está disponível, exclusivamente, para a camada 1 e 2, a ocultação da banda de alta frequência 6000- 7000 Hz é realizada exatamente da mesma maneira que quando não ocorre erro algum. A operação do decodificador de canal limpo para camadas 1, 2 e 3 é como segue: uma extensão de largura de banda é aplicada. O espectro na faixa de 6400 - 7000 Hz é preenchido com um sinal de ruído branco, escalado adequadamente no domínio de excitação (a energia da banda alta deve corresponder à energia de banda baixa. É, então, sintetizado com um filtro derivado pela ponderação do mesmo filtro de síntese de LP como usado no domínio de 12,8 kHz. Para camadas 4 e nenhum extensão de largura de banda é realizada, uma vez que aquelas camadas cobrem toda a banda até 8 kHz.
[043] Na operação padrão de um processamento de baixa complexidade é realizado para reconstruir a banda de alta frequência do sina sintetizado em frequência de amostragem de 16 kHz. Primeiro, a excitação de banda de alta frequência escalada, u”HB (n) é atenuada linearmente por todo o quadro como:
Figure img0008
[044] onde o comprimento de quadro é 320 amostras e egatt (n) é um fator e atenuação, que é dado por:
Figure img0009
[045] Na equação acima, é o ganho médio de passo. É o mesmo ganho que o usado durante ocultação do livro de códigos adaptativo. Então, a memória do filtro de passagem de banda na faixa de frequências 6000 - 7000 Hz é atenuada usando gatt (n), como derivado na equação 10, para impedir quaisquer descontinuidades. Finalmente, o sinal de excitação de alta frequência, u”’ (n), é filtrado através do filtro de síntese. O sinal sintetizado é, então, adicionado à síntese oculta em uma frequência de amostragem e 16 kHz.
[046] A ocultação do estado da técnica de extensão de largura de banda cega em AMR-WB é esboçada em [3GP12b, 6.2.4] e aqui resumida brevemente:
[047] Quando um quadro é perdido ou parcialmente perdido, o parâmetro de ganho de banda alta não é recebido e uma estimativa para o para o ganho de banda alta é usada. Isso significa que, no caso de quadros de fala ruins /perdidos, a reconstrução de banda alta opera do mesmo modo que para todos os diferentes modos.
[048] Em caso de um quadro ser perdido, o filtro de síntese de LP de banda alta é derivado como usual dos coeficientes de LPC da banda de núcleo. A única exceção é que os coeficientes de LPC não foram decodificados do fluxo de bits, mas foram extrapolados usando a abordagem de ocultação regular de AMR-WB.
[049] A ocultação do estado da técnica da extensão de largura de banda em AMR-WB+ é esboçada em [3GP09, 6.2] a brevemente aqui resumida.
[050] No caso de um perda de pacote, os dados de controle que são internos ao decodificador de HF são gerados do vetor indicador de quadro ruim BFI = (bfi0, bfil, bfi2, bfi3). Esses dados são
Figure img0010
, BFIGAIN e o número de subquadros para interpolação de ISF. A natureza desses dados é definida em mais detalhes abaixo:
[051]
Figure img0011
é um flag binário indicando a perda dos parâmetros de ISF. Como os parãmetros de ISF para o sinal de HF são sempre transmitidos no primeiro pacote (contendo o primeiro subquadro) , sendo HF20, 40 ou 80, o flag perdido é sempre definido para o indicador de bfi do primeiro subquadro (bfi0).O mesmo se mantém verdadeiro para a indicação de ganhos de HF perdidos. Se o primeiro pacote/ subquadro do modo corrente for perdido (HF20, 40 ou 80) o ganho é perdido e precisa ser oculto.
[052] A ocultação dos vetores de HF de ISF é muito semelhante à ocultação de ISF para ISFs de núcleo. A ideia principal é reutilizar o ultimo vetor de IFbom, mas desviá-lo em direção ao vetor médio de ISF (onde o vetor médio de ISF formado offline).
Figure img0012
[053] Os ganhos de BWE ( 0, . . . , nb-1) são estimados de acordo com o código fonte a seguir (no código: 9\ - gain_q [i]; 2,807458 é uma constante de decodificador).
[054] /* usar os ganhos passados ligeiramente desviados em direção ao meio */
[055] *past_q = (0,9f*(*past_q + 20,0f)) - 20,0f;
[056] for (i=0; i<4; i++) {
[057] gain_q [i] = *past_q + 2,807458f;
[058] }
[059] tmp = 0,0;
[060] for (i=0; i<4; i++) {
[061] tmp += gain_q [i];
[062] }
[063] *past_q = 0,25f*tmp - 2,807458f;
[064] A fim de derivarmos “ganhos para corresponder à magnitude em fs/4* o mesmo algoritmo que na decodificação do canal limpo é realizada, mas com a exceção que os ISFs para a HF e/ou a parte de LF já pode ser oculta. Todas as etapas a seguir como interpolação linear de dB, soma e aplicação de ganhos são as mesmas que no caso do canal limpo.
[065] Para derivar a excitação, o mesmo procedimento é aplicado que em um quadro recebido corretamente, onde a excitação de banda mais baixa é usada depois: • foi randomizado • foi amplificado no domínio de tempo com ganhos de subquadros • foi moldado no domínio de frequência com um filtro de LP • a energia foi suavizada ao longo do tempo
[066] Então, a síntese é realizada de acordo com a figura 3.
[067] O papel de convenção de AES 6789: Schneide, Krauss e Ehret [SKE06] descrevem uma técnica de ocultação que reutiliza os últimos dados válidos de envelope de SBR. Se mais de um quadro de SBR for perdido, um desvanecimento é aplicado. “O princípio básico é simplesmente bloquear os últimos valores válidos de envelope de SBR conhecidos até que o processamento de SBR possa ser continuado com dados recentemente transmitidos. Além disso, um desvanecimento é realizado, se mais de um quadro de SBR não for decodificável.
[068] Papel de convenção de AES 6962: Sang-Uk Ryu e Kenneth Rose [RR06] descrevem uma técnica de ocultação que estima a informação paramétrica, utilizando dados de SBR do quadro anterior e do seguinte. Envelopes de banda alta são estimados adaptativamente da evolução de energia nos quadros circundantes.
[069] Os conceitos de ocultação de perda de pacote podem produzir um sinal de áudio perceptualmente degradado durante a perda de pacote
[070] É um objetivo da presente invenção proporcionar um decodificador de áudio e um método tendo um conceito aperfeiçoado de ocultação de perda de pacote.
[071] Esse objetivo pode ser alcançado por um decodificador de áudio configurado para produzir um sinal de áudio de um fluxo de bits contendo quadros de áudio, o decodificador de áudio compreendendo:
[072] um módulo de decodificação de banda de núcleo configurado para derivar um sinal de áudio de banda de núcleo decodificado diretamente do fluxo de bits;
[073] um módulo de extensão de largura de banda configurado para derivar um sinal de áudio de extensão de largura de banda do sinal de áudio de banda de núcleo e do fluxo de bits, em que o sinal de áudio de extensão de largura de banda é baseado em um sinal de domínio de frequência tendo pelo menos uma banda de frequências; e
[074] um combinador configurado para combinar o sinal de áudio de banda de núcleo e o sinal de áudio de extensão de largura de banda de modo a produzir o sinal de áudio;
[075] em que o módulo de extensão de largura de banda compreende um módulo de ajuste de energia sendo configurado de tal maneira que em um quadro de áudio corrente, em que uma perda de quadro de áudio ocorre, uma energia de sinal ajustada para o quadro de áudio corrente para a pelo menos uma banda de frequências é estabelecida
[076] com base em um fator de ganho corrente para o quadro de áudio corrente, em que o fator de ganho corrente é derivado de um fator de ganho de um quadro de áudio anterior ou do fluxo de bits; e
[077] e com base em uma energia de sinal estimada para a pelo menos uma banda de frequências, em que a energia de sinal estimada é derivada de um espectro do quadro de áudio corrente do sinal de áudio de banda de núcleo.
[078] O decodificador de áudio de acordo com a invenção liga o módulo de extensão de largura de banda ao módulo de decodificação de banda de núcleo em termos de energia ou, em outras palavras, assegura que o módulo de extensão de largura de banda segue o moo de energia do módulo de decodificação de banda de núcleo durante ocultação, não importa o que faz o módulo de decodificação de banda de núcleo.
[079] A inovação com essa abordagem é que - em caso de ocultação - a geração de banda alta não está estritamente adaptada às energias do envelope. Com a técnica de bloqueio de ganho, as energias da banda alta são adaptadas às energias de banda baixa durante a ocultação e, portanto, não mais contando apenas com os dados transmitidos no ultimo quadro bom. Esse processo retoma a ideia de usar informação de banda baixa para reconstrução de banda alta.
[080] Com essa abordagem, nenhum dado adicional (por exemplo, fator de desvanecimento) precisa ser transferido do codificador de núcleo para o codificador de extensão de largura de banda. Isso torna a técnica facilmente aplicável a qualquer codificador com extensão de largura de banda, especialmente ao SBR, onde o cálculo de ganho já é realizado inerentemente (equação 1).
[081] A ocultação do decodificador de áudio da invenção leva em consideração a inclinação do desvanecimento do módulo de decodificação de banda de núcleo. Isso leva ao comportamento pretendido do desvanecimento como um todo.
[082] Situações em que as energias das bandas de frequências do módulo de decodificação de banda de núcleo se desvanecem mais lentamente do que as energias das bandas de frequências do módulo de extensão de largura de banda, que se tornam percebíveis e causam a impressão desagradável de um sinal de banda limitado, são evitadas.
[083] Além disso, situações em que as energias nas bandas de frequências do módulo de decodificação de banda de núcleo se desvanecem mais rapidamente do que as energias das bandas de frequências do módulo de extensão de largura de banda, o que introduziria artefatos porque as bandas de frequências do módulo de extensão de largura de banda são amplificadas demais, em comparação com as bandas de frequências do módulo de decodificação de banda de núcleo, são evitadas, igualmente.
[084] Em contraste com um decodificador de não desvanecimento tendo uma extensão de largura de banda com níveis de energia predefinidos (como, por exemplo, um decodificador CELP/HVXC+SBR), que preserva apenas a inclinação espectral de um certo tipo de sinal, o decodificador de áudio da invenção funciona de modo independente das características espectrais dos sinais, de modo que uma degradação perceptualmente decodificada do sinal de áudio é evitada.
[085] A técnica proposta poderia ser usada com qualquer método de extensão de largura de banda (BWE) no topo de um módulo de decodificação de banda de núcleo (codificador de núcleo no seguinte). A maior parte da técnica de extensão de largura de banda é baseada no ganho por banda entre os níveis originais de energia e os níveis de energia obtidos após copiar o espectro de núcleo. A técnica proposta não funciona nas energias do quadro de áudio anterior, como faz o estado da técnica, mas nos ganhos do quadro de áudio anterior.
[086] Quando um quadro de áudio está perdido ou ilegível (ou, em outras palavras, se uma perda de quadro de áudio ocorrer) , os ganhos do ultimo quadro bom são alimentados no processo normal de decodificação do módulo de decodificação de banda de núcleo, que ajusta as energias das bandas de frequências do módulo de extensão de largura de banda (veja equação 1). Isso forma a ocultação. Qualquer desvanecimento, sendo aplicado no módulo de decodificação de banda de núcleo por uma ocultação de módulo de decodificação de banda de núcleo, será aplicado, automaticamente, às energias das bandas de frequências do módulo de extensão de largura de banda pelo bloqueio da relação de energia entre a banda baixa e a banda alta.
[087] O sinal no domínio de frequência tendo pelo menos uma banda de frequências pode ser, por exemplo, um sinal de excitação de predição linear, excitado por código algébrico (sinal de excitação ACELP).
[088] Em algumas modalidades, o módulo de extensão de largura de banda compreende módulo de fornecimento de fator de ganho configurado para encaminhar o fator de ganho corrente pelo menos no quadro de áudio corrente em que a perda de quadro de áudio ocorre para o módulo de ajuste de energia.
[089] Em uma modalidade preferida, o módulo de fornecimento de fator de ganho é configurado de tal maneira que, no quadro de áudio corrente, em que a perda de quadro de áudio ocorre, o fator de ganho corrente é o fator de ganho do quadro de áudio anterior. Essa modalidade desativa, completamente o desvanecimento contido no módulo de decodificação de extensão de largura de banda apenas bloqueando os ganhos derivados para o ultimo envelope no último quadro bom:
Figure img0013
[090] em que EAdj [k] denota a energia de uma banda de frequências k do módulo de extensão de largura de banda, ajustada para expressar a distribuição de energia original tão bem quanto possível; ;
Figure img0014
denota o fator de ganho do quadro corrente;
Figure img0015
e denota o fator de ganho do quadro anterior.
[091] Em outra modalidade preferida, o módulo de fornecimento de fator de ganho é configurado de tal maneira que, no quadro de áudio corrente, em que a perda de quadro ocorre, o fator de ganho corrente é calculado do fator de ganho do quadro de áudio anterior e de uma classe de sinal do quadro de áudio anterior.
[092] Essa modalidade usa um classificador de sinais para computar os ganhos com base nos ganhos passados e também adaptativamente na classe de sinais do quadro previamente recebido:
Figure img0016
[093] em que
Figure img0017
denota uma função, dependendo do fator de [M—1] [w—1] ganho
Figure img0018
do quadro de áudio anterior e da classe de sinais
Figure img0019
do quadro de áudio anterior. As classes de sinais podem se referir à classes de sons de fala, tais como: obstruinte (com subclasses: parada, africativa, fricativa), sonora (estas subclasses: nasais, aba aproximante, vogais), laterais, trinado.
[094] Em uma modalidade preferida, o módulo de fornecimento de fator de ganho é configurado para calcular um número de quadros de áudio subsequentes em que as perdas dos quadros de áudio ocorrem e configurado para executar um procedimento de redução de fator de ganho em caso de o número de quadros de áudio subsequentes em que as perdas de quadros de áudio ocorrem exceder um número predefinido.
[095] Se uma fricativa ocorre imediatamente antes de uma perda de quadro de estouro (múltiplas perdas de quadros em quadros de áudio subsequentes), o desvanecimento padrão inerente do módulo de decodificação de banda de núcleo pode ser lento demais para assegurar um som agradável e natural em combinação com o bloqueio de ganho. O resultado percebido dessa questão pode ser uma fricativa prolongada com energia demais nas bandas de frequências de módulo de extensão de largura de banda. Por essa razão, uma verificação para múltiplas perdas de quadros pode ser realizada. Se essa verificação for positiva, um procedimento de redução de fator de ganho pode ser executado.
[096] Em uma modalidade preferida, o procedimento de redução de fator de ganho compreende a etapa de redução do fator de ganho corrente pela divisão do fator de ganho corrente por um algarismo, no caso de o fator de ganho corrente exceder um primeiro limite. Por essas características , ganhos que excedem o primeiro limite (que podem ser determinados empiricamente) são reduzidos.
[097] Em uma modalidade preferida, o procedimento de redução de fator de ganho compreende a etapa de redução do fator de ganho corrente pela divisão do fator de ganho corrente por um segundo algarismo, que é maior do que o primeiro algarismo, em caso de o fator de ganho corrente exceder um segundo limite, que é maior do que o primeiro limite. Essas características asseguram que ganhos extremamente altos diminuem mais rapidamente. Todos os ganhos que excedem o segundo limite serão diminuídos mais depressa.
[098] Em algumas modalidades, o procedimento de redução de fator de ganho compreende a etapa de ajuste do fator de ganho corrente ao primeiro limite, no caso de o limite corrente, após a redução, estar abaixo do primeiro limite. Por essas características, os ganhos diminuídos são impedidos de caírem abaixo do primeiro limite.
[099] Um exemplo pode ser visto dentro do pseudo código 1: /* limitar ganho em caso de múltiplas perdas de quadros*/ #DEFINE BWE_GAINDEC 10 if (previousFrameErrorFlag && (gain [k] > BWE_GAINDEC) ) { /* ganhos excedendo o primeiro limite 50 vezes serão diminuídos mais depressa */ if (gain [k] > 50* BWE_GAINDEC ) { gain [k] /= 6; } else { gain [k] /= 4; } /* impedir ganhos de caírem abaixo de BWE_GAINDEC */ if (gain [k] < BWE_GAINDEC) { gain [k] = BWE_GAINDEC; } }
[100] em que FrameErrorFlag anterior é um flag que indica se uma perda múltiplas de quadros está presente, BWE_GAINDEC denota o Segundo limite e gain [k] denota o fator de ganho corrente para a banda de frequências k.
[101] Em algumas modalidades, o módulo de extensão de largura de banda compreende um módulo gerador de ruídos configurado para adicionar ruído à pelo menos uma banda de frequências, em que, no quadro de áudio corrente em que a perda de quadro de áudio ocorre, uma proporção da energia de sinal para a energia de ruído da pelo menos uma banda de frequências do quadro de áudio anterior é usada para calcular a energia de ruído do quadro de áudio corrente.
[102] No caso em que há uma característica de piso de ruído, (isto é, componentes de ruído adicionais mantêm o ruído do sinal original) implementada na extensão de largura de banda, é necessário adotar a ideia de bloqueio de ganho também para o piso de ruído. Para obter isso, os níveis de energia de piso de ruído de quadros não ocultos são convertidos em uma relação de ruído, tomando em conta a energia das bandas de frequências do módulo de extensão de largura de banda. A relação é salva em um armazenamento temporário e será a base do nível de ruído no caso de ocultação. A vantagem principal é o melhor acoplamento do piso de ruído à energia do codificador de núcleo devido a um cálculo da proporção prev_noise [k].
[103] O pseudo código 2 mostra isso: for (k=bands) { if !(frameErrorFlag) { prev_noise [k] = nrgHighband [k] / noiseLevel [k]; } else { noiseLevel [k] = nrgHighband [k] / prev_noise [k]; } }
[104] em que frameErrorFlag é um flag indicando se uma perda de quadro está presente e prev_noise [k] é a proporção entre a energia nrgHighband [k] da banda de frequências k e o nível de ruído noiseLevel [k] da banda de frequências k.
[105] Em uma modalidade preferida, o decodificador de áudio compreende um módulo de análise de espectro configurado para estabelecer o espectro do quadro de áudio corrente do sinal de áudio de banda de núcleo e derivar a energia de sinal estimada para o quadro corrente para a pelo menos uma banda de frequências do espectro do quadro de áudio corrente do sinal de áudio de banda de núcleo.
[106] Em algumas modalidades, o módulo de fornecimento de fator de ganho é configurado de tal maneira que , no caso em que um quadro de áudio corrente em que uma perda de quadro de áudio não ocorre, subsequentemente, segue-se um quadro de áudio anterior, em que uma perda de quadro de áudio ocorre, o fator de ganho recebido para o quadro de áudio corrente é usado para o quadro corrente, se um retardo entre os quadros de áudio do módulo de extensão de largura de banda com relação aos quadros de áudio do módulo de decodificação de banda de núcleo for menor do que um limite de retardo, enquanto o fator de ganho do quadro de áudio anterior é usado para o quadro corrente, se o retardo entre quadros de áudio do módulo de extensão de largura de banda com relação aos quadros de áudio do módulo de decodificação de banda de núcleo for maior do que o limite de retardo.
[107] No topo da ocultação, no módulo de extensão de largura de banda, , atenção especial precisa ser dada ao enquadramento. Quadros de áudio do módulo de extensão de largura de banda e quadros de áudio do módulo de decodificação de banda de núcleo, com frequência, não são alinhados exatamente, mas poderiam ter um certo retardo. Assim, pode acontecer que um pacote perdido contenha dados de extensão de largura de banda sendo retardados, em relação ao sinal de núcleo contido no mesmo pacote.
[108] O resultado nesse caso é que o primeiro pacote bom após uma perda pode conter dados de extensão para criar partes das bandas de frequências do módulo de extensão de largura de banda do quadro de áudio do módulo de decodificação de banda de núcleo, que já estava oculto no decodificador.
[109] Por essa razão, o enquadramento precisa ser considerado durante a recuperação, dependendo das respectivas propriedades do módulo de decodificação de núcleo e do módulo de extensão de largura de banda. Isso poderia significar tratar o primeiro quadro de áudio ou partes dele no módulo de extensão de largura de banda como erro e não aplicar os ganhos mais novos de uma vez, mas manter os ganhos bloqueados do primeiro quadro de áudio para um quadro adicional.
[110] Manter ou não os ganhos bloqueados para o primeiro quadro bom depende do retardo. A aplicação experimental aos codecs com retardos diferentes mostrou beneficio diferente para codecs com retardos diferentes. Para codecs com retardos bastante pequenos (por exemplo, 1ms) é melhor usar os ganhos mais novos para o primeiro quadro de áudio bom..
[111] Em uma modalidade preferida, o módulo de extensão de largura de banda compreende um módulo gerador de sinais, configurado para criar um sinal no domínio de frequência bruta, tendo pelo menos uma banda de frequências, que é encaminhado para o módulo de ajuste de energia com base no sinal de áudio de banda de núcleo e no fluxo de bits.
[112] Em uma modalidade preferida, o módulo de extensão de largura de banda compreende um módulo de síntese de sinal configurado para produzir o sinal de áudio de extensão de largura de banda do sinal no domínio de frequência.
[113] O objetivo da invenção pode ser alcançado por um método para produzir um sinal de áudio a partir de fluxo de bits contendo quadros de áudio. O método compreende as etapas de:
[114] derivação de um sinal de áudio de banda de núcleo, decodificado diretamente, do fluxo de bits;
[115] derivação de um sinal de áudio de extensão de largura de banda parametricamente decodificado do sinal de áudio de banda de núcleo e do fluxo de bits, em que o sinal de áudio de extensão de largura de banda é baseado em um sinal no domínio de frequência tendo pelo menos uma banda de frequências; e
[116] combinação do sinal de áudio de banda de núcleo e do sinal de áudio de extensão de largura de banda de modo a produzir o sinal de áudio;
[117] em que, em um quadro de áudio corrente, em que uma perda de quadro de áudio ocorre, um energia de sinal ajustada para o quadro de áudio corrente para a pelo menos uma banda de frequências é definida.
[118] com base em um fator de ganho corrente para o quadro de áudio corrente, em que o fator de ganho corrente é derivado de um fator de ganho de um quadro de áudio anterior ou do fluxo de bits; e
[119] com base em uma energia de sinal estimada para a pelo menos uma banda de frequências, em que a energia de sinal estimada é derivada de um espectro do quadro de áudio corrente do sinal de áudio de banda de núcleo.
[120] O objetivo da invenção pode ainda ser alcançado por um programa de computador para realização, quando executando em um computador ou um processador, do método descrito acima.
[121] Modalidades preferidas da invenção são discutidas subsequentemente com relação aos desenhos anexos, em que:
[122] A figura 4 ilustra uma modalidade de um decodificador de áudio de acordo com a invenção em uma vista esquemática; e
[123] A figura 5 ilustra uma modalidade de um decodificador de áudio de acordo com a invenção.
[124] A figura 4 ilustra uma modalidade de um decodificador de áudio de acordo com a invenção em uma vista esquemática. O decodificador de áudio 1 é configurado para produzir um sinal de áudio AS de um fluxo de bits BS contendo quadros de áudio AF. O decodificador de áudio 1 compreende:
[125] um módulo de decodificação de banda de núcleo configurado para derivar um sinal de áudio de banda de núcleo decodificado diretamente CBS do fluxo de bits BS;
[126] um módulo de extensão de largura de banda 2 configurados para derivar um sinal de áudio de extensão de largura de banda decodificado parametricamente BES do sinal de áudio de banda de núcleo CBS e do fluxo de bits BS, em que o sinal de áudio de extensão de largura de banda BES é baseado em um sinal no domínio de frequência FDS, tendo pelo menos uma banda de frequências FB; e
[127] um combinador 4 configurado para combinar o sinal de áudio de banda de núcleo CBS e o sinal de áudio de extensão de largura de banda BES de modo a produzir o sinal de áudio AS;
[128] em que o módulo de extensão de largura de banda 3 compreende um módulo de ajuste de energia 5 sendo configurado de tal maneira que, em um quadro de áudio corrente AF2, em que uma perda de quadro de audio AFL ocorre, uma energia de sinal ajustada para o quadro de áudio corrente AF2 para a pelo menos uma banda de frequências FB é definida,
[129] com base em um fator de ganho corrente CGF para o quadro de áudio corrente AF2, em que o fator de ganho corrente CGF é derivado de um fator de ganho de um quadro de áudio anterior AF1 ou de um fluxo de bits BS; e
[130] com base em uma energia de sinal estimada EE para a pelo menos uma banda de frequências FB, em que a energia de sinal estimada EE é derivada de um espectro do quadro de áudio corrente AF2 do sinal de áudio de banda de núcleo CBS.
[131] O decodificador de áudio 1 de acordo com a invenção liga o módulo de extensão de largura de banda 3 ao módulo de decodificação de banda de núcleo em termos de energia ou, em outras palavras, assegura que o módulo de extensão de largura de banda 3 segue o modo de energia do módulo de decodificação de banda de núcleo 2 durante a ocultação, não importa o que faz o módulo de decodificação de banda de núcleo 2.
[132] A inovação com essa abordagem é que - em caso de ocultação - a geração de banda alta não está estritamente adaptada às energias de envelope. Com a técnica de bloqueio de ganho, as energias da banda alta são adaptadas às energias de banda baixa durante a ocultação e, portanto, não mais contando apenas com os dados transmitidos no ultimo quadro bom AF1. Esse processo retoma a ideia de usar informação de banda baixa para reconstrução de banda alta.
[133] Com essa abordagem, nenhum dado adicional (por exemplo, fator de desvanecimento) precisa ser transferido do codificador de núcleo 2 para o codificador de extensão de largura de banda 3. Isso torna a técnica facilmente aplicável a qualquer codificador 1 com extensão de largura de banda 3, especialmente ao SBR, onde o cálculo de ganho já é realizado inerentemente (equação 1).
[134] A ocultação do decodificador de áudio 1 da invenção leva em consideração a inclinação do desvanecimento do módulo de decodificação de banda de núcleo 2. Isso leva ao comportamento pretendido do desvanecimento como um todo.
[135] Situações em que as energias das bandas de frequências FB do módulo de decodificação de banda de núcleo 2 se desvanecem mais lentamente do que as energias das bandas de frequências FB do módulo de extensão de largura de banda 3, que se tornam percebíveis e causam a impressão desagradável de um sinal de banda limitado, são evitadas.
[136] Além disso, situações em que as energias nas bandas de frequências FB do módulo de decodificação de banda de núcleo 2 se desvanecem mais rapidamente do que as energias das bandas de frequências FB do módulo de extensão de largura de banda 3, o que introduziria artefatos porque as bandas de frequências FB do módulo de extensão de largura de banda 3 são amplificadas demais, em comparação com as bandas de frequências FB do módulo de decodificação de banda de núcleo 2, são evitadas, igualmente.
[137] Em contraste com um decodificador de não desvanecimento tendo uma extensão de largura de banda com níveis de energia predefinidos (como, por exemplo, um decodificador CELP/HVXC+SBR), que preserva apenas a inclinação espectral de um certo tipo de sinal, o decodificador de áudio da invenção funciona de modo independente das características espectrais dos sinais, de modo que uma degradação perceptualmente decodificada do sinal de áudio AS é evitada.
[138] A técnica proposta poderia ser usada com qualquer método de extensão de largura de banda (BWE) no topo de um módulo de decodificação de banda de núcleo 2 (codificador de núcleo no seguinte). A maior parte da técnica de extensão de largura de banda é baseada no ganho por banda entre os níveis originais de energia e os níveis de energia obtidos após copiar o espectro de núcleo. A técnica proposta não funciona nas energias do quadro de áudio anterior, como faz o estado da técnica, mas nos ganhos do quadro de áudio anterior AF1.
[139] Quando um quadro de áudio AF2 está perdido ou ilegível (ou, em outras palavras, se uma perda de quadro de áudio AFL ocorrer) , os ganhos do ultimo quadro bom são alimentados no processo normal de decodificação do módulo de decodificação de banda de núcleo 2, que ajusta as energias das bandas de frequências FB do módulo de extensão de largura de banda 3 (veja equação 1). Isso forma a ocultação. Qualquer desvanecimento, sendo aplicado no módulo de decodificação de banda de núcleo 2 por uma ocultação de módulo de decodificação de banda de núcleo, será aplicado, automaticamente, às energias das bandas de frequências FB do módulo de extensão de largura de banda 3 pelo bloqueio da relação de energia entre a banda baixa e a banda alta.
[140] Em algumas modalidades, o módulo de extensão de largura de banda 3 compreende módulo de fornecimento de fator de ganho 6 configurado para encaminhar o fator de ganho corrente CGF pelo menos no quadro de áudio corrente AF2 em que a perda de quadro de áudio AFL ocorre para o módulo de ajuste de energia 5.
[141] Em uma modalidade preferida, o módulo de fornecimento de fator de ganho 6 é configurado de tal maneira que, no quadro de áudio corrente AF2, em que a perda de quadro de áudio AFL ocorre, o fator de ganho corrente CGF é o fator de ganho do quadro de áudio anterior AF1.
[142] Essa modalidade desativa, completamente o desvanecimento contido no módulo de decodificação de extensão de largura de banda 3 apenas bloqueando os ganhos derivados para o ultimo envelope no último quadro bom.
[143] Em outra modalidade preferida, o módulo de fornecimento de fator de ganho 6 é configurado de tal maneira que, no quadro de áudio corrente AF2, em que a perda de quadro AFL ocorre, o fator de ganho corrente CGS é calculado do fator de ganho do quadro de áudio anterior e de uma classe de sinal do quadro de áudio anterior.
[144] Essa modalidade usa um classificador de sinais para computar os ganhos GCS com base nos ganhos passados e também adaptativamente na classe de sinais do quadro previamente recebido AF1. As classes de sinais podem se referir à classes de sons de fala, tais como: obstruinte (com subclasses: parada, africativa, fricativa), sonora (estas subclasses: nasais, aba aproximante, vogais), laterais, trinado.
[145] Em uma modalidade preferida, o módulo de fornecimento de fator de ganho 6 é configurado para calcular um número de quadros de áudio subsequentes em que as perdas dos quadros de áudio AFL ocorrem e configurado para executar um procedimento de redução de fator de ganho em caso de o número de quadros de áudio subsequentes em que as perdas de quadros de áudio AFL ocorrem exceder um número predefinido.
[146] Se uma fricativa ocorre imediatamente antes de uma perda de quadro de estouro (múltiplas perdas de quadros AFL em quadros de áudio subsequentes), o desvanecimento padrão inerente do módulo de decodificação de banda de núcleo 2 pode ser lento demais para assegurar um som agradável e natural em combinação com o bloqueio de ganho. O resultado percebido dessa questão pode ser uma fricativa prolongada com energia demais nas bandas de frequências FB de módulo de extensão de largura de banda 3. Por essa razão, uma verificação para múltiplas perdas de quadros AFL pode ser realizada. Se essa verificação for positiva, um procedimento de redução de fator de ganho pode ser executado.
[147] Em uma modalidade preferida, o procedimento de redução de fator de ganho compreende a etapa de redução do fator de ganho corrente pela divisão do fator de ganho corrente por um algarismo, no caso de o fator de ganho corrente exceder um primeiro limite. Por essas características , ganhos que excedem o primeiro limite (que podem ser determinados empiricamente) são reduzidos.
[148] Em uma modalidade preferida, o procedimento de redução de fator de ganho compreende a etapa de redução do fator de ganho corrente pela divisão do fator de ganho corrente por um segundo algarismo, que é maior do que o primeiro algarismo, em caso de o fator de ganho corrente exceder um segundo limite, que é maior do que o primeiro limite. Essas características asseguram que ganhos extremamente altos diminuem mais rapidamente. Todos os ganhos que excedem o segundo limite serão diminuídos mais depressa.
[149] Em algumas modalidades, o procedimento de redução de fator de ganho compreende a etapa de ajuste do fator de ganho corrente ao primeiro limite, no caso de o limite corrente, após a redução, estar abaixo do primeiro limite. Por essas características, os ganhos diminuídos são impedidos de caírem abaixo do primeiro limite.
[150] Em algumas modalidades, o módulo de extensão de largura de banda 3 compreende um módulo gerador de ruídos 7 configurado para adicionar ruído NOI à pelo menos uma banda de frequências FB, em que, no quadro de áudio corrente AF2 em que a perda de quadro de áudio AFL ocorre, uma proporção da energia de sinal para a energia de ruído da pelo menos uma banda de frequências FB do quadro de áudio anterior AF1 é usada para calcular a energia de ruído do quadro de áudio corrente AF2.
[151] No caso em que há uma característica de piso de ruído, (isto é, componentes de ruído adicionais mantêm o ruído do sinal original) implementada na extensão de largura de banda 3, é necessário adotar a ideia de bloqueio de ganho também para o piso de ruído. Para obter isso, os níveis de energia de piso de ruído de quadros não ocultos são convertidos em uma relação de ruído, tomando em conta a energia das bandas de frequências do módulo de extensão de largura de banda. A relação é salva em um armazenamento temporário e será a base do nível de ruído no caso de ocultação. A vantagem principal é o melhor acoplamento do piso de ruído à energia do codificador de núcleo devido a um cálculo da proporção.
[152] Em uma modalidade preferida, o decodificador de áudio 1 compreende um módulo de análise de espectro 8 configurado para estabelecer o espectro do quadro de áudio corrente AF2 do sinal de áudio de banda de núcleo CBS e derivar a energia de sinal estimada EE para o quadro corrente AF2 para a pelo menos uma banda de frequências FB do espectro do quadro de áudio corrente AF2 do sinal de áudio de banda de núcleo CBS.
[153] Em uma modalidade preferida, o módulo de extensão de largura de banda 3 compreende um módulo gerador de sinais 9, configurado para criar um sinal no domínio de frequência bruta RFS, tendo pelo menos uma banda de frequências FB, que é encaminhado para o módulo de ajuste de energia 5 com base no sinal de áudio de banda de núcleo CBS e no fluxo de bits BS.
[154] Em uma modalidade preferida, o módulo de extensão de largura de banda 3 compreende um módulo de síntese de sinal 10, configurado para produzir o sinal de áudio de extensão de largura de banda BES do sinal no domínio de frequência FDS.
[155] A figura 5 ilustra o enquadramento de uma modalidade de um decodificador de áudio 1 de acordo com a invenção.
[156] Em algumas modalidades, o módulo de fornecimento de fator de ganho 6 é configurado de tal maneira que , no caso em que um quadro de áudio corrente AF2, em que uma perda de quadro de áudio AFL não ocorre, subsequentemente, segue-se um quadro de áudio anterior AF1, em que uma perda de quadro de áudio AFL ocorre, o fator de ganho recebido para o quadro de áudio corrente AF2 é usado para o quadro corrente AF2, se um retardo DEL entre os quadros de áudio AF do módulo de extensão de largura de banda 3 com relação aos quadros de áudio AF’ do módulo de decodificação de banda de núcleo 2 for menor do que um limite de retardo, enquanto o fator de ganho do quadro de áudio anterior AF1 é usado para o quadro corrente AF2, se o retardo DEL entre quadros de áudio AF do módulo de extensão de largura de banda 3 com relação aos quadros de áudio AF’ do módulo de decodificação de banda de núcleo 3 for maior do que o limite de retardo.
[157] No topo da ocultação, no módulo de extensão de largura de banda, 3, atenção especial precisa ser dada ao enquadramento. Quadros de áudio AF do módulo de extensão de largura de banda e quadros de áudio AF’ do módulo de decodificação de banda de núcleo 3, com frequência, não são alinhados exatamente, mas poderiam ter um certo retardo DEL. Assim, pode acontecer que um pacote perdido contenha dados de extensão de largura de banda sendo retardados, em relação ao sinal de núcleo contido no mesmo pacote.
[158] O resultado nesse caso é que o primeiro pacote bom após uma perda pode conter dados de extensão para criar partes das bandas de frequências FB do módulo de extensão de largura de banda 3 do quadro de áudio AF’ do módulo de decodificação de banda de núcleo, que já estava oculto no decodificador 2.
[159] Por essa razão, o enquadramento precisa ser considerado durante a recuperação, dependendo das respectivas propriedades do módulo de decodificação de núcleo e do módulo de extensão de largura de banda. Isso poderia significar tratar o primeiro quadro de áudio ou partes dele no módulo de extensão de largura de banda 3 como erro e não aplicar os ganhos mais novos de uma vez, mas manter os ganhos bloqueados do primeiro quadro de áudio para um quadro adicional.
[160] Manter ou não os ganhos bloqueados para o primeiro quadro bom depende do retardo. A aplicação experimental aos codecs com retardos diferentes mostrou beneficio diferente para codecs com retardos diferentes. Para codecs com retardos bastante pequenos (por exemplo, 1ms) é melhor usar os ganhos mais novos para o primeiro quadro de áudio bom.
[161] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, está claro que esses aspectos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa do método ou uma característica de uma etapa do método. De modo análogo, aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item ou característica correspondente de um aparelho correspondente. Algumas ou todas as etapas do método podem ser executadas por (ou usando) um aparelho de hardware, como, por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas modalidades uma ou mais das etapas mais importantes do método podem ser executadas por esse aparelho.
[162] Dependendo de certas exigências de implementação, modalidades da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada usando um meio de armazenamento não transitório, tal como, um meio de armazenamento digital, por exemplo, um disco flexível, um DVD, Blu-Ray, um CD, uma ROM, uma PROM e EPROM, uma EEPROM ou uma memória FLASH, tendo sinais de controle legíveis eletronicamente armazenados, que cooperam (ou são capazes de cooperar) com um sistema de computador programável de modo que o respectivo método é realizado. Portanto, o meio de armazenamento digital pode ser legível em computador.
[163] Algumas modalidades de acordo com a invenção compreendem uma portadora de dados tendo sinais de controle legíveis eletronicamente, os quase são capazes de cooperar com um sistema de computador programável, de modo que um dos métodos aqui descrito é realizada.
[164] De um modo geral, as modalidades da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, o código de programa sendo operativo para realizar um dos métodos, quando o produto de programa de computador executa em um computador. O código de programa pode, por exemplo, ser armazenado em portadora legível em máquina.
[165] Outras modalidades compreendem o programa de computador para realizar um dos métodos aqui descritos, armazenado em uma portadora legível em máquina.
[166] Em outras palavras, uma modalidade do método da invenção é, portanto, um programa de computador tendo um código de programa para realizar um dos métodos aqui descritos, quando o programa de computador executa em um computador.
[167] Uma outra modalidade do método da invenção é, portanto, uma portadora de dados (ou meio de armazenamento digital) ou um meio legível em computador) compreendendo, nele gravado, o programa de computador para realizar um dos métodos aqui descritos. A portadora de dados, o meio de armazenamento digita ou o meio gravado são, tipicamente, tangíveis e/ou não transitórios.
[168] Uma outra modalidade do método da invenção é, portanto, um fluxo de dados ou uma sequência de sinais representando o programa de computador para realizar um dos métodos aqui descritos. O fluxo de dados ou a sequência de sinais podem, por exemplo ser configurados para serem transferidos via uma conexão de comunicação de dados, por exemplo, via a Internet.
[169] Uma outra modalidade compreende um meio de processamento, por exemplo, um computador ou um dispositivo lógico programável configurado para ou adaptado par realizar um dos métodos aqui descritos.
[170] Uma outra modalidade compreende um computador tendo nele instalado um programa de computador para realizar um dos métodos aqui descritos.
[171] Uma outra modalidade de acordo com a invenção compreende um aparelho ou um sistema configurado para transferir (por exemplo, eletrônica ou opticamente) um programa de computador paras realizar um dos métodos aqui descritos para um receptor. O receptor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou semelhante. O aparelho ou sistema pode compreender, por exemplo, um servidor de arquivos para transferir o programa de computador para o receptor.
[172] Em algumas modalidades, um dispositivo lógico programável )por exemplo, um arranjo de portas programáveis em campo) pode ser usado para realizar algumas ou todas as funcionalidades dos métodos aqui descritos. De um modo geral, os métodos são realizados, de preferência, por qualquer aparelho de hardware.
[173] As modalidades descritas acima são apenas ilustrativas para os princípios da presente invenção. É compreendido que modificações e variações das disposições e dos detalhes aqui descritos serão evidentes para outros habilitados na técnica. É intenção, portanto, que esteja limitada apenas pelo escopo das reivindicações de patente próximas e não pelos detalhes específicos apresentados por meio de descrição e explanação das modalidades mostradas.
[174] Sinais de Referência:
[175] decodificador de áudio
[176] módulo de decodificação de banda de núcleo
[177] módulo de extensão de largura de banda
[178] combinador
[179] módulo de ajuste de energia
[180] módulo de fornecimento de fator de ganho
[181] módulo gerador de ruídos
[182] módulo de análise de espectro
[183] módulo gerador de sinais
[184] módulo de síntese de sinal
[185] AS sinal de áudio
[186] BS fluxo de bits
[187] AF quadro de áudio
[188] CBS sinal de áudio de banda de núcleo
[189] BES sinal de áudio de extensão de largura de banda
[190] FDS sinal no domínio de frequência
[191] FB banda de frequências
[192] AFL perda de quadro de áudio
[193] CGF fator de ganho corrente
[194] EE energia de sinal estimada
[195] NOI ruído
[196] DEL retardo
[197] RFS sinal no domínio de frequência bruta Referências
[198] [3GP09] 3GPP; Technical Specification Group Services and System Aspects, Extended adaptive multi-rate - wideband (AMR-WB+) codec, 3GPP TS 26.290, 3rd Generation Partnership Project, 2009.
[199] [3GP12a] General audio codec audio processing functions; Enhanced aacPlus general audio codec; additional decoder tools (release 11), 3GPP TS 26.402, 3rd Generation Partnership Project, Sep 2012.
[200] [3GP12b] Speech codec speech processing functions; adaptive multi-rate - wideband (AMRWB) speech codec; error concealment of erroneous or lost frames, 3GPP TS 26.191, 3rd Generation Partnership Project, Sep 2012.
[201] [EBU10] EBU/ETSI JTC Broadcast, Digital audio broadcasting (DAB); transport of advanced audio coding (AAC) audio, ETSI TS 102 563, European Broadcasting Union, May 2010.
[202] [EBU12] Digital radio mondiale (DRM); system specification, ETSI ES 201 980, ETSI, Jun 2012.
[203] [ISO09] ISO/IEC JTC1/SC29/WG11, Information technology - coding of audio-visual objects - part 3: Audio, ISO/IEC IS 14496-3, International Organization for Standardization, 2009.
[204] [ITU08] ITU-T, G.718: Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s, Recommendation ITU-T G.718, Telecommunication Standardization Sector of ITU, Jun 2008.
[205] [RR06] Sang-Uk Ryu and Kenneth Rose, Frame loss concealment for audio decoders employing spectral band replication, Convention Paper 6962, Electrical and Computer Engineering, University of California, Oct 2006, AES.
[206] [SKE06] Andreas Schneider, Kurt Krauss, and Andreas Ehret, Evaluation of real-time transport protocol configurations using aacplus, Convention paper 6789, AES, May 2006, Presented at the 120th Convention 2006 May 20-23.

Claims (14)

1. Decodificador de áudio configurado para produzir um sinal de áudio (AS) de um fluxo de bits (BS) contendo quadros de áudio (AF), o decodificador de áudio (1) caracterizado por compreender: um módulo de decodificação de banda de núcleo (2) configurado para derivar um sinal de áudio de banda de núcleo decodificado diretamente (CBS) do fluxo de bits (BS); um módulo de extensão de largura de banda (3) configurado para derivar um sinal de áudio de extensão de largura de banda parametricamente decodificado BES do sinal de áudio de banda de núcleo (CBS) e do fluxo de bits (BS), em que o sinal de áudio de extensão de largura de banda (BES) é baseado em um sinal no domínio de frequência (FDS) tendo pelo menos uma banda de frequências FB; e um combinador (4) configurado para combinar o sinal de áudio de banda de núcleo (CBS) e o sinal de áudio de extensão de largura de banda (BES) de modo a produzir o sinal de áudio (AS); em que o módulo de extensão de largura de banda (3) compreende um módulo de ajuste de energia (5) sendo configurado de tal maneira que em um quadro de áudio corrente (AF2), em que uma perda de quadro de áudio (AF1) ocorre, uma energia de sinal ajustada para o quadro de áudio corrente (AF2) para a pelo menos uma banda de frequências (FB) é estabelecida, com base em um fator de ganho corrente (CGF) para o quadro de áudio corrente (AF2), em que o fator de ganho corrente (CGF) é derivado de um fator de ganho de um quadro de áudio anterior (AF1) ou do fluxo de bits (BS); e com base em uma energia de sinal estimada (EE) para a pelo menos uma banda de frequências, em que a energia de sinal estimada (EE) é derivada de um espectro do quadro de áudio corrente AF2’) do sinal de áudio de banda de núcleo (CBS).
2. Decodificador de áudio, de acordo com reivindicação 1, caracterizado por o módulo de extensão de largura de banda (3) compreender um módulo de fornecimento de fator de ganho (6) configurado para encaminhar o fator de ganho corrente (CGF) pelo menos no quadro de áudio corrente (AF2) em que a perda de quadro de audio (AFL) ocorre para o módulo de ajuste de energia (5).
3. Decodificador de áudio, de acordo com a reivindicação 2, caracterizado por o módulo de fornecimento de fator de ganho (6) ser configurado de modo que, no quadro de áudio corrente (AF2) em que a perda de quadro de áudio ocorrer (AFL) o fator de ganho corrente (CGF) ser o fator de ganho do quadro de áudio anterior (AF1).
4. Decodificador de áudio, de acordo com a reivindicação 2 ou 3, caracterizado por o módulo de fornecimento de fator de ganho (6) ser configurado de tal maneira que, no quadro de áudio corrente (AF2), em que a perda de quadro (AFL) ocorre, o fator de ganho corrente (CGF) é calculado do fator de ganho do quadro de áudio anterior (AF1) e de uma classe de sinais do quadro de áudio anterior (AF1).
5. Decodificador de áudio, de acordo com as reivindicações de 2 a 4, caracterizado por o módulo de fornecimento de fator de ganho (6) ser configurado para calcular um número de quadros de áudio subsequentes em que perdas de quadro de áudio (AFL) ocorrem e configurado para executar um procedimento de redução de fator de ganho no caso de o número de quadros de áudio subsequentes, em que as perdas de quadros de áudio (AFL) ocorrem exceder um número predefinido.
6. Decodificador de áudio, de acordo com a reivindicação 5, caracterizado por o procedimento de redução de fator de ganho compreender a etapa de redução do fator de ganho corrente pela divisão do fator de ganho corrente por um primeiro algarismo no caso do fator de ganho corrente exceder um primeiro limite.
7. Decodificador de áudio, de acordo com a reivindicação 5 ou 6, caracterizado por o procedimento de redução de fator de ganho compreender a etapa de redução de fator de ganho corrente pela divisão do fator de ganho corrente por um segundo algarismo que é maior do que o primeiro algarismo em caso de o fator de ganho corrente exceder um segundo limite que é maior do que o primeiro limite.
8. Decodificador de áudio, de acordo com qualquer uma das reivindicações de 5 a 7, caracterizado por o procedimento de redução de fator de ganho compreender a etapa de ajuste do fator de ganho corrente ao primeiro limite em caso de o limite corrente após redução estar abaixo do primeiro limite.
9. Decodificador de áudio, de acordo com qualquer uma das reivindicações de 1 a 8, caracterizado por o módulo de extensão de largura de banda (3) compreender um módulo gerador de ruídos (7) configurado para adicionar ruído (NOI) à pelo menos uma banda de frequências (FB), em que, no quadro de áudio corrente (AF2) em que a perda de quadro de áudio (AFL) ocorre, uma proporção da energia de sinal para a energia de ruído da pelo menos uma banda de frequências (FB) do quadro de áudio anterior (AF1) é usada para calcular a energia de ruído do quadro de áudio corrente (AF2).
10. Decodificador de áudio, de acordo com qualquer uma das reivindicações de 1 a 9, caracterizado por o decodificador de áudio compreender um módulo de análise de espectro configurado para estabelecer o espectro do quadro de áudio corrente (AF2’) do sinal de áudio de banda de núcleo (CBS) e derivar a energia de sinal estimada para o quadro corrente (AF2) para a pelo menos uma banda de frequências (FB) do espectro do quadro de áudio corrente (AF2’) do sinal de áudio de banda de núcleo (CBS).
11. Decodificador de áudio, de acordo com qualquer uma das reivindicações de 2 a 10, caracterizado por o módulo de fornecimento de fator de ganho (6) ser configurado de tal maneira que, no caso em que um quadro de áudio corrente, em que uma perda de quadro de audio não ocorre, segue-se, subsequentemente, em um quadro de áudio anterior, em que a perda de quadro de audio ocorre, o fator de ganho recebido para o quadro de áudio corrente é usado para o quadro corrente, se um retardo (DEL) entre quadros de áudio (AF1, AF2) do módulo de extensão de largura de banda (3) com relação aos quadros de áudio (AF1’, AF2’) do módulo de decodificação de banda de núcleo (2) é menor do que um limite de retardo, enquanto o fator de ganho do quadro de áudio anterior é usado para o quadro corrente, se o retardo (DEL) entre os quadros de áudio do módulo de extensão de largura de banda com relação aos quadros de áudio do módulo de decodificação de banda de núcleo for maior do que o limite de retardo.
12. Decodificador de áudio, de acordo com qualquer uma das reivindicações de 1 a 11, caracterizado por o módulo de extensão de largura de banda (3) compreender um módulo gerador de sinais (9) configurado para criar um sinal no domínio de frequência bruta (RFS) tendo pelo menos banda de frequências (FB), que é encaminhado para o módulo de ajuste de energia (5), com base no sinal de áudio de banda de núcleo (CBS) e no fluxo de bits (BS).
13. Decodificador de áudio, de acordo com qualquer uma das reivindicações de 1 a 12, caracterizado por o módulo de extensão de largura de banda (3) compreender um módulo de síntese de sinal (10) configurado para produzir o sinal de áudio de extensão de largura de banda (BES) do sinal no domínio de frequência (FDS).
14. Método para produzir um sinal de áudio (AS) de um fluxo de bits (BS) contendo quadros de áudio (AF), o método caracterizado por compreender as etapas de: derivação de um sinal de áudio de banda de núcleo (CBS) decodificado diretamente do fluxo de bits (BS); derivação de um sinal de áudio de extensão de largura de banda (BES) parametricamente decodificado do sinal de áudio de banda de núcleo (CBS) e do fluxo de bits (BS), em que o sinal de áudio de extensão de largura de banda (BES) é baseado em um sinal no domínio de frequência (FDS) tendo pelo menos uma banda de frequências FB); e combinação do sinal de áudio de banda de núcleo (CBS) e do sinal de áudio de extensão de largura de banda (BES) de modo a produzir o sinal de áudio (AS); em que, em um quadro de áudio corrente (AF2), em que uma perda de quadro de áudio ocorre (AFL), uma energia de sinal ajustada para o quadro de áudio corrente (AF2) para a pelo menos uma banda de frequências (FB) é definida; com base em um fator de ganho corrente (CGF) para o quadro de áudio corrente (AF2), em que o fator de ganho corrente (CGF) é derivado de um fator de ganho de um quadro de áudio anterior (AF1) ou do fluxo de bits (BS); e com base em uma energia de sinal estimada para a pelo menos uma banda de frequências (FB), em que a energia de sinal estimada é derivada de um espectro do quadro de áudio corrente (AF2’) do sinal de áudio de banda de núcleo (CBS).
BR112015031605-0A 2013-06-21 2014-06-18 Decodificador de áudio tendo um módulo de extensão de largura de banda com um módulo de ajuste de energia BR112015031605B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP13173152.3 2013-06-21
EP13173152 2013-06-21
EP14167050 2014-05-05
EP14167050.5 2014-05-05
PCT/EP2014/062902 WO2014202701A1 (en) 2013-06-21 2014-06-18 Audio decoder having a bandwidth extension module with an energy adjusting module

Publications (2)

Publication Number Publication Date
BR112015031605A2 BR112015031605A2 (pt) 2017-07-25
BR112015031605B1 true BR112015031605B1 (pt) 2022-03-29

Family

ID=51022308

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112015031605-0A BR112015031605B1 (pt) 2013-06-21 2014-06-18 Decodificador de áudio tendo um módulo de extensão de largura de banda com um módulo de ajuste de energia

Country Status (18)

Country Link
US (2) US10096322B2 (pt)
EP (1) EP3011560B1 (pt)
JP (1) JP6228298B2 (pt)
KR (2) KR20170124590A (pt)
CN (1) CN105431898B (pt)
AU (1) AU2014283285B2 (pt)
BR (1) BR112015031605B1 (pt)
CA (1) CA2915001C (pt)
ES (1) ES2697474T3 (pt)
HK (1) HK1224368A1 (pt)
MX (1) MX358362B (pt)
MY (1) MY169410A (pt)
PL (1) PL3011560T3 (pt)
PT (1) PT3011560T (pt)
RU (1) RU2642894C2 (pt)
SG (1) SG11201510458UA (pt)
TW (1) TWI564883B (pt)
WO (1) WO2014202701A1 (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2642894C2 (ru) * 2013-06-21 2018-01-29 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиодекодер, имеющий модуль расширения полосы частот с модулем регулирования энергии
KR102340151B1 (ko) * 2014-01-07 2021-12-17 하만인터내셔날인더스트리스인코포레이티드 신호 품질-기반 압축 오디오 신호 향상 및 보상
EP3701527B1 (en) 2017-10-27 2023-08-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating a bandwidth-enhanced audio signal using a neural network processor
CN109668917B (zh) * 2018-09-29 2020-06-19 中国科学院高能物理研究所 一种利用单色器获得不同能量带宽x射线的方法
CN113324546B (zh) * 2021-05-24 2022-12-13 哈尔滨工程大学 罗经失效下的多潜航器协同定位自适应调节鲁棒滤波方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6009117A (en) * 1996-09-17 1999-12-28 Kabushiki Kaisha Toyoda Jidoshokki Seisakusho Spread spectrum communication system
AU3372199A (en) * 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6763142B2 (en) * 2001-09-07 2004-07-13 Nline Corporation System and method for correlated noise removal in complex imaging systems
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US6985856B2 (en) * 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
RU2376657C2 (ru) 2005-04-01 2009-12-20 Квэлкомм Инкорпорейтед Системы, способы и устройства для высокополосного предыскажения шкалы времени
EP1898397B1 (en) * 2005-06-29 2009-10-21 Panasonic Corporation Scalable decoder and disappeared data interpolating method
US8374857B2 (en) * 2006-08-08 2013-02-12 Stmicroelectronics Asia Pacific Pte, Ltd. Estimating rate controlling parameters in perceptual audio encoders
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
MY155538A (en) * 2008-07-11 2015-10-30 Fraunhofer Ges Forschung An apparatus and a method for generating bandwidth extension output data
WO2010051857A1 (en) * 2008-11-10 2010-05-14 Oticon A/S N band fm demodulation to aid cochlear hearing impaired persons
US8718804B2 (en) * 2009-05-05 2014-05-06 Huawei Technologies Co., Ltd. System and method for correcting for lost data in a digital audio signal
US8428938B2 (en) * 2009-06-04 2013-04-23 Qualcomm Incorporated Systems and methods for reconstructing an erased speech frame
PL2596497T3 (pl) * 2010-07-19 2014-10-31 Dolby Int Ab Przetwarzanie sygnałów audio podczas rekonstrukcji wysokiej częstotliwości
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
US20140019125A1 (en) * 2011-03-31 2014-01-16 Nokia Corporation Low band bandwidth extended
US8909539B2 (en) * 2011-12-07 2014-12-09 Gwangju Institute Of Science And Technology Method and device for extending bandwidth of speech signal
EP2950308B1 (en) * 2013-01-22 2020-02-19 Panasonic Corporation Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
RU2642894C2 (ru) * 2013-06-21 2018-01-29 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиодекодер, имеющий модуль расширения полосы частот с модулем регулирования энергии

Also Published As

Publication number Publication date
US10096322B2 (en) 2018-10-09
MX358362B (es) 2018-08-15
PT3011560T (pt) 2018-11-09
HK1224368A1 (zh) 2017-08-18
CA2915001A1 (en) 2014-12-24
MY169410A (en) 2019-04-01
JP2016530548A (ja) 2016-09-29
TWI564883B (zh) 2017-01-01
CA2915001C (en) 2019-04-02
MX2015017846A (es) 2016-04-18
CN105431898B (zh) 2019-09-06
RU2642894C2 (ru) 2018-01-29
EP3011560A1 (en) 2016-04-27
TW201513097A (zh) 2015-04-01
US20190027153A1 (en) 2019-01-24
CN105431898A (zh) 2016-03-23
SG11201510458UA (en) 2016-01-28
PL3011560T3 (pl) 2019-01-31
AU2014283285A1 (en) 2016-02-11
US20160180854A1 (en) 2016-06-23
JP6228298B2 (ja) 2017-11-08
ES2697474T3 (es) 2019-01-24
KR101991421B1 (ko) 2019-06-21
KR20170124590A (ko) 2017-11-10
BR112015031605A2 (pt) 2017-07-25
EP3011560B1 (en) 2018-08-01
RU2016101607A (ru) 2017-07-26
WO2014202701A1 (en) 2014-12-24
KR20160024920A (ko) 2016-03-07
AU2014283285B2 (en) 2017-09-21

Similar Documents

Publication Publication Date Title
ES2644693T3 (es) Aparato y método para generar una forma espectral adaptativa de ruido de confort
KR101907017B1 (ko) 고주파 복원 동안 오디오 신호들의 프로세싱
EP2301027B1 (en) An apparatus and a method for generating bandwidth extension output data
JP6515147B2 (ja) 音声周波数信号復号器における周波数帯域拡張のための最適化スケール因子の判定方法及び判定装置
US20190027153A1 (en) Audio Decoder Having A Bandwidth Extension Module With An Energy Adjusting Module
CN105960675B (zh) 音频信号解码器中改进的频带扩展
BR112015031177B1 (pt) Aparelho e método que realizam um desvanecimento de um espectro de mdct em ruído branco antes da aplicação de fdns

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B350 Update of information on the portal [chapter 15.35 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 18/06/2014, OBSERVADAS AS CONDICOES LEGAIS.