BR112016005850B1 - método e aparelho de extensão de largura de banda - Google Patents

método e aparelho de extensão de largura de banda Download PDF

Info

Publication number
BR112016005850B1
BR112016005850B1 BR112016005850-0A BR112016005850A BR112016005850B1 BR 112016005850 B1 BR112016005850 B1 BR 112016005850B1 BR 112016005850 A BR112016005850 A BR 112016005850A BR 112016005850 B1 BR112016005850 B1 BR 112016005850B1
Authority
BR
Brazil
Prior art keywords
signal
high frequency
bandwidth extension
excitation signal
frequency
Prior art date
Application number
BR112016005850-0A
Other languages
English (en)
Inventor
Zexin LIU
Lei Miao
Bin Wang
Original Assignee
Huawei Technologies Co., Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co., Ltd filed Critical Huawei Technologies Co., Ltd
Publication of BR112016005850B1 publication Critical patent/BR112016005850B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • G10L2025/906Pitch tracking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • External Artificial Organs (AREA)
  • Vehicle Body Suspensions (AREA)

Abstract

MÉTODO E APARELHO DE EXTENSÃO DE LARGURA DE BANDA. A presente invenção refere-se a um método e aparelho de extensão de largura de banda. O método de extensão de largura de banda inclui: adquirir um parâmetro de extensão de largura de banda, em que o parâmetro de extensão de largura de banda inclui um ou mais dos seguintes parâmetros: um coeficiente de previsão linear LPC, um parâmetro de frequência espectral em linha LSF, um período de intervalo, uma taxa de decodificação, uma contribuição do livro de código adaptável e uma contribuição do livro de código algébrico; e realizar, de acordo com o parâmetro de extensão de largura de banda, a extensão de largura de banda em um sinal decodificado de baixa frequência, para obter um sinal de alta frequência. Nas modalidades da presente invenção, a extensão de largura de banda é realizada, com o uso do parâmetro de extensão de largura de banda e de um fator de correção obtido através de cálculo com o uso do parâmetro de extensão de largura de banda no sinal decodificado de baixa frequência, recuperando, desse modo, o sinal de alta frequência. O sinal de alta frequência recuperado com o uso do método (...).

Description

CAMPO DA TÉCNICA
[1] A presente invenção refere-se ao campo de codificação e decodificação de áudio e, em particular, a um método e um aparelho de extensão de largura de banda em uma previsão linear excitada por código algébrico (ACELP) de uma banda larga de taxa média e baixa.
ANTECEDENTES DA INVENÇÃO
[2] Uma tecnologia de extensão de largura de banda cega é uma tecnologia em um decodificador, e em que um decodificador realiza a extensão de largura de banda cega de acordo com um sinal de decodificação de baixa frequência e com o uso de um método de previsão correspondente.
[3] Durante a codificação e decodificação por ACELP de uma banda larga de taxa média e baixa, todos os algoritmos existentes primeiramente reduzem a resolução de um sinal de banda larga amostrado a 16 kHz a 12,8 kHz, e, então, realiza codificação. Desse modo, a largura de banda de uma saída de sinal após a codificação e a decodificação é apenas 6,4 kHz. Se um algoritmo original não for mudado, as informações em uma parte com uma largura de banda de 6,4 até 8 kHz ou de 6,4 até 7 kHz precisam ser recuperadas de um modo de extensão de largura de banda cega, ou seja, a recuperação correspondente é realizada apenas no decodificador.
[4] Entretanto, um sinal de banda de alta frequência recuperado pela tecnologia existente de extensão de largura de banda cega se afasta muito de um sinal de banda de alta frequência original, o que faz com que o sinal de banda de alta frequência recuperado seja insatisfatório.
SUMÁRIO
[5] A presente invenção fornece um método e um aparelho de extensão de largura de banda, e objetiva resolver o problema de um sinal de banda de alta frequência recuperado com o uso de uma tecnologia existente de extensão de largura de banda cega se afastar muito de um sinal de banda de alta frequência original.
[6] De acordo com um primeiro aspecto, um método de extensão de largura de banda é fornecido, incluindo: adquirir um parâmetro de extensão de largura de banda, em que o parâmetro de extensão de largura de banda inclui um ou mais dos seguintes parâmetros: um coeficiente de previsão linear (LPC), um parâmetro de frequência espectral em linha (LSF), um período de intervalo, uma taxa de decodificação, uma contribuição do livro de código adaptável e uma contribuição do livro de código algébrico; e realizar, de acordo com o parâmetro de extensão de largura de banda, a extensão de largura de banda em um sinal decodificado de baixa frequência, para obter um sinal de banda de alta frequência.
[7] Com referência ao primeiro aspecto, em um primeiro modo de implementação do primeiro aspecto, a realização, de acordo com o parâmetro de extensão de largura de banda, de extensão de largura de banda em um sinal decodificado de baixa frequência, para obter um sinal de banda de alta frequência inclui: prever energia de alta frequência e um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda; e obter o sinal de banda de alta frequência de acordo com a energia de alta frequência e o sinal de excitação de banda alta.
[8] Com referência ao primeiro modo de implementação do primeiro aspecto, em um segundo modo de implementação do primeiro aspecto, a energia de alta frequência inclui um ganho de alta frequência; e a previsão de energia de alta frequência e um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda inclui: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta de acordo com o parâmetro de LSF, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[9] Com referência ao segundo modo de implementação do primeiro aspecto, em um terceiro modo de implementação do primeiro aspecto, a previsão de modo adaptável do sinal de excitação de banda alta de acordo com o parâmetro de LSF, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico inclui: prever de modo adaptável o sinal de excitação de banda alta de acordo com a taxa de decodificação, o parâmetro de LSF, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[10] Com referência ao primeiro modo de implementação do primeiro aspecto, em um quarto modo de implementação do primeiro aspecto, a energia de alta frequência inclui um ganho de alta frequência; e a previsão de energia de alta frequência e um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda inclui: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta de acordo com a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[11] Com referência ao quarto modo de implementação do primeiro aspecto, em um quinto modo de implementação do primeiro aspecto, a previsão de modo adaptável do sinal de excitação de banda alta de acordo com a contribuição do livro de código adaptável e a contribuição do livro de código algébrico inclui: prever de modo adaptável o sinal de excitação de banda alta de acordo com a taxa de decodificação, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[12] Com referência ao primeiro modo de implementação do primeiro aspecto, em um sexto modo de implementação do primeiro aspecto, a energia de alta frequência inclui um envelope de alta frequência; e a previsão de energia de alta frequência e um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda inclui: prever o envelope de alta frequência de acordo com o sinal decodificado de baixa frequência ou um sinal de excitação de baixa frequência, em que o sinal de excitação de baixa frequência é a soma da contribuição do livro de código adaptável e da contribuição do livro de código algébrico; e prever o sinal de excitação de banda alta de acordo com o sinal decodificado de baixa frequência ou o sinal de excitação de baixa frequência.
[13] Com referência ao sexto modo de implementação do primeiro aspecto, em um sétimo modo de implementação do primeiro aspecto, a previsão do sinal de excitação de banda alta de acordo com o sinal decodificado de baixa frequência ou o sinal de excitação de baixa frequência inclui: prever o sinal de excitação de banda alta de acordo com a taxa de decodificação e o sinal decodificado de baixa frequência.
[14] Com referência ao sexto modo de implementação do primeiro aspecto, em um oitavo modo de implementação do primeiro aspecto, a previsão do sinal de excitação de banda alta de acordo com o sinal decodificado de baixa frequência ou um sinal de excitação de baixa frequência inclui: prever o sinal de excitação de banda alta de acordo com a taxa de decodificação e o sinal de excitação de baixa frequência.
[15] Com referência do primeiro ao oitavo modos de implementação do primeiro aspecto, em um nono modo de implementação do primeiro aspecto, após a previsão de uma energia de alta frequência e um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda, o método inclui adicionalmente: determinar um primeiro fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência, em que o primeiro fator de correção inclui um ou mais dos seguintes parâmetros: um fator de voz, um fator de portão de ruído, e um fator de inclinação de espectro; e corrigir a energia de alta frequência de acordo com o primeiro fator de correção.
[16] Com referência ao nono modo de implementação do primeiro aspecto, em um décimo modo de implementação do primeiro aspecto, a determinação de um primeiro fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência inclui: determinar o primeiro fator de correção de acordo com o período de intervalo, a contribuição do livro de código adaptável, a contribuição do livro de código algébrico e o sinal decodificado de baixa frequência.
[17] Com referência ao nono modo de implementação do primeiro aspecto, em um décimo primeiro modo de implementação do primeiro aspecto, a determinação de um primeiro fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência inclui: determinar o primeiro fator de correção de acordo com o sinal decodificado de baixa frequência.
[18] Com referência ao nono modo de implementação do primeiro aspecto, em um décimo segundo modo de implementação do primeiro aspecto, a determinação de um primeiro fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência inclui: determinar o primeiro fator de correção de acordo com o período de intervalo, a contribuição do livro de código adaptável, a contribuição do livro de código algébrico e o sinal decodificado de baixa frequência.
[19] Com referência do nono ao décimo segundo modos de implementação do primeiro aspecto, em um décimo terceiro modo de implementação do primeiro aspecto, o método inclui adicionalmente: corrigir a energia de alta frequência de acordo com o período de intervalo.
[20] Com referência do nono ao décimo terceiro modos de implementação do primeiro aspecto, em um décimo quarto modo de implementação do primeiro aspecto, o método inclui adicionalmente: determinar um segundo fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência, em que o segundo fator de correção inclui pelo menos um dentre um parâmetro de classificação e um tipo de sinal; e corrigir a energia de alta frequência e o sinal de excitação de banda alta de acordo com o segundo fator de correção.
[21] Com referência ao décimo quarto modo de implementação do primeiro aspecto, em um décimo quinto modo de implementação do primeiro aspecto, a determinação de um segundo fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência inclui: determinar o segundo fator de correção de acordo com o parâmetro de extensão de largura de banda.
[22] Com referência ao décimo quarto modo de implementação do primeiro aspecto, em um décimo sexto modo de implementação do primeiro aspecto, a determinação de um segundo fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência inclui: determinar o segundo fator de correção de acordo com o sinal decodificado de baixa frequência.
[23] Com referência ao décimo quarto modo de implementação do primeiro aspecto, em um décimo sétimo modo de implementação do primeiro aspecto, a determinação de um segundo fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência inclui: determinar o segundo fator de correção de acordo com o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência.
[24] Com referência do nono ao décimo sétimo modos de implementação do primeiro aspecto, em um décimo oitavo modo de implementação do primeiro aspecto, o método inclui adicionalmente: ponderar o sinal previsto de excitação de banda alta e um sinal de ruído aleatório, para obter um sinal final de excitação de banda alta, em que um peso da ponderação é determinado de acordo com um valor de um parâmetro de classificação e/ou um fator de voz do sinal decodificado de baixa frequência.
[25] Com referência do primeiro ao décimo oitavo modos de implementação do primeiro aspecto, em um décimo nono modo de implementação do primeiro aspecto, a obtenção do sinal de banda de alta frequência de acordo com a energia de alta frequência e o sinal de excitação de banda alta inclui: sintetizar a energia de alta frequência e o sinal de excitação de banda alta, para obter o sinal de banda de alta frequência; ou sintetizar a energia de alta frequência, o sinal de excitação de banda alta e um LPC previsto, para obter o sinal de banda de alta frequência, em que o LPC previsto inclui um LPC previsto de banda de alta frequência ou um LPC previsto de banda larga e o LPC previsto é obtido com base no LPC.
[26] De acordo com um segundo aspecto, um aparelho de extensão de largura de banda é fornecido, incluindo: uma unidade de aquisição configurada para adquirir um parâmetro de extensão de largura de banda, em que o parâmetro de extensão de largura de banda inclui um ou mais dos seguintes parâmetros: um coeficiente de previsão linear (LPC), um parâmetro de frequência espectral em linha (LSF), um período de intervalo, uma taxa de decodificação, uma contribuição do livro de código adaptável e uma contribuição do livro de código algébrico; e uma unidade de extensão de largura de banda, configurada para realizar, de acordo com o parâmetro de extensão de largura de banda adquirido pela unidade de aquisição, a extensão de largura de banda em um sinal decodificado de baixa frequência, para obter um sinal de banda de alta frequência.
[27] Com referência ao segundo aspecto, em um primeiro modo de implementação do segundo aspecto, a unidade de extensão de largura de banda inclui: uma subunidade de previsão, configurada parar prever energia de alta frequência e um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda; e uma subunidade de síntese, configurada para obter o sinal de banda de alta frequência de acordo com a energia de alta frequência e o sinal de excitação de banda alta.
[28] Com referência ao primeiro modo de implementação do segundo aspecto, em um segundo modo de implementação do segundo aspecto, a energia de alta frequência inclui um ganho de alta frequência; e a subunidade de previsão é configurada especificamente para: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta de acordo com o parâmetro de LSF, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[29] Com referência ao primeiro modo de implementação do segundo aspecto, em um terceiro modo de implementação do segundo aspecto, a energia de alta frequência inclui um ganho de alta frequência; e a subunidade de previsão é configurada especificamente para: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta de acordo com a taxa de decodificação, o parâmetro de LSF, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[30] Com referência ao primeiro modo de implementação do segundo aspecto, em um quarto modo de implementação do segundo aspecto, a energia de alta frequência inclui um ganho de alta frequência; e a subunidade de previsão é configurada especificamente para: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta de acordo com a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[31] Com referência ao primeiro modo de implementação do segundo aspecto, em um quinto modo de implementação do segundo aspecto, a energia de alta frequência inclui um ganho de alta frequência; e a subunidade de previsão é configurada especificamente para: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta de acordo com a taxa de decodificação, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[32] Com referência ao primeiro modo de implementação do segundo aspecto, em um sexto modo de implementação do segundo aspecto, a energia de alta frequência inclui um envelope de alta frequência; e a subunidade de previsão é configurada especificamente para: prever o envelope de alta frequência de acordo com o sinal decodificado de baixa frequência; e prever o sinal de excitação de banda alta de acordo com o sinal decodificado de baixa frequência ou um sinal de excitação de baixa frequência, em que o sinal de excitação de baixa frequência é a soma da contribuição do livro de código adaptável e da contribuição do livro de código algébrico.
[33] Com referência ao sexto modo de implementação do segundo aspecto, em um sétimo modo de implementação do segundo aspecto, a subunidade de previsão é configurada especificamente para: prever o envelope de alta frequência de acordo com o sinal decodificado de baixa frequência; e prever o sinal de excitação de banda alta de acordo com a taxa de decodificação e o sinal de excitação de baixa frequência.
[34] Com referência ao sexto modo de implementação do segundo aspecto, em um oitavo modo de implementação do segundo aspecto, a subunidade de previsão é configurada especificamente para: prever o envelope de alta frequência de acordo com o sinal decodificado de baixa frequência; e prever o sinal de excitação de banda alta de acordo com a taxa de decodificação e o sinal de decodificado de baixa frequência.
[35] Com referência do primeiro ao oitavo modos de implementação do segundo aspecto, em um nono modo de implementação do segundo aspecto, a unidade de extensão de largura de banda inclui adicionalmente: uma primeira subunidade de correção, configurada para: após a energia de alta frequência e o sinal de excitação de banda alta serem previstos de acordo com o parâmetro de extensão de largura de banda, determinar um primeiro fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência, em que o primeiro fator de correção inclui um ou mais dos seguintes parâmetros: um fator de voz, um fator de portão de ruído e um fator de inclinação de espectro; e corrigir a energia de alta frequência de acordo com o primeiro fator de correção.
[36] Com referência ao nono modo de implementação do segundo aspecto, em um décimo modo de implementação do segundo aspecto, a primeira subunidade de correção é configurada especificamente para: determinar o primeiro fator de correção de acordo com o período de intervalo, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico; e corrigir a energia de alta frequência de acordo com o primeiro fator de correção.
[37] Com referência ao nono modo de implementação do segundo aspecto, em um décimo primeiro modo de implementação do segundo aspecto, a primeira subunidade de correção é configurada especificamente para: determinar o primeiro fator de correção de acordo com o sinal decodificado de baixa frequência; e corrigir a energia de alta frequência de acordo com o primeiro fator de correção.
[38] Com referência ao nono modo de implementação do segundo aspecto, em um décimo segundo modo de implementação do segundo aspecto, a primeira subunidade de correção é configurada especificamente para: determinar o primeiro fator de correção de acordo com o período de intervalo, a contribuição do livro de código adaptável, a contribuição do livro de código algébrico e o sinal decodificado de baixa frequência; e corrigir a energia de alta frequência de acordo com o primeiro fator de correção.
[39] Com referência do nono ao décimo segundo modos de implementação do segundo aspecto, em um décimo terceiro modo de implementação do segundo aspecto, a unidade de extensão de largura de banda inclui adicionalmente: uma segunda subunidade de correção, configurada para corrigir a energia de alta frequência de acordo com o período de intervalo.
[40] Com referência do nono ao décimo terceiro modos de implementação do segundo aspecto, em um décimo quarto modo de implementação do segundo aspecto, a unidade de extensão de largura de banda inclui adicionalmente: uma terceira subunidade de correção, configurada para determinar um segundo fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência, em que o segundo fator de correção inclui pelo menos um dentre um parâmetro de classificação e um tipo de sinal; e corrigir a energia de alta frequência e o sinal de excitação de banda alta de acordo com o segundo fator de correção.
[41] Com referência ao décimo quarto modo de implementação do segundo aspecto, em um décimo quinto modo de implementação do segundo aspecto, a terceira subunidade de correção é configurada especificamente para: determinar o segundo fator de correção de acordo com o parâmetro de extensão de largura de banda; e corrigir a energia de alta frequência e o sinal de excitação de banda alta de acordo com o segundo fator de correção.
[42] Com referência ao décimo quarto modo de implementação do segundo aspecto, em um décimo sexto modo de implementação do segundo aspecto, a terceira subunidade de correção é configurada especificamente para: determinar o segundo fator de correção de acordo com o sinal decodificado de baixa frequência; e corrigir a energia de alta frequência e o sinal de excitação de banda alta de acordo com o segundo fator de correção.
[43] Com referência ao décimo quarto modo de implementação do segundo aspecto, em um décimo sétimo modo de implementação do segundo aspecto, a terceira subunidade de correção é configurada especificamente para: determinar o segundo fator de correção de acordo com o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência; e corrigir a energia de alta frequência e o sinal de excitação de banda alta de acordo com o segundo fator de correção.
[44] Com referência do nono ao décimo sétimo modos de implementação do segundo aspecto, em um décimo oitavo modo de implementação do segundo aspecto, a unidade de extensão de largura de banda inclui adicionalmente: uma subunidade de ponderação, configurada para ponderar o sinal previsto de excitação de banda alta e um sinal de ruído aleatório, para obter um sinal final de excitação de banda alta, em que um peso da ponderação é determinado de acordo com um valor de um parâmetro de classificação e/ou um fator de voz do sinal decodificado de baixa frequência.
[45] Com referência do primeiro ao décimo oitavo modos de implementação do segundo aspecto, em um décimo nono modo de implementação do segundo aspecto, a subunidade de síntese é configurada especificamente para: sintetizar a energia de alta frequência e o sinal de excitação de banda alta, para obter o sinal de banda de alta frequência; ou sintetizar a energia de alta frequência, o sinal de excitação de banda alta e um LPC previsto, para obter o sinal de banda de alta frequência, em que o LPC previsto inclui um LPC previsto de banda de alta frequência ou um LPC previsto de banda larga e o LPC previsto é obtido com base no LPC.
[46] Nas modalidades da presente invenção, é realizada a extensão de largura de banda, com o uso de um parâmetro de extensão de largura de banda e com o uso do parâmetro de extensão de largura de banda, em um sinal decodificado de baixa frequência, recuperando, desse modo, um sinal de banda de alta frequência. O sinal de banda de alta frequência recuperado com o uso do método e do aparelho de extensão de largura de banda nas modalidades da presente invenção está próximo a um sinal de banda de alta frequência original, e a qualidade é satisfatória.
BREVE DESCRIÇÃO DOS DESENHOS
[47] Para descrever as soluções técnicas nas modalidades da presente invenção mais claramente, o seguinte introduz brevemente os desenhos anexos exigidos para descrever as modalidades da presente invenção. Aparentemente, os desenhos anexos na descrição a seguir mostram meramente algumas modalidades da presente invenção, e uma pessoa de habilidade comum na técnica ainda pode derivar outros desenhos a partir desses desenhos anexos sem esforços criativos.
[48] A Figura 1 é um fluxograma de um método de extensão de largura de banda de acordo com uma modalidade da presente invenção;
[49] A Figura 2 é um diagrama de blocos de uma implementação de um método de extensão de largura de banda de acordo com uma modalidade da presente invenção;
[50] A Figura 3 é um diagrama de blocos de uma implementação de um método de extensão de largura de banda em um domínio de tempo e um domínio de frequência de acordo com uma modalidade da presente invenção;
[51] A Figura 4 é um diagrama de blocos de uma implementação de um método de extensão de largura de banda em um domínio de frequência de acordo com uma modalidade da presente invenção;
[52] A Figura 5 é um diagrama de blocos de uma implementação de um método de extensão de largura de banda em um domínio de tempo de acordo com uma modalidade da presente invenção;
[53] A Figura 6 é um diagrama estrutural esquemático de um aparelho de extensão de largura de banda de acordo com uma modalidade da presente invenção;
[54] A Figura 7 é um diagrama estrutural esquemático de uma unidade de extensão de largura de banda em um aparelho de extensão de largura de banda de acordo com uma modalidade da presente invenção;
[55] A Figura 8 é um diagrama estrutural esquemático de uma unidade de extensão de largura de banda em um aparelho de extensão de largura de banda de acordo com outra modalidade da presente invenção;
[56] A Figura 9 é um diagrama estrutural esquemático de uma unidade de extensão de largura de banda em um aparelho de extensão de largura de banda de acordo com outra modalidade da presente invenção;
[57] A Figura 10 é um diagrama estrutural esquemático de uma unidade de extensão de largura de banda em um aparelho de extensão de largura de banda de acordo com outra modalidade da presente invenção;
[58] A Figura 11 é um diagrama estrutural esquemático de uma unidade de extensão de largura de banda em um aparelho de extensão de largura de banda de acordo com outra modalidade da presente invenção; e
[59] A Figura 12 é um diagrama estrutural esquemático de um decodificador de acordo com uma modalidade da presente invenção.
DESCRIÇÃO DAS MODALIDADES
[60] O seguinte descreve claramente as soluções técnicas nas modalidades da presente invenção com referência aos desenhos anexos nas modalidades da presente invenção. Aparentemente, as modalidades descritas são algumas, mas não todas as modalidades da presente invenção. Todas as outras modalidades obtidas por indivíduos de habilidade comum na técnica com base nas modalidades da presente invenção sem esforços criativos devem ser abrangidas pelo escopo de proteção da presente invenção.
[61] Nas modalidades da presente invenção, a extensão de largura de banda é realizada em um sinal de baixa frequência de acordo com qualquer um dentre uma combinação de alguns dentre uma taxa de decodificação, um coeficiente LPC (um parâmetro de LSF) e um período de intervalo que são obtidos decodificando-se diretamente um fluxo de códigos, uma contribuição do livro de código adaptável e uma contribuição do livro de código algébrico que são obtidos por decodificação intermediária, e um sinal de baixa frequência obtido por decodificação final, recuperando, desse modo, um sinal de banda de alta frequência.
[62] O seguinte descreve em detalhes um método de extensão de largura de banda de acordo com uma modalidade da presente invenção com referência à Figura 1, que pode incluir as etapas a seguir.
[63] S11: Um decodificador adquire um parâmetro de extensão de largura de banda, em que o parâmetro de extensão de largura de banda inclui um ou mais dos seguintes parâmetros: um coeficiente de previsão linear (LPC), um parâmetro de frequência espectral em linha (LSF), um período de intervalo, uma contribuição do livro de código adaptável e uma contribuição do livro de código algébrico; e
[64] O decodificador pode estar disposto em um dispositivo de hardware como um telefone móvel, um computador do tipo tablet, um computador, um aparelho de televisão, um conversor ou um console de jogo no qual uma operação de decodificação precisa ser realizada, e funcionar sob o controle de processadores nesses dispositivos de hardware. O decodificador também pode ser um dispositivo de hardware independente, em que o dispositivo de hardware inclui um processador e o dispositivo de hardware funciona sob o controle do processador.
[65] Especificamente, o LPC é um coeficiente de um filtro de previsão linear e o filtro de previsão linear pode descrever um recurso básico de um modelo de canal de som e o LPC também reflete uma tendência de mudança de energia de um sinal em um domínio de frequência. O parâmetro de LSF é um modo de representação do domínio de frequência do LPC.
[66] Adicionalmente, quando uma pessoa produz um som de voz, um fluxo de ar atravessa uma glote, e faz as cordas vocais produzirem uma vibração oscilatória de relaxamento, criando, desse modo, um fluxo de ar de pulso quase periódico. Esse fluxo de ar excita um canal de som e, então, o som de voz é produzido, o que também é referido como uma fala de voz. A fala de voz carrega a maior parte da energia em uma fala. Tal frequência na qual as cordas vocais vibram é referida como uma frequência fundamental, e um período correspondente é referido como o período de intervalo.
[67] A taxa de decodificação se refere a que, em um algoritmo de codificação de fala, tanto a codificação quanto a decodificação são processados de acordo com uma taxa (uma taxa de bits) que é definida de antemão, e para diferentes taxas de decodificação, modos ou parâmetros de processamento podem ser diferentes.
[68] A contribuição do livro de código adaptável é uma porção quase periódica em um sinal residual após um sinal de fala ser analisado com o uso do LPC. A contribuição do livro de código algébrico se refere a uma porção de quase ruído no sinal residual após o sinal de fala ser analisado com o uso do LPC.
[69] No presente documento, o LPC e o parâmetro de LSF podem ser obtidos decodificando-se diretamente o fluxo de códigos; a contribuição do livro de código adaptável e a contribuição do livro de código algébrico podem ser combinados para obter um sinal de excitação de baixa frequência.
[70] A contribuição do livro de código adaptável reflete um constituinte quase periódico do sinal, e a contribuição do livro de código algébrico reflete um constituinte de quase ruído do sinal.
[71] S12: O decodificador realiza, de acordo com o parâmetro de extensão de largura de banda, extensão de largura de banda em um sinal decodificado de baixa frequência, para obter um sinal de banda de alta frequência.
[72] Por exemplo, primeiro, a energia de alta frequência e um sinal de excitação de banda alta são previstos de acordo com o parâmetro de extensão de largura de banda, em que a energia de alta frequência pode incluir um envelope de alta frequência ou um ganho de alta frequência; então, o sinal de banda de alta frequência é obtido de acordo com a energia de alta frequência e o sinal de excitação de banda alta.
[73] Adicionalmente, para uma diferença entre um domínio de tempo e um domínio de frequência, o parâmetro de extensão de largura de banda envolvido na previsão da energia de alta frequência ou o sinal de excitação de banda alta pode ser diferente.
[74] Se a extensão de largura de banda for realizada no domínio de tempo e no domínio de frequência, a previsão de energia de alta frequência e um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda pode incluir: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta de acordo com o parâmetro de LSF, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico. Adicionalmente, o sinal de excitação de banda alta pode ser previsto adicionalmente de modo adaptável de acordo com a taxa de decodificação, o parâmetro de LSF, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[75] Opcionalmente, se a extensão de largura de banda for realizada no domínio de tempo, a previsão de energia de alta frequência e um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda pode incluir: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta de acordo com a contribuição do livro de código adaptável e a contribuição do livro de código algébrico. Adicionalmente, o sinal de excitação de banda alta pode ser previsto adicionalmente de modo adaptável de acordo com a taxa de decodificação, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[76] Opcionalmente, se a extensão de largura de banda for realizada no domínio de frequência, a previsão de energia de alta frequência e um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda pode incluir: prever o envelope de alta frequência de acordo com o sinal decodificado de baixa frequência; e prever o sinal de excitação de banda alta de acordo com o sinal decodificado de baixa frequência ou um sinal de excitação de baixa frequência. No presente documento, o sinal de excitação de baixa frequência é a soma da contribuição do livro de código adaptável e da contribuição do livro de código algébrico. Adicionalmente, o sinal de excitação de banda alta também pode ser previsto de acordo com a taxa de decodificação e o sinal decodificado de baixa frequência; ou o sinal de excitação de banda alta também pode ser previsto de acordo com a taxa de decodificação e o sinal de excitação de baixa frequência.
[77] Além disso, após a previsão de energia de alta frequência e um sinal de excitação de banda alta de acordo o parâmetro de extensão de largura de banda, o método de extensão de largura de banda nessa modalidade da presente invenção pode incluir adicionalmente: determinar um primeiro fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência, em que o primeiro fator de correção inclui um ou mais dos seguintes parâmetros: um fator de voz, um fator de portão de ruído e um fator de inclinação de espectro; e corrigir a energia de alta frequência de acordo com o primeiro fator de correção. Por exemplo, o fator de voz ou o fator de portão de ruído podem ser determinados de acordo com o parâmetro de extensão de largura de banda, e o fator de inclinação de espectro pode ser determinado de acordo com o sinal decodificado de baixa frequência.
[78] A determinação de um primeiro fator de correção de acordo com o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência pode incluir: determinar o primeiro fator de correção de acordo com o sinal decodificado de baixa frequência; ou, determinar o primeiro fator de correção de acordo com o período de intervalo, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico; ou, determinar o primeiro fator de correção de acordo com o período de intervalo, a contribuição do livro de código adaptável, a contribuição do livro de código algébrico e o sinal decodificado de baixa frequência.
[79] Além disso, o método de extensão de largura de banda nessa modalidade da presente invenção pode incluir adicionalmente: corrigir a energia de alta frequência de acordo com o período de intervalo.
[80] Adicionalmente, o método de extensão de largura de banda nessa modalidade da presente invenção pode incluir adicionalmente: determinar um segundo fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência, em que o segundo fator de correção inclui pelo menos um dentre um parâmetro de classificação e um tipo de sinal; e corrigir a energia de alta frequência e o sinal de excitação de banda alta de acordo com o segundo fator de correção.
[81] Especificamente, a determinação de um segundo fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência pode incluir: determinar o segundo fator de correção de acordo com o parâmetro de extensão de largura de banda; ou, determinar o segundo fator de correção de acordo com o sinal decodificado de baixa frequência; ou, determinar o segundo fator de correção de acordo com o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência.
[82] Além disso, o método de extensão de largura de banda nessa modalidade da presente invenção pode incluir adicionalmente: corrigir o sinal de excitação de banda alta de acordo com um sinal de ruído aleatório e a taxa de decodificação.
[83] Além disso, a obtenção do sinal de banda de alta frequência de acordo com a energia de alta frequência e o sinal de excitação de banda alta pode incluir: sintetizar a energia de alta frequência e o sinal de excitação de banda alta, para obter o sinal de banda de alta frequência; ou sintetizar a energia de alta frequência, o sinal de excitação de banda alta e um LPC previsto, para obter o sinal de banda de alta frequência, em que o LPC previsto inclui um LPC previsto de banda de alta frequência ou um LPC previsto de banda larga e o LPC previsto é obtido com base no LPC. A "banda larga" no LPC de banda larga no presente documento inclui uma banda de baixa frequência e uma banda de alta frequência.
[84] Pode ser visto a partir do supracitado que, nessa modalidade da presente invenção, é realizada extensão de largura de banda, com o uso de um parâmetro de extensão de largura de banda, em um sinal decodificado de baixa frequência, recuperando, desse modo, um sinal de banda de alta frequência. O sinal de banda de alta frequência recuperado com o uso do método de extensão de largura de banda nessa modalidade da presente invenção está próximo a um sinal de banda de alta frequência original, e a qualidade é satisfatória.
[85] Ou seja, no método de extensão de largura de banda nessa modalidade da presente invenção, a energia de alta frequência é prevista com o uso completo de um parâmetro de baixa frequência obtido por codificação direta de um fluxo de códigos, um parâmetro decodificado intermediário, ou o sinal de baixa frequência obtido por decodificação final; um sinal de excitação de banda alta é previsto de modo adaptável de acordo com um sinal de excitação de baixa frequência, para que o sinal de banda de alta frequência que é finalmente produzido esteja próximo ao sinal de banda de alta frequência original, melhorando, desse modo, a qualidade do sinal produzido.
[86] O seguinte descreve modalidades específicas da presente invenção em detalhes com referência aos desenhos anexos.
[87] Primeiramente, a Figura 2 mostra um fluxograma esquemático de um método de extensão de largura de banda de acordo com uma modalidade da presente invenção.
[88] Conforme mostrado na Figura 2, primeiro, qualquer um dentre ou uma combinação de alguns dentre um fator de voz, um fator de portão de ruído, um fator de inclinação de espectro e um valor de um parâmetro de classificação é calculado de acordo com qualquer um dentre ou uma combinação de alguns dentre uma taxa de decodificação, um LPC (ou um parâmetro de LSF) e um período de intervalo que são obtidos por decodificação direta de um fluxo de códigos, parâmetros como uma contribuição do livro de código adaptável e uma contribuição do livro de código algébrico que são obtidos por decodificação intermediária e um sinal de baixa frequência obtido por decodificação final. O fator de voz é uma razão entre a contribuição do livro de código adaptável e a contribuição do livro de código algébrico, o fator de portão de ruído é um parâmetro usado para representar a magnitude de um ruído de plano de fundo de sinal, e o fator de inclinação de espectro é usado para representar um grau de inclinação de espectro de sinal ou uma tendência de mudança de energia de um sinal entre diferentes bandas de frequências, em que o parâmetro de classificação é um parâmetro usado para diferenciar tipos de sinal. Depois disso, um LPC de banda de alta frequência ou um LPC de banda larga, energia de alta frequência (por exemplo, um ganho de alta frequência ou um envelope de alta frequência) e um sinal de excitação de banda alta são previstos. Finalmente, um sinal de banda de alta frequência é sintetizado com o uso da energia de alta frequência prevista e o sinal de excitação de banda alta, ou com o uso da energia de alta frequência prevista e do sinal de excitação de banda alta e o LPC previsto.
[89] Especificamente, o LPC de banda de alta frequência ou o LPC de banda larga podem ser previstos de acordo com o LPC obtido por decodificação.
[90] O envelope de alta frequência ou o ganho de alta frequência podem ser previstos do seguinte modo:
[91] Por exemplo, o ganho de alta frequência ou o envelope de alta frequência é previsto com o uso do LPC previsto e o LPC obtido por decodificação, ou uma relação entre frequências alta e baixa do sinal decodificado de baixa frequência.
[92] Alternativamente, por exemplo, para diferentes tipos de sinal, diferentes fatores de correção são calculados para corrigir o ganho de alta frequência ou o envelope de alta frequência previstos. Por exemplo, o envelope de alta frequência ou o ganho de alta frequência previstos podem ser corrigidos com o uso de um valor ponderado ou valores ponderados de qualquer um ou alguns dentre o parâmetro de classificação, o fator de inclinação de espectro, o fator de voz e o fator de portão de ruído do sinal decodificado de baixa frequência. Alternativamente, para um sinal cujo período de intervalo é estável, o envelope de alta frequência previsto pode ser corrigido adicionalmente com o uso do período de intervalo.
[93] O sinal de excitação de banda alta pode ser previsto do modo a seguir:
[94] Por exemplo, para diferentes taxas de decodificação ou diferentes tipos de sinais, são previstos sinais de excitação de banda alta selecionando-se de modo adaptável sinais de baixa frequência com diferentes bandas de frequências e obtidos por decodificação, ou com o uso de diferentes algoritmos de previsão.
[95] Adicionalmente, o sinal previsto de excitação de banda alta e um sinal de ruído aleatório são ponderados, para obter um sinal final de excitação de banda alta, em que um peso é determinado de acordo com o valor do parâmetro de classificação e/ou o fator de voz do sinal decodificado de baixa frequência.
[96] Finalmente, o sinal de banda de alta frequência é sintetizado com o uso da energia de alta frequência prevista e o sinal de excitação de banda alta, ou com o uso da energia de alta frequência prevista e do sinal de excitação de banda alta e o LPC previsto.
[97] Pode ser visto a partir do supracitado que, no método de extensão de largura de banda nessa modalidade da presente invenção, a energia de alta frequência é prevista com o uso completo de um parâmetro de baixa frequência obtido por codificação direta de um fluxo de códigos, um parâmetro decodificado intermediário, ou um sinal de baixa frequência obtido por decodificação final; um sinal de excitação de banda alta é previsto de modo adaptável de acordo com um sinal de excitação de baixa frequência, para que um sinal de banda de alta frequência que é finalmente produzido esteja próximo a um sinal de banda de alta frequência original, melhorando, desse modo, a qualidade do sinal produzido.
[98] Para uma diferença entre um domínio de tempo e um domínio de frequência, um processo de implementação específico do método de extensão de largura de banda nessa modalidade da presente invenção pode variar. O seguinte descreve separadamente as modalidades específicas para o domínio de tempo e o domínio de frequência, para o domínio de frequência e para o domínio de tempo com referência da Figura 3 à Figura 5.
[99] Conforme mostrado na Figura 3, em um processo de implementação específico de realização de extensão de largura de banda em um domínio de tempo e um domínio de frequência:
[100] Primeiro, um LPC de banda larga é previsto de acordo com um LPC obtido por decodificação.
[101] Depois disso, um ganho de alta frequência é previsto com o uso de uma relação entre o LPC previsto de banda larga e o LPC obtido por decodificação. Além disso, para diferentes tipos de sinal, diferentes fatores de correção são calculados para corrigir o ganho de alta frequência previsto. Por exemplo, o ganho de alta frequência previsto é corrigido com o uso de um parâmetro de classificação, um fator de inclinação de espectro, um fator de voz e um fator de portão de ruído de um sinal decodificado de baixa frequência. Um ganho de alta frequência corrigido é proporcional a um fator de portão de ruído mínimo ng_min, proporcional a um valor fmerit do parâmetro de classificação, proporcional a um número oposto do fator de inclinação de espectro tilt e inversamente proporcional ao fator de voz voice_fac. Nesse caso, um ganho de alta frequência maior indica um fator de inclinação de espectro menor; um ruído de plano de fundo mais alto indica um fator de portão de ruído maior; uma característica de fala mais forte indica um valor maior do parâmetro de classificação. Por exemplo, o ganho de alta frequência corrigido = gain * (1-tilt) * fmerit * (30+ng_min) * (1.6-voice_fac). No presente documento, um fator de portão de ruído avaliado em cada quadro precisa ser comparado a um dado limiar; portanto, quando o fator de portão de ruído avaliado em cada quadro for menor que o dado limiar, o fator de portão de ruído mínimo é igual ao fator de portão de ruído avaliado em cada quadro; de outro modo, o fator de portão de ruído mínimo é igual ao dado limiar.
[102] Além disso, para diferentes taxas de decodificação ou diferentes tipos de sinais, são previstos sinais de excitação de banda alta selecionando-se de modo adaptável sinais de baixa frequência com diferentes bandas de frequências e obtidos por decodificação, ou com o uso de diferentes algoritmos de previsão. Por exemplo, quando uma taxa de decodificação for maior que um dado valor, um sinal de excitação de baixa frequência (a soma da contribuição do livro de código adaptável e da contribuição do livro de código algébrico) com uma banda de frequência adjacente ao sinal de banda de alta frequência é usado como o sinal de excitação de banda alta; de outro modo, um sinal com uma banda de frequência cuja qualidade de codificação é melhor (ou seja, um valor de diferença entre parâmetros de LSF é menor) é selecionado de modo adaptável a partir de sinais de excitação de baixa frequência como o sinal de excitação de banda alta com o uso do valor de diferença entre os parâmetros de LSF. Pode ser entendido que diferentes decodificadores podem selecionar diferentes valores dados. Por exemplo, um codec de banda larga com múltiplas taxas adaptáveis (AMR-WB) suporta taxas de decodificação como 12,65 kbps, 15,85 kbps, 18,25 kbps, 19,85 kbps, 23,05 kbps e 23,85 kbps, e, então, o codec AMR-WB pode selecionar 19,85 kbps como o dado valor.
[103] Um parâmetro de ISF (o parâmetro de ISF é um grupo de números, e é o mesmo que uma ordem e um coeficiente LPC) é um modo de representação de um domínio de frequência do coeficiente LPC e reflete uma mudança de energia de um sinal de fala/áudio no domínio de frequência. Um valor da ISF corresponde aproximadamente a toda uma banda de frequência proveniente de uma baixa frequência a uma alta frequência do sinal de fala/áudio, e cada valor do parâmetro de ISF corresponde a um valor de frequência correspondente.
[104] Em uma modalidade da presente invenção, em que um sinal com uma banda de frequência cuja qualidade de codificação é melhor (ou seja, um valor de diferença entre parâmetros de LSF é menor) é selecionado de modo adaptável a partir de sinais de excitação de baixa frequência como o sinal de excitação de banda alta com o uso do valor de diferença entre os parâmetros de LSF pode incluir: um valor de diferença entre cada dois parâmetros de LSF ser calculado, para obter um grupo de valores de diferença dos parâmetros de LSF; um valor de diferença mínimo é buscado, e um bin de frequência correspondente ao parâmetro de LSF é determinado de acordo com o valor de diferença mínimo; e um sinal de excitação de domínio de frequência com uma banda de frequência é selecionado a partir de sinais de excitação de domínio de frequência de acordo com o bin de frequência, e é usado como um sinal de excitação com uma banda de alta frequência. Existem múltiplos modos de seleção. Se o bin de frequência for F1, um sinal com uma banda de frequência de um comprimento necessário pode ser selecionado a partir de um pino de frequência F1-F, e é usado como o sinal de excitação de banda alta, em que F>=0, e o comprimento especificamente selecionado é determinado de acordo com a largura de banda e um recurso de sinal de um sinal de banda de alta frequência que precisa ser recuperado.
[105] Além disso, quando a banda de frequência cuja qualidade de codificação é melhor for selecionada de modo adaptável a partir dos sinais de excitação de baixa frequência, para um sinal de música ou um sinal de fala, um bin de frequência mínima de seleção de início diferente é selecionado. Por exemplo, para o sinal de fala, a seleção pode ser realizada de modo adaptável a partir de uma faixa de 2 a 6 kHz; para o sinal de música, a seleção pode ser realizada de modo adaptável a partir de uma faixa de 1 a 6 kHz. O sinal previsto de excitação de banda alta e um sinal de ruído aleatório podem ser adicionalmente ponderados, para obter um sinal final de excitação de banda alta, em que um peso da ponderação é determinado de acordo com um valor de um parâmetro de classificação e/ou um fator de voz do sinal decodificado de baixa frequência:
Figure img0001
em que exc [n] é o sinal previsto de excitação de banda alta, random [n] é o sinal de ruído aleatório, α é um peso do sinal previsto de excitação de banda alta, β é um peso do sinal de ruído aleatório, Yé um valor que é predefinido quando o peso do sinal previsto de excitação de banda alta for calculado para ser α, fmerit é o valor do parâmetro de classificação, e voice_fac é o fator de voz.
[106] É fácil entender que métodos de classificação de sinal são diferentes e, portanto, sinais de excitação de banda alta são previstos selecionando-se de modo adaptável sinais de baixa frequência com diferentes bandas de frequências e obtidos por decodificação ou com o uso de diferentes algoritmos de previsão. Por exemplo, os sinais podem ser classificados em sinais de fala e sinais de música, em que os sinais de fala podem ser classificados adicionalmente em sons surdos, sons sonoros e sons de transição. Alternativamente, os sinais podem ser classificados adicionalmente em sinais transitórios e sinais não transitórios e assim por diante.
[107] Finalmente, o sinal de banda de alta frequência é sintetizado com o uso do ganho de alta frequência previsto e o sinal de excitação de banda alta e o LPC previsto. O sinal de excitação de banda alta é corrigido com o uso do ganho de alta frequência previsto, e, então, um sinal corrigido de excitação de banda alta atravessa um filtro de síntese de LPC, para obter um sinal de banda de alta frequência que é finalmente, produzido; ou o sinal de excitação de banda alta atravessa um filtro de síntese de LPC, para obter um sinal de banda de alta frequência, e, então, o sinal de banda de alta frequência é corrigido com o uso do ganho de alta frequência, para obter um sinal de banda de alta frequência que é finalmente produzido. O filtro de síntese de LPC é um filtro linear, e, portanto, uma correção antes da síntese é a mesma que uma correção após a síntese. Ou seja, um resultado de correção do sinal de excitação de banda alta antes da síntese com o uso do ganho de alta frequência é o mesmo que um resultado de correção do sinal de excitação de banda alta após a síntese com o uso do ganho de alta frequência e, portanto, não existe ordem sequencial para correção.
[108] No presente documento, em um processo de síntese, o sinal de excitação de banda alta obtido do domínio de frequência é convertido no sinal de excitação de banda alta do domínio de tempo, o sinal de excitação de banda alta do domínio de tempo e o ganho de alta frequência do domínio de tempo são usados como entradas do filtro de síntese, e o coeficiente LPC previsto é usado como um coeficiente do filtro de síntese, que, desse modo, obtém o sinal de banda de alta frequência sintetizado.
[109] Pode ser visto a partir do supracitado que, no método de extensão de largura de banda nessa modalidade da presente invenção, a energia de alta frequência é prevista com o uso completo de um parâmetro de baixa frequência obtido por codificação direta de um fluxo de códigos, um parâmetro decodificado intermediário, ou um sinal de baixa frequência obtido por decodificação final; um sinal de excitação de banda alta é previsto de modo adaptável de acordo com um sinal de excitação de baixa frequência, para que um sinal de banda de alta frequência que é finalmente produzido esteja próximo a um sinal de banda de alta frequência original, melhorando, desse modo, a qualidade do sinal produzido.
[110] Conforme mostrado na Figura 4, em um processo de implementação específico de realização de extensão de largura de banda em um domínio de frequência:
[111] Primeiro, um LPC de banda de alta frequência é previsto de acordo com um LPC obtido por decodificação.
[112] Depois disso, um sinal de banda de alta frequência que precisa ser estendido é dividido em M sub-bandas, e envelopes de alta frequência das M sub-bandas são previstos. Por exemplo, N bandas de frequências adjacentes ao sinal de banda de alta frequência são selecionados a partir de um sinal decodificado de baixa frequência, a energia ou a amplitude das N bandas de frequências é calculada, e os envelopes de alta frequência das M sub-bandas são previstos de acordo com uma relação de tamanho entre a energia ou a amplitude das N bandas de frequências. No presente documento, M e N são, ambos, valores predefinidos. Por exemplo, o sinal de banda de alta frequência é dividido em M=2 sub-bandas, e N=2 ou 4 subbandas adjacentes ao sinal de banda de alta frequência são selecionados.
[113] Adicionalmente, os envelopes previstos de alta frequência são corrigidos com o uso de um parâmetro de classificação do sinal decodificado de baixa frequência, um período de intervalo, uma energia ou uma razão de amplitude entre frequências alta e baixa do sinal de baixa frequência, um fator de voz e um fator de portão de ruído. No presente documento, altas frequências e baixas frequências podem ser divididas de modo diferente para diferentes sinais de baixa frequência. Por exemplo, se a largura de banda de um sinal de baixa frequência for 6 kHz, de 0 a 3 kHz e de 3 a 6 kHz podem ser usados respectivamente como baixas frequências e altas frequências do sinal de baixa frequência, ou de 0 a 4 kHz e de 4 a 6 kHz podem ser usados respectivamente como baixas frequências e altas frequências do sinal de baixa frequência.
[114] Um envelope de alta frequência corrigido é proporcional a um fator de portão de ruído mínimo ng_min, proporcional a um valor fmerit do parâmetro de classificação, proporcional ao número oposto do fator de inclinação de espectro tilt e inversamente proporcional ao fator de voz voice_fac. Além disso, para um sinal cujo período de intervalo pitch é estável, um envelope de alta frequência corrigido é proporcional ao período de intervalo. Nesse caso, a energia de alta frequência maior indica um fator de inclinação de espectro menor; um ruído de plano de fundo mais alto indica um fator de portão de ruído maior; uma característica de fala mais forte indica um valor maior do parâmetro de classificação. Por exemplo, o envelope de alta frequência corrigido gain *= (1-tilt) * fmerit * (30+ng_min) * (1,6-voice_fac) * (pitch/100).
[115] Em seguida, quando a taxa de decodificação for maior ou igual a um dado limiar, uma banda de frequência de um sinal de baixa frequência adjacente ao sinal de banda de alta frequência é selecionada para prever um sinal de excitação de banda alta; ou, quando uma taxa de decodificação for menor que um dado limiar, uma sub-banda cuja qualidade de codificação é melhor é selecionada de modo adaptável para prever um sinal de excitação de banda alta. No presente documento, o dado limiar pode ser um valor empírico.
[116] Adicionalmente, o sinal previsto de excitação de banda alta é ponderado com o uso de um sinal de ruído aleatório, e um valor ponderado é determinado pelo parâmetro de classificação do sinal de baixa frequência. Um peso do sinal de ruído aleatório é proporcional a um tamanho de um parâmetro de classificação do sinal de baixa frequência:
Figure img0002
em que exc [n] é o sinal previsto de excitação de banda alta, random [n] é o sinal de ruído aleatório, α é um peso do sinal previsto de excitação de banda alta, β é o peso do sinal de ruído aleatório, Y é um valor que é predefinido quando o peso do sinal previsto de excitação de banda alta for calculado para ser α, e fmerit é um valor do parâmetro de classificação.
[117] Finalmente, o sinal de banda de alta frequência é sintetizado com o uso do envelope de alta frequência previsto e o sinal de excitação de banda alta.
[118] No presente documento, um processo de síntese pode multiplicar diretamente o sinal de excitação de banda alta do domínio de frequência pelo envelope de alta frequência do domínio de frequência, para obter o sinal de banda de alta frequência sintetizado.
[119] Pode ser visto a partir do supracitado que, no método de extensão de largura de banda nessa modalidade da presente invenção, a energia de alta frequência é prevista com o uso completo de um parâmetro de baixa frequência obtido por codificação direta de um fluxo de códigos, um parâmetro decodificado intermediário, ou um sinal de baixa frequência obtido por decodificação final; um sinal de excitação de banda alta é previsto de modo adaptável de acordo com um sinal de excitação de baixa frequência, para que um sinal de banda de alta frequência que é finalmente produzido esteja próximo a um sinal de banda de alta frequência original, melhorando, desse modo, a qualidade do sinal produzido.
[120] Conforme mostrado na Figura 5, em um processo de implementação específico de realização de extensão de largura de banda em um domínio de tempo:
[121] Primeiro, um LPC de banda larga é previsto de acordo com um LPC obtido por decodificação.
[122] Depois disso, um sinal de banda de alta frequência que precisa ser estendido é dividido em M subquadros, e ganhos de alta frequência dos M subquadros são previstos com o uso de uma relação entre o LPC previsto de banda larga e o LPC obtido por decodificação.
[123] Depois disso, um ganho de alta frequência de um subquadro atual é previsto com o uso de um sinal de baixa frequência ou um sinal de excitação de baixa frequência do subquadro atual ou um quadro atual.
[124] Adicionalmente, o ganho previsto de alta frequência é corrigido com o uso de um parâmetro de classificação do sinal decodificado de baixa frequência, um período de intervalo, uma energia ou uma razão de amplitude entre frequências alta e baixa do sinal de baixa frequência, um fator de voz e um fator de portão de ruído. Um ganho de alta frequência corrigido é proporcional a um fator de portão de ruído mínimo ng_min, proporcional a um valor fmerit do parâmetro de classificação, proporcional ao número oposto do fator de inclinação de espectro tilt e inversamente proporcional ao fator de voz voice_fac. Além disso, para um sinal cujo período de intervalo pitch é estável, um ganho de alta frequência corrigido é proporcional ao período de intervalo. Nesse caso, a energia de alta frequência maior indica um fator de inclinação de espectro menor; um ruído de plano de fundo mais alto indica um fator de portão de ruído maior; uma característica de fala mais forte indica um valor maior do parâmetro de classificação. Por exemplo, o ganho de alta frequência corrigido gain *= (1-tilt) * fmerit * (30+ng_min) * (1,6-voice_fac) * (pitch/100), em que tilt é o fator de inclinação de espectro, fmerit é o valor do parâmetro de classificação, ng_min é o fator de portão de ruído mínimo, voice_fac é o fator de voz e pitch é o período de intervalo.
[125] Em seguida, quando a taxa de decodificação for maior ou igual a um dado limiar, uma banda de frequência do sinal decodificado de baixa frequência adjacente ao sinal de banda de alta frequência é selecionada para prever um sinal de excitação de banda alta; ou, quando uma taxa de decodificação for menor que um dado limiar, faixa de frequência cuja qualidade de codificação é melhor é selecionada de modo adaptável para prever um sinal de excitação de banda alta. Ou seja, um sinal de excitação de baixa frequência (uma contribuição do livro de código adaptável e uma contribuição do livro de código algébrico) com uma banda de frequência adjacente ao sinal de banda de alta frequência pode ser usado como o sinal de excitação de banda alta.
[126] Adicionalmente, o sinal previsto de excitação de banda alta é ponderado com o uso de um sinal de ruído aleatório, e um valor ponderado é determinado pelo parâmetro de classificação do sinal de baixa frequência e um valor ponderado do fator de voz.
[127] Finalmente, o sinal de de banda alta frequência é sintetizado com o uso do ganho de alta frequência previsto e o sinal de excitação de banda alta e o LPC previsto.
[128] No presente documento, um processo de síntese pode ser usar o sinal de excitação de banda alta do domínio de tempo e o ganho de alta frequência do domínio de tempo como entradas de um filtro de síntese, e usar o LPC previsto coeficiente como um coeficiente do filtro de síntese, que, desse modo, obtém o sinal de banda de alta frequência sintetizado.
[129] Pode ser visto a partir do supracitado que, no método de extensão de largura de banda nessa modalidade da presente invenção, a energia de alta frequência é prevista com o uso completo de um parâmetro de baixa frequência obtido por codificação direta de um fluxo de códigos, um parâmetro decodificado intermediário, ou um sinal de baixa frequência obtido por decodificação final; um sinal de excitação de banda alta é previsto de modo adaptável de acordo com um sinal de excitação de baixa frequência, para que um sinal de banda de alta frequência que é finalmente produzido esteja próximo a um sinal de banda de alta frequência original, melhorando, desse modo, a qualidade do sinal produzido.
[130] Da Figura 6 à Figura 11 são mostrados diagramas estruturais esquemáticos de um aparelho de extensão de largura de banda de acordo com uma modalidade da presente invenção. Conforme mostrado na Figura 6, um aparelho de extensão de largura de banda 60 inclui uma unidade de aquisição 61 e uma unidade de extensão de largura de banda 62. A unidade de aquisição 61 é configurada para adquirir um parâmetro de extensão de largura de banda, em que o parâmetro de extensão de largura de banda inclui um ou mais dos seguintes parâmetros: um coeficiente de previsão linear (LPC), um parâmetro de frequência espectral em linha (LSF), um período de intervalo, uma taxa de decodificação, uma contribuição do livro de código adaptável e uma contribuição do livro de código algébrico. A unidade de extensão de largura de banda 62 é configurada para realizar, de acordo com o parâmetro de extensão de largura de banda adquirido pela unidade de aquisição 61, extensão de largura de banda em um sinal decodificado de baixa frequência, para obter um sinal de banda de alta frequência.
[131] Adicionalmente, conforme mostrado na Figura 7, a unidade de extensão de largura de banda 62 inclui uma subunidade de previsão 621 e uma subunidade de síntese 622. A subunidade de previsão 621 é configurada para prever energia de alta frequência e um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda. A subunidade de síntese 622 é configurada para obter o sinal de banda de alta frequência de acordo com a energia de alta frequência e o sinal de excitação de banda alta. Especificamente, a subunidade de síntese 622 é configurada para: sintetizar a energia de alta frequência e o sinal de excitação de banda alta, para obter o sinal de de banda alta frequência; ou sintetizar a energia de alta frequência, o sinal de excitação de banda alta e um LPC previsto, para obter o sinal de banda de alta frequência, em que o LPC previsto inclui um LPC previsto de banda de alta frequência ou um LPC previsto de banda larga e o LPC previsto é obtido com base no LPC.
[132] Especificamente, a energia de alta frequência inclui um ganho de alta frequência; e a subunidade de previsão 621 é configurada para: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta de acordo com o parâmetro de LSF, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[133] Alternativamente, a energia de alta frequência inclui um ganho de alta frequência; e a subunidade de previsão 621 é configurada para: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta de acordo com a taxa de decodificação, o parâmetro de LSF, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[134] Alternativamente, a energia de alta frequência inclui um ganho de alta frequência; e a subunidade de previsão 621 é configurada para: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta de acordo com a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[135] Alternativamente, a energia de alta frequência inclui um ganho de alta frequência; e a subunidade de previsão 621 é configurada para: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta de acordo com a taxa de decodificação, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico.
[136] Alternativamente, a energia de alta frequência inclui um envelope de alta frequência; e a subunidade de previsão 621 é configurada para: prever o envelope de alta frequência de acordo com o sinal decodificado de baixa frequência; e prever o sinal de excitação de banda alta de acordo com o sinal decodificado de baixa frequência ou um sinal de excitação de baixa frequência, em que o sinal de excitação de baixa frequência é a soma da contribuição do livro de código adaptável e da contribuição do livro de código algébrico.
[137] Alternativamente, a energia de alta frequência inclui um envelope de alta frequência; a subunidade de previsão 621 é configurada para prever o envelope de alta frequência de acordo com o sinal decodificado de baixa frequência, e prever o sinal de excitação de banda alta de acordo com a taxa de decodificação e o sinal decodificado de baixa frequência.
[138] Alternativamente, a energia de alta frequência inclui um envelope de alta frequência; a subunidade de previsão 621 é configurada para prever o envelope de alta frequência de acordo com o sinal decodificado de baixa frequência, e prever o sinal de excitação de banda alta de acordo com a taxa de decodificação e o sinal de excitação de baixa frequência.
[139] Além disso, a unidade de extensão de largura de banda 62 inclui adicionalmente uma primeira subunidade de correção 623, conforme mostrado na Figura 8. A primeira subunidade de correção 26 é configurada para: após a energia de alta frequência e o sinal de excitação de banda alta serem previstos de acordo com o parâmetro de extensão de largura de banda, determinar um primeiro fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência; e corrigir a energia de alta frequência de acordo com o primeiro fator de correção, em que o primeiro fator de correção inclui um ou mais dos seguintes parâmetros: um fator de voz, um fator de portão de ruído e um fator de inclinação de espectro.
[140] Especificamente, a primeira subunidade de correção 623 é configurada para determinar o primeiro fator de correção de acordo com o período de intervalo, a contribuição do livro de código adaptável e a contribuição do livro de código algébrico; e corrigir a energia de alta frequência de acordo com o primeiro fator de correção. Alternativamente, a primeira subunidade de correção é configurada especificamente para: determinar o primeiro fator de correção de acordo com o sinal decodificado de baixa frequência; e corrigir a energia de alta frequência de acordo com o primeiro fator de correção. Alternativamente, a primeira subunidade de correção é configurada especificamente para: determinar o primeiro fator de correção de acordo com o período de intervalo, a contribuição do livro de código adaptável, a contribuição do livro de código algébrico e o sinal decodificado de baixa frequência; e corrigir a energia de alta frequência de acordo com o primeiro fator de correção.
[141] Além disso, a unidade de extensão de largura de banda 62 inclui adicionalmente uma segunda subunidade de correção 624, conforme mostrado na Figura 9, configurada para corrigir a energia de alta frequência de acordo com o período de intervalo.
[142] Além disso, a unidade de extensão de largura de banda 62 inclui adicionalmente uma terceira subunidade de correção 625, conforme mostrado na Figura 10, configurada para determinar um segundo fator de correção de acordo com pelo menos um dentre o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência, em que o segundo fator de correção inclui pelo menos um dentre um parâmetro de classificação e um tipo de sinal; e corrigir a energia de alta frequência e o sinal de excitação de banda alta de acordo com o segundo fator de correção.
[143] Especificamente, a terceira subunidade de correção 625 é configurada para determinar o segundo fator de correção de acordo com o parâmetro de extensão de largura de banda; e corrigir a energia de alta frequência e o sinal de excitação de banda alta de acordo com o segundo fator de correção. Alternativamente, a terceira subunidade de correção 625 é configurada para determinar o segundo fator de correção de acordo com o sinal decodificado de baixa frequência; e corrigir a energia de alta frequência e o sinal de excitação de banda alta de acordo com o segundo fator de correção. A terceira subunidade de correção 625 é configurada para determinar o segundo fator de correção de acordo com o parâmetro de extensão de largura de banda e o sinal decodificado de baixa frequência; e corrigir a energia de alta frequência e o sinal de excitação de banda alta de acordo com o segundo fator de correção.
[144] Adicionalmente, a unidade de extensão de largura de banda 62 inclui adicionalmente uma subunidade de ponderação 626, conforme mostrado na Figura 11, configurada para ponderar o sinal previsto de excitação de banda alta e um sinal de ruído aleatório, para obter um sinal final de excitação de banda alta, em que um peso de ponderação é determinado de acordo com um valor de um parâmetro de classificação e/ou um fator de voz do sinal decodificado de baixa frequência.
[145] Em uma modalidade da presente invenção, o aparelho extensão de largura de banda 60 pode incluir adicionalmente um processador, em que o processador é configurado para controlar unidades inclusas no aparelho extensão de largura de banda.
[146] Pode ser visto a partir do supracitado que o aparelho de extensão de largura de banda nessa modalidade da presente invenção prevê a energia de alta frequência com o uso completo de um parâmetro de baixa frequência obtido por codificação direta de um fluxo de códigos, um parâmetro decodificado intermediário, ou um sinal de baixa frequência obtido por decodificação final; prevê de modo adaptável um sinal de excitação de banda alta de acordo com um sinal de excitação de baixa frequência, para que um sinal de banda de alta frequência que é finalmente produzido esteja próximo a um sinal de banda de alta frequência original, melhorando, desse modo, a qualidade do sinal produzido.
[147] A Figura 12 mostra um diagrama estrutural esquemático de um decodificador 120 de acordo com uma modalidade da presente invenção. O decodificador 120 inclui um processador 121 e uma memória 122.
[148] O processador 121 implanta um método de extensão de largura de banda em uma modalidade da presente invenção. Ou seja, o processador 121 é configurado para: adquirir um parâmetro de extensão de largura de banda, em que o parâmetro de extensão de largura de banda inclui um ou mais dos seguintes parâmetros: um coeficiente de previsão linear (LPC), um parâmetro de frequência espectral em linha (LSF), um período de intervalo, uma taxa de decodificação, uma contribuição do livro de código adaptável e uma contribuição do livro de código algébrico; e realizar, de acordo com o parâmetro de extensão de largura de banda, a extensão de largura de banda em um sinal decodificado de baixa frequência, para obter um sinal de banda de alta frequência. A memória 122 é configurada para armazenar instruções a serem executadas pelo processador 121.
[149] Deve ser entendido que uma solução descrita em cada reivindicação da presente invenção também deve ser considerada como uma modalidade e é um recurso na reivindicação e pode ser combinada. Por exemplo, diferentes etapas de ramificação realizadas após as etapas de determinação na presente invenção podem ser usadas como modalidades diferentes.
[150] Uma pessoa de habilidade comum na técnica pode estar ciente que, em combinação com os exemplos descritos nas modalidades reveladas neste relatório descritivo, etapas de unidades e algoritmo podem ser implantadas por hardware eletrônico ou uma combinação de software de computador e hardware eletrônico. Se as funções são executadas por um hardware ou software depende de condições de limitação de modelo e pedidos particulares das soluções técnicas. Uma pessoa versada na técnica pode usar métodos diferentes para implantar as funções descritas para cada pedido particular, mas não se deve considerar que a implementação vai além de escopo da presente invenção.
[151] Pode ser claramente compreendido por uma pessoa versada na técnica que, para o propósito de uma descrição breve e conveniente, para um processo de trabalho detalhado do sistema, aparelho e unidade supracitados, pode ser feita referência a um processo correspondente nas modalidades dos métodos anteriormente mencionados, e os detalhes não são descritos novamente no presente documento.
[152] Em algumas modalidades fornecidas no pedido presente deve-se compreender que os sistema, aparelho e método revelados podem ser implantados de outras maneiras. Por exemplo, as modalidades de aparelho descritas são meramente exemplificativas. Por exemplo, a divisão de unidade é meramente uma divisão de função lógica e pode ser outra divisão em uma implementação real. Por exemplo, uma pluralidade de unidades ou componentes pode ser combinada ou integrada em outro sistema, ou algumas características podem ser ignoradas ou não realizadas. Além disso, os acoplamentos mútuos ou acoplamentos diretos ou conexões de comunicação exibidos ou discutidos podem ser implantados com o uso de algumas interfaces. Os acoplamentos indiretos ou conexões de comunicação entre os aparelhos ou unidades podem ser implantados em formas eletrônicas, mecânicas ou outras formas.
[153] As unidades descritas como partes separadas podem ou não serem separadas fisicamente, e as partes exibidas como unidades podem ou não serem unidades físicas, podem estar localizadas em uma posição, ou podem estar distribuídas em uma pluralidade de unidades de rede. Algumas ou todas as unidades podem ser selecionadas de acordo com necessidades reais para alcançar os objetivos das soluções das modalidades.
[154] Além disso, unidades funcionais nas modalidades da presente invenção podem ser integradas em uma unidade de processamento, ou cada das unidades pode existir fisicamente sozinha, ou duas ou mais unidades são integradas em uma unidade.
[155] Quando as funções são implementadas na forma de uma unidade funcional de software e vendida ou usada como um produto independente, as funções podem ser armazenadas em um meio de armazenamento legível pelo computador. Com base em uma tal compreensão, essencialmente as soluções técnicas da presente invenção, ou a parte que contribui para a técnica anterior, ou algumas das soluções técnicas podem ser implantadas em uma forma de um produto de software. O produto de software de computador é armazenado em um meio de armazenamento, e inclui algumas instruções para instruir um dispositivo de computador (que pode ser um computador pessoal, um servidor ou um dispositivo de rede) a executar todas ou algumas das etapas dos métodos descritos nas modalidades da presente invenção. O meio de armazenamento supracitado inclui: qualquer meio que possa armazenar um código de programa, tal qual uma unidade flash USB, um disco rígido removível, uma memória somente de leitura (ROM), uma memória de acesso aleatório (RAM), um disco magnético ou um disco óptico.
[156] As descrições mencionadas anteriormente são meramente modos de implementação específicos da presente invenção, porém, não se destinam a limitar o escopo de proteção da presente invenção. Qualquer variação ou substituição prontamente compreendida por uma pessoa versada na técnica abrangida pelo escopo técnico revelado na presente invenção deve ser abrangida pelo escopo de proteção da presente invenção. Portanto, o escopo de proteção da presente invenção deve ser submetido ao escopo de proteção das reivindicações.

Claims (10)

1. Método de extensão de largura de banda, CARACTERIZADO pelo fato de que compreende: adquirir (S11) um parâmetro de extensão de largura de banda, em que o parâmetro de extensão de largura de banda compreende os seguintes parâmetros: um coeficiente de previsão linear, LPC, parâmetros de frequência espectral em linha, LSF, uma contribuição do livro de código adaptável, e uma contribuição do livro de código algébrico; e realizar (S12), de acordo com o parâmetro de extensão de largura de banda, extensão de largura de banda em um sinal decodificado de baixa frequência, para obter um sinal de banda de alta frequência; em que a realização, de acordo com o parâmetro de extensão de largura de banda, de extensão de largura de banda em um sinal decodificado de baixa frequência, para obter um sinal de banda de alta frequência compreende: prever energia de alta frequência e um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda; e obter o sinal de alta frequência de acordo com a energia de alta frequência e com o sinal de excitação de banda alta; em que a energia de alta frequência é um ganho de alta frequência; e a previsão de energia de alta frequência e de um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda compreende: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta selecionando-se uma banda de frequência a partir de um sinal de excitação de baixa frequênica de acordo com a diferença de valores entre os parâmetros de LSF, em que o sinal de excitação de baixa frequênica é uma soma da contribuição do livro de código adaptável e da contribuição do livro de código algébrico.
2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que a previsão de modo adaptável do sinal de excitação de banda alta compreende: quando a taxa de decodificação não for maior que um dado valor, selecionar de modo adaptável um sinal com uma banda de frequência cuja qualidade de codificação é melhor a partir do sinal de excitação de baixa frequência como o sinal de excitação de banda alta usando-se a diferença de valores entre os parâmetros de LSF.
3. Método, de acordo com a reivindicação 1 ou 2, CARACTERIZADO pelo fato de que após a previsão de uma energia de alta frequência e de um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda, o método compreende adicionalmente: corrigir a energia de alta frequência usando um fator de inclinação de espectro do sinal decodificado de baixa frequência.
4. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que compreende adicionalmente: ponderar o sinal previsto de excitação de banda alta e um sinal de ruído aleatório, para obter um sinal final de excitação de banda alta, em que um peso da ponderação é determinado de acordo com um valor de um fator de voz do sinal decodificado de baixa frequência.
5. Método, de acordo com qualquer uma das reivindicações 1 a 4, CARACTERIZADO pelo fato de que a obtenção do sinal de banda de alta frequência de acordo com a energia de alta frequência e com o sinal de excitação de banda alta compreende: corrigir o sinal de excitação de banda alta usando o ganho previsto de alta frequência para obter um sinal corrigido de excitação de banda alta, e passar o sinal corrigido de excitação de banda alta através de um filtro de síntese de LPC para obter o sinal de alta frequência.
6. Aparelho de extensão de largura de banda, CARACTERIZADO pelo fato de que compreende: uma unidade de aquisição (61), configurada para adquirir um parâmetro de extensão de largura de banda, em que o parâmetro de extensão de largura de banda compreende os seguintes parâmetros: um coeficiente de previsão linear, LPC, parâmetros de frequência espectral em linha, LSF, uma contribuição do livro de código adaptável, e uma contribuição do livro de código algébrico; e uma unidade de extensão de largura de banda (62), configurada para realizar, de acordo com o parâmetro de extensão de largura de banda adquirido pela unidade de aquisição, extensão de largura de banda em um sinal decodificado de baixa frequência, para obter um sinal de banda de alta frequência; em que a unidade de extensão de largura de banda compreende: uma subunidade de previsão (621), configurada para prever energia de alta frequência e um sinal de excitação de banda alta de acordo com o parâmetro de extensão de largura de banda; e uma subunidade de síntese (622), configurada para obter o sinal de banda de alta frequência de acordo com a energia de alta frequência e com o sinal de excitação de banda alta; em que a energia de alta frequência é um ganho de alta frequência; e a subunidade de previsão (621) é configurada especificamente para: prever o ganho de alta frequência de acordo com o LPC; e prever de modo adaptável o sinal de excitação de banda alta selecionando-se uma banda de frequência a partir de um sinal de excitação de baixa frequência de acordo com a diferença de valores entre os parâmetros de LSF, em que o sinal de excitação de baixa frequência é uma soma da contribuição do livro de código adaptável e da contribuição do livro de código algébrico.
7. Aparelho, de acordo com a reivindicação 6, CARACTERIZADO pelo fato de que a subunidade de previsão (621) é configurada especificamente para: prever o ganho de alta frequência de acordo com o LPC; e quando uma taxa de decodificação não for maior que um dado valor, selecionar de modo adaptável um sinal com uma banda de frequência cuja qualidade de codificação é melhor a partir do sinal de excitação de baixa frequência como o sinal de excitação de banda alta usando-se a diferença de valores entre os parâmetros de LSF.
8. Aparelho, de acordo com a reivindicação 6 ou 7, CARACTERIZADO pelo fato de que a unidade de extensão de largura de banda (62) compreende adicionalmente: uma primeira subunidade de correção (623), configurada para: após a energia de alta frequência e o sinal de excitação de banda alta serem previstos de acordo com o parâmetro de extensão de largura de banda, corrigir a energia de alta frequência usando um fator de inclinação de espectro do sinal decodificado de baixa frequência.
9. Aparelho, de acordo com a reivindicação 6, CARACTERIZADO pelo fato de que a unidade de extensão de largura de banda (62) compreende adicionalmente: uma subunidade de ponderação (626), configurada para ponderar o sinal previsto de excitação de banda alta e um sinal de ruído aleatório, para obter um sinal final de excitação de banda alta, em que um peso da ponderação é determinado de acordo com o valor de um fator de voz do sinal decodificado de baixa frequência.
10. Aparelho, de acordo com qualquer uma das reivindicações 6 a 9, CARACTERIZADO pelo fato de que a subunidade de síntese (622) é configurada especificamente para: corrigir o sinal de excitação de banda alta usando o ganho previsto de alta frequência para obter um sinal corrigido de excitação de banda alta, e passar o sinal corrigido de excitação de banda alta através de um filtro de síntese de LPC para obter o sinal de banda de alta frequência.
BR112016005850-0A 2013-09-26 2014-04-15 método e aparelho de extensão de largura de banda BR112016005850B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310444398.3A CN104517610B (zh) 2013-09-26 2013-09-26 频带扩展的方法及装置
CN201310444398.3 2013-09-26
PCT/CN2014/075420 WO2015043161A1 (zh) 2013-09-26 2014-04-15 频带扩展的方法及装置

Publications (1)

Publication Number Publication Date
BR112016005850B1 true BR112016005850B1 (pt) 2020-12-08

Family

ID=52741937

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112016005850-0A BR112016005850B1 (pt) 2013-09-26 2014-04-15 método e aparelho de extensão de largura de banda

Country Status (11)

Country Link
US (2) US9666201B2 (pt)
EP (2) EP3611729B1 (pt)
JP (1) JP6423420B2 (pt)
KR (2) KR101893454B1 (pt)
CN (2) CN104517610B (pt)
BR (1) BR112016005850B1 (pt)
ES (2) ES2745289T3 (pt)
HK (1) HK1206140A1 (pt)
PL (1) PL3611729T3 (pt)
SG (1) SG11201601691RA (pt)
WO (1) WO2015043161A1 (pt)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103426441B (zh) 2012-05-18 2016-03-02 华为技术有限公司 检测基音周期的正确性的方法和装置
CN103928029B (zh) 2013-01-11 2017-02-08 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
CN104217727B (zh) 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
CN105761723B (zh) * 2013-09-26 2019-01-15 华为技术有限公司 一种高频激励信号预测方法及装置
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
AU2017219696B2 (en) 2016-02-17 2018-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
CN105869653B (zh) * 2016-05-31 2019-07-12 华为技术有限公司 话音信号处理方法和相关装置和系统
CN105959974B (zh) * 2016-06-14 2019-11-29 深圳市海思半导体有限公司 一种预测空口带宽的方法和装置
US10475457B2 (en) * 2017-07-03 2019-11-12 Qualcomm Incorporated Time-domain inter-channel prediction
CN108630212B (zh) * 2018-04-03 2021-05-07 湖南商学院 非盲带宽扩展中高频激励信号的感知重建方法与装置
WO2019213965A1 (zh) * 2018-05-11 2019-11-14 华为技术有限公司 语音信号的处理方法和移动设备
CN110660402B (zh) 2018-06-29 2022-03-29 华为技术有限公司 立体声信号编码过程中确定加权系数的方法和装置
CN109150399B (zh) * 2018-08-14 2021-04-13 Oppo广东移动通信有限公司 数据传输方法、装置、电子设备及计算机可读介质
CN115512709A (zh) * 2021-06-07 2022-12-23 炬芯科技股份有限公司 一种音频数据的处理方法、对应装置、设备和存储介质
CN113421584B (zh) * 2021-07-05 2023-06-23 平安科技(深圳)有限公司 音频降噪方法、装置、计算机设备及存储介质

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
US6199040B1 (en) * 1998-07-27 2001-03-06 Motorola, Inc. System and method for communicating a perceptually encoded speech spectrum signal
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US7469206B2 (en) * 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
EP1543307B1 (en) * 2002-09-19 2006-02-22 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
ES2295837T3 (es) * 2004-03-12 2008-04-16 Nokia Corporation Sistesis de una señal de audio monofonica sobre la base de una señal de audio multicanal codificada.
WO2006025313A1 (ja) * 2004-08-31 2006-03-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
EP1864281A1 (en) * 2005-04-01 2007-12-12 QUALCOMM Incorporated Systems, methods, and apparatus for highband burst suppression
PL1875463T3 (pl) 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia
CA2558595C (en) * 2005-09-02 2015-05-26 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
US20080300866A1 (en) * 2006-05-31 2008-12-04 Motorola, Inc. Method and system for creation and use of a wideband vocoder database for bandwidth extension of voice
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
CN101304261B (zh) * 2007-05-12 2011-11-09 华为技术有限公司 一种频带扩展的方法及装置
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
CN101620854B (zh) * 2008-06-30 2012-04-04 华为技术有限公司 频带扩展的方法、系统和设备
EP2176862B1 (en) * 2008-07-11 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing
ES2396927T3 (es) * 2008-07-11 2013-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para decodificar una señal de audio codificada
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
CN102044250B (zh) 2009-10-23 2012-06-27 华为技术有限公司 频带扩展方法及装置
CN102612712B (zh) * 2009-11-19 2014-03-12 瑞典爱立信有限公司 低频带音频信号的带宽扩展
WO2011062536A1 (en) * 2009-11-19 2011-05-26 Telefonaktiebolaget Lm Ericsson (Publ) Improved excitation signal bandwidth extension
JP5651980B2 (ja) * 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
KR20130088756A (ko) * 2010-06-21 2013-08-08 파나소닉 주식회사 복호 장치, 부호화 장치 및 이러한 방법
CN102339607A (zh) * 2010-07-16 2012-02-01 华为技术有限公司 一种频带扩展的方法和装置
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
US8924200B2 (en) 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9589568B2 (en) * 2011-02-08 2017-03-07 Lg Electronics Inc. Method and device for bandwidth extension
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
BR112014008376B1 (pt) * 2011-11-02 2021-01-05 Telefonaktiebolaget Lm Ericsson (Publ) codificação/decodificação de áudio baseada em uma representação eficaz de coeficientes autorregressivos
EP2791937B1 (en) * 2011-11-02 2016-06-08 Telefonaktiebolaget LM Ericsson (publ) Generation of a high band extension of a bandwidth extended audio signal
WO2013066244A1 (en) * 2011-11-03 2013-05-10 Telefonaktiebolaget L M Ericsson (Publ) Bandwidth extension of audio signals
US8666753B2 (en) * 2011-12-12 2014-03-04 Motorola Mobility Llc Apparatus and method for audio encoding
CN105469805B (zh) * 2012-03-01 2018-01-12 华为技术有限公司 一种语音频信号处理方法和装置
CN103928031B (zh) * 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
US9319510B2 (en) * 2013-02-15 2016-04-19 Qualcomm Incorporated Personalized bandwidth extension
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
CN105761723B (zh) * 2013-09-26 2019-01-15 华为技术有限公司 一种高频激励信号预测方法及装置
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
US9595269B2 (en) * 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry

Also Published As

Publication number Publication date
KR101893454B1 (ko) 2018-08-30
CN108172239A (zh) 2018-06-15
US9666201B2 (en) 2017-05-30
CN108172239B (zh) 2021-01-12
EP3038105B1 (en) 2019-06-26
SG11201601691RA (en) 2016-04-28
EP3038105A1 (en) 2016-06-29
US10186272B2 (en) 2019-01-22
HK1206140A1 (en) 2015-12-31
JP2016537662A (ja) 2016-12-01
JP6423420B2 (ja) 2018-11-14
KR101787711B1 (ko) 2017-11-15
ES2924905T3 (es) 2022-10-11
EP3038105A4 (en) 2016-08-31
US20160196829A1 (en) 2016-07-07
CN104517610B (zh) 2018-03-06
WO2015043161A1 (zh) 2015-04-02
EP3611729B1 (en) 2022-06-08
PL3611729T3 (pl) 2022-09-12
US20170213564A1 (en) 2017-07-27
KR20170117621A (ko) 2017-10-23
ES2745289T3 (es) 2020-02-28
CN104517610A (zh) 2015-04-15
EP3611729A1 (en) 2020-02-19
KR20160044025A (ko) 2016-04-22

Similar Documents

Publication Publication Date Title
BR112016005850B1 (pt) método e aparelho de extensão de largura de banda
US10490199B2 (en) Bandwidth extension audio decoding method and device for predicting spectral envelope
ES2391292T3 (es) Sistemas, procedimientos y aparato para la generación de una señal de excitación de banda alta
TWI352972B (en) Systems, methods, and apparatus for gain factor li
KR101092167B1 (ko) 피치-조정 및 비-피치-조정 코딩을 이용한 신호 인코딩
ES2358125T3 (es) Procedimiento y aparato para un filtrado de antidispersión de una señal ensanchada de excitación de predicción de velocidad de ancho de banda.
ES2777282T3 (es) Extensión de ancho de banda armónico de señales de audio
ES2687249T3 (es) Decisión no sonora/sonora para el procesamiento de la voz
BR112016030056B1 (pt) Aperfeiçoamento de classificação entre codificação de domínio de tempo e codificação de domínio de frequência
EP2954524B1 (en) Systems and methods of performing gain control
RU2637885C2 (ru) Способ и устройство предсказания сигнала возбуждения верхней полосы
KR101888030B1 (ko) 오디오 코딩 방법 및 장치
BR112015014956B1 (pt) Método de codificação de sinal de áudio, método de decodificação de sinal de áudio, aparelho de codificação de sinal de áudio e aparelho de decodificação de sinal de áudio
TWI353752B (en) Systems, methods, and apparatus for wideband encod

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B15K Others concerning applications: alteration of classification

Free format text: A CLASSIFICACAO ANTERIOR ERA: G10L 21/02

Ipc: G10L 21/038 (2013.01)

B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 15/04/2014, OBSERVADAS AS CONDICOES LEGAIS.