BR112016028375B1 - Método para processar sinal de fala/áudio e aparelho - Google Patents

Método para processar sinal de fala/áudio e aparelho Download PDF

Info

Publication number
BR112016028375B1
BR112016028375B1 BR112016028375-9A BR112016028375A BR112016028375B1 BR 112016028375 B1 BR112016028375 B1 BR 112016028375B1 BR 112016028375 A BR112016028375 A BR 112016028375A BR 112016028375 B1 BR112016028375 B1 BR 112016028375B1
Authority
BR
Brazil
Prior art keywords
value
speech
audio signal
sample
signal
Prior art date
Application number
BR112016028375-9A
Other languages
English (en)
Other versions
BR112016028375A2 (pt
Inventor
Zexin LIU
Lei Miao
Original Assignee
Huawei Technologies Co., Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co., Ltd filed Critical Huawei Technologies Co., Ltd
Publication of BR112016028375A2 publication Critical patent/BR112016028375A2/pt
Publication of BR112016028375B1 publication Critical patent/BR112016028375B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Telephone Function (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

MÉTODO PARA PROCESS AR SINAL DE FALA/ÁUD IO E APARELHO Trata-se de um método para reconstruir um componente de ruído de um sinal de fala/áudio e um aparelho. O método inclui: receber um fluxo de bits, e decodificar o fluxo de bits, para obter um sinal de fala/áudio (101); determinar um primeiro sinal de fala/áudio de acordo com o sinal de fala/áudio (102); determinar um símbolo de cada valor de amostra no primeiro sinal de fala/áudio e um valor de amplitude de cada valor de amostra no primeiro sinal de fala/áudio (103); determinar um comprimento de normalização adaptativo (104); determinar um valor de amplitude ajustado de cada valor de amostra de acordo com o comprimento de normalização adaptativo e o valor de amplitude de cada valor de amostra (105); e determinar um segundo sinal de fala/áudio de acordo com o símbolo de cada valor de amostra e o valor de amplitude ajustado de cada valor de amostra (106).

Description

[0001] Este pedido reivindica a prioridade do Pedido de Patente Chinês No. 201410242233.2, depositado junto à Repartição de Patentes chinesa em 3 de junho de 2014 e intitulado "METHOD FOR PROCESSING SPEECH/AUDIO SIGNAL AND APPARATUS", que está incorporado ao presente documento a título de referência em sua totalidade.
CAMPO DA TÉCNICA
[0002] A presente invenção refere-se ao campo de comunicações e, em particular, a um método para processar um sinal de fala/áudio e um aparelho.
ANTECEDENTES
[0003] Atualmente, para alcançar melhor qualidade de áudio, ao decodificar informações decodificadas de um sinal de fala/áudio, um dispositivo eletrônico reconstrói um componente de ruído de um sinal de fala/áudio obtido por meio de decodificação.
[0004] Atualmente, um dispositivo eletrônico reconstrói um componente de ruído de um sinal de fala/áudio geralmente adicionando-se um sinal de ruído aleatório ao sinal de fala/áudio. Especificamente, a adição ponderada é realizada no sinal de fala/áudio e no sinal de ruído aleatório, para obter um sinal após o componente de ruído do sinal de fala/áudio ser reconstruído. O sinal de fala/áudio pode ser um sinal de domínio de tempo, um sinal de domínio de frequência ou um sinal de excitação, ou pode ser um sinal de baixa frequência, um sinal de alta frequência ou similares.
[0005] Entretanto, o inventor conclui que, se o sinal de fala/áudio for um sinal que tem um início ou uma continuidade, esse método para reconstruir um componente de ruído de um sinal de fala/áudio resulta em que um sinal obtido após o componente de ruído do sinal de fala/áudio ser reconstruído tem um eco, o que, desse modo, afeta a qualidade auditiva do sinal obtido após o componente de ruído ser reconstruído.
SUMÁRIO
[0006] As modalidades da presente invenção fornecem um método para processar um sinal de fala/áudio e um aparelho, para que para um sinal de fala/áudio que tem um início ou uma continuidade, quando um componente de ruído do sinal de fala/áudio for reconstruído, um sinal obtido após o componente de ruído do sinal de fala/áudio ser reconstruído não tem um eco, o que, desse modo, melhora a qualidade auditiva do sinal obtido após o componente de ruído ser reconstruído.
[0007] De acordo com a primeiro aspecto, uma modalidade da presente invenção fornece um método para processar um sinal de fala/áudio, em que o método inclui: receber um fluxo de bits, e decodificar o fluxo de bits, para obter um sinal de fala/áudio; determinar um primeiro sinal de fala/áudio de acordo com o sinal de fala/áudio, em que o primeiro sinal de fala/áudio é um sinal, cujo componente de ruído precisa ser reconstruído, no sinal de fala/áudio; determinar um símbolo de cada valor de amostra no primeiro sinal de fala/áudio e um valor de amplitude de cada valor de amostra no primeiro sinal de fala/áudio; determinar um comprimento de normalização adaptativo; determinar um valor de amplitude ajustado de cada valor de amostra de acordo com o comprimento de normalização adaptativo e o valor de amplitude de cada valor de amostra; e determinar um segundo sinal de fala/áudio de acordo com o símbolo de cada valor de amostra e o valor de amplitude ajustado de cada valor de amostra, em que o segundo sinal de fala/áudio é um sinal obtido após o componente de ruído do primeiro sinal de fala/áudio ser reconstruído.
[0008] Com referência ao primeiro aspecto, em uma primeira maneira de implantação possível do primeiro aspecto, a determinação de um valor de amplitude ajustado de cada valor de amostra de acordo com o comprimento de normalização adaptativo e o valor de amplitude de cada valor de amostra inclui: calcular, de acordo com o valor de amplitude de cada valor de amostra e o comprimento de normalização adaptativo, um valor de amplitude médio que corresponde a cada valor de amostra, e determinar, de acordo com o valor de amplitude médio que corresponde a cada valor de amostra, um valor de distúrbio da amplitude que corresponde a cada valor de amostra; e calcular o valor de amplitude ajustado de cada valor de amostra de acordo com o valor de amplitude de cada valor de amostra e de acordo com o valor de distúrbio da amplitude que corresponde a cada valor de amostra.
[0009] Com referência à primeira maneira de implantação possível do primeiro aspecto, em uma segunda maneira de implantação possível do primeiro aspecto, o cálculo de, de acordo com o valor de amplitude de cada valor de amostra e o comprimento de normalização adaptativo, um valor de amplitude médio que corresponde a cada valor de amostra inclui: determinar, para cada valor de amostra e de acordo com o comprimento de normalização adaptativo, uma sub-banda à qual o valor de amostra pertence; e calcular um valor médio de valores de amplitude de todos os valores de amostra na sub-banda à qual o valor de amostra pertence, e usar o valor médio obtido por meio de cálculo como o valor de amplitude médio que corresponde ao valor de amostra.
[0010] Com referência à segunda maneira de implantação possível do primeiro aspecto, em uma terceira maneira de implantação possível do primeiro aspecto, a determinação, para cada valor de amostra e de acordo com o comprimento de normalização adaptativo, de uma sub-banda à qual o valor de amostra pertence inclui: realizar o agrupamento de sub-banda em todos os valores de amostra em uma ordem predefinida de acordo com o comprimento de normalização adaptativo; e, para cada valor de amostra, determinar uma subbanda que inclui o valor de amostra como a sub-banda à qual o valor de amostra pertence; ou para cada valor de amostra, determinar uma sub-banda que consiste em m valores de amostra antes do valor de amostra, o valor de amostra, e n valores de amostra após o valor de amostra como a sub-banda à qual o valor de amostra pertence, em que m e n dependem do comprimento de normalização adaptativo, m é um número inteiro não menor que 0, e n é um número inteiro não menor que 0.
[0011] Com referência à primeira maneira de implantação possível do primeiro aspecto e/ou à segunda maneira de implantação possível do primeiro aspecto e/ou à terceira maneira de implantação possível do primeiro aspecto, em uma quarta maneira de implantação possível do primeiro aspecto, o cálculo do valor de amplitude ajustado de cada valor de amostra de acordo com o valor de amplitude de cada valor de amostra e de acordo com o valor de distúrbio da amplitude que corresponde a cada valor de amostra inclui: subtrair o valor de distúrbio da amplitude que corresponde a cada valor de amostra do valor de amplitude de cada valor de amostra, para obter uma diferença entre o valor de amplitude de cada valor de amostra e o valor de distúrbio da amplitude que corresponde a cada valor de amostra, e usar a diferença obtida como o valor de amplitude ajustado de cada valor de amostra.
[0012] Com referência ao primeiro aspecto e/ou à primeira maneira de implantação possível do primeiro aspecto e/ou à segunda maneira de implantação possível do primeiro aspecto e/ou à terceira maneira de implantação possível do primeiro aspecto e/ou à quarta maneira de implantação possível do primeiro aspecto, em uma quinta maneira de implantação possível do primeiro aspecto, a determinação de um comprimento de normalização adaptativo inclui: dividir um sinal de banda de baixa frequência no sinal de fala/áudio nas N sub-bandas, em que N é um número natural; calcular uma razão de pico para média de cada sub-banda, e determinar uma quantidade de sub-bandas cujas razões de pico para média são maiores que um limiar predefinido da razão de pico para média; e calcular o comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio e a quantidade das sub-bandas.
[0013] Com referência à quinta maneira de implantação possível do primeiro aspecto, em uma sexta maneira de implantação possível do primeiro aspecto, o cálculo do comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio e uma quantidade das sub-bandas inclui: calcular o comprimento de normalização adaptativo de acordo com uma fórmula L = K + α xM, em que L é o comprimento de normalização adaptativo; K é um valor numérico que corresponde ao tipo de sinal do sinal de banda de alta frequência no sinal de fala/áudio, e diferentes tipos de sinal de sinais de banda de alta frequência correspondem a diferentes valores numéricos K; M é uma quantidade das sub-bandas cujas razões de pico para média são maiores que o limiar predefinido da razão de pico para média; e α é uma constante menor que 1.
[0014] Com referência ao primeiro aspecto e/ou à primeira maneira de implantação possível do primeiro aspecto e/ou à segunda maneira de implantação possível do primeiro aspecto e/ou à terceira maneira de implantação possível do primeiro aspecto e/ou à quarta maneira de implantação possível do primeiro aspecto, em uma sétima maneira de implantação possível do primeiro aspecto, a determinação de um comprimento de normalização adaptativo inclui: calcular uma razão de pico para média de um sinal de banda de baixa frequência no sinal de fala/áudio e uma razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência é menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência não for menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido, em que o primeiro valor de comprimento é maior que o segundo valor de comprimento; ou calcular uma razão de pico para média de um sinal de banda de baixa frequência no sinal de fala/áudio e uma razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando a razão de pico para média do sinal de banda de baixa frequência for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando a razão de pico para média do sinal de banda de baixa frequência não for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido; ou determinar o comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio, em que diferentes tipos de sinal dos sinais de banda de alta frequência correspondem a diferentes comprimentos de normalização adaptativos.
[0015] Com referência ao primeiro aspecto e/ou à primeira maneira de implantação possível do primeiro aspecto e/ou à segunda maneira de implantação possível do primeiro aspecto e/ou à terceira maneira de implantação possível do primeiro aspecto e/ou à quarta maneira de implantação possível do primeiro aspecto e/ou à quinta maneira de implantação possível do primeiro aspecto e/ou à sexta maneira de implantação possível do primeiro aspecto e/ou à sétima maneira de implantação possível do primeiro aspecto, em uma oitava maneira de implantação possível do primeiro aspecto, a determinação de a segundo sinal de fala/áudio de acordo com o símbolo de cada valor de amostra e o valor de amplitude ajustado de cada valor de amostra inclui: determinar um novo valor de cada valor de amostra de acordo com o símbolo e o valor de amplitude ajustado de cada valor de amostra, para obter o segundo sinal de fala/áudio; ou calcular um fator de modificação; realizar o processamento de modificação em um valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra de acordo com o fator de modificação; e determinar um novo valor de cada valor de amostra de acordo com o símbolo de cada valor de amostra e um valor de amplitude ajustado que é obtido após o processamento de modificação, para obter o segundo sinal de fala/áudio.
[0016] Com referência à oitava maneira de implantação possível do primeiro aspecto, em uma nona maneira de implantação possível do primeiro aspecto, o cálculo de a fator de modificação inclui: calcular o fator de modificação com o uso de uma fórmula β = a/L, em que β é o fator de modificação, L é o comprimento de normalização adaptativo, e a é uma constante maior que 1.
[0017] Com referência à oitava maneira de implantação possível do primeiro aspecto e/ou à nona maneira de implantação possível do primeiro aspecto, em uma décima maneira de implantação possível do primeiro aspecto, a realização de processamento de modificação em um valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra de acordo com o fator de modificação inclui: realizar o processamento de modificação no valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra com o uso da seguinte fórmula: Y = y x (b - β); ; em que Y é o valor de amplitude ajustado obtido após o processamento de modificação; y é o valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra; e b é uma constante, e 0 < b < 2.
[0018] De acordo com a segundo aspecto, uma modalidade da presente invenção fornece um aparelho para reconstruir um componente de ruído de um sinal de fala/áudio, que inclui: uma unidade de processamento do fluxo de bits, configurada para receber um fluxo de bits e decodificar o fluxo de bits, para obter um sinal de fala/áudio; uma unidade de determinação do sinal, configurada para determinar um primeiro sinal de fala/áudio de acordo com o sinal de fala/áudio obtido pela unidade de processamento do fluxo de bits, em que o primeiro sinal de fala/áudio é um sinal, cujo componente de ruído precisa ser reconstruído, no sinal de fala/áudio obtido por meio de decodificação; uma primeira unidade de determinação, configurada para determinar um símbolo de cada valor de amostra no primeiro sinal de fala/áudio determinado pela unidade de determinação do sinal e um valor de amplitude de cada valor de amostra no primeiro sinal de fala/áudio determinado pela unidade de determinação do sinal; uma segunda unidade de determinação, configurada para determinar um comprimento de normalização adaptativo; uma terceira unidade de determinação, configurada para determinar um valor de amplitude ajustado de cada valor de amostra de acordo com o comprimento de normalização adaptativo determinado pela segunda unidade de determinação e o valor de amplitude que é de cada valor de amostra e é determinado pela primeira unidade de determinação; e uma quarta unidade de determinação, configurada para determinar um segundo sinal de fala/áudio de acordo com o símbolo que é de cada valor de amostra e é determinado pela primeira unidade de determinação e o valor de amplitude ajustado que é de cada valor de amostra e é determinado pela terceira unidade de determinação, em que o segundo sinal de fala/áudio é um sinal obtido após o componente de ruído do primeiro sinal de fala/áudio é reconstruído.
[0019] Com referência ao segundo aspecto, em uma primeira maneira de implantação possível do segundo aspecto, a terceira unidade de determinação inclui: uma subunidade de determinação, configurada para calcular, de acordo com o valor de amplitude de cada valor de amostra e o comprimento de normalização adaptativo, um valor de amplitude médio que corresponde a cada valor de amostra, e determinar, de acordo com o valor de amplitude médio que corresponde a cada valor de amostra, um valor de distúrbio da amplitude que corresponde a cada valor de amostra; e uma unidade de cálculo do valor de amplitude ajustado, configurada para calcular o valor de amplitude ajustado de cada valor de amostra de acordo com o valor de amplitude de cada valor de amostra e de acordo com o valor de distúrbio da amplitude que corresponde a cada valor de amostra.
[0020] Com referência à primeira maneira de implantação possível do segundo aspecto, em uma segunda maneira de implantação possível do segundo aspecto, a subunidade de determinação inclui: um módulo de determinação, configurado para determinar, para cada valor de amostra e de acordo com o comprimento de normalização adaptativo, uma sub-banda à qual o valor de amostra pertence; e um módulo de cálculo, configurado para calcular um valor médio de valores de amplitude de todos os valores de amostra na sub-banda à qual o valor de amostra pertence, e usar o valor médio obtido por meio de cálculo como o valor de amplitude médio que corresponde ao valor de amostra.
[0021] Com referência à segunda maneira de implantação possível do segundo aspecto, em uma terceira maneira de implantação possível do segundo aspecto, o módulo de determinação é configurado especificamente para: realizar o agrupamento de sub-banda em todos os valores de amostra em uma ordem predefinida de acordo com o comprimento de normalização adaptativo; e, para cada valor de amostra, determinar uma subbanda que inclui o valor de amostra como a sub-banda à qual o valor de amostra pertence; ou para cada valor de amostra, determinar uma sub-banda que consiste em m valores de amostra antes do valor de amostra, o valor de amostra, e n valores de amostra após o valor de amostra como a sub-banda à qual o valor de amostra pertence, em que m e n dependem do comprimento de normalização adaptativo, m é um número inteiro não menor que 0, e n é um número inteiro não menor que 0.
[0022] Com referência à primeira maneira de implantação possível do segundo aspecto e/ou à segunda maneira de implantação possível do segundo aspecto e/ou à terceira maneira de implantação possível do segundo aspecto, em uma quarta maneira de implantação possível do segundo aspecto, a subunidade de cálculo do valor de amplitude ajustado é configurada especificamente para: subtrair o valor de distúrbio da amplitude que corresponde a cada valor de amostra do valor de amplitude de cada valor de amostra, para obter uma diferença entre o valor de amplitude de cada valor de amostra e o valor de distúrbio da amplitude que corresponde a cada valor de amostra, e usar a diferença obtida como o valor de amplitude ajustado de cada valor de amostra.
[0023] Com referência ao segundo aspecto e/ou à primeira maneira de implantação possível do segundo aspecto e/ou à segunda maneira de implantação possível do segundo aspecto e/ou à terceira maneira de implantação possível do segundo aspecto e/ou à quarta maneira de implantação possível do segundo aspecto, em uma quinta maneira de implantação possível do segundo aspecto, a segunda unidade de determinação inclui: uma subunidade de divisão, configurada para dividir um sinal de banda de baixa frequência no sinal de fala/áudio nas N sub-bandas, em que N é um número natural; uma subunidade de determinação de quantidade, configurada para calcular uma razão de pico para média de cada sub-banda, e determinar uma quantidade de sub-bandas cujas razões de pico para média são maiores que um limiar predefinido da razão de pico para média; e uma subunidade de cálculo de comprimento, configurada para calcular o comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio e a quantidade das sub-bandas.
[0024] Com referência à quinta maneira de implantação possível do segundo aspecto, em uma sexta maneira de implantação possível do segundo aspecto, a subunidade de cálculo de comprimento é configurada especificamente para: calcular o comprimento de normalização adaptativo de acordo com uma fórmula L = K + α xM, em que L é o comprimento de normalização adaptativo; K é um valor numérico que corresponde ao tipo de sinal do sinal de banda de alta frequência no sinal de fala/áudio, e diferentes tipos de sinal de sinais de banda de alta frequência correspondem a diferentes valores numéricos K; M é uma quantidade das sub-bandas cujas razões de pico para média são maiores que o limiar predefinido da razão de pico para média; e α é uma constante menor que 1.
[0025] Com referência ao segundo aspecto e/ou à primeira maneira de implantação possível do segundo aspecto e/ou à segunda maneira de implantação possível do segundo aspecto e/ou à terceira maneira de implantação possível do segundo aspecto e/ou à quarta maneira de implantação possível do segundo aspecto, em uma sétima maneira de implantação possível do segundo aspecto, a segunda unidade de determinação é configurada especificamente para: calcular uma razão de pico para média de um sinal de banda de baixa frequência no sinal de fala/áudio e uma razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência é menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência não for menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido, em que o primeiro valor de comprimento é maior que o segundo valor de comprimento; ou calcular uma razão de pico para média de um sinal de banda de baixa frequência no sinal de fala/áudio e uma razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando a razão de pico para média do sinal de banda de baixa frequência for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando a razão de pico para média do sinal de banda de baixa frequência não for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido; ou determinar o comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio, em que diferentes tipos de sinal dos sinais de banda de alta frequência correspondem a diferentes comprimentos de normalização adaptativos.
[0026] Com referência ao segundo aspecto e/ou à primeira maneira de implantação possível do segundo aspecto e/ou à segunda maneira de implantação possível do segundo aspecto e/ou à terceira maneira de implantação possível do segundo aspecto e/ou à quarta maneira de implantação possível do segundo aspecto e/ou à quinta maneira de implantação possível do segundo aspecto e/ou à sexta maneira de implantação possível do segundo aspecto e/ou à sétima maneira de implantação possível do segundo aspecto, em uma oitava maneira de implantação possível do segundo aspecto, a quarta unidade de determinação é configurada especificamente para: determinar um novo valor de cada valor de amostra de acordo com o símbolo e o valor de amplitude ajustado de cada valor de amostra, para obter o segundo sinal de fala/áudio; ou calcular um fator de modificação; realizar o processamento de modificação em um valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra de acordo com o fator de modificação; e determinar um novo valor de cada valor de amostra de acordo com o símbolo de cada valor de amostra e um valor de amplitude ajustado que é obtido após o processamento de modificação, para obter o segundo sinal de fala/áudio.
[0027] Com referência à oitava maneira de implantação possível do segundo aspecto, em uma nona maneira de implantação possível do segundo aspecto, a quarta unidade de determinação é configurada especificamente para calcular o fator de modificação com o uso de uma fórmula β = a/L, em que β é o fator de modificação, L é o comprimento de normalização adaptativo, e a é uma constante maior que 1.
[0028] Com referência à oitava maneira de implantação possível do segundo aspecto e/ou à nona maneira de implantação possível do segundo aspecto, em uma décima maneira de implantação possível do segundo aspecto, a quarta unidade de determinação é configurada especificamente para: realizar o processamento de modificação no valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra com o uso da seguinte fórmula: Y = y x (b - β); ; em que Y é o valor de amplitude ajustado obtido após o processamento de modificação; y é o valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra; e b é uma constante, e 0 < b < 2.
[0029] Nas modalidades, um fluxo de bits é recebido, e o fluxo de bits é decodificado, para obter um sinal de fala/áudio; um primeiro sinal de fala/áudio é determinado de acordo com o sinal de fala/áudio; um símbolo de cada valor de amostra no primeiro sinal de fala/áudio e um valor de amplitude de cada valor de amostra no primeiro sinal de fala/áudio são determinados; um comprimento de normalização adaptativo é determinado; um valor de amplitude ajustado de cada valor de amostra é determinado de acordo com o comprimento de normalização adaptativo e o valor de amplitude de cada valor de amostra; e um segundo sinal de fala/áudio é determinado de acordo com o símbolo de cada valor de amostra e o valor de amplitude ajustado de cada valor de amostra. Nesse processo, apenas um sinal original, ou seja, o primeiro sinal de fala/áudio é processado, e nenhum novo sinal é adicionado ao primeiro sinal de fala/áudio, para que nenhuma nova energia seja adicionada a um segundo sinal de fala/áudio obtido após um componente de ruído ser reconstruído. Portanto, se o primeiro sinal de fala/áudio tiver um início ou uma continuidade, nenhum eco é adicionado ao segundo sinal de fala/áudio, o que, desse modo, melhora a qualidade auditiva do segundo sinal de fala/áudio.
[0030] Deve ser entendido que as descrições gerais supracitadas e as descrições detalhadas a seguir são meramente exemplificativas, e não estão destinadas a limitar o escopo de proteção da presente invenção.
BREVE DESCRIÇÃO DOS DESENHOS
[0031] Para descrever as soluções técnicas nas modalidades da presente invenção ou na técnica anterior mais claramente, o seguinte introduz brevemente os desenhos anexos exigidos para descrever as modalidades ou a técnica anterior. Evidentemente, os desenhos anexos na descrição a seguir mostram meramente algumas modalidades da presente invenção e um indivíduo de habilidade comum na técnica ainda pode derivar outros desenhos a partir desses desenhos anexos sem esforços criativos.
[0032] A Figura 1 é um fluxograma esquemático de um método para reconstruir um componente de ruído de um sinal de fala/áudio de acordo com uma modalidade da presente invenção;
[0033] A Figura 1A é um diagrama esquemático de um exemplo de valores de amostra de agrupamento de acordo com uma modalidade da presente invenção;
[0034] A Figura 1B é outro diagrama esquemático de um exemplo de valores de amostra de agrupamento de acordo com uma modalidade da presente invenção;
[0035] A Figura 2 é um fluxograma esquemático de outro método para reconstruir um componente de ruído de um sinal de fala/áudio de acordo com uma modalidade da presente invenção;
[0036] A Figura 3 é um fluxograma esquemático de outro método para reconstruir um componente de ruído de um sinal de fala/áudio de acordo com uma modalidade da presente invenção;
[0037] A Figura 4 é um diagrama estrutural esquemático de um aparelho para reconstruir um componente de ruído de um sinal de fala/áudio de acordo com uma modalidade da presente invenção; e
[0038] A Figura 5 é um diagrama estrutural esquemático de um dispositivo eletrônico de acordo com uma modalidade da presente invenção.
[0039] Os desenhos anexos supracitados mostram modalidades específicas da presente invenção, e descrições mais detalhadas são fornecidas a seguir. Os desenhos de descrições textuais anexos não se destinam a limitar o escopo da ideia da presente invenção em qualquer quantidade, mas são destinados a descrever o conceito da presente invenção para uma pessoa versada na técnica com referência a modalidades particulares.
DESCRIÇÃO DAS MODALIDADES
[0040] O seguinte descreve clara e completamente as soluções técnicas nas modalidades da presente invenção com referência para os desenhos anexos nas modalidades da presente invenção. Evidentemente, as modalidades descritas são meramente uma parte em vez de todas as modalidades da presente invenção. Todas as outras modalidades obtidas por um indivíduo de habilidade comum na técnica com base nas modalidades da presente invenção sem esforços criativos devem ser abrangidas pelo escopo de proteção da presente invenção.
[0041] Diversos detalhes específicos são mencionados nas descrições detalhadas a seguir para fornecer um entendimento minucioso da presente invenção. Entretanto, uma pessoa versada na técnica deve entender que a presente invenção pode ser implantada sem esses detalhes específicos. Em outras modalidades, um método, um processo, um componente e um circuito que sejam conhecidos publicamente não são descritos em detalhes de modo a não obscurecer desnecessariamente as modalidades.
[0042] Em referência à Figura 1, a Figura 1 é um fluxograma esquemático de um método para reconstruir um componente de ruído de um sinal de fala/áudio de acordo com uma modalidade da presente invenção. O método inclui:
[0043] Etapa 101: Receber um fluxo de bits, e decodificar o fluxo de bits, para obter um sinal de fala/áudio.
[0044] Os detalhes a respeito de como decodificar um fluxo de bits para obter um sinal de fala/áudio não são descritos no presente documento.
[0045] Etapa 102: Determinar um primeiro sinal de fala/áudio de acordo com o sinal de fala/áudio, em que o primeiro sinal de fala/áudio é um sinal, cujo componente de ruído precisa ser reconstruído, no sinal de fala/áudio obtido por meio de codificação.
[0046] O primeiro sinal de fala/áudio pode ser um sinal de banda de baixa frequência, um sinal de banda de alta frequência, um sinal de banda inteira, ou similares no sinal de fala/áudio obtido por meio de decodificação.
[0047] O sinal de fala/áudio obtido por meio de decodificação pode incluir um sinal de banda de baixa frequência e um sinal de banda de alta frequência, ou pode incluir um sinal de banda inteira.
[0048] Etapa 103: Determinar um símbolo de cada valor de amostra no primeiro sinal de fala/áudio e um valor de amplitude de cada valor de amostra no primeiro sinal de fala/áudio.
[0049] Quando o primeiro sinal de fala/áudio tiver diferentes maneiras de implantação, as maneiras de implantação do valor de amostra também podem ser diferentes. Por exemplo, se o primeiro sinal de fala/áudio for um sinal de domínio de frequência, o valor de amostra pode ser um coeficiente de espectro; se o sinal de fala/áudio for um sinal de domínio de tempo, o valor de amostra pode ser um valor de ponto de amostra.
[0050] Etapa 104: Determinar um comprimento de normalização adaptativo.
[0051] O comprimento de normalização adaptativo pode ser determinado de acordo com um parâmetro relacionado de um sinal de banda de baixa frequência e/ou um sinal de banda de alta frequência do sinal de fala/áudio obtido por meio de decodificação. Especificamente, o parâmetro relacionado pode incluir um tipo de sinal, uma razão de pico para média, e similares. Por exemplo, em uma maneira de implantação possível, a determinação de um comprimento de normalização adaptativo pode incluir: dividir o sinal de banda de baixa frequência no sinal de fala/áudio nas N sub-bandas, em que N é um número natural; calcular uma razão de pico para média de cada sub-banda, e determinar uma quantidade de sub-bandas cujas razões de pico para média são maiores que um limiar predefinido da razão de pico para média; e calcular o comprimento de normalização adaptativo de acordo com um tipo de sinal do sinal de banda de alta frequência no sinal de fala/áudio e a quantidade das sub-bandas.
[0052] Opcionalmente, o cálculo do comprimento de normalização adaptativo de acordo com um tipo de sinal do sinal de banda de alta frequência no sinal de fala/áudio e a quantidade das sub-bandas pode incluir: calcular o comprimento de normalização adaptativo de acordo com uma fórmula L = K + α xM, em que L é o comprimento de normalização adaptativo; K é um valor numérico que corresponde ao tipo de sinal do sinal de banda de alta frequência no sinal de fala/áudio, e diferentes tipos de sinal de sinais de banda de alta frequência correspondem a diferentes valores numéricos K; M é uma quantidade das sub-bandas cujas razões de pico para média são maiores que o limiar predefinido da razão de pico para média; e α é uma constante menor que 1.
[0053] Em outra uma maneira de implantação possível, o comprimento de normalização adaptativo pode ser calculado de acordo com um tipo de sinal do sinal de banda de baixa frequência no sinal de fala/áudio e uma quantidade das sub-bandas. Para uma fórmula de cálculo específica, referir-se à fórmula L = K + αxM . Uma diferença fica apenas em que, nesse caso, K é um valor numérico que corresponde ao tipo de sinal do sinal de banda de baixa frequência no sinal de fala/áudio. Diferentes tipos de sinal dentre os sinais de banda de baixa frequência correspondem a diferentes valores numéricos K.
[0054] Em uma terceira maneira de implantação possível, a determinação de um comprimento de normalização adaptativo pode incluir: calcular uma razão de pico para média de o sinal de banda de baixa frequência no sinal de fala/áudio e a razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência é menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência não for menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido. O primeiro valor de comprimento é maior que o segundo valor de comprimento. O primeiro valor de comprimento e o segundo valor de comprimento também podem ser obtidos por meio de cálculo com o uso de uma razão dentre a razão de pico para média do sinal de banda de baixa frequência até a razão de pico para média do sinal de banda de alta frequência ou uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência. Um método de cálculo específico não é limitado.
[0055] Em uma quarta maneira de implantação possível, a determinação de um comprimento de normalização adaptativo pode incluir: calcular uma razão de pico para média do sinal de banda de baixa frequência no sinal de fala/áudio e a razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando a razão de pico para média do sinal de banda de baixa frequência for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando a razão de pico para média do sinal de banda de baixa frequência não for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido. O primeiro valor de comprimento é maior que o segundo valor de comprimento. O primeiro valor de comprimento e o segundo valor de comprimento também podem ser obtidos por meio de cálculo com o uso de uma razão dentre a razão de pico para média do sinal de banda de baixa frequência até a razão de pico para média do sinal de banda de alta frequência ou uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência. Um método de cálculo específico não é limitado.
[0056] Em uma quinta maneira de implantação possível, a determinação de um comprimento de normalização adaptativo pode incluir: determinar o comprimento de normalização adaptativo de acordo com um tipo de sinal do sinal de banda de alta frequência no sinal de fala/áudio. Diferentes tipos de sinal correspondem a diferentes comprimentos de normalização adaptativos. Por exemplo, quando o tipo de sinal for um sinal harmônico, um comprimento de normalização adaptativo correspondente é 32; quando o tipo de sinal for um sinal normal, um comprimento de normalização adaptativo correspondente é 16; quando o tipo de sinal for um sinal transitório, um comprimento de normalização adaptativo correspondente é 8.
[0057] Etapa 105: Determinar um valor de amplitude ajustado de cada valor de amostra de acordo com o comprimento de normalização adaptativo e o valor de amplitude de cada valor de amostra.
[0058] A determinação de um valor de amplitude ajustado de cada valor de amostra de acordo com o comprimento de normalização adaptativo e o valor de amplitude de cada valor de amostra pode incluir: calcular, de acordo com o valor de amplitude de cada valor de amostra e o comprimento de normalização adaptativo, um valor de amplitude médio que corresponde a cada valor de amostra, e determinar, de acordo com o valor de amplitude médio que corresponde a cada valor de amostra, um valor de distúrbio da amplitude que corresponde a cada valor de amostra; e calcular o valor de amplitude ajustado de cada valor de amostra de acordo com o valor de amplitude de cada valor de amostra e de acordo com o valor de distúrbio da amplitude que corresponde a cada valor de amostra.
[0059] O cálculo, de acordo com o valor de amplitude de cada valor de amostra e o comprimento de normalização adaptativo, de um valor de amplitude médio que corresponde a cada valor de amostra pode incluir: determinar, para cada valor de amostra e de acordo com o comprimento de normalização adaptativo, uma sub-banda à qual o valor de amostra pertence; e calcular um valor médio de valores de amplitude de todos os valores de amostra na sub-banda à qual o valor de amostra pertence, e usar o valor médio obtido por meio de cálculo como o valor de amplitude médio que corresponde ao valor de amostra.
[0060] A determinação, para cada valor de amostra e de acordo com o comprimento de normalização adaptativo, de uma sub-banda à qual o valor de amostra pertence pode incluir: realizar o agrupamento de sub-banda em todos os valores de amostra em uma ordem predefinida de acordo com o comprimento de normalização adaptativo; e, para cada valor de amostra, determinar uma subbanda que inclui o valor de amostra como a sub-banda à qual o valor de amostra pertence.
[0061] A ordem predefinida pode ser, por exemplo, uma ordem desde uma baixa frequência até uma alta frequência ou uma ordem desde uma alta frequência até uma baixa frequência, que não é limitada no presente documento.
[0062] Por exemplo, em referência à Figura 1A, presumindo-se que os valores de amostra em ordem crescente sejam respectivamente x1, x2, x3, ..., e xn, e o comprimento de normalização adaptativo seja 5, de x1 a x5 pode ser agrupado em uma sub-banda, e de x6 a x10 pode ser agrupado em uma sub-banda. Por analogia, diversas sub-bandas são obtidas. Portanto, para cada valor de amostra de x1 a x5, uma sub-banda de x1 a x5 é uma sub-banda à qual cada valor de amostra pertence, e para cada valor de amostra de x6 a x10, uma sub-banda de x6 a x10 é uma sub-banda à qual cada valor de amostra pertence.
[0063] Alternativamente, a determinação, para cada valor de amostra e de acordo com o comprimento de normalização adaptativo, de uma sub-banda à qual o valor de amostra pertence pode incluir: para cada valor de amostra, determinar uma sub-banda que consiste em m valores de amostra antes do valor de amostra, o valor de amostra, e n valores de amostra após o valor de amostra como a sub-banda à qual o valor de amostra pertence, em que m e n dependem do comprimento de normalização adaptativo, m é um número inteiro não menor que 0, e n é um número inteiro não menor que 0.
[0064] Por exemplo, em referência à Figura 1B, presume-se que valores de amostra em ordem crescente sejam respectivamente x1, x2, x3, ., e xn, o comprimento de normalização adaptativo é 5, m é 2, e n é 2. Para o valor de amostra x3, uma sub-banda que consiste de x1 a x5 é uma sub-banda à qual o valor de amostra x3 pertence. Para o valor de amostra x4, uma sub banda que consiste de x2 a x6 é uma sub-banda à qual o valor de amostra x4 pertence. O resto pode ser deduzido por analogia. Devido ao fato de não haver valores de amostra suficientes antes dos valores de amostra x1 e x2 para formar sub-bandas às quais os valores de amostra x1 e x2 pertencem, e não haver valores de amostra suficientes após os valores de amostra x(n-1) e xn para formar sub-bandas às quais os valores de amostra x(n-1) e xn pertencem, em uma aplicação real, as sub-bandas às quais x1, x2, x(n-1), e xn pertencem podem ser definidas de modo autônomo. Por exemplo, o próprio valor de amostra pode ser adicionado para compensar por uma falta de um valor de amostra na sub-banda à qual o valor de amostra pertence. Por exemplo, para o valor de amostra x1, não há valor de amostra antes do valor de amostra x1, e x1, x1, x1, x2 e x3 podem ser usados como a sub-banda à qual o valor de amostra x1 pertence.
[0065] Quando o valor de distúrbio da amplitude que corresponde a cada valor de amostra for determinado de acordo com o valor de amplitude médio que corresponde a cada valor de amostra, o valor de amplitude médio que corresponde a cada valor de amostra pode ser usado diretamente como o valor de distúrbio da amplitude que corresponde a cada valor de amostra. Alternativamente, uma operação predefinida pode ser realizada no valor de amplitude médio que corresponde a cada valor de amostra, para obter o valor de distúrbio da amplitude que corresponde a cada valor de amostra. A operação predefinida pode ser, por exemplo, que o valor de amplitude médio seja multiplicado por um valor numérico. O valor numérico é geralmente maior que 0.
[0066] O cálculo do valor de amplitude ajustado de cada valor de amostra de acordo com o valor de amplitude de cada valor de amostra e de acordo com o valor de distúrbio da amplitude que corresponde a cada valor de amostra pode incluir: subtrair o valor de distúrbio da amplitude que corresponde a cada valor de amostra do valor de amplitude de cada valor de amostra, para obter uma diferença entre o valor de amplitude de cada valor de amostra e o valor de distúrbio da amplitude que corresponde a cada valor de amostra, e usar a diferença obtida como o valor de amplitude ajustado de cada valor de amostra.
[0067] Etapa 106: Determinar um segundo sinal de fala/áudio de acordo com o símbolo de cada valor de amostra e o valor de amplitude ajustado de cada valor de amostra, em que o segundo sinal de fala/áudio é um sinal obtido após o componente de ruído do primeiro sinal de fala/áudio ser reconstruído.
[0068] Em uma maneira de implantação possível, um novo valor de cada valor de amostra pode ser determinado de acordo com o símbolo e o valor de amplitude ajustado de cada valor de amostra, para obter o segundo sinal de fala/áudio.
[0069] Em outra uma maneira de implantação possível, a determinação de um segundo sinal de fala/áudio de acordo com o símbolo de cada valor de amostra e o valor de amplitude ajustado de cada valor de amostra pode incluir: calcular um fator de modificação; realizar o processamento de modificação em um valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra de acordo com o fator de modificação; e determinar um novo valor de cada valor de amostra de acordo com o símbolo de cada valor de amostra e um valor de amplitude ajustado que é obtido após o processamento de modificação, para obter o segundo sinal de fala/áudio.
[0070] Em uma maneira de implantação possível, o segundo sinal de fala/áudio obtido pode incluir novos valores dentre todos os valores de amostra.
[0071] O fator de modificação pode ser calculado de acordo com o comprimento de normalização adaptativo. Especificamente, o fator de modificação β pode ser igual a a/L, em que a é uma constante maior que 1.
[0072] A realização de processamento de modificação em um valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra de acordo com o fator de modificação pode incluir: realizar o processamento de modificação no valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra com o uso da seguinte fórmula: Y = y x (b - β); ; em que Y é o valor de amplitude ajustado obtido após o processamento de modificação; y é o valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra; e b é uma constante, e 0 < b < 2.
[0073] A etapa de extração do símbolo de cada valor de amostra no primeiro sinal de fala/áudio na etapa 103 pode ser realizado a qualquer momento antes de etapa 106. Não há ordem de execução necessária entre a etapa de extração do símbolo de cada valor de amostra no primeiro sinal de fala/áudio e a etapa 104 e a etapa 105.
[0074] Uma ordem de execução entre a etapa 103 e a etapa 104 não é limitada.
[0075] Na técnica anterior, quando um sinal de fala/áudio for um sinal que tem um início ou uma continuidade, um sinal de domínio de tempo no sinal de fala/áudio pode estar dentro de um quadro. Nesse caso, uma parte do sinal de fala/áudio tem um valor de ponto de amostra de sinal extremamente grande e energia de sinal extremamente potente, embora outra parte do sinal de fala/áudio tenha um valor de ponto de amostra de sinal extremamente pequeno e uma energia de sinal extremamente fraca. Nesse caso, um sinal de ruído aleatório é adicionado ao sinal de fala/áudio em um domínio de frequência, para obter um sinal obtido após um componente de ruído ser reconstruído. Devido ao fato da energia do sinal de ruído aleatório estar mesmo dentro de um quadro em um domínio de tempo, quando um sinal de domínio de frequência obtido após um componente de ruído ser reconstruído for convertido em um sinal de domínio de tempo, o sinal de ruído aleatório recentemente adicionado geralmente faz com que a energia de sinal de uma parte, cujo original valor de ponto de amostra é extremamente pequeno, no sinal de domínio de tempo obtido por meio de conversão, aumente. Um valor de ponto de amostra de sinal dessa parte também se torna relativamente grande de modo correspondente. Consequentemente, o sinal obtido após um componente de ruído ser reconstruído tem alguns ecos, o que afeta a qualidade auditiva do sinal obtido após um componente de ruído ser reconstruído.
[0076] Nessa modalidade, um primeiro sinal de fala/áudio é determinado de acordo com um sinal de fala/áudio; um símbolo de cada valor de amostra no primeiro sinal de fala/áudio e um valor de amplitude de cada valor de amostra no primeiro sinal de fala/áudio são determinados; um comprimento de normalização adaptativo é determinado; um valor de amplitude ajustado de cada valor de amostra é determinado de acordo com o comprimento de normalização adaptativo e o valor de amplitude de cada valor de amostra; e um segundo sinal de fala/áudio é determinado de acordo com o símbolo de cada valor de amostra e o valor de amplitude ajustado de cada valor de amostra. Nesse processo, apenas um sinal original, ou seja, o primeiro sinal de fala/áudio é processado, e nenhum novo sinal é adicionado ao primeiro sinal de fala/áudio, para que nenhuma nova energia seja adicionada a um segundo sinal de fala/áudio obtido após um componente de ruído ser reconstruído. Portanto, se o primeiro sinal de fala/áudio tiver um início ou uma continuidade, nenhum eco é adicionado ao segundo sinal de fala/áudio, o que, desse modo, melhora a qualidade auditiva do segundo sinal de fala/áudio.
[0077] Em referência à Figura 2, a Figura 2 é outro fluxograma esquemático de um método para reconstruir um componente de ruído de um sinal de fala/áudio de acordo com uma modalidade da presente invenção. O método inclui:
[0078] Etapa 201: Receber um fluxo de bits, decodificar o fluxo de bits, para obter um sinal de fala/áudio, em que o sinal de fala/áudio obtido por meio de decodificação inclui um sinal de banda de baixa frequência e um sinal de banda de alta frequência; e determinar o sinal de banda de alta frequência como um primeiro sinal de fala/áudio.
[0079] O modo de decodificar o fluxo de bits não está limitado na presente invenção.
[0080] Etapa 202: Determinar um símbolo de cada valor de amostra no sinal de banda de alta frequência e um valor de amplitude de cada valor de amostra no sinal de banda de alta frequência.
[0081] Por exemplo, se um coeficiente de um valor de amostra no sinal de banda de alta frequência for -4, um símbolo do valor de amostra é "-", e um valor de amplitude é 4.
[0082] Etapa 203: Determinar um comprimento de normalização adaptativo.
[0083] Para detalhes sobre como determinar o comprimento de normalização adaptativo, referir-se a descrições relacionadas na etapa 104. Os detalhes não são descritos no presente documento novamente.
[0084] Etapa 204: Determinar, de acordo com o valor de amplitude de cada valor de amostra e o comprimento de normalização adaptativo, um valor de amplitude médio que corresponde a cada valor de amostra, e determinar, de acordo com o valor de amplitude médio que corresponde a cada valor de amostra, um valor de distúrbio da amplitude que corresponde a cada valor de amostra.
[0085] Para como determinar o valor de amplitude médio que corresponde a cada valor de amostra, referir-se às descrições relacionadas na etapa 105. Os detalhes não são descritos no presente documento novamente.
[0086] Etapa 205: Calcular um valor de amplitude ajustado de cada valor de amostra de acordo com o valor de amplitude de cada valor de amostra e de acordo com o valor de distúrbio da amplitude que corresponde a cada valor de amostra.
[0087] Para como determinar o valor de amplitude ajustado de cada valor de amostra, referir-se às descrições relacionadas na etapa 105. Os detalhes não são descritos no presente documento novamente.
[0088] Etapa 206: Determinar um segundo sinal de fala/áudio de acordo com o símbolo e o valor de amplitude ajustado de cada valor de amostra.
[0089] O segundo sinal de fala/áudio é um sinal obtido após um componente de ruído do primeiro sinal de fala/áudio ser reconstruído.
[0090] Para a implantação específica nessa etapa, referir-se às descrições relacionadas na etapa 106. Os detalhes não são descritos no presente documento novamente.
[0091] A etapa de determinação do símbolo de cada valor de amostra no primeiro sinal de fala/áudio na etapa 202 pode ser realizado a qualquer momento antes de etapa 206. Não há ordem de execução necessária entre a etapa de determinação do símbolo de cada valor de amostra no primeiro sinal de fala/áudio e a etapa 203, a etapa 204 e a etapa 205.
[0092] Uma ordem de execução entre a etapa 202 e a etapa 203 não é limitada.
[0093] Etapa 207: Combinar o segundo sinal de fala/áudio e o sinal de banda de baixa frequência no sinal de fala/áudio obtido por meio de decodificação, para obter um sinal de saída.
[0094] Se o primeiro sinal de fala/áudio for um sinal de banda de baixa frequência no sinal de fala/áudio obtido por meio de decodificação, o segundo sinal de fala/áudio e um sinal de banda de alta frequência no sinal de fala/áudio obtido por meio de decodificação pode ser combinado, para obter um sinal de saída.
[0095] Se o primeiro sinal de fala/áudio for um sinal de banda de alta frequência no sinal de fala/áudio obtido por meio de decodificação, o segundo sinal de fala/áudio e um sinal de banda de baixa frequência no sinal de fala/áudio obtido por meio de decodificação pode ser combinado, para obter um sinal de saída.
[0096] Se o primeiro sinal de fala/áudio for um sinal de banda inteira no sinal de fala/áudio obtido por meio de decodificação, o segundo sinal de fala/áudio pode ser diretamente determinado como o sinal de saída.
[0097] Nessa modalidade, reconstruindo-se um componente de ruído de um sinal de banda de alta frequência em um sinal de fala/áudio obtido por meio de decodificação, o componente de ruído do sinal de banda de alta frequência é finalmente reconstruído, para obter um segundo sinal de fala/áudio. Portanto, se o sinal de banda de alta frequência tiver um início ou uma continuidade, nenhum eco é adicionado ao segundo sinal de fala/áudio, o que, desse modo, melhora a qualidade auditiva do segundo sinal de fala/áudio e melhora ainda mais a qualidade auditiva do sinal de saída finalmente emitido.
[0098] Em referência à Figura 3, a Figura 3 é outro fluxograma esquemático de um método para reconstruir um componente de ruído de um sinal de fala/áudio de acordo com uma modalidade da presente invenção. O método inclui:
[0099] As etapas 301 à etapa 305 são as mesmas que as etapas 201 à etapa 205, e os detalhes não são descritos no presente documento novamente.
[0100] Etapa 306: Calcular um fator de modificação; e realizar o processamento de modificação em um valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra de acordo com o fator de modificação.
[0101] Para a implantação específica nessa etapa, referir-se às descrições relacionadas na etapa 106. Os detalhes não são descritos no presente documento novamente.
[0102] Etapa 307: Determinar um segundo sinal de fala/áudio de acordo com o símbolo de cada valor de amostra e um valor de amplitude ajustado obtido após o processamento de modificação.
[0103] Para a implantação específica nessa etapa, referir-se às descrições relacionadas na etapa 106. Os detalhes não são descritos no presente documento novamente.
[0104] A etapa de determinação do símbolo de cada valor de amostra no primeiro sinal de fala/áudio na etapa 302 pode ser realizado a qualquer momento antes de etapa 307. Não há ordem de execução necessária entre a etapa de determinação do símbolo de cada valor de amostra no primeiro sinal de fala/áudio e a etapa 303, a etapa 304, a etapa 305 e a etapa 306.
[0105] Uma ordem de execução entre a etapa 302 e a etapa 303 não é limitada.
[0106] Etapa 308: Combinar o segundo sinal de fala/áudio e um sinal de banda de baixa frequência no sinal de fala/áudio obtido por meio de decodificação, para obter um sinal de saída.
[0107] Em relação à modalidade mostrada na Figura 2, nessa modalidade, após o valor de amplitude ajustado de cada valor de amostra ser obtido, e um valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados é ainda mais modificado, o que, desse modo, melhora ainda mais a qualidade auditiva do segundo sinal de fala/áudio, e melhora ainda mais a qualidade auditiva do sinal de saída finalmente emitido.
[0108] Nos métodos exemplificativos para reconstruir um componente de ruído de um sinal de fala/áudio na Figura 2 e na Figura 3 de acordo com as modalidades da presente invenção, um sinal de banda de alta frequência no sinal de fala/áudio obtido por meio de decodificação é determinado como o primeiro sinal de fala/áudio, e um componente de ruído do primeiro sinal de fala/áudio é reconstruído, para finalmente obter o segundo sinal de fala/áudio. Em uma aplicação real, de acordo com o método para reconstruir um componente de ruído de um sinal de fala/áudio de acordo com as modalidades da presente invenção, um componente de ruído de um sinal de banda inteira do sinal de fala/áudio obtido por meio de decodificação pode ser reconstruído, ou um componente de ruído de um sinal de banda de baixa frequência do sinal de fala/áudio obtido por meio de decodificação é reconstruído, para finalmente obter um segundo sinal de fala/áudio. Para um processo de implantação do mesmo, referir-se aos métodos exemplificativos mostrados na Figura 2 e na Figura 3. Uma diferença reside apenas em que, quando um primeiro sinal de fala/áudio tiver que ser determinado, um sinal de banda inteira ou um sinal de banda de baixa frequência é determinado como o primeiro sinal de fala/áudio. As descrições não são fornecidas com o uso de exemplos um a um no presente documento.
[0109] Em referência à Figura 4, a Figura 4 é um diagrama estrutural esquemático de um aparelho para reconstruir um componente de ruído de um sinal de fala/áudio de acordo com uma modalidade da presente invenção. O aparelho pode ser disposto em um dispositivo eletrônico. Um aparelho 400 pode incluir: uma unidade de processamento do fluxo de bits 410, configurada para receber um fluxo de bits e decodificar o fluxo de bits, para obter um sinal de fala/áudio; e determinar um primeiro sinal de fala/áudio de acordo com o sinal de fala/áudio, em que o primeiro sinal de fala/áudio é um sinal, cujo componente de ruído precisa ser reconstruído, no sinal de fala/áudio obtido por meio de decodificação; uma unidade de determinação do sinal 420, configurada para determinar o primeiro sinal de fala/áudio de acordo com o sinal de fala/áudio obtido pela unidade de processamento do fluxo de bits 410; uma primeira unidade de determinação 430, configurada para determinar um símbolo de cada valor de amostra no primeiro sinal de fala/áudio determinado pela unidade de determinação do sinal 420 e um valor de amplitude de cada valor de amostra no primeiro sinal de fala/áudio determinado pela unidade de determinação do sinal 420; uma segunda unidade de determinação 440, configurada para determinar um comprimento de normalização adaptativo; uma terceira unidade de determinação 450, configurada para determinar um valor de amplitude ajustado de cada valor de amostra de acordo com o comprimento de normalização adaptativo determinado pela segunda unidade de determinação 440 e o valor de amplitude que é de cada valor de amostra e é determinado pela primeira unidade de determinação 430; e uma quarta unidade de determinação 460, configurada para determinar um segundo sinal de fala/áudio de acordo com o símbolo que é de cada valor de amostra e é determinado pela primeira unidade de determinação 430 e o valor de amplitude ajustado que é de cada valor de amostra e é determinado pela terceira unidade de determinação 450, em que o segundo sinal de fala/áudio é um sinal obtido após o componente de ruído do primeiro sinal de fala/áudio é reconstruído.
[0110] Opcionalmente, a terceira unidade de determinação 450 pode incluir: uma subunidade de determinação, configurada para calcular, de acordo com o valor de amplitude de cada valor de amostra e o comprimento de normalização adaptativo, um valor de amplitude médio que corresponde a cada valor de amostra, e determinar, de acordo com o valor de amplitude médio que corresponde a cada valor de amostra, um valor de distúrbio da amplitude que corresponde a cada valor de amostra; e uma subunidade de cálculo do valor de amplitude ajustado, configurada para calcular o valor de amplitude ajustado de cada valor de amostra de acordo com o valor de amplitude de cada valor de amostra e de acordo com o valor de distúrbio da amplitude que corresponde a cada valor de amostra.
[0111] Opcionalmente, a subunidade de determinação pode incluir: um módulo de determinação, configurado para determinar, para cada valor de amostra e de acordo com o comprimento de normalização adaptativo, uma sub-banda à qual o valor de amostra pertence; e um módulo de cálculo, configurado para calcular um valor médio de valores de amplitude de todos os valores de amostra na sub-banda à qual o valor de amostra pertence, e usar o valor médio obtido por meio de cálculo como o valor de amplitude médio que corresponde ao valor de amostra.
[0112] Opcionalmente, o módulo de determinação pode ser configurado especificamente para: realizar o agrupamento de sub-banda em todos os valores de amostra em uma ordem predefinida de acordo com o comprimento de normalização adaptativo; e, para cada valor de amostra, determinar uma subbanda que inclui o valor de amostra como a sub-banda à qual o valor de amostra pertence; ou para cada valor de amostra, determinar uma sub-banda que consiste em m valores de amostra antes do valor de amostra, o valor de amostra, e n valores de amostra após o valor de amostra como a sub-banda à qual o valor de amostra pertence, em que m e n dependem do comprimento de normalização adaptativo, m é um número inteiro não menor que 0, e n é um número inteiro não menor que 0.
[0113] Opcionalmente, a subunidade de cálculo do valor de amplitude ajustado é configurada especificamente para: subtrair o valor de distúrbio da amplitude que corresponde a cada valor de amostra do valor de amplitude de cada valor de amostra, para obter uma diferença entre o valor de amplitude de cada valor de amostra e o valor de distúrbio da amplitude que corresponde a cada valor de amostra, e usar a diferença obtida como o valor de amplitude ajustado de cada valor de amostra.
[0114] Opcionalmente, a segunda unidade de determinação 440 pode incluir: uma subunidade de divisão, configurada para dividir um sinal de banda de baixa frequência no sinal de fala/áudio nas N sub-bandas, em que N é um número natural; uma subunidade de determinação de quantidade, configurada para calcular uma razão de pico para média de cada sub-banda, e determinar uma quantidade de sub-bandas cujas razões de pico para média são maiores que um limiar predefinido da razão de pico para média; e uma subunidade de cálculo de comprimento, configurada para calcular o comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio e a quantidade das sub-bandas.
[0115] Opcionalmente, a subunidade de cálculo de comprimento pode ser configurada especificamente para: calcular o comprimento de normalização adaptativo de acordo com uma fórmula L = K + α xM, em que L é o comprimento de normalização adaptativo; K é um valor numérico que corresponde ao tipo de sinal do sinal de banda de alta frequência no sinal de fala/áudio, e diferentes tipos de sinal de sinais de banda de alta frequência correspondem a diferentes valores numéricos K; M é uma quantidade das sub-bandas cujas razões de pico para média são maiores que o limiar predefinido da razão de pico para média; e α é uma constante menor que 1.
[0116] Opcionalmente, a segunda unidade de determinação 440 pode ser configurada especificamente para: calcular uma razão de pico para média de um sinal de banda de baixa frequência no sinal de fala/áudio e uma razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência é menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência não for menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido, em que o primeiro valor de comprimento é maior que o segundo valor de comprimento; ou calcular uma razão de pico para média de um sinal de banda de baixa frequência no sinal de fala/áudio e uma razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando a razão de pico para média do sinal de banda de baixa frequência for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando a razão de pico para média do sinal de banda de baixa frequência não for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido; ou determinar o comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio, em que diferentes tipos de sinal dos sinais de banda de alta frequência correspondem a diferentes comprimentos de normalização adaptativos.
[0117] Opcionalmente, a quarta unidade de determinação 460 pode ser configurada especificamente para: determinar um novo valor de cada valor de amostra de acordo com o símbolo e o valor de amplitude ajustado de cada valor de amostra, para obter o segundo sinal de fala/áudio; ou calcular um fator de modificação; realizar o processamento de modificação em um valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra de acordo com o fator de modificação; e determinar um novo valor de cada valor de amostra de acordo com o símbolo de cada valor de amostra e um valor de amplitude ajustado que é obtido após o processamento de modificação, para obter o segundo sinal de fala/áudio.
[0118] Opcionalmente, a quarta unidade de determinação 460 pode ser configurada especificamente para calcular o fator de modificação com o uso de uma fórmula β = a/L, em que β é o fator de modificação, L é o comprimento de normalização adaptativo, e a é uma constante maior que 1.
[0119] Opcionalmente, a quarta unidade de determinação 460 pode ser configurada especificamente para: realizar o processamento de modificação no valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra com o uso da seguinte fórmula: Y = y x (b - β); ; em que Y é o valor de amplitude ajustado obtido após o processamento de modificação; y é o valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra; e b é uma constante, e 0 < b < 2.
[0120] Nessa modalidade, um primeiro sinal de fala/áudio é determinado de acordo com um sinal de fala/áudio; um símbolo de cada valor de amostra no primeiro sinal de fala/áudio e um valor de amplitude de cada valor de amostra no primeiro sinal de fala/áudio são determinados; um comprimento de normalização adaptativo é determinado; um valor de amplitude ajustado de cada valor de amostra é determinado de acordo com o comprimento de normalização adaptativo e o valor de amplitude de cada valor de amostra; e um segundo sinal de fala/áudio é determinado de acordo com o símbolo de cada valor de amostra e o valor de amplitude ajustado de cada valor de amostra. Nesse processo, apenas um sinal original, ou seja, o primeiro sinal de fala/áudio é processado, e nenhum novo sinal é adicionado ao primeiro sinal de fala/áudio, para que nenhuma nova energia seja adicionada a um segundo sinal de fala/áudio obtido após um componente de ruído ser reconstruído. Portanto, se o primeiro sinal de fala/áudio tiver um início ou uma continuidade, nenhum eco é adicionado ao segundo sinal de fala/áudio, o que, desse modo, melhora a qualidade auditiva do segundo sinal de fala/áudio.
[0121] Em referência à Figura 5, a Figura 5 é um diagrama estrutural esquemático de um dispositivo eletrônico de acordo com uma modalidade da presente invenção. Um dispositivo eletrônico 500 inclui um processador 510, uma memória 520, um transceptor 530 e um barramento 540.
[0122] O processador 510, a memória 520 e o transceptor 530 são conectados um ao outro com o uso do barramento 540, e o barramento 540 pode ser um barramento de ISA, um barramento de PCI, um barramento de EISA, ou similares. O barramento pode ser classificado em um barramento de endereço, um barramento de dados, um barramento de controle, ou similares. Para facilidade de indicação, o barramento mostrado na Figura 5 é indicado com o uso apenas de uma linha em negrito, mas não indica que haja apenas um barramento ou apenas um tipo de barramento.
[0123] A memória 520 é configurada para armazenar um programa. Especificamente, o programa pode incluir código de programa e o código de programa inclui uma instrução de operação de computador. A memória 520 pode incluir uma memória RAM de alta velocidade e pode incluir adicionalmente uma memória não volátil (non-volatile memory), tal como pelo menos um armazenamento de disco magnético.
[0124] O transceptor 530 é configurado para se conectar a outro dispositivo, e se comunicar com o outro dispositivo. Especificamente, o transceptor 530 pode ser configurado para receber um fluxo de bits.
[0125] O processador 510 executa o código de programa armazenado na memória 520 e é configurada para: decodificar o fluxo de bits, para obter um sinal de fala/áudio; determinar um primeiro sinal de fala/áudio de acordo com o sinal de fala/áudio; determinar um símbolo de cada valor de amostra no primeiro sinal de fala/áudio e um valor de amplitude de cada valor de amostra no primeiro sinal de fala/áudio; determinar um comprimento de normalização adaptativo; determinar um valor de amplitude ajustado de cada valor de amostra de acordo com o comprimento de normalização adaptativo e o valor de amplitude de cada valor de amostra; e determinar um segundo sinal de fala/áudio de acordo com o símbolo de cada valor de amostra e o valor de amplitude ajustado de cada valor de amostra.
[0126] Opcionalmente, o processador 510 pode ser configurado especificamente para: calcular, de acordo com o valor de amplitude de cada valor de amostra e o comprimento de normalização adaptativo, um valor de amplitude médio que corresponde a cada valor de amostra, e determinar, de acordo com o valor de amplitude médio que corresponde a cada valor de amostra, um valor de distúrbio da amplitude que corresponde a cada valor de amostra; e calcular o valor de amplitude ajustado de cada valor de amostra de acordo com o valor de amplitude de cada valor de amostra e de acordo com o valor de distúrbio da amplitude que corresponde a cada valor de amostra.
[0127] Opcionalmente, o processador 510 pode ser configurado especificamente para: determinar, para cada valor de amostra e de acordo com o comprimento de normalização adaptativo, uma sub-banda à qual o valor de amostra pertence; e calcular um valor médio de valores de amplitude de todos os valores de amostra na sub-banda à qual o valor de amostra pertence, e usar o valor médio obtido por meio de cálculo como o valor de amplitude médio que corresponde ao valor de amostra.
[0128] Opcionalmente, o processador 510 pode ser configurado especificamente para: realizar o agrupamento de sub-banda em todos os valores de amostra em uma ordem predefinida de acordo com o comprimento de normalização adaptativo; e, para cada valor de amostra, determinar uma subbanda que inclui o valor de amostra como a sub-banda à qual o valor de amostra pertence; ou para cada valor de amostra, determinar uma sub-banda que consiste em m valores de amostra antes do valor de amostra, o valor de amostra, e n valores de amostra após o valor de amostra como a sub-banda à qual o valor de amostra pertence, em que m e n dependem do comprimento de normalização adaptativo, m é um número inteiro não menor que 0, e n é um número inteiro não menor que 0.
[0129] Opcionalmente, o processador 510 pode ser configurado especificamente para: subtrair o valor de distúrbio da amplitude que corresponde a cada valor de amostra do valor de amplitude de cada valor de amostra, para obter uma diferença entre o valor de amplitude de cada valor de amostra e o valor de distúrbio da amplitude que corresponde a cada valor de amostra, e usar a diferença obtida como o valor de amplitude ajustado de cada valor de amostra.
[0130] Opcionalmente, o processador 510 pode ser configurado especificamente para: dividir um sinal de banda de baixa frequência no sinal de fala/áudio nas N sub-bandas, em que N é um número natural; calcular uma razão de pico para média de cada sub-banda, e determinar uma quantidade de sub-bandas cujas razões de pico para média são maiores que um limiar predefinido da razão de pico para média; e calcular o comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio e a quantidade das sub-bandas.
[0131] Opcionalmente, o processador 510 pode ser configurado especificamente para: calcular o comprimento de normalização adaptativo de acordo com uma fórmula L = K + α xM , em que L é o comprimento de normalização adaptativo; K é um valor numérico que corresponde ao tipo de sinal do sinal de banda de alta frequência no sinal de fala/áudio, e diferentes tipos de sinal de sinais de banda de alta frequência correspondem a diferentes valores numéricos K; M é uma quantidade das sub-bandas cujas razões de pico para média são maiores que o limiar predefinido da razão de pico para média; e α é uma constante menor que 1.
[0132] Opcionalmente, o processador 510 pode ser configurado especificamente para: calcular uma razão de pico para média de um sinal de banda de baixa frequência no sinal de fala/áudio e uma razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência é menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência não for menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido, em que o primeiro valor de comprimento é maior que o segundo valor de comprimento; ou calcular uma razão de pico para média de um sinal de banda de baixa frequência no sinal de fala/áudio e uma razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando a razão de pico para média do sinal de banda de baixa frequência for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando a razão de pico para média do sinal de banda de baixa frequência não for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido; ou determinar o comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio, em que diferentes tipos de sinal dos sinais de banda de alta frequência correspondem a diferentes comprimentos de normalização adaptativos.
[0133] Opcionalmente, o processador 510 pode ser configurado especificamente para: determinar um novo valor de cada valor de amostra de acordo com o símbolo e o valor de amplitude ajustado de cada valor de amostra, para obter o segundo sinal de fala/áudio; ou calcular um fator de modificação; realizar o processamento de modificação em um valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra de acordo com o fator de modificação; e determinar um novo valor de cada valor de amostra de acordo com o símbolo de cada valor de amostra e um valor de amplitude ajustado que é obtido após o processamento de modificação, para obter o segundo sinal de fala/áudio.
[0134] Opcionalmente, o processador 510 pode ser configurado especificamente para: calcular o fator de modificação com o uso de uma fórmula β = a/L, em que β é o fator de modificação, L é o comprimento de normalização adaptativo, e a é uma constante maior que 1.
[0135] Opcionalmente, o processador 510 pode ser configurado especificamente para: realizar o processamento de modificação no valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra com o uso da seguinte fórmula: Y = y x (b - β); ; em que Y é o valor de amplitude ajustado obtido após o processamento de modificação; y é o valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra; e b é uma constante, e 0 < b < 2.
[0136] Nessa modalidade, o dispositivo eletrônico determina um primeiro sinal de fala/áudio de acordo com um sinal de fala/áudio; determina um símbolo de cada valor de amostra no primeiro sinal de fala/áudio e um valor de amplitude de cada valor de amostra no primeiro sinal de fala/áudio; determina um comprimento de normalização adaptativo; determina um valor de amplitude ajustado de cada valor de amostra de acordo com o comprimento de normalização adaptativo e o valor de amplitude de cada valor de amostra; e determina um segundo sinal de fala/áudio de acordo com o símbolo de cada valor de amostra e o valor de amplitude ajustado de cada valor de amostra. Nesse processo, apenas um sinal original, ou seja, o primeiro sinal de fala/áudio é processado, e nenhum novo sinal é adicionado ao primeiro sinal de fala/áudio, para que nenhuma nova energia seja adicionada a um segundo sinal de fala/áudio obtido após um componente de ruído ser reconstruído. Portanto, se o primeiro sinal de fala/áudio tiver um início ou uma continuidade, nenhum eco é adicionado ao segundo sinal de fala/áudio, o que, desse modo, melhora a qualidade auditiva do segundo sinal de fala/áudio.
[0137] Uma modalidade do sistema corresponde basicamente a uma modalidade do método, e, portanto, para partes relacionadas, pode ser feita referência a descrições parciais na modalidade do método. A modalidade de sistema descrita é meramente exemplificativa. As unidades descritas como partes separadas podem ou não serem separadas fisicamente, e as partes exibidas como unidades podem ou não serem unidades físicas, podem estar localizadas em uma posição, ou podem estar distribuídas em uma pluralidade de unidades de rede. Uma parte ou todos os módulos podem ser selecionados de acordo com necessidades reais para alcançar os objetivos das soluções das modalidades. Uma pessoa de habilidade comum na técnica pode entender e implantar as modalidades da presente invenção sem esforços criativos.
[0138] A presente invenção pode ser descrita no contexto geral de instruções executáveis por computador executadas por um computador, por exemplo, um módulo de programa. Em geral, a unidade de programa inclui uma rotina, um programa, um objeto, um componente, uma estrutura de dados, e similares para executar uma tarefa particular ou implantar um tipo de dados abstratos particular. A presente invenção também pode ser praticada em ambientes de computação distribuídos no qual as tarefas são realizadas por dispositivos de processamento remoto que são conectados com o uso de uma rede de computações. Em um ambiente de computação distribuído, os módulos de programa podem estar localizados em meios de armazenamento em computador tanto local quanto remoto, o que inclui dispositivos de armazenamento.
[0139] Uma pessoa de habilidade comum na técnica pode entender que todas ou uma parte das etapas das maneiras de implantação no método podem ser implantadas por um programa que instrui um hardware relevante. O programa pode ser armazenado em um meio de armazenamento legível por computador, como uma ROM, uma RAM, um disco magnético ou um disco óptico.
[0140] Deve ser observado adicionalmente que no relatório descritivo, termos relacionais como primeiro e segundo são usados apenas para diferenciar uma entidade ou operação a partir de outra entidade ou operação, e não necessitam ou implicam que qualquer relação real ou sequência exista entre essas entidades ou operações. Ademais, os termos "incluir", "compreender", ou quaisquer outras dentre suas variantes são destinados a cobrir uma inclusão não exclusiva, para que um processo, um método, um artigo ou um dispositivo que inclui uma lista de elementos, não inclui apenas aqueles elementos mas também inclui outros elementos que não estão expressamente listados, ou inclui adicionalmente elementos inerentes a tal processo, método, artigo ou aparelho. Um elemento precedido por "inclui um...", sem mais restrições, não impede a existência de elementos idênticos adicionais no processo, método, artigo ou aparelho que inclui o elemento.
[0141] As descrições mencionadas anteriormente são meramente modalidades exemplificativas da presente invenção, porém, não se destinam a limitar o escopo de proteção da presente invenção. Nesse relatório descritivo, os exemplos específicos são usados para descrever o princípio e as maneiras de implantação da presente invenção e a descrição das modalidades destinam- se apenas a tornar o método e a ideia principal da presente invenção mais compreensíveis. Além disso, uma pessoa de habilidade comum na técnica pode, com base na ideia da presente invenção, fazer modificações em relação às maneiras de implantação específicas e ao escopo do pedido. Em conclusão, o conteúdo nesse relatório descritivo não será interpretado como uma limitação da presente invenção. Qualquer modificação, substituição equivalente ou melhoria feita sem se afastar do espírito e do princípio da presente invenção deve ser abrangida pelo escopo de proteção da presente invenção.

Claims (12)

1. Método para processar um sinal de fala/áudio, CARACTERIZADO pelo fato de que o método compreende: receber (101) um fluxo de bits, e decodificar o fluxo de bits, para obter um sinal de fala/áudio; determinar (102) um primeiro sinal de fala/áudio de acordo com o sinal de fala/áudio, em que o primeiro sinal de fala/áudio é um sinal, cujo componente de ruído precisa ser reconstruído, no sinal de fala/áudio; determinar (103) uma sinalização de cada valor de amostra no primeiro sinal de fala/áudio e um valor de amplitude de cada valor de amostra no primeiro sinal de fala/áudio; determinar (104) um comprimento de normalização adaptativo; em que determinar um comprimento de normalização adaptativo compreende: dividir um sinal de banda de baixa frequência no sinal de fala/áudio em N subbandas, em que N é um número natural; calcular uma razão de pico para média de cada sub-banda, e determinar uma quantidade de sub-bandas cujas razões de pico para média são maiores que um limiar predefinido de razão de pico para média; e calcular o comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio e a quantidade das sub-bandas; determinar (105) um valor de amplitude ajustado de cada valor de amostra de acordo com o comprimento de normalização adaptativo e o valor de amplitude de cada valor de amostra; e determinar (106) um segundo sinal de fala/áudio de acordo com a sinalização de cada valor de amostra e o valor de amplitude ajustado de cada valor de amostra, em que o segundo sinal de fala/áudio é um sinal obtido após o componente de ruído do primeiro sinal de fala/áudio ser reconstruído; em que determinar (105) um valor de amplitude ajustado de cada valor de amostra de acordo com o comprimento de normalização adaptativo e o valor de amplitude de cada valor de amostra compreende: calcular, de acordo com o valor de amplitude de cada valor de amostra e o comprimento de normalização adaptativo, um valor de amplitude médio que corresponde a cada valor de amostra, e determinar, de acordo com o valor de amplitude médio que corresponde a cada valor de amostra, um valor de distúrbio de amplitude que corresponde a cada valor de amostra; e calcular o valor de amplitude ajustado de cada valor de amostra de acordo com o valor de amplitude de cada valor de amostra e de acordo com o valor de distúrbio de amplitude que corresponde a cada valor de amostra; em que calcular o valor de amplitude ajustado de cada valor de amostra de acordo com o valor de amplitude de cada valor de amostra e de acordo com o valor de distúrbio de amplitude que corresponde a cada valor de amostra compreende: subtrair o valor de distúrbio de amplitude que corresponde a cada valor de amostra do valor de amplitude de cada valor de amostra, para obter uma diferença entre o valor de amplitude de cada valor de amostra e o valor de distúrbio de amplitude que corresponde a cada valor de amostra, e usar a diferença obtida como o valor de amplitude ajustado de cada valor de amostra; em que calcular, de acordo com o valor de amplitude de cada valor de amostra e o comprimento de normalização adaptativo, um valor de amplitude médio que corresponde a cada valor de amostra compreende: determinar, para cada valor de amostra e de acordo com o comprimento de normalização adaptativo, uma sub-banda à qual o valor de amostra pertence; em que, a sub-banda inclui certo número de valores de amostra; em que determinar, para cada valor de amostra e de acordo com o comprimento de normalização adaptativo, uma sub-banda à qual o valor de amostra pertence compreende: para cada valor de amostra, determinar uma sub-banda que consiste em m valores de amostra antes do valor de amostra, o valor de amostra, e n valores de amostra após o valor de amostra como a subbanda à qual o valor de amostra pertence, em que m e n dependem do comprimento de normalização adaptativo, m é um número inteiro não menor que 0, e n é um número inteiro não menor que 0; e calcular um valor médio de valores de amplitude de todos os valores de amostra na sub-banda à qual o valor de amostra pertence, e usar o valor médio obtido por meio de cálculo como o valor de amplitude médio que corresponde ao valor de amostra.
2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que calcular o comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio e a quantidade das sub-bandas compreende: calcular o comprimento de normalização adaptativo de acordo com uma fórmula L = K +</xM, em que L é o comprimento de normalização adaptativo; K é um valor numérico que corresponde ao tipo de sinal do sinal de banda de alta frequência no sinal de fala/áudio, e diferentes tipos de sinal de sinais de banda de alta frequência correspondem a diferentes valores numéricos K; M é a quantidade das sub-bandas cujas razões de pico para média são maiores que o limiar predefinido de razão de pico para média; e α é uma constante menor que 1.
3. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que determinar um comprimento de normalização adaptativo compreende: calcular uma razão de pico para média de um sinal de banda de baixa frequência no sinal de fala/áudio e uma razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência for menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência não for menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido, em que o primeiro valor de comprimento é maior que o segundo valor de comprimento; ou calcular uma razão de pico para média de um sinal de banda de baixa frequência no sinal de fala/áudio e uma razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando a razão de pico para média do sinal de banda de baixa frequência for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando a razão de pico para média do sinal de banda de baixa frequência não for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido; ou determinar o comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio, em que diferentes tipos de sinal de sinais de banda de alta frequência correspondem a diferentes comprimentos de normalização adaptativos.
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, CARACTERIZADO pelo fato de que a determinação de um segundo sinal de fala/áudio de acordo com o símbolo de cada valor de amostra e o valor de amplitude ajustado de cada valor de amostra compreende: determinar um novo valor de cada valor de amostra de acordo com o símbolo e o valor de amplitude ajustado de cada valor de amostra, para obter o segundo sinal de fala/áudio; ou calcular um fator de modificação; realizar processamento de modificação em um valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra de acordo com o fator de modificação; e determinar um novo valor de cada valor de amostra de acordo com o símbolo de cada valor de amostra e um valor de amplitude ajustado que é obtido após o processamento de modificação, para obter o segundo sinal de fala/áudio.
5. Método, de acordo com a reivindicação 4, CARACTERIZADO pelo fato de que o cálculo de um fator de modificação compreende: calcular o fator de modificação com o uso de uma fórmula β = a/L, em que β é o fator de modificação, L é o comprimento de normalização adaptativo, e a é uma constante maior que 1.
6. Método, de acordo com a reivindicação 4 ou 5, CARACTERIZADO pelo fato de que a realização de processamento de modificação em um valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra de acordo com o fator de modificação compreende: realizar processamento de modificação no valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra com o uso da seguinte fórmula: Y = y x (b - β); ; em que Y é o valor de amplitude ajustado obtido após o processamento de modificação; y é o valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra; e b é uma constante, e 0 < b < 2.
7. Aparelho para reconstruir um componente de ruído de um sinal de fala/áudio, CARACTERIZADO pelo fato de que compreende: uma unidade de processamento de fluxo de bits (410), configurada para receber um fluxo de bits e decodificar o fluxo de bits, para obter um sinal de fala/áudio; uma unidade de determinação de sinal (420), configurada para determinar um primeiro sinal de fala/áudio de acordo com o sinal de fala/áudio obtido pela unidade de processamento de fluxo de bits, em que o primeiro sinal de fala/áudio é um sinal, cujo componente de ruído precisa ser reconstruído, no sinal de fala/áudio obtido por meio de decodificação; uma primeira unidade de determinação (430), configurada para determinar uma sinalização de cada valor de amostra no primeiro sinal de fala/áudio determinado pela unidade de determinação de sinal e um valor de amplitude de cada valor de amostra no primeiro sinal de fala/áudio determinado pela unidade de determinação de sinal; uma segunda unidade de determinação (440), configurada para determinar um comprimento de normalização adaptativo; em que a segunda unidade de determinação compreende: uma subunidade de divisão, configurada para dividir um sinal de banda de baixa frequência no sinal de fala/áudio em N sub-bandas, em que N é um número natural; uma subunidade de determinação de quantidade, configurada para calcular uma razão de pico para média de cada sub-banda, e determinar uma quantidade de sub-bandas cujas razões de pico para média são maiores que um limiar predefinido de razão de pico para média; e uma subunidade de cálculo de comprimento, configurada para calcular o comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio e a quantidade das sub-bandas; uma terceira unidade de determinação (450), configurada para determinar um valor de amplitude ajustado de cada valor de amostra de acordo com o comprimento de normalização adaptativo determinado pela segunda unidade de determinação e o valor de amplitude que é de cada valor de amostra e é determinado pela primeira unidade de determinação; e uma quarta unidade de determinação (460), configurada para determinar um segundo sinal de fala/áudio de acordo com a sinalização que é de cada valor de amostra e é determinada pela primeira unidade de determinação e o valor de amplitude ajustado que é de cada valor de amostra e é determinado pela terceira unidade de determinação, em que o segundo sinal de fala/áudio é um sinal obtido após o componente de ruído do primeiro sinal de fala/áudio ser reconstruído; em que a terceira unidade de determinação (450) compreende: uma subunidade de determinação, configurada para calcular, de acordo com o valor de amplitude de cada valor de amostra e o comprimento de normalização adaptativo, um valor de amplitude médio que corresponde a cada valor de amostra, e determinar, de acordo com o valor de amplitude médio que corresponde a cada valor de amostra, um valor de distúrbio de amplitude que corresponde a cada valor de amostra; e uma subunidade de cálculo de valor de amplitude ajustado, configurada para calcular o valor de amplitude ajustado de cada valor de amostra de acordo com o valor de amplitude de cada valor de amostra e de acordo com o valor de distúrbio de amplitude que corresponde a cada valor de amostra; em que a subunidade de cálculo de valor de amplitude ajustado é especificamente configurada para: subtrair o valor de distúrbio de amplitude que corresponde a cada valor de amostra do valor de amplitude de cada valor de amostra, para obter uma diferença entre o valor de amplitude de cada valor de amostra e o valor de distúrbio de amplitude que corresponde a cada valor de amostra, e usar a diferença obtida como o valor de amplitude ajustado de cada valor de amostra; em que a subunidade de determinação compreende: um módulo de determinação, configurado para determinar, para cada valor de amostra e de acordo com o comprimento de normalização adaptativo, uma sub-banda à qual o valor de amostra pertence; em que, a subbanda inclui certo número de valores de amostra; em que o módulo de determinação é especificamente configurado para: para cada valor de amostra, determinar uma sub-banda que consiste em m valores de amostra antes do valor de amostra, o valor de amostra, e n valores de amostra após o valor de amostra como a sub-banda à qual o valor de amostra pertence, em que m e n dependem do comprimento de normalização adaptativo, m é um número inteiro não menor que 0, e n é um número inteiro não menor que 0; e um módulo de cálculo, configurado para calcular um valor médio de valores de amplitude de todos os valores de amostra na sub-banda à qual o valor de amostra pertence, e usar o valor médio obtido por meio de cálculo como o valor de amplitude médio que corresponde ao valor de amostra.
8. Aparelho, de acordo com a reivindicação 7, CARACTERIZADO pelo fato de que a subunidade de cálculo de comprimento é especificamente configurada para: calcular o comprimento de normalização adaptativo de acordo com uma fórmula L = K + </xM, em que Léo comprimento de normalização adaptativo; K é um valor numérico que corresponde ao tipo de sinal do sinal de banda de alta frequência no sinal de fala/áudio, e diferentes tipos de sinal de sinais de banda de alta frequência correspondem a diferentes valores numéricos K; M é a quantidade das sub-bandas cujas razões de pico para média são maiores que o limiar predefinido de razão de pico para média; e α é uma constante menor que 1.
9. Aparelho, de acordo com qualquer uma das reivindicações 7 a 8, CARACTERIZADO pelo fato de que a segunda unidade de determinação (440) é especificamente configurada para: calcular uma razão de pico para média de um sinal de banda de baixa frequência no sinal de fala/áudio e uma razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência for menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando um valor absoluto de uma diferença entre a razão de pico para média do sinal de banda de baixa frequência e a razão de pico para média do sinal de banda de alta frequência não for menor que um limiar predefinido de diferença, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido, em que o primeiro valor de comprimento é maior que o segundo valor de comprimento; ou calcular uma razão de pico para média de um sinal de banda de baixa frequência no sinal de fala/áudio e uma razão de pico para média de um sinal de banda de alta frequência no sinal de fala/áudio; e quando a razão de pico para média do sinal de banda de baixa frequência for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um primeiro valor de comprimento predefinido, ou quando a razão de pico para média do sinal de banda de baixa frequência não for menor que a razão de pico para média do sinal de banda de alta frequência, determinar o comprimento de normalização adaptativo como um segundo valor de comprimento predefinido; ou determinar o comprimento de normalização adaptativo de acordo com um tipo de sinal de um sinal de banda de alta frequência no sinal de fala/áudio, em que diferentes tipos de sinal de sinais de banda de alta frequência correspondem a diferentes comprimentos de normalização adaptativos.
10. Aparelho, de acordo com qualquer uma das reivindicações 7 a 9, CARACTERIZADO pelo fato de que a quarta unidade de determinação (460) é configurada especificamente para: determinar um novo valor de cada valor de amostra de acordo com o símbolo e o valor de amplitude ajustado de cada valor de amostra, para obter o segundo sinal de fala/áudio; ou calcular um fator de modificação; realizar processamento de modificação em um valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra de acordo com o fator de modificação; e determinar um novo valor de cada valor de amostra de acordo com o símbolo de cada valor de amostra e um valor de amplitude ajustado que é obtido após o processamento de modificação, para obter o segundo sinal de fala/áudio.
11. Aparelho, de acordo com a reivindicação 7, CARACTERIZADO pelo fato de que a quarta unidade de determinação (460) é especificamente configurada para calcular o fator de modificação com o uso de uma fórmula β = a/L, em que β é o fator de modificação, L é o comprimento de normalização adaptativo, e a é uma constante maior que 1.
12. Aparelho, de acordo com a reivindicação 7 ou 11, CARACTERIZADO pelo fato de que a quarta unidade de determinação (460) é especificamente configurada para: realizar processamento de modificação no valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra com o uso da seguinte fórmula: Y=y x (b - β); ; em que Y é o valor de amplitude ajustado obtido após o processamento de modificação; y é o valor de amplitude ajustado, que é maior que 0, nos valores de amplitude ajustados dos valores de amostra; e b é uma constante, e 0 < b < 2.
BR112016028375-9A 2014-06-03 2015-01-19 Método para processar sinal de fala/áudio e aparelho BR112016028375B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410242233.2 2014-06-03
CN201410242233.2A CN105336339B (zh) 2014-06-03 2014-06-03 一种语音频信号的处理方法和装置
PCT/CN2015/071017 WO2015184813A1 (zh) 2014-06-03 2015-01-19 一种语音频信号的处理方法和装置

Publications (2)

Publication Number Publication Date
BR112016028375A2 BR112016028375A2 (pt) 2017-08-22
BR112016028375B1 true BR112016028375B1 (pt) 2022-09-27

Family

ID=54766052

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112016028375-9A BR112016028375B1 (pt) 2014-06-03 2015-01-19 Método para processar sinal de fala/áudio e aparelho

Country Status (19)

Country Link
US (3) US9978383B2 (pt)
EP (3) EP4283614A3 (pt)
JP (3) JP6462727B2 (pt)
KR (3) KR101943529B1 (pt)
CN (2) CN105336339B (pt)
AU (1) AU2015271580B2 (pt)
BR (1) BR112016028375B1 (pt)
CA (1) CA2951169C (pt)
CL (1) CL2016003121A1 (pt)
ES (1) ES2964221T3 (pt)
HK (1) HK1220543A1 (pt)
IL (1) IL249337B (pt)
MX (2) MX362612B (pt)
MY (1) MY179546A (pt)
NZ (1) NZ727567A (pt)
RU (1) RU2651184C1 (pt)
SG (1) SG11201610141RA (pt)
WO (1) WO2015184813A1 (pt)
ZA (1) ZA201608477B (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105336339B (zh) * 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
CN108133712B (zh) * 2016-11-30 2021-02-12 华为技术有限公司 一种处理音频数据的方法和装置
CN106847299B (zh) * 2017-02-24 2020-06-19 喜大(上海)网络科技有限公司 延时的估计方法及装置
RU2754497C1 (ru) * 2020-11-17 2021-09-02 федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет" (ФГАОУ ВО КФУ) Способ передачи речевых файлов по зашумленному каналу и устройство для его реализации
US20230300524A1 (en) * 2022-03-21 2023-09-21 Qualcomm Incorporated Adaptively adjusting an input current limit for a boost converter

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6261312B1 (en) 1998-06-23 2001-07-17 Innercool Therapies, Inc. Inflatable catheter for selective organ heating and cooling and method of using the same
SE9803698L (sv) * 1998-10-26 2000-04-27 Ericsson Telefon Ab L M Metoder och anordningar i ett telekommunikationssystem
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6687668B2 (en) * 1999-12-31 2004-02-03 C & S Technology Co., Ltd. Method for improvement of G.723.1 processing time and speech quality and for reduction of bit rate in CELP vocoder and CELP vococer using the same
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
US6708147B2 (en) * 2001-02-28 2004-03-16 Telefonaktiebolaget Lm Ericsson(Publ) Method and apparatus for providing comfort noise in communication system with discontinuous transmission
US20030093270A1 (en) * 2001-11-13 2003-05-15 Domer Steven M. Comfort noise including recorded noise
EP1701340B1 (en) * 2001-11-14 2012-08-29 Panasonic Corporation Decoding device, method and program
US7536298B2 (en) * 2004-03-15 2009-05-19 Intel Corporation Method of comfort noise generation for speech communication
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
US8255213B2 (en) 2006-07-12 2012-08-28 Panasonic Corporation Speech decoding apparatus, speech encoding apparatus, and lost frame concealment method
KR101396140B1 (ko) 2006-09-18 2014-05-20 코닌클리케 필립스 엔.브이. 오디오 객체들의 인코딩과 디코딩
CN101320563B (zh) * 2007-06-05 2012-06-27 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
CN101335003B (zh) * 2007-09-28 2010-07-07 华为技术有限公司 噪声生成装置、及方法
US8139777B2 (en) * 2007-10-31 2012-03-20 Qnx Software Systems Co. System for comfort noise injection
CN101483042B (zh) * 2008-03-20 2011-03-30 华为技术有限公司 一种噪声生成方法以及噪声生成装置
RU2492530C2 (ru) * 2008-07-11 2013-09-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ кодирования/декодирования звукового сигнала посредством использования схемы переключения совмещения имен
EP2146344B1 (en) 2008-07-17 2016-07-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding/decoding scheme having a switchable bypass
CN101483048B (zh) 2009-02-06 2010-08-25 凌阳科技股份有限公司 光学储存装置及其回路增益值的自动校正方法
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
CN102436820B (zh) 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
EP3346465A1 (en) * 2011-05-13 2018-07-11 Samsung Electronics Co., Ltd. Audio decoding with noise filling
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
DE102011106033A1 (de) 2011-06-30 2013-01-03 Zte Corporation Verfahren und System zur Audiocodierung und -decodierung und Verfahren zur Schätzung des Rauschpegels
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
US20130132100A1 (en) 2011-10-28 2013-05-23 Electronics And Telecommunications Research Institute Apparatus and method for codec signal in a communication system
HUE050600T2 (hu) * 2011-11-03 2021-01-28 Voiceage Evs Llc A nem-beszéd tartalom javítása alacsony sebességû CELP számára
US9305567B2 (en) 2012-04-23 2016-04-05 Qualcomm Incorporated Systems and methods for audio signal processing
CN105336339B (zh) * 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
US12044962B2 (en) 2019-04-19 2024-07-23 Canon Kabushiki Kaisha Forming apparatus, forming method, and article manufacturing method

Also Published As

Publication number Publication date
JP2019061282A (ja) 2019-04-18
US20170084282A1 (en) 2017-03-23
US10657977B2 (en) 2020-05-19
SG11201610141RA (en) 2017-01-27
KR20190009440A (ko) 2019-01-28
EP3147900A4 (en) 2017-05-03
KR102104561B1 (ko) 2020-04-24
JP6817283B2 (ja) 2021-01-20
WO2015184813A1 (zh) 2015-12-10
ZA201608477B (en) 2018-08-29
US11462225B2 (en) 2022-10-04
AU2015271580B2 (en) 2018-01-18
EP3147900B1 (en) 2019-10-02
CN105336339B (zh) 2019-05-03
US20180268830A1 (en) 2018-09-20
CA2951169C (en) 2019-12-31
IL249337B (en) 2020-09-30
JP7142674B2 (ja) 2022-09-27
IL249337A0 (en) 2017-02-28
CN110097892A (zh) 2019-08-06
NZ727567A (en) 2018-01-26
EP3147900A1 (en) 2017-03-29
MX2019001193A (es) 2019-06-12
CN105336339A (zh) 2016-02-17
KR102201791B1 (ko) 2021-01-11
RU2651184C1 (ru) 2018-04-18
CN110097892B (zh) 2022-05-10
CA2951169A1 (en) 2015-12-10
JP6462727B2 (ja) 2019-01-30
US20200279572A1 (en) 2020-09-03
AU2015271580A1 (en) 2017-01-19
KR20170008837A (ko) 2017-01-24
ES2964221T3 (es) 2024-04-04
MX362612B (es) 2019-01-28
EP4283614A2 (en) 2023-11-29
EP3712890B1 (en) 2023-08-30
JP2021060609A (ja) 2021-04-15
JP2017517034A (ja) 2017-06-22
HK1220543A1 (zh) 2017-05-05
MX2016015950A (es) 2017-04-05
US9978383B2 (en) 2018-05-22
MY179546A (en) 2020-11-10
CL2016003121A1 (es) 2017-04-28
KR101943529B1 (ko) 2019-01-29
EP4283614A3 (en) 2024-02-21
BR112016028375A2 (pt) 2017-08-22
KR20200043548A (ko) 2020-04-27
EP3712890A1 (en) 2020-09-23

Similar Documents

Publication Publication Date Title
US11462225B2 (en) Method for processing speech/audio signal and apparatus
ES2882485T3 (es) Procedimiento y aparato de codificación de audio
ES2816014T3 (es) Ocultación de error de trama
RU2702265C1 (ru) Способ и устройство обработки сигналов
BR112015008609B1 (pt) Método e aparelho para alocação de bits de um sinal de áudio
KR20160124877A (ko) 음성 주파수 코드 스트림 디코딩 방법 및 디바이스
KR101941619B1 (ko) 음성/오디오 비트스트림 디코딩 방법 및 장치
BRPI0719728B1 (pt) Sistemas e métodos para normalização dinâmica para reduzir perda em precisão para sinais de baixo nível
BR112015013088B1 (pt) método e aparelho de codificação e método e aparelho de decodificação
BR112016026440B1 (pt) Método, aparelho e sistema de codificação/decodificação
ES2954460T3 (es) Método y aparato de cuantificación de vector de envolventes de frecuencia

Legal Events

Date Code Title Description
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 19/01/2015, OBSERVADAS AS CONDICOES LEGAIS