BR112015029310B1 - Método e dispositivo de codificação de sinal - Google Patents

Método e dispositivo de codificação de sinal Download PDF

Info

Publication number
BR112015029310B1
BR112015029310B1 BR112015029310-7A BR112015029310A BR112015029310B1 BR 112015029310 B1 BR112015029310 B1 BR 112015029310B1 BR 112015029310 A BR112015029310 A BR 112015029310A BR 112015029310 B1 BR112015029310 B1 BR 112015029310B1
Authority
BR
Brazil
Prior art keywords
frame
silence
current input
comfort noise
parameter
Prior art date
Application number
BR112015029310-7A
Other languages
English (en)
Other versions
BR112015029310A2 (pt
Inventor
Zhe Wang
Original Assignee
Huawei Technologies Co., Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co., Ltd filed Critical Huawei Technologies Co., Ltd
Publication of BR112015029310A2 publication Critical patent/BR112015029310A2/pt
Publication of BR112015029310B1 publication Critical patent/BR112015029310B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

método e dispositivo de codificação de sinal. a presente invenção refere-se a um método e a um dispositivo de codificação de sinal. o método inclui: predizer, em um caso em que uma forma de codificação de um quadro anterior de um quadro de quadro de entrada atual é uma forma de codificação contínua, um ruído de conforto que é gerado por um decodificador em conformidade com o quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro sid e determinar um sinal de silêncio real (210), em que o quadro de entrada atual é um quadro de silêncio; determinar um grau de desvio entre o ruído de conforto e o sinal de silêncio real (220); determinar uma forma de codificação do quadro de entrada atual em conformidade com o grau de desvio, em que a forma de codificação do quadro de entrada atual inclui uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro sid (230); e codificar o quadro de entrada atual em conformidade com a forma de codificação do quadro de entrada atual (240). é determinado, de acordo com o grau de desvio entre o ruído de conforto e o sinal de silêncio real, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão ou a forma de codificação de quadro sid, que pode salvar a largura de banda de comunicação.

Description

CAMPO DA TÉCNICA
[0001] A presente invenção refere-se ao campo de processamentode sinal e, particularmente, a um método e dispositivo de codificação de sinal.
ANTECEDENTES DA INVENÇÃO
[0002] Um sistema de transmissão descontínua (DiscontinuousTransmission, DTX) é um sistema de comunicação por voz amplamente aplicado, em que, em um período de silêncio da comunicação por voz, uma forma de codificar e transmitir descontinuamente um quadro de voz pode ser usada para reduzir a ocupação da largura de banda de canal e, entretanto, a qualidade de chamada subjetiva adequada pode ainda ser assegurada.
[0003] Os sinais de voz podem ser usualmente classificados emdois tipos, ou seja, um sinal de voz ativo e um sinal de silêncio. O sinal de voz ativo refere-se a um sinal que inclui uma voz de chamada, e o sinal de silêncio refere-se a um sinal que não inclui uma voz de chamada. No sistema DTX, o sinal de voz ativo é transmitido com o uso de um método de transmissão contínua, e o sinal de silêncio é transmitido com o uso de um método de transmissão descontínua. A transmissão descontínua do sinal de silêncio é implantada da seguinte forma: um codificador codificar e envia intermitentemente um quadro de codificação especial, ou seja, um quadro descritor de silêncio (Silence Descriptor, SID), em que, no sistema DTX, nenhum dentre qualquer outro sinal é codificado entre dois quadros SID adjacentes. Um decodificador gera discricionariamente, de acordo com os quadros SID descontinuamente recebidos, um ruído que permite a audição subjetiva confortável de um usuário. O ruído de conforto (Comfort Noise, CN) não visa restaurar precisamente um sinal de silêncio original, mas visa satisfazer uma exigência de um usuário de decodificador na qualidade auditiva subjetiva e permitir que o usuário não se sinta desconfortável.
[0004] A fim de obter uma melhor qualidade auditiva subjetiva nodecodificador, a qualidade da transição de uma banda de voz ativa para uma banda de CN é crítica. Para se obter uma transição mais suave, um método eficaz é que: durante a transição de uma banda de voz ativa para uma banda de silêncio, o codificador não transita para um estado de transmissão descontínua imediatamente, mas atrasa adicionalmente por um período de tempo. Nesse período de tempo, alguns quadros de silêncio no começo da banda de silêncio são ainda considerados como quadros de voz ativos e são continuamente codificados e enviados, isto é, um a intervalo de desconexão de transmissão contínua é definido. A vantagem dessa medição reside no fato de que: o decodificador pode usar completamente um sinal de silêncio dentro do intervalo de desconexão para melhor estimar e extrair um recurso do sinal de silêncio, de modo a gerar um melhor CN.
[0005] Entretanto, na técnica anterior, um mecanismo dedesconexão não é eficazmente controlado. Uma condição para ativar o mecanismo de desconexão é relativamente simples, isto é, a possibilidade de ativar o mecanismo de desconexão é determinada simplesmente verificando se há quadros de voz ativos suficientes para serem continuamente codificados e enviados no final de uma atividade de voz; após o mecanismo de desconexão ser ativado, um intervalo de desconexão a uma duração fixa pode ser executado compulsoriamente. Entretanto, é desnecessário que um intervalo de desconexão a uma duração fixa deva ser executado quando há quadros de voz ativos suficientes para serem continuamente codificados e enviados, por exemplo, quando um ruído de fundo de um ambiente de comunicação é estável, mesmo se nenhum intervalo de desconexão for definido ou um intervalo de desconexão curto for definido, o decodificador pode obter um CN que tem uma melhor qualidade. Portanto, esse modo de controlar de modo simples o mecanismo de desconexão causa o desperdício de largura de banda de comunicação.
SUMÁRIO
[0006] As modalidades da presente invenção fornecem umdispositivo e método de codificação de sinal, que podem salvar a largura de banda de comunicação.
[0007] De acordo com um primeiro aspecto, um método decodificação de sinal é fornecido que inclui: predizer, em um caso em que uma forma de codificação de um quadro anterior de um quadro de entrada atual é uma forma de codificação contínua, um ruído de conforto que é gerado por um decodificador em conformidade com o quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro descritor de silêncio SID e determinar um sinal de silêncio real, em que o quadro de entrada atual é um quadro de silêncio; determinar um grau de desvio entre o ruído de conforto e o sinal de silêncio real; determinar uma forma de codificação do quadro de entrada atual em conformidade com o grau de desvio, em que a forma de codificação do quadro de entrada atual inclui uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro SID; e codificar o quadro de entrada atual em conformidade com a forma de codificação do quadro de entrada atual.
[0008] Em referência ao primeiro aspecto, em uma primeira formade implantação possível, a predição de um ruído de conforto que é gerado por um decodificador em conformidade com o quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro SID, e a determinação de um sinal de silêncio real inclui: predizer um parâmetro de recurso do ruído de conforto e determinar um parâmetro de recurso do sinal de silêncio real, em que o parâmetro de recurso do ruído de conforto está em uma correspondência de um para um com o parâmetro de recurso do sinal de silêncio real; ea determinação de um grau de desvio entre o ruído de conforto e o sinal de silêncio real inclui: determinar uma distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real.
[0009] Em referência à primeira forma de implantação possível doprimeiro aspecto, em uma segunda forma de implantação possível, a determinação de uma forma de codificação do quadro de entrada atual de acordo com o grau de desvio inclui: determinar, em um caso em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é menor do que um limite correspondente em um conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID, em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real está em uma correspondência de um para um com o limite no conjunto de limites; e determinar, em um caso em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é maior ou igual ao limite correspondente no conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
[00010] Em referência à primeira forma de implantação possível ou à segunda forma de implantação possível do primeiro aspecto, em uma terceira forma de implantação possível, o parâmetro de recurso do ruído de conforto é usado para representar pelo menos uma das seguintes informações: informações de energia e informações espectrais.
[00011] Em referência à terceira forma de implantação possível do primeiro aspecto, em uma quarta forma de implantação possível, as informações de energia incluem a energia de excitação de predição linear excitada por código CELP;as informações espectrais incluem pelo menos um dos seguintes: um coeficiente de filtro preditivo linear, um coeficiente de transformada rápida de Fourier FFT e um coeficiente de transformada discreta de cosseno modificada MDCT; eo coeficiente de filtro preditivo linear inclui pelo menos um dos seguintes: um coeficiente de frequência espectral linear LSF, um coeficiente de par espectral linear LSP, um coeficiente de frequência espectral de imitância ISF, um coeficiente de par espectral de imitância ISP, um coeficiente de reflexão e um coeficiente de codificação preditiva linear LPC.
[00012] Em referência a qualquer forma de implantação da primeira forma de implantação possível à quarta forma de implantação possível do primeiro aspecto, em uma quinta forma de implantação possível, a predição de um parâmetro de recurso do ruído de conforto inclui: predizer o parâmetro de recurso do ruído de conforto em conformidade com um parâmetro de ruído de conforto do quadro anterior do quadro de entrada atual e um parâmetro de recurso do quadro de entrada atual; ou predizer o parâmetro de recurso do ruído de conforto em conformidade com os parâmetros de recurso de L quadros de desconexão que precedem o quadro de entrada atual e um parâmetro de recurso do quadro de entrada atual, em que L é um número inteiro positivo.
[00013] Em referência a qualquer forma de implantação da primeira forma de implantação possível à quinta forma de implantação possível do primeiro aspecto, em uma sexta forma de implantação possível, a determinação de um parâmetro de recurso do sinal de silêncio real inclui: determinar que o parâmetro de recurso do quadro de entrada atual é o parâmetro de recurso do sinal de silêncio real; ou coletar as estatísticas sobre os parâmetros de recurso de M quadros de silêncio para determinar o parâmetro de recurso do sinal de silêncio real.
[00014] Em referência à sexta forma de implantação possível do primeiro aspecto, em uma sétima forma de implantação possível, os M quadros de silêncio incluem o quadro de entrada atual e os (M-1) quadros de silêncio que precedem o quadro de entrada atual, em que M é um número inteiro positivo.
[00015] Em referência à segunda forma de implantação possível do primeiro aspecto, em uma oitava forma de implantação possível, o parâmetro de recurso do ruído de conforto inclui a energia de excitação de predição linear excitada por código CELP do ruído de conforto e um coeficiente de frequência espectral linear LSF do ruído de conforto e o parâmetro de recurso do sinal de silêncio real inclui a energia de excitação de CELP do sinal de silêncio real e um coeficiente de LSF do sinal de silêncio real; ea determinação de uma distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real inclui: determinar uma distância De entre a energia de excitação de CELP do ruído de conforto e a energia de excitação de CELP do sinal de silêncio real e determinar uma distância Dlsf entre o coeficiente de LSF do ruído de conforto e o coeficiente de LSF do sinal de silêncio real.
[00016] Em referência à oitava forma de implantação possível do primeiro aspecto, em uma nona forma de implantação possível, a determinação, em um caso em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é menor do que um limite correspondente em um conjunto de limites, de que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID inclui: determinar, em um caso em que a distância De é menor do que um primeiro limite e a distância Dlsf é menor do que um segundo limite, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID; e determinação, em um caso em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é maior ou igual ao limite correspondente no conjunto de limites, de que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão inclui: determinar, em um caso em que a distância De é maior ou igual ao primeiro limite ou a distância Dlsf é maior ou igual ao segundo limite, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
[00017] Em referência à nona forma de implantação possível do primeiro aspecto, em uma décima forma de implantação possível, o método inclui adicionalmente: adquirir o primeiro limite predefinido e o segundo limite predefinido; ou determinar o primeiro limite em conformidade com a energia de excitação de CELP de N quadros de silêncio que precedem o quadro de entrada atual e determinar o segundo limite em conformidade com os coeficientes de LSF dos N quadros de silêncio, em que N é um número inteiro positivo.
[00018] Em referência ao primeiro aspecto ou qualquer forma de implantação da primeira forma de implantação possível à décima forma de implantação possível do primeiro aspecto, em uma décima-primeira forma de implantação possível, a predição de um ruído de conforto que é gerado por um decodificador de acordo com o quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro SID inclui: predizer o ruído de conforto de uma primeira forma de predição, em que a primeira forma de predição é igual a uma forma na qual o decodificador gera o ruído de conforto.
[00019] De acordo com um segundo aspecto, um método de processamento de sinal é fornecido que inclui: determinar uma distância espectral ponderada em grupo de cada quadro de silêncio em P quadros de silêncio, em que a distância espectral ponderada em grupo de cada quadro de silêncio nos P quadros de silêncio é a soma das distâncias espectrais ponderadas entre cada quadro de silêncio nos P quadros de silêncio e os outros (P-1) quadros de silêncio, em que P é um número inteiro positivo; e determinar um primeiro parâmetro espectral em conformidade com a distância espectral ponderada em grupo de cada quadro de silêncio nos P quadros de silêncio, em que o primeiro parâmetro espectral é usado para gerar um ruído de conforto.
[00020] Em referência ao segundo aspecto, em uma primeira forma de implantação possível, cada quadro de silêncio corresponde a um grupo de coeficientes de ponderação, em que, no grupo de coeficientes de ponderação, um coeficiente de ponderação que corresponde a um primeiro grupo de sub-bandas é maior do que um coeficiente de ponderação que corresponde a um segundo grupo de sub-bandas, e a importância perceptiva do primeiro grupo de sub-bandas é maior do que a importância perceptiva do segundo grupo de sub-bandas.
[00021] Em referência ao segundo aspecto ou à primeira forma de implantação possível do segundo aspecto, em uma segunda forma de implantação possível, a determinação de um primeiro parâmetro espectral de acordo com a distância espectral ponderada em grupo de cada quadro de silêncio nos P quadros de silêncio inclui: selecionar um primeiro quadro de silêncio dentre os P quadros de silêncio, de modo que uma distância espectral ponderada em grupo do primeiro quadro de silêncio nos P quadros de silêncio seja a menor; e determinar que um parâmetro espectral do primeiro quadro de silêncio é o primeiro parâmetro espectral.
[00022] Em referência ao segundo aspecto ou à primeira forma de implantação possível do segundo aspecto, em uma terceira forma de implantação possível, a determinação de um primeiro parâmetro espectral de acordo com a distância espectral ponderada em grupo de cada quadro de silêncio nos P quadros de silêncio inclui: selecionar pelo menos um quadro de silêncio dentre os P quadros de silêncio, de modo que uma distância espectral ponderada em grupo do pelo menos um quadro de silêncio nos P quadros de silêncio seja menor do que um terceiro limite; e determinar o primeiro parâmetro espectral em conformidade com um parâmetro espectral do pelo menos um quadro de silêncio.
[00023] Em referência ao segundo aspecto ou qualquer forma de implantação da primeira forma de implantação possível à terceira forma de implantação possível do segundo aspecto, em uma quarta forma de implantação possível, os P quadros de silêncio incluem um quadro de silêncio de entrada atual e (P-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual.
[00024] Em referência à quarta forma de implantação possível do segundo aspecto, em uma quinta forma de implantação possível, o método inclui adicionalmente: codificar o quadro de silêncio de entrada atual em um quadro descritor de silêncio SID, em que o quadro SID inclui o primeiro parâmetro espectral.
[00025] De acordo com um terceiro aspecto, um método de processamento de sinal é fornecido que inclui: dividir uma banda de frequência de um sinal de entrada em R sub-bandas, em que R é um número inteiro positivo; determinar, em cada sub-banda das R subbandas, uma distância espectral de grupo de sub-banda de cada quadro de silêncio em S quadros de silêncio, em que a distância espectral de grupo de sub-banda de cada quadro de silêncio nos S quadros de silêncio é a soma das distâncias espectrais entre cada quadro de silêncio nos S quadros de silêncio em cada sub-banda e os outros (S- 1) quadros de silêncio, e S é um número inteiro positivo; e determinar, em cada sub-banda, um primeiro parâmetro espectral de cada subbanda, em conformidade com a distância espectral de grupo de sub- banda em grupo de cada quadro de silêncio nos S quadros de silêncio, em que o primeiro parâmetro espectral de cada sub-banda é usado para gerar um ruído de conforto.
[00026] Em referência ao terceiro aspecto, em uma primeira forma de implantação possível, a determinação, em cada sub-banda, de um primeiro parâmetro espectral de cada sub-banda em conformidade com a distância espectral de grupo de sub-banda de cada quadro de silêncio nos S quadros de silêncio inclui: selecionar, em cada sub-banda, um primeiro quadro de silêncio dos S quadros de silêncio, de modo que uma distância espectral de grupo de sub-banda do primeiro quadro de silêncio nos S quadros de silêncio em cada sub-banda seja a menor; e determinar, em cada sub-banda, que um parâmetro espectral do primeiro quadro de silêncio é o primeiro parâmetro espectral de cada sub-banda.
[00027] Em referência ao segundo aspecto, em uma primeira forma de implantação possível, a determinação, em cada sub-banda, de um primeiro parâmetro espectral de cada sub-banda em conformidade com a distância espectral de grupo de sub-banda de cada quadro de silêncio nos S quadros de silêncio inclui: selecionar, em cada sub-banda, pelo menos um quadro de silêncio dentre os S quadros de silêncio, de modo que uma distância espectral de grupo de sub-banda do pelo menos um quadro de silêncio seja menor do que um quarto limite; e determinar, em cada sub-banda, o primeiro parâmetro espectral de cada sub-banda em conformidade com um parâmetro espectral do pelo menos um quadro de silêncio.
[00028] Em referência ao terceiro aspecto ou à primeira forma de implantação possível ou à segunda forma de implantação possível do terceiro aspecto, em uma terceira forma de implantação possível, os S quadros de silêncio incluem um quadro de silêncio de entrada atual e (S-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual.
[00029] Em referência à terceira forma de implantação possível do terceiro aspecto, em uma quarta forma de implantação possível, o método inclui adicionalmente: codificar o quadro de silêncio de entrada atual em um quadro descritor de silêncio SID, em que o quadro SID inclui o primeiro parâmetro espectral de cada sub-banda.
[00030] De acordo com um quarto aspecto, um método de processamento de sinal é fornecido que inclui: determinar um primeiro parâmetro de cada quadro de silêncio em T quadros de silêncio, em que o primeiro parâmetro é usado para representar a entropia espectral, e T é um número inteiro positivo; e determinar um primeiro parâmetro espectral em conformidade com o primeiro parâmetro de cada quadro de silêncio nos T quadros de silêncio, em que o primeiro parâmetro espectral é usado para gerar um ruído de conforto.
[00031] Em referência ao quarto aspecto, em uma primeira forma de implantação possível, a determinação de um primeiro parâmetro espectral em conformidade com o primeiro parâmetro de cada quadro de silêncio nos T quadros de silêncio inclui: determinar, em um caso em que é determinado que os T quadros de silêncio podem ser classificados em um primeiro grupo de quadros de silêncio e um segundo grupo de quadros de silêncio em conformidade com um critério de agrupamento, o primeiro parâmetro espectral em conformidade com um parâmetro espectral do primeiro grupo de quadros de silêncio, em que a entropia espectral representada pelos primeiros parâmetros do primeiro grupo de quadros de silêncio é maior do que a entropia espectral representada pelos primeiros parâmetros do segundo grupo de quadros de silêncio; e realizar, em um caso em que é determinado que os T quadros de silêncio não podem ser classificados no primeiro grupo de quadros de silêncio e no segundo grupo de quadros de silêncio em conformidade com o critério de agrupamento, a média ponderada nos parâmetros espectrais dos T quadros de silêncio, para determinar o primeiro parâmetro espectral, em que a entropia espectral representada pelos primeiros parâmetros do primeiro grupo de quadros de silêncio é maior do que a entropia espectral representada pelos primeiros parâmetros do segundo grupo de quadros de silêncio.
[00032] Em referência à primeira forma de implantação possível do quarto aspecto, em uma segunda forma de implantação possível, o critério de agrupamento inclui: uma distância entre um primeiro parâmetro de cada quadro de silêncio no primeiro grupo de quadros de silêncio e um primeiro valor médio é menor ou igual a uma distância entre o primeiro parâmetro de cada quadro de silêncio no primeiro grupo de quadros de silêncio e um segundo valor médio; uma distância entre um primeiro parâmetro de cada quadro de silêncio no segundo grupo de quadros de silêncio e o segundo valor médio é menor ou igual a uma distância entre o primeiro parâmetro de cada quadro de silêncio no segundo grupo de quadros de silêncio e o primeiro valor médio; uma distância entre o primeiro valor médio e o segundo valor médio é maior do que uma distância média entre os primeiros parâmetros do primeiro grupo de quadros de silêncio e o primeiro valor médio; e a distância entre o primeiro valor médio e o segundo valor médio é maior do que uma distância média entre os primeiros parâmetros do segundo grupo de quadros de silêncio e o segundo valor médio, em que o primeiro valor médio é um valor médio dos primeiros parâmetros do primeiro grupo de quadros de silêncio, e o segundo valor médio é um valor médio dos primeiros parâmetros do segundo grupo de quadros de silêncio.
[00033] Em referência ao quarto aspecto, em uma terceira forma de implantação possível, a determinação de um primeiro parâmetro espectral em conformidade com o primeiro parâmetro de cada quadro de silêncio nos T quadros de silêncio inclui:
[00034] realizar a média ponderada nos parâmetros espectrais dos T quadros de silêncio para determinar o primeiro parâmetro espectral, em que, para o i-ésimo quadro de silêncio e o j-ésimo quadro de silêncio, que são diferentes, nos T quadros de silêncio, um coeficiente de ponderação que corresponde ao i-ésimo quadro de silêncio é maior ou igual a um coeficiente de ponderação que corresponde ao j-ésimo quadro de silêncio; quando o primeiro parâmetro é positivamente correlacionado à entropia espectral, um primeiro parâmetro do i-ésimo quadro de silêncio é maior do que um primeiro parâmetro do j-ésimo quadro de silêncio; e quando o primeiro parâmetro é negativamente correlacionado à entropia espectral, o primeiro parâmetro do i-ésimo quadro de silêncio é menor do que o primeiro parâmetro do j-ésimo quadro de silêncio, em que i e j são ambos números inteiros positivos, e 1>i>T, e 1>j>T.
[00035] Em referência ao quarto aspecto ou qualquer forma de implantação da primeira forma de implantação possível à terceira forma de implantação possível do quarto aspecto, em uma quarta forma de implantação possível, os T quadros de silêncio incluem um quadro de silêncio de entrada atual e (T-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual.
[00036] Em referência à quarta forma de implantação possível do quarto aspecto, em uma quinta forma de implantação possível, o método inclui adicionalmente: codificar o quadro de silêncio de entrada atual em um quadro descritor de silêncio SID, em que o quadro SID inclui o primeiro parâmetro espectral.
[00037] De acordo com um quinto aspecto, um dispositivo de codificação de sinal é fornecido que inclui: uma primeira unidade de determinação configurada para: predizer, em um caso em que uma forma de codificação de um quadro anterior de um quadro de entrada atual é uma forma de codificação contínua, um ruído de conforto que é gerado por um decodificador em conformidade com o quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro descritor de silêncio SID e determinar um sinal de silêncio real, em que o quadro de entrada atual é um quadro de silêncio; uma segunda unidade de determinação configurada para determinar um grau de desvio entre o ruído de conforto determinado pela primeira unidade de determinação e o sinal de silêncio real determinado pela primeira unidade de determinação; uma terceira unidade de determinação configurada para determinar uma forma de codificação do quadro de entrada atual em conformidade com o grau de desvio determinado pela segunda unidade de determinação, em que a forma de codificação do quadro de entrada atual inclui uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro SID; e uma unidade de codificação configurada para codificar o quadro de entrada atual em conformidade com a forma de codificação do quadro de entrada atual determinada pela terceira unidade de determinação.
[00038] Em referência ao quinto aspecto, em uma primeira forma de implantação possível, a primeira unidade de determinação é especificamente configurada para predizer um parâmetro de recurso do ruído de conforto e determinar um parâmetro de recurso do sinal de silêncio real, em que o parâmetro de recurso do ruído de conforto está em uma correspondência de um para um com o parâmetro de recurso do sinal de silêncio real; e a segunda unidade de determinação é especialmente configurada para determinar uma distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real.
[00039] Em referência à primeira forma de implantação possível do quinto aspecto, em uma segunda forma de implantação possível, a terceira unidade de determinação é especificamente configurada para: determinar, em um caso em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é menor do que um limite correspondente em um conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID, em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real está em uma correspondência de um para um com o limite no conjunto de limites; e determinar, em um caso em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é maior ou igual ao limite correspondente no conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
[00040] Em referência à primeira forma de implantação possível ou à segunda forma de implantação possível do quinto aspecto, em uma terceira forma de implantação possível, a primeira unidade de determinação é especificamente configurada para: predizer o parâmetro de recurso do ruído de conforto em conformidade com um parâmetro de ruído de conforto do quadro anterior do quadro de entrada atual e um parâmetro de recurso do quadro de entrada atual; ou predizer o parâmetro de recurso do ruído de conforto em conformidade com os parâmetros de recurso de L quadros de desconexão que precedem o quadro de entrada atual e um parâmetro de recurso do quadro de entrada atual, em que L é um número inteiro positivo.
[00041] Em referência à primeira forma de implantação possível ou à segunda forma de implantação possível ou à terceira forma de implantação possível do quinto aspecto, em uma quarta forma de implantação possível, a primeira unidade de determinação é especificamente configurada para: determinar que o parâmetro de recurso do quadro de entrada atual é o parâmetro do sinal de silêncio real; ou coletar as estatísticas sobre os parâmetros de recurso de M quadros de silêncio para determinar o parâmetro do sinal de silêncio real.
[00042] Em referência à segunda forma de implantação possível do quinto aspecto, em uma quinta forma de implantação possível, o parâmetro de recurso do ruído de conforto inclui a energia de excitação de predição linear excitada por código CELP do ruído de conforto e um coeficiente de frequência espectral linear LSF do ruído de conforto e o parâmetro de recurso do sinal de silêncio real inclui a energia de excitação de CELP do sinal de silêncio real e um coeficiente de LSF do sinal de silêncio real; e a segunda unidade de determinação é especificamente configurada para determinar uma distância De entre a energia de excitação de CELP do ruído de conforto e a energia de excitação de CELP do sinal de silêncio real e determinar uma distância Dlsf entre o coeficiente de LSF do ruído de conforto e o coeficiente de LSF do sinal de silêncio real.
[00043] Em referência à quinta forma de implantação possível do quinto aspecto, em uma sexta forma de implantação possível, a terceira unidade de determinação é especificamente configurada para: determinar, em um caso em que a distância De é menor do que um primeiro limite e a distância Dlsf é menor do que um segundo limite, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID; e a terceira unidade de determinação é especificamente configurada para: determinar, em um caso em que a distância De é maior ou igual ao primeiro limite ou a distância Dlsf é maior ou igual ao segundo limite, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
[00044] Em referência à sexta forma de implantação possível do quinto aspecto, em uma sétima forma de implantação possível, o dispositivo inclui adicionalmente uma quarta unidade de determinação configurada para: adquirir o primeiro limite predefinido e o segundo limite predefinido; ou determinar o primeiro limite em conformidade com a energia de excitação de CELP de N quadros de silêncio que precedem o quadro de entrada atual e determinar o segundo limite em conformidade com os coeficientes de LSF dos N quadros de silêncio, em que N é um número inteiro positivo.
[00045] Em referência ao quinto aspecto ou qualquer forma de implantação possível da primeira forma de implantação possível à sétima forma de implantação possível do quinto aspecto, em uma oitava forma de implantação possível, a primeira unidade de determinação é especificamente configurada para predizer o ruído de conforto de uma primeira forma de predição, em que a primeira forma de predição é igual a uma forma na qual o decodificador gera o ruído de conforto.
[00046] De acordo com um sexto aspecto, um dispositivo de processamento de sinal é fornecido que inclui: uma primeira unidade de determinação configurada para determinar uma distância espectral ponderada em grupo de cada quadro de silêncio em P quadros de silêncio, em que a distância espectral ponderada em grupo de cada quadro de silêncio nos P quadros de silêncio é a soma das distâncias espectrais ponderadas entre cada quadro de silêncio nos P quadros de silêncio e os outros (P-1) quadros de silêncio, em que P é um número inteiro positivo; e uma segunda unidade de determinação configurada para determinar um primeiro parâmetro espectral em conformidade com a distância espectral ponderada em grupo, determinada pela primeira unidade de determinação, de cada quadro de silêncio nos P quadros de silêncio, em que o primeiro parâmetro espectral é usado para gerar um ruído de conforto.
[00047] Em referência ao sexto aspecto, em uma primeira forma de implantação possível, a segunda unidade de determinação é especificamente configurada para selecionar um primeiro quadro de silêncio dentre os P quadros de silêncio, de modo que uma distância espectral ponderada em grupo do primeiro quadro de silêncio nos P quadros de silêncio seja a menor; e determinar que um parâmetro espectral do primeiro quadro de silêncio é o primeiro parâmetro espectral.
[00048] Em referência ao sexto aspecto, em uma segunda forma de implantação possível, a segunda unidade de determinação é especificamente configurada para selecionar pelo menos um quadro de silêncio dentre os P quadros de silêncio, de modo que uma distância espectral ponderada em grupo do pelo menos um quadro de silêncio nos P quadros de silêncio seja menor do que um terceiro limite; e determinar o primeiro parâmetro espectral em conformidade com um parâmetro espectral do pelo menos um quadro de silêncio.
[00049] Em referência ao sexto aspecto ou à primeira forma de implantação possível ou à segunda forma de implantação possível do sexto aspecto, em uma terceira forma de implantação possível, os P quadros de silêncio incluem um quadro de silêncio de entrada atual e (P-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual; eo dispositivo inclui adicionalmente: uma unidade de codificação configurada para codificar o quadro de silêncio de entrada atual em um quadro descritor de silêncio SID, em que o quadro SID inclui o primeiro parâmetro espectral determinado pela segunda unidade de determinação.
[00050] De acordo com um sétimo aspecto, um dispositivo de processamento de sinal é fornecido que inclui: uma unidade de divisão configurada para dividir uma banda de frequência de um sinal de entrada em R sub-bandas, em que R é um número inteiro positivo; uma primeira unidade de determinação configurada para determinar, em cada sub-banda das R sub-bandas obtidas após a unidade de divisão realizar a divisão, uma distância espectral de grupo de sub-banda de cada quadro de silêncio em S quadros de silêncio, em que a distância espectral de grupo de sub-banda de cada quadro de silêncio nos S quadros de silêncio é a soma das distâncias espectrais entre cada quadro de silêncio nos S quadros de silêncio em cada sub-banda e os outros (S-1) quadros de silêncio, e S é um número inteiro positivo; e uma segunda unidade de determinação configurada para determinar, em cada sub-banda obtida após a unidade de divisão realizar a divisão, um primeiro parâmetro espectral de cada sub-banda em conformidade com a distância espectral de grupo de sub-banda, determinada pela primeira unidade de determinação, de cada quadro de silêncio nos S quadros de silêncio, em que o primeiro parâmetro espectral de cada sub-banda é usado para gerar um ruído de conforto.
[00051] Em referência ao sétimo aspecto, em uma primeira forma de implantação possível, a segunda unidade de determinação é especificamente configurada para selecionar, em cada sub-banda, um primeiro quadro de silêncio dos S quadros de silêncio, de modo que uma distância espectral de grupo de sub-banda do primeiro quadro de silêncio nos S quadros de silêncio em cada sub-banda seja a menor; e determinar, em cada sub-banda, que um parâmetro espectral do primeiro quadro de silêncio é o primeiro parâmetro espectral de cada sub-banda.
[00052] Em referência ao sétimo aspecto, em uma segunda forma de implantação possível, a segunda unidade de determinação é especificamente configurada para selecionar, em cada sub-banda, pelo menos um quadro de silêncio dentre os S quadros de silêncio, de modo que uma distância espectral de grupo de sub-banda do pelo menos um quadro de silêncio seja menor do que um quarto limite; e determinar, em cada sub-banda, o primeiro parâmetro espectral de cada sub-banda em conformidade com um parâmetro espectral do pelo menos um quadro de silêncio.
[00053] Em referência ao sétimo aspecto ou à primeira forma de implantação possível ou à segunda forma de implantação possível do sétimo aspecto, em uma terceira forma de implantação possível, os S quadros de silêncio incluem um quadro de silêncio de entrada atual e (S-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual; eo dispositivo inclui adicionalmente: uma unidade de codificação configurada para codificar o quadro de silêncio de entrada atual em um quadro descritor de silêncio SID, em que o quadro SID inclui o primeiro parâmetro espectral de cada sub-banda.
[00054] De acordo com um oitavo aspecto, um dispositivo de processamento de sinal é fornecido que inclui: uma primeira unidade de determinação configurada para determinar um primeiro parâmetro de cada quadro de silêncio em T quadros de silêncio, em que o primeiro parâmetro é usado para representar a entropia espectral, e T é um número inteiro positivo; e uma segunda unidade de determinação configurada para determinar um primeiro parâmetro espectral em conformidade com o primeiro parâmetro, determinada pela primeira unidade de determinação, de cada quadro de silêncio nos T quadros de silêncio, em que o primeiro parâmetro espectral é usado para gerar um ruído de conforto.
[00055] Em referência ao oitavo aspecto, em uma primeira forma de implantação possível, a segunda unidade de determinação é especificamente configurada para: determinar, em um caso em que é determinado que os T quadros de silêncio podem ser classificados em um primeiro grupo de quadros de silêncio e um segundo grupo de quadros de silêncio em conformidade com um critério de agrupamento, o primeiro parâmetro espectral em conformidade com um parâmetro espectral do primeiro grupo de quadros de silêncio, em que a entropia espectral representada pelos primeiros parâmetros do primeiro grupo de quadros de silêncio é maior do que a entropia espectral representada pelos primeiros parâmetros do segundo grupo de quadros de silêncio; e realizar, em um caso em que é determinado que os T quadros de silêncio não podem ser classificados no primeiro grupo de quadros de silêncio e no segundo grupo de quadros de silêncio em conformidade com o critério de agrupamento, a média ponderada nos parâmetros espectrais dos T quadros de silêncio, para determinar o primeiro parâmetro espectral, em que a entropia espectral representada pelos primeiros parâmetros do primeiro grupo de quadros de silêncio é maior do que a entropia espectral representada pelos primeiros parâmetros do segundo grupo de quadros de silêncio.
[00056] Em referência ao oitavo aspecto, em uma segunda forma de implantação possível, a segunda unidade de determinação é especificamente configurada para realizar a média ponderada nos parâmetros espectrais dos T quadros de silêncio para determinar o primeiro parâmetro espectral,em que para o i-ésimo quadro de silêncio e o j-ésimo quadro de silêncio, que são diferentes, nos T quadros de silêncio, um coeficiente de ponderação que corresponde ao i-ésimo quadro de silêncio é maior ou igual a um coeficiente de ponderação que corresponde ao j-ésimoquadro de silêncio; quando o primeiro parâmetro é positivamente correlacionado à entropia espectral, um primeiro parâmetro do i-ésimo quadro de silêncio é maior do que um primeiro parâmetro do j-ésimo quadro de silêncio; e quando o primeiro parâmetro é negativamente correlacionado à entropia espectral, o primeiro parâmetro do i-ésimo quadro de silêncio é menor do que o primeiro parâmetro do j-ésimo quadro de silêncio, em que i e j são ambos números inteiros positivos, e 1 >i>T, e 1>j>T.
[00057] Em referência ao oitavo aspecto ou à primeira forma de implantação possível ou à segunda forma de implantação possível do oitavo aspecto, em uma terceira forma de implantação possível, os T quadros de silêncio incluem um quadro de silêncio de entrada atual e (T-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual; eo dispositivo inclui adicionalmente: uma unidade de codificação configurada para codificar o quadro de silêncio de entrada atual em um quadro descritor de silêncio SID, em que o quadro SID inclui o primeiro parâmetro espectral.
[00058] Nas modalidades da presente invenção, em um caso em que uma forma de codificação de um quadro anterior de um quadro de entrada atual é uma forma de codificação contínua, um ruído de conforto que é gerado por um decodificador de acordo com o quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro SID é predito, um grau de desvio entre o ruído de conforto e um sinal de silêncio real é determinado, e é determinado, de acordo com o grau de desvio, que uma forma de codificação do quadro de entrada atual é uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro SID, em vez de que quadro de entrada atual é codificado em um quadro de desconexão simplesmente de acordo com uma quantidade, obtida através de uma coleção de estatísticas, de quadros de voz ativos, salvando, assim, a largura de banda de comunicação.
BREVE DESCRIÇÃO DOS DESENHOS
[00059] Para descrever as soluções técnicas nas modalidades da presente invenção mais claramente, o seguinte introduz brevemente os desenhos anexos exigidos para descrever as modalidades da presente invenção. Aparentemente, os desenhos anexos na descrição a seguir mostram apenas algumas modalidades da presente invenção, e um indivíduo de conhecimento comum na técnica pode ainda derivar outros desenhos a partir desses desenhos anexos sem esforços criativos.
[00060] A Figura 1 é um diagrama de blocos esquemático de um sistema de comunicação por voz de acordo com uma modalidade da presente invenção; A Figura 2 é um fluxograma esquemático de um método de codificação de sinal de acordo com uma modalidade da presente invenção; A Figura 3a é um fluxograma esquemático de um processo de um método de codificação de sinal de acordo com uma modalidade da presente invenção; A Figura 3b é um fluxograma esquemático de um processo de um método de codificação de sinal de acordo com outra modalidade da presente invenção; A Figura 4 é um fluxograma esquemático de um método de processamento de sinal de acordo com uma modalidade da presente invenção; A Figura 5 é um fluxograma esquemático de um método de processamento de sinal de acordo com outra modalidade da presente invenção; A Figura 6 é um fluxograma esquemático de um método de processamento de sinal de acordo com outra modalidade da presente invenção; A Figura 7 é um diagrama de blocos esquemático de um dispositivo de codificação de sinal de acordo com uma modalidade da presente invenção; A Figura 8 é um diagrama de blocos esquemático de um dispositivo de processamento de sinal de acordo com outra modalidade da presente invenção; A Figura 9 é um diagrama de blocos esquemático de um dispositivo de processamento de sinal de acordo com outra modalidade da presente invenção; A Figura 10 é um diagrama de blocos esquemático de um dispositivo de processamento de sinal de acordo com outra modalidade da presente invenção; A Figura 11 é um diagrama de blocos esquemático de um dispositivo de codificação de sinal de acordo com outra modalidade da presente invenção; A Figura 12 é um diagrama de blocos esquemático de um dispositivo de processamento de sinal de acordo com outra modalidade da presente invenção; A Figura 13 é um diagrama de blocos esquemático de um dispositivo de processamento de sinal de acordo com outra modalidade da presente invenção; e A Figura 14 é um diagrama de blocos esquemático de um dispositivo de processamento de sinal de acordo com outra modalidade da presente invenção.
DESCRIÇÃO DAS MODALIDADES
[00061] O seguinte descreve clara e completamente as soluções técnicas nas modalidades da presente invenção em referência aos desenhos anexos nas modalidades da presente invenção. Aparentemente, as modalidades descritas são algumas, mas não todas as modalidades da presente invenção. Todas as outras modalidades obtidas por um indivíduo de conhecimento comum na técnica com base nas modalidades da presente invenção sem esforços criativos devem ser abrangidas pelo escopo de proteção da presente invenção.
[00062] A Figura 1 é um diagrama de blocos esquemático de um sistema de comunicação por voz de acordo com uma modalidade da presente invenção.
[00063] Um sistema 100 na Figura 1 pode ser um sistema DTX. O sistema 100 pode incluir um codificador 110 e um decodificador 120.
[00064] O codificador 110 pode truncar um sinal de voz de domínio de tempo de entrada em um quadro de voz, codificar o quadro de voz, e enviar o quadro de voz codificado para o decodificador 120. O decodificador 120 pode receber o quadro de voz codificado do codificador 110, decodificar o quadro de voz codificado e emitir o sinal de voz de domínio de tempo decodificado.
[00065] O codificador 110 pode incluir adicionalmente um detector de atividade de voz (Voice Activity Detector, VAD) 110a. O VAD 110a pode detectar se um quadro de voz de entrada atual é um quadro de voz ativo ou um quadro de silêncio. O quadro de voz ativo pode representar um quadro que inclui um sinal de voz de chamada e o quadro de silêncio pode representar um quadro que não inclui um sinal de voz de chamada. No presente documento, o quadro de silêncio pode incluir um quadro mudo cuja energia é menor do que um limite de silêncio ou pode também incluir um quadro de ruído de fundo. O codificador 110 pode ter dois estados de trabalho, isto é, um estado de transmissão contínua e um estado de transmissão descontínua. Quando o codificador 110 funciona no estado de transmissão contínua, o codificador 110 pode codificar cada quadro de voz de entrada e enviar o quadro codificado. Quando o codificador 110 funciona no estado de transmissão descontínua, o codificador 110 pode não codificar um quadro de voz de entrada ou pode codificar o quadro de voz em um quadro SID. Geralmente, apenas quando o quadro de voz de entrada é um quadro de silêncio, o codificador 110 funciona no estado de transmissão descontínua.
[00066] Quando um quadro de silêncio de entrada atual é o primeiro quadro após o final de uma banda de voz ativa, em que a banda de voz ativa inclui um intervalo de desconexão que pode existir, o codificador 110 pode codificar o quadro de silêncio em um quadro SID, em que SID_FIRST pode ser usado para representar o quadro SID. Quando o quadro de silêncio de entrada atual é o n-ésimo quadro após um quadro SID anterior, em que n é um número inteiro positivo, e não há nenhum quadro de voz ativo entre o quadro de silêncio de entrada atual e o quadro SID anterior, o codificador 110 pode codificar o quadro de silêncio em um quadro SID, em que SID_UPDATE pode ser usado para representar o quadro SID.
[00067] O quadro SID pode incluir algumas informações que descrevem um recurso de um sinal de silêncio. O decodificador pode gerar um ruído de conforto de acordo com as informações de recurso. Por exemplo, o quadro SID pode incluir informações de energia e informações espectrais do sinal de silêncio. Ademais, por exemplo, as informações de energia do sinal de silêncio podem incluir a energia de um sinal de excitação em um modelo de predição linear excitada por código (Code Excited Linear Prediction, CELP) ou energia de domínio do tempo do sinal de silêncio. As informações espectrais podem incluir um coeficiente de frequência espectral linear (Line Spectral Frequency, LSF), um coeficiente de par espectral linear (Line Spectrum Pair, LSP), um coeficiente de frequência espectral de imitância (Immittance Spectral Frequency, ISF), um coeficiente de par espectral de imitância (Immittance Spectral Pair, ISP), um coeficiente de codificação preditiva linear (Linear Predictive Coding, LPC), um coeficiente de transformada rápida de Fourier (Fast Fourier Transform, FFT) ou um coeficiente de transformada discreta de cosseno modificada (Modified Discrete Cosine Transform, MDCT) ou similares.
[00068] O quadro de voz codificado pode incluir três tipos: um quadro de voz codificado, um quadro SID e um quadro NO_DATA. O quadro de voz codificado é um quadro que é codificado pelo codificador 110 em um estado de transmissão contínua, e o quadro NO_DATA pode representar um quadro que não tem nenhum bit codificado, isto é, um quadro que não existe fisicamente, tal como um quadro de silêncio que não é codificado e entre os quadros SID.
[00069] O decodificador 120 pode receber um quadro de voz codificado do codificador 110 e decodificar o quadro de voz codificado. Quando o quadro de voz codificado é recebido, o decodificador pode decodificar diretamente o quadro e emitir um quadro de voz de domínio de tempo. Quando um quadro SID é recebido, o decodificador pode decodificar o quadro SID e obter informações de duração de desconexão, informações de energia e informações espectrais no quadro SID. Especificamente, quando o quadro SID é SID_UPDATE, o decodificador pode obter as informações de energia e informações espectrais de um sinal de silêncio, isto é, obter um parâmetro CN, de acordo com as informações no quadro SID atual ou de acordo com as informações no quadro SID atual e em referência a outras informações, de modo a gerar um quadro CN de domínio de tempo de acordo com o parâmetro CN. Quando o quadro SID é SID_FIRST, o decodificador obtém, de acordo com as informações de duração de desconexão no quadro SID, as informações de estatísticas da energia e espectros em m quadros que precedem o quadro e obtém um parâmetro CN em referência às informações que são obtidas através da decodificação e estão no quadro SID, de modo a gerar um quadro CN de domínio de tempo, em que m é um número inteiro positivo. Quando um quadro NO_DATA é inserido no decodificador, o decodificador obtém um parâmetro CN de acordo com um quadro SID recentemente recebido e em referência a outras informações, de modo a gerar um quadro CN de domínio de tempo.
[00070] A Figura 2 é um fluxograma esquemático de um método de codificação de sinal de acordo com uma modalidade da presente invenção. O método na Figura 2 é executado por um codificador, por exemplo, pode ser executado pelo codificador 110 na Figura 1.
[00071] 210: Predizer, em um caso em que uma forma de codificaçãode um quadro anterior de um quadro de entrada atual é uma forma de codificação contínua, um ruído de conforto que é gerado por um decodificador em conformidade com o quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro SID e determinar um sinal de silêncio real, em que o quadro de entrada atual é um quadro de silêncio.
[00072] Nessa modalidade da presente invenção, o sinal de silêncio real pode se referir a um sinal de silêncio real inserido no codificador.
[00073] 220: Determinar um grau de desvio entre o ruído de confortoe o sinal de silêncio real.
[00074] 230: Determinar uma forma de codificação do quadro deentrada atual em conformidade com o grau de desvio, em que a forma de codificação do quadro de entrada atual inclui uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro SID.
[00075] Especificamente, a forma de codificação de quadro de desconexão pode se referir a uma forma de codificação contínua. O codificador pode codificar um quadro de silêncio em um intervalo de desconexão na forma de codificação contínua, e um quadro obtido através da codificação pode ser referido como um quadro de desconexão.
[00076] 240: Codificar o quadro de entrada atual em conformidadecom a forma de codificação do quadro de entrada atual.
[00077] Na etapa 210, o codificador pode determinar, de acordo com diferentes fatores, codificar o quadro anterior do quadro de entrada atual na forma de codificação contínua, por exemplo, se um VAD no codificador determinar que o quadro anterior está em uma banda de voz ativa ou o codificador determinar que o quadro anterior está em um intervalo de desconexão, o codificador pode codificar o quadro anterior na forma de codificação contínua.
[00078] Após um sinal de voz de entrada entrar em uma banda de silêncio, o codificador pode determinar, de acordo com uma situação real, se funciona em um estado de transmissão contínua ou em um estado de transmissão descontínua. Portanto, para o quadro de entrada atual usado como o quadro de silêncio, o codificador precisa determinar como codificar o quadro de entrada atual.
[00079] O quadro de entrada atual pode ser o primeiro quadro de silêncio após o sinal de voz de entrada entrar na banda de silêncio ou pode também ser o n-ésimo quadro após o sinal de voz de entrada entrar na banda de silêncio, em que n é um número inteiro positivo maior do que 1.
[00080] Se o quadro de entrada atual for o primeiro quadro de silêncio, na etapa 230, o codificador determina que uma forma de codificação do quadro de entrada atual é: determinar se um intervalo de desconexão precisa ser definido, em que se um intervalo de desconexão precisar ser definido, o codificador pode codificar o quadro de entrada em um quadro de desconexão e se nenhum intervalo de desconexão precisar ser definido, o codificador pode codificar o quadro de entrada atual em um quadro SID.
[00081] Se o quadro de entrada atual for o n-ésimo quadro de silêncio e o codificador puder determinar que o quadro de entrada atual está em um intervalo de desconexão, isto é, os quadros de silêncio que precedem o quadro de entrada atual são continuamente codificados, na etapa 230, o codificador determina que uma forma de codificação do quadro de entrada atual é: determinar se finaliza o intervalo de desconexão, em que se o intervalo de desconexão precisar ser finalizado, o codificador pode codificar o quadro de entrada atual em um quadro SID, e se o intervalo de desconexão precisar ser prolongado, o codificador pode codificar o quadro de entrada atual em um quadro de desconexão.
[00082] Se o quadro de entrada atual for o n-enésimo quadro de silêncio e não há nenhum mecanismo de desconexão, na etapa 230, o codificador precisa determinar a forma de codificação do quadro de entrada atual, de modo que o decodificador possa obter um sinal de ruído de conforto melhor após a decodificação do quadro de entrada atual codificado.
[00083] Conforme pode ser visto, essa modalidade da presente invenção não apenas pode ser aplicada em um cenário de ativação de um mecanismo de desconexão, como também pode ser aplicada em um cenário de execução do mecanismo de desconexão e também pode ser aplicada em um cenário no qual não há nenhum mecanismo de desconexão. Especificamente, nessa modalidade da presente invenção, a possibilidade de ativar o mecanismo de desconexão pode ser determinada, e a possibilidade de finalizar o mecanismo de desconexão antecipadamente pode também ser determinada. Alternativamente, para um cenário no qual não há nenhum mecanismo de desconexão, nessa modalidade da presente invenção, uma forma de codificação de um quadro de silêncio pode ser determinada, de modo a alcançar efeitos de codificação e efeitos de decodificação melhores.
[00084] Especificamente, pode ser presumido que o codificador codifica o quadro de entrada atual em um quadro SID, se o decodificador receber o quadro SID, o decodificador gera o ruído de conforto de acordo com o quadro SID, e o codificador pode predizer o ruído de conforto. Então, o codificador pode estimar um grau de desvio entre o ruído de conforto e um sinal de silêncio real que é inserido no codificador. O grau de desvio no presente documento pode ser entendido como um grau de similaridade. Ser o ruído de conforto predito for próximo o suficiente ao sinal de silêncio real, o codificador pode considerar que nenhum intervalo de desconexão precisa ser definido ou um intervalo de desconexão não precisa ser prolongado.
[00085] Na técnica anterior, a possibilidade de executar um intervalo de desconexão a uma duração fixada é determinada simplesmente coletando as estatísticas sobre uma quantidade de quadros de voz ativos. Isto é, se houver quadros de voz ativos suficientes para serem continuamente codificados, um intervalo de desconexão a uma duração fixa é definido. Não importa se o quadro de entrada atual for o primeiro quadro de silêncio ou o n-ésimo quadro de silêncio que está no intervalo de desconexão, o quadro de entrada atual é codificado no quadro de desconexão. Entretanto, os quadros de desconexão desnecessários podem causar desperdício de largura de banda de comunicação. Entretanto, nessa modalidade da presente invenção, a forma de codificação do quadro de entrada atual é determinado de acordo com o grau de desvio entre o ruído de conforto predito e o sinal de silêncio real, em vez do quadro de entrada atual ser codificado no quadro de desconexão simplesmente de acordo com uma quantidade de quadros de voz ativos, salvando, assim, a largura de banda de comunicação.
[00086] Nessa modalidade da presente invenção, em um caso em que uma forma de codificação de um quadro anterior de um quadro de entrada atual é uma forma de codificação contínua, um ruído de conforto que é gerado por um decodificador de acordo com o quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro SID é predito, um grau de desvio entre o ruído de conforto e um sinal de silêncio real é determinado, e é determinado, de acordo com o grau de desvio, que uma forma de codificação do quadro de entrada atual é uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro SID, em vez de que quadro de entrada atual é codificado em um quadro de desconexão simplesmente de acordo com uma quantidade, obtida através de uma coleção de estatísticas, de quadros de voz ativos, salvando, assim, a largura de banda de comunicação.
[00087] Opcionalmente, como uma modalidade, na etapa 210, o codificador pode predizer o ruído de conforto de uma primeira forma de predição, em que a primeira forma de predição é igual a uma forma na qual o decodificador gera o ruído de conforto.
[00088] Especificamente, o codificador e o decodificador podem determinar o ruído de conforto de uma mesma maneira; ou o codificador e o decodificador podem determinar o ruído de conforto de maneira diferentes, o que não é limitado nessa modalidade da presente invenção.
[00089] Opcionalmente, como uma modalidade, na etapa 210, o codificador pode predizer um parâmetro de recurso do ruído de conforto e determinar um parâmetro de recurso do sinal de silêncio real, em que o parâmetro de recurso do ruído de conforto está em uma correspondência de um para um com o parâmetro de recurso do sinal de silêncio real. Na etapa 220, o codificador pode determinar uma distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real.
[00090] Especificamente, o codificador pode comparar o parâmetro de recurso do ruído de conforto ao parâmetro de recurso do sinal de silêncio real para obter a distância entre os parâmetros de recurso, de modo a determinar o grau de desvio entre o ruído de conforto e o sinal de silêncio real. O parâmetro de recurso do ruído de conforto deve estar em correspondência de um para um ao parâmetro de recurso do sinal de silêncio real. Isto é, um tipo do parâmetro de recurso do ruído de conforto é igual a um tipo do parâmetro de recurso do sinal de silêncio real. Por exemplo, o codificador pode comparar um parâmetro de energia do ruído de conforto a um parâmetro de energia do sinal de silêncio real ou pode também comparar um parâmetro espectral do ruído de conforto a um parâmetro espectral do sinal de silêncio real.
[00091] Nessa modalidade da presente invenção, quando os parâmetros de recurso são escalares, a distância entre os parâmetros de recurso pode se referir a um valor absoluto de uma diferença entre os parâmetros de recurso, isto é, uma distância escalar. Quando os parâmetros de recurso são vetores, a distância entre os parâmetros de recurso pode se referir à soma das distâncias escalares de elementos correspondentes entre os parâmetros de recurso.
[00092] Opcionalmente, como outra modalidade, na etapa 230, o codificador pode determinar, em um caso em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é menor do que um limite correspondente em um conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID, em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real está em uma correspondência de um para um com o limite no conjunto de limites. O codificador pode também determinar, em um caso em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é maior ou igual ao limite correspondente no conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
[00093] Especificamente, o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real podem incluir, cada um, pelo menos um parâmetro; portanto, a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real pode também incluir uma distância entre pelo menos um tipo dos parâmetros. O conjunto de limites também pode incluir pelo menos um limite. Uma distância entre cada tipo dos parâmetros pode corresponder a um limite. Ao determinar a forma de codificação do quadro de entrada atual, o codificador pode comparar separadamente a distância entre pelo menos um tipo dos parâmetros a um limite correspondente no conjunto de limites. O pelo menos um limite no conjunto de limites pode ser predefinido ou pode também ser determinado pelo codificador de acordo com os parâmetros de recurso de múltiplos quadros de silêncio que precedem o quadro de entrada atual.
[00094] Se a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real for menor do que o limite correspondente no conjunto de limites, o codificador pode considerar que o ruído de conforto é próximo o suficiente ao sinal de silêncio real e, portanto, pode codificar o quadro de entrada atual em um quadro SID. Se a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real for maior ou igual ao limite correspondente no conjunto de limites, o codificador pode considerar que um desvio entre o ruído de conforto e o sinal de silêncio real é relativamente grande e, portanto, pode codificar o quadro de entrada atual em um quadro de desconexão.
[00095] Opcionalmente, como outra modalidade, o parâmetro de recurso do ruído de conforto pode ser usado para representar pelo menos uma das informações a seguir: informações de energia e informações espectrais.
[00096] Opcionalmente, como outra modalidade, as informações de energia podem incluir a energia de excitação de CELP. As informações espectrais podem incluir pelo menos um dos seguintes: um coeficiente de filtro preditivo linear, um coeficiente de FFT e um coeficiente de MDCT. O coeficiente de filtro preditivo linear pode incluir pelo menos um dos seguintes: um coeficiente de LSF, um coeficiente de LSP, um coeficiente de ISF, um coeficiente de ISP, um coeficiente de reflexão e um coeficiente de LPC.
[00097] Opcionalmente, como outra modalidade, na etapa 210, o codificador pode determinar que um parâmetro de recurso do quadro de entrada atual é o parâmetro de recurso do sinal de silêncio real. Alternativamente, o codificador pode coletar as estatísticas sobre os parâmetros de recurso de M quadros de silêncio para determinar o parâmetro de recurso do sinal de silêncio real.
[00098] Opcionalmente, como outra modalidade, os M quadros de silêncio podem incluir o quadro de entrada atual e (M-1) quadros de silêncio que precedem o quadro de entrada atual, em que M é um número inteiro positivo.
[00099] Por exemplo, se o quadro de entrada atual for o primeiro quadro de silêncio, o parâmetro de recurso do sinal de silêncio real pode ser o parâmetro de recurso do quadro de entrada atual; se o quadro de entrada atual for o n-ésimo quadro de silêncio, o parâmetro de recurso do sinal real pode ser obtido pelo codificador coletando-se estatísticas sobre os parâmetros de recurso dos M quadros de silêncio incluindo o quadro de entrada atual. Os M quadros de silêncio podem ser contínuos ou podem também ser descontínuos, o que não é limitado nessa modalidade da presente invenção.
[000100] Opcionalmente, como outra modalidade, na etapa 210, o codificador pode predizer o parâmetro de recurso do ruído de conforto em conformidade com um parâmetro de ruído de conforto do quadro anterior do quadro de entrada atual e um parâmetro de recurso do quadro de entrada atual. Alternativamente, o codificador pode predizer o parâmetro de recurso do ruído de conforto em conformidade com os parâmetros de recurso de L quadros de desconexão que precedem o quadro de entrada atual e o parâmetro de recurso do quadro de entrada atual, em que L é um número inteiro positivo.
[000101] Por exemplo, se o quadro de entrada atual for o primeiro quadro de silêncio, o codificador pode predizer o parâmetro de recurso do ruído de conforto de acordo com o parâmetro de ruído de conforto do quadro anterior e o parâmetro de recurso do quadro de entrada atual. Ao codificar cada quadro, o codificador pode salvar um parâmetro de ruído de conforto de cada quadro no codificador. Usualmente, apenas quando um quadro de entrada é um quadro de silêncio, o parâmetro de ruído de conforto salvo pode mudar em relação a este de um quadro anterior, porque o codificador pode atualizar o parâmetro de ruído de conforto salvo de acordo com um parâmetro de recurso do quadro de silêncio de entrada atual e usualmente não atualiza o parâmetro de ruído de conforto quando o quadro de entrada atual é um quadro de voz ativo. Portanto, o codificador pode adquirir um parâmetro de ruído de conforto, armazenado no codificador, do quadro anterior. Por exemplo, o parâmetro de ruído de conforto pode incluir um parâmetro de energia e um parâmetro espectral de um sinal de silêncio.
[000102] Adicionalmente, se o quadro de entrada atual estiver atualmente em um intervalo de desconexão, o codificador pode coletar estatísticas sobre os parâmetros dos L quadros de desconexão que precedem o quadro de entrada atual e obter o parâmetro de recurso do ruído de conforto de acordo com um resultado obtido através da coleta e do parâmetro de recurso do quadro de entrada atual.
[000103] Opcionalmente, como outra modalidade, o parâmetro de recurso do ruído de conforto pode incluir a energia de excitação CELP do ruído de conforto e um coeficiente de LSF do ruído de conforto e o parâmetro de recurso do sinal de silêncio real pode incluir a energia de excitação de CELP do sinal de silêncio real e um coeficiente de LSF do sinal de silêncio real. Na etapa 220, o codificador pode determinar uma distância De entre a energia de excitação de CELP do ruído de conforto e a energia de excitação de CELP do sinal de silêncio real e determinar uma distância Dlsf entre o coeficiente de LSF do ruído de conforto e o coeficiente de LSF do sinal de silêncio real.
[000104] Deve ser notado que a distância De e a distância Dlsf podem incluir uma variação ou podem também incluir um grupo de variações. Por exemplo, a distância Dlsf pode incluir duas variações, em que uma variação pode ser uma distância média entre os coeficientes de LSF, isto é, um valor médio das distâncias entre os coeficientes de LSF e a outra pode ser uma distância máxima entre os coeficientes de LSF, isto é, uma distância entre um par de coeficientes de LSF que tem a distância máxima.
[000105] Opcionalmente, como outra modalidade, na etapa 230, em um caso em que a distância De é menor do que um primeiro limite e a distância Dlsf é menor do que um segundo limite, o codificador pode determinar que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID. Em um caso em que a distância De é maior ou igual ao primeiro limite ou a distância Dlsf é maior ou igual ao segundo limite, o codificador pode determinar que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão. O primeiro limite e o segundo limite pertencem, ambos, ao conjunto de limites.
[000106] Opcionalmente, como outra modalidade, quando De ou Dlsf inclui um grupo de variações, o codificador compara cada variação no grupo de variações a um limite correspondente, de modo a determinar uma forma para codificar o quadro de entrada atual.
[000107] Especificamente, o codificador pode determinar a forma de codificação do quadro de entrada atual de acordo com a distância De e a distância Dlsf. Se a distância De < o primeiro limite e a distância Dlsf < o segundo limite, isso pode indicar que a energia de excitação de CELP e o coeficiente de LSF do ruído de conforto predito são um pouco diferentes da energia de excitação de CELP e do coeficiente de LSF do sinal de silêncio real, e o codificador pode considerar que o ruído de conforto está próximo o suficiente ao sinal de silêncio real e pode codificar o quadro de entrada atual em um quadro SID; de outra maneira, o codificador pode codificar o quadro de entrada atual em um quadro de desconexão.
[000108] Opcionalmente, como outra modalidade, na etapa 230, o codificador pode adquirir o primeiro limite predefinido e o segundo limite predefinido. Alternativamente, o codificador pode determinar o primeiro limite em conformidade com a energia de excitação de CELP de N quadros de silêncio que precedem o quadro de entrada atual e determinar o segundo limite em conformidade com os coeficientes de LSF dos N quadros de silêncio, em que N é um número inteiro positivo.
[000109] Especificamente, tanto o primeiro limite quanto o segundo limite podem ser valores fixos predefinidos. Alternativamente, tanto o primeiro limite quanto o segundo limite podem ser variações autoadaptativas. Por exemplo, o primeiro limite pode ser obtido pelo codificador coletando-se as estatísticas sobre a energia de excitação de CELP dos N quadros de silêncio que precedem o quadro de entrada atual e o segundo limite pode ser obtido pelo codificador coletando-se as estatísticas sobre os coeficientes de LSF dos N quadros de silêncio que precedem o quadro de entrada atual, em que os N quadros de silêncio podem ser contínuos ou podem também ser descontínuos.
[000110] O seguinte descreve um processo específico da Figura 2 em detalhes com o uso de exemplos específicos. Nos exemplos da Figura 3a e da Figura 3b, dois cenários aos quais essa modalidade da presente invenção pode ser aplicada são usados para descrição. Deve ser entendido que esses exemplos se destinam apenas a auxiliar um elemento versado na técnica a entender melhor essa modalidade presente invenção, em vez de limitar o escopo dessa modalidade da presente invenção.
[000111] A Figura 3a é um fluxograma esquemático de um processo de um método de codificação de sinal de acordo com uma modalidade da presente invenção. Na Figura 3a, presume-se que uma forma de codificação de um quadro anterior de um quadro de entrada atual é uma forma de codificação contínua, e um VAD em um codificador determina que o quadro de entrada atual é o primeiro quadro de silêncio após um sinal de voz de entrada entrar em uma banda de silêncio; então, o codificador precisa determinar se define um intervalo de desconexão, isto é, precisa determinar se codifica o quadro de entrada atual em um quadro de desconexão ou um quadro SID. O seguinte descreve o processo em detalhes.
[000112] 301a: Determinar a energia de excitação de CELP e umcoeficiente de LSF de um sinal de silêncio real.
[000113] Especificamente, o codificador pode usar a energia de excitação de CELP e do quadro de entrada atual como energia de excitação de CELP eSI do sinal de silêncio real e pode usar um coeficiente de LSF lsf(i) do quadro de entrada atual como um coeficiente de LSF lsfSI(i) do quadro de entrada atual, em que i = 0, 1, ..., K-1, e K é uma ordem de filtro. O codificador pode determinar a energia de excitação de CELP e o coeficiente de LSF do quadro de entrada atual em referência à técnica anterior.
[000114] 302a: Predizer a energia de excitação de CELP e umcoeficiente de LSF de um ruído de conforto que é gerado por um decodificador de acordo com um quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro SID.
[000115] Presume-se que o codificador codifica o quadro de entrada atual em um quadro SID, o decodificador gera o ruído de conforto de acordo com o quadro SID. O codificador pode predizer a energia de excitação de CELP eCN e um coeficiente de LSF lsfCN(i) do ruído de conforto, em que i = 0, 1, ..., K-1, e K é uma ordem de filtro. O codificador pode determinar separadamente a energia de excitação de CELP e o coeficiente de LSF do ruído de conforto de acordo com um parâmetro de ruído de conforto, armazenado no codificador, de um quadro anterior e a energia de excitação de CELP e o coeficiente de LSF do quadro de entrada atual.
[000116] Por exemplo, o codificador pode predizer a energia de excitação de CELP eCN do ruído de conforto de acordo com a equação (1) a seguir:eCN = 0.4 * eCN[’1 + 0.6 * e (1)em que eCN 11pode representar a energia de excitação deCELP do quadro anterior, e e pode representar a energia de excitação de CELP do quadro de entrada atual.
[000117] O codificador pode predizer o coeficiente de LSF lsfCN(i) do ruído de conforto de acordo com a equação (2) a seguir, em que i = 0, 1, ..., K-1, e K é uma ordem de filtro:IsfCN(i) = 0.4 * IsfCN[-11 (i) + 0.6 * lsf (i) (2)em que lsfCN [ 1](i) pode representar um coeficiente de LSFdo quadro anterior, e lsf(i) pode representar o i-ésimo coeficiente de LSF do quadro de entrada atual.
[000118] 303a: Determinar uma distância De entre a energia deexcitação de CELP do ruído de conforto e a energia de excitação de CELP do sinal de silêncio real e determinar uma distância Dlsf entre o coeficiente de LSF do ruído de conforto e o coeficiente de LSF do sinalde silêncio real.
[000119] Especificamente, o codificador pode determinar a distância De entre a energia de excitação de CELP do ruído de conforto e a energia de excitação de CELP do sinal de silêncio real de acordo com a equação (3) a seguir:
Figure img0001
[000120] O codificador pode determinar a distância Dlsf entre o coeficiente de LSF do ruído de conforto e o coeficiente de LSF do sinal de silêncio real de acordo com a equação (4) a seguir:
Figure img0002
[000121] 304a: Determinar se a distância De é menor do que umprimeiro limite e se a distância Dlsf é menor do que um segundo limite.
[000122] Especificamente, tanto o primeiro limite quanto o segundo limite podem ser valores fixos predefinidos.
[000123] Alternativamente, tanto o primeiro limite quanto o segundo limite podem ser variações autoadaptativas. O codificador pode determinar o primeiro limite de acordo com a energia de excitação de CELP dos N quadros de silêncio que precedem o quadro de entrada atual, por exemplo, o codificador pode determinar o primeiro limite thr1 de acordo com a equação (5) a seguir:
Figure img0003
[000124] O codificador pode determinar o segundo limite de acordo com os coeficientes de LSF dos N quadros de silêncio, por exemplo, o codificador pode determinar o segundo limite thr2 de acordo com a equação (6) a seguir:
Figure img0004
[000125] Na equação (5) e na equação (6), [x] pode representar o x- ésimo quadro, e x pode ser n, m ou p. Por exemplo, e[m]pode representar a energia de excitação de CELP do m-ésimo quadro. lsf [n] (i)s ( )pode representar o i-ésimo coeficiente de LSF do n-ésimo quadro e lsf [p] (i)pode representar o i-ésimo coeficiente de LSF do p- ésimo quadro.
[000126] 305a: Se a distância De for menor do que o primeiro limite ea distância Dlsf for menor do que o segundo limite, determinar não definir um intervalo de desconexão e codificar o quadro de entrada atual em um quadro SID.
[000127] Se a distância De for menor do que o primeiro limite e a distância Dlsf for menor do que o segundo limite, o codificador pode considerar que o ruído de conforto que pode ser gerado pelo decodificador é próximo o suficiente ao sinal de silêncio real, nenhum intervalo de desconexão pode ser definido, e o quadro de entrada atual é codificado no quadro SID.
[000128] 306a: Se a distância De for maior ou igual ao primeiro limiteou a distância Dlsf for maior ou igual ao segundo limite, determinar definir um intervalo de desconexão e codificar o quadro de entrada atual em um quadro de desconexão.
[000129] Nessa modalidade da presente invenção, é determinado, de acordo com um grau de desvio entre um ruído de conforto que é gerado por um decodificador de acordo com um quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro SID e um sinal de silêncio real, que uma forma de codificação do quadro de entrada atual é uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro SID, em vez de que quadro de entrada atual é codificado em um quadro de desconexão simplesmente de acordo com uma quantidade, obtida através de uma coleção de estatísticas, de quadros de voz ativos, salvando, assim, a largura de banda de comunicação.
[000130] A Figura 3b é um fluxograma esquemático de um processo de um método de codificação de sinal de acordo com outra modalidade da presente invenção. Na Figura 3b, presume-se que um quadro de entrada atual já está em um intervalo de desconexão. Um codificador precisa determinar se finaliza o intervalo de desconexão, isto é, o codificador precisa determinar se continua a codificar o quadro de entrada atual em um quadro de desconexão ou se codificar o quadro de entrada atual em um quadro SID. O seguinte descreve o processo em detalhes.
[000131] 301b: Determinar a energia de excitação de CELP e umcoeficiente de LSF de um sinal de silêncio real.
[000132] Opcionalmente, similar à etapa 301a, o codificador pode usar a energia de excitação de CELP e um coeficiente de LSF do quadro de entrada atual como a energia de excitação de CELP e o coeficiente de LSF do sinal de silêncio real.
[000133] Opcionalmente, o codificador pode coletar as estatísticas sobre a energia de excitação de CELP de M quadros de silêncio incluindo o quadro de entrada atual para obter a energia de excitação de CELP do sinal de silêncio real, em que M >uma quantidade de quadros de desconexão, que precede o quadro de entrada atual, dentro do intervalo de desconexão.
[000134] Por exemplo, o codificador pode determinar a energia deexcitação de CELP eSI do sinal de silêncio real de acordo com aequação (7):
Figure img0005
[000135] Em outro exemplo, o codificador pode predizer um coeficiente de LSF lsfSI(i) do sinal de silêncio real de acordo com a equação (8) a seguir, em que i = 0, 1, ..., K-1, e K é uma ordem de filtro:
Figure img0006
[000136] Na equação (7) e equação (8) anteriores, w(j) pode representar um coeficiente de ponderação, ehj]pode representar a energia de excitação de CELP do j-ésimo quadro de silêncio que precede o quadro de entrada atual.
[000137] 302b: Predizer a energia de excitação de CELP e umcoeficiente de LSF de um ruído de conforto que é gerado por um decodificador de acordo com um quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro SID.
[000138] Especificamente, o codificador pode determinar separadamente a energia de excitação de CELP eCN e um coeficiente de LSF lsfCN(i) do ruído de conforto de acordo com a energia de excitação de CELP e os coeficientes de LSF dos L quadros de desconexão que precedem o quadro de entrada atual, em que i = 0, 1, ..., K-1, e K é uma ordem de filtro.
[000139] Por exemplo, o codificador pode determinar a energia de excitação de CELP eCN do ruído de conforto de acordo com a equação (9) a seguir:
Figure img0007
em que eHO[- j]pode representar a energia de excitação do j-ésimo quadro de desconexão que precede o quadro de entrada atual.
[000140] Em outro exemplo, o codificador pode determinar o coeficiente de LSF lsfCN(i) do ruído de conforto de acordo com a equação (10) a seguir, em que i = 0, 1, ..., K-1, e K é uma ordem de filtro:
Figure img0008
em que lsfHO(i)[- j]pode representar o i-ésimo coeficiente de LSF do j-ésimo quadro de desconexão que precede o quadro de entrada atual.
[000141] Na equação (9) e na equação (10), w(j) pode representar um coeficiente de ponderação.
[000142] 303b: Determinar uma distância De entre a energia de excitação de CELP do ruído de conforto e a energia de excitação de CELP do sinal de silêncio real e determinar uma distância Dlsf entre o coeficiente de LSF do ruído de conforto e o coeficiente de LSF do sinal de silêncio real.
[000143] Por exemplo, o codificador pode determinar a distância De entre a energia de excitação de CELP do ruído de conforto e a energia de excitação de CELP do sinal de silêncio real de acordo com a equação (3). O codificador pode determinar a distância Dlsf entre o coeficiente de LSF do ruído de conforto e o coeficiente de LSF do sinal de silêncio real de acordo com a equação (4).
[000144] 304b: Determinar se a distância De é menor do que umprimeiro limite e se a distância Dlsf é menor do que um segundo limite.
[000145] Especificamente, tanto o primeiro limite quanto o segundo limite podem ser valores fixos predefinidos.
[000146] Alternativamente, tanto o primeiro limite quanto o segundo limite podem ser variações autoadaptativas. Por exemplo, o codificador pode determinar o primeiro limite thr1 de acordo com a equação (5) e pode determinar o segundo limite thr2 de acordo com a equação (6).
[000147] 305b: Se a distância De for menor do que o primeiro limite ea distância Dlsf for menor do que o segundo limite, determinar finalizar o intervalo de desconexão e codificar o quadro de entrada atual em um quadro SID.
[000148] 306b: Se a distância De for maior ou igual ao primeiro limiteou a distância Dlsf for maior ou igual ao segundo limite, determinar continuar a prolongar o intervalo de desconexão e codificar o quadro de entrada atual em um quadro de desconexão.
[000149] Nessa modalidade da presente invenção, é determinado, de acordo com um grau de desvio entre um ruído de conforto que é gerado por um decodificador de acordo com um quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro SID e um sinal de silêncio real, que uma forma de codificação do quadro de entrada atual é uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro SID, em vez de que quadro de entrada atual é codificado em um quadro de desconexão simplesmente de acordo com uma quantidade, obtida através de uma coleção de estatísticas, de quadros de voz ativos, salvando, assim, a largura de banda de comunicação.
[000150] Conforme pode ser visto a partir do anterior, após a inserção de um estado de transmissão descontínua, um codificador pode codificar intermitentemente um quadro SID. O quadro SID geralmente inclui algumas informações que descrevem a energia e um espectro de um sinal de silêncio. Após receber o quadro SID do codificador, um decodificador pode gerar um ruído de conforto de acordo com as informações no quadro SID. Atualmente, como o quadro SID é codificado e enviado uma vez a cada dos diversos quadros, ao codificar o quadro SID, o codificador usualmente obtém as informações do quadro SID coletando-se as estatísticas sobre um quadro de silêncio de entrada atual e diversos quadros de silêncio que precedem o quadro de silêncio de entrada atual. Por exemplo, dentro de um intervalo de silêncio contínuo, as informações de um quadro SID atualmente codificado são usualmente obtidas coletando-se as estatísticas sobre o quadro SID atual e múltiplos quadros de silêncio entre o quadro SID atual e um quadro SID anterior. Em outro exemplo, as informações de codificação do primeiro quadro SID após uma banda de voz ativa são usualmente obtidas pelo codificador coletando-se as estatísticas sobre um quadro de silêncio de entrada atual e diversos quadros de desconexão adjacentes no final da banda de voz ativa, isto é, obtidas coletando-se as estatísticas sobre os quadros de silêncio dentro de um intervalo de desconexão. Para a conveniência da descrição, múltiplos quadros de silêncio usados para coletar as estatísticas sobre um parâmetro de codificação de quadro SID são referidos como um intervalo de análise. Especificamente, quando um quadro SID é codificado, um parâmetro do quadro SID é obtido através da obtenção de um valor médio ou um valor mediano dos parâmetros de múltiplos quadros de silêncio dentro de um intervalo de análise. Entretanto, um espectro de ruído de fundo real pode incluir vários componentes espectrais transitórios inesperados. Uma vez que o intervalo de análise inclui tais componentes espectrais, os componentes podem ser adicionados no quadro SID em um método para obter um valor médio, e um espectro de silêncio que inclui tais componentes espectrais pode ainda ser incorretamente codificado no quadro SID em um método para obter um valor mediano, fazendo com que a qualidade de um ruído de conforto que é gerado pelo decodificador de acordo com o quadro SID diminua.
[000151] A Figura 4 é um fluxograma esquemático de um método de processamento de sinal de acordo com uma modalidade da presente invenção. O método na Figura 4 é executado por um codificador ou um decodificador, por exemplo, pode ser executado pelo codificador 110 ou o decodificador 120 na Figura 1.
[000152] 410: determinar uma distância espectral ponderada emgrupo (Group Weighted Spectral Distance) de cada quadro de silêncio em P quadros de silêncio, em que a distância espectral ponderada em grupo de cada quadro de silêncio nos P quadros de silêncio é a soma das distâncias espectrais ponderadas entre cada quadro de silêncio nos P quadros de silêncio e os outros (P-1) quadros de silêncio, em que P é um número inteiro positivo; e
[000153] Por exemplo, o codificador ou decodificador pode armazenar os parâmetros de múltiplos quadros de silêncio que precedem um quadro de silêncio de entrada atual em um armazenamento temporário. Uma duração do armazenamento temporário pode ser fixa ou variável. Os P quadros de silêncio podem ser selecionados pelo codificador ou decodificador do armazenamento temporário.
[000154] 420: Determinar um primeiro parâmetro espectral emconformidade com a distância espectral ponderada em grupo de cada quadro de silêncio nos P quadros de silêncio, em que o primeiro parâmetro espectral é usado para gerar um ruído de conforto.
[000155] Nessa modalidade da presente invenção, um primeiro parâmetro espectral usado para gerar um ruído de conforto é determinado de acordo com uma distância espectral ponderada em grupo de cada quadro de silêncio em P quadros de silêncio, em vez de um parâmetro espectral usado para gerar o ruído de conforto ser obtido simplesmente obtendo um valor médio ou um valor mediano dos parâmetros espectrais de múltiplos quadros de silêncio, melhorando, assim, a qualidade do ruído de conforto.
[000156] Opcionalmente, como uma modalidade, na etapa 410, a distância espectral ponderada em grupo de cada quadro de silêncio pode ser determinada de acordo com um parâmetro espectral de cada quadro de silêncio nos P quadros de silêncio. Por exemplo, uma distância espectral ponderada em grupo swd[x]do x-ésimo quadro nos P quadros de silêncio pode ser determinada de acordo com a equação (11) a seguir:
Figure img0009
em que U[x] (i) pode representar o i-ésimo parâmetroespectral do x-ésimo quadro, U[j] (i) pode representar o i-ésimo parâmetro espectral do j-ésimo quadro, w(i) pode ser um coeficiente de ponderação, e K é uma quantidade de coeficientes de um parâmetro espectral.
[000157] Por exemplo, o parâmetro espectral de cada quadro de silêncio pode incluir um coeficiente de LSF, um coeficiente de LSP, um coeficiente de ISF, um coeficiente de ISP, um coeficiente de LPC, um coeficiente de reflexão, um coeficiente de FFT ou um coeficiente de MDCT ou similares. Portanto, correspondentemente, na etapa 420, o primeiro parâmetro espectral pode incluir um coeficiente de LSF, um coeficiente de LSP, um coeficiente de ISF, um coeficiente de ISP, um coeficiente de LPC, um coeficiente de reflexão, um coeficiente de FFT ou um coeficiente de MDCT ou similares.
[000158] O seguinte descreve um processo da etapa 420 com o uso de um exemplo no qual o parâmetro espectral é o coeficiente de LSF. Por exemplo, a soma das distâncias espectrais ponderadas entre o coeficiente de LSF de cada quadro de silêncio e os coeficientes de LSF dos outros (P-1) quadros de silêncio, isto é, uma distância espectral ponderada em grupo swd do coeficiente de LSF de cada quadro de silêncio, pode ser determinada, por exemplo, uma distância espectral ponderada em grupo swdwde um coeficiente de LSF do x-ésimo quadro nos P quadros de silêncio pode ser determinada de acordo com a equação (12) a seguir, em que x = 0, 1,2, ..., P-1:
Figure img0010
em que w (i)é um coeficiente de ponderação, e K'é uma ordem de filtro.
[000159] Opcionalmente, como uma modalidade, cada quadro de silêncio pode corresponder a um grupo de coeficientes de ponderação, em que, no grupo de coeficientes de ponderação, um coeficiente de ponderação que corresponde a um primeiro grupo de sub-bandas é maior do que um coeficiente de ponderação que corresponde a um segundo grupo de sub-bandas, e a importância perceptiva do primeiro grupo de sub-bandas é maior do que a importância perceptiva do segundo grupo de sub-bandas.
[000160] As sub-bandas podem ser obtidas dividindo-se um coeficiente espectral; para um processo específico, referência pode ser feita à técnica anterior. A importância perceptiva das sub-bandas pode ser determinada de acordo com a técnica anterior. Usualmente, a importância perceptiva de uma sub-banda de baixa frequência é maior do que a importância perceptiva de uma sub-banda de alta frequência; portanto, em uma modalidade simplificada, um coeficiente de ponderação de uma sub-banda de baixa frequência pode ser maior do que um coeficiente de ponderação de uma sub-banda de alta frequência.
[000161] Por exemplo, na equação (12), w (i)é um coeficiente de ponderação, em que i = 0, 1, ..., K'-1. Cada quadro de silênciocorresponde a um grupo de coeficientes de ponderação, isto é, w (0)a w (K -1). Em um grupo de coeficientes de ponderação, um coeficiente de ponderação de um coeficiente de LSF de uma sub-banda de baixa frequência é maior do que um coeficiente de ponderação de um coeficiente de LSF de uma sub-banda de alta frequência. Como a energia de um ruído de fundo é, na maior parte, concentrada em uma banda de baixa frequência, a qualidade do ruído de conforto gerado pelo decodificador é principalmente determinada pela qualidade de um sinal de banda de baixa frequência, e a influência imposta por uma distância espectral de um coeficiente de LSF de uma banda de alta frequência em uma distância espectral ponderada final deve diminuir apropriadamente.
[000162] Opcionalmente, como outra modalidade, na etapa 420, um primeiro quadro de silêncio pode ser selecionado dentre os P quadros de silêncio, de modo que uma distância espectral ponderada em grupo do primeiro quadro de silêncio nos P quadros de silêncio seja a menor e pode ser determinado que um parâmetro espectral do primeiro quadro de silêncio é o primeiro parâmetro espectral.
[000163] Especificamente, a distância espectral ponderada em grupo sendo a menor pode indicar que o parâmetro espectral do primeiro quadro de silêncio pode representar melhor a generalidade entre os parâmetros espectrais dos P quadros de silêncio. Portanto, o parâmetro espectral do primeiro quadro de silêncio pode ser codificado em um quadro SID. Por exemplo, para a distância espectral ponderada em grupo do coeficiente de LSF de cada quadro de silêncio, a distância espectral ponderada em grupo do coeficiente de LSF do primeiro quadro de silêncio é a menor; então, isso pode indicar que um espectro de LSF do primeiro quadro de silêncio é um espectro de LSF que pode melhor representar a generalidade os espectros de LSF dos P quadros de silêncio.
[000164] Opcionalmente, como outra modalidade, na etapa 420, pelo menos um quadro de silêncio pode ser selecionado dentre os P quadros de silêncio, de modo que uma distância espectral ponderada em grupo do pelo menos um quadro de silêncio nos P quadros de silêncio seja menor do que um terceiro limite e o primeiro parâmetro espectral pode ser determinado de acordo com um parâmetro espectral do pelo menos um quadro de silêncio.
[000165] Por exemplo, em uma modalidade, pode ser determinado que um valor médio do parâmetro espectral do pelo menos um quadro de silêncio é o primeiro parâmetro espectral. Em outra modalidade, pode ser determinado que um valor mediano do parâmetro espectral do pelo menos um quadro de silêncio é o primeiro parâmetro espectral. Em outra modalidade, o primeiro parâmetro espectral pode também ser determinado de acordo com o parâmetro espectral do pelo menos um quadro de silêncio com o uso de outro método nessa modalidade da presente invenção.
[000166] O seguinte proporciona a descrição com o uso ainda de um exemplo no qual o parâmetro espectral é o coeficiente de LSF; então, o primeiro parâmetro espectral pode ser um primeiro coeficiente de LSF. Por exemplo, a distância espectral ponderada em grupo do coeficiente de LSF de cada quadro de silêncio nos P quadros de silêncio pode ser obtida de acordo com a equação (12). Pelo menos um quadro de silêncio cuja distância espectral ponderada em grupo de um coeficiente de LSF é menor do que o terceiro limite é selecionado dentre o P quadros de silêncio. Então, um valor médio de um coeficiente de LSF do pelo menos um quadro de silêncio pode ser usado como um primeiro coeficiente de LSF. Por exemplo, um primeiro coeficiente de LSF lsfSID(i) pode ser determinado de acordo com a equação (13) a seguir, em que i = 0, 1, ..., K -1, e K'é uma ordem de filtro:
Figure img0011
em que {A} pode representar um quadro de silêncio nos P quadros de silêncio exceto o pelo menos um quadro de silêncio, e lsf [j] (i)pode representar o i-ésimo coeficiente de LSF do j-ésimo quadro.
[000167] Adicionalmente, o terceiro limite pode ser predefinido.
[000168] Opcionalmente, como outra modalidade, quando o método na Figura 4 é executado pelo codificado, os P quadros de silêncio podem incluir um quadro de silêncio de entrada atual e os (P-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual.
[000169] Quando o método na Figura 4 é executado pelo decodificador, os P quadros de silêncio podem ser P quadros de desconexão.
[000170] Opcionalmente, como outra modalidade, quando o método na Figura 4 é executado pelo codificador, o codificador pode codificar o quadro de silêncio de entrada atual em um quadro SID, em que o quadro SID inclui o primeiro parâmetro espectral.
[000171] Nessa modalidade da presente invenção, um codificador pode codificar um quadro de entrada atual em um quadro SID, de modo que o quadro SID inclua um primeiro parâmetro espectral, em vez de um parâmetro espectral do quadro SID ser obtido simplesmente obtendo-se um valor médio ou um valor mediano dos parâmetros espectrais de múltiplos quadros de silêncio, melhorando, assim, a qualidade de um ruído de conforto que é gerado por um decodificador de acordo com o quadro SID.
[000172] A Figura 5 é um fluxograma esquemático de um método de processamento de sinal de acordo com outra modalidade da presente invenção. O método na Figura 5 é executado por um codificador ou um decodificador, por exemplo, pode ser executado pelo codificador 110 ou o decodificador 120 na Figura 1.
[000173] 510: Dividir uma banda de frequência de um sinal de entradaem R sub-bandas, em que R é um número inteiro positivo.
[000174] 520: Determinar, em cada sub-banda das R sub-bandas,uma distância espectral de grupo de sub-banda de cada quadro de silêncio em S quadros de silêncio, em que a distância espectral de grupo de sub-banda de cada quadro de silêncio nos S quadros de silêncio é a soma das distâncias espectrais entre cada quadro de silêncio nos S quadros de silêncio em cada sub-banda e os outros (S-1) quadros de silêncio, e S é um número inteiro positivo.
[000175] 530: Determinar, em cada sub-banda de acordo com adistância espectral de grupo de sub-banda de cada quadro de silêncio nos S quadros de silêncio, um primeiro parâmetro espectral de cada sub-banda, em que o primeiro parâmetro espectral de cada sub-banda é usado para gerar um ruído de conforto.
[000176] Nessa modalidade da presente invenção, um primeiro parâmetro espectral que é de cada sub-banda e usado para gerar um ruído de conforto é determinado em cada sub-banda de R sub-bandas de acordo com uma distância espectral de grupo de sub-banda de cada quadro de silêncio em S quadros de silêncio, em vez de um parâmetro espectral usado para gerar o ruído de conforto ser obtido simplesmente usando um valor médio ou um valor mediano dos parâmetros espectrais de múltiplos quadros de silêncio, melhorando, assim, a qualidade do ruído de conforto.
[000177] Na etapa 530, para cada sub-banda, a distância espectral de grupo de sub-banda de cada quadro de silêncio em cada sub-banda pode ser determinada de acordo com um parâmetro espectral de cada quadro de silêncio nos S quadros de silêncio. Opcionalmente, como [ y] uma modalidade, uma distância espectral de grupo de sub-banda ssdk do y-ésimo quadro de silêncio na k-ésima sub-banda pode ser determinada de acordo com a equação (14) a seguir, em que k = 1, 2, .... R, e y = 0, 1, ..., S-1:
Figure img0012
em que L(k) pode representar uma quantidade de coeficientes dos parâmetros espectrais incluídos na k-ésima sub-banda, Uk[y] (i) pode representar o i-ésimo coeficiente de um parâmetroespectral do y-ésimo quadro de silêncio na k-ésima sub-banda, e Uk[j] (i) pode representar o i-ésimo coeficiente de um parâmetroespectral do j-ésimo quadro de silêncio na k-ésima sub-banda.
[000178] Por exemplo, o parâmetro espectral de cada quadro de silêncio pode incluir um coeficiente de LSF, um coeficiente de LSP, um coeficiente de ISF, um coeficiente de ISP, um coeficiente de LPC, um coeficiente de reflexão, um coeficiente de FFT ou um coeficiente de MDCT ou similares.
[000179] O seguinte proporciona a descrição com o uso de um exemplo no qual o parâmetro espectral é o coeficiente de LSF. Por exemplo, a distância espectral de grupo de sub-banda do coeficiente de LSF de cada quadro de silêncio pode ser determinada. Cada sub-banda pode incluir um coeficiente de LSF ou pode também incluir múltiplos coeficientes de LSF. Por exemplo, uma distância espectral de grupo de [y]sub-banda ssdkde um coeficiente de LSF do y-ésimo quadro de silêncio na k-ésima sub-banda pode ser determinada de acordo com a equação (15) a seguir, em que k = 1,2, ..., R, e y = 0, 1, ..., S-1:
Figure img0013
em que L(k) pode representar uma quantidade de coeficientes de LSF incluídas na k-ésima sub-banda, lsfk[y](i) poderepresentar o i-ésimo coeficiente de LSF do y-ésimo quadro de silênciona k-ésima sub-banda, e lsfk[ j](i) pode representar o i-ésimo
[000180] Correspondentemente, o primeiro parâmetro espectral de cada sub-banda pode incluir um coeficiente de LSF, um coeficiente de LSP, um coeficiente de ISF, um coeficiente de ISP, um coeficiente deLPC, um coeficiente de reflexão, um coeficiente de FFT ou um coeficiente de MDCT ou similares.
[000181] Opcionalmente, como outra modalidade, na etapa 530, um primeiro quadro de silêncio pode ser selecionado em cada sub-banda dos S quadros de silêncio, de modo que uma distância espectral de grupo de sub-banda do primeiro quadro de silêncio nos S quadros de silêncio em cada sub-banda seja a menor. Então, um parâmetro espectral do primeiro quadro de silêncio em cada sub-banda pode ser usado como o primeiro parâmetro espectral de cada sub-banda.
[000182] Especificamente, o codificador pode determinar o primeiro quadro de silêncio em cada sub-banda e usar o parâmetro espectral do primeiro quadro de silêncio como o primeiro parâmetro espectral da sub-banda.
[000183] O seguinte proporciona a descrição com o uso ainda de um exemplo no qual o parâmetro espectral é o coeficiente de LSF. Correspondentemente, o primeiro parâmetro espectral de cada subbanda é um primeiro coeficiente de LSF de cada sub-banda. Por exemplo, uma distância espectral de grupo de sub-banda de um coeficiente de LSF de cada quadro de silêncio em cada sub-banda pode ser determinada de acordo com a equação (15). Para cada sub-banda, um coeficiente de LSF de um quadro que tem a menor distância espectral de grupo de sub-banda pode ser selecionado como o primeiro coeficiente de LSF da sub-banda.
[000184] Opcionalmente, como outra modalidade, na etapa 530, pelo menos um quadro de silêncio pode ser selecionado em cada sub-banda dentre os S quadros de silêncio, de modo que uma distância espectral de grupo de sub-banda do pelo menos um quadro de silêncio seja menor do que um quarto limite. Então, o primeiro parâmetro espectral de cada sub-banda pode ser determinado em cada sub-banda de acordo com um parâmetro espectral de pelo menos um quadro de silêncio.
[000185] Por exemplo, em uma modalidade, pode ser determinado que um valor médio do parâmetro espectral do pelo menos um quadro de silêncio nos S quadros de silêncio em cada sub-banda é o primeiro parâmetro espectral de cada sub-banda. Em outra modalidade, pode ser determinado que um valor mediano do parâmetro espectral do pelo menos um quadro de silêncio nos S quadros de silêncio em cada sub-banda é o primeiro parâmetro espectral de cada sub-banda. Em outra modalidade, o primeiro parâmetro espectral de cada sub-banda pode também ser determinado de acordo com o parâmetro espectral do pelo menos um quadro de silêncio com o uso de outro método na presente invenção.
[000186] Com o uso de um coeficiente de LSF como um exemplo, uma cada sub-banda pode ser determinada de acordo com a equação (15). Para cada sub-banda, pelo menos um quadro de silêncio cuja distância espectral de grupo de sub-banda é menor do que o quarto limite pode ser selecionado, e é determinado que um valor médio de um coeficiente de LSF do pelo menos um quadro de silêncio é um primeiro coeficiente de LSF da sub-banda. O quarto limite pode ser predefinido.
[000187] Opcionalmente, como outra modalidade, quando o método na Figura 5 é executado pelo codificado, os S quadros de silêncio podem incluir um quadro de silêncio de entrada atual e os (S-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual.
[000188] Quando o método na Figura 5 é executado pelo decodificador, os S quadros de silêncio podem ser S quadros de desconexão.
[000189] Opcionalmente, como outra modalidade, quando o método na Figura 5 é executado pelo codificador, o codificador pode codificar o quadro de silêncio de entrada atual em um quadro SID, em que o quadro SID inclui o primeiro parâmetro espectral de cada sub-banda.
[000190] Nessa modalidade da presente invenção, ao codificar um quadro SID, um codificador pode permitir que o quadro SID inclua um primeiro parâmetro espectral de cada sub-banda, em vez de um parâmetro espectral do quadro SID ser obtido simplesmente obtendo- se um valor médio ou um valor mediano dos parâmetros espectrais de múltiplos quadros de silêncio, melhorando, assim, a qualidade de um ruído de conforto que é gerado por um decodificador de acordo com o quadro SID.
[000191] A Figura 6 é um fluxograma esquemático de um método de processamento de sinal de acordo com outra modalidade da presente invenção. O método na Figura 6 é executado por um codificador ou um decodificador, por exemplo, pode ser executado pelo codificador 110 ou o decodificador 120 na Figura 1.
[000192] 610: Determinar um primeiro parâmetro de cada quadro desilêncio em T quadros de silêncio, em que o primeiro parâmetro é usado para representar a entropia espectral, e T é um número inteiro positivo.
[000193] Por exemplo, quando a entropia espectral do quadro de silêncio pode ser determinada diretamente, o primeiro parâmetro pode ser a entropia espectral. Em alguns casos, a entropia espectral em conformidade com uma definição estrita pode não ser determinada diretamente e, nesse caso, o primeiro parâmetro pode ser outro parâmetro que pode representar a entropia espectral, por exemplo, um parâmetro que pode refletir a resistência estrutural de um espectro ou similar.
[000194] Por exemplo, o primeiro parâmetro de cada quadro de silêncio pode ser determinado de acordo com um coeficiente de LSF de cada quadro de silêncio. Por exemplo, um primeiro parâmetro do z- ésimo quadro de silêncio pode ser determinado de acordo com a equação (16) a seguir, em que z = 1,2, ..., T:
Figure img0014
em que K é uma ordem de filtro.
[000195] No presente documento, C é um parâmetro que pode refletir a resistência estrutural de um espectro e não se obedece estritamente uma definição de entropia espectral, em que um C maior pode indicar uma entropia espectral menor.
[000196] 620: Determinar um primeiro parâmetro espectral emconformidade com o primeiro parâmetro de cada quadro de silêncio nos T quadros de silêncio, em que o primeiro parâmetro espectral é usado para gerar um ruído de conforto.
[000197] Nessa modalidade da presente invenção, um primeiro parâmetro espectral usado para gerar um ruído de conforto é determinado de acordo com um primeiro parâmetro que é usado para representar a entropia espectral e de T quadros de silêncio, em vez de um parâmetro espectral usado para gerar o ruído de conforto ser obtido simplesmente obtendo um valor médio ou um valor mediano dos parâmetros espectrais de múltiplos quadros de silêncio, melhorando, assim, a qualidade do ruído de conforto.
[000198] Opcionalmente, como uma modalidade, em um caso em que é determinado que os T quadros de silêncio podem ser classificados em um primeiro grupo de quadros de silêncio e um segundo grupo de quadros de silêncio em conformidade com um critério de agrupamento, o primeiro parâmetro espectral pode ser determinado em conformidade com um parâmetro espectral do primeiro grupo de quadros de silêncio, em que a entropia espectral representada pelos primeiros parâmetros do primeiro grupo de quadros de silêncio é maior do que a entropia espectral representada pelos primeiros parâmetros do segundo grupo de quadros de silêncio; e em um caso em que é determinado que os T quadros de silêncio não podem ser classificados no primeiro grupo de quadros de silêncio e no segundo grupo de quadros de silêncio em conformidade com o critério de agrupamento, a média ponderada pode ser realizada nos parâmetros espectrais dos T quadros de silêncio, para determinar o primeiro parâmetro espectral, em que a entropia espectral representada pelos primeiros parâmetros do primeiro grupo de quadros de silêncio é maior do que a entropia espectral representada pelos primeiros parâmetros do segundo grupo de quadros de silêncio.
[000199] Geralmente, um espectro de ruído comum tem resistência estrutural relativamente pobre, enquanto um espectro de sinal de não ruído ou um espectro de ruído que incluir um componente transitório tem uma resistência estrutural relativamente forte. A resistência estrutural de um espectro corresponde diretamente a um tamanho da entropia espectral. Relativamente, a entropia espectral de um ruído comum pode ser relativamente grande, enquanto a entropia espectral de um sinal de não ruído ou um ruído que inclui um componente transitório pode ser relativamente pequena. Portanto, no caso em que os T quadros de silêncio podem ser classificados no primeiro grupo de quadros de silêncio e no segundo grupo dos quadros de silêncio, o codificador pode selecionar, de acordo com a entropia espectral do quadro de silêncio, um parâmetro espectral do primeiro grupo de quadros de silêncio não incluindo o componente transitório, para determinar o primeiro parâmetro espectral.
[000200] Por exemplo, em uma modalidade, pode ser determinado que um valor médio do parâmetro espectral do primeiro grupo dos quadros de silêncio é o primeiro parâmetro espectral. Em outra modalidade, pode ser determinado que um valor mediano do parâmetro espectral do primeiro grupo dos quadros de silêncio é o primeiro parâmetro espectral. Em outra modalidade, o primeiro parâmetro espectral pode também ser determinado de acordo com o parâmetro espectral do primeiro grupo de quadros de silêncio com o uso de outro método na presente invenção.
[000201] Se os T quadros de silêncio não puderem ser classificados no primeiro grupo de quadros de silêncio e no segundo grupo de quadros de silêncio, a média ponderada pode ser realizada nos parâmetros espectrais dos T quadros de silêncio para obter o primeiro parâmetro espectral. Opcionalmente, como outra modalidade, o critério de agrupamento pode incluir: uma distância entre um primeiro parâmetro de cada quadro de silêncio no primeiro grupo de quadros de silêncio e um primeiro valor médio é menor ou igual a uma distância entre o primeiro parâmetro de cada quadro de silêncio no primeiro grupo de quadros de silêncio e um segundo valor médio; uma distância entre um primeiro parâmetro de cada quadro de silêncio no segundo grupo de quadros de silêncio e o segundo valor médio é menor ou igual a uma distância entre o primeiro parâmetro de cada quadro de silêncio no segundo grupo de quadros de silêncio e o primeiro valor médio; uma distância entre o primeiro valor médio e o segundo valor médio é maior do que uma distância média entre os primeiros parâmetros do primeiro grupo de quadros de silêncio e o primeiro valor médio; e a distância entre o primeiro valor médio e o segundo valor médio é maior do que uma distância média entre os primeiros parâmetros do segundo grupo de quadros de silêncio e o segundo valor médio,
[000202] em que o primeiro valor médio é um valor médio dos primeiros parâmetros do primeiro grupo de quadros de silêncio, e o segundo valor médio é um valor médio dos primeiros parâmetros do segundo grupo de quadros de silêncio.
[000203] Opcionalmente, como outra modalidade, o codificador pode realizar a média ponderada nos parâmetros espectrais dos T quadros de silêncio para determinar o primeiro parâmetro espectral, em que, para o i-ésimo quadro de silêncio e o j-ésimo quadro de silêncio, que são diferentes, nos T quadros de silêncio, um coeficiente de ponderação que corresponde ao i-ésimo quadro de silêncio é maior ou igual a um coeficiente de ponderação que corresponde ao j-ésimo quadro de silêncio; quando o primeiro parâmetro é positivamente correlacionado à entropia espectral, um primeiro parâmetro do i-ésimo quadro de silêncio é maior do que um primeiro parâmetro do j-ésimo quadro de silêncio; e quando o primeiro parâmetro é negativamente correlacionado à entropia espectral, o primeiro parâmetro do i-ésimo quadro de silêncio é menor do que o primeiro parâmetro do j-ésimoquadro de silêncio, em que i e j são ambos números inteiros positivos, e 1 >i>T, e 1>j>T.
[000204] Especificamente, o codificador pode realizar a média ponderada nos parâmetros espectrais dos T quadros de silêncio para obter o primeiro parâmetro espectral. Conforme descrito acima, a entropia espectral de um ruído comum pode ser relativamente grande, enquanto a entropia espectral de um sinal de não ruído ou um ruído que inclui um componente transitório pode ser relativamente pequena. Portanto, nos T quadros de silêncio, um coeficiente de ponderação que corresponde a um quadro de silêncio que tem uma entropia espectral relativamente grande pode ser maior ou igual a um coeficiente de ponderação que corresponde a um quadro de silêncio que tem uma entropia espectral relativamente pequena.
[000205] Opcionalmente, como outra modalidade, quando o método na Figura 6 é executado pelo codificado, os T quadros de silêncio podem incluir um quadro de silêncio de entrada atual e os (T-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual.
[000206] Quando o método na Figura 6 é executado pelo decodificador, os T quadros de silêncio podem ser T quadros de desconexão.
[000207] Opcionalmente, como outra modalidade, quando o método na Figura 6 é executado pelo codificador, o codificador pode codificar o quadro de silêncio de entrada atual em um quadro SID, em que o quadro SID inclui o primeiro parâmetro espectral.
[000208] Nessa modalidade da presente invenção, ao codificar um quadro SID, um codificador pode permitir que o quadro SID inclua um primeiro parâmetro espectral de cada sub-banda, em vez de um parâmetro espectral do quadro SID ser obtido simplesmente obtendo- se um valor médio ou um valor mediano dos parâmetros espectrais de múltiplos quadros de silêncio, melhorando, assim, a qualidade de um ruído de conforto que é gerado por um decodificador de acordo com o quadro SID.
[000209] A Figura 7 é um diagrama de blocos esquemático de um dispositivo de codificação de sinal de acordo com uma modalidade da presente invenção. Um exemplo de um dispositivo 700 na Figura 7 é um codificador, por exemplo, o codificador 110 mostrado na Figura 1. O dispositivo 700 inclui uma primeira unidade de determinação 710, uma segunda unidade de determinação 720, uma terceira unidade de determinação 730 e uma unidade de codificação 740.
[000210] A primeira unidade de determinação 710 prediz, em um caso em que uma forma de codificação de um quadro anterior de um quadro de entrada atual é uma forma de codificação contínua, um ruído de conforto que é gerado por um decodificador em conformidade com o quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro SID e determina um sinal de silêncio real, em que o quadro de entrada atual é um quadro de silêncio. A segunda unidade de determinação 720 determina um grau de desvio entre o ruído de conforto determinado pela primeira unidade de determinação 710 e o sinal de silêncio real determinado pela primeira unidade de determinação 710. A terceira unidade de determinação 730 determina uma forma de codificação do quadro de entrada atual em conformidade com o grau de desvio determinado pela segunda unidade de determinação, em que a forma de codificação do quadro de entrada atual inclui uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro SID. A unidade de codificação 740 codifica o quadro de entrada atual em conformidade com a forma de codificação do quadro de entrada atual determinada pela terceira unidade de determinação 730.
[000211] Nessa modalidade da presente invenção, em um caso em que uma forma de codificação de um quadro anterior de um quadro de entrada atual é uma forma de codificação contínua, um ruído de conforto que é gerado por um decodificador de acordo com o quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro SID é predito, um grau de desvio entre o ruído de conforto e um sinal de silêncio real é determinado, e é determinado, de acordo com o grau de desvio, que uma forma de codificação do quadro de entrada atual é uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro SID, em vez de que quadro de entrada atual é codificado em um quadro de desconexão simplesmente de acordo com uma quantidade, obtida através de uma coleção de estatísticas, de quadros de voz ativos, salvando, assim, a largura de banda de comunicação.
[000212] Opcionalmente, como uma modalidade, a primeira unidade de determinação 710 pode predizer um parâmetro de recurso do ruído de conforto e determinar um parâmetro de recurso do sinal de silêncio real, em que o parâmetro de recurso do ruído de conforto está em uma correspondência de um para um com o parâmetro de recurso do sinal de silêncio real. A segunda unidade de determinação 720 pode determinar uma distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real.
[000213] Opcionalmente, como outra modalidade, a terceira unidade de determinação 230 pode determinar, em um caso em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é menor do que um limite correspondente em um conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID, em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real está em uma correspondência de um para um com o limite no conjunto de limites. A terceira unidade de determinação 730 pode determinar, em um caso em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é maior ou igual ao limite correspondente no conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
[000214] Opcionalmente, como outra modalidade, o parâmetro de recurso do ruído de conforto pode ser usado para representar pelo menos uma das informações a seguir: informações de energia e informações espectrais.
[000215] Opcionalmente, como outra modalidade, as informações de energia podem incluir a energia de excitação de CELP. As informações espectrais podem incluir pelo menos um dos seguintes: um coeficiente de filtro preditivo linear, um coeficiente de FFT e um coeficiente de MDCT.
[000216] O coeficiente de filtro preditivo linear pode incluir pelo menos um dos seguintes: um coeficiente de LSF, um coeficiente de LSP, um coeficiente de ISF, um coeficiente de ISP, um coeficiente de reflexão e um coeficiente de LPC.
[000217] Opcionalmente, como outra modalidade, a primeira unidade de determinação 710 pode predizer o parâmetro de recurso do ruído de conforto em conformidade com um parâmetro de ruído de conforto do quadro anterior do quadro de entrada atual e um parâmetro de recurso do quadro de entrada atual. Alternativamente, a primeira unidade de determinação 710 pode predizer o parâmetro de recurso do ruído de conforto em conformidade com os parâmetros de recurso de L quadros de desconexão que precedem o quadro de entrada atual e o parâmetro de recurso do quadro de entrada atual, em que L é um número inteiro positivo.
[000218] Opcionalmente, como outra modalidade, a primeira unidade de determinação 710 pode determinar que o parâmetro de recurso do quadro de entrada atual é o parâmetro de recurso do sinal de silêncio real. Alternativamente, a primeira unidade de determinação 710 pode coletar as estatísticas sobre os parâmetros de recurso de M quadros de silêncio para determinar o parâmetro de recurso do sinal de silêncio real.
[000219] Opcionalmente, como outra modalidade, os M quadros de silêncio podem incluir o quadro de entrada atual e (M-1) quadros de silêncio que precedem o quadro de entrada atual, em que M é um número inteiro positivo.
[000220] Opcionalmente, como outra modalidade, o parâmetro de recurso do ruído de conforto pode incluir a energia de excitação de predição linear excitada por código CELP do ruído de conforto e um coeficiente de frequência espectral linear LSF do ruído de conforto e o parâmetro de recurso do sinal de silêncio real pode incluir a energia de excitação de CELP do sinal de silêncio real e um coeficiente de LSF do sinal de silêncio real. A segunda unidade de determinação 720 pode determinar uma distância De entre a energia de excitação de CELP do ruído de conforto e a energia de excitação de CELP do sinal de silêncio real e determinar uma distância Dlsf entre o coeficiente de LSF do ruído de conforto e o coeficiente de LSF do sinal de silêncio real.
[000221] Opcionalmente, como outra modalidade, em um caso em que a distância De é menor do que um primeiro limite e a distância Dlsf é menor do que um segundo limite, a terceira unidade de determinação 730 pode determinar que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID. Em um caso em que a distância De é maior ou igual ao primeiro limite ou a distância Dlsf é maior ou igual ao segundo limite, a terceira unidade de determinação 730 pode determinar que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
[000222] Opcionalmente, como outra modalidade, o dispositivo 700 pode incluir adicionalmente uma quarta unidade de determinação 750. A quarta unidade de determinação 750 pode adquirir o primeiro limite predefinido e o segundo limite predefinido. Alternativamente, a quarta unidade de determinação 750 pode determinar o primeiro limite em conformidade com a energia de excitação de CELP de N quadros de silêncio que precedem o quadro de entrada atual e determinar o segundo limite em conformidade com os coeficientes de LSF dos N quadros de silêncio, em que N é um número inteiro positivo.
[000223] Opcionalmente, como outra modalidade, a primeira unidade de determinação 710 pode predizer o ruído de conforto de uma primeira forma de predição, em que a primeira forma de predição é igual a uma forma na qual o decodificador gera o ruído de conforto.
[000224] Para outras funções e operações do dispositivo 700, referência pode ser feita aos processos das modalidades de método na Figura 1 à Figura 3b no anterior; para impedir a repetição, nenhum detalhe adicional é fornecido no presente documento novamente.
[000225] A Figura 8 é um diagrama de blocos esquemático de um dispositivo de processamento de sinal de acordo com outra modalidade da presente invenção. Um exemplo de um dispositivo 800 na Figura 8 é um codificador ou um decodificador, por exemplo, o codificador 110 ou o decodificador 120 mostrado na Figura 1. O dispositivo 800 inclui uma primeira unidade de determinação 810 e uma segunda unidade de determinação 820.
[000226] A primeira unidade de determinação 810 determina uma distância espectral ponderada em grupo de cada quadro de silêncio em P quadros de silêncio, em que a distância espectral ponderada em grupo de cada quadro de silêncio nos P quadros de silêncio é a soma das distâncias espectrais ponderadas entre cada quadro de silêncio nos P quadros de silêncio e os outros (P-1) quadros de silêncio, em que P é um número inteiro positivo. A segunda unidade de determinação 820 determina um primeiro parâmetro espectral em conformidade com a distância espectral ponderada em grupo, determinada pela primeira unidade de determinação 810, de cada quadro de silêncio nos P quadros de silêncio, em que o primeiro parâmetro espectral é usado para gerar um ruído de conforto.
[000227] Nessa modalidade da presente invenção, um primeiro parâmetro espectral usado para gerar um ruído de conforto é determinado de acordo com uma distância espectral ponderada em grupo de cada quadro de silêncio em P quadros de silêncio, em vez de um parâmetro espectral usado para gerar o ruído de conforto ser obtido simplesmente obtendo um valor médio ou um valor mediano dos parâmetros espectrais de múltiplos quadros de silêncio, melhorando, assim, a qualidade do ruído de conforto.
[000228] Opcionalmente, como uma modalidade, cada quadro de silêncio pode corresponder a um grupo de coeficientes de ponderação, em que, no grupo de coeficientes de ponderação, um coeficiente de ponderação que corresponde a um primeiro grupo de sub-bandas é maior do que um coeficiente de ponderação que corresponde a um segundo grupo de sub-bandas, e a importância perceptiva do primeiro grupo de sub-bandas é maior do que a importância perceptiva do segundo grupo de sub-bandas.
[000229] Opcionalmente, como outra modalidade, a segunda unidade de determinação 820 pode selecionar um primeiro quadro de silêncio dos P quadros de silêncio, de modo que uma distância espectral ponderada em grupo do primeiro quadro de silêncio nos P quadros de silêncio seja a menor e pode determinar que um parâmetro espectral do primeiro quadro de silêncio é o primeiro parâmetro espectral.
[000230] Opcionalmente, como outra modalidade, a segunda unidade de determinação 820 pode selecionar pelo menos um quadro de silêncio dos P quadros de silêncio, de modo que uma distância espectral ponderada em grupo do pelo menos um quadro de silêncio nos P quadros de silêncio seja menor do que um terceiro limite e determinar o primeiro parâmetro espectral de acordo com um parâmetro espectral do pelo menos um quadro de silêncio.
[000231] Opcionalmente, como outra modalidade, quando o dispositivo 800 é o codificador, o dispositivo 800 pode incluir adicionalmente uma unidade de codificação 830.
[000232] Os P quadros de silêncio podem incluir um quadro de silêncio de entrada atual e os (P-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual. A unidade de codificação 830 pode codificar o quadro de silêncio de entrada atual em um quadro SID, em que o quadro SID inclui o primeiro parâmetro espectral determinado pela segunda unidade de determinação 820.
[000233] Para outras funções e operações do dispositivo 800, referência pode ser feita ao processo da modalidade de método na Figura 4 no anterior; para impedir a repetição, nenhum detalhe adicional é fornecido no presente documento novamente.
[000234] A Figura 9 é um diagrama de blocos esquemático de um dispositivo de processamento de sinal de acordo com outra modalidade da presente invenção. Um exemplo de um dispositivo 900 na Figura 9 é um codificador ou um decodificador, por exemplo, o codificador 110 ou o decodificador 120 mostrado na Figura 1. O dispositivo 900 inclui uma unidade de divisão 910, uma primeira unidade de determinação 920 e uma segunda unidade de determinação 930.
[000235] A unidade de divisão 910 divide uma banda de frequência de um sinal de entrada em R sub-bandas, em que R é um número inteiro positivo. A primeira unidade de determinação 920 determina, em cada sub-banda das R sub-bandas obtidas após a unidade de divisão 910 realizar a divisão, uma distância espectral de grupo de sub-banda de cada quadro de silêncio em S quadros de silêncio, em que a distância espectral de grupo de sub-banda de cada quadro de silêncio nos S quadros de silêncio é a soma das distâncias espectrais entre cada quadro de silêncio nos S quadros de silêncio em cada sub-banda e os outros (S-1) quadros de silêncio, e S é um número inteiro positivo. A segunda unidade de determinação 930 determina, em cada sub-banda, um primeiro parâmetro espectral de cada sub-banda em conformidade com uma distância espectral, determinada pela primeira unidade de determinação 920, de cada quadro de silêncio nos S quadros de silêncio, em que o primeiro parâmetro espectral de cada sub-banda é usado para gerar um ruído de conforto.
[000236] Nessa modalidade da presente invenção, um parâmetro espectral que é de cada sub-banda e usado para gerar um ruído de conforto é determinado em cada sub-banda de R sub-bandas de acordo com uma distância espectral de cada quadro de silêncio em S quadros de silêncio, em vez do parâmetro espectral usado para gerar o ruído de conforto ser obtido simplesmente obtendo um valor médio ou um valor mediano dos parâmetros espectrais de múltiplos quadros de silêncio, melhorando, assim, a qualidade do ruído de conforto.
[000237] Opcionalmente, como uma modalidade, a segunda unidade de determinação 930 pode selecionar, em cada sub-banda, um primeiro quadro de silêncio dos S quadros de silêncio, de modo que uma distância espectral de grupo de sub-banda do primeiro quadro de silêncio nos S quadros de silêncio em cada sub-banda seja a menor e determinar, em cada sub-banda, que um parâmetro espectral do primeiro quadro de silêncio é o primeiro parâmetro espectral de cada sub-banda.
[000238] Opcionalmente, como outra modalidade, a segunda unidade de determinação 930 pode selecionar, em cada sub-banda, pelo menos um quadro de silêncio dos S quadros de silêncio, de modo que uma distância espectral de grupo de sub-banda do pelo menos um quadro de silêncio seja menor do que um quarto limite e determinar, em cada sub-banda, o primeiro parâmetro espectral de cada sub-banda de acordo com um parâmetro espectral do pelo menos um quadro de silêncio.
[000239] Opcionalmente, como outra modalidade, quando o dispositivo 900 é o codificador, o dispositivo 900 pode incluir adicionalmente uma unidade de codificação 940.
[000240] Os S quadros de silêncio podem incluir um quadro de silêncio de entrada atual e os (S-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual. A unidade de codificação 940 pode codificar o quadro de silêncio de entrada atual em um quadro SID, em que o quadro SID inclui o primeiro parâmetro espectral de cada subbanda.
[000241] Para outras funções e operações do dispositivo 900, referência pode ser feita ao processo da modalidade de método na Figura 5 no anterior; para impedir a repetição, nenhum detalhe adicional é fornecido no presente documento novamente.
[000242] A Figura 10 é um diagrama de blocos esquemático de um dispositivo de processamento de sinal de acordo com outra modalidade da presente invenção. Um exemplo de um dispositivo 1000 na Figura 10 é um codificador ou um decodificador, por exemplo, o codificador 110 ou o decodificador 120 mostrado na Figura 1. O dispositivo 1000 inclui uma primeira unidade de determinação 1010 e uma segunda unidade de determinação 1020.
[000243] A primeira unidade de determinação 1010 determina um primeiro parâmetro de cada quadro de silêncio em T quadros de silêncio, em que o primeiro parâmetro é usado para representar a entropia espectral, e T é um número inteiro positivo. A segunda unidade de determinação 1020 determina um primeiro parâmetro espectral em conformidade com o primeiro parâmetro, determinado pela primeira unidade de determinação 1010, de cada quadro de silêncio nos T quadros de silêncio, em que o primeiro parâmetro espectral é usado para gerar um ruído de conforto.
[000244] Nessa modalidade da presente invenção, um primeiro parâmetro espectral usado para gerar um ruído de conforto é determinado de acordo com um primeiro parâmetro que é usado para representar a entropia espectral e de T quadros de silêncio, em vez de um parâmetro espectral usado para gerar o ruído de conforto ser obtido simplesmente obtendo um valor médio ou um valor mediano dos parâmetros espectrais de múltiplos quadros de silêncio, melhorando, assim, a qualidade do ruído de conforto.
[000245] Opcionalmente, como uma modalidade, a segunda unidade de determinação 1020 pode determinar, em um caso em que é determinado que os T quadros de silêncio podem ser classificados em um primeiro grupo de quadros de silêncio e um segundo grupo de quadros de silêncio em conformidade com um critério de agrupamento, o primeiro parâmetro espectral em conformidade com um parâmetro espectral do primeiro grupo de quadros de silêncio, em que a entropia espectral representada pelos primeiros parâmetros do primeiro grupo de quadros de silêncio é maior do que a entropia espectral representada pelos primeiros parâmetros do segundo grupo de quadros de silêncio; e realizar, em um caso em que é determinado que os T quadros de silêncio não podem ser classificados no primeiro grupo de quadros de silêncio e no segundo grupo de quadros de silêncio em conformidade com o critério de agrupamento, a média ponderada nos parâmetros espectrais dos T quadros de silêncio, para determinar o primeiro parâmetro espectral, em que a entropia espectral representada pelos primeiros parâmetros do primeiro grupo de quadros de silêncio é maior do que a entropia espectral representada pelos primeiros parâmetros do segundo grupo de quadros de silêncio.
[000246] Opcionalmente, como outra modalidade, o critério de agrupamento pode incluir: uma distância entre um primeiro parâmetro de cada quadro de silêncio no primeiro grupo de quadros de silêncio e um primeiro valor médio é menor ou igual a uma distância entre o primeiro parâmetro de cada quadro de silêncio no primeiro grupo de quadros de silêncio e um segundo valor médio; uma distância entre um primeiro parâmetro de cada quadro de silêncio no segundo grupo de quadros de silêncio e o segundo valor médio é menor ou igual a uma distância entre o primeiro parâmetro de cada quadro de silêncio no segundo grupo de quadros de silêncio e o primeiro valor médio; uma distância entre o primeiro valor médio e o segundo valor médio é maior do que uma distância média entre os primeiros parâmetros do primeiro grupo de quadros de silêncio e o primeiro valor médio; e a distância entre o primeiro valor médio e o segundo valor médio é maior do que uma distância média entre os primeiros parâmetros do segundo grupo de quadros de silêncio e o segundo valor médio,em que o primeiro valor médio é um valor médio dos primeiros parâmetros do primeiro grupo de quadros de silêncio, e o segundo valor médio é um valor médio dos primeiros parâmetros do segundo grupo de quadros de silêncio.
[000247] Opcionalmente, como outra modalidade, a segunda unidade de determinação 1020 pode realizar a média ponderada nos parâmetros espectrais dos T quadros de silêncio para determinar o primeiro parâmetro espectral, em que, para o i-ésimo quadro de silêncio e o j- ésimo quadro de silêncio, que são diferentes, nos T quadros de silêncio, um coeficiente de ponderação que corresponde ao i-ésimo quadro de silêncio é maior ou igual a um coeficiente de ponderação que corresponde ao j-ésimo quadro de silêncio; quando o primeiro parâmetro é positivamente correlacionado à entropia espectral, um primeiro parâmetro do i-ésimo quadro de silêncio é maior do que um primeiro parâmetro do j-ésimo quadro de silêncio; e quando o primeiro parâmetro é negativamente correlacionado à entropia espectral, o primeiro parâmetro do i-ésimo quadro de silêncio é menor do que o primeiro parâmetro do j-ésimo quadro de silêncio, em que i e j são ambos números inteiros positivos, e 1 >i>T, e 1>j>T.
[000248] Opcionalmente, como outra modalidade, quando o dispositivo 1000 é o codificador, o dispositivo 1000 pode incluir adicionalmente uma unidade de codificação 1030.
[000249] Os T quadros de silêncio podem incluir um quadro de silêncio de entrada atual e os (T-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual. A unidade de codificação 1030 pode codificar o quadro de silêncio de entrada atual em um quadro SID, em que o quadro SID inclui o primeiro parâmetro espectral.
[000250] Para outras funções e operações do dispositivo 1000, referência pode ser feita ao processo da modalidade de método na Figura 6 no anterior; para impedir a repetição, nenhum detalhe adicional é fornecido no presente documento novamente.
[000251] A Figura 11 é um diagrama de blocos esquemático de um dispositivo de codificação de sinal de acordo com outra modalidade da presente invenção. Um exemplo de um dispositivo 1100 na Figura 11 é um codificador. O dispositivo 1100 inclui uma memória 1110 e um processador 1120.
[000252] A memória 1110 pode incluir uma memória de acesso aleatório, uma memória flash, uma memória de somente leitura, uma memória de somente leitura programável, uma memória não volátil ou um registro. O processador 1120 pode ser uma unidade de processamento central (Central Processing Unit, CPU).
[000253] A memória 1110 é configurada para armazenar uma instrução executável. O processador 1120 pode executar a instrução executável armazenada na memória 1110 para: predizer, em um caso em que uma forma de codificação de um quadro anterior de um quadro de entrada atual é uma forma de codificação contínua, um ruído de conforto que é gerado por um decodificador em conformidade com o quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro SID e determinar um sinal de silêncio real, em que o quadro de entrada atual é um quadro de silêncio; determinar um grau de desvio entre o ruído de conforto e o sinal de silêncio real; determinar uma forma de codificação do quadro de entrada atual em conformidade com o grau de desvio, em que a forma de codificação do quadro de entrada atual inclui uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro SID; e codificar o quadro de entrada atual em conformidade com a forma de codificação do quadro de entrada atual.
[000254] Nessa modalidade da presente invenção, em um caso em que uma forma de codificação de um quadro anterior de um quadro de entrada atual é uma forma de codificação contínua, um ruído de conforto que é gerado por um decodificador de acordo com o quadro de entrada atual em um caso em que o quadro de entrada atual é codificado em um quadro SID é predito, um grau de desvio entre o ruído de conforto e um sinal de silêncio real é determinado, e é determinado, de acordo com o grau de desvio, que uma forma de codificação do quadro de entrada atual é uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro SID, em vez de que quadro de entrada atual é codificado em um quadro de desconexão simplesmente de acordo com uma quantidade, obtida através de uma coleção de estatísticas, de quadros de voz ativos, salvando, assim, a largura de banda de comunicação.
[000255] Opcionalmente, como uma modalidade, o processador 1120 pode predizer um parâmetro de recurso do ruído de conforto e determinar um parâmetro de recurso do sinal de silêncio real, em que o parâmetro de recurso do ruído de conforto está em uma correspondência de um para um com o parâmetro de recurso do sinal de silêncio real. O processador 1120 pode determinar uma distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real.
[000256] Opcionalmente, como outra modalidade, o processador 1120 pode determinar, em um caso em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é menor do que um limite correspondente em um conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID, em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real está em uma correspondência de um para um com o limite no conjunto de limites. O processador 1120 pode determinar, em um caso em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é maior ou igual ao limite correspondente no conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
[000257] Opcionalmente, como outra modalidade, o parâmetro de recurso do ruído de conforto pode ser usado para representar pelo menos uma das informações a seguir: informações de energia e informações espectrais.
[000258] Opcionalmente, como outra modalidade, as informações de energia podem incluir a energia de excitação de CELP. As informações espectrais podem incluir pelo menos um dos seguintes: um coeficiente de filtro preditivo linear, um coeficiente de FFT e um coeficiente de MDCT. O coeficiente de filtro preditivo linear pode incluir pelo menos um dos seguintes: um coeficiente de LSF, um coeficiente de LSP, um coeficiente de ISF, um coeficiente de ISP, um coeficiente de reflexão e um coeficiente de LPC.
[000259] Opcionalmente, como outra modalidade, o processador 1120 pode predizer o parâmetro de recurso do ruído de conforto em conformidade com um parâmetro de ruído de conforto do quadro anterior do quadro de entrada atual e um parâmetro de recurso do quadro de entrada atual. Alternativamente, o processador 1120 pode predizer o parâmetro de recurso do ruído de conforto em conformidade com os parâmetros de recurso de L quadros de desconexão que precedem o quadro de entrada atual e o parâmetro de recurso do quadro de entrada atual, em que L é um número inteiro positivo.
[000260] Opcionalmente, como outra modalidade, o processador 1120 pode determinar que o parâmetro de recurso do quadro de entrada atual é o parâmetro do sinal de silêncio real. Alternativamente, o processador 1120 pode coletar as estatísticas sobre os parâmetros de recurso de M quadros de silêncio para determinar o parâmetro do sinal de silêncio real.
[000261] Opcionalmente, como outra modalidade, os M quadros de silêncio podem incluir o quadro de entrada atual e (M-1) quadros de silêncio que precedem o quadro de entrada atual, em que M é um número inteiro positivo.
[000262] Opcionalmente, como outra modalidade, o parâmetro de recurso do ruído de conforto pode incluir a energia de excitação de predição linear excitada por código CELP do ruído de conforto e um coeficiente de frequência espectral linear LSF do ruído de conforto e o parâmetro de recurso do sinal de silêncio real pode incluir a energia de excitação de CELP do sinal de silêncio real e um coeficiente de LSF do sinal de silêncio real. O processador 1120 pode determinar uma distância De entre a energia de excitação de CELP do ruído de conforto e a energia de excitação de CELP do sinal de silêncio real e determinar uma distância Dlsf entre o coeficiente de LSF do ruído de conforto e o coeficiente de LSF do sinal de silêncio real.
[000263] Opcionalmente, como outra modalidade, em um caso em que a distância De é menor do que um primeiro limite e a distância Dlsf é menor do que um segundo limite, o processador 1120 pode determinar que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID. Em um caso em que a distância De é maior ou igual ao primeiro limite ou a distância Dlsf é maior ou igual ao segundo limite, o processador 1120 pode determinar que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
[000264] Opcionalmente, como outra modalidade, o processor 1120 pode incluir adicionalmente o primeiro limite predefinido e o segundo limite predefinido. Alternativamente, o processador 1120 pode determinar adicionalmente o primeiro limite em conformidade com a energia de excitação de CELP de N quadros de silêncio que precedem o quadro de entrada atual e determinar o segundo limite em conformidade com os coeficientes de LSF dos N quadros de silêncio, em que N é um número inteiro positivo.
[000265] Opcionalmente, como outra modalidade, o processador 1120 pode predizer o ruído de conforto de uma primeira forma de predição, em que a primeira forma de predição é igual a uma forma na qual o decodificador gera o ruído de conforto.
[000266] Para outras funções e operações do dispositivo 1100, referência pode ser feita aos processos das modalidades de método na Figura 1 à Figura 3b no anterior; para impedir a repetição, nenhum detalhe adicional é fornecido no presente documento novamente.
[000267] A Figura 12 é um diagrama de blocos esquemático de um dispositivo de codificação de sinal de acordo com outra modalidade da presente invenção. Um exemplo de um dispositivo 1200 na Figura 12 é um codificador ou um decodificador, por exemplo, o codificador 110 ou o decodificador 120 mostrado na Figura 1. O dispositivo 1200 inclui uma memória 1210 e um processador 1220.
[000268] A memória 1210 pode incluir uma memória de acesso aleatório, uma memória flash, uma memória de somente leitura, uma memória de somente leitura programável, uma memória não volátil ou um registro. O processador 1220 pode ser uma CPU.
[000269] A memória 1210 é configurada para armazenar uma instrução executável. O processador 1220 pode executar a instrução executável armazenada na memória 1210 para: determinar uma distância espectral ponderada em grupo de cada quadro de silêncio em P quadros de silêncio, em que a distância espectral ponderada em grupo de cada quadro de silêncio nos P quadros de silêncio é a soma das distâncias espectrais ponderadas entre cada quadro de silêncio nos P quadros de silêncio e os outros (P-1) quadros de silêncio, em que P é um número inteiro positivo; e determinar um primeiro parâmetro espectral em conformidade com a distância espectral ponderada em grupo de cada quadro de silêncio nos P quadros de silêncio, em que o primeiro parâmetro espectral é usado para gerar um ruído de conforto.
[000270] Nessa modalidade da presente invenção, um primeiro parâmetro espectral usado para gerar um ruído de conforto é determinado de acordo com uma distância espectral ponderada em grupo de cada quadro de silêncio em P quadros de silêncio, em vez de um parâmetro espectral usado para gerar o ruído de conforto ser obtido simplesmente obtendo um valor médio ou um valor mediano dos parâmetros espectrais de múltiplos quadros de silêncio, melhorando, assim, a qualidade do ruído de conforto.
[000271] Opcionalmente, como uma modalidade, cada quadro de silêncio pode corresponder a um grupo de coeficientes de ponderação, em que, no grupo de coeficientes de ponderação, um coeficiente de ponderação que corresponde a um primeiro grupo de sub-bandas é maior do que um coeficiente de ponderação que corresponde a um segundo grupo de sub-bandas, e a importância perceptiva do primeiro grupo de sub-bandas é maior do que a importância perceptiva do segundo grupo de sub-bandas.
[000272] Opcionalmente, como outra modalidade, o processador 1220 pode selecionar um primeiro quadro de silêncio dos P quadros de silêncio, de modo que uma distância espectral ponderada em grupo do primeiro quadro de silêncio nos P quadros de silêncio seja a menor e determinar que um parâmetro espectral do primeiro quadro de silêncio é o primeiro parâmetro espectral.
[000273] Opcionalmente, como outra modalidade, o processador 1220 pode selecionar pelo menos um quadro de silêncio dos P quadros de silêncio, de modo que uma distância espectral ponderada em grupo do pelo menos um quadro de silêncio nos P quadros de silêncio seja menor do que um terceiro limite e determinar o primeiro parâmetro espectral de acordo com um parâmetro espectral do pelo menos um quadro de silêncio.
[000274] Opcionalmente, como outra modalidade, quando o dispositivo 1200 é o codificador, os P quadros de silêncio podem incluir um quadro de silêncio de entrada atual e os (P-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual. O processador 1220 pode codificar o quadro de silêncio de entrada atual em um quadro SID, em que o quadro SID inclui o primeiro parâmetro espectral.
[000275] Para outras funções e operações do dispositivo 1200, referência pode ser feita ao processo da modalidade de método na Figura 4 no anterior; para impedir a repetição, nenhum detalhe adicional é fornecido no presente documento novamente.
[000276] A Figura 13 é um diagrama de blocos esquemático de um dispositivo de processamento de sinal de acordo com outra modalidade da presente invenção. Um exemplo de um dispositivo 1300 na Figura 13 é um codificador ou um decodificador, por exemplo, o codificador 110 ou o decodificador 120 mostrado na Figura 1. O dispositivo 1300 inclui uma memória 1310 e um processador 1320.
[000277] A memória 1310 pode incluir uma memória de acesso aleatório, uma memória flash, uma memória de somente leitura, uma memória de somente leitura programável, uma memória não volátil ou um registro. O processador 1320 pode ser uma CPU.
[000278] A memória 1310 é configurada para armazenar uma instrução executável. O processador 1320 pode executar a instrução executável armazenada na memória 1310 para: dividir uma banda de frequência de um sinal de entrada em R sub-bandas, em que R é um número inteiro positivo; determinar, em cada sub-banda das R subbandas, uma distância espectral de grupo de sub-banda de cada quadro de silêncio em S quadros de silêncio, em que a distância espectral de grupo de sub-banda de cada quadro de silêncio nos S quadros de silêncio é a soma das distâncias espectrais entre cada quadro de silêncio nos S quadros de silêncio em cada sub-banda e os outros (S- 1) quadros de silêncio, e S é um número inteiro positivo; e determinar, em cada sub-banda, um primeiro parâmetro espectral de cada subbanda, em conformidade com a distância espectral de grupo de subbanda em grupo de cada quadro de silêncio nos S quadros de silêncio, em que o primeiro parâmetro espectral de cada sub-banda é usado para gerar um ruído de conforto.
[000279] Nessa modalidade da presente invenção, um parâmetro espectral que é de cada sub-banda e usado para gerar um ruído de conforto é determinado em cada sub-banda de R sub-bandas de acordo com uma distância espectral de cada quadro de silêncio em S quadros de silêncio, em vez do parâmetro espectral usado para gerar o ruído de conforto ser obtido simplesmente obtendo um valor médio ou um valor mediano dos parâmetros espectrais de múltiplos quadros de silêncio, melhorando, assim, a qualidade do ruído de conforto.
[000280] Opcionalmente, como uma modalidade, o processador 1320 pode selecionar, em cada sub-banda, um primeiro quadro de silêncio dos S quadros de silêncio, de modo que uma distância espectral de grupo de sub-banda do primeiro quadro de silêncio nos S quadros de silêncio em cada sub-banda seja a menor e determinar, em cada sub- banda, que um parâmetro espectral do primeiro quadro de silêncio é o primeiro parâmetroespectral de cada sub-banda.
[000281] Opcionalmente, como outra modalidade, o processador 1320 pode selecionar, em cada sub-banda, pelo menos um quadro de silêncio dos S quadros de silêncio, de modo que uma distância espectral de grupo de sub-banda do pelo menos um quadro de silêncio seja menor do que um quarto limite e determinar, em cada sub-banda, o primeiro parâmetro espectral de cada sub-banda de acordo com um parâmetro espectral do pelo menos um quadro de silêncio.
[000282] Opcionalmente, como outra modalidade, quando o dispositivo 1300 é o codificador, os S quadros de silêncio podem incluir um quadro de silêncio de entrada atual e os (S-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual. O processador 1320 pode codificar o quadro de silêncio de entrada atual em um quadro SID, em que o quadro SID inclui o primeiro parâmetro espectral de cada sub-banda.
[000283] Para outras funções e operações do dispositivo 1300, referência pode ser feita ao processo da modalidade de método na Figura 5 no anterior; para impedir a repetição, nenhum detalhe adicional é fornecido no presente documento novamente.
[000284] A Figura 14 é um diagrama de blocos esquemático de um dispositivo de processamento de sinal de acordo com outra modalidade da presente invenção. Um exemplo de um dispositivo 1400 na Figura 14 é um codificador ou um decodificador, por exemplo, o codificador 110 ou o decodificador 120 mostrado na Figura 1. O dispositivo 1400 inclui uma memória 1410 e um processador 1420.
[000285] A memória 1410 pode incluir uma memória de acesso aleatório, uma memória flash, uma memória de somente leitura, uma memória de somente leitura programável, uma memória não volátil ou um registro. O processador 1420 pode ser uma CPU.
[000286] A memória 1410 é configurada para armazenar uma instrução executável. O processador 1420 pode executar a instrução executável armazenada na memória 1410 para: determinar um primeiro parâmetro de cada quadro de silêncio em T quadros de silêncio, em que o primeiro parâmetro é usado para representar a entropia espectral, e T é um número inteiro positivo; e determinar um primeiro parâmetro espectral em conformidade com o primeiro parâmetro de cada quadro de silêncio nos T quadros de silêncio, em que o primeiro parâmetro espectral é usado para gerar um ruído de conforto.
[000287] Nessa modalidade da presente invenção, um primeiro parâmetro espectral usado para gerar um ruído de conforto é determinado de acordo com um primeiro parâmetro que é usado para representar a entropia espectral e de T quadros de silêncio, em vez de um parâmetro espectral usado para gerar o ruído de conforto ser obtido simplesmente obtendo um valor médio ou um valor mediano dos parâmetros espectrais de múltiplos quadros de silêncio, melhorando, assim, a qualidade do ruído de conforto.
[000288] Opcionalmente, como uma modalidade, o processador 1420 pode determinar, em um caso em que é determinado que os T quadros de silêncio podem ser classificados em um primeiro grupo de quadros de silêncio e um segundo grupo de quadros de silêncio em conformidade com um critério de agrupamento, o primeiro parâmetro espectral em conformidade com um parâmetro espectral do primeiro grupo de quadros de silêncio, em que a entropia espectral representada pelos primeiros parâmetros do primeiro grupo de quadros de silêncio é maior do que a entropia espectral representada pelos primeiros parâmetros do segundo grupo de quadros de silêncio; e realizar, em um caso em que é determinado que os T quadros de silêncio não podem ser classificados no primeiro grupo de quadros de silêncio e no segundo grupo de quadros de silêncio em conformidade com o critério de agrupamento, a média ponderada nos parâmetros espectrais dos T quadros de silêncio, para determinar o primeiro parâmetro espectral, em que a entropia espectral representada pelos primeiros parâmetros do primeiro grupo de quadros de silêncio é maior do que a entropia espectral representada pelos primeiros parâmetros do segundo grupo de quadros de silêncio.
[000289] Opcionalmente, como outra modalidade, o critério de agrupamento pode incluir: uma distância entre um primeiro parâmetro de cada quadro de silêncio no primeiro grupo de quadros de silêncio e um primeiro valor médio é menor ou igual a uma distância entre o primeiro parâmetro de cada quadro de silêncio no primeiro grupo de quadros de silêncio e um segundo valor médio; uma distância entre um primeiro parâmetro de cada quadro de silêncio no segundo grupo de quadros de silêncio e o segundo valor médio é menor ou igual a uma distância entre o primeiro parâmetro de cada quadro de silêncio no segundo grupo de quadros de silêncio e o primeiro valor médio; uma distância entre o primeiro valor médio e o segundo valor médio é maior do que uma distância média entre os primeiros parâmetros do primeiro grupo de quadros de silêncio e o primeiro valor médio; e a distância entre o primeiro valor médio e o segundo valor médio é maior do que uma distância média entre os primeiros parâmetros do segundo grupo de quadros de silêncio e o segundo valor médio,em que o primeiro valor médio é um valor médio dos primeiros parâmetros do primeiro grupo de quadros de silêncio, e o segundo valor médio é um valor médio dos primeiros parâmetros do segundo grupo de quadros de silêncio.
[000290] Opcionalmente, como outra modalidade, o processador 1420 pode realizar a média ponderada nos parâmetros espectrais dos T quadros de silêncio para determinar o primeiro parâmetro espectral, em que, para o i-ésimo quadro de silêncio e o j-ésimo quadro de silêncio, que são diferentes, nos T quadros de silêncio, um coeficiente de ponderação que corresponde ao i-ésimo quadro de silêncio é maior ou igual a um coeficiente de ponderação que corresponde ao j-ésimo quadro de silêncio; quando o primeiro parâmetro é positivamente correlacionado à entropia espectral, um primeiro parâmetro do i-ésimo quadro de silêncio é maior do que um primeiro parâmetro do j-ésimo quadro de silêncio; e quando o primeiro parâmetro é negativamente correlacionado à entropia espectral, o primeiro parâmetro do i-ésimo quadro de silêncio é menor do que o primeiro parâmetro do j-ésimoquadro de silêncio, em que i e j são ambos números inteiros positivos, e 1 >i>T, e 1>j>T.
[000291] Opcionalmente, como outra modalidade, quando o dispositivo 1400 é o codificador, os T quadros de silêncio podem incluir um quadro de silêncio de entrada atual e os (T-1) quadros de silêncio que precedem o quadro de silêncio de entrada atual. O processador 1420 pode codificar o quadro de silêncio de entrada atual em um quadro SID, em que o quadro SID inclui o primeiro parâmetro espectral.
[000292] Para outras funções e operações do dispositivo 1400, referência pode ser feita ao processo da modalidade de método na Figura 6 no anterior; para impedir a repetição, nenhum detalhe adicional é fornecido no presente documento novamente.
[000293] Uma pessoa de habilidade comum na técnica pode estar ciente de que, em combinação com os exemplos descritos nas modalidades reveladas nesse relatório descritivo, as etapas de algoritmo e unidades podem ser implantadas por hardware eletrônico ou uma combinação de software de computador e hardware eletrônico. Se as funções são executadas por um hardware ou software depende de condições de limitação de modelo e pedidos particulares das soluções técnicas. Uma pessoa versada na técnica pode usar diferentes métodos para implantar as funções descritas para cada pedido particular, mas não deve ser considerado que a implantação vai além de escopo da presente invenção.
[000294] Pode ser claramente entendido por uma pessoa versada na técnica que, para o propósito de uma descrição breve e conveniente, para um processo de trabalho detalhado do sistema, aparelho e unidade anteriores, pode ser feita referência a um processo correspondente nas modalidades de método anteriores, e os detalhes não são descritos novamente no presente documento.
[000295] Nas diversas modalidades fornecidas no presente pedido, deve-se entender que o sistema, o aparelho e o método revelados podem ser implantados de outras formas. Por exemplo, a modalidade de aparelho descrita é apenas exemplificativa. Por exemplo, a divisão de unidade é apenas uma divisão de função lógica e pode ser outra divisão em uma implantação real. Por exemplo, uma pluralidade de unidades ou componentes pode ser combinada ou integrada em outro sistema ou alguns recursos podem ser ignorados ou não realizados. Além disso, os acoplamentos mútuos ou acoplamentos diretos ou conexões de comunicação exibidos ou discutidos podem ser implantados com o uso de algumas interfaces. Os acoplamentos indiretos ou conexões de comunicação entre os aparelhos ou unidades podem ser implantados em formas eletrônicas, mecânicas ou outras.
[000296] As unidades descritas como partes separadas podem ou não ser separadas fisicamente, e as partes exibidas como unidades podem ou não ser unidades físicas, podem estar localizadas em uma posição ou podem estar distribuídas em uma pluralidade de unidades de rede. Alguma parte ou todas as unidades podem ser selecionadas de acordo com necessidades reais para alcançar os objetivos das soluções das modalidades.
[000297] Adicionalmente, as unidades funcionais nas modalidades da presente invenção podem ser integradas em uma unidade de processamento ou cada uma das unidades pode existir fisicamente sozinha ou duas ou mais unidades são integradas em uma unidade.
[000298] Quando as funções são implantadas na forma de uma unidade funcional de software e vendida ou usada como um produto independente, as funções podem ser armazenadas em um meio de armazenamento legível por computador. Com base em tal entendimento, as soluções técnicas da presente invenção,essencialmente, ou a parte que contribui para a técnica anterior ou alguma parte das soluções técnicas podem ser implantadas em forma de um produto de software. O produto de software de computador é armazenado em um meio de armazenamento e inclui várias instruções para instruir um dispositivo de computador (que pode ser um computador pessoal, um servidor ou um dispositivo de rede) a realizar todas ou uma parte das etapas dos métodos descritos nas modalidades da presente invenção. O meio de armazenamento supracitado inclui: qualquer meio que possa armazenar um código de programa, tal qual uma unidade flash USB, um disco rígido removível, uma memória só de leitura (ROM, Read-Only Memory), uma memória de acesso aleatório (RAM, Random Access Memory), um disco magnético, ou um disco óptico.
[000299] As descrições anteriores são apenas formas de implantação específicas da presente invenção, porém, não se destinam a limitar o escopo de proteção da presente invenção. Qualquer variação ou substituição prontamente percebida por uma pessoa versada na técnica abrangida pelo escopo técnico revelado na presente invenção deve ser abrangida pelo escopo de proteção da presente invenção. Portanto, o escopo de proteção da presente invenção deve ser submetido ao escopo de proteção das concretizações.

Claims (21)

1. Método de codificação de sinal caracterizado pelo fato de que o método compreende as etapas de:em um caso no qual uma forma de codificação de um quadro anterior de um quadro de entrada atual é uma forma de codificação contínua, predizer (210) um ruído de conforto que é gerado por um decodificador de acordo com o quadro de entrada atual em um caso no qual o quadro de entrada atual é codificado em um quadro descritor de silêncio, SID, e determinar um sinal de silêncio real, em que o quadro de entrada atual é um quadro de silêncio;determinar (220) um grau de desvio entre o ruído de conforto e o sinal de silêncio real;determinar (230) uma forma de codificação do quadro de entrada atual de acordo com o grau de desvio, em que a forma de codificação do quadro de entrada atual compreende uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro SID; ecodificar (240) o quadro de entrada atual de acordo com a forma de codificação de quadro de desconexão quando a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de predizer um ruído de conforto que é gerado por um decodificador de acordo com o quadro de entrada atual em um caso no qual o quadro de entrada atual é codificado em um quadro SID, e determinar um sinal de silêncio real compreender:predizer um parâmetro de recurso do ruído de conforto, e determinar um parâmetro de recurso do sinal de silêncio real, em que o parâmetro de recurso do ruído de conforto está em uma correspondência de um para um com o parâmetro de recurso do sinal de silêncio real; ea determinação de um grau de desvio entre o ruído de conforto e o sinal de silêncio real compreende:determinar uma distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a determinação de uma forma de codificação do quadro de entrada atual de acordo com o grau de desvio compreende:determinar, em um caso no qual a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é menor do que um limite correspondente em um conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID, em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real está em uma correspondência de um para um com o limite no conjunto de limites; edeterminar, em um caso no qual a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é maior do que ou igual ao limite correspondente no conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
4. Método, de acordo com a reivindicação 2 ou 3, caracterizado pelo fato de que o parâmetro de recurso do ruído de conforto é usado para representar pelo menos uma das informações a seguir: informações de energia e informações espectrais.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que as informações de energia compreendem energia de excitação de predição linear excitada por código, CELP;as informações espectrais compreendem pelo menos um dos seguintes: um coeficiente de filtro preditivo linear, um coeficiente de transformada rápida de Fourier, FFT, e um coeficiente de transformada discreta de cosseno modificada, MDCT; eo coeficiente de filtro preditivo linear compreende pelo menos um dos seguintes: um coeficiente de frequência espectral linear, LSF, um coeficiente de par espectral linear, LSP, um coeficiente de frequência espectral de imitância, ISF, um coeficiente de par espectral de imitância, ISP, um coeficiente de reflexão, e um coeficiente de codificação preditiva linear, LPC.
6. Método, de acordo com qualquer uma das reivindicações 2 a 5, caracterizado pelo fato de predizer um parâmetro de recurso do ruído de conforto compreender:predizer o parâmetro de recurso do ruído de conforto de acordo com um parâmetro de ruído de conforto do quadro anterior do quadro de entrada atual e um parâmetro de recurso do quadro de entrada atual; oupredizer o parâmetro de recurso do ruído de conforto de acordo com os parâmetros de recurso de L quadros de desconexão precedendo o quadro de entrada atual e um parâmetro de recurso do quadro de entrada atual, em que L é um número inteiro positivo.
7. Método, de acordo com qualquer uma das reivindicações 2 a 6, caracterizado pelo fato de que a determinação de um parâmetro de recurso do sinal de silêncio real compreende:usar o parâmetro de recurso do quadro de entrada atual como o parâmetro de recurso do sinal de silêncio real; oucoletar estatísticas sobre parâmetros de recurso de M quadros de silêncio, para determinar o parâmetro de recurso do sinal de silêncio real.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que os M quadros de silêncio compreendem o quadro de entrada atual e (M-1) quadros de silêncio precedendo o quadro de entrada atual, em que M é um número inteiro positivo.
9. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que o parâmetro de recurso do ruído de conforto compreende energia de excitação de predição linear excitada por código, CELP, do ruído de conforto e um coeficiente de frequência espectral linear, LSF, do ruído de conforto, e o parâmetro de recurso do sinal de silêncio real compreende energia de excitação de CELP do sinal de silêncio real e um coeficiente de LSF do sinal de silêncio real; ea determinação de uma distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real compreende:determinar uma distância De entre a energia de excitação de CELP do ruído de conforto e a energia de excitação de CELP do sinal de silêncio real, e determinar uma distância Dlsf entre o coeficiente de LSF do ruído de conforto e o coeficiente de LSF do sinal de silêncio real.
10. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que a determinação de, em um caso no qual a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é menor do que um limite correspondente em um conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID compreende:em um caso no qual a distância De é menor do que um primeiro limite e a distância Dlsf é menor do que um segundo limite, determinar que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID; ea determinação de, em um caso no qual a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é maior do que ou igual ao limite correspondente no conjunto de limites, que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão compreende:em um caso no qual a distância De é maior do que ou igual ao primeiro limite ou a distância Dlsf é maior do que ou igual ao segundo limite, determinar que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
11. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que o método ainda compreende:adquirir o primeiro limite predefinido e o segundo limite predefinido; oudeterminar o primeiro limite de acordo com energia de excitação de CELP de N quadros de silêncio precedendo o quadro de entrada atual, e determinar o segundo limite de acordo com coeficientes de LSF dos N quadros de silêncio, em que N é um número inteiro positivo.
12. Método, de acordo com qualquer uma das reivindicações 1 a 11, caracterizado pelo fato de predizer um ruído de conforto que é gerado por um decodificador de acordo com o quadro de entrada atual em um caso no qual o quadro de entrada atual é codificado em um quadro SID compreender:predizer o ruído de conforto de uma primeira forma de predição, em que a primeira forma de predição é igual a uma forma na qual o decodificador gera o ruído de conforto.
13. Dispositivo de codificação de sinal caracterizado pelo fato de que o dispositivo compreende:uma primeira unidade de determinação (710), configurada para: em um caso no qual uma forma de codificação de um quadro anterior de um quadro de entrada atual é uma forma de codificação contínua, predizer um ruído de conforto que é gerado por um decodificador de acordo com o quadro de entrada atual em um caso no qual o quadro de entrada atual é codificado em um quadro descritor de silêncio, SID, e determinar um sinal de silêncio real, em que o quadro de entrada atual é um quadro de silêncio;uma segunda unidade de determinação (720), configurada para determinar um grau de desvio entre o ruído de conforto determinado pela primeira unidade de determinação e o sinal de silêncio real determinado pela primeira unidade de determinação (710);uma terceira unidade de determinação (730), configurada para determinar uma forma de codificação do quadro de entrada atual de acordo com o grau de desvio determinado pela segunda unidade de determinação (720), em que a forma de codificação do quadro de entrada atual compreende uma forma de codificação de quadro de desconexão ou uma forma de codificação de quadro SID; euma unidade de codificação (740), configurada para codificar o quadro de entrada atual de acordo com a forma de codificação de quadro de desconexão quando a forma de codificação do quadro de entrada atual determinada pela terceira unidade de determinação é a forma de codificação de quadro de desconexão.
14. Dispositivo, de acordo com a reivindicação 13, caracterizado pelo fato de que a primeira unidade de determinação (710) é especificamente configurada para predizer um parâmetro de recurso do ruído de conforto, e determinar um parâmetro de recurso do sinal de silêncio real, em que o parâmetro de recurso do ruído de conforto está em uma correspondência de um para um com o parâmetro de recurso do sinal de silêncio real; ea segunda unidade de determinação (720) é especialmente configurada para determinar uma distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real.
15. Dispositivo, de acordo com a reivindicação 14, caracterizado pelo fato de que terceira unidade de determinação (730) é especificamente configurada para: em um caso no qual a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é menor do que um limite correspondente em um conjunto de limites, determinar que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID, em que a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real está em uma correspondência de um para um com o limite no conjunto de limites; e em um caso no qual a distância entre o parâmetro de recurso do ruído de conforto e o parâmetro de recurso do sinal de silêncio real é maior do que ou igual ao limite correspondente no conjunto de limites, determinar que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
16. Dispositivo, de acordo com a reivindicação 14 ou 15, caracterizado pelo fato de que a primeira unidade de determinação (710) é especificamente configurada para: predizer o parâmetro de recurso do ruído de conforto de acordo com um parâmetro de ruído de conforto do quadro anterior do quadro de entrada atual e um parâmetro de recurso do quadro de entrada atual; ou predizer o parâmetro de recurso do ruído de conforto de acordo com parâmetros de recurso de L quadros de desconexão precedendo o quadro de entrada atual e um parâmetro de recurso do quadro de entrada atual, em que L é um número inteiro positivo.
17. Dispositivo, de acordo com qualquer uma das reivindicações 14 a 16, caracterizado pelo fato de que a primeira unidade de determinação (710) é especificamente configurada para: determinar que o parâmetro de recurso do quadro de entrada atual é o parâmetro de recurso do sinal de silêncio real; ou coletar estatísticas sobre parâmetros de recurso de M quadros de silêncio para determinar o parâmetro de recurso do sinal de silêncio real.
18. Dispositivo, de acordo com a reivindicação 15, caracterizado pelo fato de que o parâmetro de recurso do ruído de conforto compreende energia de excitação de predição linear excitada por código, CELP, do ruído de conforto e um coeficiente de frequência espectral linear, LSF, do ruído de conforto, e o parâmetro de recurso do sinal de silêncio real compreende energia de excitação de CELP do sinal de silêncio real e um coeficiente de LSF do sinal de silêncio real; ea segunda unidade de determinação (720) é especificamente configurada para determinar uma distância De entre a energia de excitação de CELP do ruído de conforto e a energia de excitação de CELP do sinal de silêncio real, e determinar uma distância Dlsf entre o coeficiente de LSF do ruído de conforto e o coeficiente de LSF do sinal de silêncio real.
19. Dispositivo, de acordo com a reivindicação 18, caracterizado pelo fato de que a terceira unidade de determinação (730) é especificamente configurada para: em um caso no qual a distância De é menor do que um primeiro limite e a distância Dlsf é menor do que um segundo limite, determinar que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro SID; ea terceira unidade de determinação (730) é especificamente configurada para: em um caso no qual a distância De é maior do que ou igual ao primeiro limite ou a distância Dlsf é maior do que ou igual aosegundo limite, determinar que a forma de codificação do quadro de entrada atual é a forma de codificação de quadro de desconexão.
20. Dispositivo, de acordo com a reivindicação 19,caracterizado pelo fato de que o dispositivo ainda compreende:uma quarta unidade de determinação (750), configurada para: adquirir o primeiro limite predefinido e o segundo limite predefinido; ou determinar o primeiro limite de acordo com energia de excitação de CELP de N quadros de silêncio precedendo o quadro de entrada atual, e determinar o segundo limite de acordo com coeficientes de LSF dos N quadros de silêncio, em que N é um número inteiro positivo.
21. Dispositivo, de acordo com qualquer uma das reivindicações 13 a 20, caracterizado pelo fato de que a primeira unidade de determinação (710) é especificamente configurada para predizer o ruído de conforto em uma primeira forma de predição, em que a primeira forma de predição é igual a uma forma na qual o decodificador gera o ruído de conforto.
BR112015029310-7A 2013-05-30 2013-09-25 Método e dispositivo de codificação de sinal BR112015029310B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310209760.9 2013-05-30
CN201310209760.9A CN104217723B (zh) 2013-05-30 2013-05-30 信号编码方法及设备
PCT/CN2013/084141 WO2014190641A1 (zh) 2013-05-30 2013-09-25 一种媒体数据的传输方法、装置和系统

Publications (2)

Publication Number Publication Date
BR112015029310A2 BR112015029310A2 (pt) 2017-07-25
BR112015029310B1 true BR112015029310B1 (pt) 2021-11-30

Family

ID=51987922

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112015029310-7A BR112015029310B1 (pt) 2013-05-30 2013-09-25 Método e dispositivo de codificação de sinal

Country Status (17)

Country Link
US (2) US9886960B2 (pt)
EP (3) EP3745396B1 (pt)
JP (3) JP6291038B2 (pt)
KR (2) KR20170110737A (pt)
CN (3) CN104217723B (pt)
AU (2) AU2013391207B2 (pt)
BR (1) BR112015029310B1 (pt)
CA (2) CA2911439C (pt)
ES (2) ES2812553T3 (pt)
HK (1) HK1203685A1 (pt)
MX (1) MX355032B (pt)
MY (1) MY161735A (pt)
PH (2) PH12015502663B1 (pt)
RU (2) RU2638752C2 (pt)
SG (3) SG10201810567PA (pt)
WO (1) WO2014190641A1 (pt)
ZA (1) ZA201706413B (pt)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217723B (zh) * 2013-05-30 2016-11-09 华为技术有限公司 信号编码方法及设备
US10049684B2 (en) * 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection
CN107731223B (zh) * 2017-11-22 2022-07-26 腾讯科技(深圳)有限公司 语音活性检测方法、相关装置和设备
CN110660402B (zh) 2018-06-29 2022-03-29 华为技术有限公司 立体声信号编码过程中确定加权系数的方法和装置
CN111918196B (zh) * 2019-05-08 2022-04-19 腾讯科技(深圳)有限公司 一种音频采集器录音异常的诊断方法、装置、设备及存储介质
US11460927B2 (en) * 2020-03-19 2022-10-04 DTEN, Inc. Auto-framing through speech and video localizations
CN114495951A (zh) * 2020-11-11 2022-05-13 华为技术有限公司 音频编解码方法和装置

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2541484B2 (ja) * 1992-11-27 1996-10-09 日本電気株式会社 音声符号化装置
CA2110090C (en) 1992-11-27 1998-09-15 Toshihiro Hayata Voice encoder
FR2739995B1 (fr) 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JP3464371B2 (ja) * 1996-11-15 2003-11-10 ノキア モービル フォーンズ リミテッド 不連続伝送中に快適雑音を発生させる改善された方法
US7124079B1 (en) * 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
US6381568B1 (en) * 1999-05-05 2002-04-30 The United States Of America As Represented By The National Security Agency Method of transmitting speech using discontinuous transmission and comfort noise
US6662155B2 (en) * 2000-11-27 2003-12-09 Nokia Corporation Method and system for comfort noise generation in speech communication
US6889187B2 (en) * 2000-12-28 2005-05-03 Nortel Networks Limited Method and apparatus for improved voice activity detection in a packet voice network
US20030120484A1 (en) * 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US7454010B1 (en) * 2004-11-03 2008-11-18 Acoustic Technologies, Inc. Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation
US20060149536A1 (en) * 2004-12-30 2006-07-06 Dunling Li SID frame update using SID prediction error
EP1861846B1 (en) * 2005-03-24 2011-09-07 Mindspeed Technologies, Inc. Adaptive voice mode extension for a voice activity detector
EP1897085B1 (en) * 2005-06-18 2017-05-31 Nokia Technologies Oy System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
US20070294087A1 (en) * 2006-05-05 2007-12-20 Nokia Corporation Synthesizing comfort noise
TWI467979B (zh) * 2006-07-31 2015-01-01 Qualcomm Inc 用於信號改變偵測之系統、方法及裝置
US8725499B2 (en) 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
RU2319222C1 (ru) * 2006-08-30 2008-03-10 Валерий Юрьевич Тарасов Способ кодирования и декодирования речевого сигнала методом линейного предсказания
WO2008090564A2 (en) * 2007-01-24 2008-07-31 P.E.S Institute Of Technology Speech activity detection
WO2008121035A1 (en) * 2007-03-29 2008-10-09 Telefonaktiebolaget Lm Ericsson (Publ) Method and speech encoder with length adjustment of dtx hangover period
CN101303855B (zh) * 2007-05-11 2011-06-22 华为技术有限公司 一种舒适噪声参数产生方法和装置
CN101320563B (zh) 2007-06-05 2012-06-27 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
CN101335003B (zh) 2007-09-28 2010-07-07 华为技术有限公司 噪声生成装置、及方法
CN101430880A (zh) * 2007-11-07 2009-05-13 华为技术有限公司 一种背景噪声的编解码方法和装置
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN101483042B (zh) * 2008-03-20 2011-03-30 华为技术有限公司 一种噪声生成方法以及噪声生成装置
CN101335000B (zh) 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
JP4950930B2 (ja) * 2008-04-03 2012-06-13 株式会社東芝 音声/非音声を判定する装置、方法およびプログラム
CN102044243B (zh) * 2009-10-15 2012-08-29 华为技术有限公司 语音激活检测方法与装置、编码器
CA2778342C (en) 2009-10-19 2017-08-22 Martin Sehlstedt Method and background estimator for voice activity detection
US20110228946A1 (en) * 2010-03-22 2011-09-22 Dsp Group Ltd. Comfort noise generation method and system
WO2012083552A1 (en) 2010-12-24 2012-06-28 Huawei Technologies Co., Ltd. Method and apparatus for voice activity detection
AR085895A1 (es) * 2011-02-14 2013-11-06 Fraunhofer Ges Forschung Generacion de ruido en codecs de audio
RU2586838C2 (ru) 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодек, использующий синтез шума в течение неактивной фазы
JP5732976B2 (ja) * 2011-03-31 2015-06-10 沖電気工業株式会社 音声区間判定装置、音声区間判定方法、及びプログラム
CN102903364B (zh) * 2011-07-29 2017-04-12 中兴通讯股份有限公司 一种进行语音自适应非连续传输的方法及装置
CN103137133B (zh) * 2011-11-29 2017-06-06 南京中兴软件有限责任公司 非激活音信号参数估计方法及舒适噪声产生方法及系统
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
PL2823479T3 (pl) * 2012-09-11 2015-10-30 Ericsson Telefon Ab L M Generowanie szumu komfortowego
PL3550562T3 (pl) * 2013-02-22 2021-05-31 Telefonaktiebolaget Lm Ericsson (Publ) Sposoby i urządzenia dla zawieszenia DTX w kodowaniu audio
CN104217723B (zh) * 2013-05-30 2016-11-09 华为技术有限公司 信号编码方法及设备
CN104978970B (zh) * 2014-04-08 2019-02-12 华为技术有限公司 一种噪声信号的处理和生成方法、编解码器和编解码系统

Also Published As

Publication number Publication date
HK1203685A1 (en) 2015-10-30
CA2911439A1 (en) 2014-12-04
US9886960B2 (en) 2018-02-06
ES2812553T3 (es) 2021-03-17
US20160078873A1 (en) 2016-03-17
MX2015016375A (es) 2016-04-13
PH12018501871A1 (en) 2019-06-10
EP3007169B1 (en) 2020-06-24
MY161735A (en) 2017-05-15
CN104217723A (zh) 2014-12-17
RU2665236C1 (ru) 2018-08-28
AU2013391207B2 (en) 2017-03-23
BR112015029310A2 (pt) 2017-07-25
EP3745396A1 (en) 2020-12-02
JP2016526188A (ja) 2016-09-01
KR20160003192A (ko) 2016-01-08
AU2013391207A1 (en) 2015-11-26
CN106169297B (zh) 2019-04-19
CA2911439C (en) 2018-11-06
WO2014190641A1 (zh) 2014-12-04
ZA201706413B (en) 2019-04-24
JP6517276B2 (ja) 2019-05-22
US20180122389A1 (en) 2018-05-03
KR20170110737A (ko) 2017-10-11
JP2018092182A (ja) 2018-06-14
JP2017199025A (ja) 2017-11-02
ES2951107T3 (es) 2023-10-18
RU2638752C2 (ru) 2017-12-15
CA3016741A1 (en) 2014-12-04
MX355032B (es) 2018-04-02
AU2017204235A1 (en) 2017-07-13
JP6291038B2 (ja) 2018-03-14
CA3016741C (en) 2020-10-27
SG10201810567PA (en) 2019-01-30
EP3745396B1 (en) 2023-04-19
EP3007169A4 (en) 2017-06-14
US10692509B2 (en) 2020-06-23
CN106169297A (zh) 2016-11-30
SG11201509143PA (en) 2015-12-30
JP6680816B2 (ja) 2020-04-15
RU2015155951A (ru) 2017-06-30
CN104217723B (zh) 2016-11-09
EP4235661A3 (en) 2023-11-15
AU2017204235B2 (en) 2018-07-26
EP4235661A2 (en) 2023-08-30
CN105225668A (zh) 2016-01-06
PH12015502663A1 (en) 2016-03-07
SG10201607798VA (en) 2016-11-29
PH12015502663B1 (en) 2016-03-07
EP3007169A1 (en) 2016-04-13
KR102099752B1 (ko) 2020-04-10
CN105225668B (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
BR112015029310B1 (pt) Método e dispositivo de codificação de sinal
JP6616470B2 (ja) 符号化方法、復号化方法、符号化装置及び復号化装置
US10984811B2 (en) Audio coding method and related apparatus
JP6487569B2 (ja) チャネル間時間差パラメータを決定するための方法および装置
BR112017001520B1 (pt) Método para estimar ruído em um sinal de áudio, estimador de ruído, criptador de áudio, decodificador de áudio e sistema para transmitir sinais de áudio
JP2018508047A (ja) チャネル間時間差パラメータを決定するための方法および装置
BR112020026932A2 (pt) Método e aparelho de codificação de sinal estéreo, e método e aparelho de decodificação de sinal estéreo
BR112020003543A2 (pt) método e aparelho para reconstruir sinal durante codificação de sinal estéreo

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B350 Update of information on the portal [chapter 15.35 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 25/09/2013, OBSERVADAS AS CONDICOES LEGAIS.