BR112014016153B1 - método para um codificador processar dados de áudio, método para processar um sinal de áudio, codificador e decodificador - Google Patents

método para um codificador processar dados de áudio, método para processar um sinal de áudio, codificador e decodificador Download PDF

Info

Publication number
BR112014016153B1
BR112014016153B1 BR112014016153-4A BR112014016153A BR112014016153B1 BR 112014016153 B1 BR112014016153 B1 BR 112014016153B1 BR 112014016153 A BR112014016153 A BR 112014016153A BR 112014016153 B1 BR112014016153 B1 BR 112014016153B1
Authority
BR
Brazil
Prior art keywords
noise
sid
current
signal
band
Prior art date
Application number
BR112014016153-4A
Other languages
English (en)
Other versions
BR112014016153A2 (pt
BR112014016153A8 (pt
Inventor
Zhe Wang
Original Assignee
Huawei Technologies Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co., Ltd. filed Critical Huawei Technologies Co., Ltd.
Publication of BR112014016153A2 publication Critical patent/BR112014016153A2/pt
Publication of BR112014016153A8 publication Critical patent/BR112014016153A8/pt
Publication of BR112014016153B1 publication Critical patent/BR112014016153B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)

Abstract

MÉTODO E APARELHO PARA PROCESSAR DADOS DE ÁUDIO A presente invenção descreve um método, um aparelho e um sistema para processar de dados de áudio, e pertence ao campo de tecnologias de comunicações. O método inclui: obter (101) um quadro de ruído de um sinal de áudio, e decompor o quadro de ruído corrente em um sinal de banda baixa de ruído e um sinal de banda alta de ruído; e codificar (102) e transmitir o sinal de banda baixa de ruído utilizando um primeiro mecanismo de transmissão descontínua, e codificar e transmitir o sinal de banda alta de ruído utilizando um segundo mecanismo de transmissão descontínua. De acordo com a presente invenção, diferentes modos de processamento são utilizados para o sinal de banda alta e o sinal de banda baixa, cargas de cálculo e bits codificados podem ser economizados sob a premissa de não diminuir qualidade subjetiva de um codec, e os bits que são economizados podem ajudar a atingir um objetivo de reduzir uma lar gura de banda de transmissão ou aperfeiçoar uma qualidade de codificação total.

Description

CAMPO TÉCNICO
[0001] A presente invenção refere-se ao campo de tecnologias de comunicações, e especificamente, a um método, um aparelho, e um sistema para processar dados de áudio.
ANTECEDENTES
[0002] No campo de comunicações digitais, existem extensos requisitos de aplicação para a transmissão de falas, imagens, áudios, e vídeos, tais como chamadas de telefone móvel, conferências de áudio / vídeo, televisão de transmissão, e entretenimento de multimídia. Uma fala é digitalizada e então transferida de um terminal para outro terminal através de uma rede de comunicação de voz. Aqui os terminais podem ser telefones móveis, terminais de telefone digital, ou terminais de voz ou quaisquer outros tipos. Exemplos de terminais de telefone digital são os telefones VoIP ou telefones ISDN, computadores, e telefones de comunicação de cabo. Para reduzir os recursos ocupados no processo de armazenamento ou transmissão de sinais de áudio, uma extremidade de envio executa um processamento de compressão nos sinais de áudio antes de transmitir os sinais de áudio para uma extremidade de recepção, e a extremidade de recepção executa um processamento de descompressão para restaurar os sinais de áudio e reproduzir os sinais de áudio.
[0003] Na comunicação de voz, uma fala está incluída em somente aproximadamente 40% de tempo, e em outros tempos, existe somente silêncio ou ruído de fundo. Para economizar as larguras de banda de transmissão e evitar um consumo desnecessário de larguras de banda em um período de silêncio ou ruído de fundo, uma tecnologia DTX/CNG (Sistema de transmissão descontínuo / Geração de Ruído de Conforto) emerge. Simplesmente, DTX/CNG significa não codificar os quadros de ruído continuamente, mas executar a codificação somente uma vez em um intervalo de diversos quadros em um período de ruído / silencia de acordo com uma política, onde a taxa de bits codificados é geralmente muito mais baixa do que uma taxa de bits de codificação de quadro de fala. Um quadro de ruído codificado em tal baixa taxa é referido como um SID (quadro de Descritor de Inserção de Silêncio). Um decodificador restaura os quadros de ruído de fundo contínuos na extremidade de decodificação de acordo com os SIDs descontinuamente recebidos. Tal ruído de fundo continuamente restaurado não é uma reprodução fiel de ruído de fundo de uma extremidade de codificação, mas visa evitar causar uma deterioração de qualidade em escutar tanto quanto possível, de modo que um usuário se sinta confortável quando ouvindo o ruído. O ruído de fundo restaurado é referido como CN (Ruído de Conforto), e o método para restaurar o CN na extremidade de decodificação é referido como geração de ruído de conforto.
[0004] Na técnica anterior, ITU-T G.718 é um novo codec de banda larga padrão, o qual inclui um sistema de DTX/CNG de banda larga. O sistema pode enviar um SID de acordo com um intervalo fixo, e pode também adaptavelmente ajustar o intervalo de envio de SID de acordo com um nível de ruído estimado. Um quadro de SID de G.718 inclui 16 parâmetros de ISP e parâmetros de energia de excitação. Este grupo de parâmetros de ISP (Par Espectral de Imitância) representa um envelope espectral sobre a largura de banda de uma banda larga inteira, e uma energia de excitação é obtida por um filtro de análise representado por este grupo de parâmetros de ISP. Na extremidade de decodificação, o G.718 estima, de acordo com os parâmetros de ISP obtidos pela decodificação de um SID em um estado de CNG, um coeficiente de LPC requerido para CNG, estimativas, de acordo com os parâmetros de energia de excitação obtidos pela decodificação do quadro de SID, uma energia de excitação requerida para CNG, e utiliza um ruído branco ajustado em ganho para excitar um filtro de síntese de CNG para obter um CN reconstruído.
[0005] No entanto, para um envelope espectral de superbanda larga, a largura de banda da superbanda larga é extremamente larga; quando a técnica anterior é estendida para o sistema de DTX/CNG de superbanda larga, mais cargas de cálculo e bits precisam ser consumidos para calcular e codificar a dúzia de parâmetros de ISP adicionada, porque um envelope espectral de superbanda larga completo precisa ser codificado por um SID. Como os sinais de banda alta de ruído (o qual refere-se a uma faixa de frequência acima da banda larga aqui) são geralmente não perceptivamente sensíveis em escuta, cargas de cálculo e bits consumidos para esta parte de sinais não são econômicos, por meio disto reduzindo a eficiência de codificação do codec.
SUMÁRIO
[0006] Para resolver um problema de codificação e transmissão de superbanda larga, as modalidades da presente invenção proveem um método, um aparelho, e um sistema para processar os dados de áudio. As soluções técnicas são como segue:
[0007] De acordo com um aspecto, um método para processar dados de áudio está provido e inclui:
[0008] obter um quadro de ruído de um sinal de áudio, e decompor o quadro de ruído em um sinal de banda baixa de ruído e um sinal de banda alta de ruído; e
[0009] codificar o sinal de sinal de banda baixa de ruído utilizando um primeiro mecanismo de transmissão descontínua e transmitir o sinal de banda baixa de ruído codificado utilizando o primeiro mecanismo de transmissão descontínua, e codificar o sinal de banda alta de ruído utilizando um segundo mecanismo de transmissão descontínua e transmitir o sinal de banda alta de ruído codificado utilizando o segundo mecanismo de transmissão descontínua, onde uma política para enviar um primeiro quadro de descritor de inserção de silêncio SID do primeiro mecanismo de transmissão descontínua é diferente de uma política para enviar um segundo SID do segundo mecanismo de transmissão descontínua, ou uma política para codificar um primeiro SID do primeiro mecanismo de transmissão descontínua é diferente de uma política para codificar um segundo SID do segundo mecanismo de transmissão descontínua.
[00010] De acordo com um aspecto, um método para processar dados de áudio está provido e inclui:
[00011] obter, por um decodificador, um SID, e determinar se o SID inclui um parâmetro de banda baixa e/ou um parâmetro de banda alta;
[00012] quando o SID inclui o parâmetro de banda baixa, decodificar o SID para obter um parâmetro de banda baixa de ruído, localmente gerando um parâmetro de banda alta de ruído, e obtendo um primeiro quadro de ruído de conforto (CN) de acordo com o parâmetro de banda baixa de ruído obtido pela decodificação e o parâmetro de banda alta de ruído localmente gerado;
[00013] quando o SID inclui o parâmetro de banda alta, decodificar o SID para obter um parâmetro de banda alta de ruído, localmente gerando um parâmetro de banda baixa de ruído, e obtendo um segundo quadro de CN de acordo com o parâmetro de banda alta de ruído obtido pela decodificação e o parâmetro de banda baixa de ruído localmente gerado; e
[00014] quando o SID inclui o parâmetro de banda alta e o parâmetro de banda baixa, decodificar o SID para obter um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, e obter um terceiro quadro de CN de acordo com o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído obtidos por decodificação.
[00015] De acordo com outro aspecto, um aparelho para codificar dados de áudio está provido e inclui:
[00016] um módulo de obtenção configurado para obter um quadro de ruído de um sinal de áudio, e decompor o quadro de ruído em um sinal de banda baixa de ruído e um sinal de banda alta de ruído; e
[00017] um módulo de transmissão configurado para codificar o sinal de banda baixa de ruído utilizando um primeiro mecanismo de transmissão descontínua e transmitir o sinal de banda baixa de ruído codificado utilizando um primeiro mecanismo de transmissão descontínua, e codificar o sinal de banda alta de ruído utilizando um segundo mecanismo de transmissão descontínua e transmitir o sinal de banda alta de ruído codificado utilizando um segundo mecanismo de transmissão descontínua, onde uma política para enviar um primeiro SID do primeiro mecanismo de transmissão descontínua é diferente de uma política para enviar um segundo SID do segundo mecanismo de transmissão descontínua, ou uma política para codificar um primeiro SID do primeiro mecanismo de transmissão descontínua é diferente de uma política para codificar um segundo SID do segundo mecanismo de transmissão descontínua.
[00018] De acordo com outro aspecto, um aparelho para decodificar dados de áudio está provido e inclui:
[00019] um módulo de obtenção, configurado para obter um SID, e determinar se o SID inclui um parâmetro de banda baixa e/ou um parâmetro de banda alta;
[00020] um primeiro módulo de decodificação configurado para: quando o SID obtido pelo módulo de obtenção inclui um parâmetro de banda baixa, decodificar o SID para obter um parâmetro de banda baixa de ruído, localmente gerar um parâmetro de banda alta de ruído, e obter um primeiro quadro de CN de acordo com o parâmetro de banda baixa de ruído obtido pela decodificação e o parâmetro de banda alta de ruído localmente gerado;
[00021] um segundo módulo de decodificação, configurado para: quando o SID obtido pelo módulo de obtenção inclui o parâmetro de banda alta, decodificar o SID para obter um parâmetro de banda alta de ruído, localmente gerar um parâmetro de banda baixa de ruído, e obter um segundo quadro de CN de acordo com o parâmetro de banda alta de ruído obtido pela decodificação e o parâmetro de banda baixa de ruído localmente gerado; e
[00022] um terceiro módulo de decodificação, configurado para: quando o SID obtido pelo módulo de obtenção inclui o parâmetro de banda alta e o parâmetro de banda baixa, decodificar o SID para obter um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, e obter um terceiro quadro de CN de acordo com o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído obtidos por decodificação.
[00023] De acordo com outro aspecto, um sistema para processar dados de áudio está provido e inclui o aparelho para codificar os dados de áudio acima e o aparelho para decodificar os dados de áudio acima.
[00024] As soluções técnicas providas pelas modalidades da presente invenção trazem os seguintes efeitos benéficos: Um quadro de ruído corrente é decomposto em um sinal de banda baixa de ruído e um sinal de banda alta de ruído; então o sinal de banda baixa de ruído é codificado e transmitido utilizando um primeiro mecanismo de transmissão descontínua e o sinal de banda alta de ruído é codificado e transmitido utilizando um segundo mecanismo de transmissão descontínua; um decodificador obtém um quadro de descritor de inserção de silêncio SID, e determina se o SID inclui um parâmetro de banda baixa e/ou um parâmetro de banda alta; e diferentes modos de decodificação de ruído são utilizados de acordo com diferentes resultados de determinação. Deste modo, diferentes modos de processamento de codificação e decodificação são utilizados para o sinal de banda alta e o sinal de banda baixa, a complexidade de cálculo pode ser reduzida e bits codificados podem ser economizados sob uma premissa de não diminuir a qualidade subjetiva de um codec, e os bits que são economizados podem ajudar a conseguir um objetivo de reduzir uma largura de banda de transmissão ou aperfeiçoar a qualidade de codificação total, por meio disto resolvendo um problema de codificação e transmissão de superbanda larga.
BREVE DESCRIÇÃO DOS DESENHOS
[00025] Para descrever as soluções técnicas nas modalidades da presente invenção mais claramente, o seguinte resumidamente introduz os desenhos acompanhantes requeridos para descrever as modalidades. Aparentemente, os desenhos acompanhantes na descrição seguinte mostram meramente algumas modalidades da presente invenção, e uma pessoa versada na técnica pode ainda derivar outros desenhos destes desenhos acompanhantes sem esforços criativos.
[00026] Figura 1 é um fluxograma de um método para processar dados de áudio de acordo com a Modalidade 1 da presente invenção;
[00027] Figura 2 é um fluxograma de um método para processar dados de áudio de acordo com a Modalidade 2 da presente invenção;
[00028] Figura 3 é um fluxograma de um método para processar dados de áudio de acordo com a Modalidade 3 da presente invenção;
[00029] Figura 4 é um fluxograma de um método para processar dados de áudio de acordo com a Modalidade 4 da presente invenção;
[00030] Figura 5 é um diagrama esquemático de um aparelho para codificar dados de áudio de acordo com a Modalidade 6 da presente invenção;
[00031] Figura 6 é um diagrama esquemático de outro aparelho para codificar dados de áudio de acordo com a Modalidade 6 da presente invenção;
[00032] Figura 7 é um diagrama esquemático de um aparelho para decodificar dados de áudio de acordo com a Modalidade 7 da presente invenção;
[00033] Figura 8 é um diagrama esquemático de outro aparelho para decodificar dados de áudio de acordo com a Modalidade 7 da presente invenção; e
[00034] Figura 9 é um diagrama esquemático de um sistema para processar dados de áudio de acordo com a Modalidade 8 da presente invenção.
DESCRIÇÃO DE MODALIDADES
[00035] Para tornar os objetivos, soluções técnicas e vantagens da presente invenção mais claros, o seguinte adicionalmente descreve as modalidades da presente invenção em detalhes com referência aos desenhos acompanhantes.
MODALIDADE 1
[00036] Referindo à Figura 1, esta modalidade provê um método para processar dados de áudio, onde o método inclui o seguinte:
[00037] 101. Obter um quadro de ruído de um sinal de áudio, e decompor o quadro de ruído em um sinal de banda baixa de ruído e um sinal de banda alta de ruído.
[00038] 102 Codificar e transmitir o sinal de banda baixa de ruído utilizando um primeiro mecanismo de transmissão descontínua, e codificar e transmitir o sinal de banda alta de ruído utilizando um segundo mecanismo de transmissão descontínua, onde uma política para enviar um primeiro quadro de descritor de inserção de silêncio SID do primeiro mecanismo de transmissão descontínua é diferente de uma política para enviar um segundo SID do segundo mecanismo de transmissão descontínua, ou uma política para codificar um primeiro SID do primeiro mecanismo de transmissão descontínua é diferente de uma política para codificar um segundo SID do segundo mecanismo de transmissão descontínua.
[00039] Nesta modalidade, o primeiro SID inclui um parâmetro de banda baixa do quadro de ruído, e o segundo SID inclui um parâmetro de banda baixa ou um parâmetro de banda alta do quadro de ruído.
[00040] Opcionalmente, nesta modalidade, a codificação e transmissão do sinal de banda alta de ruído utilizando um segundo mecanismo de transmissão descontínua inclui:
[00041] determinar se o sinal de banda alta de ruído tem uma estrutura espectral pré-ajustada; se sim, e uma condição de envio da política para enviar o segundo SID for satisfeita, codificar um SID do sinal de banda alta de ruído utilizando a política para codificar o segundo SID, e enviar o SID; e se não, determinar que o sinal de banda alta de ruído não precisa ser codificado e transmitido.
[00042] A determinação se o sinal de banda alta de ruído tem uma estrutura espectral pré-ajustada inclui:
[00043] obter um espectro do sinal de banda alta de ruído, dividir o espectro em pelo menos duas sub-bandas, e se uma energia média de qualquer primeira sub-banda nas sub-bandas não for menor do que uma energia média de uma segunda sub-banda nas sub-bandas, onde uma banda de frequência na qual a segunda sub-banda está localizada é mais alta do que uma banda de frequência na qual a primeira sub-banda está localizada, confirmar que o sinal de banda alta de ruído não tem uma estrutura espectral pré-ajustada; de outro modo, confirmar que o sinal de banda alta de ruído tem uma estrutura espectral pré-ajustada.
[00044] Opcionalmente, nesta modalidade, a codificação e transmissão do sinal de banda alta de ruído utilizando um segundo mecanismo de transmissão descontínua inclui:
[00045] gerar um valor de extensão de desvio de acordo com uma primeira razão e uma segunda razão, em que a primeira razão é uma razão de uma energia do sinal de banda alta de ruído para uma energia do sinal de banda baixa de ruído do quadro de ruído, e a segunda razão é uma razão de uma energia de um sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído no momento quando um SID que inclui um parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído; e
[00046] determinar se o valor de extensão de desvio atinge um limite pré-ajustado; se sim, codificar um SID do sinal de banda alta de ruído utilizando a política para codificar o segundo SID, e enviar o SID; e se não, determinar que o sinal de banda alta de ruído não precisa ser codificado e transmitido.
[00047] Opcionalmente, que a primeira razão é uma razão de uma energia do sinal de banda alta de ruído para uma energia do sinal de banda baixa de ruído do quadro de ruído inclui que:
[00048] a primeira razão é uma razão de uma energia instantânea do sinal de banda alta de ruído para uma energia instantânea do sinal de banda baixa de ruído do quadro de ruído; e
[00049] correspondentemente, que a segunda razão é uma razão de uma energia de um sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído em um momento quando um SID que inclui um parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído inclui que:
[00050] a segunda razão é uma razão de uma energia instantânea do sinal de banda alta de ruído para uma energia instantânea do sinal de banda baixa de ruído no momento quando um SID que inclui o parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído.
[00051] Alternativamente, que a primeira razão é uma razão de uma energia do sinal de banda alta de ruído para uma energia do sinal de banda baixa de ruído do quadro de ruído inclui que:
[00052] a primeira razão é uma razão de uma energia média ponderada de sinais de banda alta de ruído do quadro de ruído e um quadro de ruído antes do quadro de ruído para uma energia média ponderada de sinais de banda baixa de ruído do quadro de ruído e o quadro de ruído antes do quadro de ruído; e
[00053] correspondentemente, que a segunda razão é uma razão de uma energia de um sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído em um momento quando um SID que inclui um parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído inclui que:
[00054] a segunda razão é uma razão de uma energia média ponderada de sinais de banda alta para uma energia média ponderada de sinais de banda baixa de um quadro de ruído e um quadro de ruído antes do quadro de ruído no momento quanto o SID que inclui o parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído.
[00055] Nesta modalidade, a geração de um valor de extensão de desvio de acordo com uma primeira razão e uma segunda razão inclui:
[00056] separadamente calcular um valor logarítmico da primeira razão e um valor logarítmico da segunda razão; e
[00057] calcular um valor absoluto de uma diferença entre o valor logarítmico da primeira razão e o valor logarítmico da segunda razão para obter o valor de extensão de desvio.
[00058] Opcionalmente, nesta modalidade a codificação e transmissão do sinal de banda alta de ruído utilizando um segundo mecanismo de transmissão descontínua inclui:
[00059] determinar se uma estrutura espectral do sinal de banda alta de ruído do quadro de ruído, em comparação com uma estrutura espectral média de sinais de banda alta de ruído antes do quadro de ruído, satisfaz uma condição pré-ajustada; se sim, codificar um SID do sinal de banda alta de ruído do quadro de ruído utilizando a política para codificar o segundo SID, e enviar o SID; e se não, determinar que o sinal de banda alta de ruído do quadro de ruído não precisa ser codificado e transmitido.
[00060] A estrutura espectral média dos sinais de banda alta de ruído antes do quadro de ruído inclui: uma média ponderada de espectros dos sinais de banda alta de ruído antes do quadro de ruído.
[00061] Nesta modalidade, a condição de envio na política para enviar o segundo SID do segundo mecanismo de transmissão descontínua ainda inclui: o primeiro mecanismo de transmissão descontínua satisfazendo uma condição para enviar o primeiro SID.
[00062] A modalidade de método provida pela presente invenção traz os seguintes efeitos benéficos: um quadro de ruído corrente de um sinal de áudio é obtido e o quadro de ruído corrente é decomposto em um sinal de banda baixa de ruído e um sinal de banda alta de ruído; então o sinal de banda baixa de ruído é codificado e transmitido utilizando um primeiro mecanismo de transmissão descontínua e o sinal de banda alta de ruído é codificado e transmitido utilizando um segundo mecanismo de transmissão descontínua. Deste modo, diferentes modos de processamento são utilizados para o sinal de banda alta e o sinal de banda baixa, a complexidade de cálculo pode ser reduzida e bits codificados podem ser economizados sob uma premissa de não diminuir a qualidade subjetiva de um codec, e os bits que são economizados ajudam a conseguir um objetivo de reduzir uma largura de banda de transmissão ou aperfeiçoar a qualidade de codificação total, por meio disto resolvendo um problema de codificação e transmissão de superbanda larga.
MODALIDADE 2
[00063] Referindo a Figura 2, esta modalidade provê um método para processar dados de áudio, onde o método inclui o seguinte:
[00064] 201. Um decodificador obtém um quadro de descritor de inserção de silêncio SID, e determina se o SID inclui um parâmetro de banda baixa ou um parâmetro de banda alta.
[00065] 202. Se o SID incluir o parâmetro de banda baixa, decodificar o SID para obter um parâmetro de banda baixa de ruído, localmente gerar um parâmetro de banda alta de ruído, e obter um primeiro quadro de ruído de conforto CN de acordo com o parâmetro de banda baixa de ruído obtido pela decodificação e o parâmetro de banda alta de ruído localmente gerado.
[00066] 203. Se o SID incluir o parâmetro de banda alta, decodificar o SID para obter um parâmetro de banda alta de ruído, localmente gerar um parâmetro de banda baixa de ruído, e obter um segundo quadro de CN de acordo com o parâmetro de banda alta de ruído obtido pela decodificação e o parâmetro de banda baixa de ruído localmente gerado.
[00067] 204. Se o SID incluir o parâmetro de banda alta e o parâmetro de banda baixa, decodificar o SID para obter um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, e obter um terceiro quadro de CN de acordo com o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído obtidos por decodificação.
[00068] Opcionalmente, nesta modalidade, se o SID incluir o parâmetro de banda baixa, antes de decodificar o SID para obter um parâmetro de banda baixa de ruído, localmente gerar um parâmetro de banda alta de ruído, e obter um primeiro quadro de ruído de conforto CN de acordo com o parâmetro de banda baixa de ruído obtido pela decodificação e o parâmetro de banda alta de ruído localmente gerado, o método ainda inclui:
[00069] se o decodificador estiver em um primeiro estado de geração de ruído de conforto CNG, entrar, pelo decodificador um segundo estado de CNG.
[00070] Opcionalmente, nesta modalidade se o SID incluir o parâmetro de banda alta e o parâmetro de banda baixa, antes de decodificar o SID para obter um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, e obter um terceiro quadro de CN de acordo com o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído obtidos por decodificação, o método ainda inclui:
[00071] se o decodificador estiver em um segundo estado CNG, entrar, pelo decodificador um primeiro estado de CNG.
[00072] Opcionalmente, nesta modalidade, a determinação se o SID inclui um parâmetro de banda baixa e/ou um parâmetro de banda alta inclui:
[00073] se o número de bits do SID for menor do que um primeiro limite pré-ajustado, confirmar que o SID inclui o parâmetro de banda alta; se o número de bits do SID for maior do que um primeiro limite pré- ajustado e menor do que um segundo limite pré-ajustado, confirmar que o SID inclui o parâmetro de banda baixa; e se o número de bits do SID for maior do que um segundo limite pré-ajustado e menor do que um terceiro limite pré-ajustado, confirmar que o SID inclui o parâmetro de banda alta e o parâmetro de banda baixa; ou
[00074] se o SID incluir um primeiro identificador, confirmar que o SID inclui o parâmetro de banda alta; se o SID incluir um segundo identificador, confirmar que o SID inclui o parâmetro de banda baixa; e se o SID incluir um terceiro identificador, confirmar que o SID inclui o parâmetro de banda baixa e o parâmetro de banda alta.
[00075] Nesta modalidade, gerar localmente um parâmetro de banda alta de ruído inclui:
[00076] separadamente obter uma energia média ponderada de um sinal de banda alta de ruído e um coeficiente de filtro de síntese do sinal de banda alta de ruído em um momento que corresponde ao SID; e
[00077] obter o sinal de banda alta de ruído de acordo com a energia média ponderada obtida do sinal de banda alta de ruído e o coeficiente de filtro de síntese obtido do sinal de banda alta de ruído no momento que corresponde ao SID.
[00078] Opcionalmente, nesta modalidade, a obtenção de uma energia média ponderada de um sinal de banda alta de ruído em um momento que corresponde ao SID inclui:
[00079] obter uma energia de um sinal de banda baixa do primeiro quadro de CN de acordo com o parâmetro de banda baixa de ruído obtido por decodificação;
[00080] calcular uma razão de uma energia de um sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído em um momento quando um SID que inclui um parâmetro de banda alta é recebido antes do SID, para obter uma primeira razão;
[00081] obter, de acordo com a energia do sinal de banda baixa do primeiro quadro de CN e a primeira razão, uma energia do sinal de banda alta de ruído no momento que corresponde ao SID; e
[00082] executar uma média ponderada sobre a energia do sinal de banda alta de ruído no momento que corresponde ao SID e a energia de um sinal de banda alta de um quadro de CN localmente armazenado, para obter a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID em que a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID é uma energia de sinal de banda alta do primeiro quadro de CN.
[00083] Opcionalmente, nesta modalidade, o cálculo de uma razão de uma energia de um sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído em um momento quando um SID que inclui um parâmetro de banda alta é recebido antes do SID, para obter uma primeira razão, inclui:
[00084] calcular uma razão de uma energia instantânea do sinal de banda alta de ruído para uma energia instantânea do sinal de banda baixa de ruído no momento quando o SID que inclui o parâmetro de banda alta é recebido antes do SID, para obter a primeira razão; ou
[00085] calcular uma razão de uma energia média ponderada do sinal de banda alta de ruído para uma energia média ponderada do sinal de banda baixa de ruído no momento quando o SID que inclui o parâmetro de banda alta é recebido antes do SID, para obter a primeira razão.
[00086] Quando a energia do sinal de banda alta de ruído no momento que corresponde ao SID é maior do que uma energia de um sinal de banda alta de um quadro de CN anterior que é localmente armazenado, a energia do sinal de banda alta do quadro de CN anterior que é localmente armazenado é atualizada em uma primeira taxa; de outro modo a energia do sinal de banda alta do quadro de CN anterior que é localmente armazenado é atualizada em uma segunda taxa, onde a primeira taxa é maior do que a segunda taxa.
[00087] Opcionalmente, nesta modalidade, a obtenção de uma energia média ponderada de um sinal de banda alta de ruído em um momento que corresponde ao SID inclui:
[00088] selecionar um sinal de banda alta de um quadro de voz com uma energia de sinal de banda alta mínima de quadros de voz dentro de um período de tempo pré-ajustado antes do SID; e
[00089] obter, de acordo com uma energia do sinal de banda alta do quadro de voz com a mínima energia de sinal de banda alta entre os quadros de voz, a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID, onde a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID é uma energia de sinal de banda alta do primeiro quadro de CN; ou
[00090] selecionar os sinais de banda de N de quadros de voz com uma energia de sinal de banda alta menor do que um limite pré-ajustado dos quadros de voz dentro de um período de tempo pré-ajustado antes do SID; e
[00091] obter de acordo com uma energia média ponderada do sinal de banda alta dos N quadros de voz, a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID, onde a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID é uma energia de sinal de banda alta do primeiro quadro de CN.
[00092] Opcionalmente, nesta modalidade, a obtenção de um coeficiente de filtro de síntese do sinal de banda alta de ruído em um momento que corresponde ao SID inclui:
[00093] distribuir M coeficientes de ISF (Frequência Espectral de Imitância) ou coeficientes de ISP de par espectral de imitância ou coeficientes de LSF (Frequência Espectral de Linha) ou coeficientes de LCP (Par Espectral de Linha) em uma faixa de frequência que corresponde a um sinal de banda alta;
[00094] executar um processamento de randomização sobre os M coeficientes, onde uma característica da randomização é: fazer com que cada coeficiente entre os M coeficientes gradualmente aproximem de um valor alvo que corresponde a cada coeficiente, onde o valor alvo é um valor em uma faixa pré-ajustada adjacente a um valor de coeficiente e o valor alvo de cada coeficiente entre os M coeficientes muda após cada N quadros, em que tanto M quanto N são números naturais; e
[00095] obter, de acordo com os coeficientes de filtro obtidos pelo processamento de randomização, o coeficiente de filtro de síntese do sinal de banda alta de ruído no momento que corresponde ao SID.
[00096] Opcionalmente, nesta modalidade, a obtenção de um coeficiente de filtro de síntese do sinal de banda alta de ruído em um momento que corresponde ao SID inclui:
[00097] obter M coeficientes de ISF ou coeficientes de ISP ou coeficientes de LSF ou coeficientes de LSP de um sinal de banda alta de ruído armazenado localmente;
[00098] executar um processamento de randomização sobre os M coeficientes, onde uma característica da randomização é: fazer com que cada coeficiente entre os M coeficientes gradualmente se aproxime de um valor alvo que corresponde a cada coeficiente, onde o valor alvo é um valor em uma faixa pré-ajustada adjacente a um valor de coeficiente, e o valor alvo de cada coeficiente entre os M coeficientes muda após cada N quadros; e
[00099] obter, de acordo com os coeficientes de filtro obtidos por processamento de randomização, o coeficiente de filtro de síntese do sinal de banda alta de ruído no momento que corresponde ao SID.
[000100] Opcionalmente, nesta modalidade, antes de obter um primeiro quadro de CN de acordo com o parâmetro de banda baixa de ruído obtido por decodificação e o parâmetro de banda alta de ruído localmente gerado, o método ainda inclui:
[000101] quando os quadros históricos adjacentes ao SID são quadros de voz codificados, se uma energia média de sinais de banda alta ou uma parte de sinais de banda alta que é decodificada dos quadros de voz codificados for menor do que uma energia média de sinais de banda alta de ruído ou uma parte dos sinais de banda alta de ruído que são gerados localmente, multiplicar os sinais de banda alta de ruído de L quadros subsequentes começando do SID por um fator de uniformização menor do que 1, para obter uma nova energia média ponderada dos sinais de banda alta de ruído localmente gerados; e
[000102] correspondentemente, a o obtenção do primeiro quadro de CN de acordo com o parâmetro de banda baixa de ruído obtido por decodificação e o parâmetro e banda alta de ruído localmente gerado inclui:
[000103] obter um quarto quadro de CN de acordo com o parâmetro de banda baixa de ruído obtido por decodificação, o coeficiente de filtro de síntese do sinal de banda alta de ruído no momento que corresponde ao SID, e a nova energia média ponderada dos sinais de banda alta de ruído localmente gerados.
[000104] A modalidade de método provida pela presente invenção traz os seguintes efeitos benéficos: Um decodificador obtém um quadro de descritor de inserção de silêncio SID, e determina se o SID inclui um parâmetro de banda baixa e/ou um parâmetro de banda alta; se o SID incluir o parâmetro de banda baixa, decodifica o SID para obter um parâmetro de banda baixa de ruído, localmente gera um parâmetro de banda alta de ruído, e obtém um primeiro quadro de ruído de conforto CN de acordo com o parâmetro de banda baixa de ruído obtido pela decodificação e o parâmetro de banda alta de ruído localmente gerado; se o SID incluir o parâmetro de banda alta, decodifica o SID para obter um parâmetro de banda alta de ruído, localmente gera um parâmetro de banda baixa de ruído, e obtém um segundo quadro de CN de acordo com o parâmetro de banda alta de ruído obtido pela decodificação e o parâmetro de banda baixa de ruído localmente gerado; e se o SID incluir o parâmetro de banda alta e o parâmetro de banda baixa, decodifica o SID para obter um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, e obtém um terceiro quadro de CN de acordo com o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído obtidos por decodificação. Deste modo, diferentes modos de processamento são utilizados para o sinal de banda alta e o sinal de banda baixa, a complexidade de cálculo pode ser reduzida e bits codificados podem ser economizados sob uma premissa de não diminuir a qualidade subjetiva de um codec, e os bits que são economizados podem ajudar a conseguir um objetivo de reduzir uma largura de banda de transmissão ou aperfeiçoar a qualidade de codificação total, por meio disto resolvendo um problema de codificação e transmissão de superbanda larga.
MODALIDADE 3
[000105] Esta modalidade provê um método para processar dados de áudio. Em uma extremidade de codificação, independente de um espectro de ruído de CNG de banda baixa ou um espectro de ruído de CNG de banda alta, geralmente, uma estrutura harmônica é perdida, e portanto, em um sinal de banda alta de CNG, o que é perceptivamente efetivo na escuta é principalmente uma energia do sinal de banda alta de CNG e não uma estrutura espectral do sinal de banda alta de CNG. Portanto, em uma transmissão DTX de um sinal de superbanda larga, em muitos casos, é desnecessário transmitir um espectro de sinal de banda larga em um SID; ao invés, um método apropriado pode ser utilizado para construir um espectro de banda larga localmente na extremidade de decodificação. O espectro de banda larga localmente construído não causará uma distorção perceptiva óbvia. Desce modo, as cargas de cálculo e os bits para calcular e codificar o espectro de banda larga são economizados na extremidade de codificação. Entrementes, para outros sinais de ruído, uma estrutura harmônica pode existir em um seu sinal de banda alta, e construir um espectro de banda larga localmente na extremidade de decodificação somente pode causar um problema de deterioração de qualidade perceptiva na comutação entre um segmento de CNG e um segmento de voz. Portanto, para tal ruído, um parâmetro espectral precisa ser transmitido em um SID. Pode ser visto que um sistema de DTX/CNG que leva em conta tanto eficiência quanto qualidade deve ser capaz de adaptavelmente selecionar codificar ou selecionar não codificar um parâmetro espectral de banda alta em um SID na extremidade de codificação para uma característica de banda alta de ruído de fundo, e reconstruir um quadro de CNG na extremidade de decodificação utilizando diferentes métodos de decodificação de acordo com diferentes tipos de SIDs. Nesta modalidade, um método para processar dados de áudio está provido e inclui o seguinte: Um espectro de banda alta de ruído é analisado e classificado; um decodificador cegamente constrói um espectro de sinal de banda larga; quando um SID não inclui um parâmetro de energia de banda alta, o decodificador estima uma energia de sinal de banda alta; e o decodificador comuta entre diferentes módulos de CNG, e assim por diante. Referindo à Figura 3 especificamente, um método para processar dados de áudio em uma extremidade de codificador de acordo com esta modalidade inclui:
[000106] 301. Um codificador obtém um quadro de ruído de um sinal de áudio e decompõe o quadro de ruído em um sinal de banda baixa de ruído e um sinal de banda alta de ruído.
[000107] Nesta modalidade, devido às diferentes regras de codificação do codificador, o codificador obtém um quadro de ruído de um sinal de áudio, e o quadro de ruído pode ser um quadro de ruído corrente, ou pode ser um quadro de ruído armazenado na extremidade de codificador, o que não está especificamente limitado nesta modalidade. Nesta modalidade, os sinais de áudio de entrada de superbanda larga amostrados a 32 kHz são utilizados como um exemplo. O codificador primeiro executa um processamento de enquadramento sobre os sinais de áudio de entrada, por exemplo, 20 ms (ou 640 pontos de amostragem) são utilizados como um quadro. Para o quadro corrente (nesta modalidade, o quadro corrente refere-se a um quadro corrente a ser codificado), e codificador primeiro executa uma filtragem de passagem alta. Geralmente, uma banda de passagem refere-se a frequências mais altas do que 50 Hz. O quadro corrente filtrado em passagem alta é decomposto em um sinal de banda baixa s0 e um sinal de banda alta s1 por um filtro de análise de filtro de espelho de quadratura QMF (Filtro de Espelho de Quadratura). O sinal de banda baixa s0 é amostrado a 16 kHz, e representa um espectro de 0-8 kHz do quadro corrente. Quando um VAD (Detector de Atividade de Voz, detector de atividade de voz) indica que o quadro corrente é um quadro de sinal de fundo, isto é, um quadro de sinal de voz, o codificador executa uma codificação de oz sobre o quadro corrente. Nesta modalidade, que o codificador codifica o quadro de voz codificado pertence ao escopo da técnica anterior, e detalhes não são repetidamente descritos nesta modalidade. O VAD indica que o codificador entre em um estado de trabalho de DTX quando o quadro corrente é um quadro de ruído. Nesta modalidade, o quadro de ruído refere-se ou a um quadro de ruído de fundo ou um quadro de silêncio.
[000108] Nesta modalidade, no estado de trabalho de DTX, um controlador de DTX decide, de acordo com a política de envio de SID, se codificar e enviar um SID do sinal de banda baixa do quadro corrente. Nesta modalidade, a política para enviar um SID de um sinal de banda baixa é como segue: (1) enviar um SID em um primeiro quadro de ruído após um quadro de voz codificado, e ajustar um sinalizador de envio de SID flagSID para 1; (2) em um período de ruído, enviar um quadro de SID em um Enésimo quadro após cada quadro de SID, e ajustar flagSID para 1 no quadro, onde N é um inteiro maior do que 1 e é externamente inserido no codificador; e (3) no período de ruído, não enviar SID em outros quadros, e ajustar flagSID para 0. Nesta modalidade, a política de enviar um SID de um sinal de banda baixa é similar àquela da técnica anterior, e não está descrita em detalhes na presente invenção.
[000109] 302. Determinar se o sinal de banda alta do quadro de ruído corrente satisfaz uma condição de codificação e transmissão pré- ajustada; se sim, executar a etapa 304; se não, executar a etapa 303.
[000110] Nesta modalidade, a determinação se o sinal de banda alta do quadro de ruído corrente satisfaz uma condição de codificação e transmissão pré-ajustada inclui: determinar se o sinal de banda alta tem uma estrutura espectral pré-ajustada; se sim, e uma condição de envio de uma política para enviar o segundo SID for satisfeita, codificar um SID do sinal de banda alta de ruído utilizando a política para codificar o segundo SID e enviar o SID; e se não, determinar que o sinal de banda alta de ruído não precisa ser codificado e transmitido. A determinação se o sinal de banda alta tem uma estrutura espectral pré-ajustada inclui: obter um do sinal de banda alta de ruído, dividir o espectro em pelo menos duas sub-bandas, e se uma energia média de qualquer primeira sub-banda nas sub-bandas não for menor do que uma energia média de uma segunda sub-banda nas sub-bandas, onde uma banda de frequência na qual a segunda sub-banda está localizada é mais alta do que uma banda de frequência na qual a primeira sub-banda está localizada, confirmar que o sinal de banda alta de ruído não tem uma estrutura espectral pré-ajustada; de outro modo, confirmar que o sinal de banda alta de ruído tem uma estrutura espectral pré-ajustada.
[000111] Nesta modalidade, no estado de trabalho de DTX, o codificador executa uma análise espectral sobre o sinal de banda alta s1 do quadro de ruído corrente para determinar se s1 tem uma estrutura espectral aparente, isto é, uma estrutura espectral pré-ajustada. Um método específico nesta modalidade é como segue: Uma diminuição de qualidade para 12,8 kHz é executada em s1, e uma FFT de 256 pontos é executada no sinal de qualidade diminuída para obter um espectro C(i), onde i = 0, ... 127. C(i) é dividido em quatro sub-bandas de uma largura igual, e uma energia E(i) de cada sub-banda é calculada. cada sub-banda é qualquer primeira sub-banda acima mencionada. E (i) = ∑ c (i), onde i = 0, ... 3, |(i) e h(i) respectivamente representam um i=l (i) limite superior e um limite inferior da ia sub-=banda, l(i) = {0, 32, 64, 96}, e h(i) = {31, 63, 95, 127}. Se a condição seguinte é satisfeita é verificado: E(i) >VE(j) j > i (1)
[000112] onde, E(j) é a segunda sub-banda acima mencionada. Se a fórmula (1) acima for satisfeita, isto é, se a energia de qualquer primeira sub-banda nas sub-bandas não for menor do que a energia da segunda sub-banda nas sub-bandas, é considerado que o sinal de banda alta não tem uma estrutura espectral aparente; de outro modo, o sinal de banda alta tem uma estrutura espectral aparente. Se o sinal de banda alta tiver uma estrutura espectral aparente, uma política de DTX é enviar um parâmetro de banda alta. Nesta modalidade, se o sinalizador de envio de parâmetro de banda alta flaghb não for 1, flaghb = 1 é ajustado a próxima vez quando flagSID = 1; de outro modo, flaghb = 0.
[000113] Nesta modalidade, quando a condição de envio de SID for satisfeita, se é necessário codificar e transmitir o sinal de banda alta do quadro de ruído corrente pode ser determinado utilizando a estrutura espectral do sinal de banda alta do quadro de ruído corrente, e a determinação se o sinal de banda alta de ruído tem uma estrutura espectral pré-ajustada e se o sinal de banda baixa de ruído satisfaz a condição de envio de SID é utilizada como uma primeira condição de determinação. Opcionalmente, nesta modalidade, a determinação se o sinal de banda alta do quadro de ruído corrente satisfaz uma condição de codificação e de envio pré-ajustada inclui: gerar um valor de extensão de desvio de acordo com uma primeira razão e uma segunda razão, onde a primeira razão é uma razão de uma energia do sinal de banda alta de ruído para uma energia do sinal de banda baixa de ruído do quadro de ruído, e a segunda razão é uma razão de uma energia de um sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído em um momento quando um SID que inclui um parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído; e determinar se o valor de extensão de desvio atinge um limite pré- ajustado; se sim, codificar um SID do sinal de banda alta de ruído utilizando a política para codificar o segundo SID, e enviar um SID; e se não, determinar que o sinal de banda alta de ruído não precisa ser codificado e transmitido. Opcionalmente, que a primeira razão é uma razão de uma energia do sinal de banda alta de ruído para uma energia do sinal de banda baixa de ruído do quadro de ruído inclui que: a primeira razão é uma razão de uma energia instantânea do sinal de banda alta de ruído para uma energia instantânea do sinal de banda baixa de ruído do quadro de ruído; e correspondentemente, que a segunda razão é uma razão de uma energia de um sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído em um momento quando um SID que inclui um parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído inclui que: a segunda razão é uma razão de uma energia instantânea do sinal de banda alta de ruído para uma energia instantânea do sinal de banda baixa de ruído no momento quando um SID que inclui o parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído. Alternativamente que, a primeira razão é uma razão de uma energia do sinal de banda alta de ruído para uma energia do sinal de banda baixa de ruído do quadro der ruído inclui que: a primeira razão é uma razão de uma energia média ponderada de sinais de banda alta de ruído do quadro de ruído e um quadro de ruído antes do quadro de ruído para uma energia média ponderada de sinais de banda baixa de ruído do quadro de ruído e o quadro de ruído antes do quadro de ruído; e correspondentemente, que a segunda razão é uma razão de uma energia do sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído em um momento quando um SID que inclui um parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído inclui que: a segunda razão é uma razão de uma energia média ponderada de sinais de banda alta para uma energia média ponderada de sinais de banda baixa de um quadro de ruído e um quadro de ruído antes do quadro de ruído no momento quando o SID que inclui um parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído. Nesta modalidade, de preferência, a geração de um valor de extensão de desvio de acordo com uma primeira razão e uma segunda razão inclui: separadamente calcular um valor logarítmico da primeira razão e um valor logarítmico da segunda razão; e calcular um valor absoluto de uma diferença entre o valor logarítmico da primeira razão e o valor logarítmico da segunda razão, para obter o valor de extensão de desvio.
[000114] Especificamente, nesta modalidade, a determinação se o valor de extensão de desvio atinge o limite pré-ajustado pode ser implementada do seguinte modo:
[000115] No estado de trabalho de DTX, o codificador separadamente calcula as energias logarítmicas e1 e e0 do sinal de banda alta s1 e do sinal de banda baixa s0do quadro corrente.
Figure img0001
[000116] As médias móveis de longo prazo e1a e e0a de e1 e e0 na extremidade de codificação são atualizadas:
Figure img0002
[000117] onde, sign[.] representa um sinal de função, MIN[.] representa uma função mínima, |.| representa uma função de valor absoluto, a forma x(-1) representa um valor de um quadro anterior x, e α=0.1 é um fator de esquecimento que decide se uma velocidade de atualização é alta ou baixa. O quadro anterior é o SID que é enviado a última vez antes do quadro de ruído corrente e inclui o parâmetro de banda alta de ruído. Nesta modalidade, uma magnitude de atualização de e1a e e0a é limitada. Se uma variação de energia entre ex do quadro de ruído corrente e exa do quadro anterior for maior do que 3 dB, exa do quadro corrente é atualizado por 3 dB. Quando o codificador entra no estado de trabalho de DTX pela primeira vez, exa é inicializado como ex do quadro corrente. O codificador verifica se um desvio entre a razão (a saber, a primeira razão) da energia do sinal de banda alta para a energia do sinal de banda baixa do quadro de ruído corrente e a razão (a segunda razão) da energia da banda alta para a energia da banda baixa no momento quando o SID que inclui o parâmetro de banda alta é enviado a última vez atinge uma extensão, isto é, verifica se a seguinte condição é satisfeita:
Figure img0003
[000118] onde, e° e e;a respectivamente representam uma energia logarítmica de banda alta e uma energia logarítmica de banda baixa no momento quando o quadro de SID que inclui o parâmetro de banda alta é enviado a última vez. Se a fórmula (4) for satisfeita o sinal de banda alta de ruído precisa ser codificado e transmitido. Se o sinalizador de envio de parâmetro de banda alta flaghb=0, flaghb=1 é ajustado.
[000119] Nesta modalidade, a média móvel de longo prazo é um tipo de cálculo de média ponderada, o qual não está especificamente limitado nesta modalidade.
[000120] Nesta modalidade, a determinação se o valor de extensão de desvio atinge um limite pré-ajustado pode ser utilizado como uma segunda condição de determinação. Em um processo de implementação específico, para determinar se o sinal de banda alta de ruído precisa ser codificado e transmitido, ou a primeira condição de determinação ou a segunda condição de determinação apenas precisa ser determinada, o que não está especificamente limitado nesta modalidade.
[000121] Nesta modalidade, a segunda condição de determinação é opcional. Um propósito de executar esta etapa é ajudar uma extremidade de decodificação em estimar localmente a energia do ruído de banda alta de acordo com a energia da banda baixa de ruído e a razão da energia da banda alta de ruído para a energia da banda baixa de ruído no momento quando o SID que inclui o parâmetro de banda alta é enviado a última vez. Especificamente, se o valor de extensão de desvio não for calculado na extremidade de codificação, um quadro de voz com uma mínima energia de sinal de banda alta pode ser obtido na extremidade de decodificação de quadros de voz dentro de um período de tempo antes do quadro de ruído corrente, e a energia do ruído de banda alta corrente é estimada localmente de acordo com uma energia de um sinal de banda alta do quadro de voz com a mínima energia de sinal de banda alta entre os quadros de voz dentro de um período de tempo antes do quadro de ruído corrente. Por exemplo, a energia do sinal de banda alta do quadro de voz com a mínima energia de sinal de banda alta entre os quadros de fala dentro do período de tempo antes do quadro de ruído corrente é selecionada como a energia do ruído de banda alta corrente. Alternativamente, os sinais de banda alta de N quadros de voz com uma energia de sinal de banda alta menor do que um limite pré-ajustado são selecionados de quadros de voz dentro de um período de tempo pré-ajustado antes do SID; e a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID é obtida de acordo com uma energia média ponderada dos sinais de banda alta dos N quadros de voz. Especificamente, nenhuma limitação é determinada nesta modalidade.
[000122] 303. Transmitir o sinal de banda baixa de ruído utilizando um primeiro mecanismo de transmissão descontínua.
[000123] Nesta modalidade, de preferência, a transmissão do sinal de banda baixa de ruído utilizando um primeiro mecanismo de transmissão descontínua inclui: No estado de trabalho de DTX, o codificador executa uma análise de predição linear de 16a ordem sobre o sinal de banda baixa s0 do quadro de ruído corrente, e obtém 16 coeficientes de predição linear lpc(i), onde i = 0, 1, ... 15. Os coeficientes de LPC são transformados em coeficientes de ISP para obter 16 coeficientes de ISP isp(i), onde i = 0, 1, ... 15, e os coeficientes de ISP são armazenados. Se um SID for codificado no quadro corrente, isto é, flagSID = 1, um coeficiente de ISP mediano é pesquisado nos coeficientes de ISP armazenados de N quadros históricos incluindo o quadro corrente. Um método é como segue: Primeiro calcular uma distância δ de um coeficiente de ISP de cada quadro para um coeficiente de ISP de outro quadro:
Figure img0004
[000124] então, selecionar um coeficiente de ISP de um quadro com o menor δ como um coeficiente de ISP ispSID(i) a ser codificado, onde i = 0,...,15; transformar ispSID(i) para um coeficiente de ISF isfSID(i), quantizar o isfSID(i), obter e encapsular um grupo de índices quantizados idxISF no SID; localmente decodificar o idxISF; obter um coeficiente de ISF isf'(i), onde i = 0,...,15; transformar isf'(i) em um coeficiente de ISP isp'(i), onde i = 0,...,15, armazenar o isp'(i); para cada quadro de ruído, atualizar uma média móvel de longo prazo dos coeficientes de IDSP decodificados da extremidade de codificação utilizando o isp'(i) armazenado:
Figure img0005
[000125] onde de preferência, α = 0,9, e ispa(i) é inicializado como isp'(i) de um primeiro SID; transformar ispa(i) em um coeficiente de LPC lpca(i), obter um filtro de análise A(Z); filtrar o sinal de banda baixa s0 de quadro de ruído pelo A(Z) para obter um sinal residual r(i), onde i = 0,1,...319, e calcular uma energia residual logarítmica er: er = l0g2 \∑ r(i)2 j i = 0,1,...319 (7)
Figure img0006
[000126] Nesta modalidade, er é armazenado. Quando o flagSID do quadro de ruído corrente é 1, uma energia logarítmica média ponderada eSID é calculada de acordo com er armazenado de M quadros históricos incluindo o quadro de ruído corrente:
Figure img0007
é um grupo de M coeficientes positivos dimensionais, e uma sua soma é menor do que 1. eSID é quantizado, e um índice quantizado idxe é obtido.
[000127] Nesta modalidade, no estado de trabalho de DTX, quando flagSID = 1, se flaghb = 0, somente um parâmetro de banda baixa é codificado e enviado em um quadro de SID e neste caso, o quadro de SID é formado do idxISF e idxe, e é referido como um pequeno quadro de SID por conveniência.
[000128] Nesta modalidade, a política para codificar e transmitir um sinal de banda baixa de ruído é similar a uma política para codificar e transmitir um sinal de banda larga de ruído na técnica anterior. Somente uma breve introdução está provida nesta modalidade. O processo de implementação específico não está descrito em detalhes nesta modalidade. Nesta modalidade, o sinal de banda alta de ruído do quadro de ruído corrente não precisa ser codificado, e somente o sinal de banda baixa de ruído é codificado. Portanto, uma carga de cálculo é reduzida na extremidade de codificação, e bits de transmissão são economizados.
[000129] 304. Transmitir o sinal de banda baixa de ruído utilizando um primeiro mecanismo de transmissão descontínua, e transmitir o sinal de banda alta de ruído utilizando um segundo mecanismo de transmissão descontínuo.
[000130] Nesta modalidade, se flaghb = 1, além de que um parâmetro de banda baixa precisa ser codificado, um parâmetro de banda alta também precisa ser codificado em um SID. A codificação de um parâmetro de banda baixa de um ruído de banda baixa é a mesma que o modo de codificação na etapa 303, e os detalhes não são repetidamente descritos nesta modalidade. Nesta modalidade, de preferência, o método para codificar um parâmetro de banda alta é como segue: somente quando o codificador está no estado de trabalho de DTX e flagSID = 1, o codificador executa uma análise de predição linear de lOaordem sobre o sinal de banda alta si do quadro corrente, e obtém 10 coeficientes de predição linear lpc(i), onde i = 0,1,...,9. lpc(i) é ponderado:
Figure img0008
[000131] e um coeficiente de LPC ponderado lpcw(i) é obtido, onde w2(i) representa um grupo de fatores de ponderação de 9 dimensões que são menores do que ou iguais a i. lpcw(i) é transformado para um coeficiente de LSP para obter i0 coeficientes de LSP lspw (i), onde i = 0,i,...,9, e uma média móvel de longo prazo de lspw (i) da extremidade de codificação é atualizada de acordo com lspw (i).
Figure img0009
[000132] onde, de preferência, α = 0,9, e lspa (i) é inicializado como lspw (i) do quadro corrente cada vez quando flaghb muda de 0 para i. Quando o SID precisa incluir parâmetros de banda alta, lspa (i) é quantizado, e um grupo de índices quantizados idxLSP é obtido. Uma média móvel de longo prazo eia de energias logarítmicas dos sinais de banda alta na extremidade de codificação é quantizada, e um índice quantizado idxE é obtido. Neste caso, o SID é formado de idxISF, idxe, idxLSP, e idxE. Nesta modalidade, o SID formado de idxISF, idxe, idxLSP, e idxE é referido como um grande SID.
[000133] Opcionalmente, lspa (i) pode ser atualizado continuamente no estado de trabalho de DTX. Isto é, não importa se o valor de flaghb é i ou 0, lspa (i) é atualizado. Especificamente, o método para atualizar lspa (i) quando flaghb = 0 é o mesmo que o método acima quando flaghb=i, e detalhes não são repetidamente descritos nesta modalidade.
[000134] Nesta modalidade, um princípio da política para codificar um sinal de banda alta de ruído é similar àquele da política para codificar um sinal de banda baixa de ruído. Somente uma breve introdução está provida nesta modalidade. O processo de implementação específico não está descrito em detalhes nesta modalidade.
[000135] Nesta modalidade, quando a condição para codificar e transmitir um sinal de banda alta de ruído é satisfeita, a codificação e transmissão são sempre executadas simultaneamente com a codificação e transmissão de um sinal de banda baixa de ruído. No entanto, opcionalmente, a codificação e transmissão podem também não ser executadas simultaneamente com a codificação e transmissão de um sinal de banda baixa de ruído. Isto é, quando o SID é enviado, três possíveis casos podem existir: (1) Somente o sinal de banda alta do quadro de ruído corrente é codificado e transmitido; (2) Somente o sinal de banda alta do quadro de ruído corrente é codificado e transmitido; e (3) O sinal de banda baixa e o sinal de banda alta do quadro de ruído corrente são codificados e transmitidos simultaneamente, e nesta caso, a condição de envio na política para enviar o segundo SID do segundo mecanismo de transmissão descontínua ainda inclui: o primeiro mecanismo de transmissão descontínua satisfazendo a condição de envio de primeiro SID. Os três casos de enviar o SID não estão especificamente limitados nesta modalidade.
[000136] Nesta modalidade, as etapas 302 e 304 são especificamente etapas de codificar e transmitir o sinal de banda baixa de ruído utilizando o primeiro mecanismo de transmissão descontínua, e codificar e transmitir o sinal de banda alta de ruído utilizando o segundo mecanismo de transmissão descontínua, onde uma política para enviar um primeiro quadro de descritor de inserção de silêncio SID do primeiro mecanismo de transmissão descontínua é diferente de uma política para enviar um segundo SID do segundo mecanismo de transmissão descontínua, ou uma política para codificar um primeiro SID do primeiro mecanismo de transmissão descontínua é diferente de uma política para codificar um segundo SID do segundo mecanismo de transmissão descontínua.
[000137] A modalidade de método provida pela presente invenção traz os seguintes efeitos benéficos: Um quadro de ruído corrente de um sinal de áudio é obtido, e o quadro de ruído corrente é decomposto em um sinal de banda baixa de ruído e um sinal de banda alta de ruído; então o sinal de banda baixa de ruído é codificado e transmitido utilizando um primeiro mecanismo de transmissão descontínua e o sinal de banda alta de ruído é codificado e transmitido utilizando um segundo mecanismo de transmissão descontínua. Deste modo, diferentes modos de processamento são utilizados para o sinal de banda alta e o sinal de banda baixa, a complexidade de cálculo pode ser reduzida e bits codificados podem ser economizados sob uma premissa de não diminuir a qualidade subjetiva de um codec, e os bits que são economizados ajudam a conseguir um objetivo de reduzir uma largura de banda de transmissão ou aperfeiçoar a qualidade de codificação total, por meio disto resolvendo um problema de codificação e transmissão de superbanda larga.
MODALIDADE 4
[000138] Esta modalidade provê um método para processar dados de áudio. Em comparação com o processamento de um sinal de ruído em uma extremidade de codificador, uma extremidade de decodificador pode determinar, de acordo com um fluxo de bits recebido, se um quadro corrente é um quadro de voz codificado ou um SID ou um quadro de NO_DATA. O quadro de NO_DATA é um quadro que indica que a extremidade de codificação não codifica e envia um SID em um período de ruído. Quando o quadro corrente é um SID, o decodificador pode ainda determinar, de acordo com o número de bits do SID, se o SID inclui um parâmetro de banda baixa e/ou de banda alta. Opcionalmente, o decodificador pode também determinar, de acordo com um identificador específico inserido no SID, se o SID inclui um parâmetro de banda baixa e/ou de banda alta. Isto requer que um bit de identificador adicional seja adicionado quando o SID é codificado. Por exemplo, quando um primeiro identificador é inserido no SID, este identifica que o SID inclui somente um parâmetro de banda alta; quando um segundo identificador é inserido, este identifica que o SID inclui somente o parâmetro de banda baixa, e quando um terceiro identificador é inserido, este identifica que o SID inclui um parâmetro de banda alta e um parâmetro de banda baixa. Se o quadro corrente for um quadro de voz codificado, o decodificador decodifica o quadro de voz. O processo de processamento específico é similar àquele da técnica anterior, e não está descrito em detalhes nesta modalidade. Quando o quadro corrente é um SID ou um quadro de NO_DATA, o decodificador seleciona de acordo com o específico estado de trabalho de CNG, um método correspondente para reconstruir um quadro de CN. Nesta modalidade, o CNG tem dois estados de trabalho: um estado de CNG de meia decodificação que corresponde a um pequeno quadro de SID, a saber, um primeiro estado de CNG, e um estado de CNG de decodificação total que corresponde a um grande quadro de CID, a saber, um segundo estado de CNG. No estado de CNG de decodificação total, o decodificador reconstrói um quadro de CN de acordo com um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído obtidos pela decodificação de um grande quadro de SID. No estado de CNG de meia decodificação, o decodificador reconstrói um quadro de CN de acordo com um parâmetro de banda baixa de ruído obtido pela decodificação de um pequeno quadro de SID e um parâmetro de banda alta de ruído localmente estimado. Quando o quadro corrente da extremidade de decodificação é um grande quadro de SID, se um sinalizador de estado de trabalho de CNG flagCNG for 0 (indicando o estado de CNG de meia decodificação), o sinalizador de estado de trabalho flagCNG é ajustado para 1 (indicando o estado de CNG de decodificação total); de outro modo, o estado original permanece inalterado. Similarmente, quando o quadro corrente na extremidade de decodificação é um pequeno quadro de SID, se o sinalizador de estado de trabalho de CNG flagCNG é 1, o sinalizador de estado de trabalho de CNG flagCNG é ajustado para 0; de outro modo, o estado original permanece inalterado. Referindo à Figura 4., especificamente esta modalidade provê um método para processar dados de áudio em uma extremidade de decodificador, onde o método inclui o seguinte:
[000139] 401. Um decodificador obtém um SID, e se o SID incluir um parâmetro de banda alta e um parâmetro de banda baixa, decodifica o SID para obter um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, e obtém um terceiro quadro de CN de acordo com o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído obtidos por decodificação.
[000140] Nesta modalidade, após receber um quadro de voz codificado enviado por uma extremidade de codificador, a extremidade de decodificador primeiro determina o tipo de quadro de voz, de modo que diferentes modos de decodificação sejam correspondentemente utilizados de acordo com diferentes tipos de quadros de voz. Especificamente, se o número de bits do SID for menor do que um primeiro limite pré-ajustado, é confirmado que o SID inclui o parâmetro de banda alta; se o número de bits do SID for maior do que um primeiro limite pré-ajustado e menor do que um segundo limite pré-ajustado, é confirmado que o SID inclui o parâmetro de banda baixa; e se o número de bits do SID for maior do que um segundo limite pré-ajustado e menor do que um terceiro limite pré-ajustado, é confirmado que o SID inclui o parâmetro de banda alta e o parâmetro de banda baixa. Alternativamente, se o SID incluir um primeiro identificador, é confirmado que o SID inclui o parâmetro de banda alta; se o SID incluir um segundo identificador, é confirmado que o SID inclui o parâmetro de banda baixa; ou se o SID incluir um terceiro identificador, é confirmado que o SID inclui o parâmetro de banda baixa e o parâmetro de banda alta.
[000141] Nesta modalidade, se o SID incluir o parâmetro de banda alta e o parâmetro de banda baixa, o SID é decodificado para obter o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído, e o terceiro quadro de CN é obtido de acordo com o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído obtidos por decodificação. Especificamente, o decodificador decodifica o SID para obter uma energia logarítmica de excitação de banda baixa eD, um coeficiente de ISF de banda baixa isfd(i), uma energia logarítmica de banda alta ED, e um coeficiente de LSP de banda alta lspd(i). isfd(i) é transformado em um coeficiente de ISP ispd(i), e eD e ED são transformados em energias ed e Ed, onde Ed = 100.1ED e = 2eD, e então ispd(i), ed, lspd(i), e Ed são armazenados.
[000142] Nesta modalidade, quando o decodificador está no estado de trabalho de CNG e flagCNG=1, não importa se o quadro corrente é um SID ou um quadro de NO_DATA, frame, os ispd(i), ed, lspd(i), e Ed armazenados são utilizados para atualizar uma média móvel de longo prazo de cada um dos ispd(i), extremidade de decodificação:
Figure img0010
[000143] onde, α=0.9, e β=0.7. armazenamento de energia de banda alta E1old. Uma pequena energia randômica é adicionada na base de eCN, e uma energia de excitação final e'CN utilizada para reconstruir o sinal de ruído de banda baixa é obtida: e= (1+0.000011-RND ■ eCN)■ eCAÍ, onde RND representa um número randômico dentro de uma faixa de [-32767, 32767]. Nesta modalidade, uma sequência de ruído branco de 320 pontos exc0(i) é gerada, onde i=0,1,...319. e'CN é utilizado para executar um ajuste de ganho em exc0(i) para obter exc'0(i), isto é, exc0(i) é multiplicado por um coeficiente de ganho G0, de modo que a energia de exc'0(i) é igual a
Figure img0011
ispCN(i) é transformado em um coeficiente de LPC para obter um filtro de síntese 1/A0(Z), a excitação ajustada em ganho exc'0(i) é utilizada para excitar o filtro 1/A(Z) para obter um sinal de CN de banda baixa s'0 que é reconstruído na extremidade de decodificação e amostrado a 16 kHz, e uma energia de s'0 é calculada e armazenada em um armazenamento de energia de banda baixa E0old.
[000144] Nesta modalidade, o processamento de um sinal de banda alta de ruído na extremidade de decodificação é similar ao processamento de um sinal de banda baixa de ruído. Outra sequência de ruído branco de 320 pontos exc1(i) é gerada, onde i=0,1,...319, lspCN(i) é transformado em um coeficiente de LPC para obter um filtro de síntese 1/A1(Z), e exc1(i) é utilizado para excitar o filtro 1/A1(Z) para obter um sinal de CN de banda alta desajustado em ganho s~1(i). s~1(i) é multiplicado por coeficientes de ganho G1 e G2, onde G2=0,8, e um sinal de CN de banda alta s'1 que é reconstruído na extremidade de decodificação e amostrado a 16 kHz é obtido, onde,
Figure img0012
Nesta modalidade, o propósito de G2 é executar uma supressão de energia sobre o sinal de ruído reconstruído em um certo grau.
[000145] Nesta modalidade, na extremidade de decodificador, s'0 e s'1 são passados através de um filtro de síntese de QMF, e finalmente um primeiro quadro de CN que é reconstruído pelo decodificador e amostrado a 32 kHz é obtido.
[000146] 402. Se o SID incluir o parâmetro de banda baixa, decodificar o SID para obter um parâmetro de banda baixa de ruído, localmente gerar um parâmetro de banda alta de ruído, e obter um primeiro quadro de CN de acordo com o parâmetro de banda baixa de ruído obtido por decodificação e o parâmetro de banda alta de ruído localmente gerado.
[000147] Nesta modalidade, quando o decodificador está no estado de trabalho de CNG e flagCNG=0, não importa se o quadro corrente é um SID ou um quadro de NO_DATA, um sinal de CN de banda baixa s'0 que é reconstruído na extremidade de decodificação e amostrado a 16 kHz é obtido de acordo com o mesmo método que é utilizado quando flagCNG=1, a saber, o método na etapa 402, que não é adicionalmente descrito nesta modalidade.
[000148] Nesta modalidade, um sinal de banda alta do primeiro quadro de CN é obtido ainda utilizando o método de excitar um filtro de síntese utilizando ruído branco exceto que uma energia do sinal de banda alta do primeiro quadro de CN e um coeficiente de filtro de síntese são obtidos executando a estimativa localmente. Nesta modalidade, localmente gerar um parâmetro de banda alta de ruído inclui: separadamente obter uma energia média ponderada de um sinal de banda alta de ruído e um coeficiente de filtro de síntese do sinal de banda alta de ruído em um momento que corresponde ao SID; e obter o sinal de banda alta de ruído de acordo com a energia média ponderada obtida do sinal de banda alta de ruído e o coeficiente de filtro de síntese obtido do sinal de banda alta de ruído no momento que corresponde ao SID.
[000149] Nesta modalidade, de preferência, a obtenção de uma energia média ponderada de um sinal de banda alta de ruído em um momento que corresponde ao SID inclui: obter uma energia de um sinal de banda baixa do primeiro quadro de CN de acordo com o parâmetro de banda baixa de ruído obtido por decodificação; calcular uma razão de uma energia de um sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído em um momento quando um SID que inclui um parâmetro de banda alta é recebido antes do SID, para obter uma primeira razão; obter, de acordo com a energia do sinal de banda baixa do primeiro quadro de CN e a primeira razão, uma energia do sinal de banda alta de ruído no momento que corresponde ao SID; e executar uma média ponderada sobre a energia do sinal de banda alta de ruído no momento que corresponde ao SID e a energia de um sinal de banda alta de um quadro de CN localmente armazenado, para obter a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID onde a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID é uma energia de sinal de banda alta do primeiro quadro de CN. Opcionalmente, o cálculo de uma razão de uma energia de um sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído em um momento quando um SID que inclui um parâmetro de banda alta é recebido antes do SID, para obter uma primeira razão, inclui: calcular uma razão de uma energia instantânea do sinal de banda alta de ruído para uma energia instantânea do sinal de banda baixa de ruído no momento quando o SID que inclui o parâmetro de banda alta é recebido antes do SID, para obter a primeira razão; ou calcular uma razão de uma energia média ponderada do sinal de banda alta de ruído para uma energia média ponderada do sinal de banda baixa de ruído no momento quando o SID que inclui o parâmetro de banda alta é recebido antes do SID, para obter a primeira razão. A energia instantânea é a energia obtida por decodificação. Quando a energia do sinal de banda alta de ruído no momento que corresponde ao SID é maior do que uma energia de um sinal de banda alta de um quadro de CN anterior que está localmente armazenado, a energia do sinal de banda alta do quadro de CN anterior que está localmente armazenado é atualizada a uma primeira taxa; de outro modo, a energia do sinal de banda alta do quadro de CN anterior que está localmente armazenado é atualizada a uma segunda taxa, onde a primeira taxa e maior do que a segunda taxa.
[000150] Especificamente, nesta modalidade, a obtenção de uma energia média ponderada de um sinal de banda alta de ruído em um momento que corresponde ao SID pode ser implementada utilizando o seguinte método:
[000151] obter uma energia E0 do sinal de banda baixa do primeiro quadro de CN s'0 de acordo com o parâmetro de banda baixa de ruído obtido por decodificação; estimar, de acordo com a energia E1old do sinal de banda alta e E0old do sinal de banda baixa do quadro de CN anterior no estado de CNG de decodificação total e E0, uma E~1 do sinal de banda alta de ruído no momento que corresponde ao SID, onde energias de sinal de CN de banda alta na extremidade de decodificação utilizado E~i: ECAÍ = X E(c+ (1 -X)■ Ef, onde um coeficiente / é uma variável, quando E~I>ECN, /=0,98; de outro modo, /=0,9, onde /=0,98 é uma primeira taxa e /=0,9 é uma segunda taxa.
[000i52] Nesta modalidade, se um valor de extensão de desvio não for calculado na extremidade de codificação, opcionalmente, a obtenção de uma energia média ponderada de um sinal de banda alta de ruído em um momento que corresponde ao SID inclui: selecionar um sinal de banda alta de um quadro de voz com uma energia de sinal de banda alta mínima de quadros de voz dentro de um período de tempo pré- ajustado antes do SID; e obter, de acordo com uma energia do sinal de banda alta do quadro de voz com a mínima energia de sinal de banda alta entre os quadros de voz, a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID; ou selecionar os sinais de banda de N de quadros de voz com uma energia de sinal de banda alta menor do que um limite pré-ajustado dos quadros de voz dentro de um período de tempo pré-ajustado antes do SID; e obter de acordo com uma energia média ponderada do sinal de banda alta dos N quadros de voz, a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID,onde a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID é uma energia de sinal de banda alta do primeiro quadro de CN.
[000153] Nesta modalidade, de preferência, a obtenção de um coeficiente de filtro de síntese do sinal de banda alta de ruído em um momento que corresponde ao SID inclui: distribuir M coeficientes de ISF de frequência espectral de imitância ou coeficientes de ISP de par espectral de imitância ou coeficientes de LSF de frequência espectral de linha ou coeficientes de LCP de par espectral de linha em uma faixa de frequência que corresponde a um sinal de banda alta; executar um processamento de randomização sobre os M coeficientes, onde uma característica da randomização é: fazer com que cada coeficiente entre os M coeficientes gradualmente aproximem de um valor alvo que corresponde a cada coeficiente, onde o valor alvo é um valor em uma faixa pré-ajustada adjacente a um valor de coeficiente e o valor alvo de cada coeficiente entre os M coeficientes muda após cada N quadros, e N pode ser uma variável; e obter, de acordo com os coeficientes de filtro obtidos pelo processamento de randomização, o coeficiente de filtro de síntese do sinal de banda alta de ruído no momento que corresponde ao SID.
[000154] Especificamente, nesta modalidade, a obtenção de um coeficiente de filtro de síntese do sinal de banda alta de ruído em um momento que corresponde ao SID pode ser implementada utilizando o seguinte método:
[000155] Nove coeficientes ISF isfext(i) são uniformemente distribuídos em uma banda de frequência de -16 kHz que correspondem a coeficientes de ISF de banda baixa isfd(14), onde i=0,1,...8:
Figure img0013
[000156] isfext(i) é transformado para uma banda de frequência de 0-8 kHz, e isf'ext(i) é obtido:
Figure img0014
[000157] isf'ext(i) é randomizado utilizando um grupo de fatores de randomização de 9 dimensões R(i), onde i=0,1,...8, e um coeficiente de ISF isf1(i) é obtido: '' '
Figure img0015
[000158] onde, R(i) é obtido com a seguinte fórmula (14):
[000159]
Figure img0016
[000160] onde, α = 0,8, e Rt(i) é referido como um fator de randomização alvo, e obtido de acordo com a seguinte fórmula :
Figure img0017
[000161] Na fórmula (15) acima, RND representa um grupo de sequências de números randômicos de 9 dimensões, e os números randômicos em cada dimensão são diferentes uns dos outros e todos caem dentro de uma faixa de [-1, 1]. cnt é um contador de quadros. No estado de trabalho de CNG, quando flagCNG=0, para cada quadro de SID ou quadro de NO_DATA, 1 é adicionado ao contador. mod(cnt, 10) representa cnt mod 10. Em outra modalidade, quando Rt(i) é calculado, 10 em mod(cnt, 10) pode também ser uma variável, por exemplo,
Figure img0018
[000162] onde, RND representa um número randômico dentro de uma faixa [-1, 1], o que não é especificamente limitado nesta modalidade.
[000163] Nesta modalidade, um coeficiente de ISF de banda baixa isfd(15) é utilizado como isf1(9), e sintetizado com um coeficiente de ISF randomizado isf1(i), onde i=0,1,...8, para formar um coeficiente de ISF de filtro de 10a ordem, o qual é então transformado para um coeficiente de LPC lpc1(i), onde i=0,1,...9. lpc1(i) é multiplicado por um grupo de fatores de ponderação de 10 dimensões W(i)={0,6699, 0,5862, 0,5129, 0,4488, 0,3927, 0,3436, 0,3007, 0,2631, 0,2302, 0,2014}, e um coeficiente de LPC ponderado lpc~1(i) é obtido, isto é, um filtro de síntese 1/A~1(Z) é estimado.
[000164] Nesta modalidade, uma sequência de ruído branco de 320 pontos exc2(i) é gerada, onde i=0,1,...319, e exc2(i) é utilizada para excitar o filtro 1/A~1(Z) para obter um sinal de CN de banda alta não ajustado em ganho s~1(i). s~1(i) é multiplicado por coeficientes de ganho G3 e G4, onde G4=0,6, e um sinal de CN de banda alta s'1 que é reconstruído na extremidade de decodificação e amostrado a 16 kHz é
Figure img0019
[000165] Se o quadro corrente for um SID, é necessário transformar lpc~1(i) para um coeficiente de LSP lsp~1(i), e utilizar lsp~1(i) para atualizar a média móvel de longo prazo de coeficientes de LSP de sinais de banda alta de quadros de CN armazenados na extremidade de decodificação:
Figure img0020
[000166] onde, β = 0,7.
[000167] Nesta modalidade, opcionalmente, a obtenção de um coeficiente de filtro de síntese do sinal de banda alta de ruído em um momento que corresponde ao SID inclui: obter M coeficientes de ISF ou coeficientes de ISP ou coeficientes de LSF ou coeficientes de LSP de um sinal de banda alta de ruído armazenado localmente; executar um processamento de randomização sobre os M coeficientes, onde uma característica da randomização é: fazer com que cada coeficiente entre os M coeficientes gradualmente se aproxime de um valor alvo que corresponde a cada coeficiente, onde o valor alvo é um valor em uma faixa pré-ajustada adjacente a um valor de coeficiente, e o valor alvo de cada coeficiente entre os M coeficientes muda após cada N quadros; e obter, de acordo com os coeficientes de filtro obtidos por processamento de randomização, o coeficiente de filtro de síntese do sinal de banda alta de ruído no momento que corresponde ao SID. Especificamente, nenhuma limitação é determinada nesta modalidade.
[000168] Nesta modalidade, após o parâmetro de banda baixa e o parâmetro de banda alta serem obtidos, s'0 e s'1 são passados através de um filtro de síntese de QMF, e finalmente um primeiro quadro de CN que é reconstruído pelo decodificador e amostrado a 32 kHz é obtido.
[000169] Ainda, nesta modalidade, opcionalmente, antes do primeiro quadro de CN ser obtido de acordo com o parâmetro de banda baixa de ruído obtido por decodificação e o parâmetro de banda alta de ruído localmente gerado, o parâmetro de banda alta de ruído localmente gerado pode ser adicionalmente otimizado, de modo que um ruído de conforto de um melhor efeito possa ser obtido. Uma etapa de otimização específica inclui: quando os quadros históricos adjacentes ao SID são quadros de voz codificados, se uma energia média de sinais de banda alta ou uma parte de sinais de banda alta que é decodificada dos quadros de voz codificados for menor do que uma energia média de sinais de banda alta de ruído ou uma parte dos sinais de banda alta de ruído que são gerados localmente, multiplicar os sinais de banda alta de ruído de L quadros subsequentes começando do SID por um fator de uniformização menor do que 1, para obter uma nova energia média ponderada dos sinais de banda alta de ruído localmente gerados; e correspondentemente, a o obtenção do primeiro quadro de CN de acordo com o parâmetro de banda baixa de ruído obtido por decodificação e o parâmetro e banda alta de ruído localmente gerado inclui: obter um quarto quadro de CN de acordo com o parâmetro de banda baixa de ruído obtido por decodificação, o coeficiente de filtro de síntese do sinal de banda alta de ruído no momento que corresponde ao SID, e a nova energia média ponderada dos sinais de banda alta de ruído localmente gerados.
[000170] Nesta modalidade, quando um quadro antes do SID corrente é um quadro de voz codificado, e uma energia Esp de um sinal de banda de alta do quadro de voz codificado é mais baixa do que uma energia Es'1 de s'1, é necessário uniformizar as energias de sinal de banda alta do SID corrente e diversos subsequentes SIDs (50 quadros nesta modalidade). Um método de uniformização específico é: multiplicar s'1 do quadro corrente por um ganho Gs, para obter s'1s uniformizado. E E 1 /
Figure img0021
onde, cnt é um contador de quadros, E E Es 1 1 é adicionado ao contador para cada quadro começando do primeiro quadro de CN após o quadro de voz codificado, e Es’/ é uma energia de um sinal de banda alta uniformizado de um quadro anterior e é inicializado como Esp quando cnt=1. O processo de uniformização é executado somente até 50 quadros. Neste período, se Es1 for maior do que Es'1, o processo de uniformização é terminado. Opcionalmente, Es1 e Es'1 podem também representar energias de somente uma parte de quadros, o que não é especificamente limitado nesta modalidade. Nesta modalidade, s'0 e s'1 (ou s'1s) são passados através de um filtro de síntese de QMF e finalmente um quadro de CN que é reconstruído pelo decodificador e amostrado a 32 kHz é obtido.
[000171] 403. Se o SID incluir o parâmetro de banda alta, decodificar o SID para obter um parâmetro de banda alta de ruído, localmente gerar um parâmetro de banda baixa de ruído, e obter um segundo quadro de CN de acordo com o parâmetro de banda alta de ruído obtido por decodificação e o parâmetro de banda baixa de ruído localmente gerado.
[000172] Nesta modalidade, se o SID incluir o parâmetro de banda alta, o SID é decodificado para obter um parâmetro de banda alta de ruído, e um parâmetro de banda baixa de ruído é gerado localmente, e um segundo quadro de CN é obtido de acordo com o parâmetro de banda alta obtido por decodificação e o parâmetro de banda baixa de ruído localmente gerado. O método para decodificar o parâmetro de banda alta é o mesmo que o método na etapa 401, e os detalhes não são repetidamente descritos nesta modalidade. O método para localmente gerar o parâmetro de banda baixa é o mesmo que o método para localmente gerar um parâmetro de banda larga, e os detalhes não são repetidamente descritos nesta modalidade.
[000173] A modalidade de método provida pela presente invenção traz os seguintes efeitos benéficos: Um decodificador obtém um quadro de descritor de inserção de silêncio SID, e determina se o SID inclui um parâmetro de banda baixa e/ou um parâmetro de banda alta; se o SID incluir o parâmetro de banda baixa, decodifica o SID para obter um parâmetro de banda baixa de ruído, localmente gera um parâmetro de banda alta de ruído, e obtém um primeiro quadro de ruído de conforto CN de acordo com o parâmetro de banda baixa de ruído obtido pela decodificação e o parâmetro de banda alta de ruído localmente gerado; se o SID incluir o parâmetro de banda alta, decodifica o SID para obter um parâmetro de banda alta de ruído, localmente gera um parâmetro de banda baixa de ruído, e obtém um segundo quadro de CN de acordo com o parâmetro de banda alta de ruído obtido pela decodificação e o parâmetro de banda baixa de ruído localmente gerado; e se o SID incluir o parâmetro de banda alta e o parâmetro de banda baixa, decodifica o SID para obter um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, e obtém um terceiro quadro de CN de acordo com o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído obtidos por decodificação. Deste modo, diferentes modos de processamento são utilizados para o sinal de banda alta e o sinal de banda baixa, a complexidade de cálculo pode ser reduzida e bits codificados podem ser economizados sob uma premissa de não diminuir a qualidade subjetiva de um codec, e os bits que são economizados ajudam a conseguir um objetivo de reduzir uma largura de banda de transmissão ou aperfeiçoar a qualidade de codificação total, por meio disto resolvendo um problema de codificação e transmissão de superbanda larga. Além disso, antes do segundo quadro de CN ser obtido de acordo com o parâmetro de banda baixa de ruído obtido por decodificação e o parâmetro de banda alta de ruído localmente gerado, o parâmetro de banda alta de ruído localmente gerado pode ser adicionalmente otimizado, de modo que um ruído de conforto de um melhor efeito possa ser obtido. Por meio disto, o desempenho do de codificador é adicionalmente otimizado.
MODALIDADE 5
[000174] Esta modalidade provê um método para processar dados de áudio. Igualmente como no método para processar dados de áudio na Modalidade 2, uma extremidade de codificador obtém um quadro de ruído de um sinal de áudio, e decompõe o quadro de ruído em um sinal de banda baixa de ruído e um sinal de banda alta de ruído. No entanto, opcionalmente, determinar se o sinal de banda alta do quadro de ruído satisfaz uma condição de codificação e transmissão pré-ajustada inclui: determinar se uma estrutura espectral do sinal de banda alta de ruído do quadro de ruído, em comparação com uma estrutura espectral média de sinais de banda alta de ruído antes do quadro de ruído, satisfaz uma condição pré-ajustada; se sim, codificar um SID do sinal de banda alta de ruído do quadro de ruído utilizando a política para codificar o segundo SID, e enviar o SID; e se não, determinar que o sinal de banda alta de ruído do quadro de ruído não precisa ser codificado e transmitido. A estrutura espectral média dos sinais de banda alta de ruído antes do quadro de ruído inclui: uma média ponderada de espectros dos sinais de banda alta de ruído antes do quadro de ruído. Nesta modalidade, a determinação se uma estrutura espectral do sinal de banda alta de ruído do quadro de ruído, em comparação com uma estrutura espectral média de sinais de banda alta de ruído antes do quadro de ruído, satisfaz uma condição pré-ajustada, é utilizada como uma terceira condição para determinar se codificar e transmitir o sinal de banda alta de ruído.
[000175] Nesta modalidade, opcionalmente, se codificar e transmitir o sinal de banda alta de ruído pode também ser determinado utilizando uma segunda condição de determinação, a qual não está especificamente limitada nesta modalidades.
[000176] Nesta modalidade, DTX decide se codificar e transmitir um parâmetro de banda alta, isto é, o ajuste de flaghb pode ser decidido utilizando as seguintes condições: (1) se uma terceira condição de determinação for satisfeita; se sim, ajustar flaghb para 0; de outro modo, ajustar flaghb para 1; e (2) se a segunda condição de determinação for satisfeita; se não, ajustar flaghb para 0; se sim, ajustar flaghb para 1.
[000177] Nesta modalidade, um método específico para implementar a terceira condição de terminação pode ser como segue: O codificador obtém um coeficiente de LSP de 10a ordem lsp(i) do sinal de banda alta de ruído s1 do quadro de ruído corrente, onde i=0,...9, e opcionalmente, o coeficiente pode também ser um coeficiente de LSF ou ISF ou ISP, o que não está especificamente limitado nesta modalidade. O coeficiente de LSP ou LSF ou ISF ou ISP é somente um diferente modo de representação em um diferente domínio, mas todos representam um coeficiente de filtro de síntese, o que não está especificamente limitado nesta modalidade. lsp(i) é utilizado para atualizar uma sua média móvel:
[000178] onde lspa(i) é uma média móvel de longo prazo de lsp(i). Uma distorção espectral entre lspa(i) corrente e lspa(i) em um momento quando um quadro de SID que inclui um parâmetro de banda alta é 92 enviado a última vez é calculada: Dlsp = ∑{lspa(i)-lspa) , onde, Disp i=0 representa a distorção espectral, e lsp- representa lspa(i) no momento quando o quadro de SID que inclui o parâmetro de banda alta é enviado a última vez. Se Dlsp for menor do que um certo limite, flaghb=0 é ajustado; de outro modo, flaghb=1 é ajustado.
[000179] Nesta modalidade, um método de trabalho para codificar o parâmetro de banda baixa e/ou o parâmetro de banda alta pelo codificador quando necessário é basicamente o mesmo que o método de trabalho na Modalidade 3, e os detalhes não são repetidamente descritos nesta modalidade.
[000180] Nesta modalidade, quando um decodificador esta em um estado de trabalho de CNG e flagCNG=0, é necessário gerar localmente um sinal de banda alta de ruído. O método para obter uma energia média ponderada de um sinal de banda alta de ruído em um momento que corresponde a um SID é o mesmo que o método da Modalidade 4, e os detalhes não são repetidamente descritos nesta modalidade. No entanto, nesta modalidade, de preferência, obter um coeficiente de filtro de síntese do sinal de banda alta de ruído em um momento que corresponde ao SID inclui: obter M coeficientes de ISF ou coeficientes de ISP ou coeficientes de LSF ou coeficientes de LSP de um sinal de banda alta de ruído armazenado localmente; executar um processamento de randomização sobre os M coeficientes, onde uma característica da randomização é: fazer com que cada coeficiente entre os M coeficientes gradualmente se aproxime de um valor alvo que corresponde a cada coeficiente, onde o valor alvo é um valor em uma faixa pré-ajustada adjacente a um valor de coeficiente, e o valor alvo de cada coeficiente entre os M coeficientes muda após cada N quadros; e obter, de acordo com os coeficientes de filtro obtidos por processamento de randomização, o coeficiente de filtro de síntese do sinal de banda alta de ruído no momento que corresponde ao SID. Especificamente, a obtenção de um coeficiente de filtro de síntese do sinal de banda alta de ruído em um momento que corresponde ao SID pode ser implementada no seguinte modo:
[000181] Assumindo lsp'(i)=lspCN(i), onde i=0,...9, lspCN(i) é uma média móvel de longo prazo de coeficientes de LSP de sinais de banda alta de ruído de quadros de CN que estão localmente armazenados na extremidade de decodificação. Um processamento de randomização é executado sobre lsp'(i) utilizando o mesmo método na Modalidade 4, e lsp1(i) é obtido:
Figure img0022
[000182] lsp1(i) é transformado em um coeficiente de LPC lpc1(i), e um filtro de síntese 1/A~1(Z) é obtido após ponderar com w(i) utilizando o mesmo método na Modalidade 4. Nesta modalidade, uma sequência de ruído branco de 320 pontos exc2(i) é gerada, onde i=0,1,...319, e exc2(i) é utilizado para excitar o filtro 1/A~1(Z) para obter um sinal de CN de banda alta não ajustado em ganho s~1(i). s~1 (i) é multiplicado por um coeficiente de ganho G3, e um sinal de banda alta s'1 de um quadro de CN que é reconstruído na extremidade de decodificação e amostrado a 16 kHz é obtido. Nesta modalidade, quando o quadro corrente é um SID, lsp1(i) obtido utilizando este método não é utilizado para atualizar a média móvel de longo prazo dos coeficientes de LSP dos sinais de sinal de banda alta dos quadros de CN que estão armazenados na extremidade de decodificação.
[000183] Nesta modalidade, quando o codificador codifica um grande quadro de SID, quando uma média móvel de longo prazo e1a de energias logarítmicas de sinais de banda alta, é quantizada na extremidade de codificação, a quantização é executada após e1a ser atenuado (isto é, após um valor ser subtraído). Portanto, neste caso, na decodificação, é desnecessário multiplicar s~1(i) por G2 ou G4 na Modalidade 4. Outras etapas da extremidade de decodificação desta modalidade são similares às etapas na modalidade acima, e detalhes não são repetidamente descritos nesta modalidade.
[000184] A modalidade de método provida pela presente invenção traz os seguintes efeitos benéficos: um quadro de ruído corrente de um sinal de áudio é obtido e o quadro de ruído corrente é decomposto em um sinal de banda baixa de ruído e um sinal de banda alta de ruído; então o sinal de banda baixa de ruído é codificado e transmitido utilizando um primeiro mecanismo de transmissão descontínua e o sinal de banda alta de ruído é codificado e transmitido utilizando um segundo mecanismo de transmissão descontínua. Um decodificador obtém um quadro de descritor de inserção de silêncio SID, e determina se o SID inclui um parâmetro de banda baixa e/ou um parâmetro de banda alta; se o SID inclui o parâmetro de banda baixa, decodifica o SID para obter um parâmetro de banda baixa de ruído, localmente gera um parâmetro de banda alta de ruído, e obtém um primeiro quadro de ruído de conforto CN de acordo com o parâmetro de banda baixa de ruído obtido por decodificação e o parâmetro de banda alta de ruído localmente gerado; se o SID incluir o parâmetro de banda alta, decodificar o SID para obter um parâmetro de banda alta de ruído, localmente gera um parâmetro de banda baixa de ruído, e obtém um segundo quadro de CN de acordo com o parâmetro de banda alta de ruído obtido por decodificação e o parâmetro de banda baixa de ruído localmente gerado; e se o SID incluir o parâmetro de banda alta e o parâmetro de banda baixa, decodifica o SID para obter um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, e obtém um terceiro quadro de CN de acordo com o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído obtidos por decodificação. Deste modo, diferentes modos de processamento são utilizados para o sinal de banda alta e o sinal de banda baixa, a complexidade de cálculo pode ser reduzida e bits codificados podem ser economizados sob uma premissa de não diminuir a qualidade subjetiva de um codec, e os bits que são economizados ajudam a conseguir um objetivo de reduzir uma largura de banda de transmissão ou aperfeiçoar a qualidade de codificação total, por meio disto resolvendo um problema de codificação e transmissão de superbanda larga.
MODALIDADE 6
[000185] Referindo à Figura 5, esta modalidade provê um aparelho para codificar dados de áudio, onde o aparelho inclui: um módulo de obtenção 501 e um módulo de transmissão 502.
[000186] O módulo de obtenção 501 está configurado para obter um quadro de ruído de um sinal de áudio, e decompor o quadro de ruído em um sinal de banda baixa de ruído e um sinal de banda alta de ruído.
[000187] O módulo de transmissão 502 está configurado para codificar e transmitir o sinal de banda baixa de ruído utilizando um primeiro mecanismo de transmissão descontínua, e codificar e transmitir o sinal de banda alta de ruído utilizando um segundo mecanismo de transmissão descontínua, onde uma política para enviar um primeiro quadro de descritor de inserção de silêncio SID do primeiro mecanismo de transmissão descontínua é diferente de uma política para enviar um segundo SID do segundo mecanismo de transmissão descontínua, ou uma política para codificar um primeiro SID do primeiro mecanismo de transmissão descontínua é diferente de uma política para codificar um segundo SID do segundo mecanismo de transmissão descontínua.
[000188] Nesta modalidade, o primeiro SID inclui um parâmetro de banda baixa do quadro de ruído, e o segundo SID inclui um parâmetro de banda baixa e/ou um parâmetro de banda alta do quadro de ruído.
[000189] Opcionalmente, referindo à Figura 6, o módulo de transmissão 502 inclui:
[000190] Uma primeira unidade de transmissão 502a configurada para determinar se o sinal de banda alta de ruído tem uma estrutura espectral pré-ajustada; se sim, e uma condição de envio da política para enviar o segundo SID for satisfeita, codificar um SID do sinal de banda alta de ruído utilizando a política para codificar o segundo SID, e enviar o SID; e se não, determinar que o sinal de banda alta de ruído não precisa ser codificado e transmitido.
[000191] Nesta modalidade, a primeira unidade de transmissão 502a inclui:
[000192] uma primeira subunidade de determinação configurada para obter um espectro do sinal de banda alta de ruído, dividir o espectro em pelo menos duas sub-bandas, e se uma energia média de qualquer primeira sub-banda nas sub-bandas não for menor do que uma energia média de uma segunda sub-banda nas sub-bandas, onde uma banda de frequência na qual a segunda sub-banda está localizada é mais alta do que uma banda de frequência na qual a primeira sub-banda está localizada, confirmar que o sinal de banda alta de ruído não tem uma estrutura espectral pré-ajustada; de outro modo, confirmar que o sinal de banda alta de ruído tem uma estrutura espectral pré-ajustada.
[000193] Referindo à Figura 6, opcionalmente, o módulo de transmissão 502 inclui:
[000194] uma segunda unidade de transmissão 502b, configurada para gerar um valor de extensão de desvio de acordo com uma primeira razão e uma segunda razão, onde a primeira razão é uma razão de uma energia do sinal de banda alta de ruído para uma energia do sinal de banda baixa de ruído do quadro de ruído, e a segunda razão é uma razão de uma energia de um sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído no momento quando um SID que inclui um parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído; e determinar se o valor de extensão de desvio atinge um limite pré-ajustado; se sim, codificar um SID do sinal de banda alta de ruído utilizando a política para codificar o segundo SID, e enviar o SID; e se não, determinar que o sinal de banda alta de ruído não precisa ser codificado e transmitido.
[000195] Opcionalmente, que a primeira razão é uma razão de uma energia do sinal de banda alta de ruído para uma energia do sinal de banda baixa de ruído do quadro de ruído inclui que:
[000196] a primeira razão é uma razão de energia instantânea do sinal de banda alta de ruído para uma energia instantânea do sinal de banda baixa do ruído do quadro de ruído; e
[000197] correspondentemente, que a segunda razão é uma razão de uma energia de um sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído em um momento quando um SID que inclui um parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído inclui que:
[000198] a segunda razão é uma razão de uma energia instantânea do sinal de banda alta de ruído para uma energia instantânea do sinal de banda baixa de ruído no momento quando o SID que inclui o parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído.
[000199] Alternativamente que a primeira razão é uma razão de uma energia do sinal de banda alta de ruído para uma energia do sinal de banda baixa de ruído do quadro de ruído inclui que:
[000200] a primeira razão é uma razão de uma energia média ponderada de sinais de banda alta de ruído do quadro de ruído e um quadro de ruído antes do quadro de ruído para uma energia média ponderada de sinais de banda baixa de ruído do quadro de ruído e o quadro de ruído antes do quadro de ruído; e
[000201] correspondentemente, que a segunda razão é uma razão de uma energia de um sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído em um momento quando um SID que inclui um parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído inclui que:
[000202] a segunda razão é uma razão de uma energia média ponderada de sinais de banda alta para uma energia média ponderada de sinais de banda baixa de um quadro de ruído e um quadro de ruído antes do quadro de ruído no momento quanto o SID que inclui o parâmetro de banda alta de ruído é enviado a última vez antes do quadro de ruído.
[000203] Opcionalmente, nesta modalidade, a segunda unidade de transmissão 502b inclui:
[000204] uma subunidade de cálculo, configurada para separadamente calcular um valor logaritmo da primeira razão e um valor logaritmo da segunda razão; e calcular um valor absoluto de uma diferença entre o valor logaritmo da primeira razão e o valor logaritmo da segunda razão para obter o valor de extensão de desvio.
[000205] Referindo à Figura 6, opcionalmente, nesta modalidade, o módulo de transmissão 502 inclui:
[000206] uma terceira unidade de transmissão configurada para determinar se uma estrutura espectral do sinal de banda alta de ruído do quadro de ruído, em comparação com uma estrutura espectral média de sinais de banda alta de ruído antes do quadro de ruído, satisfaz uma condição pré-ajustada; se sim, codificar um SID do sinal de banda alta de ruído do quadro de ruído utilizando a política para codificar o segundo SID, e enviar o SID; e se não, determinar que o sinal de banda alta de ruído do quadro de ruído não precisa ser codificado e transmitido.
[000207] Nesta modalidade, opcionalmente, a estrutura espectral média dos sinais de banda alta de ruído antes do quadro de ruído inclui: uma média ponderada de espectros dos sinais de banda alta de ruído antes do quadro de ruído.
[000208] Opcionalmente, nesta modalidade, a condição de envio na política para enviar o segundo SID do segundo mecanismo de transmissão descontínua ainda inclui: o primeiro mecanismo de transmissão descontínua satisfazendo uma condição para enviar o primeiro SID.
[000209] A modalidade de aparelho provida pela presente invenção traz os seguintes efeitos benéficos: um quadro de ruído corrente de um sinal de áudio é obtido e o quadro de ruído corrente é decomposto em um sinal de banda baixa de ruído e um sinal de banda alta de ruído; então o sinal de banda baixa de ruído é codificado e transmitido utilizando um primeiro mecanismo de transmissão descontínua e o sinal de banda alta de ruído é codificado e transmitido utilizando um segundo mecanismo de transmissão descontínua. Deste modo, diferentes modos de processamento são utilizados para o sinal de banda alta e o sinal de banda baixa, a complexidade de cálculo pode ser reduzida e bits codificados podem ser economizados sob uma premissa de não diminuir a qualidade subjetiva de um codec, e os bits que são economizados ajudam a conseguir um objetivo de reduzir uma largura de banda de transmissão ou aperfeiçoar a qualidade de codificação total, por meio disto resolvendo um problema de codificação e transmissão de superbanda larga.
MODALIDADE 7
[000210] Referindo à Figura 7, está modalidade provê um aparelho para decodificar dados de áudio, onde o aparelho inclui: um módulo de obtenção 601, um primeiro módulo de decodificação 602, um segundo módulo de decodificação 603, e um terceiro módulo de decodificação 604.
[000211] O módulo de obtenção 601 esta configurado para determinar se um quadro de descritor de inserção de silêncio SID corrente inclui um parâmetro de banda baixa ou um parâmetro de banda alta.
[000212] O primeiro módulo de decodificação 602 está configurado para: se o SID obtido pelo módulo de obtenção 601 incluir um parâmetro de banda baixa, decodificar o SID para obter um parâmetro de banda baixa de ruído, localmente gerar um parâmetro de banda alta de ruído, e obter um primeiro quadro de ruído de conforto CN de acordo com o parâmetro de banda baixa de ruído obtido pela decodificação e o parâmetro de banda alta de ruído localmente gerado.
[000213] O segundo módulo de decodificação 603 está configurado para: se o SID obtido pelo módulo de obtenção 601 incluir o parâmetro de banda alta, decodificar o SID para obter um parâmetro de banda alta de ruído, localmente gerar um parâmetro de banda baixa de ruído, e obter um segundo quadro de CN de acordo com o parâmetro de banda alta de ruído obtido por decodificação e o parâmetro de banda baixa de ruído localmente gerado.
[000214] O terceiro módulo de decodificação 604 está configurado para: se o SID obtido pelo módulo de obtenção 601 incluir o parâmetro de banda alta e o parâmetro de banda baixa, decodificar o SID para obter um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, e obter um terceiro quadro de CN de acordo com o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído obtidos por decodificação.
[000215] Opcionalmente nesta modalidade, primeiro módulo de decodificação 602 está ainda configurado para: antes de decodificar o SID para obter um parâmetro de banda baixa de ruído, localmente gerar um parâmetro de banda alta de ruído, e obter um primeiro quadro de ruído de conforto CN de acordo com o parâmetro de banda baixa de ruído obtido por decodificação e o parâmetro de banda alta de ruído gerado, e ser o decodificador estiver em um primeiro estado de geração de ruído de conforto CNG, entrar, em um segundo estado de CNG.
[000216] Opcionalmente, nesta modalidade, o terceiro módulo de decodificação 604 está ainda configurado para: antes de decodificar o SID para obter um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, e obter um terceiro quadro de CN de acordo com o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído obtidos por decodificação, se o decodificador estiver em um segundo estado de CNG entrar em um primeiro estado de CNG.
[000217] Opcionalmente, o módulo de obtenção 601 inclui:
[000218] uma primeira unidade de confirmação, configurada para: se o número de bits do SID for menor do que um primeiro limite pré- ajustado, confirmar que o SID inclui o parâmetro de banda alta; se o número de bits do SID for maior do que um primeiro limite pré-ajustado e menor do que um segundo limite pré-ajustado, confirmar que o SID inclui o parâmetro de banda baixa; e se o número de bits do SID for maior do que um segundo limite pré-ajustado e menor do que um terceiro limite pré-ajustado, confirmar que o SID inclui o parâmetro de banda alta e o parâmetro de banda baixa; ou
[000219] uma segunda unidade de confirmação, configurada para: se o SID incluir um primeiro identificador, confirmar que o SID inclui o parâmetro de banda alta; se o SID incluir um segundo identificador, confirmar que o SID inclui o parâmetro de banda baixa; e se o SID incluir um terceiro identificador, confirmar que o SID incluir o parâmetro de banda baixa e o parâmetro de banda alta.
[000220] Nesta modalidade, o primeiro módulo de decodificação 602 inclui:
[000221] uma primeira unidade de obtenção, configurada para separadamente obter uma energia média ponderada de um sinal de banda alta de ruído e um coeficiente de filtro de síntese do sinal de banda alta de ruído em um momento que corresponde ao SID; e
[000222] uma segunda unidade de obtenção, configurada para obter o sinal de banda alta de ruído de acordo com a energia média ponderada obtida do sinal de banda alta de ruído e o coeficiente de filtro de síntese obtido do sinal de banda alta de ruído no momento que corresponde ao SID.
[000223] Opcionalmente, a primeira unidade de obtenção inclui:
[000224] uma primeira subunidade de obtenção, configurada para obter uma energia de um sinal de banda baixa do primeiro quadro de CN de acordo com o parâmetro de banda baixa de ruído obtido por decodificação;
[000225] uma subunidade de cálculo, configurada para calcular uma razão de uma energia de um sinal de banda alta de ruído para uma energia de um sinal de banda baixa de ruído em um momento quando um SID que inclui um parâmetro de banda alta é recebido antes do SID, para obter uma primeira razão;
[000226] uma segunda subunidade de obtenção, configurada para obter, de acordo com a energia do sinal de banda baixa do primeiro quadro de CN e a primeira razão, uma energia do sinal de banda alta de ruído no momento que corresponde ao SID; e
[000227] uma terceira subunidade de obtenção, configurada para executar uma média ponderada sobre a energia do sinal de banda alta de ruído no momento que corresponde ao SID e a energia de um sinal de banda alta de um quadro de CN localmente armazenado, para obter a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID onde a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID é uma energia de sinal de banda alta do primeiro quadro de CN.
[000228] A subunidade de cálculo está especificamente configurada para:
[000229] calcular uma razão de uma energia instantânea do sinal de banda alta de ruído para uma energia instantânea do sinal de banda baixa de ruído no momento quando o SID que inclui o parâmetro de banda alta é recebido antes do SID, para obter a primeira razão; ou
[000230] calcular uma razão de uma energia média ponderada do sinal de banda alta de ruído para uma energia média ponderada do sinal de banda baixa de ruído no momento quando o SID que inclui o parâmetro de banda alta é recebido antes do SID, para obter a primeira razão.
[000231] Quando a energia do sinal de banda alta de ruído no momento que corresponde ao SID é maior do que uma energia de um sinal de banda alta do quadro de CN anterior que está localmente armazenada, a energia do sinal de banda alta do quadro de CN anterior que está localmente armazenada é atualizada em uma primeira taxa; de outro modo, a energia do sinal de banda alta do quadro de CN anterior que está localmente armazenada é atualizada em uma segunda taxa, onde a primeira taxa é maior do que a segunda taxa.
[000232] Opcionalmente, a primeira unidade de obtenção inclui:
[000233] uma primeira subunidade de seleção, configurada para selecionar um sinal de banda alta de um quadro de voz com uma energia de sinal de banda alta mínima de quadros de voz dentro de um período de tempo pré-ajustado antes do SID, e obter, de acordo com uma energia do sinal de banda alta o quadro de voz com a mínima energia de sinal de banda alta entre os quadros de voz, a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID, onde a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID é uma energia de sinal de banda alta do primeiro quadro de CN; ou
[000234] uma segunda subunidade de seleção, configurada para selecionar os sinais de banda de N de quadros de voz com uma energia de sinal de banda alta menor do que um limite pré-ajustado dos quadros de voz dentro de um período de tempo pré-ajustado antes do SID; e obter, de acordo com uma energia média ponderada dos sinais de banda alta dos N quadros de voz, a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID, onde a energia média ponderada do sinal de banda alta de ruído no momento que corresponde ao SID é uma energia de sinal de banda alta do primeiro quadro de CN.
[000235] Opcionalmente, a primeira unidade de obtenção inclui:
[000236] uma subunidade de distribuição, configurada para distribuir M coeficientes de frequência espectral de imitância ISF ou coeficientes de par espectral de imitância ISP ou coeficientes de frequência espectral de linha LSF ou coeficientes de par espectral de linha LCP em uma faixa de frequência que corresponde a um sinal de banda alta;
[000237] uma primeira unidade de processamento de randomização, configurada para executar um processamento de randomização sobre os M coeficientes, onde uma característica da randomização é: fazer com que cada coeficiente entre os M coeficientes gradualmente aproximem de um valor alvo que corresponde a cada coeficiente onde o valor alvo é um valor em uma faixa pré-ajustada adjacente a um valor de coeficiente e o valor alvo de cada coeficiente entre os M coeficientes muda após cada N quadros, onde tanto M quanto N são números naturais; e
[000238] uma quarta subunidade de obtenção, configurada para obter, de acordo com os coeficientes de filtro obtidos pelo processamento de randomização, o coeficiente de filtro de síntese do sinal de banda alta de ruído no momento que corresponde ao SID.
[000239] Opcionalmente, a primeira unidade de obtenção inclui:
[000240] uma quinta subunidade de obtenção, configurada para obter M coeficientes de ISF ou coeficientes de ISP ou coeficientes de LSF ou coeficientes de LSP de um sinal de banda alta de ruído armazenado localmente;
[000241] uma segunda unidade de processamento de randomização, configurada para executar um processamento de randomização sobre os M coeficientes, onde uma característica da randomização é: fazer com que cada coeficiente entre os M coeficientes gradualmente se aproximem de um valor alvo que corresponde a cada coeficiente, onde o valor alvo é um valor em uma faixa pré-ajustada adjacente a um valor de coeficiente, e o valor alvo de cada coeficiente entre os M coeficientes muda após cada N quadros; e
[000242] uma sexta subunidade de obtenção, configurada para obter, de acordo com os coeficientes de filtro obtidos por processamento de randomização, o coeficiente de filtro de síntese do sinal de banda alta de ruído no momento que corresponde ao SID.
[000243] Referindo à Figura 8, opcionalmente, o aparelho ainda inclui:
[000244] um módulo de otimização 605 configurado para: antes do primeiro módulo de decodificação 602 obter o primeiro quadro de CN, quando os quadros históricos adjacentes ao SID são quadros de voz codificados, se uma energia média de sinais de banda alta ou uma parte de sinais de banda alta que são decodificados dos quadros de voz codificados for menor do que uma energia média de sinais de banda alta de ruído ou uma parte dos sinais de banda alta de ruído que são gerados localmente, multiplicar os sinais de banda alta de ruído de L quadros subsequentes começando do SID por um fator de uniformização menor do que 1, para obter uma nova energia média ponderada dos sinais de banda alta de ruído localmente gerados.
[000245] Correspondentemente, o primeiro módulo de decodificação 602 está especificamente configurado para obter um quarto quadro de CN de acordo com o parâmetro de banda baixa de ruído obtido por decodificação, o coeficiente de filtro de síntese do sinal de banda alta de ruído no momento que corresponde ao SID, e a nova energia média ponderada dos sinais de banda alta de ruído localmente gerados.
[000246] A modalidade de aparelho provida pela presente invenção traz os seguintes efeitos benéficos: Um decodificador obtém um quadro de descritor de inserção de silêncio SID, e determina se o SID inclui um parâmetro de banda baixa e/ou um parâmetro de banda alta; se o SID incluir o parâmetro de banda baixa, decodifica o SID para obter um parâmetro de banda baixa de ruído, localmente gera um parâmetro de banda alta de ruído, e obtém um primeiro quadro de ruído de conforto CN de acordo com o parâmetro de banda baixa de ruído obtido pela decodificação e o parâmetro de banda alta de ruído localmente gerado; se o SID incluir o parâmetro de banda alta, decodifica o SID para obter um parâmetro de banda alta de ruído, localmente gera um parâmetro de banda baixa de ruído, e obtém um segundo quadro de CN de acordo com o parâmetro de banda alta de ruído obtido pela decodificação e o parâmetro de banda baixa de ruído localmente gerado; e se o SID incluir o parâmetro de banda alta e o parâmetro de banda baixa, decodifica o SID para obter um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, e obtém um terceiro quadro de CN de acordo com o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído obtidos por decodificação. Deste modo, diferentes modos de processamento são utilizados para o sinal de banda alta e o sinal de banda baixa, a complexidade de cálculo pode ser reduzida e bits codificados podem ser economizados sob uma premissa de não diminuir a qualidade subjetiva de um codec, e os bits que são economizados ajudam a conseguir um objetivo de reduzir uma largura de banda de transmissão ou aperfeiçoar a qualidade de codificação total, por meio disto resolvendo um problema de codificação e transmissão de superbanda larga.
MODALIDADE 8
[000247] Referindo à Figura 9, esta modalidade provê um sistema para processar dados de áudio, onde o sistema inclui o aparelho 500 acima para codificar dados de áudio e o aparelho 600 acima para decodificar dados de áudio.
[000248] As soluções técnicas providas pelas modalidades da presente invenção trazem os seguintes efeitos benéficos: um quadro de ruído corrente de um sinal de áudio é obtido e o quadro de ruído corrente é decomposto em um sinal de banda baixa de ruído e um sinal de banda alta de ruído; então o sinal de banda baixa de ruído é codificado e transmitido utilizando um primeiro mecanismo de transmissão descontínua e o sinal de banda alta de ruído é codificado e transmitido utilizando um segundo mecanismo de transmissão descontínua. Um decodificador obtém um quadro de descritor de inserção de silêncio SID, e determina se o SID inclui um parâmetro de banda baixa e/ou um parâmetro de banda alta; se o SID incluir o parâmetro de banda baixa, decodifica o SID para obter um parâmetro de banda baixa de ruído, localmente gera um parâmetro de banda alta de ruído, e obtém um primeiro quadro de ruído de conforto CN de acordo com o parâmetro de banda baixa de ruído obtido pela decodificação e o parâmetro de banda alta de ruído localmente gerado; se o SID incluir o parâmetro de banda alta, decodifica o SID para obter um parâmetro de banda alta de ruído, localmente gera um parâmetro de banda baixa de ruído, e obtém um segundo quadro de CN de acordo com o parâmetro de banda alta de ruído obtido pela decodificação e o parâmetro de banda baixa de ruído localmente gerado; e se o SID incluir o parâmetro de banda alta e o parâmetro de banda baixa, decodifica o SID para obter um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, e obtém um terceiro quadro de CN de acordo com o parâmetro de banda alta de ruído e o parâmetro de banda baixa de ruído obtidos por decodificação. Deste modo, diferentes modos de processamento são utilizados para o sinal de banda alta e o sinal de banda baixa, a complexidade de cálculo pode ser reduzida e bits codificados podem ser economizados sob uma premissa de não diminuir a qualidade subjetiva de um codec, e os bits que são economizados ajudam a conseguir um objetivo de reduzir uma largura de banda de transmissão ou aperfeiçoar a qualidade de codificação total, por meio disto resolvendo um problema de codificação e transmissão de superbanda larga.
[000249] O aparelho e sistema providos pelas modalidades podem especificamente pertencer à mesma ideia que as modalidades de método. O processo de implementação específico do aparelho e sistema foi descrito em detalhes nas modalidades de método e os detalhes não são repetidamente aqui descritos.
[000250] O método e aparelho para processar dados de áudio nas modalidades acima podem ser aplicados a um codificador de áudio ou um decodificador de áudio. Codecs de áudio podem ser amplamente aplicados a vários dispositivos eletrônicos tal como um telefone móvel, um aparelho sem fio, um assistente de dados pessoal (PDA) um computador de mão ou portátil, um receptor de GPS ou dispositivo de navegação, uma câmera, um reprodutor de áudio / vídeo, uma camcorder, um gravador de vídeo, e um dispositivo de vigilância. Geralmente, tal dispositivo eletrônico inclui um codificador de áudio ou um decodificador de áudio. O codificador ou decodificador de áudio pode ser diretamente implementado utilizando um circuito digital ou chip, por exemplo, um DSP (processador de sinal digital), ou implementado utilizando um código de software para acionar um processador para executar um procedimento no código de software.
[000251] Uma pessoa versada na técnica pode compreender que todas ou uma parte das etapas das modalidades podem ser implementadas por hardware ou um programa que instrui um hardware relevante. O programa pode estar armazenado em um meio de armazenamento legível por computador. O meio de armazenamento pode incluir uma memória somente de leitura, um disco magnético, ou um disco ótico.

Claims (20)

1. Método para um codificador processar dados de áudio, caracterizado pelo fato de que compreende as etapas de: obter (101) um quadro de ruído atual de um sinal de áudio, em que o quadro de ruído atual inclui um sinal de banda baixa de ruído atual e um sinal de banda alta de ruído atual; determinar, de acordo com uma energia em domínio logarítmico do sinal de banda baixa de ruído atual, uma energia em domínio logarítmico do sinal de banda alta de ruído atual, uma energia em domínio logarítmico de um sinal de banda baixa de ruído anterior de um quadro de ruído anterior do sinal de áudio, e uma energia em domínio logarítmico de um sinal de banda alta de ruído anterior do quadro de ruído anterior, se codifica um primeiro quadro de descritor de inserção de silêncio (SID) correspondendo ao quadro de ruído atual ou um segundo SID correspondendo ao quadro de ruído atual, em que o primeiro SID compreende um parâmetro de banda baixa de ruído do sinal de banda baixa de ruído atual e um parâmetro de banda alta de ruído do sinal de banda alta de ruído atual, em que o segundo SID compreende o parâmetro de banda baixa de ruído do sinal de banda baixa de ruído atual, o segundo SID não compreendendo o parâmetro de banda alta de ruído do sinal de banda alta de ruído atual, em que o quadro de ruído anterior é prévio ao quadro de ruído atual no sinal de áudio, em que o quadro de ruído anterior correspondendo a um SID compreendendo um parâmetro de banda alta de ruído do sinal de banda alta de ruído anterior e um parâmetro de banda baixa de ruído do sinal de banda baixa de ruído anterior foi transmitido, em que quando o quadro de ruído anterior não é adjacente ao quadro de ruído atual, nenhum SID compreendendo um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído foi transmitido entre o quadro de ruído anterior e o quadro de ruído atual; e codificar (102) o primeiro SID ou o segundo SID de acordo com a etapa de determinar.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a energia em domínio logarítmico do sinal de banda baixa de ruído atual é representada por uma energia média alisada em domínio logarítmico do sinal de banda baixa de ruído atual, em que a energia em domínio logarítmico do sinal de banda alta de ruído atual é representada por uma energia média alisada em domínio logarítmico do sinal de banda alta de ruído atual, em que a energia em domínio logarítmico do sinal de banda baixa de ruído anterior é representada por uma energia média alisada em domínio logarítmico do sinal de banda baixa de ruído anterior, e em que a energia em domínio logarítmico do sinal de banda alta de ruído anterior é representada por uma energia média alisada em domínio logarítmico do sinal de banda alta de ruído anterior.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a energia média alisada em domínio logarítmico do sinal de banda baixa de ruído atual é obtida de acordo com a energia média alisada em domínio logarítmico do sinal de banda baixa de ruído anterior e uma energia média em domínio logarítmico do sinal de banda baixa de ruído atual; e em que a energia média alisada em domínio logarítmico do sinal de banda alta de ruído atual é obtida de acordo com a energia média alisada em domínio logarítmico do sinal de banda alta de ruído anterior e uma energia média em domínio logarítmico do sinal de banda alta de ruído atual.
4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa de determinar se codifica um primeiro SID correspondendo ao quadro de ruído atual ou um segundo SID correspondendo ao quadro de ruído atual compreende: obter uma primeira diferença entre a energia em domínio logarítmico do sinal de banda baixa de ruído atual e a energia em domínio logarítmico do sinal de banda alta de ruído atual; obter uma segunda diferença entre a energia em domínio logarítmico do sinal de banda baixa de ruído anterior e a energia em domínio logarítmico do sinal de banda alta de ruído anterior; obter uma terceira diferença entre a primeira diferença e a segunda diferença, e comparar um valor absoluto da terceira diferença com um limite pré-ajustado, em que o primeiro SID é codificado quando o valor absoluto da terceira diferença é maior do que o limite pré-ajustado, e em que o segundo SID é codificado quando o valor absoluto da terceira diferença é menor do que ou igual ao limite pré-ajustado.
5. Método para processar um sinal de áudio, caracterizado pelo fato de que compreende as etapas de: receber, por um decodificador, um quadro de descritor de inserção de silêncio (SID) atual do sinal de áudio, em que o SID atual compreende um parâmetro de banda baixa de ruído; determinar que o SID atual não compreende um parâmetro de banda alta de ruído; extrapolar um parâmetro de banda alta de ruído do SID atual de acordo como parâmetro de banda baixa de ruído do SID atual e uma razão de uma energia de um sinal de banda alta de ruído anterior de um quadro de ruído anterior do sinal de áudio para uma energia de um sinal de banda baixa de ruído anterior do quadro de ruído anterior, em que o quadro de ruído anterior é prévio ao SID atual no sinal de áudio, em que o quadro de ruído anterior correspondendo a um SID recebido anterior compreendendo um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, em que quando o SID recebido anterior não é adjacente ao SID atual, nenhum SID compreendendo um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído foi recebido entre o SID recebido anterior e o SID atual; e obter um quadro de ruído atual de acordo com o parâmetro de banda baixa de ruído do SID atual e o parâmetro de banda alta de ruído extrapolado do SID atual.
6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que se o SID atual compreende um parâmetro de banda alta de ruído é determinado com base em um primeiro identificador ou um segundo identificador indicado por um bit do SID atual, em que o SID atual compreende o parâmetro de banda alta de ruído quando o SID atual compreende o primeiro identificador e em que o SID atual não compreende o parâmetro de banda alta de ruído quando o SID atual compreende o segundo identificador.
7. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que o parâmetro de banda alta de ruído do SID atual é extrapolado ao: obter, de acordo com o parâmetro de banda baixa de ruído do SID atual e a razão, uma energia média ponderada de um sinal de banda alta de ruído atual correspondendo ao SID atual; obter um coeficiente de filtro de síntese do sinal de banda alta de ruído atual; e obter o parâmetro de banda alta de ruído do SID atual de acordo com a energia média ponderada obtida do sinal de banda alta de ruído atual e o coeficiente de filtro de síntese obtido do sinal de banda alta de ruído atual.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que obter a energia média ponderada do sinal de banda alta de ruído atual compreende: obter uma energia de um sinal de banda baixa atual correspondendo ao SID atual de acordo com o parâmetro de banda baixa de ruído do SID atual; obter, de acordo com a energia do sinal de banda baixa atual e a razão, uma energia do sinal de banda alta de ruído atual; e obter, de acordo com a energia do sinal de banda alta de ruído atual, a energia média ponderada do sinal de banda alta de ruído.
9. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que a razão é obtida em domínio logarítmico, e em que a razão é representada por uma diferença entre uma energia em domínio logarítmico do sinal de banda alta de ruído anterior e uma energia em domínio logarítmico do sinal de banda baixa de ruído anterior.
10. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que o método ainda compreende: multiplicar sinais de banda alta de ruído de L quadros subsequentes começando do SID atual por um fator de alisamento para obter uma nova energia média ponderada dos sinais de banda alta de ruído extrapolados, em que quadros históricos adjacentes ao SID atual são quadros de fala codificados, em que o fator de alisamento é maior do que 0 e menor do que 1, em que uma parte dos sinais de banda alta que são codificados a partir dos quadros de fala codificados ou uma energia média de sinais de banda alta é menor do que uma parte dos sinais de banda alta de ruído que são extrapolados ou uma energia média de sinais de banda alta de ruído, e em que o quadro de ruído atual é obtido com base no parâmetro de banda baixa de ruído decodificado, no coeficiente de filtro de síntese do sinal de banda alta de ruído atual, e na nova energia média ponderada dos sinais de banda alta de ruído extrapolados.
11. Codificador, caracterizado pelo fato de que compreende: uma memória não transitória para armazenar instruções executáveis por computador; e um processador acoplado de maneira operacional à memória não transitória, em que o processador é configurado para executar as instruções executáveis por computador para: obter um quadro de ruído atual de um sinal de áudio, em que o quadro de ruído atual inclui um sinal de banda baixa de ruído atual e um sinal de banda alta de ruído atual; determinar, de acordo com uma energia em domínio logarítmico do sinal de banda baixa de ruído atual, uma energia em domínio logarítmico do sinal de banda alta de ruído atual, uma energia em domínio logarítmico de um sinal de banda baixa de ruído anterior de um quadro de ruído anterior do sinal de áudio, e uma energia em domínio logarítmico de um sinal de banda alta de ruído anterior do quadro de ruído anterior, se codifica um primeiro quadro de descritor de inserção de silêncio (SID) correspondendo ao quadro de ruído atual ou um segundo SID correspondendo ao quadro de ruído atual, em que o primeiro SID compreende um parâmetro de banda baixa de ruído do sinal de banda baixa de ruído atual e um parâmetro de banda alta de ruído do sinal de banda alta de ruído atual, em que o segundo SID compreende o parâmetro de banda baixa de ruído do sinal de banda baixa de ruído atual, o segundo SID não compreendendo o parâmetro de banda alta de ruído do sinal de banda alta de ruído atual, em que o quadro de ruído anterior é prévio ao quadro de ruído atual no sinal de áudio, em que o quadro de ruído anterior correspondendo a um SID compreendendo um parâmetro de banda alta de ruído do sinal de banda alta de ruído anterior e um parâmetro de banda baixa de ruído do sinal de banda baixa de ruído anterior foi transmitido, em que quando o quadro de ruído anterior não é adjacente ao quadro de ruído atual, nenhum SID compreendendo um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído foi transmitido entre o quadro de ruído anterior e o quadro de ruído atual; e codificar o primeiro SID ou o segundo SID de acordo com a determinação.
12. Método, de acordo com a reivindicação 11, caracterizado pelo fato de que a energia em domínio logarítmico do sinal de banda baixa de ruído atual é representada por uma energia média alisada em domínio logarítmico do sinal de banda baixa de ruído atual, em que a energia em domínio logarítmico do sinal de banda alta de ruído atual é representada por uma energia média alisada em domínio logarítmico do sinal de banda alta de ruído atual, em que a energia em domínio logarítmico do sinal de banda baixa de ruído anterior é representada por uma energia média alisada em domínio logarítmico do sinal de banda baixa de ruído anterior, e em que a energia em domínio logarítmico do sinal de banda alta de ruído anterior é representada por uma energia média alisada em domínio logarítmico do sinal de banda alta de ruído anterior.
13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a energia média alisada em domínio logarítmico do sinal de banda baixa de ruído atual é obtida de acordo com a energia média alisada em domínio logarítmico do sinal de banda baixa de ruído anterior e uma energia média em domínio logarítmico do sinal de banda baixa de ruído atual; e em que a energia média alisada em domínio logarítmico do sinal de banda alta de ruído atual é obtida de acordo com a energia média alisada em domínio logarítmico do sinal de banda alta de ruído anterior e uma energia média em domínio logarítmico do sinal de banda alta de ruído atual.
14. Método, de acordo com a reivindicação 11, caracterizado pelo fato de que ao determinar se codifica um primeiro SID correspondendo ao quadro de ruído atual ou um segundo SID correspondendo ao quadro de ruído atual, o processador é ainda configurado para executar as instruções executáveis por computador para: obter uma primeira diferença entre a energia em domínio logarítmico do sinal de banda baixa de ruído atual e a energia em domínio logarítmico do sinal de banda alta de ruído atual; obter uma segunda diferença entre a energia em domínio logarítmico do sinal de banda baixa de ruído anterior e a energia em domínio logarítmico do sinal de banda alta de ruído anterior; obter uma terceira diferença entre a primeira diferença e a segunda diferença, e comparar um valor absoluto da terceira diferença com um limite pré-ajustado, em que determina que o primeiro SID é codificado quando o valor absoluto da terceira diferença é maior do que o limite pré-ajustado, e em que o segundo SID é codificado quando o valor absoluto da terceira diferença é menor do que ou igual ao limite pré-ajustado.
15. decodificador, caracterizado pelo fato de que compreende: uma memória não transitória para armazenar instruções executáveis por computador; e um processador acoplado de maneira operacional à memória não transitória, em que o processador é configurado para executar as instruções executáveis por computador para: receber um quadro de descritor de inserção de silêncio (SID) atual do sinal de áudio, em que o SID atual compreende um parâmetro de banda baixa de ruído; determinar que o SID atual não compreende um parâmetro de banda alta de ruído; extrapolar um parâmetro de banda alta de ruído do SID atual de acordo como parâmetro de banda baixa de ruído do SID atual e uma razão de uma energia de um sinal de banda alta de ruído anterior de um quadro de ruído anterior do sinal de áudio para uma energia de um sinal de banda baixa de ruído anterior do quadro de ruído anterior, em que o quadro de ruído anterior é prévio ao SID atual no sinal de áudio, em que o quadro de ruído anterior correspondendo a um SID recebido anterior compreendendo um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído, em que quando o SID recebido anterior não é adjacente ao SID atual, nenhum SID compreendendo um parâmetro de banda alta de ruído e um parâmetro de banda baixa de ruído foi recebido entre o SID recebido anterior e o SID atual; e obter um quadro de ruído atual de acordo com o parâmetro de banda baixa de ruído do SID atual e o parâmetro de banda alta de ruído extrapolado do SID atual.
16. Método, de acordo com a reivindicação 15, caracterizado pelo fato de que se o SID atual compreende um parâmetro de banda alta de ruído é determinado com base em um primeiro identificador ou um segundo identificador indicado por um bit do SID atual, em que o SID atual compreende o parâmetro de banda alta de ruído quando o SID atual compreende o primeiro identificador e em que o SID atual não compreende o parâmetro de banda alta de ruído quando o SID atual compreende o segundo identificador.
17. Método, de acordo com a reivindicação 15, caracterizado pelo fato de que ao extrapolar o parâmetro de banda alta de ruído do SID atual, o processador é ainda configurado para executar as instruções executáveis por computador para: obter, de acordo com o parâmetro de banda baixa de ruído do SID atual e a razão, uma energia média ponderada de um sinal de banda alta de ruído atual correspondendo ao SID atual; obter um coeficiente de filtro de síntese do sinal de banda alta de ruído atual; e obter o parâmetro de banda alta de ruído do SID atual de acordo com a energia média ponderada obtida do sinal de banda alta de ruído atual e o coeficiente de filtro de síntese obtido do sinal de banda alta de ruído atual.
18. Método, de acordo com a reivindicação 17, caracterizado pelo fato de que ao obter a energia média ponderada do sinal de banda alta de ruído atual, o processador é ainda configurado para executar as instruções executáveis por computador para: obter uma energia de um sinal de banda baixa atual correspondendo ao SID atual de acordo com o parâmetro de banda baixa de ruído do SID atual; obter, de acordo com a energia do sinal de banda baixa atual e a razão, uma energia do sinal de banda alta de ruído atual; e obter, de acordo com a energia do sinal de banda alta de ruído atual, a energia média ponderada do sinal de banda alta de ruído.
19. Método, de acordo com a reivindicação 18, caracterizado pelo fato de que a razão é obtida em domínio logarítmico, e em que a razão é representada por uma diferença entre uma energia em domínio logarítmico do sinal de banda alta de ruído anterior e uma energia em domínio logarítmico do sinal de banda baixa de ruído anterior.
20. Método, de acordo com a reivindicação 17, caracterizado pelo fato de que o processador é ainda configurado para executar as instruções executáveis por computador para: multiplicar sinais de banda alta de ruído de L quadros subsequentes começando do SID atual por um fator de alisamento para obter uma nova energia média ponderada dos sinais de banda alta de ruído extrapolados, em que quadros históricos adjacentes ao SID atual são quadros de fala codificados, em que o fator de alisamento é maior do que 0 e menor do que 1, em que uma parte dos sinais de banda alta que são codificados a partir dos quadros de fala codificados ou uma energia média de sinais de banda alta é menor do que uma parte dos sinais de banda alta de ruído que são extrapolados ou uma energia média de sinais de banda alta de ruído, e em que o quadro de ruído atual é obtido com base no parâmetro de banda baixa de ruído decodificado, no coeficiente de filtro de síntese do sinal de banda alta de ruído atual, e na nova energia média ponderada dos sinais de banda alta de ruído extrapolados.
BR112014016153-4A 2011-12-30 2012-12-28 método para um codificador processar dados de áudio, método para processar um sinal de áudio, codificador e decodificador BR112014016153B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201110455836.7A CN103187065B (zh) 2011-12-30 2011-12-30 音频数据的处理方法、装置和系统
CN201110455836.7 2011-12-30
PCT/CN2012/087812 WO2013097764A1 (zh) 2011-12-30 2012-12-28 音频数据的处理方法、装置和系统

Publications (3)

Publication Number Publication Date
BR112014016153A2 BR112014016153A2 (pt) 2017-06-13
BR112014016153A8 BR112014016153A8 (pt) 2017-07-04
BR112014016153B1 true BR112014016153B1 (pt) 2021-01-12

Family

ID=48678198

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112014016153-4A BR112014016153B1 (pt) 2011-12-30 2012-12-28 método para um codificador processar dados de áudio, método para processar um sinal de áudio, codificador e decodificador

Country Status (18)

Country Link
US (6) US9406304B2 (pt)
EP (1) EP2793227B1 (pt)
JP (2) JP6072068B2 (pt)
KR (2) KR101693280B1 (pt)
CN (1) CN103187065B (pt)
AU (1) AU2012361423B2 (pt)
BR (1) BR112014016153B1 (pt)
CA (3) CA3059322C (pt)
ES (1) ES2610783T3 (pt)
HK (1) HK1199543A1 (pt)
IN (1) IN2014KN01436A (pt)
MX (1) MX338445B (pt)
MY (1) MY173976A (pt)
PT (1) PT2793227T (pt)
RU (3) RU2579926C1 (pt)
SG (2) SG10201609338SA (pt)
WO (1) WO2013097764A1 (pt)
ZA (2) ZA201404996B (pt)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
CN104217723B (zh) * 2013-05-30 2016-11-09 华为技术有限公司 信号编码方法及设备
US9136763B2 (en) * 2013-06-18 2015-09-15 Intersil Americas LLC Audio frequency deadband system and method for switch mode regulators operating in discontinuous conduction mode
CN111710342B (zh) * 2014-03-31 2024-04-16 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序
US10163453B2 (en) 2014-10-24 2018-12-25 Staton Techiya, Llc Robust voice activity detector system for use with an earphone
GB2532041B (en) * 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation
CN105681512B (zh) * 2016-02-25 2019-02-01 Oppo广东移动通信有限公司 一种降低语音通话功耗的方法及装置
CN105721656B (zh) * 2016-03-17 2018-10-12 北京小米移动软件有限公司 背景噪声生成方法及装置
EP3334079B1 (en) 2016-12-12 2019-06-19 Kyynel Oy Versatile channel selection procedure for wireless network
US10504538B2 (en) * 2017-06-01 2019-12-10 Sorenson Ip Holdings, Llc Noise reduction by application of two thresholds in each frequency band in audio signals
US10540983B2 (en) * 2017-06-01 2020-01-21 Sorenson Ip Holdings, Llc Detecting and reducing feedback
GB2595891A (en) * 2020-06-10 2021-12-15 Nokia Technologies Oy Adapting multi-source inputs for constant rate encoding
CN113571072B (zh) * 2021-09-26 2021-12-14 腾讯科技(深圳)有限公司 一种语音编码方法、装置、设备、存储介质及产品

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7103065B1 (en) * 1998-10-30 2006-09-05 Broadcom Corporation Data packet fragmentation in a cable modem system
US6424938B1 (en) 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
AR024520A1 (es) * 1998-11-24 2002-10-16 Ericsson Telefon Ab L M Metodo para realizar la transmision discontinua (dtx) en un sistema de comunicaciones, metodo para transmitir mensajes de protocolo a un segundo componente en un sistema de comunicaciones donde datos de habla son transmitidos desde un primer componente a un segungo componente, metodo de efectuar cam
US6549587B1 (en) * 1999-09-20 2003-04-15 Broadcom Corporation Voice and data exchange over a packet based network with timing recovery
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6522746B1 (en) * 1999-11-03 2003-02-18 Tellabs Operations, Inc. Synchronization of voice boundaries and their use by echo cancellers in a voice processing system
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
US7920697B2 (en) 1999-12-09 2011-04-05 Broadcom Corp. Interaction between echo canceller and packet voice processing
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
US6691805B2 (en) 2001-08-27 2004-02-17 Halliburton Energy Services, Inc. Electrically conductive oil-based mud
US7319703B2 (en) * 2001-09-04 2008-01-15 Nokia Corporation Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts
US20030093270A1 (en) * 2001-11-13 2003-05-15 Domer Steven M. Comfort noise including recorded noise
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
FR2859566B1 (fr) * 2003-09-05 2010-11-05 Eads Telecom Procede de transmission d'un flux d'information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre
JP4572123B2 (ja) * 2005-02-28 2010-10-27 日本電気株式会社 音源供給装置及び音源供給方法
CN101087319B (zh) * 2006-06-05 2012-01-04 华为技术有限公司 一种发送和接收背景噪声的方法和装置及静音压缩系统
US7809559B2 (en) * 2006-07-24 2010-10-05 Motorola, Inc. Method and apparatus for removing from an audio signal periodic noise pulses representable as signals combined by convolution
US8725499B2 (en) 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
JP2008139447A (ja) * 2006-11-30 2008-06-19 Mitsubishi Electric Corp 音声符号化装置及び音声復号装置
US8032359B2 (en) * 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
CN101246688B (zh) 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
CN101320563B (zh) * 2007-06-05 2012-06-27 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
KR101290622B1 (ko) * 2007-11-02 2013-07-29 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 복호화 방법 및 장치
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
DE102008009719A1 (de) 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
DE102008009718A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN101483495B (zh) * 2008-03-20 2012-02-15 华为技术有限公司 一种背景噪声生成方法以及噪声处理装置
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
CN102792760B (zh) * 2010-02-25 2015-08-12 瑞典爱立信有限公司 为音乐关闭dtx
US20110228946A1 (en) * 2010-03-22 2011-09-22 Dsp Group Ltd. Comfort noise generation method and system
JP2012215198A (ja) * 2011-03-31 2012-11-08 Showa Corp 回転構造体
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
AU2013366642B2 (en) * 2012-12-21 2016-09-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals

Also Published As

Publication number Publication date
CA2861916C (en) 2019-11-19
MY173976A (en) 2020-03-02
EP2793227A1 (en) 2014-10-22
US9892738B2 (en) 2018-02-13
IN2014KN01436A (pt) 2015-10-23
CN103187065B (zh) 2015-12-16
PT2793227T (pt) 2016-12-29
SG10201609338SA (en) 2016-12-29
CN103187065A (zh) 2013-07-03
MX338445B (es) 2016-04-15
RU2617926C1 (ru) 2017-04-28
EP2793227A4 (en) 2015-03-18
HK1199543A1 (en) 2015-07-03
EP2793227B1 (en) 2016-10-26
WO2013097764A1 (zh) 2013-07-04
ES2610783T3 (es) 2017-05-03
CA3059322A1 (en) 2013-07-04
CA3181066A1 (en) 2013-07-04
US20140316774A1 (en) 2014-10-23
US20160300578A1 (en) 2016-10-13
CA2861916A1 (en) 2013-07-04
MX2014007968A (es) 2015-01-26
CA3059322C (en) 2023-01-10
AU2012361423A1 (en) 2014-07-31
AU2012361423B2 (en) 2016-01-28
ZA201404996B (en) 2016-06-29
US10529345B2 (en) 2020-01-07
KR101693280B1 (ko) 2017-01-05
SG11201403686SA (en) 2014-10-30
RU2579926C1 (ru) 2016-04-10
US20220044692A1 (en) 2022-02-10
US20180137869A1 (en) 2018-05-17
US11727946B2 (en) 2023-08-15
BR112014016153A2 (pt) 2017-06-13
US11183197B2 (en) 2021-11-23
JP6462653B2 (ja) 2019-01-30
US20200098378A1 (en) 2020-03-26
US20230352035A1 (en) 2023-11-02
BR112014016153A8 (pt) 2017-07-04
KR20170002704A (ko) 2017-01-06
ZA201600247B (en) 2016-03-30
JP2017062512A (ja) 2017-03-30
KR20140109456A (ko) 2014-09-15
KR101770237B1 (ko) 2017-08-22
US9406304B2 (en) 2016-08-02
RU2641464C1 (ru) 2018-01-17
JP2015507764A (ja) 2015-03-12
JP6072068B2 (ja) 2017-02-01

Similar Documents

Publication Publication Date Title
BR112014016153B1 (pt) método para um codificador processar dados de áudio, método para processar um sinal de áudio, codificador e decodificador
JP6937877B2 (ja) 信号符号化及び復号化方法及び装置
JP6474874B2 (ja) ハーモニックオーディオ信号の帯域幅拡張
US20140358527A1 (en) Inactive Sound Signal Parameter Estimation Method and Comfort Noise Generation Method and System
WO2023197809A1 (zh) 一种高频音频信号的编解码方法和相关装置

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 28/12/2012, OBSERVADAS AS CONDICOES LEGAIS.