BRPI0720266A2 - Dispositivo de decodificação de aúdio e método de ajuste de potência - Google Patents

Dispositivo de decodificação de aúdio e método de ajuste de potência Download PDF

Info

Publication number
BRPI0720266A2
BRPI0720266A2 BRPI0720266-0A BRPI0720266A BRPI0720266A2 BR PI0720266 A2 BRPI0720266 A2 BR PI0720266A2 BR PI0720266 A BRPI0720266 A BR PI0720266A BR PI0720266 A2 BRPI0720266 A2 BR PI0720266A2
Authority
BR
Brazil
Prior art keywords
adjustment
coefficient
value
section
signal
Prior art date
Application number
BRPI0720266-0A
Other languages
English (en)
Inventor
Toshiyuki Morii
Masahiro Oshikiri
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Publication of BRPI0720266A2 publication Critical patent/BRPI0720266A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

Relatório Descritivo da Patente de Invenção para "DISPOSITIVO DE DECODIFICAÇÃO DE ÁUDIO E MÉTODO DE AJUSTE DE POTÊN- CIA".
CAMPO TÉCNICO
A presente invenção refere-se a um aparelho de decodificação de fala e a um método de ajuste de potência para decodificar um sinal de fala codificado. TÉCNICA ANTECEDENTE
Em comunicação móvel, é necessário comprimir e codificar in- formação digital, tais como fala e imagens, para eficientemente utilizar a ca- pacidade de canal de rádio e um meio de armazenamento. Por isso, até ago- ra, foram desenvolvidos muitos esquemas de codificação/decodificação.
Dentre estas técnicas, o desempenho da técnica de codificação de fala foi significativamente aperfeiçoado graças ao esquema fundamental "CELP" (Code Excited Linear Prediction) de engenhosamente aplicar a quantização de vetor por meio da modelagem do sistema de trato vocal. A- lém disso, o desempenho de uma técnica de codificação de som, tal como a codificação de áudio, foi significativamente aperfeiçoado graças à transfor- mação das técnicas de codificação (padrão MPEG ACC, MP3 e semelhan- te).
Aqui, como processamento subseqüente a um decodificador de uma baixa taxa de bits, a pós-filtragem é geralmente aplicada ao som sinteti- zado antes de o som sintetizado ser emitido. Quase todos os codecs (codifi- cadores/decodificadores) padrões para telefones móveis usam esta pós- filtragem. A pós-filtragem para CELP usa um filtro de ênfase de pólo tipo de pólo-zero (isto é, tipo ARMA) que usa parâmetros LPC, um filtro de ênfase de banda de alta freqüência e um filtro de passo.
Entretanto, quando da execução de processamento de ênfase por um pós-filtro, a potência de um sinal de saída do pós-filtro irá flutuar comparada a um sinal de entrada. Por isso, é necessário casar a potência do sinal de saída do pós-filtro com o sinal de entrada.
A potência deste sinal de saída do pós-filtro é ajustada com a descoberta da razão de potência do sinal de entrada e do sinal de saída de um pós-filtro, com a descoberta de coeficientes de ajuste com base na razão de potência e com a multiplicação do sinal de saída do pós-filtro pelos coefi- cientes de ajuste.
O Documento de Patente 1 e o Documento de Patente 2 descre-
vem técnicas para encontrar coeficientes de ajuste e usar coeficientes de retificação, de tal modo que a potência seja gradualmente ajustada em uma base por amostra. Além disso, quando os coeficientes de retificação forem a, (1-a) será coeficiente de aceleração. Documento de Patente 1: Pedido de Patente Japonês Aberto a
inspeção pública N0 HEI9-190195
Documento de Patente 2: Pedido de Patente Japonês Aberto a inspeção pública N0 HEI9-127996. DESCRIÇÃO DA INVENÇÃO PROBLEMAS A SEREM SOLUCIONADOS PELA INVENÇÃO
Um pós-filtro provê um ganho de filtro significativo na porção on- de a potência é elevada, tal como na porção inicial de fala, e a potência do sinal de saída do pós-filtro será provavelmente aumentada repentinamente de modo significativo do que a potência do sinal de entrada, sendo, portanto, necessário que, neste caso, os coeficientes de ajuste de potência sejam a- daptados prontamente. Além disso, quando a razão de potência de entra- da/saída do pós-filtro flutuar significativamente no decorrer do tempo, o ajus- te se fará prontamente necessário. Em contraste com isto, se os coeficientes de ajuste forem mudados repentinamente em um período no qual a flutuação de potência de entrada/saída do pós-filtro é pequena ou em um período de fala estacionária, tais como vogais, a distorção da qualidade do som causará um problema e, consequentemente, os coeficientes de ajuste serão preferi- velmente adaptados de maneira lenta.
Contudo, com qualquer das técnicas convencionais acima, os coeficientes de retificação serão fixos e a extensão de mudança dos coefici- entes de ajuste será constante em uma base por condição. Consequente- mente, de acordo com técnicas convencionais, não é possível produzir um bom som sintetizado com um volume de som estável.
Por conseguinte, é um objetivo da presente invenção o de prover um aparelho de decodificação de fala e um método de ajuste de potência para produzir um bom som sintetizado com um volume de som estável.
MEIOS PARA SOLUCIONAR O PROBLEMA
Um aparelho de decodificação de fala de acordo com a presente invenção emprega uma configuração que inclui: um pós-filtro que aplica fil- tragem a um sinal de um comprimento de subquadro em intervalos de sin- cronização de amostra predeterminados; uma seção de cálculo que calcula um primeiro valor de cálculo e um segundo valor de cálculo em uma base por subquadro, o primeiro valor de cálculo incluindo uma razão de amplitude ou uma razão de potência de um sinal de entrada e de um sinal de saída do pós-filtro, o segundo valor de cálculo incluindo uma quantidade de flutuação do primeiro valor de cálculo; uma seção de ajuste de coeficiente de retifica- ção que ajusta um coeficiente de retificação em uma base por subquadro no primeiro valor de cálculo e no segundo valor de cálculo; uma seção de ajuste de coeficiente de ajuste que ajusta um coeficiente de ajuste em uma base por amostra com base no primeiro valor de cálculo e no coeficiente de retifi- cação; e uma seção de ajuste de potência que adquire um sinal de fala de- codificado com a multiplicação do sinal de saída do pós-filtro pelo coeficiente de ajuste.
Um método de ajuste de potência de acordo com a presente in- venção para um sinal de saída de um pós-filtro para aplicar a filtragem a um sinal de um comprimento de subquadro em intervalos de temporização de amostra predeterminados inclui: o cálculo de um primeiro valor de cálculo e de um segundo valor de cálculo em uma base por subquadro, o primeiro va- lor de cálculo incluindo uma razão de amplitude ou uma razão de potência de um sinal de entrada e do sinal de saída do pós-filtro, o segundo valor de cálculo incluindo uma quantidade de flutuação do primeiro valor de cálculo; o ajuste de um coeficiente de retificação em uma base por subquadro com base no primeiro valor de cálculo e no segundo valor de cálculo; o ajuste de um coeficiente de ajuste em uma base por amostra com base no primeiro valor de cálculo e no coeficiente de retificação; e a multiplicação do sinal de saída do pós-filtro pelo coeficiente de ajuste. EFEITO VANTAJOSO DA INVENÇÃO
De acordo com a presente invenção, é possível ajustar a potên- cia prontamente, quando da mudança significativa de potência de um pós- filtro ou da flutuação significativa da razão de potência no decorrer do tempo, e realizar o ajuste de potência suave sem descontinuidade em um período no qual o pós-filtro flutua potência em pequena escala ou em um período estacionário, por exemplo, de vogais. Consequentemente, é possível produ- zir um bom som sintetizado com um volume de som estável de acordo com a presente invenção.
BREVE DESCRIÇÃO DOS DESENHOS
A figura 1 é um diagrama de bloco que mostra uma configuração de um aparelho de codificação de fala que transmite dados codificados para um aparelho de decodificação de fala, de acordo com uma concretização da presente invenção.
A figura 2 é um diagrama de bloco que mostra uma configuração do aparelho de decodificação de fala, de acordo com uma concretização da presente invenção.
A figura 3 é um fluxograma que explica um algoritmo de ajuste
de potência no aparelho de decodificação de fala, de acordo com uma con- cretização da presente invenção.
E a figura 4 é um fluxograma que explica um algoritmo de ajuste de potência no aparelho de decodificação de fala, de acordo com uma concretização da presente invenção.
MELHOR MODO PARA SE EXECUTAR A INVENÇÃO
Uma concretização da presente invenção será explicada abaixo com referência aos desenhos anexos.
A figura 1 é um diagrama de bloco que mostra uma configuração de um aparelho de codificação de fala que transmite dados codificados para um aparelho de decodificação de fala, de acordo com a presente concretiza- ção. A seção de pré-processamento 101 executa o processamento de filtragem de passagem de freqüências elevadas para remover os compo- nentes CC e o processamento de formação de forma de onda ou processa- mento de pré-ênfase para aperfeiçoar o desempenho de processamento de codificação subseqüente, com relação a um sinal de fala de entrada, e emite o sinal (Xin) depois destes processamentos, para a seção de análise LPC 102 e a seção de acréscimo 105.
A seção de análise LPC 102 executa uma análise de prognóstico linear usando Xin, e emite o resultado da análise (isto é, os coeficientes de prognóstico linear) para a seção de quantização LPC 103. A seção de quan- tização LPC 103 executa o processamento de quantização de coeficientes de prognóstico linear (LPCs) emitidos da seção de análise LPC 102, e emite os LPC's quantizados para o filtro de síntese 104 e um código (L) represen- tando os LPC's quantizados para a seção de multiplexação 114. O filtro de síntese 104 executa a síntese de filtro para uma exci-
tação emitida da seção de acréscimo 111 (explicado posteriormente) usando coeficientes de filtro com base nos LPC's quantizados, para gerar um sinal sintetizado e emitir o sinal sintetizado para a seção de acréscimo 105.
A seção de acréscimo 105 inverte a polaridade do sinal sinteti- zado e acrescenta o sinal para o Xin para calcular um sinal de erro, e emite o sinal de erro para a seção de pesagem perceptual 112.
O codebook de excitação adaptável 106 armazena excitações passadas emitidas da seção de acréscimo 111 em um buffer, corta um qua- dro de amostras das excitações passadas como um vetor de excitação adp- tável que é especificado por um sinal emitido da seção de determinação de parâmetro 113, e emite o vetor de excitação adaptável para a seção de mul- tiplicação 109.
O codebook de ganho 107 emite o ganho do vetor de excitação adaptável que é especificado pelo sinal emitido da seção de determinação de parâmetro 113 e o ganho de um vetor de excitação fixa para a seção de multiplicação 109 e a seção de multiplicação 110, respectivamente.
O codebook de excitação fixa 108 armazena uma pluralidade de vetores de excitação de pulso de uma forma predeterminada em um buffer, e emite um vetor de excitação fixa adquirido com a multiplicação por um vetor de dispersão de um vetor de excitação de pulso apresentando uma forma que é especificada pelo sinal emitido da seção de determinação de parâme- tro 113, para a seção de multiplicação 110.
A seção de multiplicação 109 multiplica o vetor de excitação a- daptável emitido do codebook de excitação adaptável 106, pelo ganho emiti- do do codebook de ganho 107, e emite o resultado para a seção de acrés- cimo 111. A seção de multiplicação 110 multiplica o vetor de excitação fixa emitido do codebook de excitação fixa 108, pelo ganho emitido do codebook de ganho 107, e emite o resultado para a seção de acréscimo 111.
A seção de acréscimo 111 recebe como entrada o vetor de exci- tação adaptável e o vetor de excitação fixa depois da multiplicação de ga- nho, da seção de multiplicação 109 e da seção de multiplicação 110, acres- cente estes vetores, e emite uma excitação representando o resultado de adição para o filtro de síntese 104 e o codebook de excitação adaptável 106. Além disso, a excitação introduzida no codebook de excitação adaptável 106 é armazenada em um buffer.
A seção de ponderação perceptiva 112 aplica pesos perceptivos ao sinal de erro emitido da seção de acréscimo 105, e emite o sinal de erro para a seção de determinação de parâmetro 113 como distorção de codifi- cação.
A seção de determinação de parâmetro 113 pesquisa códigos para o vetor de excitação adaptável, o vetor de excitação fixa e o ganho de quantização que minimizam a distorção de codificação emitida da seção de ponderação perceptiva 112, e emite o código pesquisado (A) representando o vetor de excitação adaptável, o código (F) representando o vetor de exci- tação fixa, e o código (G) representando o ganho de quantização, para a seção de multiplexação.
A seção de multiplexação 114 recebe como entrada o código (L) representando os LPC's quantizados da seção de quantização de LPC 103, recebe como entrada o código (A) representando o vetor de excitação adap- tável, o código (F) representando o vetor de excitação fixa, e o código (G) representando o ganho de quantização, e multiplexa estes itens de informa- ção para emitir a informação codificada.
A figura 2 é um diagrama de bloco que mostra uma configuração do aparelho de decodificação de fala de acordo com a presente concretiza- ção. Na figura 2, a informação codificada é desmultiplexada na seção de desmultiplexação 201 em códigos individuais (L, A, G e F). O código (L) re- presentando os LPCs quantizados é emitido para a seção de decodificação de LPC 202, o código (A) representando o vetor de excitação adaptável é emitido para o codebook de excitação adaptável 203, o código (G) represen- tando o ganho de quantização é emitido para o codebook de ganho 204, e o código (F) representando o vetor de excitação fixa é emitido para o codebo- ok de excitação fixa 205.
A seção de decodificação de LPC 202 decodifica um parâmetro LSP quantizado do código (L) representando os LPC's quantizados, retrans- forma o parâmetro LSP quantizado resultante em um parâmetro de LPC quantizado, e emite o parâmetro de LPZ quantizado para o filtro de síntese 209.
O codebook de excitação adaptável 203 armazena excitações passadas usadas no filtro de síntese 209, extrai um quadro de amostras co- mo um vetor de excitação adaptável das excitações passadas que são es- pecificadas por um retardo de codebook adaptável associado com o código (A) representando o vetor de excitação adaptável e emite o vetor de excita- ção adaptável para a seção de multiplicação 206. Além disso, o codebook de excitação adaptável 203 atualiza as excitações armazenadas usando a exci- tação emitida da seção de acréscimo 208.
O codebook de ganho 204 decodifica o ganho do vetor de exci- tação adaptável que é especificado pelo código (G) representando o ganho de quantização e o ganho do vetor de excitação fixa, e emite o ganho do vetor de excitação adaptável e o ganho do vetor de excitação fixa para a se- ção de multiplicação 206 e a seção de multiplicação 207, respectivamente.
O codebook de excitação fixa 205 armazena uma pluralidade de vetores de excitação de pulso de uma forma predeterminada no buffer, gera um vetor de excitação fixa obtido com a multiplicação por um vetor de dis- persão um vetor de excitação de pulso apresentando uma forma que é es- pecificada pelo código (F) representando o vetor de excitação fixa, e emite o vetor de excitação fixa para a seção de multiplicação 207.
A seção de multiplicação 206 multiplica o vetor de excitação a- daptável pelo ganho e emite o resultado para a seção de acréscimo 208. A seção de multiplicação 207 multiplica o vetor de excitação fixa pelo ganho e emite o resultado para a seção de acréscimo 208.
A seção de acréscimo 208 acrescenta o vetor de excitação a- daptável e o vetor de excitação fixa depois da multiplicação de ganho emiti- da das seções de multiplicação 206 e 207 para gerar uma excitação, e emite esta excitação para o filtro de síntese 209 e o codebook de excitação adap- tável 203.
O filtro de síntese 209 executa a síntese de filtro da excitação emitida da seção de acréscimo 208 usando os coeficientes de filtro decodifi- cados na seção de decodificação de LPC 202, e emite o sinal resultante (a- diante "primeiro sinal sintetizado") para o pós-filtro 210 e a seção de cálculo de quantidade de flutuação/razão de amplitude 211.
O pós-filtro 210 executa o processamento para aperfeiçoar a qualidade subjetiva de fala, tal como a ênfase de grupo de ondas sonoras e a ênfase de passo, e o processamento para aperfeiçoar a qualidade subjeti- va de ruído estacionário, com relação ao sinal emitido do filtro de síntese 209, e emite o sinal resultante (adiante "segundo sinal sintetizado") para a seção de cálculo de quantidade de flutuação/razão de amplitude 211 e a se- ção de ajuste de potência 214. Além disso, podem haver casos em que o pós-filtro 210 salte uma análise de passo para reduzir a quantidade de cálcu- lo e aplica a filtragem utilizando o retardo de codebook adaptável e o ganho do vetor de excitação adaptável do codebook de excitação adaptável 203.
A seção de cálculo de quantidade de flutuação/razão de ampli- tude 211 calcula em uma base por subquadro a razão de amplitude do pri- meiro sinal sintetizado do sinal de entrada do pós-filtro 210 e do segundo sinal sintetizado do sinal de saída do pós-filtro 210, e a quantidade de flutua- ção da razão de amplitude, emite a razão de amplitude calculada para a se- ção de ajuste de coeficiente de retificação 212 e a seção de ajuste de coefi- ciente de ajuste 213, e emite a quantidade de flutuação da seção de ajuste de coeficiente de retificação-razão de amplitude calculada 212.
A seção de ajuste de coeficiente de retificação 212 ajusta os co- eficientes de retificação em uma base por subquadro usando a razão de amplitude do primeiro sinal sintetizado e do segundo sinal sintetizado, e a quantidade de flutuação da razão de amplitude, e emite os coeficientes de retificação ajustados para a seção de ajuste de coeficiente de ajuste 213.
A seção de ajuste de coeficiente de ajuste 213 ajusta os coefici- entes de ajuste em uma base por amostra usando a razão de amplitude do primeiro sinal sintetizado e do segundo sinal sintetizado e os coeficientes de retificação, e emite os coeficientes de ajuste ajustados para a seção de ajus- te de potência 214.
A seção de ajuste de potência 214 multiplica o segundo sinal sintetizado pelos coeficientes de ajuste para ajustar a potência do segundo sinal sintetizado e adquire o sinal de fala decodificado final.
Em seguida, o algoritmo de ajuste de potência no aparelho de decodificação de fala de acordo com a presente concretização será explica- do usando as figuras 3 e 4. Ademais, os valores usados no algoritmo mos- trado nas figuras 3 e 4 serão representados pelos seguintes símbolos. Além disso, nas figuras 3 e 4, os valores numéricos de constantes são ajustados assumindo-se que a taxa de amostragem é 8 kHz e o comprimento do sub- quadro é de 5 ms, que são as unidades usadas em codecs de baixa taxa de bits comuns para telefones.
η: o valor da amostra
pO: a potência do primeiro sinal sintetizado p1: a potência do segundo sinal sintetizado gs: a razão de amplitude do subquadro corrente
gs-i: a razão de amplitude do subquadro anterior g: o coeficiente de ajuste α: ο coeficiente de retificação
β: a escala estacionária
sy[n]: o primeiro sinal sintetizado na amostra η
pf[n]: o segundo sinal sintetizado na amostra η
q[n]: o sinal de fala decodificado.
Primeiro, os coeficientes de ajuste g e a razão de amplitude gs-i do quadro anterior são inicializados em 1,0 antes de a operação do aparelho de decodificação de fala ser iniciada (ST 300 e ST 301).
Depois, os primeiros sinais sintetizados e os segundos sinais sintetizados de todas as temporizações de amostragem são introduzidos em uma base por subquadro (ST 302), a potência pO dos primeiros sinais sinte- tizados, a potência p1 dos segundos sinais sintetizados e o valor de amostra η são inicializados em 0 (ST 303) e a potência pO do primeiro sinal sintetiza- do e a potência p1 do segundo sinal sintetizado no subquadro corrente são determinadas (ST 304, ST 305 e ST 306).
Em seguida, se houver 0 em uma das potências, a potência pO dos primeiros sinais sintetizados ou a potência p1 dos segundos sinais sinte- tizados (ST 307: SIM), o modo entrará no modo excepcional, o valor do coe- ficiente de ajuste g atualizando os coeficientes de ajuste passados será atri- buído à razão de amplitude gs do quadro corrente, e os coeficientes de retifi- cação α serão ajustados em 1,0 (ST 308). Além disso, apenas um destes dois processamentos em ST 308 precisa ser executado.
Em contraste com isto, se nem a potência pO dos primeiros si- nais sintetizados nem a potência p1 do segundo sinal sintetizado p1 for 0 (ST 302: NÃO), a potência PO dos primeiros sinais sintetizados será dividida pela potência p1 do segundo sinal sintetizado, a raiz quadrada do resultado de divisão será calculada e a razão de amplitude gs do subquadro corrente será determinada (ST 309). Além disso, as porções do ST 303, ST 304, ST 305, ST 306, ST 307 e ST 309 são representadas pela seguinte equação 1. 8 s
12 x P/M
...onde gs será 1, quando o denominador for 0. (E-
quação 1)
Depois, os coeficientes de retificação α são ajustados depen- dendo da magnitude da razão de magnitude gs do subquadro corrente. A figura 4 mostra quatro padrões de exemplos de ajuste. Isto é, no caso de gs<0,4 ou gs>2,5, a=0,9 será ajustado (ST 310: SIM e ST 311). Além disso, em casos à parte do caso acima e no caso de gs<0,6 ou gs>1,7, a=0,96 será ajustado (ST 310: NÃO, ST 312: SIM e ST 313). Além disso, em casos à parte dos dois casos acima e no caso de gs<0,8 ou gs>1,3, a=0,99 será ajus- tado (ST 312: NÃO, ST 314: SIM e ST 315). Ademais, em casos à parte dos três casos acima, a=0,998 será ajustado (ST 314:NÃO e ST 316). Aqui, quando a razão de amplitude gs do subquadro corrente
estiver mais próxima a 1,0, os coeficientes de retificação α serão ajustados mais próximos a 1,0. Por outro lado, quando os coeficientes de retificação α ficarem mais próximos a 1,0, os coeficientes de aceleração (1-a) ficarão mais próximos a 0,0. Este processo é um elemento importante com a pre- sente invenção, e, graças a este ajuste, quando o processamento do pós- filtro mudar de potência de modo significativo, a potência será ajustada pron- tamente e, quando o processamento pós-filtro não mudar muito de potência, a potência será ajustada mais suavemente.
Em seguida, quando o valor absoluto | gs-gs-i | da diferença en- tre a razão de amplitude gs-i do subquadro anterior e a razão de amplitude gs do subquadro corrente for maior do que um limiar predeterminado, a escala estacionária β será ajustada pequena e, quando o valor absoluto | gs-gs-i | for igual ou menor que um limiar predeterminado, a escala estacionária β será ajustada grande. Na figura 4, como um exemplo de ajuste, quando | gs- gs-i | for maior que 0,5, β=0,95 será ajustado, e, quando | gs-gs-i | for igual ou menor que 0,5, β=1,0 será ajustado (ST 317, ST 318 e ST 319).
Depois, novos coeficientes de retificação α serão adquiridos com a multiplicação dos coeficientes de retificação α pela escala estacionária β (ST 320). Desta forma, é possível prover uma vantagem de ajustar a potên- cia prontamente com a multiplicação dos coeficientes de retificação α pela escala estacionária β, quando a flutuação no decorrer do tempo for significa- tiva.
Depois, os coeficientes de ajuste g são calculados com base na razão de amplitude determinada gs do subquadro corrente e dos coeficientes de retificação a. Mais especificamente, novos coeficientes de ajuste g são calculados com a multiplicação dos coeficientes de ajuste g da amostra ante- rior pelos coeficientes de retificação a, com a multiplicação da razão de am- plitude gs do subquadro corrente pelos coeficientes de aceleração (1-a) e com o acréscimo dos resultados de multiplicação. Depois, o sinal de fala de- codificado final q[n] é adquirido com a multiplicação do segundo sinal sinteti- zado pf[n] pelos coeficientes de ajuste g (ST 321, ST 322, ST 323 e ST 324).
Um subquadro do sinal de fala decodificado resultante q[n] é e- mitido (ST 325).
Os processamentos acima são repetidos no próximo subquadro (ST 326). Além disso, os coeficientes de ajuste g que são usados por último são usados como está no próximo subquadro. Ademais, a razão de amplitu- de gs do subquadro corrente determinado em ST 308 e ST 309 é usada co- mo a razão de amplitude gs-i do subquadro anterior no processamento do próximo subquadro.
Desta forma, de acordo com a presente concretização, é possí- vel ajustar a potência prontamente quando o pós-filtro mudar de potência significativamente ou flutuar a razão de amplitude significativamente no de- correr do tempo, e realizar um ajuste de potência suave sem descontinuida- de em um período no qual o pós-filtro flutua potência em pequena escala ou em um período que está estacionário no decorrer do tempo. Consequente- mente, é possível produzir um bom som sintetizado com um volume de som estável de acordo com a presente concretização.
Além disso, embora constantes tenham sido ajustadas assumin- do que a freqüência de amostragem é de 8 kHz e o comprimento do sub- quadro é de 5 ms (40 amostras) com a presente concretização, a freqüência de amostragem e o comprimento do subquadro da presente invenção não são limitados a estes, sendo também efetivos outras freqüências de amos- tragem e outros comprimentos de subquadro. Por exemplo, quando a amos- tragem for executada em uma taxa de amostragem de 16 kHz que é duas vezes tanto quanto a taxa de amostragem de 8 kHz, a unidade de subquadro será de 80 amostras e um bom desempenho será alcançado em ajustando os valores dos coeficientes de retificação a maior. Por exemplo, é possível alcançar um bom desempenho casando a taxa de amostragem com o ajuste das constantes dos coeficientes de retificação {0,9, 0,96, 0,99, 0,998} em {0,95, 0,98, 0,993, 0,999} e com o ajuste das escalas estacionárias {0,95, 1,0} em cerca de {0,97, 1,0}.
Ademais, embora tenha sido explicado um caso com a presente concretização onde a razão de amplitude é aplicada para decidir os coefici- entes de retificação e a escala estacionária, a presente invenção não é Iimi- tada a isto e é possível prover a mesma vantagem mesmo quando a razão de potência for usada no lugar da razão de amplitude. Além disso, a razão de potência é altamente correlacionada com o quadrado da razão de ampli- tude.
Em contraste com isto, embora a raiz quadrada da razão das somas dos quadrados dos dois sinais seja calculada para determinar os coe- ficientes de ajuste do subquadro corrente, a presente invenção não é limita- da a isto, e é possível prover a mesma vantagem mesmo quando a razão das somas dos valores absolutos dos sinais for usada.
Além disso, embora uma seção de ajuste de potência para ajus- tar a flutuação da potência de entrada/saída de um pós-filtro tenha sido ex- plicada com a presente concretização, a presente invenção não será limitada ao pós-filtro e será efetiva quando a potência de entrada/saída flutuar. Por exemplo, embora o processamento de ênfase de som vocal usado no ins- trumento de escuta e semelhante exija o ajuste de potência para impedir a flutuação de potência repentina, a presente invenção será, neste caso, subs- tancialmente efetiva, de modo que seja possível realizar uma qualidade de som perceptiva suave da fala que é fácil de ser ouvida. Além disso, embora a presente concretização seja usada para CELP, a presente invenção também é efetiva para outros codecs. Isto se deve ao fato de a seção de ajuste de potência da presente invenção ser u- sada no processamento subseqüente para decodificar o processamento e não depender dos tipos de codecs.
Ademais, embora um vetor de excitação fixa seja gerado com a multiplicação de um vetor de excitação de pulso por um vetor de dispersão em um codebook de excitação fixa com a presente concretização, a presen- te invenção não é limitada a isto, e o vetor de excitação de pulso poderá ser usado como para o vetor de excitação fixa.
Adicionalmente, o aparelho de decodificação de fala de acordo com a presente modalidade pode ser provido em um aparelho terminal de comunicação e o aparelho de estação de base em um sistema de comunica- ção móvel, de modo que seja possível prover um aparelho de terminal de comunicação, um aparelho de estação de base e um sistema de comunica- ção móvel apresentando as mesmas operações e vantagens, conforme ex- plicado acima.
Também, embora tenham sido explicados casos aqui como e- xemplos onde a presente invenção é configurada por hardware, a presente invenção pode também ser realizada por software. Por exemplo, é possível implementar as mesmas funções como no aparelho de estação de base de acordo com a presente invenção com a descrição de algoritmos de acordo com a presente invenção usando a linguagem de programação, e com a e- xecução deste programa com uma seção de processamento de informação por meio do armazenamento deste programa na memória.
Cada bloco de função empregado na explanação de cada qual da concretização acima mencionada pode tipicamente ser implementado como um LSI constituído por um circuito integrado. Estes podem ser chips individuais ou parcialmente ou totalmente contidos em um único chip.
"LSI" é adotado aqui, mas este pode ser também chamado de "IC", "LSI de sistema", "super LSI", ou "ultra LSI", dependendo de diferentes extensões de integração. Além disso, o método de integração de circuito não é limitado a LSI's, sendo também possível a implementação usando circuitos dedicados ou processadores de uso geral. Depois da fabricação de LSI, também é pos- sível a utilização de um FPGA (Fiel Programmable Gate Array) programável ou um processador reconfigurável onde as conexões e os ajustes de células de circuito dentro de um LSI podem ser configurados.
Ademais, se a tecnologia de circuito integrado surgir para substi- tuir os LSI's como resultado do avanço da tecnologia de semicondutor ou outra tecnologia derivativa, será também naturalmente possível executar a integração de bloco de função usando esta tecnologia. A aplicação de bio- tecnologia também é possível.
A descrição do Pedido de Patente Japonês No. 2006-336272, depositado em 13 de dezembro de 2006, incluindo o relatório descritivo, de- senhos e resumo, é aqui incorporada para referência em sua totalidade. APLICABILIDADE INDUSTRIAL
A presente invenção é adequada para uso em um aparelho de decodificação de fala e semelhante para decodificar um sinal de fala codifi- cado.

Claims (4)

1. Aparelho de decodificação de fala que compreende: um pós-filtro que aplica filtragem a um sinal de um comprimento de subquadro em intervalos de temporização de amostra predeterminados; uma seção de cálculo que calcula um primeiro valor de cálculo e um segundo valor em uma base por subquadro, o primeiro valor de cálculo compreendendo uma razão de amplitude ou uma razão de potência de um sinal de entrada e de um sinal de saída do pós-filtro, o segundo valor de cál- culo compreendendo uma quantidade de flutuação do primeiro valor de cál- culo; uma seção de ajuste de coeficiente de retificação que ajusta um coeficiente de retificação em uma base por subquadro com base no primeiro valor de cálculo e no segundo valor de cálculo; uma seção de ajuste de coeficiente de ajuste que ajusta um coe- ficiente de ajuste em uma base por amostra com base no primeiro valor de cálculo e no coeficiente de retificação; e uma seção de ajuste de potência que adquire um sinal de fala decodificado com a multiplicação do sinal de saída do pós-filtro pelo coefici- ente de ajuste.
2. Aparelho de decodificação de fala, de acordo com a reivindi- cação 1, em que a seção de ajuste de coeficiente de retificação ajustará o coeficiente de retificação mais próximo a 1,0 quando o primeiro valor de cál- culo estiver próximo a 1,0.
3. Aparelho de decodificação de fala, de acordo com a reivindi- cação 1, em que a seção de ajuste de coeficiente de ajuste acrescenta um valor que multiplica o coeficiente de ajuste de uma amostra anterior pelo co- eficiente de retificação, e um valor que multiplica o primeiro valor de cálculo por um coeficiente de aceleração com a subtração do coeficiente de retifica- ção de 1,0, para calcular um novo coeficiente de ajuste.
4. Método de ajuste de potência para um sinal de saída de um pós-filtro para aplicar filtragem a um sinal de um comprimento de subquadro em intervalos de temporização de amostra predeterminados, o método de ajuste de potência compreendendo: o cálculo de um primeiro valor de cálculo e de um segundo valor de cálculo em uma base por subquadro, o primeiro valor de cálculo compre- endendo uma razão de amplitude ou uma razão de potência de um sinal de entrada e do sinal de saída do pós-filtro, o segundo valor de cálculo compre- endendo uma quantidade de flutuação do primeiro valor de cálculo; o ajuste de um coeficiente de retificação em uma base por sub- quadro com base no primeiro valor de cálculo e no segundo valor de cálculo; o ajuste de um coeficiente de ajuste em uma base por amostra com base no primeiro valor de cálculo e no coeficiente de retificação; e a multiplicação do sinal de saída do pós-filtro pelo coeficiente de ajuste.
BRPI0720266-0A 2006-12-13 2007-12-12 Dispositivo de decodificação de aúdio e método de ajuste de potência BRPI0720266A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006336272 2006-12-13
JP2006-336272 2006-12-13
PCT/JP2007/073968 WO2008072671A1 (ja) 2006-12-13 2007-12-12 音声復号化装置およびパワ調整方法

Publications (1)

Publication Number Publication Date
BRPI0720266A2 true BRPI0720266A2 (pt) 2014-01-28

Family

ID=39511688

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0720266-0A BRPI0720266A2 (pt) 2006-12-13 2007-12-12 Dispositivo de decodificação de aúdio e método de ajuste de potência

Country Status (5)

Country Link
US (1) US20100332223A1 (pt)
EP (1) EP2096631A4 (pt)
JP (1) JPWO2008072671A1 (pt)
BR (1) BRPI0720266A2 (pt)
WO (1) WO2008072671A1 (pt)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5245622B2 (ja) * 2008-07-31 2013-07-24 富士通株式会社 ノイズ検出装置及びノイズ検出方法
CN103928031B (zh) 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US9042462B2 (en) 2013-04-24 2015-05-26 Commscope Technologies Llc Differential signal transmission
US9620134B2 (en) 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10614816B2 (en) 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
US10163447B2 (en) 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
CN110689488B (zh) * 2019-08-22 2022-03-04 稿定(厦门)科技有限公司 图像调色方法、介质、设备及装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3274451B2 (ja) * 1990-02-23 2002-04-15 株式会社東芝 適応ポストフィルタ及び適応ポストフィルタリング方法
JP3076086B2 (ja) * 1991-06-28 2000-08-14 シャープ株式会社 音声合成装置用ポストフィルタ
JP3024468B2 (ja) * 1993-12-10 2000-03-21 日本電気株式会社 音声復号装置
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
JP3319556B2 (ja) * 1995-09-14 2002-09-03 株式会社東芝 ホルマント強調方法
DE69628103T2 (de) * 1995-09-14 2004-04-01 Kabushiki Kaisha Toshiba, Kawasaki Verfahren und Filter zur Hervorbebung von Formanten
JP3426871B2 (ja) 1995-09-18 2003-07-14 株式会社東芝 音声信号のスペクトル形状調整方法および装置
US5864798A (en) * 1995-09-18 1999-01-26 Kabushiki Kaisha Toshiba Method and apparatus for adjusting a spectrum shape of a speech signal
JP3653826B2 (ja) 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
US5890138A (en) * 1996-08-26 1999-03-30 Bid.Com International Inc. Computer auction system
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
JPH1084284A (ja) * 1996-09-06 1998-03-31 Sony Corp 信号再生方法および装置
JPH10214100A (ja) * 1997-01-31 1998-08-11 Sony Corp 音声合成方法
US6691082B1 (en) * 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
KR20020052203A (ko) * 2000-09-08 2002-07-02 요트.게.아. 롤페즈 오디오 신호 압축
AU2002218520A1 (en) * 2000-11-30 2002-06-11 Matsushita Electric Industrial Co., Ltd. Audio decoder and audio decoding method
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
BRPI0418838A (pt) * 2004-05-17 2007-11-13 Nokia Corp método para suportar uma codificação de um sinal de áudio, módulo para suportar uma codificação de um sinal de áudio, dispositivo eletrÈnico, sistema de codificação de áudio, e, produto de programa de software
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
EP1785984A4 (en) * 2004-08-31 2008-08-06 Matsushita Electric Ind Co Ltd AUDIOCODING DEVICE, AUDIO DECODING DEVICE, COMMUNICATION DEVICE AND AUDIOCODING METHOD
WO2006030864A1 (ja) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号装置、通信装置及び音声符号化方法
JP4732730B2 (ja) * 2004-09-30 2011-07-27 パナソニック株式会社 音声復号装置
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
JPWO2007088853A1 (ja) * 2006-01-31 2009-06-25 パナソニック株式会社 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法

Also Published As

Publication number Publication date
WO2008072671A1 (ja) 2008-06-19
EP2096631A1 (en) 2009-09-02
JPWO2008072671A1 (ja) 2010-04-02
EP2096631A4 (en) 2012-07-25
US20100332223A1 (en) 2010-12-30

Similar Documents

Publication Publication Date Title
BRPI0720266A2 (pt) Dispositivo de decodificação de aúdio e método de ajuste de potência
JP4698593B2 (ja) 音声復号化装置および音声復号化方法
EP2054879B1 (en) Re-phasing of decoder states after packet loss
EP2235719B1 (en) Audio encoder and decoder
RU2641224C2 (ru) Адаптивное расширение полосы пропускания и устройство для этого
TWI324335B (en) Methods of signal processing and apparatus for wideband speech coding
US11328739B2 (en) Unvoiced voiced decision for speech processing cross reference to related applications
US20100010810A1 (en) Post filter and filtering method
RU2414010C2 (ru) Трансформация шкалы времени кадров в широкополосном вокодере
KR20130033468A (ko) 대역폭 확장 출력 데이터를 생성하기 위한 장치 및 방법
KR19990088582A (ko) 신호의기본주파수를추정하기위한방법및장치
US8892428B2 (en) Encoding apparatus, decoding apparatus, encoding method, and decoding method for adjusting a spectrum amplitude
BRPI0808202A2 (pt) Dispositivo de codificação e método de codificação.
EP2626856B1 (en) Encoding device, decoding device, encoding method, and decoding method
US8073687B2 (en) Audio regeneration method
WO2010098130A1 (ja) トーン判定装置およびトーン判定方法
JPWO2007037359A1 (ja) 音声符号化装置および音声符号化方法
JP2010175633A (ja) 符号化装置及び方法、並びにプログラム

Legal Events

Date Code Title Description
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 6A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: REFERENTE AO DESPACHO 8.6 PUBLICADO NA RPI 2277 DE 26/08/2014.

B15K Others concerning applications: alteration of classification

Ipc: G10L 19/26 (2013.01), H03G 3/30 (2006.01)