BRPI0609530B1 - métodos e equipamento para encodificar e decodificar uma porção de banda alta de um sinal de fala - Google Patents
métodos e equipamento para encodificar e decodificar uma porção de banda alta de um sinal de fala Download PDFInfo
- Publication number
- BRPI0609530B1 BRPI0609530B1 BRPI0609530-5A BRPI0609530A BRPI0609530B1 BR PI0609530 B1 BRPI0609530 B1 BR PI0609530B1 BR PI0609530 A BRPI0609530 A BR PI0609530A BR PI0609530 B1 BRPI0609530 B1 BR PI0609530B1
- Authority
- BR
- Brazil
- Prior art keywords
- signal
- high band
- band portion
- gain
- envelope
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Abstract
métodos e equipamento para encodificar e decodificar uma porção de banda alta de um sinal de fala. um encodificador de fala de banda larga de acordo com uma modalidade inclui um encodificador de banda baixa e um encodificador de banda alta. o encodificador de banda baixa é configurado para encodificar uma porção de banda baixa de um sinal de fala de banda larga como uni conjunto de parâmetros de filtro e um sinal de excitação encodificado. o encodificador de banda alta é configurado para calcular valores para codificar parâmetros que especificam um envelope espectral e um envelope temporal de uma porção de banda alta do sinal de fala de banda larga. o envelope temporal se baseia em um sinal de excitação de banda alta que é derivado do sinal de excitação encodificado. em tal exemplo, o envelope temporal se baseia em urna diferença em níveis entre a porção de banda alta e um sinal de banda alta sintetizado, em que o sinal de banda alta sintetizado é gerado de acordo com o sinal de excitação de banda alta e um conjunto de parâmetros de filtro de banda alta.
Description
MÉTODOS Ε EQUIPAMENTO PARA ENCODIFICAR Ε DECODIFICAR UMA
PORÇÃO DE BANDA ALTA DE UM SINAL DE FALA
CAMPO DA INVENÇÃO
Esta invenção se refere a processamento de sinal. FUNDAMENTOS
A comunicação de voz através de rede de telefonia pública comutada (PSTN) tem sido tradicionalmente limitada em largura de banda para a faixa de freqüência de 300-3400 Hz. As novas redes para comunicação de voz, tal como telefonia celular e voz sobre IP (Protocolo Internet, VoIP), podem não ter os mesmos limites de largura de banda, e pode ser desejável transmitir e receber comunicações de voz que incluam uma faixa de freqüência de banda larga através de tais redes. Por exemplo, pode ser desejável suportar uma faixa de freqüência de áudio que se estenda de 50 Hz e/ou até 7 ou 8 kHz. Também pode ser desejável suportar outras aplicações, tal como áudio de alta qualidade ou conferência de áudio/vídeo, que pode ter conteúdo de fala de áudio nas faixas fora dos limites de
PSTN tradicionais.
A extensão da faixa suportada por um codificador de fala em frequências superiores pode melhorar a inteligibilidade. Por exemplo, a informação que diferencia fricativas tais como s e f está em grande parte nas freqüências elevadas. Extensão de banda alta também pode melhorar outras qualidades de fala, tal como presença. Por exemplo, mesmo uma vogal falada pode ter energia espectral bem acima do limite de PSTN.
Uma abordagem para codificação de fala de banda larga envolve escalonamento de uma técnica de codificação de fala de banda estreita (por exemplo, aquela configurada para encodificar a faixa de 0-4 kHz) para cobrir o espectro de banda larga. Por exemplo, um sinal de fala pode ser
2/80 amostrado em uma taxa superior para incluir componentes em altas frequências, e uma técnica de codificação de banda estreita pode ser reconfigurada para utilizar mais coeficientes de filtro para representar esse sinal de banda larga. Contudo, técnicas de codificação de banda estreita tal como CELP (predição linear excitada por livro-código) são computacionalmente intensivas, e um codificador CELP de banda larga pode consumir muitos ciclos de processamento para ser prático para muitas aplicações móveis e outras aplicações integradas. A encodificação do espectro inteiro de um sinal de banda larga para uma qualidade desejada usando tal técnica também pode levar a um aumento inaceitavelmente grande em largura de banda. Além disso, a transcodificação de tal sinal encodificado seria exigida antes até mesmo que sua porção de banda estreita pudesse ser transmitida para e/ou decodificada por um sistema que suporta apenas codificação de banda estreita.
Outra abordagem para codificação de fala de banda larga envolve extrapolar o envelope espectral de banda alta a partir do envelope espectral de banda estreita encodifiçado. Embora tal abordagem possa ser implementada sem qualquer aumento em largura de banda e sem uma necessidade de transcodificação, o envelope espectral grosseiro ou estrutura formante da porção de banda alta de um sinal de fala geralmente nâo pode ser predito exatamente a partir do envelope espectral da porção de banda estreita.
Pode ser desejável implementar codificação de fala de banda larga de tal modo que pelo menos a porção de banda estreita do sinal encodificado possa ser enviada através de um canal de banda estreita (tal como um canal ΡΞΤΝ) sem transcodificação ou outra modificação significativa. A eficiência da extensão de codificação de banda larga também pode ser desejável, por exemplo, para
3/80
evitar uma redução significativa no número de usuários que podem ser servidos em aplicações tais como telefonia celular sem fio e transmissão por broadcast através de canais cabeados e de canais sem fio.
SUMÁRIO
Em uma modalidade, um método para encodificar uma porção de banda alta de um sinal de fala tendo uma porção de banda baixa e a porção de banda alta inclui calcular uma pluralidade de parâmetros de filtro que particularizam um envelope espectral da porção de banda alta; calcular um sinal espectralmente estendido mediante extensão do espectro de um sinal derivado da porção de banda baixa; gerar um sinal de banda alta sintetizado, de acordo com (A) um sinal de excitação de banda alta baseado no sinal espectralmente estendido e (B) a pluralidade de parâmetros de filtro; e calcular um envelope de ganho com base em uma relação entre a porção de banda alta e um sinal baseado na porção de banda baixa.
Em uma modalidade, um método para processamento de fala inclui gerar um sinal de excitação de banda alta com base em um sinal de excitação de banda baixa; gerar um sinal de banda alta sintetizado, com base em um sinal de fala de banda alta e no sinal de excitação de banda alta; e calcular uma pluralidade de fatores de ganho com base em uma relação entre o sinal de fala de banda alta e um sinal baseado no sinal de excitação de banda baixa.
Em outra modalidade, um método para decodificar uma porção de banda alta de um sinal de fala tendo uma porção de banda baixa e a porção de banda alta inclui receber uma pluralidade de parâmetros de filtro que particularizam um envelope espectral da porção de banda alta e uma pluralidade de fatores de ganho que particularizam um envelope temporal da porção de banda
4/80 alta; calcular um sinal espectralmente estendido mediante extensão do espectro de um sinal que se baseia em um sinal de excitação da banda baixa; gerar um sinal de banda alta sintetizado de acordo com (A) a pluralidade de parâmetros de filtro e (B) um sinal de excitação de banda alta com base no sinal espectralmente estendido; e modular um envelope de ganho do sinal de banda alta sintetizado de acordo com a pluralidade de fatores de ganho.
Em outra modalidade, um equipamento configurado para encodificar uma porção de banda alta de um sinal de fala tendo uma porção de banda baixa e a porção de banda alta inclui um módulo de análise configurado para calcular um conjunto de parâmetros de filtro que particularizam um envelope espectral da porção de banda alta; um extensor de espectro configurado para calcular um sinal espectralmente estendido mediante extensão do espectro de um sinal derivado da porção de banda baixa; um filtro de síntese configurado para gerar um sinal de banda alta sintetizado de acordo com (A) um sinal de excitação de banda alta com base no sinal espectralmente estendido e (Β) o conjunto de parâmetros de filtro; e um calculador de fator de ganho configurado para calcular um envelope de ganho com base em uma relação variável no tempo entre a porção de banda alta e um sinal baseado na porção de banda baixa.
Em outra modalidade, um decodificador de fala de banda alta é configurado para receber (A) uma pluralidade de parâmetros de filtro que particularizam um envelope espectral de uma porção de banda alta de um sinal de fala e (B) um sinal de excitação de banda baixa encodificado baseado em uma porção de banda baixa do sinal de fala. O decodificador inclui um extensor de espectro configurado para calcular um sinal espectralmente estendido mediante extensão do espectro de um sinal que é baseado no sinal de
5/80 excitação de banda baixa encodifiçado; um filtro de síntese configurado para gerar um sinal de banda alta sintetizado de acordo com (A) uma pluralidade de parâmetros de filtro que particularizam um envelope espectral da porção de banda alta e (B) um sinal de excitação de banda alta baseado no sinal espectralmente estendido; e um elemento de controle de ganho configurado para modular um envelope de ganho do sinal de banda alta sintetizado, de acordo com uma pluralidade de fatores de ganho que particularizam um envelope temporal da porção da banda alta.
BREVE DESCRIÇÃO DOS DESENHOS
A Figura | la | mostra um diagrama | de | > blocos | i de | um |
encodificador de fala | de banda larga A100 | de | acordo | com | uma | |
modalidade. | ||||||
A Figura | lb | mostra um diagrama | de | blocos | de | uma |
implementação A102 | de | encodificador de fala | de banda larga | |||
A100. | ||||||
A Figura | 2a | mostra um diagrama | de | ; blocos | ; de | um |
decodificador de fala | de banda larga B100 | de | acordo | com | uma | |
modalidade. | ||||||
A Figura | 2b | mostra um diagrama | de | blocos | de | uma |
implementação B102 | do | decodificador de fala | de banda larga | |||
B100. | ||||||
A Figura | 3a | mostra um diagrama | de | blocos | de | uma |
implementação Al12 | de | banco de filtros A110. | ||||
A Figura | 3b | mostra um diagrama | de | blocos | de | uma |
implementação B122 | do | banco de filtros B120. | ||||
A Figura | 4a | mostra cobertura de | largura de banda | |||
das bandas baixa e | alta para um exemplo de | banco de | filtros |
A110.
A Figura 4b mostra a cobertura de largura de banda das bandas baixa e alta para outro exemplo de banco de filtros A110.
6/80
A Figura 4c mostra um diagrama de blocos de uma implementação A114 de banco de filtros A112.
A Figura 4d mostra um diagrama de blocos de uma implementação B124 de banco de filtros B122.
A Figura 5a mostra um exemplo de um gráfico de log-amplitude versus freqüência para um sinal de fala.
A Figura 5b mostra um diagrama de blocos de um sistema de codificação de predição linear básica.
A Figura 6 mostra um diagrama de blocos de uma implementação A122 do encodificador de banda estreita A120.
A Figura 7 mostra um diagrama de blocos de uma implementação B112 do decodificador de banda estreita B110.
A Figura 8a mostra um exemplo de um gráfico de log-amplitude versus freqüência para um sinal residual para fala com voz.
A Figura 8b mostra um exemplo de um gráfico de log-amplitude versus tempo para um sinal residual para fala com voz.
A Figura 9 mostra um diagrama de blocos de um sistema de codificação de predição linear básica que também realiza predição de longo prazo.
A Figura 10 mostra um diagrama de blocos de uma implementação A202 do encodificador de banda alta A200.
A Figura 11 mostra um diagrama de blocos de uma implementação A302 do gerador de excitação de banda alta A300.
A Figura 12 mostra um diagrama de blocos de uma implementação A402 do extensor de espectro A400.
A Figura 12a | mostra | gráficos | de | espectros | de | |
sinal em | vários pontos | em um | exemplo de | uma | operação | de |
extensão | espectral. | |||||
A Figura 12b | mostra | gráficos | de | espectros | de | |
sinal em | vários pontos | em outro | i exemplo de | ; uma operação | de |
7/80 extensão espectral.
A Figura 13 mostra um diagrama de blocos de uma implementação A304 do gerador de excitação de banda alta A302.
A Figura 14 mostra um diagrama de blocos de uma implementação A306 do gerador de excitação de banda alta
A302.
A Figura 15 mostra um fluxograma para uma tarefa de cálculo de envelope T100.
A Figura 16 mostra um diagrama de blocos de uma implementação 492 do combinador 490.
A Figura 17 ilustra uma abordagem para calcular uma medida da periodicidade do sinal de banda alta S30.
A Figura 18 mostra um diagrama de blocos de uma implementação A312 do gerador de excitação de banda alta A302.
A Figura 19 mostra um diagrama de blocos de uma implementação A314 do gerador de excitação de banda alta A302.
A Figura 20 mostra um diagrama de blocos de uma implementação A316 do gerador de excitação de banda alta A302.
A Figura 21 mostra um fluxograma para uma tarefa de cálculo de ganho T200.
A Figura 22 mostra um fluxograma para uma implementação T210 da tarefa de cálculo de ganho T200.
A Figura 23a mostra um diagrama de uma função de janelamento.
A Figura 23b mostra uma aplicação de uma função de janelamento como mostrado na Figura 23a aos subquadros de um sinal de fala.
A Figura 24 mostra um diagrama de blocos para uma implementação B202 do decodificador de banda alta B200.
8/80
A Figura mostra um diagrama de blocos de uma implementação ADIO do encodificador de fala de banda larga
A100.
A Figura 26a mostra um diagrama esquemático de uma implementação D122 da linha de retardo D120.
A Figura 26b mostra um diagrama esquemático de uma implementação D124 da linha de retardo D120.
A Figura 27 mostra um diagrama esquemático de uma implementação D130 da linha de retardo D120.
A Figura 28 mostra um diagrama de blocos de uma implementação AD12 do encodificador de fala de banda larga ADIO.
A Figura 29 mostra um fluxograma de um método de processamento de sinal MD100 de acordo com uma modalidade.
A Figura 30 mostra um fluxograma para um método M100 de acordo com uma modalidade.
A Figura 31a mostra um fluxograma para um método M200 de acordo com uma modalidade.
A Figura 31b mostra um fluxograma para uma implementação M210 do método Μ2Ό0.
A Figura 32 mostra um fluxograma para um método M300 de acordo com uma modalidade.
Nas figuras e descrição anexa, os mesmos rótulos de referência se referem aos mesmos elementos ou sinais análogos.
DESCRIÇÃO DETALHADA
As modalidades aqui descritas incluem sistemas, métodos e equipamento que podem ser configurados para prover uma extensão para um codificador de fala de banda estreita para suportar transmissão e/ou armazenamento de sinais de fala de banda larga em um aumento de largura de banda de apenas aproximadamente 800 a 1000 bps (bits por segundo). Vantagens potenciais de tais implementações
9/80 incluem codificação integrada para suportar compatibilidade com os sistemas de banda estreita, alocação e realocação de bits relativamente fáceis entre os canais de codificação de banda estreita e de banda alta, evitando uma operação de síntese de banda larga computacionalmente intensiva, e mantendo uma baixa taxa de amostragem para sinais a serem processados por rotinas de codificação de forma de onda computacionalmente intensivas.
A menos que expressamente limitado por seu contexto, o termo calculando é usado aqui para indicar quaisquer de seus significados comuns, tal como computando, gerando e selecionando a partir de uma lista de valores. Onde o termo compreendendo é usado na presente descrição e reivindicações, ele não exclui outros elementos ou operações. O termo A se baseia em B é usado para indicar quaisquer de seus significados comuns, incluindo os casos (i) A é igual a B e (ii) A se baseia em pelo menos B. O termo Protocolo Internet inclui a versão 4, como descrito em IETF (Força Tarefa de Engenharia da Internet) RFC (Solicitação para Comentários) 791, e versões subseqüentes tal como a versão 6.
A Figura la mostra um diagrama de blocos de um encodificador de fala de banda larga A100 de acordo com uma modalidade. 0 banco de filtros A110 é configurado para filtrar um sinal de fala de banda larga S10 para produzir um sinal de banda estreita S20 e um sinal de banda alta S30. O encodificador de banda estreita A120 é configurado para encodificar o sinal de banda estreita S20 para produzir parâmetros de filtro de banda estreita (NB) S40 e um sinal residual de banda estreita S50. Como descrito em detalhe adicional aqui, o encodificador de banda estreita A120 é configurado tipicamente para produzir parâmetros de filtro de banda estreita S40 e sinal de excitação de banda
10/80 estreita encodificado Ξ50 como índices de livro-código ou em uma outra forma quantizada. O encodificador de banda alta A200 é configurado para encodificar o sinal de banda alta S30 de acordo com informação no sinal de excitação de banda estreita encodificado S50 para produzir parâmetros de codificação de banda alta S60. Como descrito em detalhe adicional aqui, o encodificador de banda alta A200 é configurado tipicamente para produzir parâmetros de codificação de banda alta S60 como índices de livro-código ou em outra forma quantizada. Um exemplo específico de encodificador de fala de banda larga A100 é configurado para encodificar sinal de fala de banda larga S10 em uma taxa de aproximadamente 8,55 kbps (quilobits por segundo), com aproximadamente 7,55 kbps sendo usados para parâmetros de filtro de banda estreita S40 e sinal de excitação de banda estreita encodificado S50, e aproximadamente 1 kbps sendo usado para parâmetros de codificação de banda alta S60.
Pode ser desejado combinar os sinais de banda estreita e de banda alta encodifiçados em um único fluxo de bits. Por exemplo, pode ser desejado multiplexar os sinais encodifiçados em conjunto para transmissão (por exemplo, através de um canal de transmissão cabeado, ótico ou sem fio) , ou para armazenamento, como um sinal de fala de banda larga encodificado. A Figura lb mostra um diagrama de blocos de uma implementação A102 de encodificador de fala de banda larga A100 que inclui um multiplexador A130 configurado para combinar parâmetros de filtro de banda estreita S40, sinal de excitação de banda estreita encodificado S50 e parâmetros de filtro de banda alta S60 em um sinal multiplexado 370.
Um equipamento incluindo encodificador A102 também pode incluir conjunto de circuitos configurado para
11/80 transmitir sinal multiplexado S70 em um canal de transmissão tal como um canal cabeado, ótico ou sem fio. Tal equipamento também pode ser configurado para realizar uma ou mais operações de encodificação de canal no sinal, tal como encodificação de correção de erros (por exemplo, encodificação convolucional compatível com taxa) e/ou encodificação de detecção de erros (por exemplo, encodificação por redundância cíclica), e/ou uma ou mais camadas de encodificação de protocolo de rede (por exemplo, Ethernet, TCP/IP, cdma2000).
Pode ser desejável que o multiplexador A130 seja configurado para integrar o sinal de banda estreita encodifiçado (incluindo parâmetros de filtro de banda estreita S40 e sinal de excitação de banda estreita encodificado S50) como um subfluxo separável de sinal multiplexado S70, de tal modo que o sinal de banda estreita encodificado possa ser recuperado e decodificado independentemente de outra porção do sinal multiplexado Ξ70 tal como um sinal de banda alta e/ou banda baixa. Por exemplo, o sinal multiplexado 370 pode ser disposto de tal modo que o sinal de banda estreita encodificado possa ser recuperado mediante remoção dos parâmetros de filtro de banda alta S60. Uma vantagem potencial de tal característica é a de evitar a necessidade de transcodificar o sinal de banda larga encodificado antes de passá-lo para um sistema que suporta decodificação do sinal de banda estreita, mas não suporta decodificação da porção de banda alta.
A Figura 2a é um diagrama de blocos de um decodificador de fala de banda larga B100 de acordo com uma modalidade. O decodificador de banda estreita B110 é configurado para decodificar parâmetros de filtro de banda estreita S40 e o sinal de excitação de banda estreita
12/80 encodificado S50 para produzir um sinal de banda estreita S90. O decodificador de banda alta B200 é configurado para decodificar os parâmetros de codificação de banda alta S60 de acordo com um sinal de excitação de banda estreita S80, com base no sinal de excitação de banda estreita encodificado S50, para produzir um sinal de banda alta S100. Nesse exemplo, o decodificador de banda estreita B110 é configurado para prover sinal de excitação de banda estreita Ξ80 ao decodificador de banda alta B200. O banco de filtros B120 é configurado para combinar sinal de banda estreita S90 e sinal de banda alta S100 para produzir um sinal de fala de banda larga S110.
A Figura 2b é um diagrama de blocos de uma implementação B102 de decodificador de fala de banda larga B100 que inclui um demultiplexador B130 configurado para produzir sinais encodifiçados S40, S50 e S60 a partir do sinal multiplexado S70. Um equipamento incluindo decodificador B102 pode incluir conjunto de circuitos configurado para receber sinal multiplexado S70 proveniente de um canal de transmissão tal como um canal cabeado, ótico ou sem fio. Tal equipamento também pode ser configurado para realizar uma ou mais operações de decodif icação de canal no sinal, tal como decodificação de correção de erro (por exemplo, decodificação convolucional compatível com taxa) e/ou decodificação por detecção de erros (por exemplo, decodificação por redundância cíclica), e/ou uma ou mais camadas de decodificação de protocolo de rede (por exemplo, Ethernet, TCP/IP, cdma2000).
O banco de filtros A110 é configurado para filtrar um sinal de entrada de acordo com um esquema de banda dividida para produzir uma sub-banda de baixa frequência e uma sub-banda de alta frequência. Dependendo dos critérios de projeto para aplicação específica, as sub-
13/80 bandas de saída podem ter larguras de banda iguais ou diferentes e podem ser sobrepostas ou não-sobrepostas. Uma configuração de banco de filtros A110 que produz mais do que duas sub-bandas também é possível. Por exemplo, um banco de filtros pode ser configurado para produzir um ou mais sinais de banda baixa que incluem componentes em uma faixa de frequência abaixo daquela do sinal de banda estreita S20 (tal como a faixa de 50-300 Hz) . Também é possível que tal banco de filtros seja configurado para produzir um ou mais sinais de banda alta adicionais, que incluem componentes em uma faixa de frequência acima daquela do sinal de banda alta S30 (tal como uma faixa de 14-20, 16-20 ou 16-32 kHz). Em tal caso, o encodificador de fala de banda larga A100 pode ser implementado para encodificar esse sinal ou sinais separadamente, e o multiplexador A130 pode ser configurado para incluir o sinal ou sinais codificados adicionais no sinal multiplexado S70 (por exemplo, como uma porção separável).
A Figura 3a mostra um diagrama de blocos de uma implementação A112 do banco de filtros Al 10 que é configurado para produzir dois sinais de sub-banda tendo taxas de amostragem reduzidas. O banco de filtros A110 é disposto para receber um sinal de fala de banda larga S10 tendo uma porção de alta freqüência (ou banda alta) e uma porção de baixa freqüência (ou banda baixa). O banco de filtros Al 12 inclui um caminho de processamento de banda baixa configurado para receber o sinal de fala de banda larga S10 e produzir um sinal de fala de banda estreita Ξ20, e um caminho de processamento de banda alta configurado para receber o sinal de fala de banda larga S10 e produzir sinal de fala de banda alta S30. Filtro passabaixa 110 filtra o sinal de fala de banda larga S10 para passar uma sub-banda de baixa freqüência selecionada, e
14/80 filtro passa-alta 130 filtra o sinal de fala de banda larga S10 para passar uma sub-banda de alta freqüência selecionada. Devido ao fato de ambos os sinais de sub-banda terem mais larguras de banda estreita do que o sinal de fala de banda larga Ξ10, suas taxas de amostragem podem ser reduzidas até certo ponto sem perda de informação. O downsampler 120 reduz a taxa de amostragem do sinal passabaixa de acordo com um fator de decimação desejado (por exemplo, mediante remoção de amostras do sinal e/ou substituindo as amostras com valores médios), e o downsampler 140 similarmente reduz a taxa de amostragem do sinal passa-alta de acordo com outro fator de decimação desejado.
A Figura 3b mostra um diagrama de blocos de uma implementação correspondente B122 do banco de filtros B120. O upsampler 150 aumenta a taxa de amostragem do sinal de banda estreita S90 (por exemplo, mediante enchimento com zero e/ou mediante duplicação das amostras), e o filtro passa-baixa 160 filtra o sinal amostrado ascendentemente para passar apenas uma porção de banda baixa (por exemplo, para evitar aliasing). Similarmente, o upsampler 170 aumenta a taxa de amostragem do sinal de banda alta S100 e o filtro passa-alta 180 filtra o sinal amostrado ascendentemente para passar apenas uma porção de banda alta. Os dois sinais de banda passante são então somados para formar o sinal de fala de banda larga S110. Em algumas implementações do decodificador B100, o banco de filtros B120 é configurado para produzir uma soma ponderada dos dois sinais de banda passante de acordo com um ou mais pesos recebidos e/ou calculados pelo decodificador de banda alta B200. Uma configuração do banco de filtros B120 que combina mais do que dois sinais de banda passante também é considerada.
15/80
Cada um dos filtros 110, 130, 160, 180 pode ser implementado como um filtro de resposta finita ao impulso (FIR) ou como um filtro de resposta infinita ao impulso (IIR). As respostas de frequência dos filtros 110 e 130 do encodificador podem ter regiões de transição de formato simétrico ou de formato diferente entre a banda de parada e a banda passante. Similarmente, as respostas de freqüência dos filtros 160 e 180 do decodificador podem ter regiões de transição simétricas ou de formato diferente entre banda de parada e banda passante. Pode ser desejável, mas não é estritamente necessário que o filtro passa-baixa 110 tenha a mesma resposta que o filtro passa-baixa 160, e que o filtro passa-alta 130 tenha a mesma resposta que o filtro passa-alta 180. Em um exemplo, os dois pares de filtros 110, 130 e 160, 180 são bancos de filtros de espelho em quadratura (QMF) , com o par de filtros 110, 130 tendo os mesmos coeficientes que o par de filtros 160, 180.
Em um exemplo típico, o filtro passa-baixa 110 tem uma banda passante que inclui a faixa de PSTN limitada de 300-3400 Hz (por exemplo, a banda de 0 a 4 kHz) . As Figuras 4a e 4b mostram larguras de banda relativas do sinal de fala de banda larga S10, sinal de banda estreita S20, e sinal de banda alta Ξ30 em dois exemplos de implementação diferentes. Nesses dois exemplos específicos, o sinal de fala de banda larga S10 tem uma taxa de amostragem de 16 kHz (representando componentes de freqüência dentro da faixa de 0 a 8 kHz) , e o sinal de banda estreita S20 tem uma taxa de amostragem de 8 kHz (representando componentes de freqüência dentro da faixa de 0 a 4 kHz).
No exemplo da Figura 4a, não existe sobreposição significativa entre as duas sub-bandas. Um sinal de banda alta Ξ30, como mostrado nesse exemplo, pode ser obtido
16/80 utilizando-se um filtro passa-alta 130 com uma banda passante de 4-8 kHz. Em tal caso, pode ser desejável reduzir a taxa de amostragem para 8 kHz mediante subamostragem do sinal filtrado por um fator de dois. Tal operação, a qual se pode esperar que reduza significativamente a complexidade computacional de operações de processamento adicionais no sinal, mudará a energia de banda passante descendentemente para a faixa de 0 a 4 kHz sem perda de informação.
No exemplo alternativo da Figura 4b, as subbandas superior e inferior têm uma sobreposição considerável, de tal modo que a região de 3, 5 a 4 kHz seja descrita por ambos os sinais de sub-banda. Um sinal de banda alta 330, como nesse exemplo, pode ser obtido utilizando-se um filtro passa-alta 130 com uma banda passante de 3,5-7 kHz. Em tal caso, pode ser desejável reduzir a taxa de amostragem para 7 kHz mediante subamostragem do sinal filtrado por um fator de 16/7. Tal operação, que pode ser esperada para reduzir significativamente a complexidade computacional de operações de processamento adicionais no sinal, mudará a energia de banda passante descendentemente para a faixa de 0 a 3,5 kHz sem perda de informação.
Em um aparelho telefônico tipico para comunicação telefônica, um ou mais dentre os transdutores (isto é, o microfone e o auricular ou alto-falante) não tem uma resposta considerável através da faixa de frequência de 7-8 kHz. No exemplo da Figura 4b, a porção do sinal de fala de banda larga Ξ10 entre 7 e 8 kHz não é incluída no sinal encodifiçado. Outros exemplos específicos de filtro passaalta 130 têm bandas passantes de 3,5-7,5 kHz e 3,5-8 kHz.
Em algumas implementações, prover uma sobreposição entre sub-bandas como no exemplo da Figura 4b
17/80 permite o uso de um filtro passa-baixa e/ou passa-alta tendo um roll-off suave sobre a região sobreposta. Tais filtros são, tipicamente, mais fáceis de projetar, menos complexos em termos de computação e/ou introduzem menos retardo do que os filtros com respostas mais acentuadas ou parede de tijolos (brick-wall)”. Os filtros tendo regiões de transmissão acentuadas tendem a ter lobos laterais maiores (os quais podem causar aliasing) do que os filtros de ordem similar que tem roll-offs suaves. Os filtros tendo regiões de transição acentuadas também podem ter respostas a impulso longas que podem causar artefatos de toque. Para implementações de banco de filtros tendo um ou mais filtros IIR, permitindo um roll-off suave através da região sobreposta pode permitir o uso de um filtro ou filtros cujos pólos estão mais distantes do círculo unitário, o que pode ser importante para garantir implementação de ponto fixo estável.
A sobreposição de sub-bandas permite uma combinação suave de banda baixa e banda alta que pode conduzir a um número menor de artefatos audíveis, reduzindo aliasing e/ou uma transição menos perceptível de uma banda para outra. Além disso, a eficiência de codificação do encodificador de banda estreita A120 (por exemplo, um codificador de forma de onda) pode diminuir com a freqüência aumentando. Por exemplo, a qualidade de codificação do codificador de banda estreita pode ser reduzida em baixas taxas de bits, especialmente na presença de ruído de fundo. Em tais casos, prover uma sobreposição das sub-bandas pode aumentar a qualidade dos componentes de freqüência reproduzidos na região sobreposta.
Além disso, a sobreposição de sub-bandas permite uma mistura suave de banda baixa e banda alta que pode levar a um número menor de artefatos audíveis, aliasing
18/80
.^d3A *g .™ a.
_ Rub;O > Ί— reduzido e/ou uma transição menos perceptível de uma banda para a outra. Tal característica pode ser especialmente desejável para uma implementação na qual o encodificador de banda estreita A120 e o encodificador de banda alta A200 operam de acordo com diferentes metodologias de codificação. Por exemplo, técnicas de codificação diferentes podem produzir sinais que soam muito diferentes. Um codificador que encodifica um envelope espectral na forma de índices de livro-código pode produzir um sinal tendo um som diferente de um codificador que encodifica em vez disso o espectro de amplitude. Um codificador de domínio de tempo (por exemplo, uma modulação de pulsocódigo ou codificador PCM) pode produzir um sinal tendo um som diferente de um codificador de freqüência-domínio. Um codificador que encodifica um sinal com uma representação do envelope espectral e o sinal residual correspondente pode produzir um sinal tendo um som diferente de um codificador que encodifica um sinal com apenas uma representação do envelope espectral. Um codificador que encodifica um sinal como uma representação de sua forma de onda pode produzir uma saída tendo um som diferente daquele de um codificador senoidal. Em tais casos, usar filtros tendo regiões de transição acentuadas para definir subbandas de não-sobreposição pode levar a uma transição abrupta e perceptível entre as sub-bandas no sinal de banda larga sintetizado.
Embora bancos de filtros QMF tendo respostas de freqüência complementarmente sobrepostas sejam frequentemente usados em técnicas de sub-banda, tais filtros são inadequados para pelo menos algumas das implementações de codificação de banda larga, aqui descritas. Um banco de filtros QMF no encodificador é configurado para criar um grau significativo de aliasing
19/80 que é cancelado no banco de filtros QMF correspondente no decodificador. Tal arranjo pode não ser apropriado para uma aplicação na qual o sinal incorre em uma quantidade significativa de distorção entre os bancos de filtros, uma vez que a distorção pode reduzir a eficácia da propriedade de cancelamento de alias. Por exemplo, aplicações descritas aqui incluem implementações de codificação configuradas para operar em taxas de bits muito baixas. Como consequência da taxa de bits muito baixa, o sinal decodificado provavelmente parecerá significativamente distorcido em comparação com o sinal original, de tal modo que o uso de bancos de filtros QMF pode levar ao aliasing não-cancelado. Aplicações que utilizam bancos de filtros QMF têm tipicamente taxas de bits mais altas (por exemplo, acima de 12 kbps para AMR e 64 kbps para G.722).
Adicionalmente, um codificador pode ser configurado para produzir um sinal sintetizado que é perceptualmente similar ao sinal original, mas o qual difere efetivamente de forma significativa do sinal original. Por exemplo, um codificador que deriva a excitação de banda alta a partir do residual de banda estreita como descrito aqui pode produzir tal sinal, uma vez que o residual de banda alta efetivo pode estar completamente ausente do sinal decodificado. O uso de bancos de filtros QMF em tais aplicações pode levar a um grau significativo de distorção causado por aliasing nãocancelado.
A quantidade de distorção causada por aliasing QMF pode ser reduzida se a sub-banda afetada for estreita, uma vez que o efeito do aliasing é limitado a uma largura de banda igual à largura da sub-banda. Para exemplos como descritos aqui nos quais cada sub-banda inclui aproximadamente metade da largura de banda da banda larga,
20/80
contudo, a distorção causada por aliasing não-cancelado poderia afetar uma parte significativa do sinal. A qualidade do sinal também pode ser afetada pela localização da banda de frequência sobre a qual ocorre o aliasing nãocancelado. Por exemplo, distorção criada próxima ao centro de um sinal de fala de banda larga (por exemplo, entre 3 e 4 kHz) pode ser muito mais censurável do que a distorção que ocorre próximo a uma borda do sinal (por exemplo, acima de 6 kHz).
Embora as respostas dos filtros de um banco de filtros QMF sejam estritamente relacionadas uma à outra, os percursos de banda baixa e de banda alta dos bancos de filtros A110 e B120 podem ser configurados para ter espectros que são completamente não-relacionados exceto pela sobreposição das duas sub-bandas. Definimos a sobreposição de duas sub-bandas como a distância a partir do ponto no qual a resposta em frequência do filtro de banda alta cai para -20 dB até o ponto no qual a resposta em frequência do filtro de banda baixa cai para -20 dB. Em vários exemplos do banco de filtros A110 e/ou B120, essa sobreposição varia de aproximadamente 200 Hz a aproximadamente 1 kHz. A faixa de aproximadamente 4 00 a aproximadamente 600 Hz pode representar uma compensação desejável entre eficiência de codificação e suavidade perceptual. Em um exemplo especifico, como mencionado acima, a sobreposição é de aproximadamente 500 Hz.
Pode ser desejável implementar o banco de filtros A112 e/ou B122 para realizar operações conforme ilustrado nas Figuras 4a e 4b em vários estágios. Por exemplo, a Figura 4c mostra um diagrama de blocos de uma implementação A114 do banco de filtros A112 que realiza um equivalente funcional das operações de subamostragem e de filtragem por passa-alta utilizando uma série de operações de
21/80 interpolação, reamostragem, decimaçâo e outras. Tal implementação pode ser mais fácil de projetar e/ou pode permitir a reutilização de blocos funcionais de lógica e/ou código. Por exemplo, o mesmo bloco funcional pode ser usado para realizar as operações de decimaçâo para 14 kHz e decimaçâo para 7 kHz como mostrado na Figura 4c. A operação de reversão espectral pode ser implementada mediante multiplicação do sinal com a função e11”1 ou a seqüência (-1), cujos valores alternam entre +1 e -1. A operação de formatação espectral pode ser implementada como um filtro passa-baixa configurado para formatar o sinal para obter uma resposta de filtro global desejada.
Observa-se que como uma consequência da operação de reversão espectral, o espectro do sinal de banda alta S30 é revertido. Operações subseqüentes no encodificador e decodificador correspondente podem ser configuradas de acordo. Por exemplo, o gerador de excitação de banda alta A300 como aqui descrito pode ser configurado para produzir um sinal de excitação de banda alta S120 que também tem uma forma espectralmente revertida.
A Figura 4d mostra um diagrama de blocos de uma implementação B124 do banco de filtros B122 que realiza um equivalente funcional das operações de superamostragem e filtragem por passa-alta utilizando uma série de operações de interpolação, reamostragem e outras. O banco de filtros B124 inclui uma operação de reversão espectral na banda alta que reverte uma operação similar conforme realizada, por exemplo, em um banco de filtros do encodificador, tal como o banco de filtros A114. Nesse exemplo especifico, o banco de filtros B124 inclui também filtros rejeita-banda (notch filter) na banda baixa e banda alta que atenuam uma componente do sinal em 7100 Hz, embora tais filtros sejam opcionais e não precisem ser incluídos. O Pedido de Patente
SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING depositado com o presente, agora numeração de publicação U.S. 2007/0088558, inclui descrição adicional e figuras relacionadas às respostas de elementos de implementações específicas dos bancos de filtros A110 e B120, e esse material é pelo presente incorporado como referência.
O encodificador de banda estreita A120 é implementado de acordo com um modelo de filtro-fonte que encodifica o sinal de fala de entrada como (A) um conjunto de parâmetros que descrevem um filtro e (B) um sinal de excitação que aciona o filtro descrito para produzir uma reprodução sintetizada do sinal de fala de entrada. A
Figura 5A mostra um exemplo de um envelope espectral de um sinal de fala. Os picos que particularizam esse envelope espectral representam ressonâncias do trato vocal e são denominados formantes. A maioria dos codificadores de fala encodifica pelo menos essa estrutura espectral grosseira como um conjunto de parâmetros, tais como coeficientes de filtro.
A Figura 5B mostra um exemplo de um arranjo de filtro-fonte básico conforme aplicado na codificação do envelope espectral do sinal de banda estreita S20. Um módulo de análise calcula um conj unto de parâmetros que particulariza um filtro correspondendo ao som de fala por um período de tempo (tipicamente 20 ms). Um filtro branqueador (também denominado um filtro de erro de predição ou análise) configurado de acordo com tais parâmetros de filtro remove o envelope espectral para aplanar espectralmente o sinal. O sinal branqueado resultante (também chamado residual) tem menos energia e desse modo menos variância e é mais fácil de encodificar do que o sinal de fala original. Erros resultantes da
23/80 codificação do sinal residual podem também ser espalhados mais igualmente através do espectro. Os parâmetros de filtro e residual são tipicamente quantizados para transmissão eficiente através do canal. No decodificador, um filtro de síntese configurado de acordo com os parâmetros de filtro é excitado por um sinal com base no residual para produzir uma versão sintetizada do som de fala original. O filtro de síntese é configurado tipicamente para ter uma função de transferência que é o inverso da função de transferência do filtro branqueador.
A Figura 6 mostra um diagrama de blocos de uma implementação básica A122 do encodificador de banda estreita A120. Nesse exemplo, um módulo de análise de codificação de predição linear (LPC) 210 encodifica o envelope espectral do sinal de banda estreita S20 como um conjunto de coeficientes de predição linear (LP) (por exemplo, coeficientes de um filtro todos os pólos 1/A(z)). O módulo de análise processa tipicamente o sinal de entrada como uma série de quadros de não-sobreposição, com um novo conjunto de coeficientes sendo calculado para cada quadro. O período de quadro é geralmente um período através do qual se pode esperar que o sinal seja localmente estacionário; um exemplo comum é de 20 milissegundos (equivalente a 160 amostras em uma taxa de amostragem de 8 kHz). Em um exemplo, o módulo de análise LPC 210 é configurado para calcular um conjunto de 10 coeficientes de filtro LP para particularizar a estrutura de formando de cada quadro de 20-milissegundos. Também é possível implementar o módulo de análise para processar o sinal de entrada como uma série de quadros sobrepostos.
modo de análise pode ser configurado para analisar as amostras de cada quadro diretamente, ou as amostras podem ser ponderadas em primeiro lugar de acordo
com a função de janelamento (por exemplo, uma janela de Hamming). A análise também pode ser realizada através de uma janela que é maior do que o quadro, tal como uma janela de 30 ms. Essa janela pode ser simétrica (por exemplo, 520-5, de tal modo que ela inclua os 5 milissegundos imediatamente antes e após o quadro de 20 milissegundos) ou assimétrica (por exemplo, 10-20, de tal modo que ela inclua os últimos 10 milissegundos do quadro precedente). Um módulo de análise LPC é configurado tipicamente para calcular os coeficientes de filtro LP utilizando uma recursão Levinson-Durbin ou o algoritmo Leroux-Gueguen. Em outra implementação, o módulo de análise pode ser configurado para calcular um conjunto de coeficiente cepstrais para cada quadro em vez de um conjunto de coeficientes de filtro LP.
A taxa de saida do encodificador A120 pode ser reduzida significativamente, com relativamente pouco efeito sobre a qualidade de reprodução, mediante quantização dos parâmetros de filtro. Os coeficientes de filtro de predição linear são difíceis de quantizar eficientemente e normalmente são mapeados em outra representação, tal como pares espectrais de linha (LSPs) ou frequências espectrais de linha (LSFs), para quantização e/ou encodificação de entropia. No exemplo da Figura 6, a transformada de coeficiente de filtro LP para LSF 220 transforma o conjunto de coeficientes de filtro LP em um conjunto correspondente de LSFs. Outra representação de um-para-um dos coeficientes de filtro LP incluem coeficientes parcor; valores de logarítimo-de-relação-de-área; pares espectrais de imitância (ISPs); e frequências espectrais de imitância (ISFs) , que são usados no codec de GSM (Sistema Global para Comunicações Móveis) AMR-WB (Banda Larga-Multitaxa Adaptativa). Tipicamente uma transformada entre um conjunto
25/80 de coeficientes de filtro LP e um conjunto correspondente de LSFs é reversível, mas as modalidades também incluem implementações do encodificador A120 no qual a transformada não é reversível sem erro.
quantizador 230 é configurado para quantizar o conjunto de LSFs de banda estreita (ou outra representação de coeficiente), e o encodificador de banda estreita A122 é configurado para emitir o resultado dessa quantização como os parâmetros de filtro de banda estreita S40. Tal quantizador inclui tipicamente um quantizador de vetor que encodifica o vetor de entrada como um índice para uma entrada de vetor correspondente em uma tabela ou livrocódigo.
Como visto na Figura 6, o encodificador de banda estreita A122 também gera um sinal residual mediante passagem do sinal de banda estreita S20 através de um filtro branqueador 260 (também denominado filtro de erro de predição ou análise) que é configurado de acordo com o conjunto de coeficientes de filtro. Nesse exemplo específico, o filtro branqueador 260 é implementado como um filtro FIR, embora implementações IIR também possam ser usadas. Esse sinal residual conterá tipicamente informações perceptualmente importantes do quadro de fala, tal como estrutura de longo prazo relacionada à pitch, que não é representado nos parâmetros de filtro de banda estreita S40. O quantizador 270 é configurado para calcular uma representação quantizada desse sinal residual para saída como sinal de excitação de banda estreita encodificado S50. Tal quantizador inclui tipicamente um quantizador de vetor que encodifica o vetor de entrada como um índice para uma entrada de vetor correspondente em uma tabela ou livrocódigo. Alternativamente, tal quantizador pode ser configurado para enviar um ou mais parâmetros a partir dos
26/80 quais o vetor pode ser gerado dinamicamente no decodificador, ao invés de ser recuperado a partir do armazenamento, como em um método de livro-código disperso. Tal método é usado em esquemas de codificação tal como CELP algébrico (predição linear por excitação de livro-código) e codecs tal como 3GPP2 (Projeto de Parceria de Terceira Geração 2) EVRC (Codec de Taxa Variável Aperfeiçoado) .
É desejável para um encodificador de banda estreita A122 gerar o sinal de excitação de banda estreita encodificado de acordo com os mesmos valores de parâmetros de filtro que estarão disponíveis para o decodificador de banda estreita correspondente. Dessa maneira, o sinal de excitação de banda estreita encodificado resultante, já pode considerar até certo ponto as não-idealidades em tais valores de parâmetro, tal como erro de quantização. Consequentemente, é desejável configurar o filtro branqueador utilizando os mesmos valores de coeficiente que estarão disponíveis no decodificador. No exemplo básico do encodificador A122 como mostrado na Figura 6, o quantizador inverso 240 dequantiza os parâmetros de codificação de banda estreita S40, a transformada de coeficiente de filtro de LSF-para-LP 250 mapeia os valores resultantes de volta para um conjunto correspondente de coeficientes de filtro LP, e esse conjunto de coeficientes é usado para configurar o filtro branqueador 260 para gerar o sinal residual que é quantizado pelo quantizador 270.
Algumas implementações do encodificador de banda estreita A120 são configuradas para calcular o sinal de excitação de banda estreita encodificado S50 mediante identificação de um vetor entre um conjunto de vetores de livro-código que melhor coincide com o sinal residual. Observa-se, contudo, que o encodificador de banda estreita A120 também pode ser implementado para calcular uma
27/80 pv.3' t o Q vx;S' representação quantizada do sinal residual sem efetiValnênte gerar o sinal residual. Por exemplo, o encodificador de banda estreita A120 pode ser configurado para usar um número de vetores de livro-código para gerar sinais sintetizados correspondentes (por exemplo, de acordo com um conjunto atual de parâmetros de filtro), e para selecionar o vetor de livro-código associado ao sinal gerado que melhor coincide com o sinal de banda estreita original S20 em um domínio perceptualmente ponderado.
A Figura 7 mostra um diagrama de blocos de uma implementação B112 de decodificador de banda estreita B110. Quantizador inverso 310 dequantiza os parâmetros de filtro de banda estreita S40 (nesse caso, para um conjunto de LSFs), e a transformada de coeficiente de filtro LSF-paraLP 320 transforma os LSFs em um conjunto de coeficientes de filtro (por exemplo, como descrito acima com referência ao quantizador inverso 240 e transformada 250 do encodificador de banda estreita A122). 0 quantizador inverso 340 dequantiza o sinal de excitação de banda estreita encodificado Ξ50 para produzir um sinal de excitação de banda estreita S80. Com base nos coeficientes de filtro e sinal de excitação de banda estreita S80, o filtro de síntese de banda estreita 330 sintetiza o sinal de banda estreita Ξ90. Em outras palavras, o filtro de síntese de banda estreita 330 é configurado para formatar espectralmente o sinal de excitação de banda estreita S80 de acordo com os coeficientes de filtro dequantizados para produzir o sinal de banda estreita S90. O decodificador de banda estreita B112 também provê sinal de excitação de banda estreita S80 ao encodificador de banda alta A200, que o utiliza para derivar o sinal de excitação de banda alta S120 como descrito aqui. Em algumas implementações como descrito abaixo, o decodificador de banda estreita
Β110
28/80 pode ser configurado para prover informação adicional ao decodificador de banda alta B200 que se refere ao sinal de banda estreita, tal como inclinação espectral, ganho e atraso de pitch, e modo de fala.
O sistema do encodificador de banda estreita A122 e do decodificador de banda estreita BI 12 é um exemplo básico de um codec de fala de análise-por-síntese. A codificação por predição linear de excitação de livrocódigo (CELP) é uma família popular de codificação de análise-por-sintese, e implementações de tais codificadores podem realizar encodificação de forma de onda do residual, incluindo operações tais como seleção de entradas a partir de livros-código fixos e adaptativos, operações de minimização de erro, e/ou operações de ponderação perceptual. Outras implementações de codificação de análise-por-síntese incluem predição linear de excitação mista (MELP), CELP algébrico (ACELP), CELP de relaxamento (RCELP), excitação de pulso regular (RPE), CELP multi-pulso (MPE), e codificação de predição linear excitada de vetorsoma (VSELP). Métodos de codificação relacionados incluem codificação por excitação de multibanda (BEM) e por interpolação de forma de onda protótipo (PWI). Exemplos de codecs de fala de análise-por-síntese padronizados incluem o codec de taxa completa ETSI (Instituto de Padrões de Telecomunicações Europeu)-GSM (GSM 06.10), que utiliza predição linear excitada residual (RELP); o codec de taxa completa aperfeiçoado GSM (ETSI-GSM 06.60); codificador Annex E 11.8 kb/s G.729 padrão ITU (União Internacional de Telecomunicações); os codecs IS (Padrão ínterim)-641 para IS-136 (um esquema de acesso múltiplo por divisão de tempo); os codecs multitaxa adaptativos GSM (GSM-AMR); e o codec 4GV™ (Vocoder™ de Quarta Geração) (QUALCOMM Incorporated, San Diego, CA) . O encodificador de banda
29/80 estreita A120 e o decodificador correspondente B110 podem ser implementados de acordo com qualquer uma dessas tecnologias, ou qualquer outra tecnologia de codificação de fala (seja conhecida ou a ser desenvolvida) que represente um sinal de fala como (A) um conjunto de parâmetros que descreve um filtro e (B) um sinal de excitação usado para orientar o filtro descrito para reproduzir o sinal de fala.
Mesmo após o filtro branqueador ter removido o envelope espectral grosseiro do sinal de banda estreita S20, uma quantidade considerável de estrutura harmônica fina pode permanecer, especialmente para fala com voz. A Figura 8A mostra um gráfico espectral de um exemplo de um sinal residual, conforme pode ser produzido por um filtro branqueador, para um sinal com voz tal como uma vogal. A estrutura periódica visível nesse exemplo é relacionada ao pitch, e diferentes sons de voz falados pelo mesmo orador podem ter diferentes estruturas formantes, porém estruturas de pitch similares. A Figura 8B mostra um gráfico de domínio do tempo de um exemplo de tal sinal residual que mostra uma seqüência de pulsos de pitch em tempo.
A eficiência de codificação e/ou qualidade de fala pode ser aumentada mediante uso de um ou mais valores de parâmetro para encodificar características da estrutura de pitch. Uma característica importante da estrutura de pitch é a freqüência do primeiro harmônico (também denominada freqüência fundamental) , a qual é tipicamente na faixa de 60 a 400 Hz. Essa característica é tipicamente encodifiçada como o inverso da freqüência fundamental, também denominado atraso de pitch. O atraso de pitch indica o número de amostras em um período de pitch e pode ser encodif içado como um ou mais índices de livro-código.
Sinais de fala de oradores masculinos tendem a ter retardos
30/80 de pitch maiores do que os sinais de fala de oradores do sexo feminino.
Outra característica de sinal relacionado à estrutura de pitch é a periodicidade, que indica a intensidade da estrutura harmônica ou, em outras palavras, o grau no qual o sinal é harmônico ou nâo-harmônico. Dois indicadores típicos de periodicidade são: cruzamentos zero e funções de autocorrelação normalizadas (NACFs). A periodicidade também pode ser indicada pelo ganho de pitch, que é comumente encodificado como um ganho de livro-código (por exemplo, um ganho de livro-código adaptativo quantizado).
O encodificador de banda estreita A120 pode incluir um ou mais módulos configurados para encodificar a estrutura harmônica de longo prazo de sinal de banda estreita S20. Como mostrado na Figura 9, um paradigma CELP típico que pode ser usado inclui um módulo de análise LPC de loop aberto, o qual encodifica as características de curto prazo ou envelope espectral grosseiro, seguido de um estágio de análise de predição de longo prazo de loop fechado, que encodifica a estrutura harmônica ou de pitch fina. As características de curto prazo são encodifiçadas como coeficientes de filtro, e as características de longo prazo são encodifiçadas como valores para parâmetros tais como atraso de pitch e ganho de pitch. Por exemplo, o encodificador de banda estreita A120 pode ser configurado para emitir sinal de excitação de banda estreita encodificado S50 em uma forma que inclui um ou mais índices de livro-código (por exemplo, um índice de livro-código fixo e um índice de livro-código adaptativo) e valores de ganho correspondentes. Cálculo dessa representação quantizada do sinal residual de banda estreita (por exemplo, pelo quantizador 270) pode incluir selecionar tais .Ü3 Ay
31/80 ‘
índices e calcular tais valores. A encodificação da estrutura de pitch também pode incluir interpolação de uma forma de onda protótipo de pitch, cuja operação pode incluir calcular uma diferença entre pulsos de pitch sucessivos. A modelagem da estrutura de longo prazo pode ser desabilitada para os quadros correspondendo a uma fala sem voz, a qual é tipicamente semelhante a ruído e não estruturada.
Uma implementação do decodificador de banda estreita B110 de acordo com um paradigma como mostrado na Figura 9 pode ser configurada para emitir sinal de excitação de banda estreita S80 para o decodificador de banda alta B200 após a estrutura de longo prazo (estrutura harmônica ou de pitch) ter sido restaurada. Por exemplo, tal decodificador pode ser configurado para emitir sinal de excitação de banda estreita S80 como uma versão dequantizada do sinal de excitação de banda estreita encodificado Ξ50. Evidentemente, também é possível implementar o decodificador de banda estreita B110 de tal modo que o decodificador de banda alta B200 realiza dequantização do sinal de excitação de banda estreita encodificado Ξ50 para obter o sinal de excitação de banda estreita 380.
Em uma implementação do encodificador de fala de banda larga A100 de acordo com um paradigma como mostrado na Figura 9, o encodificador de banda alta A200 pode ser configurado para receber o sinal de excitação de banda estreita conforme produzido pela análise de curto prazo ou filtro branqueador. Em outras palavras, o encodificador de banda estreita A120 pode ser configurado para emitir o sinal de excitação de banda estreita para o encodificador de banda alta A200 antes da encodificação da estrutura de longo prazo. É desejável, contudo, que o encodificador de
32/80 banda alta A200 receba a partir do canal de banda estreita a mesma informação de codificação que será recebida pelo decodif icador de banda alta B200, de tal modo que os parâmetros de codificação produzidos pelo encodificador de banda alta A200 já possam considerar até certo ponto as nâo-idealidades naquela informação. Desse modo pode ser preferível que o encodificador de banda alta A200 reconstrua o sinal de excitação de banda estreita S80 a partir do mesmo sinal de excitação de banda estreita encodificado parametrizado e/ou quantizado S50 a ser emitido pelo encodificador de fala de banda larga A100. Uma vantagem potencial dessa abordagem é o cálculo mais exato dos fatores de ganho de banda alta S60b descritos abaixo.
Além dos parâmetros que particularizam a estrutura de curto prazo e/ou longo prazo do sinal de banda estreita S20, o encodificador de banda estreita A120 pode produzir valores de parâmetro que se relacionam a outras características do sinal de banda estreita Ξ20. Esses valores, os quais podem ser adequadamente quantizados para emissão pelo encodificador de fala de banda larga A100, podem ser incluídos entre os parâmetros de filtro de banda estreita S40 ou emitidos separadamente. O encodificador de banda alta A200 também pode ser configurado para calcular os parâmetros de codificação de banda alta S60 de acordo com um ou mais desses parâmetros adicionais (por exemplo, após dequantização) . No decodificador de fala de banda larga B100, o decodificador de banda alta' B200 pode ser configurado para receber os valores de parâmetro via o decodificador de banda estreita B110 (por exemplo, após dequantização). Alternativamente, o decodificador de banda alta B200 pode ser configurado para receber (e possivelmente dequantizar) os valores de parâmetro diretamente.
33/80
Em um exemplo de parâmetros de codificação de banda estreita adicionais, o encodificador de banda estreita A120 produz valores para inclinação espectral e parâmetros de modo de fala para cada quadro. Inclinação espectral se refere ao formato do envelope espectral sobre a banda passante e é tipicamente representada pelo primeiro coeficiente de reflexão quantizado. Para a maioria dos sons com voz, a energia espectral diminui com o aumento da freqüência, de tal modo que o primeiro coeficiente de reflexão é negativo e pode se aproximar de -1. A maioria dos sons com voz tem um espectro que ou é plano, de tal modo que o primeiro coeficiente de reflexão seja próximo de zero, ou tem mais energia em freqüências altas, de tal modo que o primeiro coeficiente de reflexão seja positivo e pode se aproximar de +1.
O modo de fala (também chamado modo de voz) indica se o quadro atual representa fala com voz ou sem voz. Esse parâmetro pode ter um valor binário com base em uma ou mais medidas de periodicidade (por exemplo, cruzamentos com zero, NACFs, ganho de pitch) e/ou atividade de voz para o quadro, tal como uma relação entre uma medida e o valor limite. Em outras implementações, o parâmetro de modo de fala tem um ou mais outros estados para indicar modos tais como ruído de fundo ou silêncio, ou uma transição entre silêncio e fala com voz.
O encodificador de banda alta A200 é configurado para encodificar sinal de banda alta Ξ30 de acordo com um modelo de fonte-filtro, com a excitação para esse filtro se baseando no sinal de excitação de banda estreita encodifiçado. A Figura 10 mostra um diagrama de blocos de uma implementação A202 do encodificador de banda alta A200 que é configurado para produzir um fluxo de parâmetros de codificação de banda alta S60 incluindo parâmetros de
filtro de banda alta S60a e fatores de ganho de banda alta S60b. 0 gerador de excitação de banda alta A300 deriva um sinal de excitação de banda alta S120 a partir do sinal de excitação de banda estreita encodifiçado S50. O módulo de análise A210 produz um conjunto de valores de parâmetro que particularizam o envelope espectral do sinal de banda alta S30. Nesse exemplo especifico, o módulo de análise A210 é configurado para realizar análise LPC para produzir um conjunto de coeficientes de filtro LP para cada quadro do sinal de banda alta S30. Transformada de coeficiente de filtro de predição linear-para-LSF 410 transforma o conjunto de coeficientes de filtro LP em um conjunto correspondente de LSFs. Como observado acima com referência ao módulo de análise 210 e transformada 220, o módulo de análise A210 e/ou transformada 410 pode ser configurado para usar outros conjuntos de coeficiente (por exemplo, coeficientes cepstrais) e/ou representações de coeficiente (por exemplo, ISPs).
quantizador 420 é configurado para quantizar o conjunto de LSFs de banda alta (ou outra representação de coeficiente, tal como ISPs) , e o encodificador de banda alta A202 é configurado para emitir o resultado dessa quantizaçâo como os parâmetros de filtro de banda alta S60a. Tal quantizador inclui tipicamente um quantizador de vetor que encodifica o vetor de entrada como um índice para uma entrada de vetor correspondente em uma tabela ou livrocódigo.
encodificador de banda alta A202 também inclui um filtro de síntese A220 configurado para produzir um sinal de banda alta sintetizado S130 de acordo com o sinal de excitação de banda alta S120 e o envelope espectral encodificado (por exemplo, o conjunto de coeficientes de filtro LP) produzido pelo módulo de análise A210. O filtro
35/80 de síntese A220 é tipicamente implementado como um filtro IIR, embora as implementações em FIR também possam ser usadas. Em um exemplo específico, o filtro de síntese A220 é implementado como um filtro auto-regressivo linear de sexta ordem.
O calculador de fator de ganho de banda alta A230 calcula uma ou mais diferenças entre os níveis do sinal de banda alta original S30 e o sinal de banda alta sintetizado S130 para especificar um envelope de ganho para o quadro. O quantizador 430, o qual pode ser implementado como um quantizador de vetor que encodifica o vetor de entrada como um índice para uma entrada de vetor correspondente em uma tabela ou livro-código, quantiza o valor ou valores especificando o envelope de ganho, e o encodificador de banda alta A202 é configurado para emitir o resultado dessa quantização como fatores de ganho de banda alta S60b.
Em uma implementação como mostrado na Figura 10, o filtro de síntese A220 é disposto para receber os coeficientes de filtro a partir do módulo de análise A210. Uma implementação alternativa do encodificador de banda alta A202 inclui um quantizador inverso e uma transformada inversa configurada para decodificar os coeficientes de filtro a partir dos parâmetros de filtro de banda alta S60a, e nesse caso o filtro de síntese A220 é disposto para receber em vez disso os coeficientes de filtro decodificados. Tal arranjo alternativo pode suportar cálculo mais exato do envelope de ganho pelo calculador de ganho de banda alta A230.
Em um exemplo específico, o módulo de análise A210 e o calculador de ganho de banda alta A230 emitem um conjunto de seis LSFs e um conjunto de cinco valores de ganho por quadro, respectivamente, de tal modo que uma extensão de banda larga do sinal de banda estreita S20 pode
36/80 ser conseguida apenas com onze valores adicionais por quadro. O ouvido tende a ser menos sensível aos erros em freqüência em freqüências altas, de tal modo que codificação de banda alta em uma ordem LPC baixa possa produzir um sinal tendo uma qualidade perceptual comparável à codificação de banda estreita em uma ordem LPC superior. Uma implementação típica do encodificador de banda alta A200 pode ser configurada para emitir de 8 a 12 bits por quadro para reconstrução de alta qualidade do envelope espectral e outros 8 a 12 bits por quadro para reconstrução de alta qualidade do envelope temporal. Em outro exemplo específico, o módulo de análise A210 emite um conjunto de oito LSFs por quadro.
Algumas implementações do encodificador de banda alta A200 são configuradas para produzir sinal de excitação de banda alta S120 mediante geração de um sinal de ruído aleatório tendo componentes de freqüência de banda alta e modulando em amplitude o sinal de ruído de acordo com o envelope de domínio de tempo do sinal de banda estreita S20, sinal de excitação de banda estreita S80, ou sinal de banda alta S30. Contudo, embora tal método baseado em ruído possa produzir resultados adequados para sons sem voz, ele pode não ser desejável para sons com voz, cujos residuais são normalmente harmônicos e consequentemente têm certa estrutura periódica.
gerador de excitação de banda alta A300 é configurado para gerar sinal de excitação de banda alta S120 mediante extensão do espectro do sinal de excitação de banda estreita Ξ80 para a faixa de freqüência de banda alta. A Figura 11 mostra um diagrama de blocos de uma implementação A302 do gerador de excitação de banda alta A300. 0 quantizador inverso 450 é configurado para dequantizar o sinal de excitação de banda estreita
37/80 encodificado S50 para produzir o sinal de excitação de banda estreita S80. 0 extensor de espectro A400 é configurado para produzir um sinal estendido harmonicamente S160 baseado no sinal de excitação de banda estreita S80. O combinador 470 é configurado para combinar um sinal de ruído aleatório gerado pelo gerador de ruído 480 e um envelope de domínio do tempo calculado pelo calculador de envelope 460 para produzir um sinal de ruído modulado S170. O combinador 490 é configurado para misturar o sinal harmonicamente estendido S160 e o sinal de ruído modulado Ξ170 para produzir o sinal de excitação de banda alta S120.
Em um exemplo, o extensor de espectro A400 é configurado para realizar uma operação de dobramento espectral {também denominado espelhagem) no sinal de excitação de banda estreita S80 para produzir sinal harmonicamente estendido S160. Dobramento espectral pode ser realizado pelo sinal de excitação de enchimento com zeros S80 e, então, aplicando-se um filtro passa-alta para reter o alias. Em outro exemplo, o extensor de espectro A400 é configurado para produzir sinal harmonicamente estendido S160 mediante translação espectral do sinal de excitação de banda estreita S80 para a banda alta (por exemplo, por intermédio de superamostragem seguida de multiplicação com um sinal de co-seno de frequência constante).
Os métodos de translação e dobramento espectral podem produzir sinais espectralmente estendidos cuja estrutura harmônica é descontínua com a estrutura harmônica original do sinal de excitação de banda estreita S80, em fase e/ou frequência. Por exemplo, tais métodos podem produzir sinais tendo picos que não são geralmente localizados em múltiplos da frequência fundamental, que pode causar artefatos de sonoridade minúscula no sinal de
38/80
fala reconstruído. Esses métodos também tendem a produzir harmônicos de alta frequência que têm características tonais não naturalmente fortes. Além disso, devido ao fato de um sinal PSTN poder ser amostrado em 8 kHz, porém limitado em banda a não mais do que 3.400 Hz, o espectro superior do sinal de excitação de banda estreita S80 pode conter pouca ou nenhuma energia, de tal modo que um sinal estendido gerado de acordo com uma operação de translação espectral ou dobramento espectral pode ter um buraco espectral acima de 3.400 Hz.
Outros métodos para gerar sinal harmonicamente estendido S160 incluem identificar uma ou mais frequências fundamentais do sinal de excitação de banda estreita S80 e gerar tons harmônicos de acordo com aquela informação. Por exemplo, a estrutura harmônica de um sinal de excitação pode ser particularizada pela frequência fundamental em conjunto com informações de fase e amplitude. Outra implementação do gerador de excitação de banda alta A300 gera um sinal harmonicamente estendido S160 com base na freqüência fundamental e amplitude (conforme indicado, por exemplo, pelo atraso de pitch e ganho de pitch). Contudo, a menos que o sinal harmonicamente estendido seja coerente em fase com o sinal de excitação de banda estreita Ξ80, a qualidade da fala decodificada resultante pode não ser aceitável.
□ma função não-linear pode ser usada para criar um sinal de excitação de banda alta que é coerente em fase com a excitação de banda estreita e preserva a estrutura harmônica sem descontinuidade de fase. Uma função nãolinear também pode prover um nível de ruído aumentado entre harmônicos de alta freqüência, o que tende a soar mais natural do que os harmônicos de alta freqüência tonal produzidos por métodos tal como translação espectral e
39/80 dobramento espectral. Funções não-lineares sem memória típicas que podem ser aplicadas pelas várias implementações do extensor de espectro A4 00 incluem a função de valor absoluto (também chamada de retificação de onda completa), retificação de meia onda, elevação ao quadrado, ao cubo, e corte. Outras implementações do extensor de espectro A400 podem ser configuradas para aplicar uma função não-linear tendo memória.
A Figura 12 é um diagrama de blocos de uma implementação A402 do extensor de espectro A400 que é configurada para aplicar uma função não-linear para estender o espectro do sinal de excitação de banda estreita S80. 0 upsampler 510 é configurado para realizar superamostragem do sinal de excitação de banda estreita S80. Pode ser desejável realizar superamostragem do sinal suficientemente para minimizar aliasing quando da aplicação da função não-linear. Em um exemplo específico, o upsampler 510 realiza superamostragem do sinal por um fator de oito. 0 upsampler 510 pode ser configurado para realizar a operação de superamostragem mediante preenchimento com zeros do sinal de entrada e filtragem por passa-baixa do resultado. 0 calculador de função não-linear 520 é configurado para aplicar uma função não-linear ao sinal superamostrado. Uma vantagem potencial da função de valor absoluto em relação às outras funções não-lineares para extensão espectral, tal como quadratura, é que a normalização de energia não é necessária. Em algumas implementações, a função de valor absoluto pode ser aplicada eficientemente mediante remoção ou retirada do bit de sinal de cada amostra. O calculador de função não-linear 520 também pode ser configurado para realizar uma distorção em amplitude do sinal espectralmente estendido ou superamostrado.
O downsampler 530 é configurado para realizar subamostragem do resultado espectralmente estendido da aplicação da função não-linear. Pode ser desejável que o downsampler 530 realize uma operação de filtragem por banda passante para selecionar uma banda de freqüência desejada do sinal espectralmente estendido antes de reduzir a taxa de amostragem (por exemplo, para reduzir ou evitar aliasing ou corrupção por uma imagem não desejada). Também pode ser desejável que o downsampler 530 reduza a taxa de amostragem em mais do que um estágio.
A Figura 12a é um diagrama que mostra os espectros de sinal em vários pontos em um exemplo de uma operação de extensão espectral, onde a escala de freqüência é a mesma através dos vários gráficos. O gráfico (a) mostra o espectro de um exemplo do sinal de excitação de banda estreita S80. O gráfico (b) mostra o espectro após o sinal S80 ter sofrido superamostragem por um fator de oito. O gráfico (c) mostra um exemplo do espectro estendido após aplicação de uma função não-linear. O gráfico (d) mostra o espectro após filtragem por passa-baixa. Nesse exemplo, a banda passante se estende até o limite de freqüência superior do sinal de banda alta Ξ30 (por exemplo, 7 kHz ou 8 kHz) .
gráfico (e) mostra o espectro após um primeiro estágio de subamostragem, no qual a taxa de amostragem é reduzida em um fator de quatro para obter um sinal de banda larga. 0 gráfico (f) mostra o espectro após uma operação de filtragem por passa-alta para selecionar a porção de banda alta do sinal estendido, e o gráfico (g) mostra o espectro após um segundo estágio de subamostragem, no qual a taxa de amostragem é reduzida por um fator de dois. Em um exemplo específico, o downsampler 530 realiza a filtragem passaalta e segundo estágio de subamostragem mediante passagem
41/80 do sinal de banda larga através do filtro passa-alta 130 e downsampler 140 do banco de filtros A112 (ou outras estruturas ou rotinas tendo a mesma resposta) para produzir um sinal espectralmente estendido tendo a faixa de freqüência e taxa de amostragem do sinal de banda alta S30.
Como pode ser visto no gráfico (g) subamostragem do sinal passa-alta, mostrada no gráfico (f) causa uma reversão de seu espectro. Nesse exemplo, o downsampler 530, é também configurado para realizar uma operação de inversão espectral no sinal. O gráfico (h) mostra um resultado da aplicação da operação de inversão espectral, a qual pode ser realizada mediante multiplicação do sinal com a função ejn” ou a seqüência (-l)n, cujos valores alternam entre +1 e -1. Tal operação é equivalente a deslocar o espectro digital do sinal no domínio da freqüência por uma distância de π. Observa-se que o mesmo resultado também pode ser obtido mediante aplicação das operações de inversão espectral e subamostragem em uma ordem diferente. As operações de superamostragem e/ou subamostragem também podem ser configuradas para incluir reamostragem para se obter um sinal espectralmente estendido tendo a taxa de amostragem do sinal de banda alta S30 (por exemplo, 7 kHz) .
Como observado acima, os bancos de filtros A110 e B120 podem ser implementados de tal modo que um ou ambos os sinais de banda estreita e banda alta S20, S30 tenham uma forma espectralmente reversa na saída do banco de filtros A110, sejam encodifiçados e decodificados na forma espectralmente reversa, e sejam outra vez espectralmente reversos no banco de filtros B120 antes de serem emitidos no sinal de fala de banda larga S110. Em tal caso, evidentemente, uma operação de inversão espectral como mostrado na Figura 12A não seria necessária, uma vez que
42/80 seria desejável que o sinal de excitação de banda alta S120 tivesse também uma forma espectralmente reversa.
As várias tarefas de superamostragem e subamostragem de uma operação de extensão espectral conforme realizada pelo extensor de espectro A402 podem ser configuradas e dispostas em muitas formas diferentes. Por exemplo, a Figura 12b é um diagrama que mostra os espectros de sinal em vários pontos em outro exemplo de uma operação de extensão espectral, onde a escala de freqüência é a mesma através dos vários gráficos. O gráfico (a) mostra o espectro de um exemplo de sinal de excitação de banda estreita S80. O gráfico (b) mostra o espectro após o sinal S80 ter sofrido superamostragem por um fator de dois. O gráfico (c) mostra um exemplo do espectro estendido após aplicação de uma função não-linear. Nesse caso, o aliasing que pode ocorrer nas freqüências mais altas é aceito.
O gráfico (d) mostra o espectro após uma operação de reversão espectral. O gráfico (e) mostra o espectro após um único estágio de subamostragem, no qual a taxa de amostragem é reduzida por um fator de dois para se obter o sinal espectralmente estendido desejado. Nesse exemplo, o sinal está na forma espectralmente reversa e pode ser usado em uma implementação do encodificador de banda alta A200 que processou o sinal de banda alta S30 em tal forma.
O sinal espectralmente estendido produzido pelo calculador de função não-linear 520 provavelmente tem um declive (dropoff) pronunciado em amplitude à medida que a freqüência aumenta. O extensor de espectro A402 inclui um aplanador espectral 540 configurado para realizar uma operação de branqueamento no sinal subamostrado. O aplanador espectral 540 pode ser configurado para realizar uma operação de branqueamento fixa ou para realizar uma operação de branqueamento adaptativa. Em um exemplo
específico de branqueamento adaptativo, o aplanador espectral 540 inclui um módulo de análise LPC configurado para calcular um conjunto de quatro coeficientes de filtro a partir do sinal amostrado descendentemente e um filtro de análise de quarta ordem configurado para branquear o sinal de acordo com esses coeficientes. Outras implementações do extensor de espectro A400 incluem configurações nas quais o aplanador espectral 540 opera no sinal espectralmente estendido antes do downsampler 530.
O gerador de excitação de banda alta A300 pode ser implementado para emitir sinal harmonicamente estendido S160 como sinal de excitação de banda alta Ξ120. Em alguns casos, contudo, utilizar apenas um sinal harmonicamente estendido como a excitação de banda alta pode resultar em artefatos audíveis. A estrutura harmônica da fala é geralmente menos pronunciada na banda alta do que na banda baixa, e usar muita estrutura harmônica no sinal de excitação de banda alta pode resultar em um som com zumbido. Esse artefato pode ser especialmente perceptível em sinais de fala a partir de oradores do sexo feminino.
As modalidades incluem implementações de gerador de excitação de banda alta A300 que são configurados para misturar sinal harmonicamente estendido S160 com um sinal de ruído. Como mostrado na Figura 11, o gerador de excitação de banda alta A302 inclui um gerador de ruído 480 que é configurado para produzir um sinal de ruído aleatório. Em um exemplo, o gerador de ruído 480 é configurado para produzir um sinal de ruído pseudoaleatório branco de variância unitária, embora em outras implementações o sinal de ruído não precise ser branco e possa ter uma densidade de potência que varia com a frequência. Pode ser desejável que o gerador de ruído 480 seja configurado para emitir o sinal de ruído como uma
44/80 função determinística de tal modo que seu estado possa ser duplicado no decodificador. Por exemplo, o gerador de ruído 480 pode ser configurado para produzir o sinal de ruído como uma função determinística de informações codificada anteriormente dentro do mesmo quadro, tal como os parâmetros de filtro de banda estreita S40 e/ou sinal de excitação de banda estreita encodifiçado S50.
Antes de ser misturado com o sinal harmonicamente estendido S160, o sinal de ruído aleatório produzido pelo gerador de ruído 4 80 pode ser modulado em amplitude para ter um envelope de domínio do tempo que se aproxima da distribuição de energia em relação ao tempo do sinal de banda estreita S20, sinal de banda alta S30, sinal de excitação de banda estreita S80, ou sinal harmonicamente estendido S160. Como mostrado na Figura 11, o gerador de excitação de banda alta A302 inclui um combinador 470 configurado para modular em amplitude o sinal de ruído produzido pelo gerador de ruído 480 de acordo com um envelope de domínio do tempo calculado pelo calculador de envelope 4 60. Por exemplo, o combinador 470 pode ser implementado como um multiplicador disposto para escalonar a saída do gerador de ruído 480 de acordo com o envelope de domínio do tempo calculado pelo calculador de envelope 460 para produzir o sinal de ruído modulado Ξ170.
Em uma implementação A304 do gerador de excitação de banda alta A302, como mostrado no diagrama de blocos da Figura 13, o calculador de envelope 460 é disposto para calcular o envelope do sinal harmonicamente estendido S160. Em uma implementação A306 do gerador de excitação de banda alta A302, como mostrado no diagrama de blocos da Figura 14, o calculador de envelope 460 é disposto para calcular o envelope do sinal de excitação de banda estreita S80. Implementações adicionais do gerador de excitação de banda
45/80 alta A302 podem ser configuradas de outra forma para adicionar ruído ao sinal harmonicamente estendido S160 de acordo com os locais dos pulsos de pitch de banda estreita em tempo.
O calculador de envelope 460 pode ser configurado para realizar um cálculo de envelope como uma tarefa que inclui uma série de subtarefas. A Figura 15 mostra um fluxograma de um exemplo T100 de tal tarefa. A subtarefa T110 calcula o quadrado de cada amostra do quadro do sinal cujo envelope deve ser modelado {por exemplo, sinal de excitação de banda estreita S80 ou sinal harmonicamente estendido SI60) para produzir uma seqüência de valores elevados ao quadrado. A subtarefa T120 realiza uma operação de suavização na seqüência de valores elevados ao quadrado. Em um exemplo, a subtarefa T120 aplica um filtro passabaixa IIR de primeira ordem para a seqüência de acordo com a expressão y(«) = ax(rt) + (1 - a)y(n -1), (1) onde x é a entrada de filtro, y é a saída de filtro, n é um índice de domínio do tempo, e a é um coeficiente de suavização tendo um valor entre 0,5 e 1. O valor do coeficiente de suavização a pode ser fixo ou, em uma implementação alternativa, pode ser adaptativo de acordo com uma indicação de ruído no sinal de entrada, de tal modo que a seja mais próximo de 1 na ausência de ruído e mais próximo de 0,5 na presença de ruído. A subtarefa T130 aplica uma função de raiz quadrada a cada amostra da seqüência suavizada para produzir o envelope de domínio do tempo.
Tal implementação de calculador de envelope 460 pode ser configurada para realizar as várias subtarefas da tarefa T100 na forma serial e/ou paralela. Em implementações adicionais da tarefa T100, a subtarefa T110
46/80 pode ser precedida por uma operação passa-faixa configurada para selecionar uma porção de frequência desejada do sinal cujo envelope deve ser modelado, tal como a faixa de 3-4 kHz.
O combinador 490 é configurado para misturar o sinal harmonicamente estendido S160 e o sinal de ruído modulado S170 para produzir o sinal de excitação de banda alta Ξ120. Implementações do combinador 490 podem ser configuradas, por exemplo, para calcular o sinal de excitação de banda alta S120 como uma soma do sinal harmonicamente estendido Ξ160 e sinal de ruído modulado S170. Tal implementação do combinador 490 pode ser configurada para calcular o sinal de excitação de banda alta S120 como uma soma ponderada mediante aplicação de um fator de ponderação ao sinal harmonicamente estendido S160 e/ou sinal de ruído modulado S170 antes da soma. Cada tal fator de ponderação pode ser calculado de acordo com um ou mais critérios e pode ser um valor fixo ou, alternativamente, um valor adaptativo que é calculado em uma base quadro-por-quadro ou subquadro-por-subquadro.
A Figura 16 mostra um diagrama de blocos de uma implementação 492 do combinador 490 que é configurada para calcular o sinal de excitação de banda alta S120 como uma soma ponderada do sinal harmonicamente estendido S160 e do sinal de ruído modulado S170. O combinador 492 é configurado para ponderar o sinal harmonicamente estendido Ξ160 de acordo com o fator de ponderação de harmônico S180, para ponderar o sinal de ruído modulado S170 de acordo com o fator de ponderação de ruído S190, e para emitir o sinal de excitação de banda alta S120 como uma soma dos sinais ponderados. Nesse exemplo, o combinador 492 inclui um calculador de fator de ponderação 550 que é configurado
47/80 para calcular o fator de ponderação de harmônico S180 e o fator de ponderação de ruído S190.
calculador de fator de ponderação 550 pode ser configurado para calcular os fatores de ponderação S180 e SI 90 de acordo com uma razão dese j ada de conteúdo de harmônico para conteúdo de ruído no sinal de excitação de banda alta S120. Por exemplo, pode ser desejável para o combinador 492 produzir sinal de excitação de banda alta S120 para ter uma relação de energia de harmônico para energia de ruído similar àquela do sinal de banda alta S30.
Em algumas implementações do calculador de fator de ponderação 550, os fatores de ponderação S180, S190 são calculados de acordo com um ou mais parâmetros relacionados a uma periodicidade do sinal de banda estreita S20 ou do sinal residual de banda estreita, tal como ganho de pitch e/ou modo de fala. Tal implementação do calculador de fator de ponderação 550 pode ser configurada para atribuir um valor ao fator de ponderação de harmônico S180 que é proporcional ao ganho de pitch, por exemplo, e/ou para atribuir um valor superior ao fator de ponderação de ruído S190 para sinais de fala sem voz do que para os sinais de fala com voz.
Em outras implementações, o calculador de fator de ponderação 550 é configurado para calcular valores para o fator de ponderação de harmônico S180 e/ou fator de ponderação de ruído S190 de acordo com uma medida de periodicidade do sinal de banda alta S30. Em tal exemplo, o calculador de fator de ponderação 550 calcula o fator de ponderação de harmônico S180 como o valor máximo do coeficiente de autocorrelação do sinal de banda alta S30 para o quadro ou subquadro atual, onde a autocorrelação é realizada através de uma faixa de busca que inclui um retardo de um atraso de pitch e não inclui um retardo de
amostras zero. A Figura 17 mostra um exemplo de uma tal faixa de busca de comprimento de n amostras que é centrada em torno de um retardo de um atraso de pitch e tem uma largura não maior do que um atraso de pitch.
A Figura 17 mostra também um exemplo de outra abordagem na qual o calculador de fator de ponderação 550 calcula uma medida da periodicidade do sinal de banda alta S30 em vários estágios. Em um primeiro estágio, o quadro atual é dividido em um número de subquadros, e o retardo para o qual o coeficiente de autocorrelação é máximo é identificado separadamente para cada subquadro. Como mencionado acima, a autocorrelação é realizada através de uma faixa de busca que inclui um retardo de um atraso de pitch e não inclui um retardo de amostras zero.
Em um segundo estágio, o quadro retardado é construído mediante aplicação do correspondente retardo identificado para cada subquadro, concatenando os subquadros resultantes para construir um quadro otimamente retardado, e calculando o fator de ponderação de harmônico S180 como o coeficiente de correlação entre o quadro original e o quadro otimamente retardado. Em uma alternativa adicional, o calculador de fator de ponderação 550 calcula o fator de ponderação de harmônico Ξ180 como uma média dos coeficientes de autocorrelação máximos obtidos no primeiro estágio para cada subquadro. Implementações do calculador de fator de ponderação 550 também podem ser configuradas para escalonar o coeficiente de correlação, e/ou para combinar o mesmo com outro valor, para calcular o valor para o fator de ponderação de harmônico S180.
Pode ser desejável que o calculador de fator de ponderação 550 calcule uma medida de periodicidade do sinal de banda alta S30 apenas em casos onde uma presença de
periodicidade no quadro é de outro modo indicada. Por exemplo, o calculador de fator de ponderação 550 pode ser configurado para calcular uma medida da periodicidade do sinal de banda alta S30 de acordo com uma relação entre outro indicador de periodicidade do quadro atual, tal como ganho de pitch, e um valor limite. Em um exemplo, o calculador de fator de ponderação 550 é configurado para realizar uma operação de autocorrelaçâo no sinal de banda alta S30 apenas se o ganho de pitch do quadro (por exemplo, o ganho de livro-código adaptativo do residual de banda estreita) tiver um valor de mais do que 0.5 (alternativamente, pelo menos 0.5). Em outro exemplo, o calculador de fator de ponderação 550 é configurado para realizar uma operação de autocorrelaçâo no sinal de banda , alta S30 apenas para os quadros tendo estados específicos de modo de fala (por exemplo, apenas para sinais com voz) .
Em tais casos, o calculador de fator de ponderação 550 pode ser configurado para atribuir um fator de ponderação default aos quadros que têm outros estados de modo de fala e/ou valores de ganho de pitch inferiores.
As modalidades incluem implementações adicionais do calculador de fator de ponderação 550 que são configuradas para calcular fatores de ponderação de acordo com as características diferentes de, ou em adição à periodicidade. Por exemplo, tal implementação pode ser configurada para atribuir um valor superior ao fator de ganho de ruído 3190 para sinais de fala tendo um atraso de pitch maior do que para os sinais de fala tendo um menor atraso de pitch. Outra implementação do calculador de fator de ponderação 550 é configurada para determinar uma medida da harmonicidade do sinal de fala de banda larga S10, ou do sinal de banda alta S30, de acordo com uma medida da energia do sinal em múltiplos da frequência fundamental
50/80 relativa à energia do sinal em outros componentes de freqüência.
Algumas implementações do encodificador de fala de banda larga A100 são configuradas para emitir uma indicação de periodicidade ou harmonicidade (por exemplo, um flag de um bit indicando se o quadro é harmônico ou nãoharmônico) com base no ganho de pitch e/ou outra medida de periodicidade ou harmonicidade como descrito aqui. Em um exemplo, um decodif icador de fala de banda larga correspondente B100 utiliza essa indicação para configurar uma operação tal como cálculo de fator de ponderação. Em outro exemplo, tal indicação é usada no encodificador e/ou decodificador no cálculo de um valor para um parâmetro do modo de fala.
Pode ser desejável para o gerador de excitação de banda alta A302 gerar o sinal de excitação de banda alta S120 de tal modo que a energia do sinal de excitação seja substancialmente não afetada pelos valores específicos dos fatores de ponderação S180 e S190. Em tal caso, o calculador de fator de ponderação 550 pode ser configurado para calcular um valor para o fator de ponderação de harmônico S180 ou para o fator de ponderação de ruído S190 (ou para receber tal valor a partir do armazenamento ou de outro elemento do encodificador de banda alta A200) e para derivar um valor para o outro fator de ponderação de acordo com uma expressão tal como (^™^O)2+(^)2=X (2) onde denota fator de ponderação de harmônico S180 e ^mído denota o fator de ponderação de ruído S190. Alternativamente, o calculador de fator de ponderação 550 pode ser configurado para selecionar, de acordo com um valor de uma medida de periodicidade para o quadro ou
51/80 subquadro atual, um fator correspondente entre uma pluralidade de pares de fatores de ponderação S180, S190, onde os pares são pré-calculados para satisfazer a uma relação de energia-constante tal como a expressão (2) . Para uma implementação de calculador de fator de ponderação 550 no qual a expressão (2) é observada, valores típicos para o fator de ponderação de harmônico S180 variam de aproximadamente 0,7 a aproximadamente 1,0, e valores típicos para o fator de ponderação de ruído S190 variam de aproximadamente 0,1 a aproximadamente 0,7. Outras implementações de calculador de fator de ponderação 550 podem ser configuradas para operar de acordo com uma versão da expressão (2) que é modificada de acordo com uma ponderação de linha base desejada entre o sinal harmonicamente estendido S160 e sinal de ruído modulado
3170.
Artefatos podem ocorrer em um sinal de fala sintetizado quando um livro-código disperso (aquele cujas entradas são na maior parte valores zero) foi utilizado para calcular a representação quantizada do residual. Dispersão de livro-código ocorre especialmente quando o sinal de banda estreita é encodificado em uma baixa taxa de bits. Os artefatos causados pela dispersão de livro-código são tipicamente quase periódicos no tempo e ocorrem na maior parte acima de 3 kHz. Devido ao fato da audição humana ter melhor resolução de tempo em frequências superiores, esses artefatos podem ser mais perceptíveis na banda alta.
Modalidades incluem implementações do gerador de excitação de banda alta A300 que são configuradas para realizar filtragem anti-dispersão. A Figura 18 mostra um diagrama de blocos de uma implementação A312 do gerador de excitação de banda alta A302 que inclui um filtro anti52/80 • Γ,.. Μ fiub:
-¾ <
dispersão 600 disposto para filtrar o sinal de excitação de banda estreita dequantizado produzido pelo quantizador inverso 450. A Figura 19 mostra um diagrama de blocos de uma implementação A314 do gerador de excitação de banda alta A302 que inclui um filtro anti-dispersão 600 disposto para filtrar o sinal espectralmente estendido produzido pelo extensor de espectro A400. A Figura 20 mostra um diagrama de blocos de uma implementação A316 do gerador de excitação de banda alta A302 que inclui um filtro antidispersão 600 disposto para filtrar a saída do combinador 490 para produzir o sinal de excitação de banda alta S120. Evidentemente, implementações do gerador de excitação de banda alta A300 que combinam as características de quaisquer das implementações A304 e A306 com as características de quaisquer das implementações A312, A314 e A316 são consideradas e aqui expressamente reveladas. O filtro anti-dispersão 600 também pode ser disposto dentro do extensor de espectro A400: por exemplo, após quaisquer dos elementos 510, 520, 530 e 540 no extensor de espectro A402. É expressamente verificado que o filtro antidispersão 600 também pode ser usado com implementações do extensor de espectro A400 que realiza dobramento espectral, translação espectral, ou extensão de harmônico.
filtro anti-dispersão 600 pode ser configurado para alterar a fase de seu sinal de entrada. Por exemplo, pode ser desejável que o filtro anti-dispersão 600 seja configurado e disposto de tal modo que a fase do sinal de excitação de banda alta S120 se torne aleatória ou, de outro modo, distribuída mais igualmente ao longo do tempo. Também pode ser desejável que a resposta do filtro antidispersão 600 seja espectralmente plana, de tal modo que o espectro de magnitude do sinal filtrado não seja consideravelmente mudado. Em um exemplo, o filtro anti53/80 οΐ^ Οά Λ,
- Μ) ο_ L7* ·. c<
- (Ο\Λ* dispersão 600 é implementado como tendo uma função de transferência de expressão :
l-0,7z4 l+0.6z
Um efeito de tal filtro pode ser o de sinal de entrada de modo que ela não um filtro passa-tudo acordo com a seguinte (3) espalhar a energia do mais seja concentrada em apenas umas poucas amostras.
Os artefatos causados por dispersão de livrocódigo são normalmente mais perceptíveis para os sinais semelhantes a ruído, onde o residual inclui menos informação de pitch, e também para fala em ruído de fundo. A dispersão tipicamente causa um número menor de artefatos em casos onde a excitação tem estrutura de longo prazo, e na realidade modificação de fase pode causar ruído nos sinais com voz. Desse modo pode ser desejável configurar o filtro anti-dispersão 600 para filtrar os sinais sem voz e passar pelo menos alguns sinais com voz sem alteração. Os sinais sem voz são particular!zados por um baixo ganho de pitch (por exemplo, ganho de livro-código adaptativo de banda estreita quantizada) e uma inclinação espectral (por exemplo, primeiro coeficiente de reflexão quantizado) que é próximo de zero ou positivo, indicando um envelope espectral que é plano ou inclinado no sentido para cima com freqüência incrementai. Implementações típicas de filtro anti-dispersão 600 são configuradas para filtrar sons sem voz (por exemplo, como indicado pelo valor da inclinação espectral), para filtrar os sinais com voz quando o ganho de pitch está abaixo de um valor limite (alternativamente, não superior ao valor limite), e de outro modo para passar o sinal sem alteração.
Implementações adicionais do filtro antidispersão 600 incluem dois ou mais filtros que são
configurados para ter diferentes ângulos de modificação de fase máxima (por exemplo, até 180 graus) . Em tal caso, o filtro anti-dispersão 600 pode ser configurado para selecionar dentre esses filtros componentes de acordo com um valor do ganho de pitch (por exemplo, o livro-código adaptativo quantizado ou ganho LTP) , de tal modo que um ângulo de modificação de fase máximo maior seja usado para quadros tendo valores de ganho de pitch menores. Uma implementação do filtro anti-dispersão 600 também pode incluir diferentes filtros componentes que são configurados para modificar a fase através de mais ou menos do espectro de frequência, de tal modo que um filtro configurado para modificar a fase através de uma faixa de frequência mais ampla do sinal de entrada seja usado para os quadros tendo valores de ganho de pitch menores.
Para reprodução exata do sinal de fala encodifiçado, pode ser desejável que a relação entre os níveis das porções de banda alta e de banda estreita do sinal de fala de banda larga sintetizado S100 seja similar àquele no sinal de fala de banda larga original S10. Em adição a um envelope espectral conforme representado pelos parâmetros de codificação de banda alta S60a, o encodificador de banda alta A200 pode ser configurado para particularizar o sinal de banda alta S30 mediante especificação de um envelope de ganho ou de tempo. Como mostrado na Figura 10, o encodificador de banda alta A202 inclui um calculador de fator de ganho de banda alta A230 que é configurado e disposto para calcular um ou mais fatores de ganho de acordo com uma relação entre o sinal de banda alta S30 e o sinal de banda alta sintetizado S130, tal como uma diferença ou relação entre as energias dos dois sinais através de um quadro ou de certa porção do mesmo. Em outras implementações do encodificador de banda
55/80 alta A202, o calculador de ganho de banda alta A230 pode ser similarmente configurado, porém disposto em vez disso para calcular o envelope de ganho de acordo com tal relação variável em tempo entre o sinal de banda alta S30 e o sinal de excitação de banda estreita S80 ou sinal de excitação de banda alta Ξ120.
Os envelopes temporais do sinal de excitação de banda estreita S80 e sinal de banda alta S30 provavelmente devem ser similares. Portanto, encodificar um envelope de ganho que se baseia em uma relação entre o sinal de banda alta S30 e o sinal de excitação de banda estreita S80 (ou um sinal derivado a partir daí, tal como sinal de excitação de banda alta S120 ou sinal de banda alta sintetizada S130) geralmente será mais eficiente do que encodificar um envelope de ganho com base apenas no sinal de banda alta S30. Em uma implementação típica, o encodificador de banda alta A202 é configurado para emitir um índice quantizado de 8 a 12 bits que especifica cinco fatores de ganho para cada quadro.
calculador de fator de ganho de banda alta A230 pode ser configurado para realizar cálculo de fator de ganho como uma tarefa que inclui uma ou mais séries de subtarefas. A Figura 21 mostra um fluxograma de um exemplo T200 de tal tarefa que calcula um valor de ganho para um subquadro correspondente de acordo com as energias relativas do sinal de banda alta S30 e sinal de banda alta sintetizado S130. As tarefas 220a e 220b calculam as energias dos subquadros correspondentes dos respectivos sinais. Por exemplo, as tarefas 220a e 220b podem ser configuradas para calcular a energia como uma soma dos quadrados das amostras do respectivo subquadro. A tarefa T230 calcula um fator de ganho para o subquadro como a raiz quadrada da relação dessas energias. Nesse exemplo, a
tarefa T230 calcula o fator de ganho como a raiz quadrada da relação da energia do sinal de banda alta S30 para a energia do sinal de banda alta sintetizado S130 em relação ao subquadro.
Pode ser desejável que o calculador de fator de ganho de banda alta A230 seja configurado para calcular as energias de subquadro de acordo com uma função de janelamento. A Figura 22 mostra um fluxograma de tal implementação T210 da tarefa de cálculo de fator de ganho T200. A tarefa T215a aplica uma função de janelamento ao sinal de banda alta S30, e a tarefa T215b aplica a mesma função de janelamento ao sinal de banda alta sintetizado
S130. As implementações 222a e 222b das tarefas 220a e220b calculam as energias das respectivas janelas, e a tarefa T230 calcula um fator de ganho para o subquadro como a raiz quadrada da relação das energias.
Pode ser desejável aplicar uma função de janelamento que sobrepõe subquadros adjacentes. Por exemplo, a função de janelamento que produz fatores de ganho que podem ser aplicados em uma forma de sobreposiçãoadição pode ajudar a reduzir ou evitar a descontinuidade entre subquadros. Em um exemplo, o calculador de fator de ganho de banda alta A230 é configurado para aplicar uma função de janelamento trapezoidal como mostrado na Figura
23a, na qual a janela se sobrepõe a cada um dos dois subquadros adjacentes em um milissegundo. A Figura 23b mostra uma aplicação dessa função de janelamento para cada um dos cinco subquadros de um quadro de 20 milissegundos. Outras implementações do calculador de fator de ganho de banda alta A230 podem ser configuradas para aplicar funções de janelamento tendo diferentes períodos de sobreposição e/ou diferentes formatos de janela (por exemplo, retangular, Hamming) que podem ser simétricos ou
57/80 assimétricos.
Também é possível para uma implementação do calculador de fator de ganho de banda alta A230 ser configurada para aplicar diferentes funções de janelamento aos diferentes subquadros dentro de um quadro e/ou para um quadro incluir subquadros de comprimentos diferentes.
Sem limitação, os valores a seguir são apresentados como exemplos para implementações específicas. Um quadro de 20 ms é suposto para esses casos, embora qualquer outra duração possa ser usada. Para um sinal de banda alta amostrado em 7 kHz, cada quadro tem 140 amostras. Se tal quadro é dividido em cinco subquadros de comprimento igual, cada subquadro terá 28 amostras, e a janela como mostrado na Figura 23a terá 42 amostras de largura. Para um sinal de banda alta amostrado em 8 kHz, cada quadro tem 160 amostras. Se tal quadro é dividido em cinco subquadros de comprimento igual, cada subquadro terá 32 amostras, e a janela como mostrado nas Figuras 23a será de 48 amostras de largura. Em outras implementações, os subquadros de qualquer largura podem ser usados, e é até mesmo possível que uma implementação do calculador de ganho de banda alta A2 30 seja configurada para produzir um fator de ganho diferente para cada amostra de um quadro.
A Figura 24 mostra um diagrama de blocos de uma implementação B202 do decodificador de banda alta B200. O decodificador de banda alta B202 inclui um gerador de excitação de banda alta B300 que é configurado para produzir o sinal de excitação de banda alta S120 com base no sinal de excitação de banda estreita Ξ80. Dependendo das escolhas do projeto de sistema específico, o gerador de excitação de banda alta B300 pode ser implementado de acordo com qualquer uma das implementações do gerador de excitação de banda alta A300 como descrito aqui.
Tipicamente, é desejável implementar o gerador de excitação
58/80 de banda alta B300 para ter a mesma resposta que o gerador de excitação de banda alta do encodificador de banda alta do sistema de codificação especifico. Devido ao fato do decodificador de banda estreita B110 realizar tipicamente a dequantização do sinal de excitação de banda estreita encodificado Ξ50, contudo, na maioria dos casos o gerador de excitação de banda alta B300 pode ser implementado para receber o sinal de excitação de banda estreita S80 a partir do decodificador de banda estreita B110 e não precisar incluir um quantizador inverso configurado para dequantizar o sinal de excitação de banda estreita encodificado S50. Também é possível que o decodificador de banda estreita B110 seja implementado para incluir uma ocorrência do filtro anti-dispersão 600 disposto para filtrar o sinal de excitação de banda estreita dequantizado antes de ser introduzido em um filtro de síntese de banda estreita, tal como filtro 330.
O quantizador inverso 560 é configurado para dequantizar os parâmetros de filtro de banda alta S60a (nesse exemplo, para um conjunto de LSFs), e a transformada de coeficiente de filtro de LSF-para-LP 570 é configurada para transformar os LSFs em um conjunto de coeficientes de filtro (por exemplo, como descrito acima com referência ao quantizador inverso 240 e transformada 250 do encodificador de banda estreita A122). Em outras implementações, como mencionado acima, conjuntos de coeficientes diferentes (por exemplo, coeficientes cepstrais) e/ou representações de coeficientes (por exemplo, ISPs) podem ser usados. O filtro de síntese de banda alta B204 é configurado para produzir um sinal de banda alta sintetizado de acordo com o sinal de excitação de banda alta S120 e o conjunto de coeficientes de filtro. Para um sistema no qual o encodificador de banda alta inclui um filtro de síntese (como no exemplo do
59/80 encodificador A202 descrito acima, por exemplo), pode ser desejável implementar o filtro de síntese de banda alta B204 para ter a mesma resposta (por exemplo, a mesma função de transferência) que aquela do filtro de síntese.
decodificador de banda alta B202 inclui também um quantizador inverso 580 configurado para dequantizar os fatores de ganho de banda alta S60b, e um elemento de controle de ganho 590 (por exemplo, um multiplicador ou amplificador) configurado e disposto para aplicar os fatores de ganho dequantizados ao sinal de banda alta sintetizado para produzir o sinal de banda alta 3100. Para um caso no qual o envelope de ganho de um quadro é especificado por mais do que um fator de ganho, o elemento de controle de ganho 590 pode incluir lógica configurada para aplicar os fatores de ganho aos respectivos subquadros, possivelmente de acordo com uma função de janelamento que pode ser a mesma ou uma diferente função de janelamento conforme aplicada por um calculador de ganho (por exemplo, calculador de ganho de banda alta A230) do encodificador de banda alta correspondente. Em outras implementações do decodificador de banda alta B202, o elemento de controle de ganho 590 é similarmente configurado, mas é disposto em vez disso para aplicar os fatores de ganho dequantizados ao sinal de excitação de banda estreita S80 ou ao sinal de excitação de banda alta S120.
Como mencionado acima, pode ser desejável obter o mesmo estado no encodif icador de banda alta e no decodificador de banda alta (por exemplo, mediante uso de valores dequantizados durante encodificação). Desse modo pode ser desejável em um sistema de codificação de acordo com tal implementação garantir o mesmo estado para os geradores de ruído correspondentes nos geradores de
60/80
. o . rí.
!..>
CL excitação de banda alta A300 e B300. Por exemplo, os geradores de excitação de banda alta A300 e
B300 de tal podem ser configurados de tal implementação estado do gerador de ruído seja uma função determinística modo que o de informações já codificadas dentro do mesmo quadro (por exemplo, parâmetros de filtro de banda estreita S40 ou uma porção do mesmo e/ou sinal de excitação de banda estreita encodificado S50 ou uma porção do mesmo).
Um ou mais dos quantizadores dos elementos aqui descritos (por exemplo, quantizador 230, 420 ou 430) podem ser configurados para realizar quantização de vetor classificado. Por exemplo, tal quantizador pode ser configurado para selecionar um dentre um conjunto de livros-código com base em informações que já foram codificadas dentro do mesmo quadro no canal de banda estreita e/ou no canal de banda alta. Tal técnica tipicamente provê maior eficiência de codificação à custa de armazenamento de livro-código adicional.
Como discutido acima com referência, por exemplo, às Figuras 8 e 9, uma quantidade considerável de estrutura periódica pode permanecer no sinal residual após remoção do envelope espectral grosseiro a partir do sinal de fala de banda estreita S20. Por exemplo, o sinal residual pode conter uma seqüência de pulsos ou picos aproximadamente periódicos ao longo do tempo. Tal estrutura, a qual é tipicamente relacionada ao pitch, é especialmente provável de ocorrer nos sinais de fala com voz. O cálculo de uma representação quantizada do sinal residual de banda estreita pode incluir encodificação dessa estrutura de pitch de acordo com um modelo de periodicidade de longo prazo conforme representado, por exemplo, por um ou mais livros-código.
t
61/80
A estrutura de pitch de um sinal residual efetivo pode não coincidir exatamente com o modelo de periodicidade. Por exemplo, o sinal residual pode incluir pequenos jitters na regularidade dos locais dos pulsos de pitch, de tal modo que as distâncias entre pulsos de pitch sucessivos em um quadro não sejam exatamente iguais e a estrutura não seja muito regular. Essas irregularidades tendem a reduzir a eficiência de codificação.
Algumas implementações do encodificador de banda estreita A120 são configuradas para realizar uma regularização da estrutura de pitch mediante aplicação de uma distorção de tempo adaptativa ao residual antes ou durante quantização ou, de outro modo, mediante inclusão de uma distorção de tempo adaptativa no sinal de excitação encodificado. Por exemplo, tal encodificador pode ser configurado para selecionar ou, de outro modo, calcular um grau de distorção de tempo (por exemplo, de acordo com um ou mais critérios de ponderação perceptual e/ou minimização de erro) de tal modo que o sinal de excitação resultante se ajuste otimamente ao modelo de periodicidade de longo prazo. A regularização da estrutura de pitch é realizada por um subconjunto de encodificadores CELP denominados encodificadores de Predição Linear Excitada por Código de Relaxamento (RCELP).
Um encodificador RCELP é configurado tipicamente para realizar a distorção de tempo como um deslocamento de tempo adaptativo. Esse deslocamento de tempo pode ser um retardo variando de uns poucos milissegundos negativos até uns poucos milissegundos positivos, e normalmente é variado suavemente para evitar descontinuidades audíveis. Em algumas implementações, tal encodificador é configurado para aplicar a regularização de uma forma sucessiva, em que cada quadro ou subquadro é distorcido em um deslocamento de
62/80 tempo fixo correspondente. Em outras implementações, o encodificador é configurado para aplicar a regularização como uma função de distorção contínua, de tal modo que um quadro ou subquadro seja distorcido de acordo com um contorno de pitch (também denominado trajetória de pitch) . Em alguns casos, (por exemplo, como descrito na Publicação de Pedido de Patente US 2004/0098255), o encodificador é configurado para incluir uma distorção de tempo no sinal de excitação encodificado mediante aplicação do deslocamento a um sinal de entrada perceptualmente ponderado que é usado para calcular o sinal de excitação encodificado.
encodificador calcula um sinal de excitação encodificado que é regularizado e quantizado, e o decodificador dequantiza o sinal de excitação encodificado para obter um sinal de excitação que é usado para sintetizar o sinal de fala decodificado. O sinal de saída decodificado desse modo exibe o mesmo retardo variável que foi incluído no sinal de excitação encodificado por intermédio da regularização. Tipicamente, nenhuma informação especificando as quantidades de regularização é transmitida para o decodificador.
A regularização tende a tornar o sinal residual mais fácil de encodificar, o que melhora o ganho de codificação a partir do preditor de longo prazo e, desse modo, aumenta a eficiência de codificação global, geralmente sem gerar artefatos. Pode ser desejável realizar regularização apenas em quadros que têm voz. Por exemplo, o encodificador de banda estreita A124 pode ser configurado para deslocar apenas aqueles quadros ou subquadros tendo uma estrutura de longo prazo, tal como sinais com voz. Pode ainda ser desejável realizar a regularização apenas em subquadros que incluem energia de pulso de pitch. Várias implementações de codificação RCELP são descritas nas
Patentes US 5.704.003 (Kleijn et al.) e 6.879.955 (Rao) e na Publicação de Pedido de Patente US 2004/0098255 (Kovesi et al.). Implementações existentes de codificadores RCELP incluem o Codec de Taxa Variável Aperfeiçoado (EVRC), conforme descrito na Associação de Indústrias de Telecomunicações (TIA) IS-127, e o Vocoder de modo selecionável (SMV) do Projeto de Parceria de Terceira Geração 2 (3GPP2).
Infelizmente, regularização pode causar problemas para um codificador de fala de banda larga no qual a excitação de banda alta é derivada do sinal de excitação de banda estreita encodificado (tal como um sistema incluindo encodificador de fala de banda larga A100 e o decodificador de fala de banda larga B100). Devido à sua derivação a partir de um sinal distorcido no tempo, o sinal de excitação de banda alta terá geralmente um perfil de tempo que é diferente daquele do sinal de fala de banda alta original. Em outras palavras, o sinal de excitação de banda alta não mais será sincrono com o sinal de fala de banda alta original.
Um desalinhamento no tempo entre o sinal de excitação de banda alta distorcido e o sinal de fala de banda alta original pode causar vários problemas. Por exemplo, o sinal de excitação de banda alta distorcido pode não mais prover uma excitação de fonte adequada para um filtro de síntese que é configurado de acordo com os parâmetros de filtro extraídos do sinal de fala de banda alta original. Como resultado, o sinal de banda alta sintetizado pode conter artefatos audíveis que reduzem a qualidade percebida do sinal de fala de banda larga decodificado.
desalinhamento no tempo também pode causar ineficiências na encodificação de envelope de ganho. Como
64/80
mencionado acima, é provável que exista uma correlação entre os envelopes temporais do sinal de excitação de banda estreita S80 e o sinal de banda alta S30. Mediante encodificação do envelope de ganho do sinal de banda alta de acordo com uma relação entre esses dois envelopes temporais, um aumento em eficiência de codificação pode ser realizado em comparação com a encodificação do envelope de ganho diretamente. Contudo, quando o sinal de excitação de banda estreita encodificado é regularizado, essa correlação pode ser enfraquecida. O desalinhamento no tempo entre o sinal de excitação de banda estreita S80 e o sinal de banda alta S30 pode fazer com que apareçam flutuações em fatores de ganho de banda alta S60b, e a eficiência de codificação pode cair.
As modalidades incluem métodos para encodificação de fala de banda larga que realizam distorção de tempo de um sinal de fala de banda alta de acordo com uma distorção de tempo incluída em um sinal de excitação de banda estreita encodificado correspondente. Vantagens potenciais de tais métodos incluem melhorar a qualidade de um sinal de fala de banda larga decodificado e/ou melhorar a eficiência da codificação de um envelope de ganho de banda alta.
A Figura 25 mostra um diagrama de blocos de uma implementação ADIO de encodificador de fala de banda larga A100. O encodificador ADIO inclui uma implementação A124 de encodificador de banda estreita A120 que é configurada para realizar regularização durante cálculo do sinal de excitação de banda estreita encodificado Ξ50. Por exemplo, o encodificador de banda estreita A124 pode ser configurado de acordo com uma ou mais implementações RCELP discutidas acima.
O encodificador de banda estreita A124 também é configurado para emitir um sinal de dados de regularização
65/80
SD10 que especifica o grau de distorção de tempo aplicado.
Para diversos casos nos quais o encodificador de banda estreita A124 é configurado para aplicar um deslocamento de tempo fixo a cada quadro ou subquadro, o sinal de dados de regularização SD10 pode incluir uma série de valores indicando cada quantidade de deslocamento de tempo como um valor de número inteiro ou de número não inteiro em termos de amostras, milissegundos, ou algum outro incremento de tempo. Para um caso no qual o encodificador de banda estreita A124 é configurado para de outro modo modificar a escala de tempo de um quadro ou outra seqüência de amostras (por exemplo, mediante compactação de uma porção e expandindo outra porção), o sinal de informação de regularização SD10 pode incluir uma descrição correspondente da modificação, tal como um conjunto de parâmetros de função. Em um exemplo específico, o encodificador de banda estreita A124 é configurado para dividir um quadro em três subquadros e para calcular um deslocamento de tempo fixo para cada subquadro, de tal modo que o sinal de dados de regularização SD10 indique três quantidades de deslocamento de tempo para cada quadro regularizado do sinal de banda estreita encodificado.
encodificador de fala de banda larga ADIO inclui uma linha de retardo D120 configurada para avançar ou retardar porções do sinal de fala de banda alta S30, de acordo com quantidades de retardo indicadas por um sinal de entrada, para produzir o sinal de fala de banda alta distorcido no tempo S30a. No exemplo mostrado na Figura 25, a linha de retardo D120 é configurada para distorcer no tempo o sinal de fala de banda alta Ξ30 de acordo com a distorção indicada pelo sinal de dados de regularização SD10. De tal modo, a mesma quantidade de distorção de tempo que foi incluída no sinal de excitação de banda estreita
66/80 encodifiçado S50 também é do sinal de fala de banda ^daC·y * : ...
aplicada à porção correspondente alta S30 antes da análise. Embora esse exemplo mostre linha de retardo D120 como um elemento separado do encodificador de banda alta A200, em outras implementações a linha de retardo D120 é disposta como parte do encodificador de banda alta.
Implementações adicionais do encodificador de banda alta A200 podem ser configuradas para realizar análise espectral (por exemplo, análise LPC) do sinal de fala de banda alta não-distorcido S30 e para realizar distorção de tempo do sinal de fala de banda alta S30 antes do cálculo dos parâmetros de ganho da banda alta S60b. Tal encodificador pode incluir, por exemplo, uma implementação da linha de retardo D120 disposta para realizar a distorção de tempo. Em tais casos, contudo, os parâmetros de filtro de banda alta S60a com base na análise do sinal nãodistorcido S30 pode descrever um envelope espectral que é desalinhado no tempo com o sinal de excitação de banda alta S120.
A linha de retardo D120 pode ser configurada de acordo com qualquer combinação de elementos lógicos e elementos de armazenamento adequados para aplicar as operações de distorção de tempo desejadas ao sinal de fala de banda alta S30. Por exemplo, a linha de retardo D120 pode ser configurada para ler o sinal de fala de banda alta S30 a partir de um buffer de acordo com os deslocamentos de tempo desejados. A Figura 26a mostra um diagrama esquemático de tal implementação D122 da linha de retardo D120 que inclui um registrador de deslocamento SRl. O registrador de deslocamento SRl é um buffer de certo comprimento m que é configurado para receber e armazenar as m amostras mais recentes do sinal de fala de banda alta
S30. O valor m é igual pelo menos à soma dos deslocamentos
de tempo máximos positivos (ou avanço) e negativos (ou demora) a serem suportados. Pode ser desejável que o valor m seja igual ao comprimento de um quadro ou subquadro do sinal de banda alta Ξ30.
A linha de retardo D122 é configurada para emitir o sinal de banda alta distorcido no tempo S30a a partir de um local de offset OL do registrador de deslocamento SR1. A posição do local de offset OL varia em torno de uma posição de referência (deslocamento de tempo zero) de acordo com o deslocamento de tempo atual conforme indicado, por exemplo, pelo sinal de dados de regularização SD10. A linha de retardo D122 pode ser configurada para suportar limites iguais de avanço e demora ou, alternativamente, um limite maior do que o outro de tal modo que um deslocamento maior possa ser realizado em uma direção do que na outra. A Figura 26a mostra um exemplo especifico que suporta um deslocamento de tempo positivo maior do que negativo. A linha de retardo D122 pode ser configurada para emitir uma ou mais amostras em um tempo (dependendo de uma largura de barramento de saída, por exemplo).
Um deslocamento de tempo de regularização tendo uma magnitude de mais do que uns poucos milissegundos pode causar artefatos audíveis no sinal decodificado. Tipicamente a magnitude de um deslocamento de tempo de regularização conforme realizado por um encodificador de banda estreita A124 nâo excederá uns poucos milissegundos de tal modo que os deslocamentos de tempo indicados pelo sinal de dados de regularização SD10 serão limitados. Contudo, pode ser desejado em tais casos que a linha de retardo D122 seja configurada para impor um limite máximo aos deslocamentos de tempo na direção positiva e/ou negativa (por exemplo, para observar um limite mais curto
68/80 do que aquele imposto pelo encodificador de banda estreita).
A Figura 26b mostra um diagrama esquemático de uma implementação Dl24 de linha de retardo D124 que inclui uma janela de deslocamento SW. Nesse exemplo, a posição do local de offset OL é limitada pela janela de deslocamento SW. Embora a Figura 26b mostre um caso no qual o comprimento do buffer m é maior do que a largura da janela de deslocamento SW, a linha de retardo D124 também pode ser implementada de tal modo que a largura da janela de deslocamento SW seja igual a m.
Em outras implementações, a linha de retardo D120 é configurada para gravar o sinal de fala de banda alta S30 em um buffer de acordo com os deslocamentos de tempo desejados. A Figura 27 mostra um diagrama esquemático de tal implementação D130 da linha de retardo D120 que inclui dois registradores de deslocamento SR2 e SR3 configurados para receber e armazenar o sinal de fala de banda alta S30. A linha de retardo D130 é configurada para gravar um quadro ou subquadro a partir do registrador de deslocamento SR2 para o registrador de deslocamento SR3 de acordo com um deslocamento de tempo como indicado, por exemplo, pelo sinal de dados de regularização SD10. O registrador de deslocamento SR3 é configurado como um buffer FIFO disposto para emitir o sinal de banda alta distorcido no tempo S30a.
No exemplo especifico mostrado na Figura 27, o registrador de deslocamento SR2 inclui uma porção de buffer de quadro FB1 e uma porção de buffer de retardo DB, e o registrador de deslocamento SR3 inclui uma porção de buffer de quadro SB2, uma porção de buffer de avanço AB, e uma porção de buffer de atraso RB. Os comprimentos do buffer de avanço AB e do buffer de atraso RB podem ser iguais, ou um deles pode ser maior do que o outro, de tal modo que um
69/80 deslocamento maior em uma direção seja suportado do que em outra. O buffer de retardo DB e a porção de buffer de atraso RB podem ser configurados para ter o mesmo comprimento. Alternativamente, o buffer de retardo DB pode ser mais curto do que o buffer de atraso RB para considerar um intervalo de tempo exigido para transferir amostras a partir do buffer de quadro FB1 para o registrador de deslocamento SR3, o que pode incluir outras operações de processamento tal como distorção das amostras antes do armazenamento no registrador de deslocamento SR3.
No exemplo da Figura 27, o buffer de quadro FB1 é configurado para ter um comprimento igual àquele de um quadro do sinal de banda alta S30. Em outro exemplo, o buffer de quadro FB1 é configurado para ter um comprimento igual àquele de um subquadro do sinal de banda alta S30. Em tal caso, a linha de retardo D130 pode ser configurada para incluir lógica para aplicar o mesmo retardo (por exemplo, uma média) a todos os subquadros de um quadro a ser deslocado. A linha de retardo D130 também pode incluir lógica para valores médios a partir do buffer de quadro FB1 com valores a serem sobrescritos no buffer de atraso RB ou buffer de avanço AB. Em um exemplo adicional, o registrador de deslocamento SR3 pode ser configurado para receber valores do sinal de banda alta S30 apenas por intermédio do buffer de quadro FB1, e em tal caso a linha de retardo D130 pode incluir lógica para interpolar através de intervalos entre quadros ou subquadros sucessivos gravados no registrador de deslocamento SR3. Em outras implementações, a linha de retardo D130 pode ser configurada para realizar uma operação de distorção nas amostras a partir do buffer de quadro FB1 antes de gravá-las no registrador de deslocamento SR3 (por exemplo, de acordo com uma função descrita pelo sinal de dados de regularização SD10).
Pode ser desejável que a linha de retardo D120 aplique uma distorção de tempo que se baseia, mas não é idêntica, à distorção especificada pelo sinal de dados de regularização SD10. A Figura 28 mostra um diagrama de blocos de uma implementação AD12 do encodificador de fala de banda larga ADIO que inclui um mapeador de valores de retardo Dl10. 0 mapeador de valores de retardo Dl10 é configurado para mapear a distorção indicada pelo sinal de dados de regularização SD10 em valores de retardo mapeados SDIOa. A linha de retardo D120 é disposta para produzir sinal de fala de banda alta distorcido no tempo S30a de acordo com a distorção indicada pelos valores de retardo mapeados SDIOa.
Pode-se esperar que o deslocamento de tempo aplicado pelo encodificador de banda estreita se desenvolva suavemente ao longo do tempo. Portanto, é tipicamente suficiente computar o deslocamento de tempo de banda estreita médio, aplicado aos subquadros durante um quadro de fala, e deslocar um quadro correspondente do sinal de fala de banda alta S30 de acordo com essa média. Em tal exemplo, o mapeador de valores de retardo Dl 10 é configurado para calcular uma média dos valores de retardo de subquadro para cada quadro, e a linha de retardo D120 é configurada para aplicar a média calculada a um quadro correspondente do sinal de banda alta S30. Em outros exemplos, uma média em relação a um período mais curto (tal como dois subquadros, ou metade de um quadro) ou um período mais longo (tal como dois quadros) pode ser calculada e aplicada. Em um caso onde a média é um valor de número nãointeiro de amostras, o mapeador de valores de retardo D110 pode ser configurado para arredondar o valor para um número inteiro de amostras antes de emiti-lo para a linha de retardo D120.
O encodificador de banda estreita Al 2 4 pode ser configurado para incluir um deslocamento de tempo de regularização de um número não-inteiro de amostras no sinal de excitação de banda estreita encodificado. Em tal caso, pode ser desejável que o mapeador de valores de retardo D110 seja configurado para arredondar o deslocamento de tempo de banda estreita para um número inteiro de amostras e que a linha de retardo D120 aplique o deslocamento de tempo arredondado ao sinal de fala de banda alta S30.
Em algumas implementações de encodificador de fala de banda larga ADIO, as taxas de amostragem do sinal de fala de banda estreita S20 e do sinal de fala de banda alta S30 podem diferir. Em tais casos, o mapeador de valores de retardo D110 pode ser configurado para ajustar quantidades de deslocamento de tempo indicadas no sinal de dados de regularização SD10 para considerar uma diferença entre as taxas de amostragem do sinal de fala de banda estreita S20 (ou sinal de excitação de banda estreita S80) e sinal de fala de banda alta S30. Por exemplo, o mapeador de valores de retardo D110 pode ser configurado para escalonar as quantidades de deslocamento de tempo de acordo com uma relação das taxas de amostragem. Em um exemplo específico, como mencionado acima, o sinal de fala de banda estreita S20 é amostrado em 8 kHz, e o sinal de fala de banda alta S30 é amostrado em 7 kHz. Nesse caso, o mapeador de valores de retardo D110 é configurado para multiplicar cada quantidade de deslocamento por 7/8. Implementações do mapeador de valores de retardo D110 também podem ser configuradas para realizar tal operação de escalonamento em conjunto com um arredondamento para número inteiro e/ou uma operação de cálculo de média de deslocamento de tempo conforme descrito aqui.
72/80
Em implementações adicionais, a linha de retardo D120 é configurada para de outro modo modificar a escala de tempo de um quadro ou outra seqüência de amostras (por exemplo, mediante compressão de uma porção e expansão de outra porção) . Por exemplo, o encodificador de banda estreita A124 pode ser configurado para realizar a regularização de acordo com uma função tal como um contorno ou trajetória de pitch. Em tal caso, o sinal de dados de regularização SD10 pode incluir uma descrição correspondente da função, tal como um conjunto de parâmetros, e a linha de retardo D120 pode incluir lógica configurada para distorcer quadros ou subquadros do sinal de fala de banda alta S30 de acordo com a função. Em outras implementações, o mapeador de valores de retardo D110 é configurado para calcular a média, escalonar, e/ou arredondar a função antes dela ser aplicada ao sinal de fala de banda alta S30 pela linha de retardo D120. Por exemplo, o mapeador de valores de retardo D110 pode ser configurado para calcular um ou mais valores de retardo de acordo com a função, cada valor de retardo indicando um número de amostras, as quais são então aplicadas pela linha de retardo D120 para distorcer no tempo um ou mais quadros ou subquadros correspondentes do sinal de fala de banda alta S30.
A Figura 29 mostra um fluxograma para um método MD100 de distorção de tempo de um sinal de fala de banda alta de acordo com uma distorção de tempo incluída em um sinal de excitação de banda estreita encodificado correspondente. A tarefa TD100 processa um sinal de fala de banda larga para obter um sinal de fala de banda estreita e um sinal de fala de banda alta. Por exemplo, a tarefa TD100 pode ser configurada para filtrar o sinal de fala de banda larga utilizando um banco de filtros tendo filtros passada '%Α 73/80
-Άίί'' ί'Ι /τΛ?Q.
'. Ruà:Φ
Ο ÍJ......
ΟΛό
- \e'P baixa e passa-alta, tal como uma implementação de banco de filtros A110. A tarefa TD200 encodifica o sinal de fala de banda estreita pelo menos em um sinal de excitação de banda estreita encodificado e uma pluralidade de parâmetros de filtro de banda estreita. O sinal de excitação de banda estreita encodificado e/ou os parâmetros de filtro podem ser quantizados, e o sinal de fala de banda estreita encodificado também pode incluir outros parâmetros tal como um parâmetro de modo de fala. A tarefa TD200 inclui também uma distorção de tempo no sinal de excitação de banda estreita encodificado.
A tarefa TD300 gera um sinal de excitação de banda alta com base em um sinal de excitação de banda estreita. Nesse caso, o sinal de excitação de banda estreita se baseia no sinal de excitação de banda estreita encodificado. De acordo pelo menos com o sinal de excitação de banda alta, a tarefa TD400 encodifica o sinal de fala de banda alta pelo menos em uma pluralidade de parâmetros de filtro de banda alta. Por exemplo, a tarefa TD4 00 pode ser configurada para encodificar o sinal de fala de banda alta em uma pluralidade de LSFs quantizados. A tarefa TD500 aplica um deslocamento de tempo ao sinal de fala de banda alta que se baseia em informações relacionadas a uma distorção de tempo incluída no sinal de excitação de banda estreita encodificado.
A tarefa TD400 pode ser configurada para realizar uma análise espectral (tal como uma análise LPC) no sinal de fala de banda alta, e/ou calcular um envelope de ganho do sinal de fala de banda alta. Em tais casos, a tarefa TD500 pode ser configurada para aplicar o deslocamento de tempo ao sinal de fala de banda alta antes da análise e/ou do cálculo de envelope de ganho.
74/80
Outras implementações do encodificador de fala de banda larga A100 são configuradas para reverter uma distorção de tempo do sinal de excitação de banda alta S120 causada por uma distorção de tempo incluída no sinal de excitação de banda estreita encodificado. Por exemplo, o gerador de excitação de banda alta A300 pode ser implementado para incluir uma implementação da linha de retardo D120 que é configurada para receber sinal de dados de regularização SD10 ou valores de retardo mapeados SDlOa, e para aplicar um deslocamento de tempo reverso correspondente ao sinal de excitação de banda estreita S80, e/ou a um sinal subsequente baseado no mesmo tal como sinal harmonicamente estendido S160 ou o sinal de excitação de banda alta S120.
Implementações adicionais do encodificador de fala de banda larga podem ser configuradas para encodificar o sinal de fala de banda estreita S20 e sinal de fala de banda alta S30 independentemente um do outro, de tal modo que o sinal de fala de banda alta S30 seja encodificado como uma representação de um envelope espectral de banda alta e um sinal de excitação de banda alta. Tal implementação pode ser configurada para realizar distorção de tempo do sinal residual de banda alta ou para, de outro modo, incluir uma distorção de tempo em um sinal de excitação de banda alta encodificado, de acordo com informações relacionadas a uma distorção de tempo incluída no sinal de excitação de banda estreita encodificado. Por exemplo, o encodificador de banda alta pode incluir uma implementação da linha de retardo D120 e/ou mapeador de valor de retardo D110 conforme descrito aqui que são configurados para aplicar uma distorção de tempo ao sinal residual de banda alta. Potenciais vantagens de tal operação incluem a encodificação mais eficiente do sinal
75/80 residual de banda alta e uma melhor coincidência entre os sinais de fala de banda estreita e de banda alta sintetizados.
Como mencionado acima, as modalidades conforme aqui descritas incluem implementações que podem ser usadas para realizar codificação integrada, suportar compatibilidade com os sistemas de banda estreita e evitar uma necessidade de transcodificação. O suporte a codificação de banda alta também pode servir para diferenciar em uma base de custo entre chips, conjuntos de chips, dispositivos, e/ou redes tendo suporte de banda larga com compatibilidade retroativa, e tais tendo apenas suporte de banda estreita. 0 suporte a codificação de banda alta conforme descrito aqui também pode ser usado em conjunto com uma técnica para suportar codificação de banda baixa, e um sistema, método ou equipamento de acordo com tal modalidade pode suportar codificação de componentes de freqüência, por exemplo, a partir de aproximadamente 50 ou 100 Hz até aproximadamente 7 ou 8 kHz.
Como mencionado acima, adicionar suporte de banda alta a um codificador de fala pode aperfeiçoar a inteligibilidade, especialmente com relação à diferenciação de fricativas. Embora tal diferenciação normalmente possa ser derivada por um ouvinte humano a partir do contexto especifico, o suporte de banda alta pode servir para habilitar recurso em reconhecimento de fala e outras aplicações de interpretação de máquina, tais como sistemas para navegação de menu de voz automatizado e/ou processamento de chamada automático.
□m equipamento de acordo com uma modalidade pode ser integrado em um dispositivo portátil para comunicações sem fio tal como um telefone celular ou um assistente pessoal digital (PDA). Alternativamente, tal equipamento
76/80 oal da .ο * VÍ < Π 21 Ht ', **: &.
pode ser incluído em outro dispositivo de comunicaçâCP como um aparelho de telefone VoIP, um computador pessoal configurado para suportar comunicações VoIP, ou um dispositivo de rede configurado para rotear comunicações telefônicas ou VoIP. Por exemplo, um equipamento de acordo com uma modalidade pode ser implementado em um chip ou conjunto de chips para um dispositivo de comunicações.
Dependendo da aplicação específica, tal dispositivo também pode incluir recursos tais como conversão de analógico/digital e/ou digital/analógico de um sinal de fala, conjunto de circuitos para realizar amplificação e/ou outras operações de processamento de sinal em um sinal de fala, e/ou conjunto de circuitos de radiofrequência para transmissão e/ou recepção do sinal de fala codificado.
É explicitamente considerado e revelado que as modalidades podem incluir e/ou ser usadas com uma ou mais das outras características reveladas nos Pedidos
Provisórios de Patente US 60/667.901 e 60/673.965 dos quais esse pedido reivindica beneficio. Tais características incluem a remoção de rajadas de alta energia de curta duração que ocorrem na banda alta e substancialmente estão ausentes na banda estreita. Tais características incluem suavização fixa ou adaptativa de representações de coeficiente tal como LSFs de banda alta. Tais características incluem modelagem fixa ou adaptativa de ruído associado à quantização de representações de coeficiente tais como LSFs. Tais características também incluem suavização fixa ou adaptativa de um envelope de ganho, e atenuação adaptativa de um envelope de ganho.
A apresentação anterior das modalidades descritas é provida para permitir que qualquer pessoa versada na técnica realize ou utilize a presente invenção. Diversas modificações a essas modalidades são possíveis, e os
77/80 princípios genéricos apresentados aqui podem ser aplicados também a outras modalidades. Por exemplo, uma modalidade pode ser implementada em parte ou integralmente como um circuito fixo, como uma configuração de circuito fabricada em um circuito integrado de aplicação especifica, ou como um programa de firmware carregado em armazenamento nãovolátil ou um programa de software carregado de ou em um meio de armazenamento de dados como código legível por máquina, tal código tendo instruções executáveis por um arranjo de elementos lógicos tal como um microprocessador ou outra unidade de processamento de sinal digital. 0 meio de armazenamento de dados pode ser qualquer arranjo de elementos de armazenamento tal como memória de semicondutor (a qual pode incluir sem limitação RAM (memória de acesso aleatório) dinâmica ou estática, ROM (memória de leitura) , e/ou RAM flash), ou memória ferroelétrica, magnetoresistiva, ovônica, polimérica, ou de mudança de fase; ou um meio de disco tal como um disco magnético ou ótico. O termo software deve ser entendido como incluindo código fonte, código de linguagem assembly, código de máquina, código binário, firmware, macrocódigo, microcódigo, qualquer um ou mais conjuntos ou seqüências de instruções executáveis por um arranjo de elementos lógicos, e qualquer combinação de tais exemplos.
Os vários elementos de implementações de geradores de excitação de banda alta A300 e B300, encodificador de banda alta A200, decodificador de banda alta B200, encodificador de fala de banda larga A100, e decodificador de fala de banda larga BI00 podem ser implementados como dispositivos eletrônicos e/ou óticos residindo, por exemplo, no mesmo chip ou entre dois ou mais chips em um conjunto de chips, embora outros arranjos sem tal limitação também sejam considerados. Um ou mais
78/80 elementos de tal equipamento podem ser implementados integralmente ou em parte como um ou mais conjuntos de instruções dispostos para executar um ou mais arranjos fixos ou programáveis de elementos lógicos (por exemplo, transistores, portas) tais como microprocessadores, processadores integrados, núcleos IP, processadores de sinal digital, FPGAs (arranjos de portas programáveis em campo), ASSPs (produtos padrão de aplicação específica), e ASICs (circuitos integrados de aplicação específica). Também é possível que um o mais de tais elementos tenham estrutura em comum (por exemplo, um processador usado para executar porções de código correspondendo a elementos diferentes em tempos diferentes, um conjunto de instruções executadas para realizar tarefas correspondendo a elementos diferentes em tempos diferentes, ou um arranjo de dispositivos eletrônicos e/ou óticos realizando operações para elementos diferentes em tempos diferentes). Além disso, é possível que um ou mais de tais elementos sejam usados para realizar tarefas ou executar outros conjuntos de instruções que não são diretamente relacionados a uma operação do equipamento, tal como uma tarefa relacionada à outra operação de um dispositivo ou sistema no qual o equipamento é integrado.
A Figura 30 mostra um fluxograma de um método M100, de acordo com uma modalidade, para encodificar uma porção de banda alta de um sinal de fala tendo uma porção de banda estreita e a porção de banda alta. A tarefa XI00 calcula um conjunto de parâmetros de filtro que particulariza um envelope espectral da porção de banda alta. A tarefa X200 calcula um sinal espectralmente estendido mediante aplicação de uma função não-linear a um sinal derivado da porção de banda estreita. A tarefa X300 gera um sinal de banda alta, sintetizado de acordo com (A)
79/80 o conjunto de parâmetros de filtro e (B) um sinal de excitação de banda alta com base no sinal espectralmente estendido. A tarefa X400 calcula um envelope de ganho com base em uma relação entre (C) energia da porção de banda alta e (D) energia de um sinal derivado da porção de banda estreita.
A Figura 31a mostra um fluxograma de um método M200 para gerar um sinal de excitação de banda alta de acordo com uma modalidade. A tarefa Y100 calcula um sinal harmonicamente estendido mediante aplicação de uma função não-linear a um sinal de excitação de banda estreita derivado de uma porção de banda estreita de um sinal de fala. A tarefa Y200 mistura o sinal harmonicamente
estendido com | um | sinal de | ruído modulado | para | gerar | um |
sinal de excitação | de banda | alta. A | Figura | 31b | mostra | um |
fluxograma de | um | método M210 para | gerar | um | sinal | de |
excitação de banda alta de acordo com outra modalidade incluindo as tarefas Y300 e Y400. A tarefa Y300 calcula um envelope de domínio do tempo de acordo com a energia ao longo do tempo de um entre o sinal de excitação de banda estreita e o sinal harmonicamente estendido. A tarefa Y400 modula um sinal de ruído de acordo com o envelope de domínio do tempo para produzir o sinal de ruído modulado.
A Figura 32 mostra um fluxograma de um método M300 de acordo com uma modalidade, para decodificar uma porção de banda alta de um sinal de fala tendo uma porção de banda estreita e a porção de banda alta. A tarefa Z100 recebe um conjunto de parâmetros de filtro que particulariza um envelope espectral da porção de banda alta e um conjunto de fatores de ganho que particulariza um envelope temporal da porção de banda alta. A tarefa Z200 calcula um sinal espectralmente estendido mediante aplicação de uma função não-linear a um sinal derivado da porção de banda estreita. A
80/80 tarefa Z300 gera um sinal de banda alta sintetizado de acordo com (A) o conjunto de parâmetros de filtro e (B) um sinal de excitação de banda alta com base no sinal espectralmente estendido. A tarefa Z400 modula um envelope de ganho do sinal de banda alta sintetizado com base no conjunto de fatores de ganho. Por exemplo, a tarefa Z4 00 pode ser configurada para modular o envelope de ganho do sinal de banda alta sintetizado mediante aplicação do conjunto de fatores de ganho a um sinal de excitação derivado da porção de banda estreita, ao sinal espectralmente estendido, ao sinal de excitação de banda alta, ou ao sinal de banda alta sintetizado.
As modalidades também incluem métodos adicionais de codificação de fala, encodificação, e decodificação como expressamente revelados aqui, por exemplo, por intermédio de descrições das modalidades estruturais configuradas para realizar tais métodos. Cada um desses métodos também pode ser incorporado de forma tangível (por exemplo, em um ou mais meios de armazenamento de dados como relacionado acima) como um ou mais conjuntos de instruções legíveis e/ou executáveis por uma máquina incluindo um arranjo de elementos lógicos (por exemplo, um processador, microprocessador, microcontrolador, ou outra máquina de estado finito). Desse modo, não se pretende que a presente invenção seja limitada às modalidades mostradas acima, mas, mais propriamente deve ser concedido o mais amplo escopo compatível com os princípios e características inovadoras aqui reveladas de qualquer forma, incluindo nas reivindicações anexas conforme depositadas, que formam uma parte da revelação original.
Claims (8)
- REIVINDICAÇÕES1. Método para encodificar uma porção de banda alta (S30) de um sinal de fala (S10) tendo uma porção de banda baixa (S20) e a porção de banda alta (S30), o método caracterizado pelo fato de que compreende:calcular uma pluralidade de parâmetros de filtro (S60A) que particularizam um envelope espectral da porção de banda alta;calcular um sinal espectralmente estendido (S160) ao estender o espectro de um sinal de excitação (S50, S80) derivado a partir da porção de banda baixa;somar o sinal espectralmente estendido (s160) com ruído modulado (S170) de acordo com um envelope derivado a partir da porção de banda baixa (S50, S80) para fornecer um sinal de excitação de banda alta (S120);gerar um sinal de banda alta sintetizado (S130) de acordo com (A) o sinal de excitação de banda alta (S120) com base no sinal estendido espectralmente (S160) e (B) a pluralidade de parâmetros de filtro (S60A); e calcular um envelope de ganho (S60B) com base em uma relação entre a porção de banda alta (S30) e um sinal (S50, S80, S120, S130) com base na porção de banda baixa.
- 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que calcular um sinal espectralmente estendido (S120, S160) compreende estender o espectro (A400, A402) do sinal derivado a partir da porção de banda baixa (S50, S80) ao aplicar uma função não-linear (520) ao sinal.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que calcular um envelope de ganho (S60B) se baseia em uma relação entre energia da porção de banda alta (S30) e energia de um sinal com base na porção de banda baixa (S120, S130).Petição 870190092029, de 16/09/2019, pág. 3/152/84. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que calcular um envelope de ganho (S60B) inclui uma pluralidade de fatores de ganho (S60B), cada um correspondendo a um diferente em uma série de subquadros consecutivos de um quadro da porção de banda alta (S30), e em que calcular um envelope de ganho (S60B) com base em uma relação entre a porção de banda alta (S30) e um sinal com base na porção de banda baixa (S120, S130) inclui calcular cada um da pluralidade de fatores de ganho (S60B) com base em uma relação entre (A) energia do subquadro respectivo da porção de banda alta (S30) e (B) energia de uma porção correspondente no tempo do sinal com base na porção de banda baixa (S120, S130).5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que calcular cada um dentre a pluralidade de fatores de ganho (S60B) inclui, para pelo menos um dentre os fatores de ganho (S60B), calcular uma energia do respectivo subquadro da porção de banda alta (S30) usando uma função de janelamento que sobrepõe subquadros adjacentes da porção de banda alta (S30).6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o sinal com base na porção de banda baixa (S20, S130) é o sinal de banda alta sintetizado (S130).7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que o envelope de ganho (S60B) inclui uma pluralidade de fatores de ganho (S60B), cada um correspondendo a um diferente em uma série de subquadros consecutivos de um quadro de uma porção de banda alta (S130), e em que calcular um envelope de ganho (S60B) inclui calcular cada um da pluralidade de fatores de ganhoPetição 870190092029, de 16/09/2019, pág. 4/15 - 3/ 8 (S60B) com base em uma relação entre (A) energia do subquadro respectivo da porção de banda alta (S30) e (B) energia de uma porção correspondente em tempo do sinal de banda alta sintetizado (S130) .8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que calcular cada um da pluralidade de fatores de ganho (S60B) inclui, para pelo menos um dos fatores de ganho (S60B), calcular uma energia do subquadro respectivo da porção de banda alta (S30) usando uma função de janelamento (T215A, T215B) que sobrepõe em tempo subquadros adjacentes da porção de banda alta (S30).9. Método, de acordo com a reivindicação 8, caracterizado pelo fato de que calcular um sinal estendido espectralmente (S120, S160) compreende estender o espectro (A400, A402) do sinal derivado a partir da porção de banda baixa (S50, S80) ao aplicar uma função não linear (520) ao sinal.10. Método para decodificar uma porção de banda alta (S30, S100) de um sinal de fala (S10, S110) tendo uma porção de banda baixa (S20, S90) e a porção de banda alta (S30, S100), o método caracterizado pelo fato de que compreende:receber uma pluralidade de parâmetros de filtro (S60A) que particularizam um envelope espectral da porção de banda alta (S30, S100) e uma pluralidade de fatores de ganho (S60B) que particularizam um envelope temporal da porção de banda alta (530, S100);calcular um sinal espectralmente estendido (S160) ao estender o espectro de um sinal que se baseia em um sinal de excitação de banda baixa (S50, S80);somar o sinal espectralmente estendido (s160) com ruído modulado (S170) de acordo com um envelope derivado aPetição 870190092029, de 16/09/2019, pág. 5/15
- 4/ 8 partir da porção de banda baixa (S50, S80) para fornecer um sinal de excitação de banda alta (S120); e gerar um sinal de banda alta sintetizado (S130) de acordo com (A) a pluralidade de parâmetros de filtro (S60A) e (B) o sinal de excitação de banda alta (S120); e modificar (590) um envelope de ganho do sinal de banda alta sintetizado (S130) de acordo com a pluralidade de fatores de ganho (S60B).11. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que calcular um sinal espectralmente estendido (S160) compreende estender o espectro (A400, A402) do sinal que se baseia em um sinal de excitação de banda baixa (S50, S80) ao aplicar uma função não-linear (520) ao sinal.12. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que modificar (590) um envelope de ganho inclui modificar, de acordo com a pluralidade de fatores de ganho (S60B), uma amplitude em relação ao tempo de pelo menos um entre um sinal que se baseia no sinal de excitação de banda baixa (S50, S80), no sinal espectralmente estendido (S160), no sinal de excitação de banda alta (S120), e no sinal de banda alta sintetizado (S130).13. Equipamento (A200, A202) configurado para encodificar uma porção de banda alta (S30) de um sinal de fala (S10) tendo uma porção de banda baixa (S20) e a porção de banda alta (S30), o equipamento caracterizado pelo fato de que compreende:um módulo de análise (A210) configurado para calcular um conjunto de parâmetros de filtro que particularizam um envelope espectral da porção de banda alta (S30);Petição 870190092029, de 16/09/2019, pág. 6/15
- 5/ 8 um extensor de espectro (A400, A402) configurado para calcular um sinal espectralmente estendido ao estender o espectro de um sinal de excitação (S50, S80) derivado a partir da porção de banda baixa;um combinador (490) configurado para fornecer um sinal de excitação de banda alta (S120) ao misturar o sinal espectralmente estendido (s160) com ruído modulado (S170) de acordo com um envelope derivado a partir da porção de banda baixa (S50, S80) ;um filtro de síntese (A220) configurado para gerar um sinal de banda alta sintetizado (S2120) de acordo com o sinal de excitação de banda alta (S120) e o conjunto de parâmetros de filtro, e um calculador de fator de ganho (A230) configurado para calcular um envelope de ganho (S60B) com base em uma relação que varia no tempo entre a porção de banda alta (S30) e um sinal (S50, S80, S120, S130) com base na porção de banda baixa.14. Equipamento, de acordo com a reivindicação13, caracterizado pelo fato de que o extensor de espectro (A400, A402) é configurado para estender o espectro do sinal derivado a partir da porção de banda baixa (S50, S80) ao aplicar uma função não-linear (520) ao sinal.15. Equipamento, de acordo com a reivindicação14, caracterizado pelo fato de que o calculador de fator de ganho (A210) é configurado para calcular o envelope de ganho (S60B) com base em uma relação que varia no tempo entre energia da porção de banda alta (S30) e energia do sinal com base na porção de banda baixa (S120, S130).16. Equipamento, de acordo com a reivindicação13, caracterizado pelo fato de que o envelope de ganho (S60B) inclui uma pluralidade de fatores de ganho (S60B), cada um correspondendo a um diferente em uma série dePetição 870190092029, de 16/09/2019, pág. 7/15
- 6/8 subquadros consecutivos de um quadro da porção de banda alta (S30), e em que o calculador de envelope de ganho é configurado para calcular cada um da pluralidade de envelope de ganho (S60B) com base em uma relação entre (A) energia do subquadro respectivo da porção de banda alta (S30) e (B) energia de uma porção correspondente no tempo do sinal com base na porção de banda baixa (S120, S130) .17. Equipamento, de acordo com a reivindicação16, caracterizado pelo fato de que, para pelo menos um da pluralidade de fatores de ganho (S60B), o calculador de envelope de ganho (A230) é configurado para calcular uma energia do respectivo subquadro da porção de banda alta (S30) usando uma função de janelamento (T215A, T215B) que sobrepõe subquadros adjacentes da porção de banda alta (S30).18. Equipamento, de acordo com a reivindicação15, caracterizado pelo fato de que o sinal com base na porção de banda baixa (S20, S130) é o sinal de banda alta sintetizado (S130).19. Equipamento, de acordo com a reivindicação18, caracterizado pelo fato de que o envelope de ganho (S60B) inclui uma pluralidade de fatores de ganho (S60B), cada um correspondendo a um diferente em uma série de subquadros consecutivos de um quadro da porção de banda alta (S130), e em que o calculador de envelope de ganho (A230) é configurado para calcular cada um da pluralidade de fatores de ganho (S60B) com base em uma relação entre (A) energia do subquadro respectivo da porção de banda alta (S30) e (B) energia de uma porção correspondente em tempo do sinal de banda alta sintetizado (S130).Petição 870190092029, de 16/09/2019, pág. 8/15
- 7/ 820. Equipamento, de acordo com a reivindicação19, caracterizado pelo fato de que, para pelo menos um da pluralidade de fatores de ganho (S60B), o calculador de envelope de ganho (A230) é configurado para calcular uma energia do subquadro respectivo da porção de banda alta (S30) usando uma função de janelamento (T215A, T215B) que sobrepõe em tempo subquadros adjacentes da porção de banda alta (S30).21. Equipamento, de acordo com a reivindicação20, caracterizado pelo fato de que o extensor de espectro (A400, A402) é configurado para estender o espectro do sinal derivado a partir da porção de banda baixa (S50, S80) ao aplicar uma função não linear (520) ao sinal.22. Equipamento, de acordo com a reivindicação 13, caracterizado pelo fato de que compreende um telefone celular.23. Decodificador de fala de banda alta (B202), caracterizado pelo fato de que é configurado para receber (A) uma pluralidade de parâmetros de filtro (S60A) que particularizam um envelope espectral de uma porção de banda alta (S30, S100) de um sinal de fala (S10, S110) e (B) um sinal de excitação de banda baixa encodificado (S50) com base em uma porção de banda baixa (S20, S90) do sinal de fala (S10, S110), o decodificador (B202) compreendendo:um extensor de espectro (A400, A402) configurado para calcular um sinal espectralmente estendido (S160) ao estender o espectro de um sinal que é baseado no sinal de excitação de banda baixa encodificado (S50);um combinador (490) configurado para fornecer um sinal de excitação de banda alta (S120) ao misturar o sinal espectralmente estendido (s160) com ruído modulado (S170) de acordo com um envelope derivado a partir da porção de banda baixa (S50, S80);Petição 870190092029, de 16/09/2019, pág. 9/15
- 8/ 8 um filtro de síntese (B204) configurado para gerar um sinal de banda alta sintetizado (s130) de acordo com (A) a pluralidade de parâmetros de filtro (S60) e (B) o sinal de excitação de banda alta (S120); e um elemento de controle de ganho (590) configurado para modificar um envelope de ganho do sinal de banda alta sintetizado (S130) de acordo com uma pluralidade de fatores de ganho (S60B) que particularizam um envelope temporal da porção de banda alta (S30, S100).24. Decodificador, de acordo com a reivindicação23, caracterizado pelo fato de que o extensor de espectro (A400, A402) é configurado para estender o espectro do sinal que é baseado no sinal de excitação de banda baixa encodificado (S50) ao aplicar uma função não-linear (520)
ao sinal. 25. Decodificador, de acordo com a reivindicação 23, caracterizado pelo fato de que o elemento de controle de ganho (590) é configurado para modificar, de acordo com a pluralidade de fatores de ganho (S60B), uma amplitude ao longo do tempo de pelo menos um dentre o sinal de excitação de banda baixa encodificado (S50), o sinal espectralmente estendido (S160), o sinal de excitação de banda alta (S120), e o sinal de banda alta sintetizado (S130).26. Decodificador, de acordo com a reivindicação23, caracterizado pelo fato de que o elemento de controle de ganho (590) compreende pelo menos um dentre um multiplicador e um amplificador.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US66790105P | 2005-04-01 | 2005-04-01 | |
US60/667,901 | 2005-04-01 | ||
US67396505P | 2005-04-22 | 2005-04-22 | |
US60/673,965 | 2005-04-22 | ||
PCT/US2006/012231 WO2006107837A1 (en) | 2005-04-01 | 2006-04-03 | Methods and apparatus for encoding and decoding an highband portion of a speech signal |
Publications (2)
Publication Number | Publication Date |
---|---|
BRPI0609530A2 BRPI0609530A2 (pt) | 2010-04-13 |
BRPI0609530B1 true BRPI0609530B1 (pt) | 2019-10-29 |
Family
ID=36588741
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0608305-6A BRPI0608305B1 (pt) | 2005-04-01 | 2006-04-03 | Sistemas, métodos e equipamentos para codificação de fala em banda larga |
BRPI0609530-5A BRPI0609530B1 (pt) | 2005-04-01 | 2006-04-03 | métodos e equipamento para encodificar e decodificar uma porção de banda alta de um sinal de fala |
BRPI0607691A BRPI0607691B1 (pt) | 2005-04-01 | 2006-04-03 | método e equipamento para codificação de fala em banda larga |
BRPI0608269A BRPI0608269B8 (pt) | 2005-04-01 | 2006-04-03 | método e aparelho para quantização vetorial de uma representação de envelope espectral |
BRPI0607690A BRPI0607690A8 (pt) | 2005-04-01 | 2006-04-03 | Sistemas, métodos e equipamento para geração de excitação em banda alta |
BRPI0608306-4A BRPI0608306A2 (pt) | 2005-04-01 | 2006-04-03 | sistemas, métodos e equipamentos para supressão de rajada em banda alta |
BRPI0607646-7A BRPI0607646B1 (pt) | 2005-04-01 | 2006-04-03 | Método e equipamento para encodificação por divisão de banda de sinais de fala |
BRPI0608270-0A BRPI0608270A2 (pt) | 2005-04-01 | 2006-04-03 | sistemas, métodos e equipamento para filtragem anti-dispersão |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0608305-6A BRPI0608305B1 (pt) | 2005-04-01 | 2006-04-03 | Sistemas, métodos e equipamentos para codificação de fala em banda larga |
Family Applications After (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0607691A BRPI0607691B1 (pt) | 2005-04-01 | 2006-04-03 | método e equipamento para codificação de fala em banda larga |
BRPI0608269A BRPI0608269B8 (pt) | 2005-04-01 | 2006-04-03 | método e aparelho para quantização vetorial de uma representação de envelope espectral |
BRPI0607690A BRPI0607690A8 (pt) | 2005-04-01 | 2006-04-03 | Sistemas, métodos e equipamento para geração de excitação em banda alta |
BRPI0608306-4A BRPI0608306A2 (pt) | 2005-04-01 | 2006-04-03 | sistemas, métodos e equipamentos para supressão de rajada em banda alta |
BRPI0607646-7A BRPI0607646B1 (pt) | 2005-04-01 | 2006-04-03 | Método e equipamento para encodificação por divisão de banda de sinais de fala |
BRPI0608270-0A BRPI0608270A2 (pt) | 2005-04-01 | 2006-04-03 | sistemas, métodos e equipamento para filtragem anti-dispersão |
Country Status (24)
Country | Link |
---|---|
US (8) | US8484036B2 (pt) |
EP (8) | EP1866914B1 (pt) |
JP (8) | JP4955649B2 (pt) |
KR (8) | KR100956524B1 (pt) |
CN (1) | CN102411935B (pt) |
AT (4) | ATE492016T1 (pt) |
AU (8) | AU2006232363B2 (pt) |
BR (8) | BRPI0608305B1 (pt) |
CA (8) | CA2603187C (pt) |
DE (4) | DE602006012637D1 (pt) |
DK (2) | DK1864101T3 (pt) |
ES (3) | ES2340608T3 (pt) |
HK (5) | HK1113848A1 (pt) |
IL (8) | IL186442A (pt) |
MX (8) | MX2007012185A (pt) |
NO (7) | NO20075510L (pt) |
NZ (6) | NZ562182A (pt) |
PL (4) | PL1869673T3 (pt) |
PT (2) | PT1864101E (pt) |
RU (9) | RU2402826C2 (pt) |
SG (4) | SG163556A1 (pt) |
SI (1) | SI1864282T1 (pt) |
TW (8) | TWI320923B (pt) |
WO (8) | WO2006107833A1 (pt) |
Families Citing this family (322)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7987095B2 (en) * | 2002-09-27 | 2011-07-26 | Broadcom Corporation | Method and system for dual mode subband acoustic echo canceller with integrated noise suppression |
US7619995B1 (en) * | 2003-07-18 | 2009-11-17 | Nortel Networks Limited | Transcoders and mixers for voice-over-IP conferencing |
JP4679049B2 (ja) * | 2003-09-30 | 2011-04-27 | パナソニック株式会社 | スケーラブル復号化装置 |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
EP3336843B1 (en) * | 2004-05-14 | 2021-06-23 | Panasonic Intellectual Property Corporation of America | Speech coding method and speech coding apparatus |
EP1775717B1 (en) * | 2004-07-20 | 2013-09-11 | Panasonic Corporation | Speech decoding apparatus and compensation frame generation method |
MY149811A (en) * | 2004-08-30 | 2013-10-14 | Qualcomm Inc | Method and apparatus for an adaptive de-jitter buffer |
US8085678B2 (en) * | 2004-10-13 | 2011-12-27 | Qualcomm Incorporated | Media (voice) playback (de-jitter) buffer adjustments based on air interface |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
WO2006103488A1 (en) * | 2005-03-30 | 2006-10-05 | Nokia Corporation | Source coding and/or decoding |
WO2006107833A1 (en) | 2005-04-01 | 2006-10-12 | Qualcomm Incorporated | Method and apparatus for vector quantizing of a spectral envelope representation |
US9043214B2 (en) * | 2005-04-22 | 2015-05-26 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor attenuation |
ATE435481T1 (de) * | 2005-04-28 | 2009-07-15 | Siemens Ag | Verfahren und vorrichtung zur geräuschunterdrückung |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
WO2007007253A1 (en) * | 2005-07-14 | 2007-01-18 | Koninklijke Philips Electronics N.V. | Audio signal synthesis |
US8169890B2 (en) * | 2005-07-20 | 2012-05-01 | Qualcomm Incorporated | Systems and method for high data rate ultra wideband communication |
KR101171098B1 (ko) * | 2005-07-22 | 2012-08-20 | 삼성전자주식회사 | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 |
CA2558595C (en) * | 2005-09-02 | 2015-05-26 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
US8326614B2 (en) * | 2005-09-02 | 2012-12-04 | Qnx Software Systems Limited | Speech enhancement system |
BRPI0616624A2 (pt) * | 2005-09-30 | 2011-06-28 | Matsushita Electric Ind Co Ltd | aparelho de codificação de fala e método de codificação de fala |
CN102623014A (zh) * | 2005-10-14 | 2012-08-01 | 松下电器产业株式会社 | 变换编码装置和变换编码方法 |
US7991611B2 (en) * | 2005-10-14 | 2011-08-02 | Panasonic Corporation | Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals |
JP4876574B2 (ja) * | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US8532984B2 (en) | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
US8135047B2 (en) | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
DE602007014059D1 (de) | 2006-08-15 | 2011-06-01 | Broadcom Corp | Zeitverschiebung eines dekodierten audiosignals nach einem paketverlust |
US8706507B2 (en) | 2006-08-15 | 2014-04-22 | Dolby Laboratories Licensing Corporation | Arbitrary shaping of temporal noise envelope without side-information utilizing unchanged quantization |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US8046218B2 (en) * | 2006-09-19 | 2011-10-25 | The Board Of Trustees Of The University Of Illinois | Speech and method for identifying perceptual features |
JP4972742B2 (ja) * | 2006-10-17 | 2012-07-11 | 国立大学法人九州工業大学 | 高域信号補間方法及び高域信号補間装置 |
EP4325724A3 (en) | 2006-10-25 | 2024-04-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating audio subband values |
KR101375582B1 (ko) | 2006-11-17 | 2014-03-20 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
US8639500B2 (en) * | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
KR101565919B1 (ko) | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
US8005671B2 (en) * | 2006-12-04 | 2011-08-23 | Qualcomm Incorporated | Systems and methods for dynamic normalization to reduce loss in precision for low-level signals |
GB2444757B (en) * | 2006-12-13 | 2009-04-22 | Motorola Inc | Code excited linear prediction speech coding |
US20080147389A1 (en) * | 2006-12-15 | 2008-06-19 | Motorola, Inc. | Method and Apparatus for Robust Speech Activity Detection |
FR2911020B1 (fr) * | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
FR2911031B1 (fr) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
US7873064B1 (en) * | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
US8032359B2 (en) | 2007-02-14 | 2011-10-04 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
DK3401907T3 (da) | 2007-08-27 | 2020-03-02 | Ericsson Telefon Ab L M | Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller |
FR2920545B1 (fr) * | 2007-09-03 | 2011-06-10 | Univ Sud Toulon Var | Procede de trajectographie de plusieurs cetaces par acoustique passive |
JP5547081B2 (ja) * | 2007-11-02 | 2014-07-09 | 華為技術有限公司 | 音声復号化方法及び装置 |
BRPI0722269A2 (pt) * | 2007-11-06 | 2014-04-22 | Nokia Corp | Encodificador para encodificar um sinal de áudio, método para encodificar um sinal de áudio; decodificador para decodificar um sinal de áudio; método para decodificar um sinal de áudio; aparelho; dispositivo eletrônico; produto de programa de comoputador configurado para realizar um método para encodificar e para decodificar um sinal de áudio |
US20100250260A1 (en) * | 2007-11-06 | 2010-09-30 | Lasse Laaksonen | Encoder |
US20100274555A1 (en) * | 2007-11-06 | 2010-10-28 | Lasse Laaksonen | Audio Coding Apparatus and Method Thereof |
KR101444099B1 (ko) * | 2007-11-13 | 2014-09-26 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치 |
AU2008326956B2 (en) * | 2007-11-21 | 2011-02-17 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
US8050934B2 (en) * | 2007-11-29 | 2011-11-01 | Texas Instruments Incorporated | Local pitch control based on seamless time scale modification and synchronized sampling rate conversion |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
TWI356399B (en) * | 2007-12-14 | 2012-01-11 | Ind Tech Res Inst | Speech recognition system and method with cepstral |
KR101439205B1 (ko) * | 2007-12-21 | 2014-09-11 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
US20100280833A1 (en) * | 2007-12-27 | 2010-11-04 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
KR101413968B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
EP2255534B1 (en) * | 2008-03-20 | 2017-12-20 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding using bandwidth extension in portable terminal |
WO2010003068A1 (en) * | 2008-07-03 | 2010-01-07 | The Board Of Trustees Of The University Of Illinois | Systems and methods for identifying speech sound features |
CA2729751C (en) * | 2008-07-10 | 2017-10-24 | Voiceage Corporation | Device and method for quantizing and inverse quantizing lpc filters in a super-frame |
ES2372014T3 (es) * | 2008-07-11 | 2012-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral. |
CN103000186B (zh) | 2008-07-11 | 2015-01-14 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
KR101614160B1 (ko) * | 2008-07-16 | 2016-04-20 | 한국전자통신연구원 | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 |
WO2010011963A1 (en) * | 2008-07-25 | 2010-01-28 | The Board Of Trustees Of The University Of Illinois | Methods and systems for identifying speech sounds using multi-dimensional analysis |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
WO2010028297A1 (en) | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
US8407046B2 (en) * | 2008-09-06 | 2013-03-26 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
US8352279B2 (en) * | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US20100070550A1 (en) * | 2008-09-12 | 2010-03-18 | Cardinal Health 209 Inc. | Method and apparatus of a sensor amplifier configured for use in medical applications |
KR101178801B1 (ko) * | 2008-12-09 | 2012-08-31 | 한국전자통신연구원 | 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법 |
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
EP2224433B1 (en) * | 2008-09-25 | 2020-05-27 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
EP2182513B1 (en) * | 2008-11-04 | 2013-03-20 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
DE102008058496B4 (de) * | 2008-11-21 | 2010-09-09 | Siemens Medical Instruments Pte. Ltd. | Filterbanksystem mit spezifischen Sperrdämpfungsanteilen für eine Hörvorrichtung |
US9947340B2 (en) * | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
GB2466201B (en) * | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
WO2010070770A1 (ja) * | 2008-12-19 | 2010-06-24 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
GB2466671B (en) * | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466674B (en) * | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
AU2010205583B2 (en) | 2009-01-16 | 2013-02-07 | Dolby International Ab | Cross product enhanced harmonic transposition |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
WO2010111876A1 (zh) * | 2009-03-31 | 2010-10-07 | 华为技术有限公司 | 一种信号去噪的方法和装置及音频解码系统 |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
JP4921611B2 (ja) * | 2009-04-03 | 2012-04-25 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
US8805680B2 (en) * | 2009-05-19 | 2014-08-12 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding audio signal using layered sinusoidal pulse coding |
CN101609680B (zh) * | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
US8000485B2 (en) * | 2009-06-01 | 2011-08-16 | Dts, Inc. | Virtual audio processing for loudspeaker or headphone playback |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
WO2011029484A1 (en) * | 2009-09-14 | 2011-03-17 | Nokia Corporation | Signal enhancement processing |
US9595257B2 (en) * | 2009-09-28 | 2017-03-14 | Nuance Communications, Inc. | Downsampling schemes in a hierarchical neural network structure for phoneme recognition |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
WO2011048099A1 (en) | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule |
PL2800094T3 (pl) * | 2009-10-21 | 2018-03-30 | Dolby International Ab | Nadpróbkowanie w banku filtrów z połączonym modułem transpozycji |
WO2011048792A1 (ja) * | 2009-10-21 | 2011-04-28 | パナソニック株式会社 | 音響信号処理装置、音響符号化装置および音響復号装置 |
US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
EP2502230B1 (en) * | 2009-11-19 | 2014-05-21 | Telefonaktiebolaget L M Ericsson (PUBL) | Improved excitation signal bandwidth extension |
CN102612712B (zh) * | 2009-11-19 | 2014-03-12 | 瑞典爱立信有限公司 | 低频带音频信号的带宽扩展 |
US8489393B2 (en) * | 2009-11-23 | 2013-07-16 | Cambridge Silicon Radio Limited | Speech intelligibility |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
RU2464651C2 (ru) * | 2009-12-22 | 2012-10-20 | Общество с ограниченной ответственностью "Спирит Корп" | Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов |
US8559749B2 (en) * | 2010-01-06 | 2013-10-15 | Streaming Appliances, Llc | Audiovisual content delivery system |
US8326607B2 (en) * | 2010-01-11 | 2012-12-04 | Sony Ericsson Mobile Communications Ab | Method and arrangement for enhancing speech quality |
KR101336051B1 (ko) | 2010-01-12 | 2013-12-04 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 인코더, 오디오 디코더, 오디오 정보 인코딩 방법, 오디오 정보 디코딩 방법, 및 수치적 이전 콘텍스트 값의 수치 표현의 수정을 이용하는 컴퓨터 프로그램 |
US8699727B2 (en) | 2010-01-15 | 2014-04-15 | Apple Inc. | Visually-assisted mixing of audio using a spectral analyzer |
US9525569B2 (en) * | 2010-03-03 | 2016-12-20 | Skype | Enhanced circuit-switched calls |
MX2012010469A (es) * | 2010-03-10 | 2012-12-10 | Dolby Int Ab | Decodificador de señales de audio, codificador de señales de audio, metodos y programa de computacion que utiliza tasa de muestreo dependiente de la codificacion del contorno de distorsion en el tiempo. |
US8700391B1 (en) * | 2010-04-01 | 2014-04-15 | Audience, Inc. | Low complexity bandwidth expansion of speech |
CN102870156B (zh) * | 2010-04-12 | 2015-07-22 | 飞思卡尔半导体公司 | 音频通信设备、输出音频信号的方法和通信系统 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
MX2012011802A (es) * | 2010-04-13 | 2013-02-26 | Fraunhofer Ges Forschung | Metodo y codificador y descodificador para la presentacion precisa de muestra de una señal de audio. |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9443534B2 (en) * | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
CN102844810B (zh) * | 2010-04-14 | 2017-05-03 | 沃伊斯亚吉公司 | 用于在码激励线性预测编码器和解码器中使用的灵活和可缩放的组合式创新代码本 |
MX2012011828A (es) * | 2010-04-16 | 2013-02-27 | Fraunhofer Ges Forschung | Aparato, metodo y programa de computadora para generar una señal de banda amplia que utiliza extension de ancho de banda guiada y extension oculta de ancho de banda. |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
US9378754B1 (en) | 2010-04-28 | 2016-06-28 | Knowles Electronics, Llc | Adaptive spatial classifier for multi-microphone systems |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
KR101660843B1 (ko) * | 2010-05-27 | 2016-09-29 | 삼성전자주식회사 | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
ES2372202B2 (es) * | 2010-06-29 | 2012-08-08 | Universidad De Málaga | Sistema de reconocimiento de sonidos de bajo consumo. |
PL3079152T3 (pl) | 2010-07-02 | 2018-10-31 | Dolby International Ab | Dekodowanie audio z selektywnym późniejszym filtrowaniem |
US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
JP5589631B2 (ja) * | 2010-07-15 | 2014-09-17 | 富士通株式会社 | 音声処理装置、音声処理方法および電話装置 |
WO2012008891A1 (en) * | 2010-07-16 | 2012-01-19 | Telefonaktiebolaget L M Ericsson (Publ) | Audio encoder and decoder and methods for encoding and decoding an audio signal |
JP5777041B2 (ja) * | 2010-07-23 | 2015-09-09 | 沖電気工業株式会社 | 帯域拡張装置及びプログラム、並びに、音声通信装置 |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US20130310422A1 (en) | 2010-09-01 | 2013-11-21 | The General Hospital Corporation | Reversal of general anesthesia by administration of methylphenidate, amphetamine, modafinil, amantadine, and/or caffeine |
KR101744621B1 (ko) | 2010-09-16 | 2017-06-09 | 돌비 인터네셔널 에이비 | 교차 곱 강화된 서브밴드 블록 기반 고조파 전위 |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US8924200B2 (en) | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
WO2012053149A1 (ja) * | 2010-10-22 | 2012-04-26 | パナソニック株式会社 | 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法 |
JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
PT3239978T (pt) | 2011-02-14 | 2019-04-02 | Fraunhofer Ges Forschung | Codificação e descodificação de posições de pulso de faixas de um sinal de áudio |
MX2013009303A (es) | 2011-02-14 | 2013-09-13 | Fraunhofer Ges Forschung | Codec de audio utilizando sintesis de ruido durante fases inactivas. |
RU2630390C2 (ru) | 2011-02-14 | 2017-09-07 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для маскирования ошибок при стандартизированном кодировании речи и аудио с низкой задержкой (usac) |
AR085222A1 (es) | 2011-02-14 | 2013-09-18 | Fraunhofer Ges Forschung | Representacion de señal de informacion utilizando transformada superpuesta |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
MY167776A (en) * | 2011-02-14 | 2018-09-24 | Fraunhofer Ges Forschung | Noise generation in audio codecs |
KR101699898B1 (ko) | 2011-02-14 | 2017-01-25 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 스펙트럼 영역에서 디코딩된 오디오 신호를 처리하기 위한 방법 및 장치 |
KR101525185B1 (ko) | 2011-02-14 | 2015-06-02 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 |
EP4243017A3 (en) | 2011-02-14 | 2023-11-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method decoding an audio signal using an aligned look-ahead portion |
RU2562771C2 (ru) * | 2011-02-16 | 2015-09-10 | Долби Лабораторис Лайсэнзин Корпорейшн | Способы и системы генерирования коэффициентов фильтра и конфигурирования фильтров |
DK3998607T3 (da) * | 2011-02-18 | 2024-04-15 | Ntt Docomo Inc | Taleafkoder |
US9165558B2 (en) | 2011-03-09 | 2015-10-20 | Dts Llc | System for dynamically creating and rendering audio objects |
JP5704397B2 (ja) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
US9298287B2 (en) | 2011-03-31 | 2016-03-29 | Microsoft Technology Licensing, Llc | Combined activation for natural user interface systems |
US9842168B2 (en) | 2011-03-31 | 2017-12-12 | Microsoft Technology Licensing, Llc | Task driven user intents |
US9244984B2 (en) | 2011-03-31 | 2016-01-26 | Microsoft Technology Licensing, Llc | Location based conversational understanding |
US9760566B2 (en) | 2011-03-31 | 2017-09-12 | Microsoft Technology Licensing, Llc | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
US10642934B2 (en) | 2011-03-31 | 2020-05-05 | Microsoft Technology Licensing, Llc | Augmented conversational understanding architecture |
US9064006B2 (en) | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
CN102811034A (zh) | 2011-05-31 | 2012-12-05 | 财团法人工业技术研究院 | 信号处理装置及信号处理方法 |
US9264094B2 (en) * | 2011-06-09 | 2016-02-16 | Panasonic Intellectual Property Corporation Of America | Voice coding device, voice decoding device, voice coding method and voice decoding method |
US9070361B2 (en) | 2011-06-10 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component |
BR112013033900B1 (pt) | 2011-06-30 | 2022-03-15 | Samsung Electronics Co., Ltd | Método para gerar um sinal estendido de largura de banda para decodificação de áudio |
US9059786B2 (en) * | 2011-07-07 | 2015-06-16 | Vecima Networks Inc. | Ingress suppression for communication systems |
JP5942358B2 (ja) * | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
RU2486636C1 (ru) * | 2011-11-14 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации высокочастотных сигналов и устройство его реализации |
RU2486637C1 (ru) * | 2011-11-15 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2486638C1 (ru) * | 2011-11-15 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации высокочастотных сигналов и устройство его реализации |
RU2496222C2 (ru) * | 2011-11-17 | 2013-10-20 | Федеральное государственное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2486639C1 (ru) * | 2011-11-21 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2496192C2 (ru) * | 2011-11-21 | 2013-10-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2490727C2 (ru) * | 2011-11-28 | 2013-08-20 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) | Способ передачи речевых сигналов (варианты) |
RU2487443C1 (ru) * | 2011-11-29 | 2013-07-10 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ согласования комплексных сопротивлений и устройство его реализации |
JP5817499B2 (ja) * | 2011-12-15 | 2015-11-18 | 富士通株式会社 | 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム |
US9972325B2 (en) * | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
US9082398B2 (en) * | 2012-02-28 | 2015-07-14 | Huawei Technologies Co., Ltd. | System and method for post excitation enhancement for low bit rate speech coding |
US9437213B2 (en) * | 2012-03-05 | 2016-09-06 | Malaspina Labs (Barbados) Inc. | Voice signal enhancement |
ES2762325T3 (es) | 2012-03-21 | 2020-05-22 | Samsung Electronics Co Ltd | Procedimiento y aparato de codificación/decodificación de frecuencia alta para extensión de ancho de banda |
FI3547261T3 (fi) | 2012-03-29 | 2023-09-26 | Ericsson Telefon Ab L M | Vektorikvantisoija |
US10448161B2 (en) | 2012-04-02 | 2019-10-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field |
JP5998603B2 (ja) * | 2012-04-18 | 2016-09-28 | ソニー株式会社 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
KR101343768B1 (ko) * | 2012-04-19 | 2014-01-16 | 충북대학교 산학협력단 | 스펙트럼 변화 패턴을 이용한 음성 및 오디오 신호 분류방법 |
RU2504898C1 (ru) * | 2012-05-17 | 2014-01-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации |
RU2504894C1 (ru) * | 2012-05-17 | 2014-01-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации |
US20140006017A1 (en) * | 2012-06-29 | 2014-01-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal |
DK2891151T3 (en) * | 2012-08-31 | 2016-12-12 | ERICSSON TELEFON AB L M (publ) | Method and device for detection of voice activity |
EP2898506B1 (en) | 2012-09-21 | 2018-01-17 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
WO2014062859A1 (en) * | 2012-10-16 | 2014-04-24 | Audiologicall, Ltd. | Audio signal manipulation for speech enhancement before sound reproduction |
KR101413969B1 (ko) | 2012-12-20 | 2014-07-08 | 삼성전자주식회사 | 오디오 신호의 복호화 방법 및 장치 |
CN105551497B (zh) | 2013-01-15 | 2019-03-19 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
PL3054446T3 (pl) * | 2013-01-29 | 2024-02-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koder audio, dekoder audio, sposób dostarczania kodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i kodowana reprezentacja, stosujące adaptacyjne względem sygnału rozszerzenie szerokości pasma |
RU2618919C2 (ru) * | 2013-01-29 | 2017-05-12 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для синтезирования аудиосигнала, декодер, кодер, система и компьютерная программа |
CN103971693B (zh) | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
US20140213909A1 (en) * | 2013-01-31 | 2014-07-31 | Xerox Corporation | Control-based inversion for estimating a biological parameter vector for a biophysics model from diffused reflectance data |
US9711156B2 (en) | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
US9741350B2 (en) * | 2013-02-08 | 2017-08-22 | Qualcomm Incorporated | Systems and methods of performing gain control |
US9601125B2 (en) * | 2013-02-08 | 2017-03-21 | Qualcomm Incorporated | Systems and methods of performing noise modulation and gain adjustment |
US9336789B2 (en) * | 2013-02-21 | 2016-05-10 | Qualcomm Incorporated | Systems and methods for determining an interpolation factor set for synthesizing a speech signal |
US9715885B2 (en) * | 2013-03-05 | 2017-07-25 | Nec Corporation | Signal processing apparatus, signal processing method, and signal processing program |
EP2784775B1 (en) * | 2013-03-27 | 2016-09-14 | Binauric SE | Speech signal encoding/decoding method and apparatus |
CA3029033C (en) | 2013-04-05 | 2021-03-30 | Dolby International Ab | Audio encoder and decoder |
CN105264600B (zh) | 2013-04-05 | 2019-06-07 | Dts有限责任公司 | 分层音频编码和传输 |
CN117253498A (zh) * | 2013-04-05 | 2023-12-19 | 杜比国际公司 | 音频信号的解码方法和解码器、介质以及编码方法 |
RU2665253C2 (ru) * | 2013-06-21 | 2018-08-28 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для улучшенного маскирования адаптивной таблицы кодирования при acelp-образном маскировании с использованием улучшенной оценки запаздывания основного тона |
BR112015031605B1 (pt) | 2013-06-21 | 2022-03-29 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Decodificador de áudio tendo um módulo de extensão de largura de banda com um módulo de ajuste de energia |
FR3007563A1 (fr) * | 2013-06-25 | 2014-12-26 | France Telecom | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
EP3014290A4 (en) | 2013-06-27 | 2017-03-08 | The General Hospital Corporation | Systems and methods for tracking non-stationary spectral structure and dynamics in physiological data |
WO2014210527A1 (en) * | 2013-06-28 | 2014-12-31 | The General Hospital Corporation | System and method to infer brain state during burst suppression |
CN104282308B (zh) | 2013-07-04 | 2017-07-14 | 华为技术有限公司 | 频域包络的矢量量化方法和装置 |
FR3008533A1 (fr) | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
EP2830054A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
EP3503095A1 (en) | 2013-08-28 | 2019-06-26 | Dolby Laboratories Licensing Corp. | Hybrid waveform-coded and parametric-coded speech enhancement |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
EP4166072A1 (en) | 2013-09-13 | 2023-04-19 | The General Hospital Corporation | Systems and methods for improved brain monitoring during general anesthesia and sedation |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
CN108172239B (zh) * | 2013-09-26 | 2021-01-12 | 华为技术有限公司 | 频带扩展的方法及装置 |
CN104517611B (zh) | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
US9224402B2 (en) | 2013-09-30 | 2015-12-29 | International Business Machines Corporation | Wideband speech parameterization for high quality synthesis, transformation and quantization |
US9620134B2 (en) * | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US10083708B2 (en) * | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US9384746B2 (en) | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
KR102271852B1 (ko) | 2013-11-02 | 2021-07-01 | 삼성전자주식회사 | 광대역 신호 생성방법 및 장치와 이를 채용하는 기기 |
EP2871641A1 (en) * | 2013-11-12 | 2015-05-13 | Dialog Semiconductor B.V. | Enhancement of narrowband audio signals using a single sideband AM modulation |
CN105765655A (zh) | 2013-11-22 | 2016-07-13 | 高通股份有限公司 | 高频带译码中的选择性相位补偿 |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
WO2015098564A1 (ja) | 2013-12-27 | 2015-07-02 | ソニー株式会社 | 復号化装置および方法、並びにプログラム |
CN103714822B (zh) * | 2013-12-27 | 2017-01-11 | 广州华多网络科技有限公司 | 基于silk编解码器的子带编解码方法及装置 |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
US9564141B2 (en) | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
JP6281336B2 (ja) * | 2014-03-12 | 2018-02-21 | 沖電気工業株式会社 | 音声復号化装置及びプログラム |
JP6035270B2 (ja) * | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
US9542955B2 (en) * | 2014-03-31 | 2017-01-10 | Qualcomm Incorporated | High-band signal coding using multiple sub-bands |
RU2689181C2 (ru) * | 2014-03-31 | 2019-05-24 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Кодер, декодер, способ кодирования, способ декодирования и программа |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
CN105336336B (zh) | 2014-06-12 | 2016-12-28 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
CN107424622B (zh) | 2014-06-24 | 2020-12-25 | 华为技术有限公司 | 音频编码方法和装置 |
US9583115B2 (en) * | 2014-06-26 | 2017-02-28 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
US9984699B2 (en) * | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
CN106486129B (zh) * | 2014-06-27 | 2019-10-25 | 华为技术有限公司 | 一种音频编码方法和装置 |
US9721584B2 (en) * | 2014-07-14 | 2017-08-01 | Intel IP Corporation | Wind noise reduction for audio reception |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980792A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980798A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
WO2016024853A1 (ko) * | 2014-08-15 | 2016-02-18 | 삼성전자 주식회사 | 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기 |
CN104217730B (zh) * | 2014-08-18 | 2017-07-21 | 大连理工大学 | 一种基于k‑svd的人工语音带宽扩展方法及装置 |
US9978388B2 (en) | 2014-09-12 | 2018-05-22 | Knowles Electronics, Llc | Systems and methods for restoration of speech components |
TWI550945B (zh) * | 2014-12-22 | 2016-09-21 | 國立彰化師範大學 | 具有急遽過渡帶的複合濾波器之設計方法及其串聯式複合濾波器 |
US9595269B2 (en) * | 2015-01-19 | 2017-03-14 | Qualcomm Incorporated | Scaling for gain shape circuitry |
DE112016000545B4 (de) | 2015-01-30 | 2019-08-22 | Knowles Electronics, Llc | Kontextabhängiges schalten von mikrofonen |
ES2837107T3 (es) | 2015-02-26 | 2021-06-29 | Fraunhofer Ges Forschung | Aparato y método para procesar una señal de audio para obtener una señal de audio procesada usando una envolvente en el dominio del tiempo objetivo |
US10847170B2 (en) * | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
US9830921B2 (en) * | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
NO20151400A1 (en) | 2015-10-15 | 2017-01-23 | St Tech As | A system for isolating an object |
WO2017064264A1 (en) * | 2015-10-15 | 2017-04-20 | Huawei Technologies Co., Ltd. | Method and appratus for sinusoidal encoding and decoding |
MX371223B (es) | 2016-02-17 | 2020-01-09 | Fraunhofer Ges Forschung | Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios. |
FR3049084B1 (fr) | 2016-03-15 | 2022-11-11 | Fraunhofer Ges Forschung | Dispositif de codage pour le traitement d'un signal d'entree et dispositif de decodage pour le traitement d'un signal code |
ES2808997T3 (es) * | 2016-04-12 | 2021-03-02 | Fraunhofer Ges Forschung | Codificador de audio para codificar una señal de audio, método para codificar una señal de audio y programa informático en consideración de una región espectral del pico detectada en una banda de frecuencia superior |
US10770088B2 (en) * | 2016-05-10 | 2020-09-08 | Immersion Networks, Inc. | Adaptive audio decoder system, method and article |
US10756755B2 (en) * | 2016-05-10 | 2020-08-25 | Immersion Networks, Inc. | Adaptive audio codec system, method and article |
CN109416913B (zh) * | 2016-05-10 | 2024-03-15 | 易默森服务有限责任公司 | 自适应音频编解码系统、方法、装置及介质 |
US10699725B2 (en) * | 2016-05-10 | 2020-06-30 | Immersion Networks, Inc. | Adaptive audio encoder system, method and article |
US20170330575A1 (en) * | 2016-05-10 | 2017-11-16 | Immersion Services LLC | Adaptive audio codec system, method and article |
US10264116B2 (en) * | 2016-11-02 | 2019-04-16 | Nokia Technologies Oy | Virtual duplex operation |
KR102507383B1 (ko) * | 2016-11-08 | 2023-03-08 | 한국전자통신연구원 | 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템 |
US10786168B2 (en) | 2016-11-29 | 2020-09-29 | The General Hospital Corporation | Systems and methods for analyzing electrophysiological data from patients undergoing medical treatments |
ES2950009T3 (es) | 2017-01-06 | 2023-10-04 | Ericsson Telefon Ab L M | Métodos y aparatos para señalizar y determinar desplazamientos de señal de referencia |
KR20180092582A (ko) * | 2017-02-10 | 2018-08-20 | 삼성전자주식회사 | Wfst 디코딩 시스템, 이를 포함하는 음성 인식 시스템 및 wfst 데이터 저장 방법 |
US10553222B2 (en) * | 2017-03-09 | 2020-02-04 | Qualcomm Incorporated | Inter-channel bandwidth extension spectral mapping and adjustment |
US10304468B2 (en) * | 2017-03-20 | 2019-05-28 | Qualcomm Incorporated | Target sample generation |
TW202341126A (zh) * | 2017-03-23 | 2023-10-16 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
JP7057428B2 (ja) * | 2017-10-27 | 2022-04-19 | テラウェーブ,エルエルシー | 符号化正弦波形を使用する高スペクトル効率データ通信システムの受信器 |
US11876659B2 (en) | 2017-10-27 | 2024-01-16 | Terawave, Llc | Communication system using shape-shifted sinusoidal waveforms |
CN109729553B (zh) * | 2017-10-30 | 2021-12-28 | 成都鼎桥通信技术有限公司 | Lte集群通信系统的语音业务处理方法及设备 |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
US10460749B1 (en) * | 2018-06-28 | 2019-10-29 | Nuvoton Technology Corporation | Voice activity detection using vocal tract area information |
US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
JP7088403B2 (ja) * | 2019-02-20 | 2022-06-21 | ヤマハ株式会社 | 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム |
CN110610713B (zh) * | 2019-08-28 | 2021-11-16 | 南京梧桐微电子科技有限公司 | 一种声码器余量谱幅度参数重构方法及系统 |
US11380343B2 (en) | 2019-09-12 | 2022-07-05 | Immersion Networks, Inc. | Systems and methods for processing high frequency audio signal |
TWI723545B (zh) * | 2019-09-17 | 2021-04-01 | 宏碁股份有限公司 | 語音處理方法及其裝置 |
US11295751B2 (en) * | 2019-09-20 | 2022-04-05 | Tencent America LLC | Multi-band synchronized neural vocoder |
KR102201169B1 (ko) * | 2019-10-23 | 2021-01-11 | 성균관대학교 산학협력단 | 메타 표면의 반사 계수를 제어하기 위한 시간 부호 생성 방법, 메타 표면의 반사 계수를 제어하기 위한 시공간 부호 생성 방법, 이를 실행하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체, 및 이를 이용한 메타 표면의 신호 변조 방법 |
CN114548442B (zh) * | 2022-02-25 | 2022-10-21 | 万表名匠(广州)科技有限公司 | 一种基于互联网技术的腕表维修管理系统 |
Family Cites Families (148)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US526468A (en) * | 1894-09-25 | Charles d | ||
US596689A (en) * | 1898-01-04 | Hose holder or support | ||
US525147A (en) * | 1894-08-28 | Steam-cooker | ||
US321993A (en) * | 1885-07-14 | Lantern | ||
US1126620A (en) * | 1911-01-30 | 1915-01-26 | Safety Car Heating & Lighting | Electric regulation. |
US1089258A (en) * | 1914-01-13 | 1914-03-03 | James Arnot Paterson | Facing or milling machine. |
US1300833A (en) * | 1918-12-12 | 1919-04-15 | Moline Mill Mfg Company | Idler-pulley structure. |
US1498873A (en) * | 1924-04-19 | 1924-06-24 | Bethlehem Steel Corp | Switch stand |
US2073913A (en) * | 1934-06-26 | 1937-03-16 | Wigan Edmund Ramsay | Means for gauging minute displacements |
US2086867A (en) * | 1936-06-19 | 1937-07-13 | Hall Lab Inc | Laundering composition and process |
US3044777A (en) * | 1959-10-19 | 1962-07-17 | Fibermold Corp | Bowling pin |
US3158693A (en) * | 1962-08-07 | 1964-11-24 | Bell Telephone Labor Inc | Speech interpolation communication system |
US3855416A (en) | 1972-12-01 | 1974-12-17 | F Fuller | Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment |
US3855414A (en) | 1973-04-24 | 1974-12-17 | Anaconda Co | Cable armor clamp |
JPS59139099A (ja) | 1983-01-31 | 1984-08-09 | 株式会社東芝 | 音声区間検出装置 |
US4616659A (en) | 1985-05-06 | 1986-10-14 | At&T Bell Laboratories | Heart rate detection utilizing autoregressive analysis |
US4630305A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4747143A (en) | 1985-07-12 | 1988-05-24 | Westinghouse Electric Corp. | Speech enhancement system having dynamic gain control |
NL8503152A (nl) * | 1985-11-15 | 1987-06-01 | Optische Ind De Oude Delft Nv | Dosismeter voor ioniserende straling. |
US4862168A (en) | 1987-03-19 | 1989-08-29 | Beard Terry D | Audio digital/analog encoding and decoding |
US4805193A (en) * | 1987-06-04 | 1989-02-14 | Motorola, Inc. | Protection of energy information in sub-band coding |
US4852179A (en) | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
JP2707564B2 (ja) | 1987-12-14 | 1998-01-28 | 株式会社日立製作所 | 音声符号化方式 |
US5285520A (en) * | 1988-03-02 | 1994-02-08 | Kokusai Denshin Denwa Kabushiki Kaisha | Predictive coding apparatus |
CA1321645C (en) | 1988-09-28 | 1993-08-24 | Akira Ichikawa | Method and system for voice coding based on vector quantization |
US5086475A (en) | 1988-11-19 | 1992-02-04 | Sony Corporation | Apparatus for generating, recording or reproducing sound source data |
JPH02244100A (ja) * | 1989-03-16 | 1990-09-28 | Ricoh Co Ltd | 駆動音源信号生成装置 |
BR9105987A (pt) | 1990-09-19 | 1993-02-02 | Philips Nv | Portador de registro no qual foram registrados um arquivo de dados principais e um arquivo de controle,processo e dispositivo para registrar um arquivo de dados principais e um arquivo de controle num portador de registro,e dispositivo para ter um portador de registro |
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
JP3191457B2 (ja) | 1992-10-31 | 2001-07-23 | ソニー株式会社 | 高能率符号化装置、ノイズスペクトル変更装置及び方法 |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
JP3721582B2 (ja) | 1993-06-30 | 2005-11-30 | ソニー株式会社 | 信号符号化装置及び方法並びに信号復号化装置及び方法 |
WO1995010760A2 (en) | 1993-10-08 | 1995-04-20 | Comsat Corporation | Improved low bit rate vocoders and methods of operation therefor |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5487087A (en) | 1994-05-17 | 1996-01-23 | Texas Instruments Incorporated | Signal quantizer with reduced output fluctuation |
US5797118A (en) | 1994-08-09 | 1998-08-18 | Yamaha Corporation | Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns |
JP2770137B2 (ja) | 1994-09-22 | 1998-06-25 | 日本プレシジョン・サーキッツ株式会社 | 波形データ圧縮装置 |
US5699477A (en) * | 1994-11-09 | 1997-12-16 | Texas Instruments Incorporated | Mixed excitation linear prediction with fractional pitch |
FI97182C (fi) | 1994-12-05 | 1996-10-25 | Nokia Telecommunications Oy | Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin |
JP3365113B2 (ja) * | 1994-12-22 | 2003-01-08 | ソニー株式会社 | 音声レベル制御装置 |
JP3189614B2 (ja) | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
EP0732687B2 (en) * | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
JP2798003B2 (ja) | 1995-05-09 | 1998-09-17 | 松下電器産業株式会社 | 音声帯域拡大装置および音声帯域拡大方法 |
JP2956548B2 (ja) | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
US5706395A (en) * | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
US6263307B1 (en) | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
JP3334419B2 (ja) * | 1995-04-20 | 2002-10-15 | ソニー株式会社 | ノイズ低減方法及びノイズ低減装置 |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
US5704003A (en) | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
US6097824A (en) | 1997-06-06 | 2000-08-01 | Audiologic, Incorporated | Continuous frequency dynamic range audio compressor |
DE69530204T2 (de) * | 1995-10-16 | 2004-03-18 | Agfa-Gevaert | Neue Klasse von Gelbfarbstoffen für photographische Materialien |
JP3707116B2 (ja) * | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
US5737716A (en) * | 1995-12-26 | 1998-04-07 | Motorola | Method and apparatus for encoding speech using neural network technology for speech classification |
JP3073919B2 (ja) * | 1995-12-30 | 2000-08-07 | 松下電器産業株式会社 | 同期装置 |
US5689615A (en) | 1996-01-22 | 1997-11-18 | Rockwell International Corporation | Usage of voice activity detection for efficient coding of speech |
TW307960B (en) * | 1996-02-15 | 1997-06-11 | Philips Electronics Nv | Reduced complexity signal transmission system |
EP0814458B1 (en) | 1996-06-19 | 2004-09-22 | Texas Instruments Incorporated | Improvements in or relating to speech coding |
JP3246715B2 (ja) | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
KR20030096444A (ko) * | 1996-11-07 | 2003-12-31 | 마쯔시다덴기산교 가부시키가이샤 | 음원 벡터 생성 장치 및 방법 |
US6009395A (en) | 1997-01-02 | 1999-12-28 | Texas Instruments Incorporated | Synthesizer and method using scaled excitation signal |
US6202046B1 (en) | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
US6041297A (en) * | 1997-03-10 | 2000-03-21 | At&T Corp | Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations |
US5890126A (en) * | 1997-03-10 | 1999-03-30 | Euphonics, Incorporated | Audio data decompression and interpolation apparatus and method |
EP0878790A1 (en) | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6889185B1 (en) | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
US6122384A (en) * | 1997-09-02 | 2000-09-19 | Qualcomm Inc. | Noise suppression system and method |
US6029125A (en) * | 1997-09-02 | 2000-02-22 | Telefonaktiebolaget L M Ericsson, (Publ) | Reducing sparseness in coded speech signals |
US6231516B1 (en) * | 1997-10-14 | 2001-05-15 | Vacusense, Inc. | Endoluminal implant with therapeutic and diagnostic capability |
JPH11205166A (ja) * | 1998-01-19 | 1999-07-30 | Mitsubishi Electric Corp | ノイズ検出装置 |
US6301556B1 (en) | 1998-03-04 | 2001-10-09 | Telefonaktiebolaget L M. Ericsson (Publ) | Reducing sparseness in coded speech signals |
US6385573B1 (en) | 1998-08-24 | 2002-05-07 | Conexant Systems, Inc. | Adaptive tilt compensation for synthesized speech residual |
US6449590B1 (en) | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
JP4170458B2 (ja) | 1998-08-27 | 2008-10-22 | ローランド株式会社 | 波形信号の時間軸圧縮伸長装置 |
US6353808B1 (en) | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
KR20000047944A (ko) | 1998-12-11 | 2000-07-25 | 이데이 노부유끼 | 수신장치 및 방법과 통신장치 및 방법 |
JP4354561B2 (ja) | 1999-01-08 | 2009-10-28 | パナソニック株式会社 | オーディオ信号符号化装置及び復号化装置 |
US6223151B1 (en) * | 1999-02-10 | 2001-04-24 | Telefon Aktie Bolaget Lm Ericsson | Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders |
JP3696091B2 (ja) | 1999-05-14 | 2005-09-14 | 松下電器産業株式会社 | オーディオ信号の帯域を拡張するための方法及び装置 |
US6604070B1 (en) | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
JP4792613B2 (ja) | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
US6556950B1 (en) | 1999-09-30 | 2003-04-29 | Rockwell Automation Technologies, Inc. | Diagnostic method and apparatus for use with enterprise control |
US6715125B1 (en) | 1999-10-18 | 2004-03-30 | Agere Systems Inc. | Source coding and transmission with time diversity |
CN1192355C (zh) | 1999-11-16 | 2005-03-09 | 皇家菲利浦电子有限公司 | 宽带音频传输系统 |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US7260523B2 (en) * | 1999-12-21 | 2007-08-21 | Texas Instruments Incorporated | Sub-band speech coding system |
CN1187735C (zh) | 2000-01-11 | 2005-02-02 | 松下电器产业株式会社 | 多模式话音编码装置和解码装置 |
US6757395B1 (en) | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
US6704711B2 (en) | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US6732070B1 (en) * | 2000-02-16 | 2004-05-04 | Nokia Mobile Phones, Ltd. | Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching |
JP3681105B2 (ja) | 2000-02-24 | 2005-08-10 | アルパイン株式会社 | データ処理方式 |
FI119576B (fi) * | 2000-03-07 | 2008-12-31 | Nokia Corp | Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin |
US6523003B1 (en) * | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
US7330814B2 (en) | 2000-05-22 | 2008-02-12 | Texas Instruments Incorporated | Wideband speech coding with modulated noise highband excitation system and method |
DE60118627T2 (de) * | 2000-05-22 | 2007-01-11 | Texas Instruments Inc., Dallas | Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen |
US7136810B2 (en) | 2000-05-22 | 2006-11-14 | Texas Instruments Incorporated | Wideband speech coding system and method |
JP2002055699A (ja) * | 2000-08-10 | 2002-02-20 | Mitsubishi Electric Corp | 音声符号化装置および音声符号化方法 |
BR0107142A (pt) | 2000-08-25 | 2002-07-02 | Koninkl Philips Electronics Nv | Métodos para redução do número de bits de um sinal de entrada digital, e para recuperar um sinal de saìda de um sinal de comprimento de palavra reduzido, e, aparelhos de processamento de sinal, e para decodificação de sinal |
US6515889B1 (en) * | 2000-08-31 | 2003-02-04 | Micron Technology, Inc. | Junction-isolated depletion mode ferroelectric memory |
US7386444B2 (en) | 2000-09-22 | 2008-06-10 | Texas Instruments Incorporated | Hybrid speech coding and system |
US6947888B1 (en) | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
JP2002202799A (ja) | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
JP3558031B2 (ja) | 2000-11-06 | 2004-08-25 | 日本電気株式会社 | 音声復号化装置 |
US7346499B2 (en) | 2000-11-09 | 2008-03-18 | Koninklijke Philips Electronics N.V. | Wideband extension of telephone speech for higher perceptual quality |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
AU2002218501A1 (en) * | 2000-11-30 | 2002-06-11 | Matsushita Electric Industrial Co., Ltd. | Vector quantizing device for lpc parameters |
GB0031461D0 (en) | 2000-12-22 | 2001-02-07 | Thales Defence Ltd | Communication sets |
US20040204935A1 (en) | 2001-02-21 | 2004-10-14 | Krishnasamy Anandakumar | Adaptive voice playout in VOP |
JP2002268698A (ja) | 2001-03-08 | 2002-09-20 | Nec Corp | 音声認識装置と標準パターン作成装置及び方法並びにプログラム |
US20030028386A1 (en) | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
CN1529882A (zh) * | 2001-05-11 | 2004-09-15 | 西门子公司 | 用于扩展窄带滤波的语音信号、特别是由通信设备发送的语音信号的带宽的方法 |
CN1235192C (zh) * | 2001-06-28 | 2006-01-04 | 皇家菲利浦电子有限公司 | 传输系统以及用于接收窄带音频信号的接收机和方法 |
US6879955B2 (en) * | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
JP2003036097A (ja) * | 2001-07-25 | 2003-02-07 | Sony Corp | 情報検出装置及び方法、並びに情報検索装置及び方法 |
TW525147B (en) | 2001-09-28 | 2003-03-21 | Inventec Besta Co Ltd | Method of obtaining and decoding basic cycle of voice |
US6988066B2 (en) * | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
TW526468B (en) | 2001-10-19 | 2003-04-01 | Chunghwa Telecom Co Ltd | System and method for eliminating background noise of voice signal |
JP4245288B2 (ja) * | 2001-11-13 | 2009-03-25 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
DE60212696T2 (de) * | 2001-11-23 | 2007-02-22 | Koninklijke Philips Electronics N.V. | Bandbreitenvergrösserung für audiosignale |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US6751587B2 (en) | 2002-01-04 | 2004-06-15 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
JP4290917B2 (ja) * | 2002-02-08 | 2009-07-08 | 株式会社エヌ・ティ・ティ・ドコモ | 復号装置、符号化装置、復号方法、及び、符号化方法 |
JP3826813B2 (ja) | 2002-02-18 | 2006-09-27 | ソニー株式会社 | ディジタル信号処理装置及びディジタル信号処理方法 |
DE60303689T2 (de) | 2002-09-19 | 2006-10-19 | Matsushita Electric Industrial Co., Ltd., Kadoma | Audiodecodierungsvorrichtung und -verfahren |
JP3756864B2 (ja) | 2002-09-30 | 2006-03-15 | 株式会社東芝 | 音声合成方法と装置及び音声合成プログラム |
KR100841096B1 (ko) | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
US20040098255A1 (en) | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
US7242763B2 (en) * | 2002-11-26 | 2007-07-10 | Lucent Technologies Inc. | Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems |
CA2415105A1 (en) | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
KR100480341B1 (ko) | 2003-03-13 | 2005-03-31 | 한국전자통신연구원 | 광대역 저전송률 음성 신호의 부호화기 |
DE602004007786T2 (de) | 2003-05-01 | 2008-04-30 | Nokia Corp. | Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate |
WO2005004113A1 (ja) | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
FI118550B (fi) * | 2003-07-14 | 2007-12-14 | Nokia Corp | Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä |
US7428490B2 (en) * | 2003-09-30 | 2008-09-23 | Intel Corporation | Method for spectral subtraction in speech enhancement |
US7689579B2 (en) * | 2003-12-03 | 2010-03-30 | Siemens Aktiengesellschaft | Tag modeling within a decision, support, and reporting environment |
KR100587953B1 (ko) * | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
JP4259401B2 (ja) | 2004-06-02 | 2009-04-30 | カシオ計算機株式会社 | 音声処理装置及び音声符号化方法 |
US8000967B2 (en) | 2005-03-09 | 2011-08-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity code excited linear prediction encoding |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
UA94041C2 (ru) * | 2005-04-01 | 2011-04-11 | Квелкомм Инкорпорейтед | Способ и устройство для фильтрации, устраняющей разреженность |
WO2006107833A1 (en) | 2005-04-01 | 2006-10-12 | Qualcomm Incorporated | Method and apparatus for vector quantizing of a spectral envelope representation |
US9043214B2 (en) | 2005-04-22 | 2015-05-26 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor attenuation |
-
2006
- 2006-04-03 WO PCT/US2006/012227 patent/WO2006107833A1/en active Application Filing
- 2006-04-03 TW TW095111794A patent/TWI320923B/zh active
- 2006-04-03 JP JP2008504481A patent/JP4955649B2/ja active Active
- 2006-04-03 PT PT06784345T patent/PT1864101E/pt unknown
- 2006-04-03 TW TW095111797A patent/TWI316225B/zh active
- 2006-04-03 DE DE602006012637T patent/DE602006012637D1/de active Active
- 2006-04-03 MX MX2007012185A patent/MX2007012185A/es active IP Right Grant
- 2006-04-03 KR KR1020077025421A patent/KR100956524B1/ko active IP Right Grant
- 2006-04-03 RU RU2007140383/09A patent/RU2402826C2/ru active
- 2006-04-03 CN CN201110326747.2A patent/CN102411935B/zh active Active
- 2006-04-03 AU AU2006232363A patent/AU2006232363B2/en active Active
- 2006-04-03 PL PL06740355T patent/PL1869673T3/pl unknown
- 2006-04-03 EP EP06740354A patent/EP1866914B1/en active Active
- 2006-04-03 NZ NZ562182A patent/NZ562182A/xx not_active IP Right Cessation
- 2006-04-03 AT AT06740357T patent/ATE492016T1/de not_active IP Right Cessation
- 2006-04-03 MX MX2007012187A patent/MX2007012187A/es active IP Right Grant
- 2006-04-03 AU AU2006232362A patent/AU2006232362B2/en active Active
- 2006-04-03 KR KR1020077025255A patent/KR100956624B1/ko active IP Right Grant
- 2006-04-03 WO PCT/US2006/012235 patent/WO2006107840A1/en active Application Filing
- 2006-04-03 EP EP06784345A patent/EP1864101B1/en active Active
- 2006-04-03 RU RU2009131435/08A patent/RU2491659C2/ru active
- 2006-04-03 KR KR1020077025447A patent/KR101019940B1/ko active IP Right Grant
- 2006-04-03 PT PT67403584T patent/PT1864282T/pt unknown
- 2006-04-03 RU RU2007140381/09A patent/RU2386179C2/ru active
- 2006-04-03 NZ NZ562188A patent/NZ562188A/en not_active IP Right Cessation
- 2006-04-03 JP JP2008504482A patent/JP5161069B2/ja active Active
- 2006-04-03 WO PCT/US2006/012230 patent/WO2006107836A1/en active Application Filing
- 2006-04-03 CA CA2603187A patent/CA2603187C/en active Active
- 2006-04-03 NZ NZ562190A patent/NZ562190A/en not_active IP Right Cessation
- 2006-04-03 EP EP06740355A patent/EP1869673B1/en active Active
- 2006-04-03 MX MX2007012191A patent/MX2007012191A/es active IP Right Grant
- 2006-04-03 JP JP2008504478A patent/JP5129117B2/ja active Active
- 2006-04-03 AU AU2006232358A patent/AU2006232358B2/en not_active Expired - Fee Related
- 2006-04-03 JP JP2008504479A patent/JP5203930B2/ja active Active
- 2006-04-03 SG SG201004744-7A patent/SG163556A1/en unknown
- 2006-04-03 RU RU2007140365/09A patent/RU2376657C2/ru active
- 2006-04-03 CA CA2603229A patent/CA2603229C/en active Active
- 2006-04-03 US US11/397,794 patent/US8484036B2/en active Active
- 2006-04-03 TW TW095111851A patent/TWI319565B/zh active
- 2006-04-03 TW TW095111800A patent/TWI321777B/zh active
- 2006-04-03 CA CA2603219A patent/CA2603219C/en active Active
- 2006-04-03 SI SI200632188T patent/SI1864282T1/sl unknown
- 2006-04-03 US US11/397,871 patent/US8140324B2/en active Active
- 2006-04-03 ES ES06740354T patent/ES2340608T3/es active Active
- 2006-04-03 AU AU2006232364A patent/AU2006232364B2/en active Active
- 2006-04-03 JP JP2008504480A patent/JP5129118B2/ja active Active
- 2006-04-03 WO PCT/US2006/012232 patent/WO2006107838A1/en active Application Filing
- 2006-04-03 DK DK06784345.8T patent/DK1864101T3/da active
- 2006-04-03 CA CA2603231A patent/CA2603231C/en active Active
- 2006-04-03 EP EP06740352A patent/EP1864281A1/en not_active Withdrawn
- 2006-04-03 AT AT06740355T patent/ATE482449T1/de not_active IP Right Cessation
- 2006-04-03 MX MX2007012183A patent/MX2007012183A/es active IP Right Grant
- 2006-04-03 PL PL06784345T patent/PL1864101T3/pl unknown
- 2006-04-03 CA CA2602804A patent/CA2602804C/en active Active
- 2006-04-03 ES ES06784345T patent/ES2391292T3/es active Active
- 2006-04-03 KR KR1020077025432A patent/KR100956525B1/ko active IP Right Grant
- 2006-04-03 KR KR1020077025290A patent/KR100956876B1/ko active IP Right Grant
- 2006-04-03 KR KR1020077025293A patent/KR100982638B1/ko active IP Right Grant
- 2006-04-03 WO PCT/US2006/012231 patent/WO2006107837A1/en active Application Filing
- 2006-04-03 RU RU2007140426/09A patent/RU2402827C2/ru active
- 2006-04-03 AU AU2006232357A patent/AU2006232357C1/en active Active
- 2006-04-03 NZ NZ562186A patent/NZ562186A/xx not_active IP Right Cessation
- 2006-04-03 BR BRPI0608305-6A patent/BRPI0608305B1/pt active IP Right Grant
- 2006-04-03 MX MX2007012182A patent/MX2007012182A/es active IP Right Grant
- 2006-04-03 MX MX2007012184A patent/MX2007012184A/es active IP Right Grant
- 2006-04-03 ES ES06740358.4T patent/ES2636443T3/es active Active
- 2006-04-03 US US11/397,432 patent/US8364494B2/en active Active
- 2006-04-03 EP EP06740357A patent/EP1866915B1/en active Active
- 2006-04-03 SG SG201004741-3A patent/SG163555A1/en unknown
- 2006-04-03 RU RU2007140394/09A patent/RU2413191C2/ru active
- 2006-04-03 TW TW095111852A patent/TWI324335B/zh active
- 2006-04-03 MX MX2007012181A patent/MX2007012181A/es active IP Right Grant
- 2006-04-03 BR BRPI0609530-5A patent/BRPI0609530B1/pt active IP Right Grant
- 2006-04-03 JP JP2008504474A patent/JP5203929B2/ja active Active
- 2006-04-03 BR BRPI0607691A patent/BRPI0607691B1/pt active IP Right Grant
- 2006-04-03 BR BRPI0608269A patent/BRPI0608269B8/pt active IP Right Grant
- 2006-04-03 DE DE602006018884T patent/DE602006018884D1/de active Active
- 2006-04-03 JP JP2008504475A patent/JP5129115B2/ja active Active
- 2006-04-03 NZ NZ562185A patent/NZ562185A/en not_active IP Right Cessation
- 2006-04-03 WO PCT/US2006/012228 patent/WO2006107834A1/en active Application Filing
- 2006-04-03 AT AT06740354T patent/ATE459958T1/de not_active IP Right Cessation
- 2006-04-03 RU RU2007140429/09A patent/RU2387025C2/ru active
- 2006-04-03 AU AU2006252957A patent/AU2006252957B2/en active Active
- 2006-04-03 DE DE602006017050T patent/DE602006017050D1/de active Active
- 2006-04-03 DE DE602006017673T patent/DE602006017673D1/de active Active
- 2006-04-03 US US11/397,870 patent/US8260611B2/en active Active
- 2006-04-03 SG SG201002300-0A patent/SG161223A1/en unknown
- 2006-04-03 DK DK06740358.4T patent/DK1864282T3/en active
- 2006-04-03 KR KR1020077025422A patent/KR100956523B1/ko active IP Right Grant
- 2006-04-03 AT AT06740351T patent/ATE485582T1/de not_active IP Right Cessation
- 2006-04-03 TW TW095111819A patent/TWI321315B/zh active
- 2006-04-03 US US11/397,872 patent/US8069040B2/en active Active
- 2006-04-03 PL PL06740357T patent/PL1866915T3/pl unknown
- 2006-04-03 AU AU2006232360A patent/AU2006232360B2/en active Active
- 2006-04-03 US US11/397,505 patent/US8332228B2/en active Active
- 2006-04-03 CA CA2603255A patent/CA2603255C/en active Active
- 2006-04-03 EP EP06740358.4A patent/EP1864282B1/en active Active
- 2006-04-03 CA CA2602806A patent/CA2602806C/en active Active
- 2006-04-03 RU RU2007140406/09A patent/RU2390856C2/ru active
- 2006-04-03 RU RU2007140382/09A patent/RU2381572C2/ru active
- 2006-04-03 US US11/397,370 patent/US8078474B2/en active Active
- 2006-04-03 EP EP06740356A patent/EP1864283B1/en active Active
- 2006-04-03 PL PL06740358T patent/PL1864282T3/pl unknown
- 2006-04-03 BR BRPI0607690A patent/BRPI0607690A8/pt not_active Application Discontinuation
- 2006-04-03 KR KR1020077025400A patent/KR100956877B1/ko active IP Right Grant
- 2006-04-03 BR BRPI0608306-4A patent/BRPI0608306A2/pt not_active Application Discontinuation
- 2006-04-03 US US11/397,433 patent/US8244526B2/en active Active
- 2006-04-03 EP EP06740351A patent/EP1869670B1/en active Active
- 2006-04-03 MX MX2007012189A patent/MX2007012189A/es active IP Right Grant
- 2006-04-03 WO PCT/US2006/012233 patent/WO2006107839A2/en active Application Filing
- 2006-04-03 SG SG201002303-4A patent/SG161224A1/en unknown
- 2006-04-03 NZ NZ562183A patent/NZ562183A/en unknown
- 2006-04-03 TW TW095111804A patent/TWI321314B/zh active
- 2006-04-03 JP JP2008504477A patent/JP5129116B2/ja active Active
- 2006-04-03 TW TW095111814A patent/TWI330828B/zh active
- 2006-04-03 BR BRPI0607646-7A patent/BRPI0607646B1/pt active IP Right Grant
- 2006-04-03 AU AU2006232361A patent/AU2006232361B2/en active Active
- 2006-04-03 CA CA2603246A patent/CA2603246C/en active Active
- 2006-04-03 BR BRPI0608270-0A patent/BRPI0608270A2/pt not_active Application Discontinuation
- 2006-04-03 WO PCT/US2006/012234 patent/WO2006130221A1/en active Application Filing
-
2007
- 2007-10-07 IL IL186442A patent/IL186442A/en active IP Right Grant
- 2007-10-07 IL IL186441A patent/IL186441A0/en active IP Right Grant
- 2007-10-07 IL IL186405A patent/IL186405A/en active IP Right Grant
- 2007-10-07 IL IL186404A patent/IL186404A/en active IP Right Grant
- 2007-10-07 IL IL186436A patent/IL186436A0/en active IP Right Grant
- 2007-10-07 IL IL186438A patent/IL186438A/en active IP Right Grant
- 2007-10-07 IL IL186439A patent/IL186439A0/en unknown
- 2007-10-07 IL IL186443A patent/IL186443A/en active IP Right Grant
- 2007-10-31 NO NO20075510A patent/NO20075510L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075513A patent/NO340428B1/no unknown
- 2007-10-31 NO NO20075515A patent/NO340566B1/no unknown
- 2007-10-31 NO NO20075503A patent/NO20075503L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075511A patent/NO20075511L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075514A patent/NO340434B1/no unknown
- 2007-10-31 NO NO20075512A patent/NO20075512L/no not_active Application Discontinuation
-
2008
- 2008-08-28 HK HK08109568.5A patent/HK1113848A1/xx unknown
- 2008-09-19 HK HK08110384.5A patent/HK1115023A1/xx unknown
- 2008-09-22 HK HK08110465.7A patent/HK1114901A1/xx unknown
- 2008-09-24 HK HK08110589.8A patent/HK1115024A1/xx unknown
- 2008-09-24 HK HK12110024.5A patent/HK1169509A1/xx unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BRPI0609530B1 (pt) | métodos e equipamento para encodificar e decodificar uma porção de banda alta de um sinal de fala | |
ES2705589T3 (es) | Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia | |
ES2350494T3 (es) | Procedimiento y aparatos para codificar y decodificar una parte de banda alta de una señal de habla. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B15K | Others concerning applications: alteration of classification |
Ipc: G10L 21/0208 (2013.01), G10L 19/02 (2013.01), G10L |
|
B07A | Application suspended after technical examination (opinion) [chapter 7.1 patent gazette] | ||
B07A | Application suspended after technical examination (opinion) [chapter 7.1 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 29/10/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) 10 (DEZ) ANOS CONTADOS A PARTIR DE 29/10/2019, OBSERVADAS AS CONDICOES LEGAIS |