BR112016008236B1 - Método, aparelho, dispositivo, meio legível por computador para extensão de largura de banda de um sinal de áudio com uso de uma excitação de banda alta dimensionada - Google Patents
Método, aparelho, dispositivo, meio legível por computador para extensão de largura de banda de um sinal de áudio com uso de uma excitação de banda alta dimensionada Download PDFInfo
- Publication number
- BR112016008236B1 BR112016008236B1 BR112016008236-2A BR112016008236A BR112016008236B1 BR 112016008236 B1 BR112016008236 B1 BR 112016008236B1 BR 112016008236 A BR112016008236 A BR 112016008236A BR 112016008236 B1 BR112016008236 B1 BR 112016008236B1
- Authority
- BR
- Brazil
- Prior art keywords
- signal
- highband
- subframe
- band
- excitation signal
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 69
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000005284 excitation Effects 0.000 claims abstract description 151
- 238000003786 synthesis reaction Methods 0.000 claims description 27
- 230000015572 biosynthetic process Effects 0.000 claims description 26
- 230000003595 spectral effect Effects 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 description 63
- 238000010586 diagram Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 7
- 101000852665 Alopecosa marikovskyi Omega-lycotoxin-Gsp2671a Proteins 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000004513 sizing Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101100379142 Mus musculus Anxa1 gene Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
método, aparelho, dispositivo, meio legível por computador para extensão de largura de banda de um sinal de áudio com uso de uma excitação de banda alta dimensionada. trata-se de um método que inclui determinar um primeiro sinal de banda alta moldado com base em um sinal de excitação de banda baixa de um sinal de áudio, em que o sinal de áudio inclui uma porção de banda alta e uma porção de banda baixa. o método também inclui determinar fatores de dimensionamento com base na energia de subquadros do primeiro sinal de banda alta moldado e na energia de subquadros correspondentes da porção de banda alta do sinal de áudio. o método inclui aplicar os fatores de dimensionamento a um sinal de excitação de banda alta moldado para determinar um sinal de excitação de banda alta dimensionado e determinar um segundo sinal de banda alta moldado com base no sinal de excitação de banda alta dimensionado. o método inclui determinar parâmetros de ganho com base no segundo sinal de banda alta moldado e na porção de banda alta do sinal de áudio.
Description
[0001] O presente pedido reivindica prioridade ao Pedido de Patente Provisória n° US 61/890.812, intitulado "SYSTEMS AND METHODS OF ENERGY-SCALED SIGNAL PROCESSING", depositado em 14 de outubro de 2013 e Pedido de Patente Não Provisória n° US 14/512.892, intitulado "SYSTEMS AND METHODS OF ENERGY-SCALED SIGNAL PROCESSFNG”, depositado em 13 de outubro de 2014, cujos conteúdos são incorporados a título de referência em sua totalidade.
[0002] A presente revelação refere-se, em geral, ao processamento de sinal.
[0003] Os avanços na tecnologia resultaram em dispositivos de computação menores e mais potentes. Por exemplo, existe atualmente uma variedade de dispositivos de computação pessoais portáteis, inclusive dispositivos de computação sem fio, como os telefones portáteis sem fio, assistentes pessoais digitais (PDAs) e dispositivos de paginação que são pequenos, leves e facilmente carregados pelos usuários. Mais especificamente, os telefones portáteis sem fio, como telefones celulares e telefones de Protocolo da Internet (IP), podem comunicar pacotes de voz e dados através das redes sem fio. Ademais, muitos tais telefones sem fio incluem outros tipos de dispositivos que são incorporados nos mesmos. Por exemplo, um telefone sem fio também pode incluir uma câmera fotográfica digital, uma câmera de vídeo digital, um gravador digital e um reprodutor de arquivo de áudio.
[0004] Em sistemas de telefone tradicionais (por exemplo, redes de telefonia comutada pública (PSTNs)), a largura de banda de sinal é limitada à faixa defrequência de 300 Hertz (Hz) a 3,4 quilohertz (kHz). Emaplicações de banda larga (WB), como telefonia celular evoz através de Protocolo da Internet (VoIP), a largura de banda de sinal pode ultrapassar a faixa de frequência de 50 Hz a 7 kHz. As técnicas de codificação de superbanda larga (SWB) suportam a largura de banda que se estende até cerca de 16 kHz. A extensão da largura de banda de sinal a partir da telefonia de banda estreita em 3,4 kHz até a telefonia de SWB de 16 kHz pode aprimorar a inteligibilidade e a naturalidade da fala.
[0005] As técnicas de codificação de SWB envolvem tipicamente codificar e transmitir a porção do sinal de menor frequência (por exemplo, de 50 Hz a 7 kHz, também chamada de "banda baixa"). Por exemplo, a banda baixa pode ser representada com o uso de parâmetros de filtro e/ou um sinal de excitação de banda baixa. No entanto, a fim de aprimorar a eficiência de codificação, a porção do sinal de maior frequência (por exemplo, de 7 kHz a 16 kHz, também chamada de "banda alta") pode ser codificada com o uso das técnicas de modelagem de sinal para predizer a banda alta. Em algumas implantações, os dados associados à banda alta podem ser fornecidos para o receptor para auxiliar na predição. Tais dados podem ser referidos como "informações específicas", e podem incluir informações de ganho, frequências espectrais de linha (LSFs, também referidas como pares espectrais de linha (LSPs)), etc. As informações de ganho podem incluir informações de formato de ganho determinadas com base nas energias de subquadro tanto de sinal de banda alta quanto do sinal de banda alta moldado. As informações de formato de ganho podem ter uma faixa dinâmica mais larga (por exemplo, grandes oscilações) devido às diferenças no sinal de banda alta original em relação ao sinal de banda alta moldado. A faixa dinâmica mais larga pode reduzir a eficiência de um codificador usado para codificar/transmitir as informações de formato de ganho.
[0006] Os sistemas e métodos de realizar a codificação de sinal de áudio são revelados. Em uma modalidade específica, um sinal de áudio é codificado em um fluxo de bits ou fluxo de dados que inclui um fluxo de bits de banda baixa (que representa uma porção de banda baixa do sinal de áudio) e informações específicas de banda alta (que representa uma porção de banda alta do sinal de áudio). As informações específicas de banda alta podem ser geradas com o uso da porção de banda baixa do sinal de áudio. Por exemplo, um sinal de excitação de banda baixa pode ser estendido para gerar um sinal de excitação de banda alta. O sinal de excitação de banda alta pode ser usado para gerar (por exemplo, sintetizar) um primeiro sinal de banda alta moldado. As dicas de energia entre o sinal de banda alta e o sinal de banda alta moldado podem ser usadas para determinar os fatores de dimensionamento (por exemplo, um primeiro conjunto de um ou mais fatores de dimensionamento). Os fatores de dimensionamento (ou um segundo conjunto de fatores de dimensionamento determinado com base no primeiro conjunto de fatores de dimensionamento) podem ser aplicados ao sinal de excitação de banda alta para gerar (por exemplo, sintetizar) um segundo sinal de banda alta moldado. O segundo sinal de banda alta moldado pode ser usado para determinar as informações específicas de banda alta. Uma vez que o segundo sinal de banda alta moldado é dimensionado para justificar as diferenças de energia em relação ao sinal de banda alta, as informações específicas de banda alta com base no segundo sinal de banda alta moldado podem ter uma faixa dinâmica reduzida em relação às informações específicas de banda alta determinadas sem dimensionar as diferenças de energia.
[0007] Em uma modalidade específica, um método inclui determinar um primeiro sinal de banda alta moldado com base em um sinal de excitação de banda baixa de um sinal de áudio. O sinal de áudio inclui uma porção de banda alta e uma porção de banda baixa. O método também inclui determinar fatores de dimensionamento com base na energia de subquadros do primeiro sinal de banda alta moldado e na energia de subquadros correspondentes do primeiro de banda alta do sinal de áudio. O método inclui aplicar os fatores de dimensionamento a um sinal de excitação de banda alta moldado para determinar um sinal de excitação de banda alta dimensionado e determinar um segundo sinal de banda alta moldado com base no sinal de excitação de banda alta dimensionado. O método também inclui determinar informações de ganho com base no segundo sinal de banda alta moldado e na porção de banda alta do sinal de áudio.
[0008] Em uma outra modalidade específica, um aparelho inclui um primeiro filtro de síntese configurado para determinar um primeiro sinal de banda alta moldado com base em um sinal de excitação de banda baixa de um sinal de áudio, onde o sinal de áudio inclui uma porção de banda alta e uma porção de banda baixa. O aparelho também inclui um módulo de dimensionamento configurado para determinar os fatores de dimensionamento com base na energia de subquadros do primeiro sinal de banda alta moldado e na energia de subquadros correspondentes da porção de banda alta do sinal de áudio e para aplicar os fatores de dimensionamento a um sinal de excitação de banda alta moldado para determinar um sinal de excitação de banda alta dimensionado. O aparelho também inclui um segundo filtro de síntese configurado para determinar um segundo sinal de banda alta moldado com base no sinal de excitação de banda alta dimensionado. O aparelho também inclui um estimador de ganho configurado para determinar informações de ganho com base no segundo sinal de banda alta moldado e na porção de banda alta do sinal de áudio.
[0009] Em uma outra modalidade específica, um dispositivo inclui meios para determinar um primeiro sinal de banda alta moldado com base em um sinal de excitação de banda baixa de um sinal de áudio, onde o sinal de áudio inclui uma porção de banda alta e uma porção de banda baixa. O dispositivo também inclui meios para determinar fatores de dimensionamento com base na energia de subquadros do primeiro sinal de banda alta moldado e na energia de subquadros correspondentes da porção de banda alta do sinal de áudio. O dispositivo também inclui meios para aplicar os fatores de dimensionamento a um sinal de excitação de banda alta moldado para determinar um sinal de excitação de banda alta dimensionado. O dispositivo também inclui meios para determinar um segundo sinal de banda alta moldado com base no sinal de excitação de banda alta dimensionado. O dispositivo também inclui meios para determinar informações de ganho com base no segundo sinal de banda alta moldado e na porção de banda alta do sinal de áudio.
[0010] Em uma outra modalidade específica, um meio legível por computador não transitório inclui instruções que, quando executadas por um computador, fazem com que o computador realize operações que incluem um primeiro sinal de banda alta moldado com base em um sinal de excitação de banda baixa de um sinal de áudio, onde o sinal de áudio inclui uma porção de banda alta e uma porção de banda baixa. As operações também incluem determinar fatores de dimensionamento com base na energia de subquadros do primeiro sinal de banda alta moldado e na energia de subquadros correspondentes da porção de banda alta do sinal de áudio. As operações também incluem aplicar os fatores de dimensionamento a um sinal de excitação de banda alta moldado para determinar um sinal de excitação de banda alta dimensionado. As operações também incluem determinar um segundo sinal de banda alta moldado com base no sinal de excitação de banda alta dimensionado. As operações também incluem determinar ganhos de parâmetros com base no segundo sinal de banda alta moldado e na porção de banda alta do sinal de áudio.
[0011] As vantagens específicas fornecidas através de pelo menos uma das modalidades reveladas incluem reduzir uma faixa dinâmica de informações de ganho fornecidas para um codificador ao dimensionar um sinal de excitação de banda alta moldado que é usado para calcular as informações de ganho. Por exemplo, o sinal de excitação de banda alta moldado pode ser dimensionado com base nas energias de subquadros de um sinal de banda alta moldado e de subquadros correspondentes de uma porção de banda alta de um sinal de áudio. O dimensionamento do sinal de excitação de banda alta moldado, dessa maneira, pode capturar variações nas características temporais de subquadro para subquadro e reduzir a dependência das informações de formato de ganho nas alterações temporais na porção de banda alta de um sinal de áudio. Outros aspectos, vantagens e recursos da presente revelação se tornarão evidentes após a revisão de todo o pedido, inclusive das seguintes seções: Breve Descrição dos Desenhos, Descrição Detalhada e as Reivindicações.
[0012] A Figura 1 é um diagrama para ilustrar uma modalidade específica de um sistema que é operável para gerar informações específicas de banda alta com base em um sinal de excitação de banda alta moldado dimensionado;
[0013] A Figura 2 é um diagrama para ilustrar uma modalidade específica de um módulo de análise de banda alta da Figura 1;
[0014] A Figura 3 é um diagrama para ilustrar uma modalidade específica de informações de subquadro de interpolação;
[0015] A Figura 4 é um diagrama para ilustrar uma outra modalidade específica de informações de subquadro de interpolação;
[0016] A Figuras 5 a 7, em conjunto, são diagramas para ilustrar uma outra modalidade específica de um módulo de análise de banda alta da Figura 1;
[0017] A Figura 8 é um fluxograma para ilustrar uma modalidade específica de um método de processamento de sinal de áudio;
[0018] A Figura 9 é um diagrama de blocos de um dispositivo sem fio operável para realizar as operações de processamento de sinal de acordo com os sistemas e os métodos das Figuras 1 a 8.
[0019] A Figura 1 é um diagrama para ilustrar uma modalidade específica de um sistema 100 que é operável para gerar informações específicas de banda alta com base em um sinal de excitação de banda alta moldado dimensionado. Em uma modalidade específica, o sistema 100 pode ser integrado em um sistema ou aparelho de codificação (por exemplo, em um telefone sem fio ou codificador/decodificador (CODEC)).
[0020] Na descrição a seguir, várias funções realizadas pelo sistema 100 da Figura 1 são descritas como sendo realizadas por determinados componentes ou módulos. No entanto, essa divisão de componentes e módulos é apenas para fins de ilustração. Em uma modalidade alternativa, uma função realizada por um componente ou módulo específico pode, em vez disso, ser dividido dentre múltiplos componentes ou módulos. Além do mais, em uma modalidade alternativa, dois ou mais componentes ou módulos da Figura 1 podem ser integrados em um único componente ou módulo. Cada componente ou módulo ilustrado na Figura 1 pode ser implantado com o uso de hardware (por exemplo, um dispositivo de arranjo de porta programável em campo (FPGA), um circuito integrado de aplicação específica (ASIC), um processador de sinal digital (DSP), um controlador, etc.), software (por exemplo, instruções executáveis por um processador), ou qualquer combinação dos mesmos.
[0021] O sistema 100 inclui um banco de filtros de análise 110 que é configurado para receber um sinal de áudio 102. Por exemplo, o sinal de áudio 102 pode ser fornecido por um microfone ou outro dispositivo de entrada. Em uma modalidade específica, o sinal de áudio de entrada 102 pode incluir fala. O sinal de áudio 102 pode ser um sinal de SWB que inclui dados na faixa de frequência de aproximadamente 50 hertz (Hz) a aproximadamente 16 quilohertz (kHz). O banco de filtros de análise 110 pode filtrar o sinal de áudio de entrada 102 em múltiplas porções com base na frequência. Por exemplo, o banco de filtros de análise 110 pode gerar um sinal de banda baixa 122 e um sinal de banda alta 124. O sinal de banda baixa 122 e o sinal de banda alta 124 podem ter larguras de banda iguais ou diferentes, e podem ser sobrepostos ou não sobrepostos. Em uma modalidade alternativa, o banco de filtros de análise 110 pode gerar mais de duas saídas.
[0022] No exemplo da Figura 1, o sinal de banda baixa 122 e o sinal de banda alta 124 ocupam bandas de frequência não sobrepostas. Por exemplo, o sinal de banda baixa 122 e o sinal de banda alta 124 podem ocupar bandas de frequência não sobrepostas de 50 Hz a 7 kHz e de 7 kHz a 16 kHz, respectivamente. Em uma modalidade alternativa, o sinal de banda baixa 122 e o sinal de banda alta 124 podem ocupar bandas de frequência não sobrepostas de 50 Hz a 8 kHz e de 8 kHz a 16 kHz, respectivamente. Em uma outra modalidade alternativa, o sinal de banda baixa 122 e o sinal de banda alta 124 sobrepostos (por exemplo, de 50 Hz a 8 kHz e de 7 kHz a 16 kHz, respectivamente), que podem possibilitar um filtro de passa baixo e um filtro de passa alto do banco de filtros de análise 110 tenham um alívio de pressão suave, que pode simplificar o projeto e reduzir o custo do filtro de passa baixo e do filtro de passa alto. A sobreposição do sinal de banda baixa 122 e do sinal de banda alta 124 também pode possibilitar a mistura suave de sinais de banda baixa e de banda alta em um receptor, o que pode resultar em menos artefatos audíveis.
[0023] Embora a descrição da Figura 1 se refira ao processamento de um sinal de SWB, isso é apenas para fins de ilustração. Em uma modalidade alternativa, o sinal de áudio de entrada 102 pode ser um sinal de WB que tem uma faixa de frequência de aproximadamente 50 Hz a aproximadamente 8 kHz. Em uma tal modalidade, o sinal de banda baixa 122 pode corresponder a uma faixa de frequência de aproximadamente 50 Hz a aproximadamente 6,4 kHz, e o sinal de banda alta 124 pode corresponder a uma faixa de frequência de aproximadamente 6,4 kHz a aproximadamente 8 kHz.
[0024] O sistema 100 pode incluir um módulo de análise de banda baixa 130 (também referido como um codificador de banda baixa) configurado para receber o sinal de banda baixa 122. Em uma modalidade específica, o módulo de análise de banda baixa 130 pode representar uma modalidade de um codificador de predição linear excitado por código (CELP). O módulo de análise de banda baixa 130 pode incluir um módulo de codificação e análise de predição linear (LP) 132, um coeficiente de predição linear (LPC) para o módulo de transformada de par de espectral de linha (LSP) 134 e um quantizador 136. Os LSPs também podem ser referidos como frequências espectrais de linha (LSFs), e os dois termos podem ser usados intercambiavelmente no presente documento. O módulo de codificação e análise de LP 132 pode codificar um envelope espectral do sinal de banda baixa 122 como um conjunto de LPCs. As LPCs podem ser geradas por cada quadro de áudio (por exemplo, 20 milissegundos (ms) de áudio, que correspondem a 320 amostras em uma taxa de amostragem de 16 kHz), sendo que cada subquadro de áudio (por exemplo, 5 ms de áudio), ou qualquer combinação dos mesmos. O número de LPCs gerado para cada quadro ou subquadro pode ser determinado pela "ordem" da análise de LP realizada. Em uma modalidade específica, o módulo de codificação e análise de LP 132 pode gerar um conjunto de onze LPCs que correspondem a uma análise de LP da décima ordem.
[0025] O módulo de transformada de LPC em LSP 134 pode transformar o conjunto de LPCs gerado pelo módulo de codificação e análise de LP 132 em um conjunto correspondente de LSPs (por exemplo, com o uso de uma transformada de um a um). Alternativamente, o conjunto de LPCs pode ser transformado de um a um em um conjunto correspondente de coeficientes parcor, valores de log-área- razão, pares espectrais de imitância (ISPs), ou frequências espectrais de imitância (ISFs). A transformada entre o conjunto de LPCs e o conjunto de LSPs pode ser reversível sem erro.
[0026] O quantizador 136 pode quantizar o conjunto de LSPs gerado pelo módulo de transformada 134. Por exemplo, o quantizador 136 pode incluir ou pode ser acoplado aos múltiplos livros de código (não mostrados) que incluem múltiplas entradas (por exemplo, vetores). Para quantizar o conjunto de LSPs, o quantizador 136 pode identificar as entradas de livros de código que são "as mais próximas" (por exemplo, com base em uma medida de distorção como erro de mínimos quadrados ou média quadrática) do conjunto de LSPs. O quantizador 136 pode emitir um valor de índice ou uma série de valores de índice que correspondem ao local das entradas identificadas no livro de código. A saída do quantizador 136 pode representar parâmetros de filtro de banda baixa que são incluídos em um fluxo de bits de banda baixa 142. O fluxo de bits de banda baixa 142 pode, então, incluir dados de código de predição linear que representam a porção de banda baixa do sinal de áudio 102.
[0027] O módulo de análise de banda baixa 130 pode gerar também um sinal de excitação de banda baixa 144. Por exemplo, o sinal de excitação de banda baixa 144 pode ser um sinal codificado que é gerado ao quantizar um sinal residual de LP que é gerado durante o processo de LP realizado pelo módulo de análise de banda baixa 130. O sinal residual de LP pode representar o erro de predição.
[0028] O sistema 100 pode incluir adicionalmente um módulo de análise de banda alta 150 configurado para receber o sinal de banda alta 124 do banco de filtros de análise 110 e o sinal de excitação de banda baixa 144 do módulo de análise de banda baixa 130. O módulo de análise de banda alta 150 pode gerar informações específicas de banda alta 172 com base no sinal de banda alta 124 e no sinal de excitação de banda baixa 144. Por exemplo, as informações específicas de banda alta 172 pode incluir dados que representam LSPs de banda alta, dados que representam informações de ganho (por exemplo, com base pelo menos em uma razão da energia de banda alta para a energia de banda baixa), dados que representam fatores de dimensionamento ou uma combinação dos mesmos.
[0029] O módulo de análise de banda alta 150 pode incluir um gerador de excitação de banda alta 152. O gerador de excitação de banda alta 152 pode gerar um sinal de excitação de banda alta (como sinal de excitação de banda alta 202 da Figura 2) ao estender um espectro do sinal de excitação de banda baixa 144 na faixa de frequência de banda alta (por exemplo, de 7 kHz a 16 kHz). Para ilustrar, o gerador de excitação de banda alta 152 pode aplicar uma transformada (por exemplo, uma transformada não linear como um valor absoluto ou operação quadrada) ao sinal de excitação de banda baixa 144 e pode misturar o sinal de excitação de banda baixa transformado com um sinal de ruído (por exemplo, ruído branco modulado ou moldado de acordo com um envelope que corresponde ao sinal de excitação de banda baixa 144 que imita as características temporais variantes do sinal de banda baixa 122) para gerar o sinal de excitação de banda alta. Por exemplo, a mistura pode ser realizada de acordo com a equação a seguir:
[0030] Excitação de banda alta = (a * excitação de banda baixa transformada) + ((1- a) * ruído modulado)
[0031] Uma razão na qual o sinal de excitaçãode banda baixa transformado e o ruído modulado são misturados pode impactar na qualidade de reconstrução de banda alta em um receptor. Para os sinais de fala por voz, a mistura pode ser inclinada no sentido da excitação de banda baixa transformada (por exemplo, o fator de mistura α pode estar na faixa de 0,5 a 1,0). Para os sinais de voz, a mistura pode ser inclinada para o ruído modulado (por exemplo, o fator de mistura α pode estar na faixa de 0,0 a 0,5).
[0032] O sinal de excitação de banda alta pode ser usado para determinar um ou mais parâmetros de ganho de banda alta que estão incluídos nas informações específicas de banda alta 172. Em uma modalidade específica, o sinal de excitação de banda alta e o sinal de banda alta 124 podem ser usados para determinar as informações de dimensionamento (por exemplo, fatores de dimensionamento) que são aplicados ao sinal de excitação de banda alta para determinar um sinal de excitação de banda alta dimensionado. O sinal de excitação de banda alta dimensionado pode ser usado para determinar os parâmetros de ganho de banda alta. Por exemplo, conforme descrito adicionalmente com referência às Figuras 2 e 5 a 7, o estimador de energia 154 pode determinar a energia estimada de quadros ou subquadros do sinal de banda alta e de quadros ou subquadros correspondentes de um primeiro sinal de banda alta moldado. O primeiro sinal de banda alta moldado pode ser determinado ao aplicar a síntese de predição linear sem memória no sinal de excitação de banda alta. O módulo de dimensionamento 156 pode determinar fatores de dimensionamento (por exemplo, um primeiro conjunto de fatores de dimensionamento) com base na energia estimada de quadros ou subquadros do sinal de banda alta 124 e na energia estimada dos quadros ou subquadros correspondentes de um primeiro sinal de banda alta moldado. Por exemplo, cada fator de dimensionamento pode corresponder a uma razão Ei/Ei’ , em que Ei é uma energia estimada de um subquadro, i, do sinal de banda alta e Ei’ é uma energia estimada de um subquadro correspondente, i, doprimeiro sinal de banda alta moldado. O módulo dedimensionamento 156 também pode aplicar os fatores dedimensionamento (ou um segundo conjunto de fatores dedimensionamento determinado com base no primeiro conjunto de fatores de dimensionamento, por exemplo, ao calcular a média de ganhos sobre diversos subquadros do primeiro conjunto de fatores de dimensionamento), em uma base de subquadro por subquadro, para o sinal de excitação de banda alta para determinar o sinal de excitação de banda alta dimensionado.
[0033] Conforme ilustrado, o módulo de análise de banda alta 150 pode incluir também um módulo de codificação e análise de LP 158, um módulo de transformada de LPC em LSP 160, e um quantizador 162. Cada um dentre o módulo de codificação e análise de LP 158, o módulo de transformada 160 e o quantizador 162 pode funcionar conforme descrito acima com referência aos componentes correspondentes do módulo de análise de banda baixa 130, mas em uma resolução comparativamente reduzida (por exemplo, com o uso de menos bits para cada coeficiente, LSP, etc.). O módulo de codificação e análise de LP 158 pode gerar um conjunto de LPCs que são transformados em LSPs pelo módulo de transformada 160 e quantizados pelo quantizador 162 com base em um livro de código 166. Por exemplo, o módulo de codificação e análise de LP 158, o módulo de transformada 160 e o quantizador 162 podem usar o sinal de banda alta 124 para determinar as informações de filtro de banda alta (por exemplo, LSPs de banda alta) que são incluídas nas informações específicas de banda alta 172. Em uma modalidade específica, as informações específicas de banda alta 172 podem incluir LSPs de banda alta, informações de ganho de banda alta, os fatores de dimensionamento ou uma combinação dos mesmos. Conforme explicado acima, as informações de ganho de banda alta podem ser determinadas com base em um sinal de excitação de banda alta dimensionado.
[0034] O fluxo de bits de banda baixa 142 e as informações específicas de banda alta 172 podem ser multiplexados por um multiplexador (MUX) 180 para gerar um fluxo de dados de saída ou fluxo de bits de saída 192. O fluxo de bits de saída 192 pode representar um sinal codificado de áudio que corresponde ao sinal de áudio de entrada 102. Por exemplo, o fluxo de bits de saída 192 pode ser transmitido (por exemplo, em um canal com fio, sem fio ou óptico) e/ou armazenado. Em um receptor, as operações inversas podem ser realizadas através de um demultiplexador (DEMUX), um decodificador de banda baixa, um decodificador de banda alta e um banco de filtro para gerar um sinal de áudio (por exemplo, uma versão reconstruída do sinal de áudio de entrada 102 que é fornecido para um alto-falante ou outro dispositivo de saída). O número de bits usados para representar o fluxo de bits de banda baixa 142 pode ser substancialmente maior que o número de bits usado para representar as informações específicas de banda alta 172. Assim, a maioria dos bits no fluxo de bits de saída 192 pode representar os dados de banda baixa. As informações específicas de banda alta 172 podem ser usadas em um receptor para regenerar o sinal de excitação de banda alta a partir dos dados de banda baixa de acordo com um modelo de sinal. Por exemplo, o modelo de sinal pode representar um conjunto esperado de relações ou correlações entre os dados de banda baixa (por exemplo, o sinal de banda baixa 122) e os dados de banda alta (por exemplo, o sinal de banda alta 124). Assim, os diferentes modelos de sinal podem ser usados para diferentes tipos de dados de áudio (por exemplo, fala, música, etc.), e o modelo de sinal específico que está em uso pode ser negociado por um transmissor e um receptor (ou definido por um padrão da indústria) antes da comunicação dos dados de áudio codificados. O uso do modelo de sinal, do módulo de análise de banda alta 150 em um transmissor pode ter a capacidade de gerar as informações específicas de banda alta 172 de modalidade que um módulo de análise de banda alta correspondente em um receptor tenha a capacidade de usar o modelo de sinal para reconstruir o sinal de banda alta 124 do fluxo de bits de saída 192.
[0035] A Figura 2 é um diagrama que ilustra uma modalidade específica do módulo de análise de banda alta 150 da Figura 1. O módulo de análise de banda alta 150 é configurado para receber um sinal de excitação de banda alta 202 e uma porção de banda alta de um sinal de áudio (por exemplo, o sinal de banda alta 124) e para gerar informações de ganho, como parâmetros de ganho 250 e ganho de quadro 254, com base no sinal de excitação de banda alta 202 e no sinal de banda alta 124. O sinal de excitação de banda alta 202 pode corresponder ao sinal de excitação de banda alta gerado pelo gerador de excitação de banda alta 152 com o uso do sinal de excitação de banda baixa 144.
[0036] Os parâmetros de filtro 204 podem ser aplicados ao sinal de excitação de banda alta 202 com o uso de um filtro de síntese de LP do tipo só polo 206 (por exemplo, um filtro de síntese) para determinar um primeiro sinal de banda alta moldado 208. Os parâmetros de filtro 204 podem corresponder à memória de retroinformação do filtro de síntese de LP do tipo só polo 206. Para fins de determinação dos fatores de dimensionamento, os parâmetros de filtro 204 podem ser sem memória. Em particular, a memória de filtro ou os estados de filtro que estão associados ao i-ésimo filtro de síntese de LP de subquadro, 1/Ai(z)) são reajustados para zero antes de realizar o filtro de síntese de LP do tipo só polo 206.
[0037] O primeiro sinal de banda alta moldado 208 pode ser aplicado a um estimador de energia 210 para determinar a energia de subquadro 212 de cada quadro ou subquadro do primeiro sinal de banda alta moldado 208. O sinal de banda alta 124 também pode ser aplicado a um estimador de energia 222 para determinar a energia 224 de cada quadro ou subquadro do sinal de banda alta 124. A energia de subquadro 212 do primeiro sinal de banda alta moldado 208 e a energia 224 do sinal de banda alta 124 podem ser usados para determinar fatores de dimensionamento 230. Os fatores de dimensionamento 230 podem quantificar as diferenças de energia entre os quadros ou subquadros do primeiro sinal de banda alta moldado 208 e os quadros ou subquadros correspondentes do sinal de banda alta 124. Por exemplo, os fatores de dimensionamento 230 podem ser determinados como uma razão de energia 224 do sinal de banda alta 124 e a energia de subquadro estimada 212 do primeiro sinal de banda alta moldado 208. Em uma modalidade específica, os fatores de dimensionamento 230 são determinados em uma base de subquadro por subquadro, em que cada quadro inclui quatro subquadros. Nessa modalidade, um fator de dimensionamento é determinado para cada conjunto de subquadros que incluem um subquadro do primeiro sinal de banda alta moldado 208 e um subquadro correspondente do sinal de banda alta 124.
[0038] Para determinar as informações deganho, cada subquadro do sinal de excitação de banda alta 202 pode ser compensado (por exemplo, multiplexado) com um fator de dimensionamento 230 correspondente para gerar um sinal de excitação de banda alta dimensionado 240. Os parâmetros de filtro 242 podem ser aplicados ao sinal de excitação de banda alta dimensionado 240 com o uso de um filtro do tipo só polo 244 para determinar um segundo sinal de banda alta moldado 246. Os parâmetros de filtro 242 podem corresponder aos parâmetros de um módulo de codificação e análise de predição linear, como o módulo de codificação e análise de LP 158 da Figura 1. Para fins de determinar as informações de ganho, os parâmetros de filtro 242 podem incluir informações associadas aos quadros previamente processados (por exemplo, memória de filtro).
[0039] O segundo sinal de banda alta moldado 246 pode ser aplicado a um estimador de formato de ganho 248 juntamente com o sinal de banda alta 124 para determinar parâmetros de ganho 250. Os parâmetros de ganho 250, o segundo sinal de banda alta moldado 246 e o sinal de banda alta 124 podem ser aplicados a um estimador de quadro de ganho 252 para determinar um ganho de quadro 254. Os parâmetros de ganho 250 e o ganho de quadro 254 juntos formam as informações de ganho. As informações de ganho podem ter faixa dinâmica reduzida em relação às informações de ganho determinado sem aplicar os fatores de dimensionamento 230 uma vez que os fatores de dimensionamento são responsáveis por algumas das diferenças de energia entre o sinal de banda alta 124 e o segundo sinal de banda alta moldado 246 determinados com base no sinal de excitação de banda alta 202.
[0040] A Figura 3 é um diagrama que ilustra uma modalidade específica de informações de subquadro de interpolação. O diagrama da Figura 3 ilustra um método específico de determinar informações de subquadro para um Nésimo Quadro 304. O Nésimo Quadro 304 é precedido em uma sequência de quadros por um N-1ésimo Quadro 302 e é seguido na sequência de quadros por um N+1ésimo Quadro 306. Um LSP é calculado para cada quadro. Por exemplo, um N-1ésimo LSP 310 é calculado para o N-1ésimo Quadro 302, um Nésimo LSP 312 é calculado para o Nésimo Quadro 304, e um N+1ésimo LSP 314 é calculado para o N+1ésimo Quadro 306. Os LSPs podem representar a evolução espectral do sinal de banda alta, SHB 124, 502 das Figuras 1, 2 ou 5 a 7.
[0041] Uma pluralidade de LSPs de subquadro para o Nésimo Quadro 304 pode ser determinada através de interpolação com o uso de valores de LSP de um quadro precedente (por exemplo, o N-1ésimo Quadro 302) e um quadro atual (por exemplo, o Nésimo Quadro 304). Por exemplo, os fatores de ponderação podem ser aplicados aos valores de um LSP precedente (por exemplo, o N-1ésimo LSP 310) e aos valores de um LSP atuais (por exemplo, o Nésimo LSP 312). No exemplo ilustrado na Figura 3, os LSPs para quatro subquadros (inclusive um primeiro subquadro 320, um segundo subquadro 322, um terceiro subquadro 324 e um quarto subquadro 326) são calculados. Os quatro LSPs de subquadro 320 a 326 podem ser calculados com o uso de ponderação igual ou ponderação desigual.
[0042] Os LSPs de subquadro (320-326) podem ser usados para realizar a síntese de LP sem atualizações de memória de filtro para estimar o primeiro sinal de banda alta moldado 208. O primeiro sinal de banda alta moldado 208 é, então, usado para estimar a energia de subquadro Ei 212. O estimador de energia 154 pode fornecer estimativas de energia de subquadro para o primeiro sinal de banda alta moldado 208 e para o sinal de banda alta 124 para o módulo de dimensionamento 156, que pode determinar fatores de dimensionamento de subquadro por subquadro 230. Os fatores de dimensionamento podem ser usados para ajustar um nível de energia do sinal de excitação de banda alta 202 para gerar um sinal de excitação de banda alta dimensionado 240, que pode ser usado pelo módulo de codificação e análise de LP 158 para gerar um segundo sinal de banda alta moldado (ou sintetizado) 246. O segundo sinal de banda alta moldado 246 pode ser usado para gerar informações de ganho (como os parâmetros de ganho 250 e/ou o ganho de quadro 254). Por exemplo, o segundo sinal de banda alta moldado 246 pode ser fornecido para o estimador de ganho 164, que pode determinar os parâmetros de ganho 250 e o ganho de quadro 254.
[0043] A Figura 4 é um diagrama que ilustra uma outra modalidade específica de informações de subquadro de interpolação. O diagrama da Figura 4 ilustra um método específico de determinar informações de subquadro para um Nésimo Quadro 404. O Nésimo Quadro 404 é precedido em uma sequência de quadros por um N-1ésimo Quadro 402 e é seguido na sequência de quadros por um N+1ésimo Quadro 406. Dois LSPs são calculados para cada quadro. Por exemplo, um LSP_1 408 e um LSP_2 410 são calculados para o N-1ésimo Quadro 402, um LSP_1 412 e um LSP_2 414 são calculados para o Nésimo Quadro 404, e um LSP_1 416 e um LSP_2 418 são calculados para o N+1ésimo Quadro 406. Os LSPs podem representar a evolução espectral do sinal de banda alta, SHB 124, 502 das Figuras 1, 2 ou 5 a 7.
[0044] Uma pluralidade de LSPs de subquadro para o Nésimo Quadro 404 pode ser determinada através de interpolação com o uso de um ou mais dos valores de LSP de um quadro precedente (por exemplo, o LSP_1 408 e/ou o LSP_2 410 do N-1ésimo Quadro 402) e um ou mais dos valores de LSP de um quadro atual (por exemplo, o Nésimo Quadro 404). Embora as janelas de LSP (por exemplo, janelas de LSP assimétricas de linhas tracejadas 412, 414 para o Quadro N 404) mostradas na Figura 4 sejam para fins ilustrativos, é possível ajustar as janelas de análise de LP de tal modo que se sobreponham dentro ou através de quadros (com antecipação) pode aprimorar a evolução espectral dos LSPs estimados a partir de quadro para quadro ou de subquadro para subquadro. Por exemplo, os fatores de ponderação podem ser aplicados aos valores de um LSP precedente (por exemplo, o LSP_2 410) e aos valores de LSP do quadro atual (por exemplo, o LSP_1 412 e/ou o LSP_2 414). No exemplo ilustrado na Figura 4, os LSPs para quatro subquadros (inclusive um primeiro subquadro 420, um segundo subquadro 422, um terceiro subquadro 424 e um quarto subquadro 426) são calculados. Os quatro LSPs de subquadro 420 a 426 podem ser calculados com o uso de ponderação igual ou ponderação desigual.
[0045] Os LSPs de subquadro (420 a 426) podem ser usados para realizar a síntese de LP sem atualizações de memória de filtro para estimar o primeiro sinal de banda alta moldado 208. O primeiro sinal de banda alta moldado 208 é, então, usado para estimar a energia de subquadro Ei 212. O estimador de energia 154 pode fornecer estimativas de energia de subquadro para o primeiro sinal de banda alta moldado 208 e para o sinal de banda alta 124 para o módulo de dimensionamento 156, que pode determinar fatores de dimensionamento de subquadro por subquadro 230. Os fatores de dimensionamento podem ser usados para ajustar um nível de energia do sinal de excitação de banda alta 202 para gerar um sinal de excitação de banda alta dimensionado 240, que pode ser usado pelo módulo de codificação e análise de LP 158 para gerar um segundo sinal de banda alta moldado (ou sintetizado) 246. O segundo sinal de banda alta moldado 246 pode ser usado para gerar informações de ganho (como os parâmetros de ganho 250 e/ou o ganho de quadro 254). Por exemplo, o segundo sinal de banda alta moldado 246 pode ser fornecido para o estimador de ganho 164, que pode determinar os parâmetros de ganho 250 e o ganho de quadro 254.
[0046] As Figuras 5 a 7 são diagramas que ilustram coletivamente uma outra modalidade específica de um módulo de análise de banda alta, como o módulo de análise de banda alta 150 da Figura 1. O módulo de análise de banda alta é configurado para receber um sinal de banda alta 502 em um estimador de energia 504. O estimador de energia 504 pode estimar a energia de cada subquadro do sinal de banda alta. A energia estimada 506, Ei, de cada subquadro do sinal de banda alta 502 pode ser fornecida para um quantizador 508, que pode gerar índices de energia de banda alta 510.
[0047] O sinal de banda alta 502 também pode ser recebido em um módulo de gestão de janelas 520. O módulo de gestão de janelas 520 pode gerar coeficientes de predição linear (LPCs) para cada par de quadros do sinal de banda alta 502. Por exemplo, o módulo de gestão de janelas 520 pode gerar um primeiro LPC 522 (por exemplo, LPC l). O módulo de gestão de janelas 520 também pode gerar um segundo LPC 524 (por exemplo, LPC 2). O primeiro LPC 522 e o segundo LPC 524 podem ser, cada um, transformados em LSPs com o uso de módulo de transformadas de LSP 526 e 528. Por exemplo, o primeiro LPC 522 pode ser transformado em um primeiro LSP 530 (por exemplo, LSP_1), e o segundo LPC 524 podem ser transformados em um segundo LSP 532 (por exemplo LSP_2). O primeiro e o segundo LSPs 530, 532 podem ser fornecidos para um codificador 538, que podem codificar os LSPs 530, 532 para formar índices de LSP de banda alta 540.
[0048] O primeiro e o segundo LSPs 530, 532 e um terceiro LSP 534 (por exemplo, LSP_2old) podem ser fornecidos para um interpolador 536. O terceiro LSP 534 pode corresponder a um quadro previamente processado, como o N-1ésimo Quadro 302 da Figura 3 (quando os subquadros do Nésimo Quadro 304 estiverem sendo determinados). O interpolador 536 pode usar o primeiro, o segundo e o terceiro LSPs 530, 532 e 534 para gerar LSPs de subquadro interpolados 542, 544, 546 e 548. Por exemplo, o interpolador 536 pode aplicar ponderações aos LSPs 530, 532 e 534 para determinar os LSPs de subquadro 542, 544, 546 e 548.
[0049] Os LSPs de subquadro 542, 544, 546 e 548 podem ser fornecidos para um módulo de transformação de LSP para LPC 550 para determinar os LPCs de subquadro e parâmetros de filtro 552, 554, 556 e 558.
[0050] Conforme também ilustrado na Figura 5, um sinal de excitação de banda alta 560 (por exemplo, um sinal de excitação de banda alta determinado pelo gerador de excitação de banda alta 152 da Figura 1 com base no sinal de excitação de banda baixa 144) pode ser fornecido para um módulo de subenquadramento 562. O módulo de subenquadramento 562 pode analisar o sinal de excitação de banda alta 560 em subquadros 570, 572, 574 e 576 (por exemplo, quatro subquadros por quadro do sinal de excitação de banda alta 560).
[0051] Com referência à Figura 6, os parâmetros de filtro 552, 554, 556 e 558 do módulo de transformação de LSP para LPC 550 e dos subquadros 570, 572, 574, 576 do sinal de excitação de banda alta 560 podem ser fornecidos para os filtros do tipo só polo correspondentes 612, 614, 616, 618. Cada um dos filtros do tipo só polo 612, 614, 616, 618 pode gerar subquadros 622, 624, 626, 628 de um primeiro sinal de banda alta moldado (ou sintetizado) (HBi’, em que i é um índice de um subquadro específico) de um subquadro correspondente 570, 572, 574, 576 do sinal de excitação de banda alta 560. Em uma modalidade específica, para fins de determinação dos fatores de dimensionamento, como fatores de dimensionamento 672, 674, 676 e 678, os parâmetros de filtro 552, 554, 556 e 558 podem ser sem memória. Ou seja, a fim de gerar um primeiro subquadro 622 de um primeiro sinal de banda alta moldado, a síntese de LP, 1/Ai(z), é realizada com seus parâmetros de filtro 552 (por exemplo, memória de filtro ou estados de filtro) reajustados para zero.
[0052] Os subquadros 622, 624, 626, 628 do primeiro sinal de banda alta moldado podem ser fornecidos para os estimadores de energia 632, 634, 636 e 638. Os estimadores de energia 632, 634, 636 e 638 podem gerar estimativas de energia 642, 644, 646, 648 (Ei’, em que i é um índice de um subquadro específico) dos subquadros 622, 624, 626, 628 do primeiro sinal de banda alta moldado.
[0053] As estimativas de energia 652, 654, 656 e 658 do sinal de banda alta 502 da Figura 5 podem ser combinadas com (por exemplo, divididas por) as estimativas de energia 642, 644, 646, 648 dos subquadros 622, 624, 626, 628 do primeiro sinal de banda alta moldados para formar os fatores de dimensionamento 672, 674, 676 e 678. Em uma modalidade específica, cada fator de dimensionamento é uma razão de energia de um subquadro do sinal de banda alta, Ei, para aquela da energia de um subquadro correspondente 622, 624, 626, 628 do primeiro sinal de banda alta moldado, Ei’. Por exemplo, um primeiro fator de dimensionamento 672 (SF1) pode ser determinado como uma razão de E1 652 dividida por E1’ 642. Assim, o primeiro fator de dimensionamento 672 representa numericamente uma relação entre a energia do primeiro subquadro do sinal de banda alta 502 da Figura 5 e o primeiro subquadro 622 do primeiro sinal de banda alta moldado determinado com base no sinal de excitação de banda alta 560.
[0054] Com referência à Figura 7, cada subquadro 570, 572, 574, 576 do sinal de excitação de banda alta 560 pode ser combinado (por exemplo, multiplicado) com um fator de dimensionamento correspondente 672, 674, 676 e 678 para gerar um subquadro 702, 704, 706 e 708 de um sinal de excitação de banda alta dimensionado CHB‘, em que i é um índice de um subquadro específico). Por exemplo, o primeiro subquadro 570 do sinal de excitação de banda alta 560 pode ser multiplicado pelo primeiro fator de dimensionamento 672 para gerar um primeiro subquadro 702 do sinal de excitação de banda alta dimensionado.
[0055] Os subquadros 702, 704, 706 e 708 do sinal de excitação de banda alta dimensionado podem ser aplicados aos filtros do tipo só polo 712, 714, 716, 718 (por exemplo, filtros de síntese) para determinar subquadros 742, 744, 746, 748 de um segundo sinal de banda alta moldado (ou sintetizado). Por exemplo, o primeiro subquadro 702 do sinal de excitação de banda alta dimensionado pode ser aplicado a um primeiro filtro do tipo só polo 712, juntamente com os primeiros parâmetros de filtro 722, para determinar um primeiro subquadro 742 do segundo sinal de banda alta moldado. Os parâmetros de filtro 722, 724, 726, e 728 aplicados aos filtros do tipo só polo 712, 714, 716, 718 podem incluir informações relacionadas aos quadros previamente processados (ou subquadros). Por exemplo, cada filtro do tipo só polo 712, 714, 716 pode produzir informações de atualização de estado de filtro 732, 734, 736 que são fornecidas para um outro dentre os filtros do tipo só polo 714, 716, 718. A atualização de estado de filtro 738 do filtro do tipo só polo 718 pode ser usada no próximo quadro (isto é, primeiro subquadro) para atualizar a memória de filtro.
[0056] Os subquadros 742, 744, 746, 748 do segundo sinal de banda alta moldado podem ser combinados, em um módulo de enquadramento 750, para gerar um quadro 752 do segundo sinal de banda alta moldado. O quadro 752 do segundo sinal de banda alta moldado pode ser aplicado a um estimador de formato de ganho 754 juntamente com o sinal de banda alta 502 para determinar parâmetros de ganho 756. Os parâmetros de ganho 756, o quadro 752 do segundo sinal de banda alta moldado e o sinal de banda alta 502 podem ser aplicados a um estimador de quadro de ganho 758 para determinar um ganho de quadro 760. Os parâmetros de ganho 756 e o ganho de quadro 760, em conjunto, formam as informações de ganho. As informações de ganho podem ter faixa dinâmica reduzida em relação às informações de ganho determinado sem aplicar os fatores de dimensionamento 672, 674, 676, 678 uma vez que os fatores de dimensionamento 672, 674, 676, 678 são responsáveis por algumas das diferenças de energia entre o sinal de banda alta 502 e um sinal moldado com o uso do sinal de excitação de banda alta 560.
[0057] A Figura 8 é um fluxograma que ilustra uma modalidade específica de um método de processamento de sinal de áudio designado 800. O método 800 pode ser realizado em um módulo de análise de banda alta, como o módulo de análise de banda alta 150 da Figura 1. O método 800 inclui, em 802, determinar um primeiro sinal de banda alta moldado com base em um sinal de excitação de banda baixa de um sinal de áudio. O sinal de áudio inclui uma porção de banda alta e uma porção de banda baixa. Por exemplo, o primeiro sinal de banda alta moldado pode corresponder ao primeiro sinal de banda alta moldado 208 da Figura 2 ou a um conjunto de subquadros 622, 624, 626, 628 do primeiro sinal de banda alta moldado da Figura 6. O primeiro sinal de banda alta moldado pode ser determinado com o uso de análise de predição linear aplicando-se um sinal de excitação de banda alta a um filtro do tipo só polo com parâmetros de filtro sem memória. Por exemplo, o sinal de excitação de banda alta 202 pode ser aplicado ao filtro de síntese de LP do tipo só polo 206 da Figura 2. Nesse exemplo, os parâmetros de filtro 204 aplicados ao filtro de síntese de LP do tipo só polo 206 são sem memória. Ou seja, os parâmetros de filtro 204 se referem ao quadro ou subquadro específico do sinal de excitação de banda alta 202 que está sendo processado e não inclui informações relacionadas aos quadros ou subquadros previamente processados. Em um outro exemplo, os subquadros 570, 572, 574, 576 do sinal de excitação de banda alta 560 das Figuras 5 e 6 podem ser aplicados aos filtros do tipo só polo correspondentes 612, 614, 616, 618. Nesse exemplo, os parâmetros de filtro 552, 554, 556, 558 aplicados a cada um dos filtros do tipo só polo 612, 614, 616, 618 são sem memória.
[0058] O método 800 também inclui, em 804, determinar fatores de dimensionamento com base na energia de subquadros do primeiro sinal de banda alta moldado e energia de subquadros correspondentes da porção de banda alta do sinal de áudio. Por exemplo, os fatores de dimensionamento 230 da Figura 2 podem ser determinados ao dividir a energia estimada 224 de um subquadro do sinal de banda alta 124 pela energia de subquadro estimada 212 de um subquadro correspondente do primeiro sinal de banda alta moldado 208. Em um outro exemplo, os fatores de dimensionamento 672, 674, 676, 678 da Figura 6 podem ser determinados ao dividir a energia estimada 652, 654, 656, 658 de um subquadro do sinal de banda alta 502 pela energia estimada 642, 644, 646, 648 de um subquadro correspondente 622, 624, 626, 628 do primeiro sinal de banda alta moldado.
[0059] O método 800 inclui, em 806, aplicar os fatores de dimensionamento a um sinal de excitação de banda alta moldado para determinar um sinal de excitação de banda alta dimensionado. Por exemplo, o fator de dimensionamento 230 da Figura 2 pode ser aplicado ao sinal de excitação de banda alta 202, em uma base de subquadro por subquadro, para gerar o sinal de excitação de banda alta dimensionado. Em um outro exemplo, os fatores de dimensionamento 672, 674, 676, 678 da Figura 6 podem ser aplicados aos subquadros correspondentes 570, 572, 574, 576 do sinal de excitação de banda alta 560 para gerar os subquadros 702, 704, 706, 708 do sinal de excitação de banda alta dimensionado. Em uma modalidade específica, um primeiro conjunto de um ou mais fatores de dimensionamento pode ser determinado em 804, e um segundo conjunto de um ou mais fatores de dimensionamento pode ser aplicado ao sinal de excitação de banda alta moldado em 806. O segundo conjunto de um ou mais fatores de dimensionamento pode ser determinado com base no primeiro conjunto de um ou mais fatores de dimensionamento. Por exemplo, os ganhos associados aos múltiplos subquadros usados para determinar o primeiro conjunto de um ou mais fatores de dimensionamento podem ter a média calculada para determinar o segundo conjunto de um ou mais fatores de dimensionamento. Nesse exemplo, o segundo conjunto de um ou mais fatores de dimensionamento pode incluir menos fatores de dimensionamento do que o primeiro conjunto de um ou mais fatores de dimensionamento.
[0060] O método 800 inclui, em 808, determinar um segundo sinal de banda alta moldado com base no sinal de excitação de banda alta dimensionado. Para ilustrar, a análise de predição linear do sinal de excitação de banda alta dimensionado pode ser realizada. Por exemplo, o sinal de excitação de banda alta dimensionado 240 da Figura 2 pode ser aplicado ao filtro do tipo só polo 244 com os parâmetros de filtro 242 para determinar o segundo sinal de banda alta moldado (por exemplo, sintetizado) 246. Os parâmetros de filtro 242 podem incluir memória (por exemplo, pode ser atualizada com base em quadros ou subquadros previamente processados). Em um outro exemplo, os subquadros 702, 704, 706, 708 do sinal de excitação de banda alta dimensionado da Figura 7 podem ser aplicados aos filtros do tipo só polo 712, 714, 716, 718 com os parâmetros de filtro 722, 724, 726, 728 para determinar os subquadros 742, 744, 746, 748 do segundo sinal de banda alta moldado (por exemplo, sintetizado). Os parâmetros de filtro 722, 724, 726, 728 podem incluir memória (por exemplo, pode ser atualizada com base em quadros ou subquadros previamente processados).
[0061] O método 800 inclui, em 810, determinar parâmetros de ganho com base no segundo sinal de banda alta moldado e na porção de banda alta do sinal de áudio. Por exemplo, o segundo sinal de banda alta moldado 246 e o sinal de banda alta 124 podem ser fornecidos para o estimador de formato de ganho 248 da Figura 2. O estimador de formato de ganho 248 pode determinar os parâmetros de ganho 250. Adicionalmente, o segundo sinal de banda alta moldado 246, o sinal de banda alta 124 e os parâmetros de ganho 250 podem ser fornecidos para o estimador de quadro de ganho 252, que pode determinar o ganho de quadro 254. Em um outro exemplo, os subquadros 742, 744, 746, 748 do segundo sinal de banda alta moldado podem ser usados para formar um quadro 752 do segundo sinal de banda alta moldado. O quadro 752 do segundo sinal de banda alta moldado e um quadro do sinal de banda alta correspondente 502 podem ser fornecidos para o estimador de formato de ganho 754 da Figura 7. O estimador de formato de ganho 754 pode determinar os parâmetros de ganho 756. Adicionalmente, o quadro 752 do segundo sinal de banda alta moldado, o quadro do sinal de banda alta correspondente 502 e os parâmetros de ganho 756 podem ser fornecidos para o estimador de quadro de ganho 758, que podem determinar o ganho de quadro 760. O ganho de quadro e os parâmetros de ganho podem ser incluídos nas informações específicas de banda alta, como as informações específicas de banda alta 172 da Figura 1, que são incluídas em um fluxo de bits 192 usado para codificar um sinal de áudio, como o sinal de áudio 102.
[0062] As Figuras 1 a 8 ilustram, então, os exemplos que incluem sistemas e métodos que realizam a codificação de sinal de áudio de uma maneira que usa fatores de dimensionamento para se responsabilizar pelas diferenças de energia entre uma porção de banda alta de um sinal de áudio, como o sinal de banda alta 124 da Figura 1, e uma versão moldada ou sintetizada do sinal de banda alta que se baseia em um sinal de excitação de banda baixa, como o sinal de excitação de banda baixa 144. O uso dos fatores de dimensionamento para se responsabilizar pelas diferenças de energia pode aprimorar o cálculo das informações de ganho, por exemplo, ao reduzir uma faixa dinâmica das informações de ganho. Os sistemas e os métodos das Figuras 1 a 8 podem ser integradas e/ou realizadas por um ou mais dispositivos eletrônicos, como um telefone celular, uma unidade de sistemas de comunicação pessoal portátil (PCS), um dispositivo de comunicações, um reprodutor de música, um reprodutor de vídeo, uma unidade de entretenimento, um decodificador de sinais, um dispositivo de navegação, um dispositivo habilitado para sistema de posicionamento global (GPS), um PDA, um computador, uma unidade de dados portátil (como um assistente de dados pessoal), uma unidade de dados de localização fixa (como equipamento de leitura em metros), ou qualquer outro dispositivo que realize as funções de codificação e/ou decodificação de dados.
[0063] Com referência à Figura 9, um diagrama de blocos de uma modalidade ilustrativa específica de um dispositivo de comunicação sem fio é retratado e designado em geral como 900. O dispositivo 900 inclui pelo menos um processador acoplado a uma memória 932. Por exemplo, na modalidade ilustrada na Figura 9, o dispositivo 900 inclui um primeiro processador 910 (por exemplo, uma (CPU)) e um segundo processador 912 (por exemplo, um DSP, etc.). Em outras modalidades, o dispositivo 900 pode incluir apenas um único processador, ou pode incluir mais de dois processadores. A memória 932 pode incluir instruções 960 executáveis por pelo menos um dos processadores 910, 912 para realizar métodos e processos revelados no presente documento, como o método 700 da Figura 8 ou um ou mais dos processos descritos com referência às Figuras 1 a 7.
[0064] Por exemplo, as instruções 960 podem incluir ou corresponder a um módulo de análise de banda baixa 976 e um módulo de análise de banda alta 978. Em uma modalidade específica, o módulo de análise de banda baixa 976 corresponde ao módulo de análise de banda baixa 130 da Figura 1, e o módulo de análise de banda alta 978 corresponde ao módulo de análise de banda alta 150 da Figura 1. Adicionalmente, ou como alternativa, o módulo de análise de banda alta 978 pode corresponder ou incluir uma combinação de componentes das Figuras 2 ou 5 a 7.
[0065] Em várias modalidades, o módulo de análise de banda baixa 976, o módulo de análise de banda alta 978, ou ambos, podem ser implantados por meio de hardware dedicado (por exemplo, conjunto de circuitos), por um processador (por exemplo, o processador 912) que executa as instruções 960 ou instruções 961 em uma memória 980 para realizar uma ou mais tarefas ou uma combinação dos mesmos. Como um exemplo, a memória 932 ou a memória 980 pode incluir ou corresponder a um dispositivo de memória, como uma memória de acesso aleatório (RAM), memória de acesso aleatório magneto resistiva (MRAM), MRAM de transferência de rotação-torque (STT-MRAM), memória flash, memória apenas de leitura (ROM), memória apenas de leitura programável (PROM), memória apenas de leitura programável e apagável (EPROM), memória apenas de leitura eletricamente programável e apagável (EEPROM), registros, disco rígido, um disco removível ou uma memória apenas de leitura de disco compacto (CD-ROM). O dispositivo de memória pode incluir instruções (por exemplo, as instruções 960 ou as instruções 961) que, quando executadas por um computador (por exemplo, o processador 910 e/ou o processador 912), podem fazer com que o computador para determinar fatores de dimensionamento com base na energia de subquadros de um primeiro sinal de banda alta moldado e energia de subquadros correspondentes de uma porção de banda alta de um sinal de áudio, aplicar os fatores de dimensionamento a um sinal de excitação de banda alta moldado para determinar um sinal de excitação de banda alta dimensionado, determinar um segundo sinal de banda alta moldado com base no sinal de excitação de banda alta dimensionado, e determinar parâmetros de ganho com base no segundo sinal de banda alta moldado e na porção de banda alta do sinal de áudio. Como um exemplo, a memória 932 ou a memória 980 pode ser um meio legível por computador não transitório que inclui instruções que, quando executadas por um computador (por exemplo, o processador 910 e/ou o processador 912), fazem com que o computador realize pelo menos uma porção do método 800 da Figura 8.
[0066] A Figura 9 também mostra um controlador de exibição 926 que é acoplado ao processador 910 e a um visor 928. Um CODEC 934 pode ser acoplado ao processador 912, conforme mostrado, ao processador 910, ou a ambos. Um alto-falante 936 e um microfone 938 podem ser acoplados ao CODEC 934. Por exemplo, o microfone 938 pode gerar o sinal de áudio de entrada 102 da Figura 1, e o processador 912 pode gerar o fluxo de bits de saída 192 para a transmissão para um receptor com base no sinal de áudio de entrada 102. Como um outro exemplo, o alto-falante 936 pode ser usado para emitir um sinal reconstruído a partir do fluxo de bits de saída 192 da Figura 1, em que o fluxo de bits de saída 192 é recebido a partir de um transmissor. A Figura 9 também indica que um controlador sem fio 940 pode ser acoplado ao processador 910, ao processador 912, ou a ambos, e a uma antena 942. Em uma modalidade específica, o CODEC 934 é um componente de front-end de processamento de áudio analógico. Por exemplo, o CODEC 934 pode realizar o ajuste de ganho analógico e definição de parâmetro para sinais recebidos do microfone 938 e sinais transmitidos para o alto-falante 936. O CODEC 934 também pode incluir conversores de analógico para digital (A/D) e digital par analógico (D/A). Em um exemplo específico, o CODEC 934 também inclui um ou mais moduladores e filtros de processamento de sinal. O CODEC 934 pode incluir uma memória para armazenar temporariamente dados de entrada recebidos do microfone 938 e para armazenar temporariamente dados de saída que devem ser fornecidos para o alto-falante 936.
[0067] Em uma modalidade específica, o processador 910, o processador 912, o controlador de exibição 926, a memória 932, o CODEC 934 e o controlador sem fio 940 estão incluídos em um dispositivo de sistema em pacote ou sistema em chip 922. Em uma modalidade específica, um dispositivo de entrada 930, como uma tela sensível ao toque e/ou teclado numérico, e uma fonte de alimentação 944 são acoplados ao dispositivo de sistema em chip 922. Além do mais, em uma modalidade específica, conforme ilustrado na Figura 9, o visor 928, o dispositivo de entrada 930, o alto-falante 936, o microfone 938, a antena 942 e a fonte de alimentação 944 são externos ao dispositivo de sistema em chip 922. No entanto, cada um dentre o visor 928, o dispositivo de entrada 930, o alto- falante 936, o microfone 938, a antena 942 e a fonte de alimentação 944 podem ser acoplados a um componente do dispositivo de sistema em chip 922, como uma interface ou um controlador.
[0068] Em conjunto com as modalidades descritas, um aparelho é revelado, o qual inclui meios para determinar um primeiro sinal de banda alta moldado com base em um sinal de excitação de banda baixa de um sinal de áudio, em que o sinal de áudio inclui uma porção de banda alta e uma porção de banda baixa. Por exemplo, o módulo de análise de banda alta 150 (ou um componente do mesmo, como o módulo de codificação e análise de LP 158) pode determinar o primeiro sinal de banda alta moldado com base no sinal de excitação de banda baixa 144 do sinal de áudio 102. Como um outro exemplo, um primeiro filtro de síntese, como o filtro de síntese de LP do tipo só polo 206 da Figura 2 pode determinar o primeiro sinal de banda alta moldado 208 com base no sinal de excitação de banda alta 202. O sinal de excitação de banda alta 202 pode ser determinado pelo gerador de excitação de banda alta 152 da Figura 1 com base no sinal de excitação de banda baixa 144) de um sinal de áudio. Ainda como um outro exemplo, um conjunto de primeiros filtros de síntese, como os filtros do tipo só polo 612, 614, 616, 618 da Figura 6 podem determinar os subquadros 622, 624, 626, 628 do primeiro sinal de banda alta moldado com base nos subquadros 570, 572, 574, 576 do sinal de excitação de banda alta. Como ainda em um outro exemplo, o processador 910 da Figura 9, o processador 912, ou um componente de um dos processadores 910, 912 (como o módulo de análise de banda alta 978 ou as instruções 961) pode determinar o primeiro sinal de banda alta moldado com base no sinal de excitação de banda baixa.
[0069] O aparelho também inclui meios para determinar fatores de dimensionamento com base na energia de subquadros do primeiro sinal de banda alta moldado e energia de subquadros correspondentes da porção de banda alta do sinal de áudio. Por exemplo, o estimador de energia 154 e o módulo de dimensionamento 156 da Figura 1 podem determinar os fatores de dimensionamento. Em um outro exemplo, os fatores de dimensionamento 230 podem ser determinados com base na energia de subquadro estimada 212 e 224 da Figura 2. Em ainda um outro exemplo, os fatores de dimensionamento 672, 674, 676, 678 podem ser determinados com base na energia estimada 642, 644, 646, 648 e na energia estimada 652, 654, 656, 658, respectivamente, da Figura 6. Como ainda um outro exemplo, o processador 910 da Figura 9, o processador 912 ou um componente de um dos processadores 910, 912 (como o módulo de análise de banda alta 978 ou as instruções 961) podem determinar os fatores de dimensionamento.
[0070] O aparelho também inclui meios para aplicar os fatores de dimensionamento a um sinal de excitação de banda alta moldado para determinar um sinal de excitação de banda alta dimensionado. Por exemplo, o módulo de dimensionamento 156 da Figura 1 pode aplicar os fatores de dimensionamento ao sinal de excitação de banda alta moldado para determinar o sinal de excitação de banda alta dimensionado. Em um outro exemplo, um combinador (por exemplo, um multiplicador) pode aplicar os fatores de dimensionamento 230 ao sinal de excitação de banda alta moldado 202 para determinar o sinal de excitação de banda alta dimensionado 240 da Figura 2. Em ainda um outro exemplo, os combinadores (por exemplo, multiplicadores) podem aplicar os fatores de dimensionamento 672, 674, 676, 678 aos subquadros correspondentes 570, 572, 574, 576, do sinal de excitação de banda alta para determinar os subquadros 702, 704, 706, 708 do sinal de excitação de banda alta dimensionado da Figura 7. Como ainda um outro exemplo, o processador 910 da Figura 9, o processador 912, ou um componente de um dos processadores 910, 912 (como o módulo de análise de banda alta 978 ou as instruções 961) pode aplicar os fatores de dimensionamento a um sinal de excitação de banda alta moldado para determinar um sinal de excitação de banda alta dimensionado.
[0071] O dispositivo também inclui meios para determinar um segundo sinal de banda alta moldado com base no sinal de excitação de banda alta dimensionado. Por exemplo, o módulo de análise de banda alta 150 (ou um componente do mesmo, como o módulo de codificação e análise de LP 158) pode determinar o segundo sinal de banda alta moldado com base no sinal de excitação de banda alta dimensionado. Como um outro exemplo, um segundo filtro de síntese, como o filtro do tipo só polo 244 da Figura 2, pode determinar o segundo sinal de banda alta moldado 246 com base no sinal de excitação de banda alta dimensionado 240. Ainda como um outro exemplo, um conjunto de segundo filtros de síntese, como os filtros do tipo só polo 712, 714, 716, 718 da Figura 7 pode determinar os subquadros 742, 744, 746, 748 do segundo sinal de banda alta moldado com base nos subquadros 702, 704, 706, 708 do sinal de excitação de banda alta dimensionado. Como ainda um outro exemplo, o processador 910 da Figura 9, o processador 912, ou um componente de um dos processadores 910, 912 (como o módulo de análise de banda alta 978 ou as instruções 961) pode determinar o segundo sinal de banda alta moldado com base no sinal de excitação de banda alta dimensionado.
[0072] O aparelho também inclui meios para determinar parâmetros de ganho com base no segundo sinal de banda alta moldado e na porção de banda alta do sinal de áudio. Por exemplo, o estimador de ganho 164 da Figura 1 pode determinar os parâmetros de ganho. Em um outro exemplo, o estimador de formato de ganho 248, o estimador de quadro de ganho 252, ou ambos, podem determinar informações de ganho, como os parâmetros de ganho 250 e o ganho de quadro 254. Em ainda um outro exemplo, o estimador de formato de ganho 754, o estimador de quadro de ganho 758, ou ambos, podem determinar informações de ganho, como os parâmetros de ganho 756 e o ganho de quadro 760. Como ainda um outro exemplo, o processador 910 da Figura 9, o processador 912 ou um componente de um dos processadores 910, 912 (como o módulo de análise de banda alta 978 ou as instruções 961) podem determinar os parâmetros de ganho com base no segundo sinal de banda alta moldado e na porção de banda alta do sinal de áudio.
[0073] Aqueles versados observariam ainda mais que os vários blocos lógicos, configurações, módulos, circuitos e etapas de algoritmo ilustrativos descritos em conjunto com as modalidades reveladas no presente documento podem ser implantados como hardware eletrônico, software de computador por um dispositivo de processamento como um processador de hardware ou combinações dos mesmos. Vários componentes, blocos, configurações, módulos, circuitos e etapas ilustrativos foram descritos, em geral, em termos de sua funcionalidade. A possibilidade de tal funcionalidade ser implantada como hardware ou software executável depende da aplicação específica e das restrições de projeto impostas ao sistema geral. Os indivíduos versados podem implantar a funcionalidade descrita de modos variantes para cada aplicação específica, mas tais decisões de implantação não devem ser interpretadas como a causa de um afastamento do escopo da presente revelação.
[0074] As etapas de um método ou algoritmo descritas em conjunto com as modalidades reveladas no presente documento podem ser embutidas diretamente em hardware, em um módulo de software executado por um processador, ou em uma combinação dos dois. Um módulo de software pode residir em um dispositivo de memória, como RAM, MRAM, STT-MRAM, memória flash, ROM, PROM, EPROM, EEPROM, registros, disco rígido, um disco removível ou um CD-ROM. Um dispositivo de memória exemplificativo é acoplado ao processador de tal modo que o processador possa ler informações a partir, e escrever informações para, o dispositivo de memória. Na alternativa, o dispositivo de memória pode ser integral ao processador. O processador e o meio de armazenamento pode residir em um ASIC. O ASIC pode residir em um dispositivo de computação ou um terminal de usuário. Na alternativa, o processador e o meio de armazenamento podem residir como componentes discretos em um dispositivo de computação ou um terminal de usuário.
[0075] A descrição anterior das modalidades reveladas é fornecida para possibilitar que uma pessoa versada na técnica produza ou use as modalidades reveladas. Várias modificações nessas modalidades serão prontamente evidentes para aqueles versados na técnica, e os princípios definidos no presente documento podem ser aplicados a outras modalidades sem se afastar do escopo da revelação. Assim, a presente revelação não se destina a ser limitada às modalidades mostradas no presente documento, mas devem estar de acordo com o escopo mais amplo possível consistente com os princípios e recursos inovadores conforme definidos pelas reivindicações a seguir.
Claims (15)
1. Método caracterizado pelo fato de que compreende:determinar um primeiro sinal de banda alta modelado com base em um sinal de excitação de banda baixa de um sinal de áudio, o sinal de áudio incluindo uma porção de banda alta e uma porção de banda baixa;determinar um primeiro conjunto de um ou mais fatores de dimensionamento com base em energia de subquadros do primeiro sinal de banda alta modelado e energia de subquadros correspondentes da porção de banda alta do sinal de áudio;aplicar um segundo conjunto de um ou mais fatores de dimensionamento com base em pelo menos um dentre o primeiro conjunto de um ou mais fatores de dimensionamento a um sinal de excitação de banda alta modelado para determinar um sinal de excitação de banda alta dimensionado;determinar um segundo sinal de banda alta modelado com base no sinal de excitação de banda alta dimensionado; edeterminar parâmetros de ganho com base no segundo sinal de banda alta modelado e na porção de banda alta do sinal de áudio.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que um subquadro específico do primeiro sinal de banda alta modelado é determinado ao aplicar um filtro de síntese em um subquadro específico do sinal de excitação de banda alta modelado.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que o filtro de síntese usa parâmetros de filtro que correspondem ao subquadro específico do sinal de excitação de banda alta modelado.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que uma memória de filtro ou estados de filtro são reajustados para zero antes de aplicar o filtro de síntese no subquadro específico do sinal de excitação de banda alta modelado.
5. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que os parâmetros de filtro não incluem informações relacionadas aos subquadros que precedem o subquadro específico do sinal de excitação de banda alta modelado.
6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que um subquadro específico do segundo sinal de banda alta modelado é determinado ao aplicar um filtro de síntese em um subquadro específico do sinal de excitação de banda alta dimensionado que corresponde ao subquadro específico do segundo sinal de banda alta modelado.
7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que o filtro de síntese usa uma memória de filtro ou atualiza estados de filtro com base no subquadro específico do sinal de excitação de banda alta dimensionado e um ou mais subquadros precedentes.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que a memória de filtro ou os estados de filtro não são reajustados para zero e são transportados a partir de um quadro ou subquadro anterior antes de aplicar o filtro de síntese no subquadro específico do sinal de excitação de banda alta dimensionado.
9. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalmente estimar a energia de um ou mais dentre os subquadros do primeiro sinal de banda alta modelado que é sintetizado com base nos filtros de síntese só de polos, em que os filtros de síntese só de polos têm coeficientes de filtro que são interpolados com base em uma soma ponderada de um ou mais pares espectrais de linha associados a um quadro atual e de um ou mais pares espectrais de linha associados a um quadro precedente.
10. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a determinação de um fator de dimensionamento para um subquadro específico compreende:determinar uma energia do subquadro específico da porção de banda alta do sinal de áudio;determinar uma energia de um subquadro correspondente do primeiro sinal de banda alta modelado;dividir a energia do subquadro específico da porção de banda alta do sinal de áudio pela energia do subquadro correspondente do primeiro sinal de banda alta modelado; equantizar e transmitir o fator de dimensionamento.
11. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que o primeiro conjunto de um ou mais fatores de dimensionamento é determinado sobre cada subquadro ou sobre cada quadro que constitui múltiplos subquadros.
12. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que os parâmetros de ganho incluem um formato de ganho e um quadro de ganho.
13. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalmente determinar o sinal de excitação de banda alta modelado ao combinar um sinal de excitação de banda baixa transformado com um sinal de ruído moldado.
14. Dispositivo caracterizado pelo fato de que compreende:meios para determinar um primeiro sinal de banda alta modelado com base em um sinal de excitação de banda baixa de um sinal de áudio, o sinal de áudio incluindo uma porção de banda alta e uma porção de banda baixa;meios para determinar fatores de dimensionamento com base em energia de subquadros do primeiro sinal de banda alta modelado e energia de subquadros correspondentes da porção de banda alta do sinal de áudio;meios para aplicar os fatores de dimensionamento a um sinal de excitação de banda alta modelado para determinar um sinal de excitação de banda alta dimensionado;meios para determinar um segundo sinal de banda alta modelado com base no sinal de excitação de banda alta dimensionado; emeios para determinar parâmetros de ganho com base no segundo sinal de banda alta modelado e na porção de banda alta do sinal de áudio.
15. Memória legível por computador caracterizada pelo fato de que possui instruções nela armazenadas que, quando executadas, fazem com que um computador realize o método conforme definido em qualquer uma das reivindicações 1 a 13.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361890812P | 2013-10-14 | 2013-10-14 | |
US61/890,812 | 2013-10-14 | ||
US14/512,892 | 2014-10-13 | ||
US14/512,892 US9384746B2 (en) | 2013-10-14 | 2014-10-13 | Systems and methods of energy-scaled signal processing |
PCT/US2014/060448 WO2015057680A1 (en) | 2013-10-14 | 2014-10-14 | Method, apparatus, device, computer-readable medium for bandwidth extension of an audio signal using a scaled high-band excitation |
Publications (2)
Publication Number | Publication Date |
---|---|
BR112016008236A2 BR112016008236A2 (pt) | 2017-08-01 |
BR112016008236B1 true BR112016008236B1 (pt) | 2021-12-21 |
Family
ID=52810406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112016008236-2A BR112016008236B1 (pt) | 2013-10-14 | 2014-10-14 | Método, aparelho, dispositivo, meio legível por computador para extensão de largura de banda de um sinal de áudio com uso de uma excitação de banda alta dimensionada |
Country Status (23)
Country | Link |
---|---|
US (1) | US9384746B2 (pt) |
EP (1) | EP3058570B1 (pt) |
JP (1) | JP6045762B2 (pt) |
KR (1) | KR101806058B1 (pt) |
CN (1) | CN105593935B (pt) |
AU (1) | AU2014337537C1 (pt) |
BR (1) | BR112016008236B1 (pt) |
CA (1) | CA2925894C (pt) |
CL (1) | CL2016000834A1 (pt) |
DK (1) | DK3058570T3 (pt) |
ES (1) | ES2643828T3 (pt) |
HK (1) | HK1219800A1 (pt) |
HU (1) | HUE033434T2 (pt) |
MX (1) | MX352483B (pt) |
MY (1) | MY182138A (pt) |
NZ (1) | NZ717786A (pt) |
PH (1) | PH12016500600A1 (pt) |
RU (1) | RU2679346C2 (pt) |
SA (1) | SA516370876B1 (pt) |
SG (1) | SG11201601783YA (pt) |
SI (1) | SI3058570T1 (pt) |
WO (1) | WO2015057680A1 (pt) |
ZA (1) | ZA201602115B (pt) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
CN105336336B (zh) * | 2014-06-12 | 2016-12-28 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
US9984699B2 (en) | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
US10475457B2 (en) * | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
CN110999301B (zh) * | 2017-08-15 | 2023-03-28 | 杜比实验室特许公司 | 位深度高效图像处理 |
US10580420B2 (en) * | 2017-10-05 | 2020-03-03 | Qualcomm Incorporated | Encoding or decoding of audio signals |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6141638A (en) | 1998-05-28 | 2000-10-31 | Motorola, Inc. | Method and apparatus for coding an information signal |
US7117146B2 (en) | 1998-08-24 | 2006-10-03 | Mindspeed Technologies, Inc. | System for improved use of pitch enhancement with subcodebooks |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
GB2342829B (en) | 1998-10-13 | 2003-03-26 | Nokia Mobile Phones Ltd | Postfilter |
CA2252170A1 (en) | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US6449313B1 (en) | 1999-04-28 | 2002-09-10 | Lucent Technologies Inc. | Shaped fixed codebook search for celp speech coding |
US6704701B1 (en) | 1999-07-02 | 2004-03-09 | Mindspeed Technologies, Inc. | Bi-directional pitch enhancement in speech coding systems |
WO2001059766A1 (en) | 2000-02-11 | 2001-08-16 | Comsat Corporation | Background noise reduction in sinusoidal based speech coding systems |
US7110953B1 (en) | 2000-06-02 | 2006-09-19 | Agere Systems Inc. | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction |
WO2002023536A2 (en) | 2000-09-15 | 2002-03-21 | Conexant Systems, Inc. | Formant emphasis in celp speech coding |
US6760698B2 (en) | 2000-09-15 | 2004-07-06 | Mindspeed Technologies Inc. | System for coding speech information using an adaptive codebook with enhanced variable resolution scheme |
CA2327041A1 (en) * | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US6766289B2 (en) | 2001-06-04 | 2004-07-20 | Qualcomm Incorporated | Fast code-vector searching |
JP3457293B2 (ja) | 2001-06-06 | 2003-10-14 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US7146313B2 (en) | 2001-12-14 | 2006-12-05 | Microsoft Corporation | Techniques for measurement of perceptual audio quality |
US7047188B2 (en) | 2002-11-08 | 2006-05-16 | Motorola, Inc. | Method and apparatus for improvement coding of the subframe gain in a speech coding system |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
FI118550B (fi) | 2003-07-14 | 2007-12-14 | Nokia Corp | Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä |
KR20050027179A (ko) * | 2003-09-13 | 2005-03-18 | 삼성전자주식회사 | 오디오 데이터 복원 방법 및 그 장치 |
US7613607B2 (en) * | 2003-12-18 | 2009-11-03 | Nokia Corporation | Audio enhancement in coded domain |
US7788091B2 (en) | 2004-09-22 | 2010-08-31 | Texas Instruments Incorporated | Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs |
JP2006197391A (ja) | 2005-01-14 | 2006-07-27 | Toshiba Corp | 音声ミクシング処理装置及び音声ミクシング処理方法 |
BRPI0607646B1 (pt) | 2005-04-01 | 2021-05-25 | Qualcomm Incorporated | Método e equipamento para encodificação por divisão de banda de sinais de fala |
UA94041C2 (ru) * | 2005-04-01 | 2011-04-11 | Квелкомм Инкорпорейтед | Способ и устройство для фильтрации, устраняющей разреженность |
US8280730B2 (en) | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
DE102006022346B4 (de) | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
US8682652B2 (en) | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
US9009032B2 (en) | 2006-11-09 | 2015-04-14 | Broadcom Corporation | Method and system for performing sample rate conversion |
US8005671B2 (en) * | 2006-12-04 | 2011-08-23 | Qualcomm Incorporated | Systems and methods for dynamic normalization to reduce loss in precision for low-level signals |
WO2008072671A1 (ja) | 2006-12-13 | 2008-06-19 | Panasonic Corporation | 音声復号化装置およびパワ調整方法 |
US20080208575A1 (en) | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
US8352279B2 (en) * | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
CA2780962C (en) | 2009-11-19 | 2017-09-05 | Telefonaktiebolaget L M Ericsson (Publ) | Methods and arrangements for loudness and sharpness compensation in audio codecs |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
EP2710590B1 (en) | 2011-05-16 | 2015-10-07 | Google, Inc. | Super-wideband noise supression |
CN102802112B (zh) | 2011-05-24 | 2014-08-13 | 鸿富锦精密工业(深圳)有限公司 | 具有音频文件格式转换功能的电子装置 |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
US9082398B2 (en) * | 2012-02-28 | 2015-07-14 | Huawei Technologies Co., Ltd. | System and method for post excitation enhancement for low bit rate speech coding |
CN103928029B (zh) * | 2013-01-11 | 2017-02-08 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
-
2014
- 2014-10-13 US US14/512,892 patent/US9384746B2/en active Active
- 2014-10-14 AU AU2014337537A patent/AU2014337537C1/en active Active
- 2014-10-14 MY MYPI2016700811A patent/MY182138A/en unknown
- 2014-10-14 SI SI201430365T patent/SI3058570T1/sl unknown
- 2014-10-14 MX MX2016004630A patent/MX352483B/es active IP Right Grant
- 2014-10-14 KR KR1020167012306A patent/KR101806058B1/ko active IP Right Grant
- 2014-10-14 NZ NZ717786A patent/NZ717786A/en unknown
- 2014-10-14 DK DK14796594.1T patent/DK3058570T3/en active
- 2014-10-14 WO PCT/US2014/060448 patent/WO2015057680A1/en active Application Filing
- 2014-10-14 CA CA2925894A patent/CA2925894C/en active Active
- 2014-10-14 JP JP2016547994A patent/JP6045762B2/ja active Active
- 2014-10-14 BR BR112016008236-2A patent/BR112016008236B1/pt active IP Right Grant
- 2014-10-14 ES ES14796594.1T patent/ES2643828T3/es active Active
- 2014-10-14 HU HUE14796594A patent/HUE033434T2/en unknown
- 2014-10-14 EP EP14796594.1A patent/EP3058570B1/en active Active
- 2014-10-14 CN CN201480054558.6A patent/CN105593935B/zh active Active
- 2014-10-14 RU RU2016113836A patent/RU2679346C2/ru active
- 2014-10-14 SG SG11201601783YA patent/SG11201601783YA/en unknown
-
2016
- 2016-03-30 ZA ZA2016/02115A patent/ZA201602115B/en unknown
- 2016-04-04 PH PH12016500600A patent/PH12016500600A1/en unknown
- 2016-04-05 SA SA516370876A patent/SA516370876B1/ar unknown
- 2016-04-08 CL CL2016000834A patent/CL2016000834A1/es unknown
- 2016-07-01 HK HK16107678.6A patent/HK1219800A1/zh unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9858941B2 (en) | Selective phase compensation in high band coding of an audio signal | |
US9564141B2 (en) | Harmonic bandwidth extension of audio signals | |
AU2019203827B2 (en) | Estimation of mixing factors to generate high-band excitation signal | |
EP3471098B1 (en) | High-band signal modeling | |
BR112016008236B1 (pt) | Método, aparelho, dispositivo, meio legível por computador para extensão de largura de banda de um sinal de áudio com uso de uma excitação de banda alta dimensionada | |
AU2014331903B2 (en) | Gain shape estimation for improved tracking of high-band temporal characteristics | |
BR112016030384B1 (pt) | Ajuste de ganho temporal baseado em característica de sinal de banda alta | |
AU2013377891B2 (en) | Systems and methods of performing noise modulation and gain adjustment | |
AU2014337537A1 (en) | Method, apparatus, device, computer-readable medium for bandwidth extension of an audio signal using a scaled high-band excitation | |
BR112016030381B1 (pt) | Método e aparelho para codificar um sinal de áudio e memória legível por computador | |
BR112016030386B1 (pt) | Codificação de sinal de banda alta com o uso de faixas de frequência incompatíveis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 14/10/2014, OBSERVADAS AS CONDICOES LEGAIS. |