BR112016007914B1 - Estimativa de formato de ganho para rastreamento aperfeiçoado de características temporais de banda alta - Google Patents

Estimativa de formato de ganho para rastreamento aperfeiçoado de características temporais de banda alta Download PDF

Info

Publication number
BR112016007914B1
BR112016007914B1 BR112016007914-0A BR112016007914A BR112016007914B1 BR 112016007914 B1 BR112016007914 B1 BR 112016007914B1 BR 112016007914 A BR112016007914 A BR 112016007914A BR 112016007914 B1 BR112016007914 B1 BR 112016007914B1
Authority
BR
Brazil
Prior art keywords
signal
highband
gain
audio signal
subframes
Prior art date
Application number
BR112016007914-0A
Other languages
English (en)
Inventor
Venkata Subrahmanyan Chandra Sekhar Chebiyyam
Venkatraman S. Atti
Original Assignee
Qualcomm Incorporated
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Incorporated filed Critical Qualcomm Incorporated
Publication of BR112016007914B1 publication Critical patent/BR112016007914B1/pt

Links

Images

Abstract

ESTIMATIVA DE FORMATO DE GANHO PARA RASTREAMENTO APERFEIÇOADO DE CARACTERÍSTICAS TEMPORAIS DE BANDA ALTA. Um método inclui a determinação, em um codificador de fala, de primeiros parâmetros de formato de ganho com base em um sinal harmonicamente estendido e/ou com base em um sinal residual de banda alta associado com uma parte de banda alta de um sinal de áudio. O método também inclui a determinação dos segundos parâmetros de formato de ganho com base em um sinal de banda alta sintetizado e com base na parte de banda alta do sinal de áudio. O método inclui adicionalmente a inserção de primeiros parâmetros de ganho e segundos parâmetros de formato de gancho em uma versão codificada do sinal de áudio para permitir o ajuste de ganho durante a reprodução do sinal de áudio a partir da versão codificada do sinal de áudio.

Description

Reivindicação de Prioridade
[0001] O presente pedido reivindica prioridade do pedido de patente provisório U.S. No. 61/889.434, intitulado "GAIN SHAPE ESTIMATION FOR IMPROVED TRACKING OF HIGH-BAND TEMPORAL CHARACTERISTICS," depositado em 10 de outubro de 2013 e do pedido de patente não provisório U.S. No. 14/508.486, intitulado "GAIN SHAPE ESTIMATION FOR IMPROVED TRACKING OF HIGH-BAND TEMPORAL CHARACTERISTICS" depositado em 7 de outubro de 2014, o conteúdo do qual é incorporado por referência em sua totalidade.
Campo
[0002] A presente descrição é geralmente relacionada com processamento de sinal.
Descrição da Técnica Relacionada
[0003] Avanços na tecnologia têm resultado em dispositivos de computação menores e mais poderosos. Por exemplo, existe atualmente uma variedade de dispositivos de computação pessoais portáteis, incluindo dispositivos de computação sem fio, tal como telefones sem fio portáteis, assistentes digitais pessoais (PDAs), e dispositivos de rádio localização que são pequenos, leves e facilmente portados pelos usuários. Mais especificamente, os telefones sem fio portáteis, tal como telefones celulares e telefones de Protocolo de Internet (IP), podem comunicar pacotes de voz e dados através de redes sem fio. Adicionalmente, muitos telefones sem fio incluem outros tipos de dispositivos que são incorporados aqui. Por exemplo, um telefone sem fio pode incluir também uma câmera estática digital, uma câmera de vídeo digital, um gravador digital, e um aparelho de arquivos de áudio.
[0004] Nos sistemas de telefonia tradicionais (por exemplo, redes de telefonia comutadas públicas (PSTNs)), a largura de banda de sinal é limitada à faixa de frequência de 300 Hertz (Hz) a 3,4 quilohertz (kHz). Nos aplicativos de banda larga (WB), tal como telefonia celular e voz através de protocolo de internet (VoIP), a largura de banda de sinal pode abranger a faixa de frequência de 50 Hz a 7 kHz. As técnicas de codificação de banda super larga (SWB) suportam largura de banda que se estende até cerca de 16 kHz. A extensão da largura de banda do sinal da telefonia de banda estreita até 3,4 kHz para telefonia SB de 16 kHz pode aperfeiçoar a qualidade de reconstrução, inteligibilidade e naturalidade de sinal.
[0005] As técnicas de codificação SWB envolvem tipicamente a codificação e transmissão da parte de frequência mais baixa do sinal (por exemplo 50 Hz a 7 kHz, também chamada de "banda baixa"). Por exemplo, a banda baixa pode ser representada utilizando-se parâmetros de filtro e/ou um sinal de excitação de banda baixa. No entanto, a fim de se aperfeiçoar a eficiência da decodificação, uma parte de frequência mais alta do sinal (por exemplo, de 7 kHz a 16 kHz, também chamada de "banda alta") pode não ser totalmente codificada e transmitida. Em vez disso, um receptor pode utilizar a modelagem de sinal para prever a banda alta. Em algumas implementações, os dados associados com a banda alta podem ser fornecidos para o receptor para auxiliar na previsão. Tais dados podem ser referidos como "informação lateral" e podem incluir informação de ganho, frequências espectrais de linha (LSFs, também referidos como pares espectrais em linha (LSPs)), etc. As propriedades do sinal de banda baixa podem ser utilizadas para gerar informação lateral; no entanto, disparidades de energia entre a banda baixa e a banda alta podem resultar em informação lateral que caracteriza de forma imprecisa a banda alta.
Sumário
[0006] Sistemas e métodos para realização de estimativa de formato de ganho em dois estágios para aperfeiçoamento do acompanhamento das características temporais de banda alta são descritos. Um codificador de fala pode utilizar uma parte de banda baixa (por exemplo, uma excitação de banda baixa harmonicamente estendida) de um sinal de áudio para gerar informação (por exemplo, informação lateral) utilizada para reconstruir uma parte de banda alta do sinal de áudio em um decodificador. Um primeiro estimador de formato de ganho pode determinar as variações de energia no sinal residual de banda alta que não estão presentes na excitação de banda baixa harmonicamente estendida. Por exemplo, o estimador de formato de ganho pode estimar as variações ou desvios temporais (por exemplo, níveis de energia) na banda alta que sofrem alteração, ou estão ausentes, no sinal residual de banda alta com relação ao sinal de excitação de banda baixa harmonicamente estendido. O primeiro elemento de ajuste de formato de ganho (com base nos primeiros parâmetros de formato de ganho) pode ajustar a evolução temporal da excitação de banda baixa harmonicamente estendida de modo que reproduza o envelope temporal do residual de banda alta. Um sinal de banda alta sintetizado pode ser gerado com base na excitação de banda baixa harmonicamente estendida ajustada/modificada, e um segundo estimador de formato de ganho pode determinar as variações de energia entre o sinal de banda alta sintetizado e a parte de banda alta do sinal de áudio em um segundo estágio. O sinal de banda alta sintetizado pode ser ajustado para modelar a parte de banda alta do sinal de áudio com base nos dados (por exemplo, segundos parâmetros de formato de ganho) a partir do segundo estimador de formato de ganho. Os primeiros parâmetros de formato de ganho e os segundos parâmetros de formato de ganho podem ser transmitidos para o decodificador juntamente com outra informação lateral para reconstrução da parte de banda alta do sinal de áudio.
[0007] Em um aspecto particular, um método inclui a determinação, em um codificador de fala, dos primeiros parâmetros de formato de ganho com base em um sinal estendido harmonicamente e/ou com base em um sinal residual de banda alta associado com uma parte de banda alta de um sinal de áudio. Em outro aspecto particular, os primeiros parâmetros de formato de ganho são determinados com base na evolução temporal no sinal residual de banda alta associado com uma parte de banda alta de um sinal de áudio. O método também inclui a determinação de segundos parâmetros de formato de ganho com base em um sinal de banda alta sintetizado e com base na parte de banda alta do sinal de áudio. O método inclui adicionalmente a inserção dos primeiros parâmetros de formato de ganho e segundos parâmetros de formato de ganho em uma versão codificada do sinal de áudio para permitir o ajuste de ganho durante a reprodução do sinal de áudio a partir da versão codificada do sinal de áudio.
[0008] Em outro aspecto particular, um aparelho inclui um primeiro estimador de formato de ganho configurado para determinar os primeiros parâmetros de formato de ganho com base em um sinal estendido harmonicamente e/ou com base em um sinal residual de banda alta associado com uma parte de banda alta de um sinal de áudio. O aparelho também inclui um segundo estimador de formato de ganho configurado para determinar os segundos parâmetros de formato de ganho com base em um sinal de banda alta sintetizado e com base na parte de banda alta do sinal de áudio. O aparelho inclui adicionalmente um multiplexador configurado para inserir os primeiros parâmetros de formato de ganho e os segundos parâmetros de formato de ganho em uma versão codificada de sinal de áudio para permitir o ajuste de ganho durante a reprodução de sinal de áudio a partir da versão codificada do sinal de áudio.
[0009] Em outro aspecto em particular, um meio legível por computador não transitório inclui instruções que, quando executadas por um processador, fazem com que o processador determine primeiros parâmetros de formato de ganho com base em um sinal harmonicamente estendido e/ou com base em um sinal residual de banda alta associado com uma parte de banda alta de um sinal de áudio. As instruções também são executáveis para fazer com que o processador determine os segundos parâmetros de formato de ganho com base em um sinal de banda alta sintetizado e com base na parte de banda alta do sinal de áudio. As instruções também são executáveis para fazer com que o processador insira os primeiros parâmetros de formato de ganho, e os segundos parâmetros de formato de ganho, em uma versão codificada do sinal de áudio para permitir o ajuste de ganho durante a reprodução do sinal de áudio a partir da versão codificada do sinal de áudio.
[0010] Em outro aspecto em particular, um aparelho inclui meios para determinar os primeiros parâmetros de formato de ganho com base em um sinal harmonicamente estendido e/ou com base em um sinal residual de banda alta com uma parte de banda alta de um sinal de áudio. O aparelho também inclui meios para determinar os segundos parâmetros de formato de ganho com base em um sinal de banda alta sintetizado e com base na parte de banda alta do sinal de áudio. O aparelho também inclui meios para inserir os primeiros parâmetros de formato de ganho e os segundos parâmetros de formato de ganho em uma versão codificada do sinal de áudio para permitir o ajuste de ganho durante a reprodução do sinal de áudio a partir da versão codificada do sinal de áudio.
[0011] Em outro aspecto particular, um método inclui o recebimento, em um decodificador de fala, de um sinal de áudio codificado de um codificador de fala. O sinal de áudio codificado inclui primeiros parâmetros de formato de ganho com base em um primeiro sinal harmonicamente estendido gerado no codificador de fala e/ou com base em um sinal residual de banda alta gerado no codificador de fala. O sinal de áudio codificado também inclui segundos parâmetros de formato de ganho com base em um primeiro sinal de banda alta sintetizado gerado no codificador de fala e com base em uma banda alta de um sinal de áudio. O método também inclui a reprodução do sinal de áudio a partir do sinal de áudio codificado com base nos primeiros parâmetros de formato de ganho e com base nos segundos parâmetros de formato de ganho.
[0012] Em outro aspecto particular, um decodificador de fala é configurado para receber um sinal de áudio codificado de um codificador de fala. O sinal de áudio codificado inclui primeiros parâmetros de formato de ganho com base em um sinal harmonicamente estendido gerado no codificador de fala e/ou com base em um sinal residual de banda alta gerado no codificador de fala. O sinal de áudio codificado também inclui segundos parâmetros de formato de ganho com base em um primeiro sinal de banda alta sintetizado gerado no codificador de fala e com base em uma banda alta de um sinal de áudio. O decodificador de fala é adicionalmente configurado para reproduzir sinal de áudio a partir do sinal de áudio codificado com base nos primeiros parâmetros de formato de ganho e com base nos segundos parâmetros de formato de ganho.
[0013] Em outro aspecto em particular, umaparelho inclui meios para receber um sinal de áudiocodificado de um codificador de fala . O sinal de áudiocodificado inclui primeiros parâmetros de formato de ganhocom base em um primeiro sinal harmonicamente estendido gerado no codificador de fala e/ou com base em um sinal residual de banda alta gerado no codificador de fala. O sinal de áudio codificado também inclui segundos parâmetros de formato de ganho com base em um primeiro sinal de banda alta sintetizado gerado no codificador de fala e com base em uma banda alta de um sinal de áudio. O aparelho também inclui meios para reproduzir o sinal de áudio a partir do sinal de áudio codificado com base nos primeiros parâmetros de formato de ganho e com base nos segundos parâmetros de formato de ganho.
[0014] Em outro aspecto em particular, um meio legível por computador não transitório inclui instruções que, quando executadas pelo processador, fazem com que o processador recebe um sinal de áudio codificado de um codificador de fala. O sinal de áudio codificado inclui primeiros parâmetros de formato de ganho com base em um primeiro sinal harmonicamente estendido gerado no codificador de fala e/o com base em um sinal residual de banda alta gerado no codificador de fala. O sinal de áudio codificado também inclui segundos parâmetros de formato de ganho com base em um primeiro sinal de banda alta sintetizado gerado no codificador de fala e com base em uma banda alta de um sinal de áudio. Instruções também são executáveis para fazer com que o processador reproduza o sinal de áudio a partir do sinal de áudio codificado com base nos primeiros parâmetros de formato de ganho e com base nos segundos parâmetros de formato de ganho.
[0015] Vantagens particulares fornecidas por pelo menos das modalidades descritas incluem o aperfeiçoamento da correlação de energia entre uma excitação de banda baixa harmonicamente estendida de um sinal de áudio e um residual de banda alta do sinal de áudio. Por exemplo, a excitação de banda baixa harmonicamente estendida pode ser ajustada com base nos parâmetros de formato de ganho para reproduzir as características temporais do sinal residual de banda alta. Outros aspectos, vantagens e características da presente descrição se tornarão aparentes após a revisão de todo o pedido, incluindo as seções a seguir: Breve Descrição dos Desenhos, Descrição Detalhada, e Reivindicações.
Breve Descrição dos Desenhos
[0016] A figura 1 é um diagrama para ilustrar uma modalidade particular de um sistema que opera para determinar os parâmetros de formato de ganho em dois estágios para reconstrução de banda alta;
[0017] A figura 2 é um diagrama para ilustrar uma modalidade particular de um sistema que opera para determinar os parâmetros de formato de ganho em um primeiro estágio com base em um sinal harmonicamente estendido e/ou um sinal residual de banda alta;
[0018] A figura 3 é um diagrama de temporização para ilustrar os parâmetros de formato de ganho com base nas disparidades de energia entre o sinal harmonicamente estendido e o sinal residual de banda alta;
[0019] A figura 4 é um diagrama para ilustrar uma modalidade particular de um sistema que opera para determinar os segundos parâmetros de formato de ganho em um segundo estágio com base em um sinal de banda alta sintetizado e uma parte de banda alta de um sinal de áudio de entrada;
[0020] A figura 5 é um diagrama para ilustrar uma modalidade particular de um sistema que opera para reproduzir um sinal de áudio utilizando parâmetros de formato de ganho;
[0021] A figura 6 é um fluxograma para ilustrar as modalidades particulares dos métodos para utilização das estimativas de ganho para reconstrução de banda alta; e
[0022] A figura 7 é um diagrama em bloco de um dispositivo sem fio que opera para realizar as operações de processamento de sinal de acordo com os sistemas e métodos das figuras de 1 a 6.
Descrição Detalhada
[0023] Com referência à figura 1, uma modalidade particular de um sistema que opera para determinar os parâmetros de formato de ganho em dois estágios para reconstrução de banda alta é ilustrada e geralmente designada por 100. Em uma modalidade particular, o sistema 100 pode ser integrado a um sistema ou aparelho de codificação (por exemplo, em um telefone sem fio, um codificador/decodificador (CODEC), ou um processador de sinal digital (DSP)). Em outras modalidades particulares, o sistema 100 pode ser integrado a uma caixa de decodificação, um aparelho de música, um aparelho de vídeo, uma unidade de entretenimento, um dispositivo de navegação, um dispositivo de comunicações, um PDA, uma unidade de dados de localização fixa, ou um computador.
[0024] Deve-se notar que na descrição a seguir, várias funções realizadas pelo sistema 100 da figura 1 são descritas como sendo realizadas por determinados componentes ou módulos. No entanto, essa divisão de componentes e módulos serve apenas à finalidade de ilustração. Em uma modalidade alterantivas, uma função realizada por um componente ou módulo em particular pode, em vez disso, ser dividida entre múltiplos componentes ou módulos. Ademais, em uma modalidade alterantivas, dois ou mais componentes ou módulos da figura 1 podem ser integrados em um único componente ou módulo. Cada componente ou módulo ilustrado na figura 1 pode ser implementado utilizando-se hardware (por exemplo, um dispositivo do conjunto de porta programável em campo (FPGA), um circuito integrado específico de aplicativo (ASIC), um DSP, um controlador, etc.), software (por exemplo, instruções executáveis por um processador), ou qualquer combinação dos mesmos.
[0025] O sistema 100 inclui um banco de filtro de análise 110 que é configurado para receber um sinal de áudio de entrada 102. Por exemplo, o sinal de áudio de entrada 102 pode ser fornecido por um microfone ou outro dispositivo de entrada. Em uma modalidade particular, o sinal de áudio de entrada 102 pode incluir fala. O sinal de áudio de entrada 102 pode ser um sinal SWB que inclui dados na faixa de frequência de aproximadamente 50 Hz para aproximadamente 16 kHz. O banco de filtro de análise 110 pode filtrar o sinal de áudio de entrada 102 em múltiplas partes com base em frequência. Por exemplo, o banco de filtro de análise 110 pode gerar um sinal de banda baixa 122 e um sinal de banda alta 124. O sinal de banda baixa 122 e o sinal de banda alta 124 podem ter largura de banda igual ou diferente, e pode ser sobreposto ou não. Em uma modalidade alternativa, o banco de filtro de análise 110 pode gerar mais de duas saídas.
[0026] No exemplo da figura 1, o sinal de banda baixa 122 e o sinal de banda alta 124 ocupam bandas de frequência não sobrepostas. Por exemplo, o sinal de banda baixa 122 e o sinal de banda alta 124 podem ocupar bandas de frequência não sobrepostas 50 Hz - 7 kHz e 7 kHz - 16 kHz, respectivamente. Em uma modalidade alternativa, o sinal de banda baixa 122 e o sinal de banda alta 124 podem ocupar bandas de frequência não sobrepostas de 50 Hz - 8 kHz e de 8 kHz a 16 kHz, respectivamente. Em outra modalidade alternativa, o sinal de banda baixa 122 e o sinal de banda alta 124 se sobrepõem (por exemplo, 50 Hz a 8 kHz e 7 kHz a 16 kHz, respectivamente), que pode permitir que um filtro de passa baixa e um filtro de passa alta do banco de filtro de análise 110 tenham um rolloff suave, o que pode simplificar o desenho e reduzir os custos do filtro de passa baixa e filtro de passa alta. A sobreposição do sinal de banda baixa 122 e sinal de banda alta 124 também pode permitir uma mistura suave de sinais de banda baixa e banda alta em um receptor, o que pode resultar em menos artefatos audíveis.
[0027] Deve-se notar que apesar de o exemplo da figura 1 ilustrar o processamento de um sinal SWB, isso é destinado à ilustração apenas. Em uma modalidade alternativa, o sinal de áudio de entrada 102 pode ser um sinal WB possuindo uma faixa de frequência de aproximadamente 50 Hz para aproximadamente 8 kHz. Em tal modalidade, o sinal de banda baixa 122 pode, por exemplo, corresponder a uma faixa de frequência de aproximadamente 50 Hz para aproximadamente 6,4 kHz e o sinal de banda alta 124 pode corresponder a uma faixa de frequência de aproximadamente 6,4 kHz a aproximadamente 8 kHz.
[0028] O sistema 100 pode incluir um módulo de análise de banda baixa 130 configurado para receber o sinal de banda baixa 122. Em uma modalidade particular, o módulo de análise de banda baixa 130 pode representar uma modalidade de um codificador de previsão linear excitada por código (CELP). O módulo de análise de banda baixa 130 pode incluir um módulo de análise e codificação de previsão linear (LP) 132, um módulo de coeficiente de previsão linear (LPC) para transformação LSP 134, e um quantizador 136. LSPs também podem ser referidos como LSFs, e os dois termos (LSP e LSF) podem ser utilizados de forma intercambiável aqui. O módulo de análise e codificação LP 132 pode codificar um envelope espectral do sinal de banda baixa 122 como um conjunto de LPCs. LPCs podem ser gerados para cada quadro de áudio (por exemplo, 20 milissegundos (ms) de áudio, correspondendo a 320 amostras a uma taxa de amostragem de 16 kHz), cada subquadro de áudio (por exemplo, 5 ms de áudio), ou qualquer combinação dos mesmos. O número de LPCs gerados para cada quadro ou subquadro pode ser determinado pela "ordem" da análise LP realizada. Em uma modalidade em particular, o módulo de análise e codificação LP 132 pode gerar um conjunto de onze LPCs correspondentes a uma análise LP de décima ordem.
[0029] O módulo de transformação de LPC para LSP 134 pode transformar o conjunto de LPCs gerados pelo módulo de análise e codificação LP 132 em um conjunto correspondente de LSPs (por exemplo, utilizando uma transformação de um para um). Alternativamente, o conjunto de LPCs pode ser transformado um por um em um conjunto correspondente de coeficientes parcor, valores de razão de área de arquivo, pares espectrais immittance (ISPs), ou frequências espectrais immittance (ISFs). A transformação entre o conjunto de LPLCs e o conjunto de LSPs pode ser reversível sem erro.
[0030] O quantizador 136 pode quantizar o conjunto de LSPs gerados pelo módulo de transformação 134. Por exemplo, o quantizador 136 pode incluir ou pode ser acoplado a múltiplos livros código que incluem múltiplos registros (por exemplo, vetores). Para se quantizar o conjunto de LSPs, o quantizador 136 pode identificar os registros de livros código que estão "mais próximos de" (por exemplo, com base em uma medição de distorção tal como erro de quadrados mínimos ou quadrado médio) conjunto de LSPs. O quantizador 136 pode enviar um valor de índice ou série de valores de índice correspondentes à localização dos registros identificados no livro código. A saída do quantizador 136 pode, dessa forma, representar parâmetros de filtro de banda baixa que soa incluídos em uma sequência de bits de banda baixa 142.
[0031] O módulo de análise de banda baixa 130 também pode gerar um sinal de excitação de banda baixa 144. Por exemplo, o sinal de excitação de banda baixa 144 pode ser um sinal codificado que é gerado pela quantização de um sinal residual LP que é gerado durante o processo LP realizado pelo módulo de análise de banda baixa 130. O sinal residual LP pode representar o erro de previsão.
[0032] O sistema 100 pode incluir adicionalmente um módulo de análise de banda alta 150 configurado para receber o sinal de banda alta 124 do banco de filtro de análise 110 e o sinal de excitação de banda baixa 144 do módulo de análise de banca baixa 130. O módulo de análise de banda alta 150 pode gerar informação de lado de banda alta 172 com base no sinal de banda alta 124 e sinal de excitação de banda baixa 144. Por exemplo, a informação de lado de banda alta 172 pode incluir LSPs de banda alta e/ou informação de ganho (por exemplo, com base pelo menos em uma razão de energia de banda alta para energia de banda baixa), como descrito adicionalmente aqui. Em uma modalidade particular, a informação de ganho pode incluir parâmetros de formato de ganho com base em um sinal harmonicamente estendido e/ou um sinal residual de banda alta. O sinal harmonicamente estendido pode ser inadequado para uso em síntese de banda alta devido à correlação insuficiente entre o sinal de banda alta 124 e o sinal de banda baixa 122. Por exemplo, subquadros do sinal de banda alta 124 podem incluir flutuações nos níveis de energia que não são adequadamente reproduzidos no sinal de excitação de banda alta modelado 161.
[0033] O módulo de análise de banda alta 150 pode incluir um primeiro estimador de formato de ganho 190. O primeiro estimador de formato de ganho 190 pode determinar os primeiros parâmetros de formato de ganho com base em um primeiro sinal associado com o sinal de banda baixa 122 e/ou com base em um resíduo de banda alta do sinal de banda alta 124. Como descrito aqui, o primeiro sinal pode ser uma excitação de banda baixa transformada (por exemplo, estendida de forma não linear ou harmonicamente) do sinal de banda baixa 122. A informação de lado de banda alta 172 pode incluir primeiros parâmetros de formato de ganho. O módulo de análise de banda alta 150 também pode incluir um primeiro elemento de ajuste de formato de ganho 192 configurado para ajustar a excitação de banda baixa harmonicamente estendida com base nos primeiros parâmetros de formato de ganho. Por exemplo, o primeiro elemento de ajuste de formato de ganho 192 pode escalonar subquadros particulares da excitação de banda baixa harmonicamente estendida para níveis de energia aproximados de subquadros correspondentes do residual do sinal de banda alta 124.
[0034] O módulo de análise de banda alta 150 também pode incluir um gerador de excitação de banda alta 160. O gerador de excitação de banda alta 160 pode gerar um sinal de excitação de banda alta 161 pela extensão de um espectro do sinal de excitação de banda baixa 144 para dentro da faixa de frequência de banda alta (por exemplo, 7 kHz - 16 kHz) . Para ilustrar, o gerador de excitação de banda alta 160 pode misturar a excitação de banda baixa harmonicamente estendida e ajustada com um sinal de ruído (por exemplo, ruído branco modulado de acordo com um envelope correspondente ao sinal de excitação de banda baixa 144 que reproduz as características temporais de variação lenta do sinal de banda baixa 122) para gerar o sinal de excitação de banda alta 161. Por exemplo, a mistura pode ser realizada de acordo com a seguinte equação:Excitação de banda alta = (a*excitação de banda baixa harmonicamente estendida e ajustada) + ((1 - α)* ruído modulado)
[0035] A razão na qual a excitação de banda baixa harmonicamente estendida e ajustada e o ruído modulado são misturados pode causar impacto na qualidade de reconstrução de banda alta em um receptor. Para sinais de fala com voz, a mistura pode ser orientada na direção da excitação de banda baixa harmonicamente estendida e ajustada (por exemplo, o fator de mistura α pode estar na faixa de 0,5 a 1,0). Para sinais sem voz, a mistura pode ser orientada na direção do ruído modulado (por exemplo, fator de mistura α pode estar na faixa de 0,0 a 0,5).
[0036] Como ilustrado, o módulo de análise de banda alta 150 também pode incluir um módulo de análise e codificação LP 152, um módulo de transformação LPC em LSP 154, e um quantizador 156. Cada um dentre o módulo de análise e codificação LP 152, o módulo de transformação 154, e o quantizador 156 pode funcionar como descrito acima com referência aos componentes correspondentes do módulo de análise de banda baixa 130, mas em uma resolução comparativamente reduzida (por exemplo, utilizando menos bits para cada coeficiente, LSP, etc.). O módulo de análise e codificação LP 152 pode gerar um conjunto de LPCs que são transformados em LSPs pelo módulo de transformação 154 e quantizados pelo quantizador 156 com base no livro código 163. Por exemplo, o módulo de análise e codificação LP 152, o módulo de transformação 154, e o quantizador 156 podem utilizar o sinal de banda alta 124 para determinar a informação de filtro de banda alta (por exemplo, LSPs de banda alta) que é incluída na informação de lado de banda alta 172.
[0037] O quantizador 156 pode ser configurado para quantizar um conjunto de valores de frequência espectral, tal como LSPs fornecidos pelo módulo de transformação 154. Em outras modalidades, o quantizador 156 pode receber e quantizar conjuntos de um ou mais tipos de valores de frequência espectral em adição a, ou em vez de LSFs ou LSPs. Por exemplo, o quantizador 156 pode receber e quantizar um conjunto de LPCs gerados pelo módulo de análise e codificação LP 152. Outros exemplos incluem conjuntos de coeficientes parcor, valores de razão de área de arquivo, e ISFs que podem ser recebidos e quantizados no quantizador 156. O quantizador 156 pode incluir um quantizador de vetor que codifica um vetor de entrada (por exemplo, um conjunto de valores de frequência espectral em um formato de vetor) como um índice para um registro correspondente em uma tabela ou livro código, tal como o livro código 163. Como outro exemplo, o quantizador 156 pode ser configurado para determinar um ou mais parâmetros dos quais o vetor de entrada pode ser gerado dinamicamente em um decodificador, tal como em uma modalidade de livro código esparsa, em vez de recuperado a partir do armazenador. Para ilustrar, exemplos de livro código esparso podem ser aplicados aos esquemas de codificação tal como CELP e codecs de acordo com os padrões da indústria tal como 3GPP2 (Parceria de 3a. Geração 2) EVRC (Codec de Taxa Variável Melhorada). Em outra modalidade, o módulo de análise de banda alta 150 pode incluir o quantizador 156 e pode ser configurado para uso de um número de vetores de livro código para gerar sinais sintetizados (por exemplo, de acordo com um conjunto de parâmetros de filtro) e para selecionar um dos vetores de livro código associados com o sinal sintetizado que melhor combina com o sinal de banda alta 124, tal como em um domínio perceptivelmente ponderado.
[0038] Em uma modalidade em particular, a informação de lado de banda alta 172 pode incluir LSPs de banda alta além de parâmetros de ganho de banda alta. Por exemplo, o sinal de excitação de banda alta 161 pode ser utilizado para determinar os parâmetros de ganho adicionais que são incluídos na informação de lado de banda alta 172. O módulo de análise de banda alta 150 pode incluir um primeiro estimador de formato de ganho 194 e um segundo ajustador de formato de ganho 196. Uma operação de síntese de coeficiente de previsão linear pode ser realizada no sinal de excitação de banda alta 161 para gerar um sinal de banda alta sintetizado. O segundo estimador de formato de ganho 194 pode determinar os segundos parâmetros de formato de ganho com base no sinal de banda alta sintetizado e o sinal de banda alta 124. A informação de lado de banda alta 172 pode incluir os segundos parâmetros de formato de ganho. O segundo ajustador de formato de ganho 196 pode ser configurado para ajustar o sinal de banda alta sintetizado com base nos segundos parâmetros de formato de ganho. Por exemplo, o segundo ajustador de formato de ganho 196 pode escalonar subquadros particulares do sinal de banda alta sintetizado para aproximar os níveis de energia dos subquadros correspondentes do sinal de banda alta 124.
[0039] A sequência de bit de banda baixa 142 e a informação de lado de banda alta 172 podem ser multiplexadas por um multiplexador (MUX) 180 para gerar uma sequência de bits de saída 199. A sequência de bits de saída 199 pode representar um sinal de áudio codificado correspondente ao sinal de áudio de entrada 102. Por exemplo, a sequência de bit de saída 199 pode ser transmitida (por exemplo, através de um canal com fio, sem fio ou ótico) e/ou armazenada. Dessa forma, o multiplexador 180 pode inserir os primeiros parâmetros de formato de ganho determinados pelo primeiro estimador de formato de ganho 190 e os segundos parâmetros de formato de ganho determinados pelo segundo estimador de formato de ganho 194 na sequência de bits de saída 199 para permitir o ajuste do ganho de excitação de banda alta durante a reprodução do sinal de áudio de entrada 102. Em um receptor, as operações inversas podem ser realizadas por um desmultiplexador (DEMUX), um decodificador de banda baixa, um decodificador de banda alta, e um banco de filtro para gerar um sinal de áudio (por exemplo, uma versão reconstruída do sinal de áudio de entrada 102 que é fornecido para um alto falante ou outro dispositivo de saída). O número de bits utilizados para representar a sequência de bits de banda baixa 142 pode ser substancialmente maior do que o número de bits utilizados para representar a informação de lado de banda alta 172. Dessa forma, a maior parte dos bits na sequência de bits de saída 199 pode representar dados de banda baixa. A informação de lado de banda alta 172 pode ser utilizada em um receptor para regenerar o sinal de excitação de banda alta a partir dos dados de banda baixa de acordo com um modelo de sinal. Por exemplo, o modelo de sinal pode representar um conjunto esperado de relações ou correlações entre os dados de banda baixa (por exemplo, o sinal de banda baixa 122) e dados de banda alta (por exemplo, o sinal de banda alta 124). Dessa forma, diferentes modelos de sinal podem ser utilizados para tipos diferentes de dados de áudio (por exemplo, fala, música, etc.) e o modelo de sinal particular que está em uso pode ser negociado por um transmissor e um receptor (ou definido por um padrão da indústria) antes da comunicação dos dados de áudio codificados. Utilizando-se o modelo de sinal, o módulo de análise de banda alta 150 em um transmissor pode ser capaz de gerar a informação de lado de banda alta 172 de modo que um módulo de análise de banda alta correspondente em um receptor possa utilizar o modelo de sinal para reconstruir o sinal de banda alta 124 a partir da sequência de bits de saída 199.
[0040] O sistema 100 pode aperfeiçoar uma correlação de energia quadro por quadro (por exemplo, aperfeiçoar uma evolução temporal) entre uma excitação de banda baixa harmonicamente estendida do sinal de áudio 102 e um residual de banda alta do sinal de áudio de entrada 102. Por exemplo, durante um primeiro estágio de ganho, o primeiro estimador de formato de ganho 190 e o primeiro ajustador de formato de ganho 192 podem ajustar a excitação de banda baixa harmonicamente estendida com base nos primeiros parâmetros de ganho. A excitação de banda baixa harmonicamente estendida pode ser ajustada para aproximar o residual da banda alta com base em quadro por quadro. O ajuste da excitação de banda baixa harmonicamente estendida pode aperfeiçoar a estimativa de formato de ganho no domínio de síntese e reduzir os artefatos audíveis durante a reconstrução de banda alta do sinal de áudio de entrada 102. O sistema 100 também pode aperfeiçoar uma correlação de energia quadro por quadro entre o sinal de banda alta 124 e uma versão sintetizada do sinal de banda alta 124. Por exemplo, durante um segundo estágio de ganho, o segundo estimador de formato de ganho 194 e o segundo ajustador de formato de ganho 196 podem ajustar a versão sintetizada do sinal de banda alta 124 com base nos segundos parâmetros de ganho. A versão sintetizada do sinal de banda alta 124 pode ser ajustada para aproximar o sinal de banda alta 124 quadro por quadro. O primeiro e segundo parâmetros de formato de ganho podem ser transmitidos para um decodificador para reduzir os artefatos audíveis durante a reconstrução de banda alta do sinal de áudio de entrada 102.
[0041] Com referência à figura 2, uma modalidade em particular de um sistema 200 que opera para determinar os parâmetros de formato de ganho em um primeiro estágio com base em um sinal harmonicamente estendido e/ou um sinal residual de banda alta é ilustrado. O sistema 200 inclui um filtro de análise de previsão linear 204, um gerador de excitação não linear 207, um módulo de identificação de quadro 214, o primeiro estimador de formato de ganho 190, e o primeiro ajustador de formato de ganho 192.
[0042] O sinal de banda alta 124 pode ser fornecido para o filtro de análise de previsão linear 204. O filtro de análise de previsão linear 204 pode ser configurado para gerar um sinal residual de banda alta 224 com base no sinal de banda alta 124 (por exemplo, uma parte de banda alta do sinal de áudio de entrada 102). Por exemplo, o filtro de análise de previsão linear 204 pode codificar um envelope espectral do sinal de banda alta 124 como um conjunto de LPCs utilizados para prever amostras futuras (com base em amostras atuais) do sinal de banda alta 124. O sinal residual de banda alta 224 pode ser fornecido para o módulo de identificação de quadro 214 e para o primeiro estimador de formato de ganho 190.
[0043] O módulo de identificação de quadro 214 pode ser configurado para determinar um modo de codificação para um quadro em particular do sinal residual de banda alta 224 e para gerar um sinal de indicação de modo de codificação 216 com base no modo de codificação. Por exemplo, o módulo de identificação de quadro 214 pode determinar se o quadro em particular do sinal residual de banda alta 224 é um quadro com voz ou sem voz. Em uma modalidade particular, um quadro com voz pode corresponder a um primeiro modo de codificação (por exemplo, uma primeira métrica) e um quadro sem voz pode corresponder a um segundo modo de codificação (por exemplo, uma segunda métrica).
[0044] O sinal de excitação de banda baixa 144 pode ser fornecido para o gerador de excitação não linear 207. Como descrito com relação à figura 1, o sinal de excitação de banda baixa 144 pode ser gerado a partir do sinal de banda baixa 122 (por exemplo, a parte de banda baixa do sinal de áudio de entrada 102) utilizando o módulo de análise de banda baixa 130. O gerador de excitação não linear 207 pode ser configurado para gerar um sinal harmonicamente estendido 208 com base no sinal de excitação de banda baixa 144. Por exemplo, o gerador de excitação não linear 207 pode realizar uma operação de valor absoluto ou uma operação quadrada nos quadros (ou subquadros) do sinal de excitação de banda baixa 144 para gerar o sinal harmonicamente estendido 208.
[0045] Para se ilustrar isso, o gerador de excitação não linear 207 pode amostrar ascendentemente o sinal de excitação de banda baixa 144 (por exemplo, um sinal variando de aproximadamente 0 kHz a 8 kHz) para gerar um sinal de 16 kHz variando de aproximadamente 0 kHz a 16 kHz (por exemplo, um sinal possuindo aproximadamente o dobro da largura de banda do sinal de excitação de banda baixa 144) e subsequentemente realizando uma operação não linear no sinal amostrado ascendentemente. Uma parte de banda baixa de sinal de 16 kHz (por exemplo, aproximadamente de 0 kHz a 8 kHz) pode ter substancialmente harmônicas similares ao sinal de excitação de banda baixa 144, e uma parte de banda alta do sinal de 16 kHz (por exemplo, aproximadamente de 8 kHz a 16 kHz) pode ser substancialmente livre de harmônicas. O gerador de excitação não linear 207 pode estender as harmônicas "dominantes" na parte de banda baixa do sinal de 16 kHz para a parte de banda alta do sinal de 16 kHz para gerar o sinal harmonicamente estendido 208. Dessa forma, o sinal harmonicamente estendido 208 pode ser uma versão harmonicamente estendida do sinal de excitação de banda baixa 144 que estende harmônicas para dentro da banda alta utilizando operações não lineares (por exemplo, operações quadradas e/ou operações de valor absoluto). O sinal harmonicamente estendido 208 pode ser fornecido para o primeiro estimador de formato de ganho 190 e para o primeiro elemento de ajuste de formato de ganho 192.
[0046] O primeiro estimador de formato de ganho 190 pode receber o sinal de indicação de modo de codificação 216 e determinar uma taxa de amostragem com base no modo de codificação. Por exemplo, o primeiro estimador de formato 190 pode amostrar um primeiro quadro do sinal harmonicamente estendido 208 para gerar uma primeira pluralidade de subquadros e pode amostrar um segundo quadro de sinal residual de banda alta 224 em situações temporais similares para gerar uma segunda pluralidade de subquadros. O número de subquadros (por exemplo, dimensões de vetor) na primeira e segunda pluralidades de subquadros pode ser baseado no modo de codificação. Por exemplo, a primeira (e segunda) pluralidade de subquadros podem incluir um primeiro número de subquadros em resposta a uma determinação de que o modo de codificação indica que o quadro particular do sinal residual de banda alta 224 é um quadro com voz. Em uma modalidade particular, a primeira e segunda pluralidades de subquadros podem, cada uma, incluir dezesseis subquadros em resposta a uma determinação de que o quadro em particular do sinal residual de banda alta 224 é um quadro com voz. Alternativamente, a primeira (e segunda) pluralidades de subquadros pode incluir um segundo número de subquadros que é inferior ao primeiro número de subquadros em resposta a uma determinação de que o modo de codificação indica que o quadro em particular do sinal residual de banda alta 224 não é um quadro com voz. Por exemplo, a primeira e a segunda pluralidades de subquadros podem, cada uma, incluir oito subquadros em resposta a uma determinação de que o modo de codificação indica que o quadro em particular do sinal residual de banda alta 224 não é um quadro com voz.
[0047] O primeiro estimador de formato de ganho 190 pode ser configurado para determinar os primeiros parâmetros de formato de ganho 242 com base no sinal harmonicamente estendido 208 e/ou sinal residual de banda alta 224. O primeiro estimador de formato de ganho 190 pode avaliar os níveis de energia de cada subquadro dentre a primeira pluralidade de subquadros e avaliar os níveis de energia de cada subquadro correspondente dentre a segunda pluralidade de subquadros. Por exemplo, os primeiros parâmetros de formato de ganho 242 podem identificar os subquadros particulares do sinal harmonicamente estendidos 208 que possuem níveis de energia menores ou maiores do que os subquadros correspondentes do sinal residual de banda RHB alta 224. O primeiro estimador de formato de ganho 190 pode determinar também uma quantidade de escalonamento de energia par fornecimento para cada subquadro em particular do sinal harmonicamente estendido 208 com base no modo de codificação. O escalonamento da energia pode ser realizado em um nível de subquadro do sinal harmonicamente estendido 208 possuindo um nível de energia inferior ou superior comparado com os subquadros correspondentes do sinal residual de banda alta 224. Por exemplo, em resposta a uma determinação de que o modo de codificação possui uma primeira métrica (por exemplo, um quadro com voz), um subquadro particular do sinal harmonicamente estendido 208 pode ser escalonado por um fator de (∑RHB2)/(∑R'LB2), onde (∑R'LB2) corresponde a um nível de energia do subquadro em particular do sinal harmonicamente estendido 208 e (∑RHB2) corresponde a um nível de energia de um subquadro correspondente do sinal residual de banda alta 224. Alternativamente, em resposta a uma determinação de que o modo de codificação possui uma segunda métrica (por exemplo, um quadro sem voz), o subquadro em particular do sinal harmonicamente estendido 208 pode ser escalonado por um fator de ∑ [(RHB)*(R'LB)]/(∑R'LB2). Os primeiros parâmetros de formato de ganho 242 podem identificar cada subquadro do sinal harmonicamente estendido 208 que exige um escalonamento de energia e pode identificar o fator de escalonamento de energia calculado para os subquadros respectivos. Os primeiros parâmetros de formato de ganho 242 podem ser fornecidos para o primeiro elemento de ajuste de formato de ganho 192 e para o multiplexador 180 da figura 1 como a informação de lado de banda alta 172.
[0048] O primeiro elemento de ajuste de formato de ganho 192 pode ser configurado para ajustar o sinal harmonicamente estendido 208 com base nos primeiros parâmetros de formato de ganho 242 para gerar um sinal harmonicamente estendido e ajustado 244. Por exemplo, o primeiro elemento de ajuste de formato de ganho 192 pode escalonar os subquadros identificados do sinal harmonicamente estendido 208 de acordo com o escalonamento de energia calculado para gerar o sinal harmonicamente estendido ajustado 244. O sinal harmonicamente estendido ajustado 244 pode ser fornecido para um rastreador de envelope 202 e para um primeiro combinador 254 para realizar uma operação de escalonamento.
[0049] O rastreamento de envelope 202 pode ser configurado para receber o sinal harmonicamente estendido ajustado 244 e para calcular um envelope de domínio de tempo de banda baixa 203 correspondente ao sinal harmonicamente estendido ajustado 244. Por exemplo, o rastreador de envelope 202 pode ser configurado para calcular o quadrado de cada amostra de um quadro do sinal harmonicamente estendido ajustado 244 para produzir uma sequência de valores quadrados. O rastreador de envelope 202 pode ser configurado para realizar uma operação de suavização na sequência de valores quadrados, tal como pela aplicação de um filtro de passa baixa de resposta a impulso infinito (IIR) de primeira ordem para a sequência de valores quadrados. O rastreador de envelope 202 pode ser configurado para aplicar uma função de raiz quadrada a cada amostra da sequência suavizada para produzir o envelope de domínio de tempo de banda baixa 203. O rastreador de envelope 202 também pode utilizar uma operação absoluta em vez de uma operação quadrada. O envelope de domínio de tempo de banda baixa 203 pode ser fornecido para um combinador de ruído 240.
[0050] O combinador de ruído 240 pode ser configurado para combinar o envelope de domínio de tempo de banda baixa 203 com o ruído branco 205 gerado por um gerador de ruído branco (não ilustrado) para produzir um sinal de ruído modulado 220. Por exemplo, o combinador de ruído 240 pode ser configurado para modular por amplitude o ruído branco 205 de acordo com o envelope de domínio de tempo de banda baixa 203. Em uma modalidade particular, o combinador de ruído 240 pode ser implementado como um multiplicador que é configurado para escalonar o ruído branco 205 de acordo com o envelope de domínio de tempo de banda baixa 203 para produzir o sinal de ruído modulado 220. O sinal de ruído modulado 220 pode ser fornecido para um segundo combinador 256.
[0051] O primeiro combinador 254 pode ser implementado como um multiplicador que é configurado para escalonar o sinal harmonicamente estendido ajustado 244 de acordo com o fator de mistura (α) para gerar um primeiro sinal escalonado. O segundo combinador 256 pode ser implementado como um multiplicador que é configurado para escalonar o sinal de ruído modulado 220 com base no fator de mistura (1-α) para gerar um segundo sinal escalonado. Por exemplo, o segundo combinador 256 pode escalonar o sinal de ruído modulado 220 com base na diferença de um menos o fator de mistura (por exemplo, 1-α). O primeiro sinal escalonado e o segundo sinal escalonado podem ser fornecidos para o misturador 211.
[0052] O misturador 211 pode gerar o sinal de excitação de banda alta 161 com base no fator de mistura (α), o sinal harmonicamente estendido ajustado 244, e o sinal de ruído modulado 220. Por exemplo, o misturador 211 pode combinar o primeiro sinal escalonado e o segundo sinal escalonado para gerar o sinal de excitação de banda alta 161.
[0053] O sistema 200 da figura 2 pode aperfeiçoar uma evolução temporal de energia entre o sinal harmonicamente estendido 208 e o sinal residual de banda alta 224. Por exemplo, o primeiro estimador de formato de ganho 190 e o primeiro elemento de ajuste de formato de ganho 192 pode ajustar o sinal harmonicamente estendido 208 com base nos primeiros parâmetros de formato de ganho 242. O sinal harmonicamente estendido 208 pode ser ajustado para níveis de energia aproximados do sinal residual de banda alta 224 subquadro por subquadro. O ajuste do sinal harmonicamente estendido 208 pode reduzir os artefatos audíveis no domínio de síntese como descrito com relação à figura 4. O sistema 200 também pode ajustar dinamicamente o número de subquadros com base no modo de codificação para modificar os parâmetros de formato de ganho 242 com base em variações de inclinaçao. Por exemplo, um número relativamente pequeno de parâmetros de formato de ganho 242 (por exemplo, um número relativamente pequeno de subquadros) pode ser gerado para um quadro sem voz possuindo uma variação relativamente baixa na evolução temporal dentro do quadro. Alternativamente, um número relativamente grande de parâmetros de formato de ganho 242 pode ser gerado para um quadro com voz possuindo uma variação relativamente alta na evolução temporal dentro de um quadro. Em uma modalidade alternativa, o número de subquadros selecionado para ajustar a evolução temporal da banda baixa harmonicamente estendida pode ser igual para um quadro sem voz além de um quadro com voz.
[0054] Com referência à figura 3, um diagrama de temporização 300 para ilustrar os parâmetros de formato de ganho com base em disparidades de energia entre um sinal harmonicamente estendido e um sinal residual de banda alta é ilustrado. O diagrama de temporização 300 inclui um primeiro traço do sinal residual de banda alta 224, um segundo traço de um sinal harmonicamente estendido 208, e um terceiro traço dos parâmetros de formato de ganho estimado 242.
[0055] O diagrama de temporização 300 apresenta um quadro particular do sinal residual de banda alta 224 e um quadro correspondente do sinal harmonicamente estendido 208. O diagrama de temporização 300 inclui uma primeira janela de temporização 302, uma segunda janela de temporização 304, uma terceira janela de temporização 306, uma quarta janela de temporização 308, uma quinta janela de temporização 310, uma sexta janela de temporização 312, e uma sétima janela de temporização 314. Cada janela de temporização 302-314 pode representar um subquadro dos sinais respectivos 224, 208. Apesar de sete janelas de temporização serem apresentadas, em outras modalidades, janelas de temporização adicionais (ou menos) podem estar presentes. Por exemplo, em uma modalidade particular, cada sinal respectivo 224, 208 pode incluir um número reduzido como quatro janelas de temporização ou um número alto como dezesseis janelas de temporização (isso é, quatro subquadros ou dezesseis subquadros). O número de janelas de temporização pode ser baseado no modo de codificação como descrito com relação à figura 2.
[0056] O nível de energia do sinal residual de banda alta 224 na primeira janela de temporização 302 pode aproximar o nível de energia do sinal harmonicamente estendido correspondente 208 na primeira janela de temporização 302. Por exemplo, o primeiro estimador de formato de ganho 190 pode medir o nível de energia do sinal residual de banda alta 224 na primeira janela de temporização 302, medir o nível de energia do sinal harmonicamente estendido 208 na primeira janela de temporização 302, e comparar uma diferença com um limite. O nível de energia do sinal residual de banda alta 224 pode aproximar o nível de energia do sinal harmonicamente estendido 208 se a diferença estiver abaixo do limite. Dessa forma, nesse caso, o primeiro parâmetro de formato de ganho 242 para a primeira janela de temporização 302 pode indicar que um escalonamento de energia não é necessário para os subquadros correspondentes do sinal harmonicamente estendido 208. Os níveis de energia do sinal residual de banda alta 224 para as terceira e quarta janelas de temporização 306, 308 também podem se aproximar do nível de energia do sinal harmonicamente estendido correspondente 208 nas terceira e quarta janelas de temporização 306, 308. Dessa forma, os primeiros parâmetros de formato de ganho 242 para as terceira e quarta janelas de temporização 306, 308 também podem indicar que um escalonamento de energia pode não ser necessário para os subquadros correspondentes do sinal harmonicamente estendido 208.
[0057] O nível de energia do sinal residual de banda alta 224 na segunda e quinta janelas de temporização 304, 310 pode flutuar e o nível de energia correspondente do sinal harmonicamente estendido 208 na segunda e quinta j anelas de temporização 304, 310 pode não refletir com precisão a flutuação no sinal residual de banda alta 224. O primeiro estimador de formato de ganho 190 das figuras 1 e 2 pode gerar o parâmetro de formato de ganho 242 na segunda e quinta janelas de temporização 304, 310 para ajustar o sinal harmonicamente estendido 208. Por exemplo, o primeiro estimador de formato de ganho 190 pode indicar para o primeiro elemento de ajuste do formato de ganho 192 para "escalonar" o sinal harmonicamente estendido 208 na segunda e quinta janelas de temporização 304, 310 (por exemplo, o segundo e quinto subquadros). A quantidade na qual o sinal harmonicamente estendido 208 é ajustado pode ser baseada no modo de codificação do sinal residual de banda alta 224. Por exemplo, o sinal harmonicamente estendido 208 pode ser ajustado por um fator de (∑RHB2)/(∑R'LB2) se o modo de codificação indicar que o quadro é um quadro com voz. Alternativamente, o sinal harmonicamente estendido 208 pode ser ajustado por um fator de ∑ [(RHB)*(R'LB)]/(∑R'LB2) se o modo de codificação indicar que o quadro é um quadro sem voz.
[0058] O nível de energia do sinal residual de banda alta 224 para a sexta e sétima janelas de temporização 312, 314 pode se aproximar do nível de energia do sinal harmonicamente estendido correspondente 208 na sexta e sétima janelas de temporização 312, 314. Dessaforma, os primeiros parâmetros de formato de ganho 242 para a sexta e sétima janelas de temporização 312, 314 podem indicar que um escalonamento de energia não é necessário para os subquadros correspondentes do sinal harmonicamente estendido 208.
[0059] A geração de primeiros parâmetros de formato de ganho 242 como descrito com relação à figura 3 pode aperfeiçoar uma evolução temporal da energia entre o sinal harmonicamente estendido 208 e o sinal residual de banda alta 224. Por exemplo, as flutuações de energia no sinal residual de banda alta 224 pode ser compensado no sinal harmonicamente estendido 208 pelo ajuste do mesmo com base nos primeiros parâmetros de formato de ganho 242. O ajuste do sinal harmonicamente estendido 208 pode reduzir artefatos audível no domínio de síntese como descrito com relação à figura 4.
[0060] Com referência à figura 4, uma modalidade particular de um sistema 400 que opera para determinar os segundos parâmetros de formato de ganho em um segundo estágio com base em um sinal de banda alta sintetizado e uma parte de banda alta de um sinal de áudio de entrada é ilustrada. O sistema 400 pode incluir um sintetizador de previsão linear (LP) 402, o segundo estimador de formato de ganho 194, o segundo elemento de ajuste de formato de ganho 196, e um estimador de quadro de ganho 410.
[0061] O sintetizador de previsão linear (LP) 402 pode ser configurado para receber o sinal de excitação de banda alta 161 e para realizar uma operação de síntese de previsão linear no sinal de excitação de banda alta 161 para gerar um sinal de banda alta sintetizado 404. O sinal de banda alta sintetizado 404 pode ser fornecido para o segundo estimador de formato de ganho 194 e para o segundo elemento de ajuste de formato de ganho 196.
[0062] O segundo estimador de formato de ganho 194 pode ser configurado para determinar os segundos parâmetros de formato de ganho 406 com base no sinal de banda alta sintetizado 404 e o sinal de banda alta 124. Por exemplo, o segundo estimador de formato de ganho 194 pode avaliar os níveis de energia de cada subquadro do sinal de banda alta sintetizada 404 e avaliar os níveis de energia de cada subquadro correspondente do sinal de banda alta 124. Por exemplo, os segundos parâmetros de formato de ganho 406 podem identificar subquadros particulares do sinal de banda alta sintetizado 404 que possui níveis de energia mais baixos do que os subquadros correspondentes do sinal de banda alta 124. Os segundos parâmetros de formato de ganho 406 podem ser determinados em um domínio de síntese. Por exemplo, os segundos parâmetros de formato de ganho 406 podem ser determinados utilizando-se um sinal sintetizado (por exemplo, sinal de banda alta sintetizado 404) em oposição a um sinal de excitação (por exemplo, sinal harmonicamente estendido 208) em um domínio de excitação. Os segundos parâmetros de formato de ganho 406 podem ser fornecidos para o segundo elemento de ajuste de formato de ganho 196 e para o multiplexador 180 como uma informação de lado de banda alta 172.
[0063] O segundo elemento de ajuste de formato de ganho 196 pode ser configurado para gerar um sinal de banda alta sintetizado ajustado 418 com base nos segundos parâmetros de formato de ganho 406. Por exemplo, o segundo elemento de a juste de formato de ganho 196 pode "escalonar" subquadros particulares do sinal de banda alta sintetizado 404 com base nos segundos parâmetros de formato de ganho 406 para gerar o sinal de banda alta sintetizado e ajustado 418. O segundo elemento de ajuste de formato de ganho 196 pode "escalonar" subquadros do sinal de banda alta sintetizado 404 de forma similar à forma na qual o primeiro elemento de ajuste de formato de ganho 192 das figuras 1 e 2 ajusta subquadros particulares do sinal harmonicamente estendido 208 com base nos primeiros parâmetros de formato de ganho 242. O sinal de banda alta sintetizado e ajustado 418 pode ser fornecido para o estimador de quadro de ganho 410.
[0064] O estimador de quadro de ganho 410 pode gerar parâmetros de quadro de ganho 412 com base no sinal de banda alta sintetizado e ajustado 404 e o sinal de banda alta 124. Os parâmetros de quadro de ganho 412 podem ser fornecidos para o multiplexador 180 como informação de lado de banda alta 172.
[0065] O sistema 400 da figura 4 pode aperfeiçoar a reconstrução de banda alta do sinal de áudio de entrada 102 da figura 1 pela geração dos segundos parâmetros de formato de ganho 406 com base nos níveis de energia do sinal de banda alta sintetizado 404 e níveis de energia correspondentes do sinal de banda alta 124. Os segundos parâmetros de formato de ganho 406 podem reduzir os artefatos audíveis durante a reconstrução de banda alta do sinal de áudio de entrada 102.
[0066] Com referência à figura 5, uma modalidade em particular de um sistema 500 que opera para reproduzir um sinal de áudio utilizando parâmetros de formato de ganho é ilustrada. O sistema 500 inclui um gerador de excitação não linear 507, um primeiro elemento de ajuste de formato de ganho 592, um gerador de excitação de banda alta 520, um sintetizador de previsão linear (LP) 522, e um segundo elemento de ajuste de formato de ganho 526. Em uma modalidade particular, o sistema 500 pode ser integrado ao sistema de decodificação ou aparelho (por exemplo, em um telefone sem fio, um CODEC, ou um DSP). Em outras modalidades particulares, o sistema 500 pode ser integrado a uma caixa de decodificação, um aparelho de música, um aparelho de vídeo, uma unidade de entretenimento, um dispositivo de navegação, um dispositivo de comunicações, um PDA, uma unidade de dados de localização fixa, ou um computador.
[0067] O gerador de excitação não linear 507 pode ser configurado para receber o sinal de excitação de banca baixa 144 da figura 1. Por exemplo, a sequência de bit de banda baixa 142 da figura 1 pode incluir dados representando o sinal de excitação de banda baixa 144, e pode ser transmitido para o sistema 500 como a sequência de bits 199. O gerador de excitação não linear 507 pode ser configurado para gerar um segundo sinal harmonicamente estendido 508 com base no sinal de excitação de banda baixa 144. Por exemplo, o gerador de excitação não linear 507 pode realizar uma operação de valor absoluto ou uma operação quadrada nos quadros (ou subquadros) do sinal de excitação de banda baixa 144 para gerar o segundo sinal harmonicamente estendido 508. Em uma modalidade particular, o gerador de excitação não linear 507 pode operar de uma forma substancialmente similar ao gerador de excitação não linear 207 da figura 2. O segundo sinal harmonicamente estendido 508 pode ser fornecido para o primeiro elemento de ajuste de formato de ganho 592.
[0068] Os primeiros parâmetros de formato de ganho, tal como os primeiros parâmetros de formato de ganho 242 da figura 2, também podem ser fornecidos para o primeiro elemento de ajuste de formato de ganho 592. Por exemplo, a informação de lado de banda alta 172 da figura 1 pode incluir dados que representam os primeiros parâmetros de formato de ganho 242 e podem ser transmitidos para o sistema 500. O primeiro elemento de ajuste de formato de ganho 592 pode ser configurado para ajustar o segundo sinal harmonicamente estendido 508 com base nos primeiros parâmetros de formato de ganho 242 para gerar um segundo sinal harmonicamente estendido ajustado 544. Em uma modalidade particular, o primeiro elemento de ajuste de formato de ganho 592 pode operar de uma forma substancialmente similar ao primeiro elemento de ajuste de formato de ganho 192 das figuras 1 e 2. O segundo sinal harmonicamente estendido e ajustado 544 pode ser fornecido para o gerador de excitação de banda alta.
[0069] O gerador de excitação de banda alta 520 pode gerar um segundo sinal de excitação de banda alta 561 com base no segundo sinal harmonicamente estendido ajustado 544. Por exemplo, o gerador de excitação de banda alta 520 pode incluir um rastreador de envelope, um combinador de ruído, um primeiro combinador, um segundo combinador, e um misturador. Em uma modalidade particular, os componentes do gerador de excitação de banda alta 520 podem operar de uma forma substancialmente similar ao rastreador de envelope 202 da figura 2, o combinador de ruído 240 da figura 2, o primeiro combinador 254 da figura 2, o segundo combinador 256 da figura 2, e o misturador 211 da figura 2. O segundo sinal de excitação de banda alta 561 pode ser fornecido para o sintetizador de previsão linear 522.
[0070] O sintetizador de previsão linear 522 pode ser configurado para receber o segundo sinal de excitação de banda alta 561 e para realizar uma operação de síntese de previsão linear no segundo sinal de excitação de banda alta 561 para gerar um segundo sinal de banda alta sintetizado 524. Em uma modalidade particular, o sintetizador de previsão linear 522 pode operar de forma substancialmente similar ao sintetizador de previsão linear 402 da figura 4. O segundo sinal de banda alta sintetizado 525 pode ser fornecido para o segundo elemento de ajuste de formato de ganho 526.
[0071] Os segundos parâmetros de formato de ganho, tal como os segundos parâmetros de formato de ganho 406 da figura 4, também podem ser fornecidos para o segundo elemento de ajuste de formato de ganho 526. Por exemplo, a informação de lado de banda alta 172 da figura 1 pode incluir dados representando os segundos parâmetros de formato de ganho 406 e podem ser transmitidos para o sistema 500. O segundo elemento de ajuste de formato de ganho 526 pode ser configurado para ajustar o segundo sinal de banda alta sintetizado 524 com base nos segundos parâmetros de formato de ganho 406 para gerar um segundo sinal de banda alta sintetizado e ajustado 528. Em uma modalidade particular, o segundo elemento de ajuste de formato de ganho 526 pode operar de uma forma substancialmente similar ao segundo elemento de ajuste de formato de ganho 196 das figuras 1 e 4. Em uma modalidade particular, o segundo sinal de banda alta sintetizado ajustado 528 pode ser uma versão reproduzida do sinal de banda alta 124 da figura 1.
[0072] O sistema 500 da figura 5 pode reproduzir o sinal de banda alta 124 utilizando o sinal de excitação de banda alta 144, os primeiros parâmetros de formato de ganho 242, e os segundos parâmetros de formato de ganho 406. A utilização dos parâmetros de formato de ganho 242, 406 pode aperfeiçoar a precisão de reprodução pelo ajuste do segundo sinal harmonicamente estendido 508 e o segundo sinal de banda alta sintetizado 524 com base nas evoluções temporais da energia detectada no codificador de fala.
[0073] Com referência à figura 6, fluxogramas de modalidades particulares dos métodos 600, 610 de utilização de estimativas de ganho para reconstrução de banda alta são ilustrados. O primeiro método 600 pode ser realizado pelos sistemas 100-200 das figuras 1 e 2 e o sistema 400 da figura 4. O segundo método 610 pode ser realizado p elo sistema 500 da figura 5
[0074] O primeiro método 600 inclui a determinação, em um codificador de fala, dos primeiros parâmetros de formato de ganho com base em um sinal harmonicamente estendido e/ou com base em um sinal residual de banda alta associado com uma parte de banda alta de um sinal de áudio, em 602. Por exemplo, o primeiro estimador de formato de ganho 190 da figura 1 pode determinar os primeiros parâmetros de formato de ganho (por exemplo, os primeiros parâmetros de formato de ganho 242 da figura 2) com base em um sinal harmonicamente estendido (por exemplo, sinal harmonicamente estendido 208 da figura 2) e/ou residual de banda alta do sinal de banda alta 124.
[0075] O método 600 também pode incluir a determinação de segundos parâmetros de formato de ganho com base em um sinal de banda alta sintetizado e com base na parte de banda alta do sinal de áudio, em 604. Por exemplo, o segundo estimador de formato de ganho 194 pode determinar os segundos parâmetros de formato de ganho 406 com base no sinal de banda alta sintetizado 404 e o sinal de banda alta 124.
[0076] Os primeiros parâmetros de formato de ganho e os segundos parâmetros de formato de ganho podem ser inseridos em uma versão codificada do sinal de áudio para permitir o ajuste de ganho durante a reprodução do sinal de áudio a partir da versão codificada do sinal de áudio, em 606. Por exemplo, a informação de lado de banda alta 172 da figura 1 pode incluir os primeiros parâmetros de formato de ganho 242 e os segundos parâmetros de formato de ganho 406. O multiplexador 180 pode inserir os primeiros parâmetros de formato de ganho 242 e os segundos parâmetros de formato de ganho 406 na sequência de bit 199, e a sequência de bits 199 pode ser transmitida para um decodificador (por exemplo, o sistema 500 da figura 5). O primeiro elemento de ajuste de formato de ganho 592 da figura 4 pode ajustar o sinal harmonicamente estendido 508 com base em um primeiro parâmetro de formato de ganho 242 para gerar o segundo sinal harmonicamente estendido ajustado 544. O segundo sinal de excitação de banda alta 561 é pelo menos parcialmente baseado no segundo sinal harmonicamente estendido ajustado 544. Adicionalmente, o segundo elemento de ajuste de formato de ganho 526 da figura 5 pode ajustar o sinal de banda alta sintetizado 524 com base nos segundos parâmetros de formato de ganho 406 para reproduzir uma versão do sinal de banda alta 124.
[0077] O segundo método 610 pode incluir o recebimento, em um decodificador de fala, de um sinal de áudio codificado a partir de um codificador de fala, em 612. O sinal de áudio codificado pode incluir os primeiros parâmetros de formato de ganho 242 com base no sinal harmonicamente estendido 208 gerado no codificador de fala e/ou sinal residual de banda alta 224 gerado no codificador de fala. O sinal de áudio codificado também pode incluir os segundos parâmetros de formato de ganho 406 com base no sinal de banda alta sintetizado 404 e o sinal de banda alta 124.
[0078] Um sinal de áudio pode ser reproduzido a partir do sinal de áudio codificado com base nos primeiros parâmetros de formato de ganho e com base nos segundos parâmetros de formato de ganho em 614. Por exemplo, o primeiro elemento de ajuste de formato de ganho 592 da figura 5 pode ajustar o sinal harmonicamente estendido 508 com base nos primeiros parâmetros de formato de ganho 242 para gerar o segundo sinal harmonicamente estendido e ajustado 544. O gerador de excitação de banda alta 520 da figura 5 pode gerar o segundo sinal de excitação de banda alta 561 com base no segundo sinal harmonicamente estendido ajustado 544. O sintetizador de previsão linear 522 pode realizar uma operação de síntese de previsão linear no segundo sinal de excitação de banda alta 561 para gerar o segundo sinal de banda alta sintetizado 524, e o segundo elemento de ajuste de formato de ganho 526 pode ajustar o segundo sinal de banda alta sintetizado 524 com base nos segundos parâmetros de formato de ganho 406 para gerar um segundo sinal de banda alta sintetizado ajustado 528 (por exemplo, o sinal de áudio reproduzido).
[0079] Os métodos 600, 610 da figura 6 podem aperfeiçoar a correlação de energia de subquadro para subquadro (por exemplo, aperfeiçoar uma evolução temporal) entre uma excitação de banda baixa harmonicamente estendida do sinal de áudio 102 e um residual de banda alta do sinal de áudio de entrada 102. Por exemplo, durante um primeiro estágio de ganho, o primeiro estimador de formato de ganho 190 e o primeiro elemento de ajuste de formato de ganho 192 podem ajustar a excitação de banda baixa harmonicamente estendida com base nos primeiros parâmetros de ganho para modelar a excitação de banda baixa harmonicamente estendida no residual de banda alta. Os métodos 600, 610 também podem aperfeiçoar uma correlação de energia de subquadro por subquadro entre o sinal de banda de sinal 124 e uma versão sintetizada do sinal de banda alta 124. Por exemplo, durante um segundo estágio de ganho, o segundo estimador de formato de ganho 194 e o segundo elemento de ajuste de formato de ganho 196 pode ajustar a versão sintetizada do sinal de banda alta 124 com base nos segundos parâmetros de ganho para modelar a versão sintetizada do sinal de banda alta 124 com base no sinal de banda alta 124.
[0080] Em modalidades particulares, os métodos 600, 610 da figura 6 podem ser implementados através de hardware (por exemplo, um dispositivo FPGA, um ASIC, etc.) de uma unidade de processamento, tal como uma unidade de processamento central (CPU), um processador de sinal digital (DSP), ou um controlador, através de um dispositivo de firmware, ou qualquer combinação dos mesmos. Como um exemplo, os métodos 600, 610 da figura 6 podem ser realizados por um processor que executa instruções, como descrito com relação à figura 7.
[0081] Com referência à figura 7, um diagrama em bloco de uma modalidade ilustrativa particular de um dispositivo de comunicação sem fio é apresentado e geralmente designado por 700. O dispositivo 700 inclui um processador 710 (por exemplo, uma CPU) acoplado a uma memória 732. A memória 32 pode incluir instruções 760 executáveis pelo processador 720 e/ou um CODEC 734 para realizar os métodos e processos descritos aqui, tal como os métodos 600,6 10 da figura 6.
[0082] Em uma modalidade particular, o CODEC 734 pode incluir um sistema de estimativa de ganho de dois estágios 782 e um sistema de ajuste de ganho de dois estágios 784. Em uma modalidade particular, o sistema de estimativa de ganho de dois estágios 782 inclui um ou mais componentes do sistema 100 da figura 1, um ou mais componentes do sistema 200 da figura 2 e/ou um ou mais componentes do sistema 400 da figura 4. Por exemplo, o sistema de estimativa de ganho de dois estágios 782 pode realizar as operações de codificação associadas com os sistemas 100-2—da figura 2, o sistema 400 da figura 4 e o método 600 da figura 6. Em uma modalidade em particular, o sistema de ajuste de ganho de dois estágios 784 pode incluir um ou mais componentes do sistema 500 da figura 5. Por exemplo, o sistema de ajuste de ganho de dois estágios 784 pode realizar as operações de decodificação associadas com o sistema 500 da figura 5 e o método 610 da figura 6. O sistema de estimativa de ganho de dois estágios 782 e/ou o sistema de ajuste de ganho de dois estágios 784 podem ser implementados através de hardware dedicado (por exemplo, conjunto de circuitos), por um processador executando instruções para realização de uma ou mais tarefas, ou uma combinação dos mesmos.
[0083] Como um exemplo, a memória 732 ou uma memória 790 no CODEC 734 pode ser um dispositivo de memória, tal como uma memória de acesso randômico (RAM), memória de acesso randômico magneto resistivo (MRAM), uma MRAM de transferência de torque de rotação (STT-MRAM), memória flash, memória de leitura apenas (ROM), memória de leitura apenas programável (PROM), memória de leitura apenas programável e eliminável (EPROM), memória de leitura apenas eletricamente programável e eliminável (EEPROM), registros, disco rígido, um disco removível, ou uma memória de leitura apenas em disco compacto (CD-ROM). O dispositivo de memória pode incluir instruções (por exemplo, instruções 760 ou instruções 795) que, quando executadas por um computador (por exemplo, um processador no CODEC 734 e/ou o processador 710), pode fazer com que o computador realize pelo menos uma parte de um dos métodos 600, 610 da figura 6. Como um exemplo, a memória 732 ou a memória 790 no CODEC 734 pode ser um meio legível por computador não transitório que inclui instruções (por exemplo, as instruções 760 ou as instruções 795, respectivamente) que, quando executadas por um computador (por exemplo, um processador no CODEC 734 e/ou o processador 710), fazem com que o computador realize pelo menos uma parte de um dentre o método 600, 610 da figura 6.
[0084] O dispositivo 700 também pode incluir um DSP 796 acoplado ao CODEC 734 e ao processador 710. Em uma modalidade particular, o DSP 796 pode incluir um sistema de estimativa de ganho de dois estágios 797 e um sistema de ajuste de ganho de dois estágios 798. O sistema de estimativa de ganho de dois estágios 797 pode incluir um ou mais componentes do sistema 100 de figura 1, um ou mais componentes do sistema 200 da figura 2, e/ou um ou mais componentes do sistema 400 da figura 4. Por exemplo, o sistema de estimativa de ganho de dois estágios 797 pode realizar operações de codificação associadas com os sistemas 100-200 da figura 2, o sistema 400 da figura 4, e o método 600 da figura 6. O sistema de ajuste de ganho de dois estágios 798 pode incluir uma ou mais componentes do sistema 500 da figura 5. Por exemplo, o sistema de ajuste de ganho de dois estágios 798 pode realizar as operações de decodificação associadas com o sistema 500 da figura 5 e o método 610 da figura 6. O sistema de estimativa de ganho de dois estágios 797 e/ou o sistema de ajuste de ganho de dois estágios 798 podem ser implementados através do hardware dedicado (por exemplo, conjunto de circuitos), por um processador executando instruções para realizar uma ou mais tarefas, ou uma combinação dos mesmos.
[0085] A figura 7 ilustra também um controlador de exibição 726 que é acoplado ao processador 710 e a um monitor 728. O CODEC 734 pode ser acoplado ao processador 710, como ilustrado. Um alto falante 736 e um microfone 738 podem ser acoplados ao CODEC 734. Por exemplo, o microfone 738 pode gerar o sinal de áudio de entrada 102 da figura 1, e o CODEC 734 pode gerar a sequência de bits de saída 199 para transmissão para um receptor com base no sinal de áudio de entrada 102. Como outro exemplo, o alto falante 735 pode ser utilizado para enviar um sinal reconstruído pelo CODEC 734 a partir da sequência de bits de saída 199 da figura 1, onde a sequência de bits de saída 199 é recebida de um transmissor. A figura 7 também indica que um controlador sem fio 740 pode ser acoplado ao processador 710 e a uma antena sem fio.
[0086] Em uma modalidade em particular, o processador 710, o controlador de exibição 726, a memória 732, o CODEC 734, o DSP 796 e o controlador sem fio 740 são incluídos em um dispositivo do sistema em pacote ou sistema em chip (por exemplo, um modem de estação móvel (MSM)) 722. Em uma modalidade particular, um dispositivo de entrada 730, tal como uma tecla de toque e/ou teclado, e um suprimento de energia 744 são acoplados ao dispositivo de sistema em chip 722. Ademais, em uma modalidade particular, como ilustrado na figura 7, o monitor 728, o dispositivo de entrada 730, o alto falante 736, o microfone 738, a antena 742 e o suprimento de energia 744 são externos ao dispositivo de sistema em chip 722. No entanto, cada um dentre o monitor 728, o dispositivo de entrada 730, o alto falante 736, o microfone 738, a antena 742, e o suprimento de energia 744 pode ser acoplado a um componente do dispositivo de sistema em chip 722, tal como uma interface ou um controlador.
[0087] Em conjunto com as modalidades descritas, um primeiro aparelho é descrito incluindo meios para determinação dos primeiros parâmetros de formato de ganho com base em um sinal harmonicamente estendido e/ou baseado em um sinal residual de banda alta associado com uma parte de banda alta de um sinal de áudio. Por exemplo, os meios para determinação dos primeiros parâmetros de formato de ganho podem incluir o primeiro estimador de formato de ganho 190 das figuras 1 e 2, o módulo de identificação de quadro 214 da figura 2, o sistema de estimativa de ganho de dois estágios 782 da figura 7, o sistema de estimativa de ganho de dois estágios 797 da figura 7, um ou mais dispositivos configurados para determinar os primeiros parâmetros de formato de ganho (por exemplo, um processador executando instruções em um meio de armazenamento legível por computador não transitório) ou qualquer combinação dos mesmos.
[0088] O primeiro aparelho também pode incluir meio para determinar os segundos parâmetros de formato de ganho com base em um sinal de banda alta sintetizado e com base na parte de banda alta do sinal de áudio. Por exemplo, os meios de determinação dos segundos parâmetros de formato de ganho podem incluir o segundo estimador de formato de ganho 194 das figuras 1 e 4, o sistema de estimativa de ganho de dois estágios 782 da figura 7, o sistema de estimativa de ganho de dois estágios 797 da figura 7, um ou mais dispositivos configurados para determinar os segundos parâmetros de ganho (por exemplo, um processador executando instruções em um meio de armazenamento legível por computador não transitório), ou qualquer combinação dos mesmos.
[0089] O primeiro aparelho também pode incluir meios para inserir os primeiros parâmetros de formato de ganho e os segundos parâmetros de formato de ganho em uma versão codificada do sinal de áudio para permitir o ajuste de ganho durante a reprodução do sinal de áudio a partir da versão codificada do sinal de áudio. Por exemplo, os meios para inserção dos primeiros parâmetros de formato de ganho e segundos parâmetros de formato de ganho na versão codificada do sinal de áudio podem incluir o multiplexador 180 da figura 1, o sistema de estimativa de ganho de dois estágios 782 da figura 7, o sistema de estimativa de ganho de dois estágios 797 da figura 7, um ou mais dispositivos configurados para inserir os primeiros parâmetros de ganho na versão codificada do sinal de áudio (por exemplo, um processador executando instruções em um meio de armazenamento legível por computador não transitório) ou qualquer combinação dos mesmos.
[0090] Em conjunto com as modalidades descritas, um segundo aparelho é descrito incluindo meios para o recebimento de um sinal de áudio codificado a partir de um codificador de fala. O sinal de áudio codificado inclui primeiros parâmetros de formato de ganho com base em um primeiro sinal harmonicamente estendido gerado no codificador de fala e com base em um sinal residual de banda alta gerado no codificador de fala. O sinal de áudio codificado também inclui segundos parâmetros de formato de ganho com base em um primeiro sinal de banda alta sintetizado gerado no codificador de fala e com base em uma banda alta de um sinal de áudio. Por exemplo, os meios para o recebimento do sinal de áudio codificado podem incluir o gerador de excitação não linear 507 da figura 5, o primeiro estimador de formato de ganho 592 da figura 5, o segundo estimador de formato de ganho 526 da figura 5, o sistema de a juste de ganho de dois estágios 784 da figura 7, o sistema de ajuste de ganho de dois estágios 798 da figura 7, um ou mais dispositivos configurados para determinar o recebimento do sinal de áudio codificado (por exemplo, um processador executando instruções em um meio de armazenamento legível por computador não transitório), ou qualquer combinação dos mesmos.
[0091] O segundo aparelho também pode incluir meios para reproduzir o sinal de áudio a partir do sinal de áudio codificado com base nos primeiros parâmetros de formato de ganho e com base nos segundos parâmetros de formato de ganho. Por exemplo, os meios para reprodução de sinal de áudio podem incluir o gerador de excitação não linear 507 da figura 5, o primeiro estimador de formato de ganho 592 da figura 5, o gerador de excitação de banda alta 520 da figura 5, o sintetizador de coeficiente de previsão linear 522 da figura 5, o segundo estimador de formato de ganho 526 da figura 5, o sistema de ajuste de ganho de dois estágios 784 da figura 7, o sistema de ajuste de ganho de dois estágios 798 da figura 7, um ou mais dispositivos configurados para reproduzir o sinal de áudio (por exemplo, um processador executando instruções em um meio de armazenamento legível por computador não transitório), ou qualquer combinação dos mesmos.
[0092] Os versados na técnica apreciarão adicionalmente que os vários blocos lógicos, configurações, módulos, circuitos e etapas de algoritmo ilustrativos descritos com relação às modalidades descritas aqui podem ser implementados como hardware eletrônico, software de computador executado por um dispositivo de processamento tal como um processador de hardware, ou combinações de ambos. Vários componentes ilustrativos, blocos, configurações, módulos, circuitos e etapas foram descritos acima geralmente em termos de sua funcionalidade. Se tal funcionalidade será implementada como hardware ou software executável depende da aplicação em particular e das restrições de desenho impostas ao sistema como um todo. Os versados na técnica podem implementar a funcionalidade descrita de várias formas para cada aplicação em particular, mas tais decisões de implementação não devem ser interpretadas como responsáveis pelo distanciamento do escopo da presente descrição.
[0093] As etapas de um método ou algoritmo descrito com relação às modalidades descritas aqui podem ser consubstanciadas diretamente em hardware, em um módulo de software executado por um processador, ou em uma combinação dos dois. Um módulo de software pode residir em um dispositivo de memória, tal como uma memória de acesso randômico (RAM), uma memória de acesso randômico magneto resistiva (MRAM), uma MRAM de transferência de torque de rotação (STT-MRAM), memória flash, memória de leitura apenas (ROM), memória de leitura apenas programável (PROM), memória de leitura apenas programável e eliminável (EPROM), memória de leitura apenas eletricamente programável e eliminável (EEPROM), registros, disco rígido, um disco removível, ou uma memória de leitura apenas em disco compacto (CD-ROM). Um dispositivo de memória ilustrativo é acoplado ao processador de modo que o processador possa ler informação a partir de e escrever informação no dispositivo de memória. Na alternativa, o dispositivo de memória pode ser integral ao processador. O processador e o meio de armazenamento podem residir em um ASIC. O ASIC pode residir em um dispositivo de computação ou um terminal de usuário. Na alternativa, o processador e o meio de armazenamento podem residir como componentes discretos em um dispositivo de computação ou um terminal de usuário.
[0094] A descrição anterior das modalidades descritas é fornecida para permitir que os versados na técnica criem ou façam uso das modalidades descritas. Várias modificações a essas modalidades serão prontamente aparentes aos versados na técnica, e os princípios definidos aqui podem ser aplicados a outras modalidades sem se distanciar do escopo da descrição. Dessa forma, a presente descrição não deve ser limitada às modalidades ilustradas aqui, mas deve ser acordado o escopo mais amplo consistente com os princípios e características de novidade como definido pelas reivindicações em anexo.

Claims (15)

1. Método para gerar uma versão codificada (199) de um sinal de áudio (102) caracterizado pela versão codificada do sinal de áudio ser gerada ao codificar uma parte de banda baixa (122) do sinal de áudio, e a partir de informações de lado de banda alta (172) para reconstruir uma parte de banda alta (124) do sinal de áudio, o método compreendendo:determinar, em um codificador de fala, primeiros parâmetros de formato de ganho com base em um sinal residual de banda alta associado à parte de banda alta do sinal de áudio;gerar um sinal de excitação de banda alta com base no sinal harmonicamente estendido e nos primeiros parâmetros de formato de ganho, em que o sinal harmonicamente estendido se baseia em um sinal de excitação de banda baixa gerado a partir da parte de banda baixa do sinal de áudio;realizar uma operação de síntese de previsão linear no sinal de excitação de banda alta para gerar um sinal de banda alta sintetizado;determinar segundos parâmetros de formato de ganho com base no sinal de banda alta sintetizado e com base na parte de banda alta do sinal de áudio; einserir pelo menos os primeiros parâmetros de formato de ganho e os segundos parâmetros de formato de ganho na versão codificada do sinal de áudio para possibilitar o ajuste de ganho durante a reprodução do sinal de áudio a partir da versão codificada do sinal de áudio.
2. Método, de acordo com a reivindicação 1, caracterizado pelos primeiros parâmetros de formato de ganho serem determinados em um domínio residual de previsão linear e/ou pelos segundos parâmetros de formato de ganho serem determinados em um domínio de síntese de previsão linear.
3. Método, de acordo com a reivindicação 1, caracterizado pelo sinal harmonicamente estendido ser gerado a partir da parte de banda baixa do sinal de áudio através de extensão harmônica não linear.
4. Método, de acordo com a reivindicação 1, caracterizado por compreender adicionalmente:ajustar o sinal harmonicamente estendido com base nos primeiros parâmetros de formato de ganho para gerar um sinal harmonicamente estendido modificado, em que o sinal de excitação de banda alta se baseia pelo menos parcialmente no sinal harmonicamente estendido modificado; e/ouajustar o sinal de banda alta sintetizado com base nos segundos parâmetros de formato de ganho.
5. Método, de acordo com a reivindicação 4, caracterizado por compreender adicionalmente:amostragem de um quadro de banda baixa do sinal harmonicamente estendido para gerar uma primeira pluralidade de subquadros;amostragem de um quadro de banda alta correspondente do sinal residual de banda alta para gerar uma segunda pluralidade de subquadros; egerar os primeiros parâmetros de formato de ganho com base em níveis de energia da primeira pluralidade de subquadros, com base em níveis de energia da segunda pluralidade de subquadros ou qualquer combinação destes.
6. Método, de acordo com a reivindicação 5, caracterizado pela primeira pluralidade de subquadros e pela segunda pluralidade de subquadros incluírem o mesmo número de subquadros tanto para um quadro de voz quanto um quadro sem voz, em que a primeira pluralidade de subquadros e a segunda pluralidade de subquadros incluem quatro subquadros se uma taxa de amostra núcleo de banda baixa for 12,8 quilohertz (kHz), e em que a primeira pluralidade de subquadros e a segunda pluralidade de subquadros incluem cinco subquadros se a taxa de amostra núcleo de banda baixa for 16 kHz.
7. Aparelho para gerar uma versão codificada (199) de um sinal de áudio (102), em que a versão codificada do sinal de áudio é gerada ao codificar uma parte de banda baixa (122) do sinal de áudio, e a partir de informações de lado de banda alta (172) para reconstruir uma parte de banda alta (124) do sinal de áudio, o aparelho caracterizado por compreender:um primeiro estimador de formato de ganho configurado para determinar primeiros parâmetros de formato de ganho com base em um sinal residual de banda alta associado à parte de banda alta do sinal de áudio;um primeiro ajustador de formato de ganho configurado para gerar um sinal de excitação de banda alta com base em um sinal harmonicamente estendido e nos primeiros parâmetros de formato de ganho, em que o sinal harmonicamente estendido se baseia em um sinal de excitação de banda baixa gerado a partir da parte de banda baixa do sinal de áudio;um sintetizador de predição linear configurado para realizar uma operação de síntese de previsão linear no sinal de excitação de banda alta para gerar um sinal de banda alta sintetizado;um segundo estimador de formato de ganho configurado para determinar segundos parâmetros de formato de ganho com base no sinal de banda alta sintetizado e com base na parte de banda alta do sinal de áudio; e conjunto de circuitos configurado para inserir pelo menos os primeiros parâmetros de formato de ganho e ossegundos parâmetros de formato de ganho na versão codificada do sinal de áudio para possibilitar o ajuste deganho durante a reprodução do sinal de áudio a partir da versão codificada do sinal de áudio.
8. Aparelho, de acordo com a reivindicação 7, caracterizado pelo conjunto de circuitos incluir um multiplexador.
9. Aparelho, de acordo com a reivindicação 7, caracterizado pelo primeiro ajustador de formato de ganho ser adicionalmente configurado para ajustar o sinal harmonicamente estendido com base nos primeiros parâmetros de formato de ganho para gerar um sinal harmonicamente estendido modificado.
10. Aparelho, de acordo com a reivindicação 9, caracterizado pelo primeiro estimador de formato de ganho ser adicionalmente configurado para:amostragem de um quadro de banda baixa do sinal harmonicamente estendido para gerar uma primeira pluralidade de subquadros;amostragem de um quadro de banda alta correspondente do sinal residual de banda alta para gerar uma segunda pluralidade de subquadros; egerar os primeiros parâmetros de formato de ganho com base em níveis de energia da primeira pluralidade de subquadros, com base em níveis de energia da segunda pluralidade de subquadros ou qualquer combinação destes.
11. Aparelho, de acordo com a reivindicação 10, caracterizado pelo primeiro ajustador de formato de ganho ser adicionalmente configurado para ajustar o sinal harmonicamente estendido ao escalonar um subquadro particular da primeira pluralidade de subquadros para aproximar um nível de energia de um subquadro correspondente da segunda pluralidade de subquadros.
12. Aparelho, de acordo com a reivindicação 10, caracterizado pela primeira pluralidade de subquadros incluir um primeiro número de subquadros em resposta a umadeterminação de que o quadro de banda alta é um quadro devoz, e pela primeira pluralidade de subquadros incluir um segundo número de subquadros que é menor que o primeiro número de subquadros, em resposta a uma determinação de que o quadro de banda alta não é um quadro de voz.
13. Aparelho, de acordo com a reivindicação 10, caracterizado pela primeira pluralidade de subquadros incluir dezesseis subquadros em resposta a uma determinação de que o quadro de banda alta é um quadro de voz.
14. Método para reproduzir um sinal de áudio a partir de uma versão codificada do sinal de áudio, o método caracterizado por compreender:receber, em um decodificador de fala, a versão codificada do sinal de áudio;determinar primeiros parâmetros de formato de ganho a partir da versão codificada do sinal de áudio;determinar segundos parâmetros de formato de ganho a partir da versão codificada do sinal de áudio;gerar um sinal harmonicamente estendido com basena extensão não linear de uma excitação de banda baixa daversão codificada do sinal de áudio;ajustar o sinal harmonicamente estendido com basenos primeiros parâmetros de formato de ganho para obter umsinal harmonicamente estendido modificado;gerar um sinal de excitação de banda alta com base no sinal harmonicamente estendido modificado;realizar uma operação de síntese de previsão linear no sinal de excitação de banda alta para gerar um segundo sinal de banda alta sintetizado; eajustar o sinal de banda alta sintetizado com base nos segundos parâmetros de formato de ganho.
15. Decodificador de fala para reproduzir um sinal de áudio a partir de uma versão codificada do sinal de áudio, o decodificador de fala caracterizado por ser configurado para:receber a versão codificada do sinal de áudio;determinar primeiros parâmetros de formato de ganho a partir da versão codificada do sinal de áudio;determinar segundos parâmetros de formato de ganho a partir da versão codificada do sinal de áudio;gerar um sinal harmonicamente estendido com basena extensão não linear de uma excitação de banda baixa daversão codificada do sinal de áudio;ajustar o sinal harmonicamente estendido com basenos primeiros parâmetros de formato de ganho para obter umsinal harmonicamente estendido modificado;gerar um sinal de excitação de banda alta com base no sinal harmonicamente estendido modificado;realizar uma operação de síntese de previsão linear no sinal de excitação de banda alta para gerar um segundo sinal de banda alta sintetizado; eajustar o sinal de banda alta sintetizado com base nos segundos parâmetros de formato de ganho.
BR112016007914-0A 2013-10-10 2014-10-08 Estimativa de formato de ganho para rastreamento aperfeiçoado de características temporais de banda alta BR112016007914B1 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US61/889,434 2013-10-10
US14/508,486 2014-10-07

Publications (1)

Publication Number Publication Date
BR112016007914B1 true BR112016007914B1 (pt) 2021-12-21

Family

ID=

Similar Documents

Publication Publication Date Title
US9858941B2 (en) Selective phase compensation in high band coding of an audio signal
AU2019203827B2 (en) Estimation of mixing factors to generate high-band excitation signal
US9620134B2 (en) Gain shape estimation for improved tracking of high-band temporal characteristics
EP3471098A1 (en) High-band signal modeling
US9601125B2 (en) Systems and methods of performing noise modulation and gain adjustment
AU2014331903A1 (en) Gain shape estimation for improved tracking of high-band temporal characteristics
US20150149157A1 (en) Frequency domain gain shape estimation
BR112016007914B1 (pt) Estimativa de formato de ganho para rastreamento aperfeiçoado de características temporais de banda alta
BR112016007938B1 (pt) Estimação de fatores de mistura para gerar sinal de excitação de banda alta
BR112017015461B1 (pt) Método de funcionamento de um aparelho; memória legível por computador e equipamento para realizar uma operação
EP3072130A1 (en) Selective phase compensation in high band coding