BR112016018575B1 - Extensão de largura de banda harmônica de sinais de áudio - Google Patents
Extensão de largura de banda harmônica de sinais de áudio Download PDFInfo
- Publication number
- BR112016018575B1 BR112016018575B1 BR112016018575-7A BR112016018575A BR112016018575B1 BR 112016018575 B1 BR112016018575 B1 BR 112016018575B1 BR 112016018575 A BR112016018575 A BR 112016018575A BR 112016018575 B1 BR112016018575 B1 BR 112016018575B1
- Authority
- BR
- Brazil
- Prior art keywords
- signal
- lowband
- processing function
- linear processing
- band
- Prior art date
Links
- 230000006870 function Effects 0.000 claims abstract description 162
- 238000012545 processing Methods 0.000 claims abstract description 131
- 230000005236 sound signal Effects 0.000 claims abstract description 91
- 238000000034 method Methods 0.000 claims abstract description 53
- 230000004044 response Effects 0.000 claims description 15
- 230000003595 spectral effect Effects 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 5
- 230000000737 periodic effect Effects 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 12
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012887 quadratic function Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000012888 cubic function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/81—Detection of presence or absence of voice signals for discriminating voice from music
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
EXTENSÃO DE LARGURA DE BANDA HARMÔNICA DE SINAIS DE ÁUDIO. Um método inclui separar, em um dispositivo, um sinal de áudio de entrada em pelo menos um sinal de banda baixa e um sinal de banda alta. O sinal de banda baixa corresponde a uma faixa de frequências de banda baixa e o sinal de banda alta corresponde a uma faixa de frequências de banda alta. O método também inclui selecionar uma função não linear de processamento de uma pluralidade de funções não lineares de processamento. O método inclui adicionalmente gerar um primeiro sinal estendido com base no sinal de banda baixa e na função não linear de processamento. O método também inclui gerar pelo menos um parâmetro de ajuste com base no primeiro sinal estendido, no sinal de banda alta, ou em ambos.
Description
[0001] O presente pedido reivindica prioridade do Pedido Provisional dos Estados Unidos N° 61/939.585, depositado em 13 de fevereiro de 2014, e do Pedido Não Provisional dos Estados Unidos N° 14/617.524, depositado em 9 de fevereiro de 2015, ambos intitulados "HARMONIC BANDWIDTH EXTENSION OF AUDIO SIGNALS", cujo conteúdo é aqui incorporado integralmente mediante referência.
[0002] A presente revelação se refere geralmente à extensão de largura de banda harmônica de sinais de áudio.
[0003] Os avanços na tecnologia resultaram em dispositivos de computação menores e mais potentes. Por exemplo, atualmente existe uma grande variedade de dispositivos de computação pessoal portáteis incluindo dispositivos de computação sem fio, tais como telefones portáteis sem fio, assistentes digitais pessoais (PDAs), dispositivos de radiochamada que são pequenos, leves e facilmente transportados pelos usuários. Mais especificamente, telefones sem fio portáteis, tais como telefones celulares e telefones de protocolo Internet (IP) podem comunicar voz e pacotes de dados através de redes sem fio. Adicionalmente, muitos dos tais telefones sem fio incluem outros tipos de dispositivos que são aqui incorporados. Por exemplo, um telefone sem fio também pode incluir uma câmera digital estática, uma câmera de video digital, um gravador digital e um aparelho de reprodução de arquivos de áudio.
[0004] Em sistemas de telefonia tradicional (por exemplo, redes telefônicas públicas comutadas (PSTNs)), a largura de banda de sinal é limitada à faixa de frequências de 300 Hertz (Hz) até 3.4 quilohertzes (kHz). Em aplicações de largura de banda (WB), tais como telefonia celular e de voz sobre protocolo Internet (VoIP), a largura de banda de sinal pode abranger a faixa de frequências de 50 Hz a 7 kHz. As técnicas de codificação de super banda larga (SWB) suportam largura de banda que se estende até aproximadamente 16 kHz. A extensão da largura de banda de sinal de telefonia de banda estreita em 3.4 kHz para telefonia SWB de 16 kHz pode aperfeiçoar a qualidade de reconstrução de sinal, a inteligibilidade, e a naturalidade.
[0005] As técnicas de codificação SWB envolvem, tipicamente, a codificação e transmissão da porção de frequência mais baixa do sinal (por exemplo, 50 Hz a 7 kHz, também chamada de "banda baixa"). Por exemplo, a banda baixa pode ser representada utilizando parâmetros de filtro e/ou um sinal de excitação de banda baixa. Para melhorar a eficiência de codificação, a porção de frequência mais elevada do sinal (por exemplo, 7 kHz a 16 kHz, também chamada de "banda alta") pode não ser completamente codificada e transmitida. Um receptor pode utilizar a modelação de sinal para gerar um sinal sintetizado de banda alta. Em algumas implementações, os dados associados com a banda alta podem ser fornecidos ao receptor para auxiliar na sintese de banda alta. Tais dados podem ser referidos como "informação secundária", e podem incluir informação de ganho, frequências espectrais de linha (LSFs), também referidas como pares espectrais de linha (LSPs), etc. A informação secundária pode ser gerada através da comparação de sinal de banda alta e um sinal sintetizado de banda alta derivado de banda baixa. Por exemplo, o sinal de banda alta sintetizado pode se basear no sinal de banda baixa e uma função não linear. Uma função não linear única pode ser usada para gerar o sinal de banda alta sintetizado para sinais de banda baixa tendo características distintas. A aplicação da mesma função não linear para sinais tendo características distintas pode resultar na geração de um sinal de banda alta sintetizado de baixa qualidade em certas situações (por exemplo, fala vs. música) . Como um resultado, o sinal de banda alta sintetizado pode ser fracamente correlacionado ao sinal de banda alta.
[0006] Sistemas e métodos para extensão de largura de banda harmônica de sinais de áudio são revelados. Um codificador pode usar uma porção de banda baixa de um sinal de áudio para gerar informação (por exemplo, parâmetros de ajuste) usada para reconstruir uma porção de banda alta do sinal de áudio em um decodificador. Por exemplo, o codificador pode estender a porção de banda baixa do sinal de áudio com base nas características da porção de banda baixa. A porção de banda baixa estendida pode ter uma largura de banda maior do que a porção de banda baixa. 0 codificador pode determinar os parâmetros de ajuste com base na porção de banda baixa estendida e na porção de banda alta.
[0007] O codificador pode usar uma função de processamento não linear selecionada para gerar a porção de banda baixa estendida. A função de processamento não linear pode ser selecionada a partir de uma pluralidade de funções de processamento não linear com base nas características da porção de banda baixa do sinal de áudio. O sinal de áudio pode corresponder a um quadro ou pacote de áudio específico. Se a porção de banda baixa indicar que o sinal de áudio é fortemente periódico (por exemplo, tem componentes harmônicos fortes e/ou corresponde à fala), o codificador de sinal pode selecionar uma função não linear de ordem superior. Se a porção de banda baixa indicar que o sinal de áudio é vigorosamente ruidoso (por exemplo, corresponde à música), o codificador de sinal pode selecionar uma função não linear de ordem inferior. 0 codificador pode determinar os parâmetros de ajuste com base em uma comparação da porção de banda alta e a porção de banda baixa estendida.
[0008] Um decodificador pode receber os dados de banda baixa e os parâmetros de ajuste a partir do codificador. 0 decodificador pode gerar um sinal sintetizado de banda baixa com base nos dados de banda baixa. 0 decodificador pode gerar uma porção de banda baixa estendida sintetizada com base no sinal de banda baixa sintetizada e uma função de processamento não linear selecionada. O decodificador pode gerar um sinal sintetizado de banda alta com base na porção de banda baixa estendida sintetizada e os parâmetros de ajuste. Um sinal de saida pode ser gerado mediante combinação do sinal sintetizado de banda baixa e o sinal de banda alta sintetizado no decodificador.
[0009] Em uma modalidade especifica, um método inclui separar, em um dispositivo, um sinal de áudio de entrada em pelo menos um sinal de banda baixa e um sinal de banda alta. O sinal de banda baixa corresponde a uma faixa de frequências de banda baixa e o sinal de banda alta corresponde a uma faixa de frequências de banda alta. O método inclui também selecionar uma função de processamento não linear de uma pluralidade de funções de processamento não lineares. O método inclui ainda gerar um primeiro sinal estendido com base no sinal de banda baixa e na função de processamento não linear. 0 método inclui também gerar pelo menos um parâmetro de ajuste com base no primeiro sinal estendido, no sinal de banda alta, ou ambos.
[0010] Em outra modalidade especifica, o método inclui receber, em um dispositivo, os dados de banda baixa correspondendo a pelo menos um sinal de banda baixa de um sinal de áudio de entrada. O método inclui também decodificar os dados de banda baixa para gerar um sinal de áudio de banda baixa, sintetizado. O método inclui ainda selecionar uma função de processamento não linear de uma pluralidade de funções de processamento não linear. O método inclui também gerar um sinal de áudio sintetizado de banda alta com base no sinal de áudio sintetizado de banda baixa e função de processamento não linear.
[0011] Em outra modalidade especifica, o aparelho inclui uma memória e um processador. O processador é configurado para separar um sinal de áudio de entrada em pelo menos um sinal de banda baixa e um sinal de banda alta. O sinal de banda baixa corresponde a uma faixa de frequências de banda baixa e um sinal de banda alta corresponde a uma faixa de frequências de banda alta. O processador também é configurado para selecionar uma função de processamento não linear de uma pluralidade de funções de processamento não linear. O processador é configurado ainda para gerar um primeiro sinal estendido com base no sinal de banda baixa e na função de processamento não linear. O processador também é configurado para gerar ao menos um parâmetro de ajuste com base no primeiro sinal estendido, no sinal de banda alta ou ambos.
[0012] Em outra modalidade especifica, o aparelho inclui uma memória e um processador. O processador é configurado para receber dados de banda baixa correspondendo a pelo menos um sinal de banda baixa de um sinal de áudio de entrada. 0 processador também é configurado para decodificar os dados de banda baixa para gerar um sinal de áudio de banda baixa sintetizado. 0 processador é configurado ainda para selecionar uma função de processamento não linear de uma pluralidade de funções de processamento não linear. O processador também é configurado para gerar um sinal de áudio sintetizado de banda alta com base no sinal de áudio sintetizado de banda baixa e na função de processamento não linear.
[0013] Em outra modalidade especifica, um dispositivo de armazenamento legivel por computador armazena instruções que, quando executadas por um processador, fazem com que o processador realize operações que incluem separar um sinal de áudio de entrada em pelo menos um sinal de banda baixa e um sinal de banda alta. O sinal de banda baixa corresponde a uma faixa de frequências de banda baixa e o sinal de banda alta corresponde a uma faixa de frequências de banda alta. As operações incluem também selecionar uma função de processamento não linear de uma pluralidade de funções de processamento não linear. As operações incluem ainda gerar um primeiro sinal estendido com base no sinal de banda baixa e na função de processamento não linear. As operações incluem também gerar pelo menos um parâmetro de ajuste com base no primeiro sinal estendido, no sinal de banda alta ou ambos.
[0014] Em outra modalidade especifica, um dispositivo de armazenamento legivel por computador armazena instruções que, quando executadas por um processador, fazem com que o processador realize operações que incluem receber os dados de banda baixa correspondendo a pelo menos um sinal de banda baixa de um sinal de áudio de entrada. As operações incluem também decodificar os dados de banda baixa para gerar um sinal de áudio de banda baixa sintetizado. As operações incluem ainda selecionar uma função de processamento não linear de uma pluralidade de funções de processamento não linear. As operações incluem também gerar um sinal de áudio sintetizado de banda alta com base no sinal de áudio sintetizado de banda baixa e na função de processamento não linear.
[0015] Vantagens especificas proporcionadas por ao menos uma das modalidades reveladas podem incluir melhorar a qualidade de uma porção de banda alta sintetizada de um sinal de saida. A qualidade do sinal de saida pode ser aperfeiçoada mediante geração da porção de banda alta sintetizada utilizando uma função não linear selecionada a partir de múltiplas funções de processamento não linear, disponiveis com base em características de áudio de uma porção de banda baixa. A função não linear selecionada pode melhorar a correlação entre a porção de banda alta de um sinal de entrada em um codificador e a porção de banda alta sintetizada do sinal de saida no decodificador tanto na situação de fala como na situação de não fala (por exemplo, música). Outros aspectos, vantagens e características da presente revelação se tornarão evidentes após análise do pedido, incluindo as seguintes seções: Breve Descrição dos Desenhos, Descrição Detalhada, e as Reivindicações.
[0016] A FIGURA 1 é um diagrama para ilustrar uma modalidade especifica de um sistema de codificador que é operável para realizar extensão de largura de banda harmônica dos sinais de áudio;
[0017] A FIGURA 2 é um diagrama de outra modalidade especifica de um sistema de decodificador que é operável para realizar a extensão de largura de banda harmônica de sinais de áudio;
[0018] A FIGURA 3 é um diagrama de outra modalidade especifica de um sistema que é operável para realizar a extensão de largura de banda harmônica de sinais de áudio;
[0019] A FIGURA 4 é um fluxograma para ilustrar uma modalidade especifica de um método de realizar extensão de largura de banda harmônica de sinais de áudio;
[0020] A FIGURA 5 é um fluxograma para ilustrar outra modalidade especifica de um método de realizar extensão de largura de banda harmônica de sinais de áudio; e
[0021] A FIGURA 6 é um diagrama em blocos de um dispositivo sem fio operável para realizar operações de processamento de sinal de acordo com os sistemas e métodos das FIGURAS 1-5.
[0022] Com referência à figura 1, um diagrama de uma modalidade especifica de um sistema de codificador que é operável para realizar extensão de largura de banda harmônica e de sinais de áudio é mostrado e geralmente designado 100. Em uma modalidade especifica, o sistema de codificador 100 pode ser integrado em um sistema de codificação (ou decodificação) ou aparelho (por exemplo, em um telefone sem fio, ou codificador/decodificador (CODEC)). Em outras modalidades, o sistema de codificador 100 pode ser integrado em um aparelho de conversão de sinais de frequência, um aparelho de reprodução de música, um aparelho de reprodução de video, uma unidade de entretenimento, um dispositivo de navegação, um dispositivo de comunicação, um assistente pessoal digital (PDA), uma unidade de dados de localização fixa, ou um computador.
[0023] Deve-se observar que na descrição que se segue, várias funções desempenhadas pelo sistema de codificador 100 da figura 1 são descritas como sendo executada por certos componentes ou módulos. Esta divisão de componentes e módulos é apenas para fins ilustrativos e não deve ser considerada limitadora. Em uma modalidade alternativa, uma função executada por um determinado componente ou módulo pode ser dividida entre vários componentes ou módulos. Além disso, em uma modalidade alternativa, dois ou mais componentes ou módulos de figura 1 podem ser integrados em um único componente ou módulo. Cada componente ou módulo ilustrado na figura 1 pode ser implementado usando hardware (por exemplo, um dispositivo de arranjo de porta programável no campo (FPGA), um circuito integrado de aplicação especifica (ASIC), um processador de sinal digital (DSP), um controlador, etc.), software (por exemplo, instruções executáveis por um processador) ou qualquer combinação disso
[0024] O sistema de codificador 100 inclui um grupo de filtros de análise 110 acoplado a um codificador de banda baixa 108, um estimador de harmonicidade 106, um gerador de sinal 112 e um estimador do parâmetro 190. O gerador de sinal 112 é acoplado a um filtro 141 e um mixador de 116. 0 gerador de sinal 112 pode incluir um seletor de função 180
[0025] Durante a operação, o grupo de filtros de análise 110 pode receber um sinal de áudio entrada 102. Por exemplo, o sinal de áudio entrada 102 pode ser fornecido por um microfone o outro dispositivo de entrada. O sinal de áudio entrada 102 pode incluir discurso, ruido, música ou uma combinação destes. 0 sinal de áudio entrada 102 pode ser um sinal de banda super larga (SWB) que inclui dados na faixa de frequência de aproximadamente 50 hertz (Hz) para aproximadamente 16 kHz (quilohertz) . O grupo de filtros de análise 110 pode separar o sinal de áudio de entrada 102 em várias parcelas com base na frequência. Por exemplo, o grupo de filtros de análise 110 pode separar o sinal de áudio entrada 102 em pelo menos um sinal de banda baixa 122 e um sinal de banda alta 124. Em uma modalidade particular, o banco de filtros de análise 10 1 pode incluir um conjunto de bancos de filtro de análise. O conjunto de bancos de filtro de análise pode separar o sinal de áudio de entrada 102 pelo menos o sinal de banda baixa 122 e o sinal de banda alta 124. Em uma modalidade particular, o grupo de filtros de análise 110 pode gerar mais de duas saidas.
[0026] No exemplo da figura 1, o sinal de banda baixa 122 e o sinal de banda alta 124 ocupam faixas de frequência não se sobrepõem. Por exemplo, o sinal de banda baixa 122 e o sinal de banda alta 124 podem ocupar disjunto de bandas de frequência de 50 Hz - 7 e 7 kHz - 16 kHz, respectivamente. Em uma modalidade alternativa, o sinal de banda baixa 122 e o sinal de banda alta 124 podem ocupar disjunto de bandas de frequência de 50 Hz - 8 e 8 kHz - 16 kHz, respectivamente. Em outra modalidade alternativa, o sinal de banda baixa 122 e o sinal de banda alta 124 se sobrepõem (por exemplo, 50 Hz - 8 kHz e 7 kHz - 16 kHz, respectivamente), o que pode permitir que um filtro passa-baixa e um filtro passa-alta do grupo de filtros de análise 110 tenham uma saida ajustável, que pode simplificar o projeto e reduzir o custo do filtro passa baixa e do filtro passa-alta. Ao se sobrepor o sinal de banda baixa 122 e o sinal de banda alta 124 também se pode permitir uma saida suave de sinais de banda baixa e de banda alta em um receptor, que pode resultar em menos artefatos audíveis.
[0027] Observar que, embora o exemplo da figura 1 ilustre a transformação de um sinal SWB, isto é apenas para fins ilustrativos e não deve ser considerado como limitador. Em uma modalidade alternativa, o sinal de áudio entrada 102 pode ser um sinal de banda larga (WB) , tendo uma faixa de frequência de aproximadamente 50 Hz e 8 kHz, aproximadamente. Em tal uma modalidade, o sinal de banda baixa 122 pode corresponder a uma faixa de frequência de aproximadamente 50 Hz para aproximadamente 6,4 kHz e o sinal de banda alta 124 pode corresponder a uma faixa de frequência de aproximadamente 6,4 kHz a cerca de 8 kHz.
[0028] O grupo de filtros de análise 110 pode fornecer o sinal de banda baixa 122 para o codificador de banda baixa 108 e pode fornecer o sinal de banda alta 124 para o estimador do parâmetro 190. 0 estimador do parâmetro 190 pode ser configurado para comparar um primeiro sinal estendido 182 e o sinal de banda alta 124 para gerar um ou mais parâmetros de ajuste 178, conforme descrito neste documento. 0 sistema codificador 100 pode gerar o primeiro sinal estendido 182 não baseia o sinal de banda baixa 122 e um selecionado nenhuma função não linear de processamento, conforme descrito neste documento. 0 mixador 116 pode ser configurado para gerar o primeiro sinal estendido 182 modulando um segundo sinal estendido 172 usando um sinal de ruido 176. O filtro 114 pode ser configurado para gerar o segundo sinal estendido 172 filtrando um terceiro sinal estendido 174 a partir do gerador de sinal 112.
[0029] 0 codificador de banda baixa 108 pode receber o sinal de banda baixa 122 do grupo de filtros de análise 110 e pode gerar banda baixa parâmetros 168. Os parâmetros de banda baixa 168 podem indicar as características do sinal banda baixa 122. Os parâmetros de banda baixa 168 podem incluir valores associados com inclinação espectral, ganho de altura, retardo, modo de fala ou uma combinação dos mesmos, do sinal de banda baixa 122.
[0030] Inclinação espectral pode incidir sobre a forma de um envelope espectral sobre uma banda de passagem e pode ser representado por um primeiro quantizado coeficiente de reflexão. Para sons consoantes, uma energia espectral pode diminuir com o aumento da frequência, tal que o primeiro coeficiente de reflexão é negativo e pode aproximar-se -1. Os sons sem voz podem ter um espectro que é um plano, de tal forma que o primeiro coeficiente de reflexão é próximo de zero, ou tem mais energia em altas frequências, tais que o primeiro coeficiente de reflexão é positivo e pode abordagem + 1.
[0031] Modo de fala (também chamado de modo de vocalização) pode indicar se um frame de áudio associado com o sinal de banda baixa 122 representa som com voz ou sem voz. Um parâmetro de modo do discurso pode ter um valor binário com base em uma ou mais medidas de periodicidade (por exemplo, cruzamentos de zero, funções de correlação automática normalizada (NACFs), ganho de altura, etc.) e/ou atividade para o frame de áudio, tais como uma relação entre essa medida e um valor de limiar de voz. Em outras implementações, o parâmetro de modo do discurso pode ter um ou mais Estados para indicar modos como silêncio ou ruído de fundo ou uma transição entre o silêncio e a voz fala. O codificador de banda baixa 108 pode fornecer os parâmetros de banda baixa 168 para o gerador de sinal 112.
[0032] Em uma modalidade particular, o gerador de sinal 112 pode gerar o sinal de banda baixa 122 com base nos parâmetros de banda baixa 168. Por exemplo, o gerador de sinal 112 pode incluir um decodificador local (ou um emulador de decodificador). O decodificador local pode emular o comportamento de um decodificador para um dispositivo receptor. Por exemplo, o decodificador local pode ser configurado para decodificar os parâmetros de banda baixa 168 para gerar o sinal de banda baixa 122. Em uma modalidade alternativa, o gerador de sinal 112 pode receber o sinal de banda baixa 122 do grupo de filtros de análise 110.
[0033] O seletor de funções 180 pode selecionar uma função não linear de processamento de uma pluralidade de funções não lineares de processamento disponíveis 181. A pluralidade de funções de processamento disponível não linear 118 pode incluir uma função de valor absoluto, uma função de retificação de onda completa, uma função de retificação de meia-onda, uma função quadrática, uma função cúbica, um poder de quatro função, uma função de recorte ou uma combinação destes.
[0034] 0 seletor de funções 180 pode selecionar a função não linear de processamento com base em uma característica do sinal banda baixa 122. Para ilustrar, o seletor de funções 180 pode determinar um valor da característica baseado em parâmetros de banda baixa 168 ou o sinal de banda baixa 122. Um fator de ruido pode indicar uma periodicidade de um quadro de áudio correspondente ao sinal de banda baixa 122. Por exemplo, o fator de ruido pode corresponder a passo ganho, modo de fala, inclinação espectral, NACFs, passagens por zero, ou uma combinação dos mesmos, associado com o sinal de banda baixa 122. Se o fator de ruido satisfaz um primeiro limite de ruido, o seletor de funções 180 pode selecionar uma primeira função não linear de processamento. Por exemplo, se o fator de ruido indica que o sinal de banda baixa 122 é fortemente periódico (por exemplo, corresponde ao discurso), o seletor de funções 180 pode selecionar uma função de potência de alta ordem (por exemplo, uma função de potência de quarta ordem). Se o fator de ruido satisfaz um segundo limiar de ruído, o seletor de funções 180 pode selecionar uma segunda função não linear de processamento. Por exemplo, se o fator de ruído indica que o sinal de banda baixa 122 não é muito periódico ou é o ruído como (por exemplo, corresponde à música), o seletor de funções 180 pode selecionar uma função de potência de baixa ordem (por exemplo, uma função quadrática).
[0035] Em uma determinada modalidade, o seletor de funções 180 pode Selecione uma função não linear de processamento a pluralidade de funções não lineares de processamento 118 disponíveis em uma base de quadro de áudio por quadro de áudio. Além disso, diferentes de processamento não-linear de funções podem ser selecionadas para quadros consecutivos do sinal de áudio de entrada 102. Assim, o seletor de funções 180 pode selecionar uma primeira função não linear de processamento da pluralidade de funções não lineares de processamento em resposta a determinação que um parâmetro associado com um primeiro quadro de áudio satisfaz uma condição primeira e pode selecionar uma segunda função não linear de processamento da pluralidade de funções não lineares de processamento em resposta a determinação que um parâmetro associado com um segundo quadro áudio satisfaz uma segunda condição. Como um exemplo ilustrativo, uma função não linear de processamento diferente pode ser aplicada quando o sinal de áudio entrada 102 corresponde ao discurso durante uma chamada de telefone do que quando o sinal de áudio entrada 102 corresponde à música em espera durante a chamada telefônica. Em uma modalidade particular, o parâmetro associado a quadro é um de um modo de codificação escolhido para codificar o sinal de banda baixa, uma periodicidade do quadro, uma quantidade de ruído não periódicas no quadro e uma inclinação espectral correspondente ao quadro.
[0036] O gerador de sinal 112 harmonicamente pode estender um espectro do sinal banda baixa 122 para incluir uma íaixa de frequência mais elevada (por exemplo, uma faixa de frequência correspondente ao sinal de banda alta 124) . Por exemplo, o gerador de sinal 112 amostrar ascendentemente o sinal de banda baixa 122. O sinal de banda baixa 122 pode ser é aumentada para reduzir suavização a pedido da função não linear de processamento selecionada. Em uma determinada modalidade, o gerador de sinal 112 amostrar ascendentemente o sinal de banda baixa 122 por um fator especifico (por exemplo, 8) . Em uma determinada modalidade, a operação de amostragem pode incluir enchimento de zeros do sinal de banda baixa 122. 0 gerador de sinal 112 pode gerar o terceiro sinal estendido 174 aplicando-se a função não linear de processamento selecionada ao sinal amostrado ascenaentemente.
[0037] O filtro 114 pode receber o terceiro sinal estendido 174, proveniente do gerador de sinal 112. O filtro 114 pode gerar o segundo sinal estendido 172 filtrando o terceiro sinal estendido 174. Por exemplo, o filtro 114 pode diminuir a resolução que o terceiro sinal estendido 174 tal que ama faixa de frequência (por exemplo, 7 kHz - 16 kHz) do segundo sinal estendido 172 corresponde à faixa de frequência associada com os sinais de banda alta 124. Para ilustrar, o filtro 114 pode aplicar uma passagem de banda (por exemplo, passa-alta) operação ao terceiro sinal estendido 174 para gerar o segundo sinal estendido 172 de filtragem. Em uma determinada modalidade, o filtro 114 pode aplicar uma transformação linear (por exemplo, uma transformada discreta de cosseno (DCT)) para o terceiro sinal estendido 174 e pode selecionar transformar os coeficientes que correspondem à faixa de alta frequência (por exemplo, 7 kHz - 16 kHz). O filtro 114 pode fornecer o segundo sinal estendido 172 ao mixador 116.
[0038] O mixador 116 pode combinar o segundo sinal estendido 172 e 176 o sinal de ruido. O mixador 3 16 pode receber o sinal de ruido 17 6 de um gerador de ruido (não mostrado). O gerador de ruido pode ser configurado para produzir um sinal de ruido pseudo-aleatório branco de variância de unidade. Em uma determinada modalidade, o sinal de ruido 17 6 não pode ser branco e pode ter uma densidade de potência que varia de acordo com frequência. Em uma determinada modalidade, o gerador de ruido pode ser configurado para a saida do ruido do sinal 176 como uma função deterministica que pode ser duplicada em um decodificador de um dispositivo receptor. Por exemplo, o gerador de ruido pode ser configurado para gerar o sinal de ruido 176 como uma função deterministica dos parâmetros de banda baixa 168.
[0039] O mixador 116 pode combinar uma primeira proporção do sinal de ruido 176 e uma segunda proporção do segundo sinal estendido 172. Por exemplo, o mixador 116 pode gerar o primeiro sinal estendido 182 para ter uma relação de energia harmônica para energia de ruido semelhante àquela do sinal de banda alta 124. O mixador 116 pode determinar a proporção de primeira e a segunda proporção com base em um fator de harmonicidade 170. Por exemplo, a proporção de primeira pode ser superior a proporção segunda se o fator de harmonicidade 170 indica que o sinal de banda alta 124 está associado com som sem voz (por exemplo, música ou ruido). Como outro exemplo, a proporção de segunda pode ser maior do que a proporção de primeira se o fator de harmonicidade 170 indica que o sinal de banda alta 124 é associado com o discurso expressa. Em uma determinada modalidade, o mixador 116 pode determinar a proporção de primeira (ou segunda proporção) do fator de harmonicidade 170 e pode derivar a segunda proporção (ou a primeira proporção) de acordo com uma equação, tal como (a primeira proporção)2+(a segunda proporção)2=1, (Eq. 1).
[0040] Alternativamente, o mixador 116 pode selecionar, com base no fator de harmonicidade 170, um par correspondente de proporções de uma pluralidade de pares de proporções, onde os pares são pré-calculados satisfazer uma proporção constante de energia, tais como a equação (1) . Valores da primeira proporção podem variar de 0,1 a 0,7 e valores da segunda proporção podem variar de 0,7 a 1,0.
[0041] O estimador de harmonicidade 106 pode determinar o fator de harmonicidade 170, baseado em uma estimativa de uma característica (por exemplo, periodicidade) do sinal de áudio de entrada 102. Em uma determinada modalidade, o estimador de harmonicidade 106 pode gerar o fator de harmonicidade 170 com base em pelo menos um dos parâmetros de banda baixa 168 e o sinal de banda alta 124. Por exemplo, o estimador de harmonicidade 106 pode determinar o fator de harmonicidade 170 com base nas características (por exemplo, periodicidade) do sinal banda baixa 122 indicado pelos parâmetros de banda baixa 168. Para ilustrar, o estimador de harmonicidade 106 pode atribuir um valor para o fator de harmonicidade 170 que é proporcional ao ganho de arremesso. Como outro exemplo, o estimador de harmonicidade 106 pode determinar o fator de harmonicidade 170 com base no modo de fala. Para ilustrar, o fator de harmonicidade 170 pode ter um valor de primeiro em resposta ao modo de discurso indicando o áudio dublado (por exemplo, discurso) e pode ter um segundo valor em resposta ao modo de fala indicando surdo áudio (por exemplo, música).
[0042] Como outro exemplo, o estimador de harmonicidade 106 pode determinar o fator de harmonicidade 170 com base nas características (por exemplo, periodicidade) do sinal de banda alta 124. Para ilustrar, o estimador de harmonicidade 106 pode determinar o fator de harmonicidade 170 com base em um valor máximo de um coeficiente de auto-correlação do sinal de banda alta 124, onde a auto-correlação é executada em um intervalo de pesquisa que inclui um atraso de um retardo de altura e não inclui um retardo de amostras zero. Em uma determinada modalidade, o estimador de harmonicidade 106 pode gerar parâmetros de filtro de banda alta correspondente ao sinal de banda alta 124 e pode determinar as características do sinal de banda alta 124 com base nos parâmetros de filtro de banda alta.
[0043] Em uma determinada modalidade, o estimador de harmonicidade 106 pode determinar o fator de harmonicidade 170 com base em outro indicador de periodicidade (por exemplo, ganho de altura) e um valor de limiar. Por exemplo, o estimador de harmonicidade 106 pode executar uma operação de auto-correlação do sinal de banda alta 124 se o ganho de campo indicado pelos parâmetros de banda baixa 168 satisfaz, um primeiro valor limite (por exemplo, maior ou igual a 0,5). Como outro exemplo, pode executar o estimador de harmonicidade 106 a operação de auto-correlação se o modo de fala indica um estado particular (por exemplo, discurso expressa). O fator de harmonicidade 170 pode ter um valor padrão se o ganho de arremesso não satisfaz o primeiro valor de limiar e/ou se o modo de fala indica outros Estados.
[0044] O estimador de harmonicidade 106 pode determinar o fator de harmonicidade 170 com base nas características de, ou além, periodicidade. Por exemplo, o fator de harmonicidade pode ter um valor diferente para os sinais de discurso tendo uma defasagem de campo grande do que para os sinais de discurso tendo um atraso pequeno passo. Em uma determinada modalidade, o estimador de harmonicidade 106 pode determinar o fator de harmonicidade 170 com base em uma medida da energia do sinal de banda alta 124 em múltiplos de uma frequência fundamental em relação a uma medida da energia do sinal de banda alta 124 em outros componentes de frequência.
[0045] 0 estimador de harmonicidade 106 pode fornecer o fator de harmonicidade 170 ao mixador 116. O mixador 116 pode gerar o primeiro sinal estendido 182 com base no fator de harmonicidade 170, conforme descrito neste documento. O mixador 116 pode fornecer o primeiro sinal estendido 182 para o estimador do parâmetro 190.
[0046] O estimador do parâmetro 190 pode gerar os parâmetros de ajuste 178 baseado em pelo menos um do sinal de banda alta 124 ou o primeiro sinal estendido 182. Por exemplo, o estimador do parâmetro 190 pode gerar os parâmetros de ajuste 178 com base em uma relação entre o sinal de banda alta 124 e o primeiro sinal estendido 182, tais como a diferença ou relação entre as energias dos dois sinais. Em uma determinada modalidade, os parâmetros de ajuste 178 podem corresponder a uma ou mais obter parâmetros de ajuste indica a diferença ou razão entre as energias dos dois sinais. Em uma modalidade alternativa, os parâmetros de ajuste 178 podem corresponder a um índice quantizado dos parâmetros de ajuste de ganho. Em uma determinada modalidade, os parâmetros de ajuste 178 podem incluir banda parâmetros indicando as características do sinal de banda alta 124. Em uma determinada modalidade, o estimador do parâmetro 190 pode gerar os parâmetros de ajuste 178 baseia o sinal de banda alta 124 e não com base no primeiro sinal estendido 182.
[0047] O estimador do parâmetro 190 pode fornecer os parâmetros de ajuste 178 e o codificador de banda baixa 108 pode fornecer os parâmetros de banda baixa 168 para um multiplexador (MUX). O MUX pode multiplexar os parâmetros de ajuste 178 e os parâmetros de banda baixa 168 para gerar um fluxo de bits de saida. O fluxo de bits de saida pode representar um sinal de áudio codificado correspondente para o sinal de áudio entrada 102. Por exemplo, o MUX pode ser configurado para inserir os parâmetros de ajuste 178 uma versão codificada do sinal de áudio de entrada 102 para permitir ajuste durante a reprodução do sinal de áudio de entrada 102 de ganho. O fluxo de bits de saida pode ser transmitido (por exemplo, através de um canal óptico, com fio ou sem fio) por um transmissor e/ou armazenado. Em um dispositivo receptor, operações inversas poderão ser realizadas por um demultiplexador (DEMUX), um decodificador de banda baixa, um decodificador de banda e um banco de filtros para gerar um sinal de áudio (por exemplo, uma versão reconstruída do sinal de áudio de entrada 102 fornecido a um alto-falante ou outro dispositivo de saida), conforme descrito em referência a figura 2. Em uma determinada modalidade, o estimador de harmonicidade 106 pode fornecer que o fator de harmonicidade 170 para o MUX e o MUX pode incluir o fator de harmonicidade 170 no fluxo de bits de saida.
[0048] 0 sistema codificador 100 gera um sinal de banda (por exemplo, o primeiro sinal estendido 182), sintetizado em um codificador, usando uma função não linear de processamento, selecionada com base nas características do sinal banda baixa 122. Usando a função não linear de processamento selecionada pode aumentar a correlação entre o sinal de banda alta sintetizado e o sinal de banda alta 124 em ambos os casos, com voz e sem voz.
[0049] Referindo-se a figura 2, uma personificação especifica de um sistema de decodificador que é operável para realizar extensão harmônica de largura de banda de sinais de áudio é mostrada e é geralmente designado a 200. O sistema codificador 100 e o decodificador 200 podem ser incluidos em um único dispositivo ou em dispositivos separados.
[0050] Em uma modalidade particular, o sistema decodificador 200 pode ser integrado em um sistema de codificação (ou decodificação) ou aparelho (por exemplo, em um telefone sem fio o codificador/decodificador (CODEC)). Em outras modalidades, o sistema decodificador 200 pode ser integrado em um aparelho de conversão de sinais de frequência, um leitor de música, um aparelho de reprodução de video, uma unidade de entretenimento, um dispositivo de navegação, um dispositivo de comunicação, assistente digital pessoal (PDA), uma unidade de dados de localização fixa ou um computador.
[0051] Note-se que a seguinte descrição, várias funções desempenhadas pelo sistema decodificador 200 da figura 2 são descritas como sendo executada por certos componentes ou módulos. Esta divisão de componentes e módulos é apenas para fins ilustrativos e não devem ser consideradas limitantes. Em uma modalidade alternativa, uma função executada por um determinado componente ou módulo pode ser dividido entre vários componentes ou módulos. Além disso, em uma modalidade alternativa, dois ou mais componentes ou módulos de figura 2 podem ser integrados em um único componente ou módulo. Cada componente ou módulo ilustrado na figura 2 pode ser implementado usando hardware (por exemplo, um dispositivo de arranjo de porta programável no campo (FPGA), um circuito integrado de aplicação especifica (ASIC), um processador de sinal digital (DSP), um controlador, etc.), software (por exemplo, instruções executáveis por um processador) ou qualquer combinação disso.
[0052] 0 sistema decodificador 200 inclui um decodificador de banda baixa 208, juntamente com o gerador de sinal 112, o filtro 114, o mixador 116, um gerador de sinal de banda alta 216 e um banco de filtros de sintese 210.
[0053] Durante a operação, o decodificador de banda baixa 208 pode receber dados de banda baixa 268. Os dados de banda baixa 268 podem corresponder a um fluxo de bits de saida gerado pelo sistema codificador 100 da figura 1. Por exemplo, um receptor no sistema decodificador 200 pode receber (por exemplo, através de um canal óptico, com fio ou sem fio) um fluxo de bits de entrada. O fluxo de bits de entrada pode corresponder a um fluxo de bits de saida gerado pelo sistema codificador 100. O receptor pode fornecer o fluxo de bits de entrada para um demultiplexador (DEMUX) . O DEMUX pode gerar os dados de banda baixa 2 68 e os parâmetros de ajuste do fluxo de bits de entrada. Em uma determinada modalidade, o DEMUX pode extrair um fator de harmonicidade do fluxo de bits de entrada. 0 DEMUX pode fornecer os dados de banda baixa 268 para o decodificador de banda baixa 208.
[0054] O decodificador de banda baixa 208 pode extrair parâmetros de banda baixa a partir dos dados de banda baixa 268. Os parâmetros de banda baixa podem correspondem aos parâmetros de banda baixa 168 da figura 1. O decodificador de banda baixa 208 pode gerar um sinal sintetizado de banda baixa 222 com base nos parâmetros de banda baixa. O sinal sintetizado de banda baixa 222 pode aproximar o sinal de banda baixa 122 da figura 1.
[0055] O gerador de sinal 112 pode receber o sinal sintetizado de banda baixa 222 de banda baixa decodif icador 208. 0 gerador de sinal 112 pode gerar um terceiro sinal estendido 274 com base no sinal sintetizado de banda baixa 222, conforme descrito em referência a figura 1. Por exemplo, o seletor de funções 180 pode selecionar uma função não linear de processamento de uma pluralidade de funções não lineares de processamento disponíveis 218 com base no sinal sintetizado de banda baixa 222. 0 gerador de sinal pode estender o sinal sintetizado de banda baixa 222 e pode aplicar a função não linear de processamento selecionada para gerar o terceiro sinal estendido 274. 0 terceiro sinal estendido 274 pode aproximar o terceiro sinal estendido 174 da figura 1. Em uma determinada modalidade, o seletor de funções 180 seleciona uma função não linear de processamento, com base em um parâmetro recebido. Por exemplo, o sistema decodificador 200 pode receber um parâmetro que identifica (por exemplo, por indice), uma função não linear de processamento particular que foi aplicada por um codificador (por exemplo, o sistema de codificador 100) para codificar um determinado quadro de áudio ou sequência de frames de áudio. Tal um parâmetro pode ser recebido para cada quadro ou quando o processamento não-linear função usada mudanças.
[0056] 0 filtro 114 pode gerar um segundo sinal estendido 272 filtrando o terceiro sinal estendido 274, descritos com referência a figura 1. 0 segundo sinal estendido 272 pode aproximar o segundo sinal estendido 172 da figura 1.
[0057] O mixador 116 pode gerar o primeiro sinal estendido 282 combinando um sinal de ruido 276 e o segundo sinal estendido 272 com base em um fator de harmonicidade 270, conforme descrito em referência a figura 2. 0 sinal de ruido 276 pode aproximar-se o sinal de ruido 176 da figura 1 e o primeiro sinal estendido 282 pode aproximar-se o primeiro sinal estendido 182 da figura 1.
[0058] O decodificador harmonicidade 206 pode receber os dados de banda baixa 268, os parâmetros de ajuste 178, um fator de harmonicidade recebidos (por exemplo, o parâmetro) ou uma combinação destes. Por exemplo, o decodificador harmonicidade 206 pode receber os dados de banda baixa 268, os parâmetros de ajuste 178, o fator de harmonicidade recebida ou uma combinação dos mesmos, de um DEMUX do sistema decodificador 200. O decodificador harmonicidade 206 pode gerar o fator de harmonicidade 270 com base nos dados de banda baixa 268, os parâmetros de ajuste 178, o fator de harmonicidade recebida ou uma combinação destes. Por exemplo, o decodificador harmonicidade 206 pode extrair parâmetros de banda baixa a partir dos dados de banda baixa 268. Como outro exemplo, o decodificador harmonicidade 206 pode extrair parâmetros de alta banda dos parâmetros de ajuste 178. O decodificador harmonicidade 206 pode gerar um fator de harmonicidade calculado com base em parâmetros de banda baixa, os parâmetros de banda ou ambos, conforme descrito em referência a figura 1.
[0059] O decodificador harmonicidade 206 pode definir o fator de harmonicidade 270 para ser o fator calculado harmonicidade ou o fator de harmonicidade recebidos. Em uma determinada modalidade, o decodificador harmonicidade 206 pode definir o fator de harmonicidade 270 ao fator calculado harmonicidade em resposta ao detectar um erro no fator de harmonicidade recebidos. O decodificador harmonicidade 206 pode detectar o erro em resposta a determinação que a diferença entre o fator de harmonicidade recebida e o fator calculado harmonicidade satisfaz um valor limite determinado. O decodificador harmonicidade 206 pode fornecer o fator de harmonicidade 270 ao mixador 116. O mixador 116 pode fornecer o primeiro sinal estendido 282 para o gerador de sinal de banda alta 216.
[0060] 0 gerador de sinal de banda alta 216 pode gerar um sinal sintetizado de banda alta 224 com base em pelo menos um dos parâmetros de ajuste 178 e o primeiro sinal estendido 282. Por exemplo, o gerador de sinal de banda alta 216 pode aplicar os parâmetros de ajuste 178 ao primeiro sinal estendido 282 para gerar o sinal sintetizado de banda alta 224. Para ilustrar, o gerador de sinal de banda alta 216 pode escalar o primeiro sinal estendido 282 por um fator que está associado com pelo menos um dos parâmetros de ajuste 178. Em uma determinada modalidade, um ou mais dos parâmetros de ajuste 178 podem corresponder para obter parâmetros de ajuste. O gerador de sinal de banda alta 216 pode aplicar os parâmetros de ajuste de ganho para o primeiro sinal estendido 282 para gerar o sinal sintetizado de banda alta 224. O banco de filtros de sintese 210 pode receber o sinal sintetizado de banda alta 224 e o sinal sintetizado de banda baixa 222. O sinal de áudio de saida 278 pode ser fornecido para um alto-falante (ou outro dispositivo de saida) pelo banco de filtro de sintese 210 e/ou armazenado.
[0061] O sistema decodificador 200 pode permitir que um sinal de banda alta sintetizado para ser gerado em um decodificador usando uma função não linear de processamento selecionada com base em parâmetros de banda baixa indicando as características de uma porção de banda baixa de um sinal de entrada recebida em um codificador. Usando a função não linear de processamento selecionada para gerar o sinal de banda alta sintetizado pode melhorar a correlação entre o sinal de banda alta sintetizado e uma porção de banda do sinal de entrada em casos sonoras e surdos.
[0062] Referindo-se a figura 3, uma personificação especifica de um sistema que é operável. para realizar extensão harmônica de largura de banda de sinais de áudio é mostrada e é geralmente designado a 300.
[0063] Em uma modalidade particular, o sistema 300 (ou partes dele) pode ser integrado em um sistema de codificação (ou decodificação) ou aparelho (por exemplo, em um telefone sem fio ou codificador/decodificador (CODEC)). Em outras modalidades, o sistema 300 (ou partes dele) pode ser integrado em um aparelho conversor de sinais de frequência, um leitor de música, um aparelho de reprodução de video, uma unidade de entretenimento, um dispositivo de navegação, um dispositivo de comunicação, assistente digital pessoal (PDA), uma unidade de dados de localização fixa ou um computador.
[0064] Note-se que a seguinte descrição, várias funções desempenhadas pelo sistema 300 da figura 3 são descritas como sendo executada por certos componentes ou módulos. Esta divisão de componentes e módulos é apenas para fins ilustrativos e não devem ser consideradas limitantes. Em uma modalidade alternativa, uma função executada por um determinado componente ou módulo pode ser dividido entre vários componentes ou módulos. Além disso, em uma modalidade alternativa, dois ou mais componentes ou móoulos de figura 3 podem ser integrados em um único componente ou módulo. Cada componente ou módulo ilustrado na figura 3 pode ser implementado usando hardware (por exemplo, um dispositivo de arranjo de porta programável no campo (FPGA) , um circuito integrado de aplicação específica (ASIC), um processador de sinal digital (DSP), um controlador, etc.), software (por exemplo, instruções executáveis por um processador) ou qualquer combinação disso.
[0065] O sistema 300 inclui o banco de filtros de análise 1 a 10, o codificador de banda baixa 108, o estimador de harmonicidade 106, o estimador do parâmetro 190 e o sistema decodificador 200.
[0066] Durante a operação, o grupo de filtros de análise 110 pode receber o sinal de áudio entrada 102. O grupo de filtros de análise 110 pode separar o sinal de áudio de entrada 102 pelo menos o sinal de banda baixa 122 e o sinal de banda alta 124.
[0067] O codificador de banda baixa 108 pode receber o sinal de banda baixa 122 do grupo de filtros de análise 110. O codificador de banda baixa 108 pode determinar parâmetros de banda baixa 168 com base no sinal de banda baixa 122, conforme descrito em referência a figura 1. O codificador de banda baixa 108 pode fornecer os parâmetros de banda baixa 168 ao sistema decodificador 200.
[0068] O estimador de harmonicidade 106 pode receber o sinal de banda alta 124 e pode gerar o fator de harmonicidade 170 com base no sinal de banda alta 124. Por exemplo, o estimador de harmonicidade 106 pode gerar o fator de harmonicidade 170 com base nos parâmetros de banda alta, indicando as caracteristicas do sinal de banda alta 124, conforme descrito em referência a figura 1. O estimador de harmonicidade 106 pode fornecer o fator de harmonicidade 170 ao sistema decodificador 200.
[0069] O estimador do parâmetro 190 pode gerar os parâmetros de ajuste 178 com base no sinal de banda alta 124. Por exemplo, os parâmetros de ajuste 178 podem corresponder aos parâmetros de banda alta indicando as características do sinal de banda alta 124. O estimador do parâmetro 190 pode fornecer os parâmetros de ajuste 178 ao sistema decodificador 200. 0 sistema decodificador 200 pode gerar o sinal sintetizado de banda alta 224 com base nos parâmetros de ajuste 178, os parâmetros de banda baixa 168, o fator de harmonicidade 170, ou uma combinação dos mesmos, tal como é descrito com referência a figura 2.
[0070] O sistema 300 permite um sinal de banda alta sintetizado para ser gerado em um decodificador usando uma função não linear de processamento selecionada com base nas características de um sinal de banda baixa sintetizada. O sistema 300 pode gerar os parâmetros de ajuste 178 baseia o sinal de banda alta 124 e não baseado em uma versão estendida do sinal banda baixa. Em uma modalidade particular, o sistema 300 pode gerar os parâmetros de ajuste 178 mais rápido do que o sistema codificador 100, salvando o tempo de processamento para estender o sinal de áudio entrada 102 e misturar o sinal estendido com um sinal de ruído.
[0071] Referindo-se a figura 4, um fluxograma de uma personificação especifica de um método de realizar extensão harmônica de largura de banda de sinais de áudio é mostrado e geralmente designado 400. O método 400 pode ser realizado pelo sistema codificador 100 da figura 1.
[0072] O método 400 pode incluir a separação, em um dispositivo, uma entrada de áudio do sinal pelo menos um sinal de banda baixa e um sinal de banda alta, em 402. O sinal de banda baixa pode corresponder a uma faixa de frequências de banda baixa e o sinal de banda alta pode corresponder a uma faixa de frequências de banda alta. Por exemplo, o banco de filtros de análise 10 1 da figura 1 pode separar o sinal de áudio de entrada 102 pelo menos o sinal de banda baixa 122 e o sinal de banda alta 124, conforme descrito em referência a figura 1. O sinal de banda baixa 122 pode corresponder a uma faixa de frequências de banda baixa (por exemplo, 50 hertz (Hz) - 7 kHz (quilohertz)) e o sinal de banda alta 124 pode corresponder a uma faixa de frequências de banda alta (por exemplo, 7 kHz-16 kHz).
[0073] O método 400 também pode incluir selecionando uma função não linear de processamento de uma pluralidade de funções de processamento de não linear, em 404. Por exemplo, o seletor de funções 180 da figura 1 pode selecionar uma função não linear de processamento especifica da pluralidade de funções não lineares de processamento disponíveis 118, conforme descrito em referência a figura 1.
[0074] O método 400 adicionais pode incluir gerando um primeiro sinal estendido baseado o sinal de banda baixa e a função não linear de processamento, em 406.Por exemplo, o mixador 116 da figura 1 pode gerar o primeiro sinal estendido 182 baseado o sinal de banda baixa 122 e a função não linear de processamento selecionada, conforme descrito em referência a figura 1.
[0075] 0 método 400 também pode incluir gerar pelo menos um parâmetro de ajuste baseado em pelo menos um do primeiro sinal estendido ou o sinal de banda, em 408. Por exemplo, o estimador do parâmetro 190 pode gerar os parâmetros de ajuste 178 baseado em pelo menos um do primeiro sinal estendido 182 ou o sinal de banda alta 124, conforme descrito em referência a figura 1.
[0076] O método 400 pode permitir a geração de um sinal de banda (por exemplo, o primeiro sinal estendido 182), sintetizado em um codificador, usando uma função não linear de processamento selecionada com base nas características do sinal banda baixa 122. Usando a função não linear de processamento selecionada pode aumentar a correlação entre o sinal de banda alta sintetizado e o sinal de banda alta 124 casos sonoras e surdas.
[0077] Em uma modalidade particular, o método 400 da figura 4 pode ser implementado através de hardware (por exemplo, um dispositivo de arranjo de porta programável no campo (FPGA), um circuito integrado de aplicação especifica (ASIC), etc.) de uma unidade de processamento, como uma unidade de processamento central (CPU), um processador de sinal digital (DSP) ou um controlador, através de um dispositivo de firmware, ou qualquer combinação destes. Como exemplo, o método 400 da figura 4 pode ser executado por um processador que executa instruções, conforme descrito em relação à figura 6.
[0078] Referindo-se a figura 5, um fluxograma de uma personificação especifica de um método de realizar extensão harmônica de largura de banda de sinais de áudio é mostrado e geralmente designado 500. O método 500 pode ser realizado pelo sistema decodificador 200 da figura 2.
[0079] 0 método 500 pode incluir a receber, em um dispositivo, dados banda baixa correspondente a pelo menos um sinal de banda baixa de um sinal de áudio entrada, na 502. Por exemplo, um DEMUX do sistema decodificador 200 pode receber um fluxo de bits de entrada através de um receptor, como descrito com referência à figura 2. Como outro exemplo, o decodificador de banda baixa 208 pode receber os dados de banda baixa 268, conforme descrito em referência a figura 2.
[0080] O método 500 também pode incluir descodificar os dados de banda baixa para gerar um sinal áudio sintetizado banda baixa, a 504. Por exemplo, o decodificador de banda baixa 208 pode decodificar os dados de banda baixa 268 para gerar o sinal sintetizado de banda baixa 222, conforme descrito em referência a figura 2.
[0081] O método 500 adicional pode incluir selecionar uma função não linear de processamento de uma pluralidade de funções não lineares de processamento, em 506. Por exemplo, o seletor de funções 180 pode selecionar uma função particular de processamento não-linear da pluralidade de funções não lineares de processamento disponíveis 118, conforme descrito em referência a figura 2 .
[0082] O método 500 também pode incluir gerando um sinal de áudio banda sintetizado baseado o sinal de áudio de banda baixa sintetizado e a função não linear de processamento, em 508. Por exemplo, o gerador de sinal de banda alta 216 pode gerar o sinal sintetizado de banda alta 224 com base no sinal sintetizado de banda baixa 222 e a função não linear de processamento selecionada, conforme descrito em referência a figura 2.
[0083] O método 500 pode permitir que um sinal de banda alta sintetizado para ser gerado em um decodificador usando uma função não linear de processamento selecionada com base em parâmetros de banda baixa indicando as características de uma porção de banda baixa de um sinal de entrada recebida em um codificador. Usando a função não linear de processamento selecionada para gerar o sinal de banda alta sintetizado pode melhorar a correlação entre o sinal de banda alta sintetizado e uma porção de banda do sinal de entrada em casos sonoras e surdos.
[0084] Em uma modalidade particular, o método 500 da figura 5 pode ser implementado através de hardware (por exemplo, um dispositivo de arranjo de porta programável no campo (FPGA), um circuito integrado de aplicação especifica (ASIC), etc.) de uma unidade de processamento, como uma unidade de processamento central (CPU), um processador de sinal digital (DSP) ou um controlador, através de um dispositivo de firmware, ou qualquer combinação destes. Como exemplo, o método 500 da fiqura 5 pode ser executado por um processador que executa instruções, conforme descrito em relação à figura 6.
[0085] Referindo-se à fig. 6, um diagrama de bloco de uma modalidade particular ilustrativo dc um dispositivo de comunicação sem fio é retratado e geralmente designado 600. 0 dispositivo 600 inclui um processador 610 (por exemplo, uma unidade de processamento central (CPU), um processador de sinal digitai (DSP), etc.), acoplado a uma memória de 632. A memória 632 pode incluir instruções 660 executável pelo processador 610. O processador 610 também pode incluir um codificador/decodificador (CODEC) 634, conforme mostrado. 634 o CODEC pode executar e/ou as instruções 660 podem ser executáveis pelo processador 610 para executar, métodos e processos revelados neste documento, tais como o método 400 da figura 4, o método 500 da figura 5, ou ambos.
[0086] O CODEC 634 pode incluir um codificador 690 e um decodificador 692. 0 codificador 690 pode incluir um ou mais do banco de filtros de análise 1 a 10, o estimador de harmonicidade 106, o codificador de banda baixa 108, o mlxador 116, o gerador de sinal 112, o filtro 114 e o estimador do parâmetro 190, conforme mostraao. 0 aecodificador 692 poae incluir um ou mais banco de filtros a sintese 210, o decodificador harmonicidade 206, o decodificador de banda baixa 208, o gerador de sinal de banda alta 216, o mixador 116 e o filtro 114, conforme mostrado. Em modalidades alternativas, o codificador 690 e o decodificador 692 podem residir dentro ou parte de vários processadores. Por exemplo, o dispositivo 600 pode incluir vários processadores, tais como um DSP e um processador de aplicação e o codificador 690 e decodificador 692, ou seus componentes, podem ser incluidos em alguns ou todos os processadores múltiplos.
[0087] 0 grupo de filtros de análise 110, o estimador de harmonicidade 106, o codificador de banda baixa 108, o mixador 116, o gerador de sinal 112, o filtro 114, o estimador do parâmetro 190, o banco de filtros de sintese 210, o decodificador harmonicidade 206, o decodificador de banda baixa 208, o gerador de sinal de banda alta 216 ou uma combinação dos mesmos, pode ser implementada através de hardware dedicado (por exemplo, circuitos), por um processador executando as instruções para executar uma ou mais tarefas, ou uma combinação destes. Por exemplo, tais instruções podem ser armazenadas em um dispositivo de memória, como uma memória de acesso aleatório (RAM), memória de acesso aleatório magneto resistiva (MRAM), MRAM de transferência de giro - torque (STT-MRAM), memória flash, memória somente leitura (ROM), memória de leitura programável (PROM), memória de estado sólido, apagável programável memória somente leitura (EPROM), eletricamente apagável programável memória somente leitura (EEPROM), registradores, disco rigido, um disco removivel ou uma disco compacto memória só de leitura (CD- ROM) .
[0088] A figura 6 mostra também um controlador de exibição 626 que é acoplado ao processador 610 e para uma exibição 628. Um altofalante 636 e microfone 638 podem ser acoplados ao dispositivo de 600. Por exemplo, o microfone 638 pode gerar o sinal de áudio de entrada 102 da figura 1, e o dispositivo 600 pode gerar um fluxo de bits de saida para transmissão a um receptor baseado no sinal de áudio de entrada 102, conforme descrito em referência a figura 1. Por exemplo, o fluxo de bits de saida pode ser transmitido por um transmissor via o processador 610, um controlador sem fio 640 e uma antena de 642. Como outro exemplo, o alto-falante 636 pode ser usado para produzir um sinal reconstruído pelo dispositivo 600 de um fluxo de bits de entrada recebido por um receptor (por exemplo, via o controlador sem fio 640 e a antena 642), conforme descrito em referência a figura 2.
[0089] Em uma modalidade particular, o processador 610, o controlador de exibição 626, a memória de 632 e controlador sem fio 640 estão incluídos em um dispositivo de sistema em pacote ou sistema em chip (por exemplo, um modem móvel estação (MSN)) 622. Em uma determinada modalidade, um dispositivo de entrada 630, como uma tela sensível ao toque e/ou teclado e um poder fornecimento 644 são acopladas para o dispositivo de sistema em chip 622. Além disso, em uma modalidade particular, conforme ilustrado na figura 6, a exposição 628, o dispositivo de entrada 630, 636, 638, microfone alto-falante a antena 642 e fonte de alimentação 644 são externas ao dispositivo de sistema em chip 622. Cada um dentre um display 628, dispositivo de entrada 630, altofalante 636, microfone 638, antena 642 e fonte de alimentação 644 pode ser acoplado a um componente do dispositivo de sistema em chip 622, tal como uma interface ou um controlador.
[0090] Em conjunto com as modalidades descritas, um primeiro aparelho pode incluir meios para separar um sinal de áudio entrada pelo menos um sinal de banda baixa e um sinal de banda, tal como um grupo de filtros de análise 110, um ou mais outros dispositivos ou circuitos configurados para separar um sinal de áudio, ou qualquer combinação destes. 0 sinal de banda baixa pode corresponder a uma faixa de frequências de banda baixa o sinal de banda alta pode corresponder a uma faixa de frequências de banda alta. 0 aparelho também pode incluir meios para selecionar uma função não linear de processamento de uma pluralidade de funções não lineares de processamento, tais como o seletor de funções 180, um ou mais outros dispositivos ou circuitos configurado para selecionar uma função não linear de processamento de uma pluralidade de funções não lineares de processamento, ou qualquer combinação destes. O aparelho ainda mais pode incluir primeiro meio para a geração de um primeiro sinal estendido baseado o sinal de banda baixa e a função não linear de processamento, tais como o mixador 116, um ou mais dos dispositivos ou circuitos configurados para gerar um sinal com base em um sinal de banda baixa e uma função não linear de processamento ou qualquer combinação destes. O aparelho também pode incluir o segundo meio para gerar pelo menos um parâmetro de ajuste com base no primeiro sinal estendido, o sinal de banda ou ambos, tais como o estimador do parâmetro 190, um ou mais outros dispositivos ou circuitos configurados para gerar pelo menos um parâmetro de ajuste com base em um sinal estendido e/ou um sinal de banda, ou qualquer combinação destes.
[0091] Em conjunto com as modalidades descritas, um segundo aparelho pode incluir meios para receber dados de banda baixa correspondente a pelo menos um sinal de banda baixa de um sinal de áudio entrada, como um componente (por exemplo, um receptor) de ou acoplado ao sistema decodificador 200, um ou mais outros dispositivos ou circuitos configurado para receber dados de banda baixa correspondente a um sinal de banda baixa de um sinal de áudio de entrada, ou qualquer combinação destes. O aparelho também pode incluir meios para decodificar os dados de banda baixa para gerar um sinal áudio sintetizado banda baixa, tais como o decodificador de banda baixa 208, um ou mais outros dispositivos ou circuitos configurados para decodificar os dados de banda baixa para gerar um sinal de áudio de banda baixa sintetizado, ou qualquer combinação destes. 0 aparelho ainda mais pode incluir meios para selecionar uma função não linear de processamento de uma pluralidade de funções não lineares de processamento, tais como o seletor de funções 180, um ou mais outros dispositivos ou circuitos configurados para selecionar uma função não linear de processamento de uma pluralidade de funções não lineares de processamento, ou qualquer combinação destes. 0 aparelho também pode incluir meios para gerar um sinal de áudio sintetizado de banda alta com base no sinal de áudio sintetizado de banda baixa e na função não linear de processamento, tal como o gerador de sinal de banda alta 216, um ou mais de outros dispositivos ou circuitos configurados para gerar um sinal de áudio sintetizado de banda alta com base em um sinal de áudio de banda baixa sintetizado e uma função não linear de processamento ou qualquer combinação destes.
[0092] Aqueles versados na arte considerariam que os vários blocos lógicos ilustrativos, configurações, módulos, circuitos e etapas do algoritmo descritos em conexão com as modalidades reveladas neste documento podem ser implementados como hardware eletrônico, software de computador, executado por um dispositivo de processamento tal como um processador de hardware, ou combinações de ambos. Vários componentes ilustrativos, blocos, configurações, módulos, circuitos e etapas foram descritos acima geralmente em termos de sua funcionalidade. Se essa funcionalidade é implementada como um, hardware ou software executável depende as restrições especiais de aplicação e projeto instituídas em relação ao sistema como um todo. Os versados na arte podem implementar a funcionalidade descrita em maneiras diferentes para cada aplicação particular, tais decisões de implementação não devem ser interpretadas como causando um afastamento do âmbito da presente revelação.
[0093] As etapas de um método ou algoritmo descrito em conexão com as modalidades reveladas neste documento podem ser incorporadas diretamente no hardware, em um módulo de software executado por um processador, ou em uma combinação dos dois. Um módulo de software pode residir em um dispositivo de memória, tal como a memória de acesso aleatório (RAM), memória de acesso aleatório magneto resistiva (MRAM), MPAM de transferência de giro - torque (STT-MRAM), memória flash, memória de leitura (ROM), programável memória leitura (PROM), memória somente leitura apagável programável (EPROM), memória de leitura eletricamente apagável programável (EEPROM), registradores, disco rigido, um disco removivel ou uma memória de disco compacto de leitura (CD-ROM). Um dispositivo de memória exemplar é acoplado ao processador em que o processador pode ler informações de e gravar informações no dispositivo de memória. Alternativamente, o dispositivo de memória pode ser parte integrante do processador. O processador e o meio de armazenamento podem residir em um circuito integrado de aplicação especifica (ASIC). O ASIC pode residir em um terminal de usuário ou um dispositivo de computação. Em alternativa, o processador e o meio de armazenamento podem residir como componentes discretos em um terminal de usuário ou um dispositivo de computação.
[0094] A descrição anterior das modalidades reveladas é fornecida para permitir que aqueles versados na arte realizem ou usem as modalidades reveladas. Várias modificações para estas modalidades serão prontamente evidentes para aqueles versados na arte, e os princípios definidos neste documento podem ser aplicados a outras modalidades sem partem do âmbito da revelação. Assim, a presente revelação não pretende limitar-se às modalidades mostradas aqui e deve ser concedido o mais amplo escopo possivel, coerente com os princípios e características inovadoras, conforme definidos pelas reivindicações a seguir.
Claims (14)
1. Método compreendendo: separar, em um dispositivo, um sinal de áudio de entrada em pelo menos um sinal de banda baixa e um sinal de banda alta, o sinal de banda baixa correspondendo a uma faixa de frequências de banda baixa e o sinal de banda alta correspondendo a uma faixa de frequências de banda alta (402); determinar um parâmetro indicando uma característica do sinal de banda baixa; selecionar uma função não linear de processamento de uma pluralidade de funções não lineares de processamento com base no parâmetro (404); gerar um primeiro sinal estendido com base no sinal de banda baixa e na função não linear de processamento (406); gerar ao menos um parâmetro de ajuste com base no primeiro sinal estendido, no sinal de banda alta (408), ou ambos para multiplexar em um fluxo de bits de saída; caracterizado pelo fato de que selecionar a primeira função não linear de processamento compreende selecionar uma primeira função não linear de processamento da pluralidade de funções não lineares de processamento em resposta à determinação de que o parâmetro associado com um quadro do sinal de áudio de entrada satisfaz uma primeira condição, e selecionar uma segunda função não linear de processamento da pluralidade de funções não lineares de processamento em resposta à determinação de que o parâmetro satisfaz uma segunda condição.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a função não linear de processamento é selecionada após o sinal de áudio de entrada ser recebido no dispositivo, em que o primeiro sinal estendido é gerado mediante mixagem de um sinal de ruído e um segundo sinal estendido, e em que o pelo menos um parâmetro de ajuste é determinado com base no primeiro sinal estendido e no sinal de banda alta.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que uma primeira proporção do sinal de ruído e uma segunda proporção do segundo sinal estendido são mixadas, e em que a primeira proporção e a segunda proporção são determinadas com base em uma harmonicidade de pelo menos um do sinal de banda baixa, do sinal de banda alta ou do sinal de áudio de entrada.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que a função não linear de processamento é selecionada em resposta ao recebimento do sinal de áudio de entrada, e compreendendo adicionalmente: determinar a harmonicidade com base em uma estimativa de periodicidade do sinal de áudio de entrada em um quadro de áudio.
5. Método, de acordo com a reivindicação 2, caracterizado por compreender adicionalmente: gerar o segundo sinal estendido mediante filtragem de um terceiro sinal estendido, em que uma largura de banda do segundo sinal estendido corresponde à faixa de frequências de banda alta.
6. Método, de acordo com a reivindicação 5, caracterizado por compreender ainda: gerar o terceiro sinal estendido mediante aplicação da função não linear de processamento para o sinal de banda baixa, em que a função não linear de processamento é selecionada em uma base de quadro a quadro.
7. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que o segundo sinal estendido é gerado mediante aplicação de uma transformação linear a um terceiro sinal estendido e seleção de coeficientes de transformada correspondendo à faixa de frequências de banda alta.
8. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a função não linear de processamento é selecionada dentre: uma primeira função não linear de processamento da pluralidade de funções não lineares de processamento que corresponde a uma função de potência de ordem inferior, e uma segunda função não linear de processamento da pluralidade de funções não lineares de processamento que corresponde a uma função de potência de ordem superior.
9. Método, de acordo com a reivindicação 1, caracterizado por compreender adicionalmente: determinar um parâmetro associado com um quadro do sinal de áudio de entrada, em que o parâmetro associado com o quadro compreende um dentre um modo de codificação escolhido para codificar o sinal de banda baixa, uma periodicidade do quadro, uma quantidade de ruído não periódico no quadro, ou uma inclinação espectral correspondendo ao quadro.
10. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o pelo menos um parâmetro de ajuste corresponde a pelo menos um parâmetro de ajuste de ganho associado com o sinal de banda alta.
12. Método compreendendo: receber, em um dispositivo, dados de banda baixa correspondendo a pelo menos um sinal de banda baixa de um sinal de áudio de entrada (502); decodificar os dados de banda baixa para gerar um sinal de áudio sintetizado de banda baixa (504); determinar um parâmetro indicando uma característica do sinal de banda baixa; selecionar uma função não linear de processamento de uma pluralidade de funções não lineares de processamento com base no parâmetro (506); gerar um sinal de áudio sintetizado de banda alta com base no sinal de áudio sintetizado de banda baixa e na função não linear de processamento (508); caracterizado pelo fato de que selecionar a primeira função não linear de processamento compreende selecionar uma primeira função não linear de processamento da pluralidade de funções não lineares de processamento em resposta à determinação de que o parâmetro associado com um quadro do sinal de áudio de entrada satisfaz uma primeira condição, e selecionar uma segunda função não linear de processamento da pluralidade de funções não lineares de processamento em resposta à determinação de que o parâmetro satisfaz uma segunda condição.
12. Aparelho compreendendo: meios para separar um sinal de áudio de entrada em pelo menos um sinal de banda baixa e um sinal de banda alta, o sinal de banda baixa correspondendo a uma faixa de frequências de banda baixa e o sinal de banda alta correspondendo a uma faixa de frequências de banda alta (402); meios para determinar um parâmetro indicando uma característica do sinal de banda baixa; meios para selecionar uma função não linear de processamento de uma pluralidade de funções não lineares de processamento com base no parâmetro (404); primeiros meios para gerar um primeiro sinal estendido com base no sinal de banda baixa e na função não linear de processamento (406); e segundos meios para gerar ao menos um parâmetro de ajuste com base no primeiro sinal estendido, no sinal de banda alta (408) ou ambos, para multiplexar em um fluxo de bits de saída caracterizado pelo fato de que a função não linear de processamento é selecionada a partir de: uma primeira função não linear de processamento da pluralidade de funções não lineares de processamento em resposta à determinação de que o parâmetro associado com um quadro do sinal de áudio de entrada satisfaz uma primeira condição, e uma segunda função não linear de processamento da pluralidade de funções não lineares de processamento em resposta à determinação de que o parâmetro satisfaz uma segunda condição.
13. Aparelho compreendendo: meios para receber dados de banda baixa correspondendo a pelo menos um sinal de banda baixa de um sinal de áudio de entrada (502); meios para decodificar os dados de banda baixa para gerar um sinal de áudio sintetizado de banda baixa (504); meios para determinar um parâmetro indicando uma característica do sinal de banda baixa; meios para selecionar uma função não linear de processamento de uma pluralidade de funções não lineares de processamento com base no parâmetro (506); e meios para gerar um sinal de áudio sintetizado de banda alta com base no sinal de áudio sintetizado de banda baixa e na função não linear de processamento (508); caracterizado pelo fato de que a função não linear de processamento é selecionada a partir de: uma primeira função não linear de processamento da pluralidade de funções não lineares de processamento em resposta à determinação de que o parâmetro associado com um quadro do sinal de áudio de entrada satisfaz uma primeira condição, e uma segunda função não linear de processamento da pluralidade de funções não lineares de processamento em resposta à determinação de que o parâmetro satisfaz uma segunda condição.
14. Memória legível por computador caracterizada pelo fato de que possui instruções nela armazenadas que, quando executadas, fazem com que um computador realize o método conforme definido em qualquer uma das reivindicações 1 a 11.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461939585P | 2014-02-13 | 2014-02-13 | |
US61/939,585 | 2014-02-13 | ||
US14/617,524 US9564141B2 (en) | 2014-02-13 | 2015-02-09 | Harmonic bandwidth extension of audio signals |
US14/617,524 | 2015-02-09 | ||
PCT/US2015/015242 WO2015123210A1 (en) | 2014-02-13 | 2015-02-10 | Harmonic bandwidth extension of audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
BR112016018575A2 BR112016018575A2 (pt) | 2017-08-08 |
BR112016018575B1 true BR112016018575B1 (pt) | 2022-08-23 |
Family
ID=53775460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112016018575-7A BR112016018575B1 (pt) | 2014-02-13 | 2015-02-10 | Extensão de largura de banda harmônica de sinais de áudio |
Country Status (25)
Country | Link |
---|---|
US (1) | US9564141B2 (pt) |
EP (1) | EP3105757B1 (pt) |
JP (1) | JP6290434B2 (pt) |
KR (1) | KR101827665B1 (pt) |
CN (1) | CN105981102B (pt) |
AU (1) | AU2015217340B2 (pt) |
BR (1) | BR112016018575B1 (pt) |
CA (1) | CA2936987C (pt) |
CL (1) | CL2016002009A1 (pt) |
DK (1) | DK3105757T3 (pt) |
ES (1) | ES2777282T3 (pt) |
HU (1) | HUE046891T2 (pt) |
IL (1) | IL246787B (pt) |
MX (1) | MX349848B (pt) |
MY (1) | MY180821A (pt) |
NZ (1) | NZ721890A (pt) |
PH (1) | PH12016501396B1 (pt) |
PL (1) | PL3105757T3 (pt) |
PT (1) | PT3105757T (pt) |
RU (1) | RU2651218C2 (pt) |
SA (1) | SA516371666B1 (pt) |
SG (1) | SG11201605412VA (pt) |
SI (1) | SI3105757T1 (pt) |
TW (1) | TWI559298B (pt) |
WO (1) | WO2015123210A1 (pt) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103516440B (zh) | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
KR20160087827A (ko) * | 2013-11-22 | 2016-07-22 | 퀄컴 인코포레이티드 | 고대역 코딩에서의 선택적 위상 보상 |
FR3020732A1 (fr) * | 2014-04-30 | 2015-11-06 | Orange | Correction de perte de trame perfectionnee avec information de voisement |
US20160180860A1 (en) * | 2014-12-23 | 2016-06-23 | Qualcomm Incorporated | High order B-spline sampling rate conversion (SRC) |
US9837089B2 (en) | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) * | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
BR112018067944B1 (pt) * | 2016-03-07 | 2024-03-05 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Unidade de ocultação de erro, método de ocultação de erro,decodificador de áudio, codificador de áudio, método para fornecer uma representação de áudio codificada e sistema |
EP3497697B1 (en) * | 2016-11-04 | 2024-01-31 | Hewlett-Packard Development Company, L.P. | Dominant frequency processing of audio signals |
EP3382703A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and methods for processing an audio signal |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
CN110322882A (zh) * | 2019-05-13 | 2019-10-11 | 厦门亿联网络技术股份有限公司 | 一种生成混合语音数据的方法及系统 |
CN113963703A (zh) * | 2020-07-03 | 2022-01-21 | 华为技术有限公司 | 一种音频编码的方法和编解码设备 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5129117B2 (ja) | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
WO2006116025A1 (en) | 2005-04-22 | 2006-11-02 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor smoothing |
US8311840B2 (en) | 2005-06-28 | 2012-11-13 | Qnx Software Systems Limited | Frequency extension of harmonic signals |
EP1772855B1 (en) * | 2005-10-07 | 2013-09-18 | Nuance Communications, Inc. | Method for extending the spectral bandwidth of a speech signal |
US9454974B2 (en) | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
EP1947644B1 (en) | 2007-01-18 | 2019-06-19 | Nuance Communications, Inc. | Method and apparatus for providing an acoustic signal with extended band-width |
KR101239812B1 (ko) * | 2008-07-11 | 2013-03-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 대역폭 확장 신호를 생성하기 위한 장치 및 방법 |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
RU2493618C2 (ru) * | 2009-01-28 | 2013-09-20 | Долби Интернешнл Аб | Усовершенствованное гармоническое преобразование |
JP4892021B2 (ja) * | 2009-02-26 | 2012-03-07 | 株式会社東芝 | 信号帯域拡張装置 |
TWI556227B (zh) * | 2009-05-27 | 2016-11-01 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US8447617B2 (en) * | 2009-12-21 | 2013-05-21 | Mindspeed Technologies, Inc. | Method and system for speech bandwidth extension |
PL2545551T3 (pl) * | 2010-03-09 | 2018-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
JP5777041B2 (ja) * | 2010-07-23 | 2015-09-09 | 沖電気工業株式会社 | 帯域拡張装置及びプログラム、並びに、音声通信装置 |
-
2015
- 2015-02-09 US US14/617,524 patent/US9564141B2/en active Active
- 2015-02-10 DK DK15706610.1T patent/DK3105757T3/da active
- 2015-02-10 BR BR112016018575-7A patent/BR112016018575B1/pt active IP Right Grant
- 2015-02-10 MX MX2016010358A patent/MX349848B/es active IP Right Grant
- 2015-02-10 CA CA2936987A patent/CA2936987C/en active Active
- 2015-02-10 WO PCT/US2015/015242 patent/WO2015123210A1/en active Application Filing
- 2015-02-10 CN CN201580007190.2A patent/CN105981102B/zh active Active
- 2015-02-10 MY MYPI2016702572A patent/MY180821A/en unknown
- 2015-02-10 TW TW104104441A patent/TWI559298B/zh active
- 2015-02-10 EP EP15706610.1A patent/EP3105757B1/en active Active
- 2015-02-10 SI SI201531104T patent/SI3105757T1/sl unknown
- 2015-02-10 AU AU2015217340A patent/AU2015217340B2/en active Active
- 2015-02-10 PL PL15706610T patent/PL3105757T3/pl unknown
- 2015-02-10 ES ES15706610T patent/ES2777282T3/es active Active
- 2015-02-10 KR KR1020167024534A patent/KR101827665B1/ko active IP Right Grant
- 2015-02-10 SG SG11201605412VA patent/SG11201605412VA/en unknown
- 2015-02-10 RU RU2016133008A patent/RU2651218C2/ru active
- 2015-02-10 HU HUE15706610A patent/HUE046891T2/hu unknown
- 2015-02-10 JP JP2016550268A patent/JP6290434B2/ja active Active
- 2015-02-10 NZ NZ721890A patent/NZ721890A/en unknown
- 2015-02-10 PT PT157066101T patent/PT3105757T/pt unknown
-
2016
- 2016-07-14 PH PH12016501396A patent/PH12016501396B1/en unknown
- 2016-07-14 IL IL246787A patent/IL246787B/en active IP Right Grant
- 2016-08-10 CL CL2016002009A patent/CL2016002009A1/es unknown
- 2016-08-11 SA SA516371666A patent/SA516371666B1/ar unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112016018575B1 (pt) | Extensão de largura de banda harmônica de sinais de áudio | |
ES2711524T3 (es) | Generación de señal de excitación de banda alta | |
US9858941B2 (en) | Selective phase compensation in high band coding of an audio signal | |
JP6976974B2 (ja) | オーディオ信号間のチャネル間位相差の符号化および復号 | |
BR112016013771B1 (pt) | Modelagem de sinal de banda elevada | |
BR112015019040B1 (pt) | Sistemas e métodos de realizar filtragem para determinação de ganho | |
BR112018002979B1 (pt) | Controle de sinal-alvo de banda alta | |
BR112016007938B1 (pt) | Estimação de fatores de mistura para gerar sinal de excitação de banda alta | |
BR112016030384B1 (pt) | Ajuste de ganho temporal baseado em característica de sinal de banda alta | |
ES2807258T3 (es) | Escalado para circuitería de forma de ganancia | |
BR112015019056B1 (pt) | Métodos, aparelho e memória legível por computador para realização de controle de ganho | |
BR112016007914B1 (pt) | Estimativa de formato de ganho para rastreamento aperfeiçoado de características temporais de banda alta | |
US20150149157A1 (en) | Frequency domain gain shape estimation | |
BR112015019042B1 (pt) | Método, equipamento e memória legível por computador para sintetizar sinal de banda alta em um dispositivo eletrônico | |
BR112016008236B1 (pt) | Método, aparelho, dispositivo, meio legível por computador para extensão de largura de banda de um sinal de áudio com uso de uma excitação de banda alta dimensionada | |
BR112019026971A2 (pt) | predição residual de banda alta com extensão de largura de banda inter-canal no domínio do tempo | |
BR112016030381B1 (pt) | Método e aparelho para codificar um sinal de áudio e memória legível por computador | |
BR112017015461B1 (pt) | Método de funcionamento de um aparelho; memória legível por computador e equipamento para realizar uma operação | |
BR112016030386B1 (pt) | Codificação de sinal de banda alta com o uso de faixas de frequência incompatíveis | |
EP3072130A1 (en) | Selective phase compensation in high band coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 10/02/2015, OBSERVADAS AS CONDICOES LEGAIS |