BRPI0306434B1 - Aparelho e método de decodificação de áudio - Google Patents

Aparelho e método de decodificação de áudio Download PDF

Info

Publication number
BRPI0306434B1
BRPI0306434B1 BRPI0306434-4A BR0306434A BRPI0306434B1 BR PI0306434 B1 BRPI0306434 B1 BR PI0306434B1 BR 0306434 A BR0306434 A BR 0306434A BR PI0306434 B1 BRPI0306434 B1 BR PI0306434B1
Authority
BR
Brazil
Prior art keywords
subband
signal
gain
spectral overlap
subband signal
Prior art date
Application number
BRPI0306434-4A
Other languages
English (en)
Other versions
BRPI0306434A8 (pt
BR0306434A (pt
Inventor
Tanaka Naoya
Shimada Osamu
Tsushima Mineo
Norimatsu Takeshi
Seng Chong Kok
Hann Kuah Kim
Nomura Toshiyuki
Takamizawa Yuichiro
Serizawa Masahiro
Hong Neo Sua
Original Assignee
Nec Corporation
Panasonic Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corporation, Panasonic Corporation filed Critical Nec Corporation
Publication of BR0306434A publication Critical patent/BR0306434A/pt
Publication of BRPI0306434A8 publication Critical patent/BRPI0306434A8/pt
Publication of BRPI0306434B1 publication Critical patent/BRPI0306434B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

"aparelho e método de decodificação de áudio". a presente invenção refere-se a um aparelho de decodificação de áudio que decodifica sinais de componente de alta freqüência usando um expansor de banda que gera múltiplos sinais de sub-banda de freqüência alta a partir dos sinais de sub-banda de freqüência baixa divididos em múltiplas sub-bandas e uma informação codificada de freqüência alta transmitida. o aparelho é provido com um detector de serrilhado e um removedor de serrilhado. o detector de serrilhado detecta o grau de ocorrência de componentes de serrilhado nos múltiplos sinais de sub-banda de freqüência alta gerados pelo expansor de banda. o removedor de serrilhado suprime componentes de serrilhado nos sinais de sub-banda de freqüência alta pelo ajuste do ganho usado para a geração dos sinais de sub-banda de freqüência alta. assim, uma ocorrência de serrilhado pode ser suprimida e a degradação resultante na qualidade do som pode ser reduzida, mesmo quando sinais de sub-banda de valor real forem usados, de modo a se reduzir o número de operações.

Description

(54) Título: APARELHO E MÉTODO DE DECODIFICAÇÃO DE ÁUDIO (51) Int.CI.: G10L 19/02; G10L 21/038 (52) CPC: G10L 19/0204,G10L 21/038 (30) Prioridade Unionista: 15/10/2002 JP 2002-300490, 19/09/2002 JP 2002-273557, 27/09/2002 JP 2002-283722 (73) Titular(es): NEC CORPORATION. PANASONIC CORPORATION (72) Inventor(es): NAOYATANAKA; OSAMU SHIMADA; MINEO TSUSHIMA; TAKESHI NORIMATSU; KOK SENG CHONG; KIM HANN KUAH; TOSHIYUKI NOMURA; YUICHIRO TAKAMIZAWA; MASAHIRO SERIZAWA; SUA HONG NEO
1/39
Relatório Descritivo da Patente de Invenção para APAREHO E MÉTODO DE DECODIFICAÇÃO DE ÁUDIO.
CAMPO TÉCNICO [001] A presente invenção refere-se a um aparelho de decodificação e a um método de decodificação para um sistema de expansão de largura de banda de áudio para a geração de um sinal de áudio de banda larga a partir de um sinal de áudio de banda estreita pelo uso de uma pequena quantidade de informação adicional, e se refere à tecnologia que permite uma decodificação de um sinal de áudio de alta qualidade com poucos cálculos.
TÉCNICA ANTERIOR [002] A codificação de divisão de largura de banda é um método comum de codificação de um sinal de áudio a uma taxa de bits baixa, enquanto se obtém um sinal de execução de alta qualidade. Isto é feito dividindo-se um sinal de áudio de entrada em sinais para várias bandas de frequência (sub-bandas) usando-se um filtro de divisão de banda, ou pela conversão do sinal de entrada em um sinal de domínio de frequência usando-se uma transformada de Fourier ou um outro algoritmo de conversão de tempo-frequência, então, dividindo-se o sinal em múltiplas sub-bandas no domínio da frequência, e alocando-se um bit de codificação apropriado a cada uma das divisões de largura de banda. A razão porque um sinal de execução de alta qualidade pode ser obtido a partir dos dados de taxa de bits baixa, usando-se uma codificação de divisão de largura de banda é que, durante o processo de codificação o sinal é processado com base em características de sentido acústico humano.
[003] A sensibilidade auditiva humana a uma frequência de aproximadamente 10 kHz ou mais geralmente cai, e níveis de som baixos tornam-se difíceis de escutar. Além disso, um fenômeno denominado mascaramento de frequência é bem-conhecido. Devido ao mascaraPetição 870180003203, de 12/01/2018, pág. 6/59
2/39 mento de frequência, quando há um alto nível de som em uma banda de frequência em particular, sons de nível baixo em bandas de frequência vizinhas tornam-se difíceis de serem audíveis. A alocação de bits e a codificação de sinais que são difíceis de serem detectados devido a tais características auditivas não têm substancialmente nenhum efeito sobre a qualidade do sinal de execução e, portanto, a codificação de tais sinais é sem significado. Inversamente, tomando-se os bits de código alocados para esta banda sem significado em termos auditivos e realocando-se os bits para sub-bandas sensíveis em termos auditivos, sinais sensíveis em termos auditivos podem ser codificados com maior detalhe, desse modo efetivamente melhorando-se a qualidade do sinal de execução.
[004] Um exemplo de tal codificação usando divisão de banda é MPEG-4 AAC (ISO/IEC 14496-3) por norma internacional, o que permite uma codificação de alta qualidade de um sinal estéreo de banda larga de 16 kHz ou mais a uma taxa de bit de aproximadamente 96 kbps.
[005] Se a taxa de bit for diminuída, por exemplo, para aproximadamente 48 kbps, apenas uma largura de banda de 10 kHz ou mais curta pode ser codificada com alta qualidade, resultando em um som abafado. Um método de compensação para a qualidade de som degradada resultante de tal limitação de largura de banda é denominado SBR (replicação de banda espectral) e é descrito na Especificação de Sistema Mundial de Rádio Digital (DRM) (ETSI TS 101 980) publicada pelo Instituto Europeu de Normas de Telecomunicação (ETSI). Uma tecnologia similar também é mostrada, por exemplo, nos artigos de convenção da AES (Sociedade de Engenharia de Áudio) 5553, 5559, 5560 (112a Convenção, 10 a 13 de maio de 2002, Munique, Alemanha).
[006] A SBR visa compensar os sinais de banda de alta frequênPetição 870180003203, de 12/01/2018, pág. 7/59
3/39 cia (referidos como componentes de alta frequência) que são perdidos pelo processo de codificação de áudio, tal como AAC ou um processo de limitação de banda equivalente. Os sinais em bandas de frequência abaixo da banda de SBR compensada (também denominados componentes de baixa frequência) devem ser transmitidos por algum outro meio. Uma informação para a geração de um componente de frequência pseudo-alta com base nos componentes de frequência baixa transmitidos pode outros meios está contida nos dados de SBR codificada e uma degradação de áudio devido a uma limitação de banda pode ser compensada pela adição deste componente de frequência pseudo-alta aos componentes de frequência baixa.
[007] A figura 7 é um digrama esquemático de um decodificador para expansão de banda de SBR, de acordo com a técnica anterior. O fluxo de bit de entrada 106 é separado em uma informação de componente de frequência baixa 107, uma informação de componente de frequência alta 108 e uma informação adicionada 109. A informação de componente de frequência baixa 107, por exemplo, é uma informação codificada usando-se MPEG-4 AAC ou um outro método de codificação, e é decodificada para a geração de um sinal de tempo representando o componente de frequência baixa. Este sinal de tempo representando o componente de frequência baixa é dividido em múltiplas sub-bandas por um banco de filtro de análise 103.
[008] O banco de filtro de análise 103, geralmente, é um banco de filtro que usa coeficientes de valor complexo, e o sinal de subbanda dividido é representando como um sinal de valor complexo. Um expansor de banda 104 compensa o componente de frequência alta perdida devido à limitação de largura de banda pela cópia de sinais de sub-banda de frequência baixa representando os componentes de frequência baixa para as sub-bandas de frequência alta. A informação de componente de frequência alta 108 introduzida no expansor de banda
Petição 870180003203, de 12/01/2018, pág. 8/59
4/39
104 contém uma informação de ganho para a sub-banda de frequência alta compensada, de modo que um ganho seja ajustado para cada sub-banda de frequência alta gerada.
[009] O sinal de sub-banda de frequência alta gerado pelo expansor de banda 104, então, é introduzido com o sinal de sub-banda de frequência baixa no banco de filtro de síntese 105 para síntese de banda, e um sinal de saída 110 é gerado. Devido ao fato de os sinais de sub-banda introduzidos no banco de filtro de síntese 105 serem, geralmente, sinais de valor complexo, um banco de filtro de coeficiente de valor complexo é usado como o banco de filtro de síntese 105. DESCRIÇÃO DA INVENÇÃO [0010] O decodificador configurado como acima para expansão de banda requer muitas operações no processo de decodificação, uma vez que dois bancos de filtro incluindo o banco de filtro de análise e o banco de filtro de síntese realizam cálculos de valor complexo. Assim sendo, quando o decodificador é implementado usando-se circuitos integrados, há um problema de o consumo de energia aumentar e o tempo de execução que é possível com uma dada capacidade de suprimento de energia diminuir.
[0011] Os sinais decodificados que são realmente extraídos para o banco de filtro de síntese são sinais de valor real e, assim, o banco de filtro de síntese pode ser configurado com bancos de filtro de valor real, de modo a se reduzir o número de operações realizadas para a decodificação. Entretanto, devido ao fato de as características de um banco de filtro de síntese (um banco de filtro de síntese de coeficiente de valor real), que realiza apenas operações de valor real, diferirem daquelas de um banco de filtro de síntese (um banco de filtro de síntese de coeficiente de valor complexo), que realiza operações de valor complexo como na técnica anterior, o banco de filtro de síntese de valor complexo não pode ser simplesmente substituído por um banco de
Petição 870180003203, de 12/01/2018, pág. 9/59
5/39 filtro de síntese de valor real.
[0012] As figuras 8A a 8E mostram as características de um banco de filtro de coeficiente de valor complexo e de um banco de filtro de coeficiente de valor real. Um sinal de tom de qualquer dada frequência tem um espectro de linha única, como mostrado na figura 8A. Quando um sinal de entrada contendo este sinal de tom 201 é dividido em múltiplas sub-bandas pelo banco de filtro de análise, o espectro de linha denotando o sinal de tom 201 está contido em um sinal de sub-banda particular único. Idealmente, sinais contidos na sub-banda m, por exemplo, denotam apenas sinais na banda de frequência de mp/M para (m+1)p/M.
[0013] Com um banco de filtro de análise real, contudo, os sinais de sub-bandas adjacentes a uma dada sub-banda são contidos na dada sub-banda, de acordo com a característica de frequência do filtro de divisão de banda. A figura 8B mostra um exemplo de um banco de filtro de coeficiente de valor complexo usado como o banco de filtro de análise. Neste caso, o sinal de tom 201 aparece como um sinal de valor complexo, e está contido no sinal de sub-banda m 203 como mostrado pela linha sólida na figura, e o sinal de sub-banda m-1 204, como mostrado pela linha pontilhada. Note que o sinal de tom contido em ambas as sub-bandas ocupa a mesma localização no eixo de frequência. O processo de geração de sinal de sub-banda de frequência alta copia ambos os sinais de sub-banda para uma sub-banda de frequência alta e ajusta o ganho de cada sub-banda, mas se o ganho diferir para cada sub-banda, o sinal de tom 201 também terá uma amplitude diferente em cada sub-banda.
[0014] Esta mudança de amplitude de sinal de tom permanece como um erro de sinal após a filtração de síntese, mas porque os sinais de tom ocupam a mesma localização no eixo de frequência em ambos os sinais de sub-banda, o efeito deste erro de sinal aparece
Petição 870180003203, de 12/01/2018, pág. 10/59
6/39 apenas como uma mudança de amplitude no sinal de tom 201 com o método convencional, usando um banco de filtro de coeficiente de valor complexo como o filtro de síntese. Este erro, portanto, tem pouco efeito sobre a qualidade do sinal de saída.
[0015] Quando um banco de filtro de coeficiente de valor real é usado como o filtro de síntese, contudo, o sinal de sub-banda de valor complexo extraído pelo banco de filtro de análise de coeficiente de valor complexo deve, primeiramente, ser convertido em um sinal de subbanda de valor real. Isso pode ser feito, por exemplo, pela rotação do eixo de valor real e eixo de valor imaginário do sinal de sub-banda de valor complexo (p/4), uma operação que é a mesma derivação de um DCT a partir de uma DFT. O formato de sinais contidos nas mudanças de sub-banda com este processo de conversão em um sinal de subbanda de valor real.
[0016] A figura 8C mostra uma mudança no sinal de sub-banda (m-1) indicado pela linha pontilhada. O espectro de sinais contidos na sub-banda (m-1) é simétrico ao eixo da fronteira de sub-banda 202, como resultado da conversão em um sinal de sub-banda de valor real. Um sinal conhecido como um componente de imagem do sinal de tom 201 contido no sinal de sub-banda de valor complexo original, portanto, aparece em uma posição simétrica à fronteira de sub-banda 202. Um componente de imagem similar 205 também aparece para sinais na sub-banda m, e à medida que não existe nenhuma carga no ganho de sub-banda (m-1) e sub-banda m, esses componentes de imagem cancelam uma à outra no processo de filtragem de síntese e não aparecem no sinal de saída.
Como mostrado na figura 8D, contudo, quando há uma diferença de ganho 206 em cada sub-banda no processo de geração de sinal de sub-banda de alta frequência, o componente de imagem 205 não é completamente cancelado e aparece como um sinal de erro, denomiPetição 870180003203, de 12/01/2018, pág. 11/59
7/39 nado sobreposição espectral, no sinal de saída. Como mostrado na figura 8E, este componente de sobreposição espectral 207 aparece onde um sinal normalmente não deve estar (isto é, em uma posição simétrica com o sinal de tom original através da fronteira de sub-banda 202), e, assim, tem um grande efeito sobre a qualidade de som do sinal de saída. Particularmente, quando o sinal de tom está próximo da fronteira de sub-banda em que uma atenuação pelo filtro de divisão de banda é insuficiente, a amplitude do componente de sobreposição espectral gerado aumenta, desse modo causando uma degradação significativa na qualidade de som do sinal de saída.
(MEIOS PARA A RESOLUÇÃO DOS PROBLEMAS) [0017] A presente invenção, portanto, é dirigida à resolução desses problemas da técnica anterior, e provê uma tecnologia para a redução do número de operações realizadas no processo de decodificação pelo uso de um banco de filtro de síntese de coeficiente de valor real, supressão de sobreposição espectral e melhoria da qualidade de som do sinal de saída.
[0018] Um aparelho de decodificação de áudio, de acordo com a invenção, é um aparelho para a decodificação de um sinal de áudio de banda larga a partir de um fluxo de bit contendo uma informação codificada para um sinal de áudio de banda estreita.
[0019] Em um primeiro aspecto da invenção, o aparelho inclui: um demultiplexador de fluxo de bit que demultiplexa uma informação codificada a partir do fluxo de bit; um decodificador que decodifica um sinal de áudio de banda estreita a partir da informação codificada demultiplexada; um banco de filtro de análise que divide o sinal de áudio de banda estreita decodificado em múltiplos primeiros sinais de subbanda; um expansor de banda que gera múltiplos segundos sinais de sub-banda a partir de pelo menos um primeiro sinal de sub-banda, cada segundo sinal de sub-banda tendo uma banda de frequência mais
Petição 870180003203, de 12/01/2018, pág. 12/59
8/39 alta do que a banda de frequência dos primeiros sinais de sub-banda; um removedor de sobreposição espectral que ajusta um ganho do segundo sinal de sub-banda de modo a suprimir os componentes de sobreposição espectral que ocorrem nos segundos sinais de sub-banda; e um banco de filtro de síntese de cálculo de valor real que sintetiza o primeiro sinal de sub-banda e o segundo sinal de sub-banda para a obtenção de um sinal de áudio de banda larga.
[0020] Em um segundo aspecto da invenção, o aparelho inclui: um demultiplexador de fluxo de bit que demultiplexa uma informação codificada a partir do fluxo de bit; um decodificador que decodifica um sinal de áudio de banda estreita a partir da informação codificada demultiplexada; um banco de filtro de análise que divide o sinal de áudio de banda estreita decodificado em múltiplos primeiros sinais de subbanda; um expansor de banda que gera múltiplos segundos sinais de sub-banda a partir de pelo menos um primeiro sinal de sub-banda, cada segundo sinal de sub-banda tendo uma banda de frequência mais alta do que a banda de frequência dos primeiros sinais de sub-banda; um detector de sobreposição espectral, que detecta um grau de ocorrência de componentes de sobreposição espectral nos múltiplos segundos sinais de sub-banda gerados pelo expansor de banda; um removedor de sobreposição espectral que ajusta um ganho do segundo sinal de sub-banda, com base no nível detectado dos componentes de sobreposição espectral, para suprimir os componentes de sobreposição espectral; e um banco de filtro de síntese de cálculo de valor real que sintetiza o primeiro sinal de sub-banda e o segundo sinal de subbanda para a obtenção de um sinal de áudio de banda larga. (VANTAGENS DA INVENÇÃO EM RELAÇÃO À TÉCNICA ANTERIOR) [0021] Assim compreendida, a invenção suprime a sobreposição espectral no sinal de sub-banda de valor real, devido a um ganho difePetição 870180003203, de 12/01/2018, pág. 13/59
9/39 rente ser aplicado a cada sub-banda de frequência alta no processo gerando sinais de sub-banda de frequência alta a partir de sinais de sub-banda de frequência baixa e, assim, suprime a degradação de áudio devido à sobreposição espectral.
BREVE DESCRIÇÃO DOS DESENHOS [0022] A figura 1 é um diagrama de blocos esquemático que mostra um exemplo de um aparelho de decodificação de áudio de acordo com a presente invenção (uma primeira modalidade);
[0023] a figura 2 é um diagrama de blocos esquemático que mostra um exemplo de um aparelho de decodificação de áudio de acordo com a presente invenção (uma segunda modalidade);
[0024] a figura 3 descreve um exemplo de um método para a detecção de sobreposição espectral em um aparelho de decodificação de áudio de acordo com a presente invenção;
[0025] a figura 4A e a figura 4B descrevem um método para a detecção de sobreposição espectral em um aparelho de decodificação de áudio de acordo com a presente invenção;
[0026] a figura 5 é um diagrama de blocos esquemático que mostra um exemplo de um aparelho de decodificação de áudio de acordo com a presente invenção (uma quarta modalidade);
[0027] a figura 6 é um diagrama de blocos esquemático que mostra um exemplo de um aparelho de decodificação de áudio de acordo com a presente invenção (uma quinta modalidade);
[0028] a figura 7 é um diagrama de blocos esquemático que mostra um aparelho de decodificação de áudio de acordo com a técnica anterior; e [0029] as figuras 8A a 8E são vistas que descrevem como as componentes de sobreposição espectral são produzidas.
MELHOR MODO PARA A REALIZAÇÃO DA INVENÇÃO [0030] As modalidades preferidas de um aparelho de decodificaPetição 870180003203, de 12/01/2018, pág. 14/59
10/39 ção de áudio e de um método de decodificação de áudio de acordo com a presente invenção são descritas abaixo, com referência às figuras em anexo.
MODALIDADE 1 [0031] A figura 1 é um diagrama de blocos esquemático que mostra um aparelho de decodificação de acordo com uma primeira modalidade da presente invenção.
[0032] Este aparelho de decodificação tem um demultiplexador de fluxo de bit 101, um decodificador de frequência baixa 102, um banco de filtro de análise 103, um expansor de banda (meio de expansão de banda) 104, um banco de filtro de síntese 105, um removedor de sobreposição espectral 113 e um gerador de sinal adicional 111.
[0033] O demultiplexador de fluxo de bit 101 recebe um fluxo de bit de entrada 106 e demultiplexa o fluxo de bit 106 em uma informação de componente de frequência baixa 107, uma informação de componente de frequência alta 108 e uma informação de sinal adicional 109. A informação de componente de frequência baixa 107 foi codificada usando-se o método de codificação MPEG-4 AAC, por exemplo. O decodificador de frequência baixa 102 decodifica a informação de componente de frequência baixa 107 e gera um sinal de tempo representando o componente de frequência baixa.
[0034] O sinal de tempo resultante representando o componente de frequência baixa, então, é dividido em múltiplas (M) sub-bandas pelo banco de filtro de análise 103, e introduzido no expansor de banda 104. O banco de filtro de análise 103 é um banco de filtro de coeficiente de valor complexo, e os sinais de sub-banda produzidos pelo banco de filtro de análise 103 são representados por sinais de valor complexo.
[0035] O expansor de banda 104 copia o sinal de sub-banda de frequência baixa representando o componente de frequência baixa paPetição 870180003203, de 12/01/2018, pág. 15/59
11/39 ra uma sub-banda de frequência alta para compensação dos componentes de frequência alta perdidos pela limitação de largura de banda. A informação de componente de frequência alta 108 introduzida no expansor de banda 104 contém uma informação de ganho para que a sub-banda de frequência alta seja compensada, e o ganho é ajustado para cada sub-banda de frequência alta gerada.
[0036] O gerador de sinal adicional 111 gera um sinal adicional de ganho controlado 112 de acordo com a informação adicionada 109, e o adiciona a cada sinal de sub-banda de frequência alta. Um sinal de tom seno ou um sinal de ruído é usado como o sinal adicional gerado pelo gerador de sinal adicional 111.
[0037] O sinal de sub-banda de frequência alta gerado pelo expansor de banda 104 é introduzido com o sinal de sub-banda de frequência baixa no banco de filtro de síntese 105 para síntese de banda, resultando no sinal de saída 110. Este banco de filtro de síntese 105 é um banco de filtro de coeficiente de valor real. O número de subbandas usadas no banco de filtro de síntese 105 não precisa combinar com o número de sub-bandas no banco de filtro de análise 103. Por exemplo, se, na figura 1, N = 2M, a frequência de amostragem do sinal de saída será duas vezes a frequência de amostragem do sinal de tempo introduzido no banco de filtro de análise.
[0038] Devido ao fato de apenas uma informação relativa ao controle de ganho estar contida na informação de componente de frequência alta 108 ou na informação de sinal adicional 109, uma taxa de bit extremamente baixa pode ser usada, se comparado com a informação de componente de frequência baixa 107 contendo a informação de espectro. Esta configuração, portanto, é adequada para a codificação de um sinal de banda larga a uma taxa de bit baixa.
[0039] O aparelho de decodificação mostrado na figura 1 também tem um removedor de sobreposição espectral 113. O removedor de
Petição 870180003203, de 12/01/2018, pág. 16/59
12/39 sobreposição espectral 113 introduz a informação de componente de frequência alta 108 e ajusta a informação de ganho nos dados de componente de frequência alta, para supressão da sobreposição espectral pelo banco de filtro de síntese de coeficiente de valor real 105. O expansor de banda 104 usa o ganho ajustado para gerar os sinais de sub-banda de frequência alta.
[0040] Os sinais de sub-banda introduzidos no banco de filtro de síntese 105 nesta modalidade devem ser sinais de valor real, mas uma conversão de um sinal de valor complexo em um sinal de valor real pode ser feita facilmente, por uma operação de rotação de fase, usando-se um método geralmente conhecido na técnica.
[0041] A operação do removedor de sobreposição espectral 113 é descrita em detalhes abaixo.
[0042] Como descrito acima, quando um banco de filtro de coeficiente de valor real é usado como o banco de filtro de síntese, uma causa de sobreposição espectral é que os sinais de sub-banda adjacentes são ajustados com níveis de ganho diferentes no processo de geração de sinal de frequência alta. Se o mesmo ganho for usado para todos os sinais de sub-banda adjacentes, o componente de sobreposição espectral pode ser completamente removido. Neste caso, contudo, a informação de ganho transmitida como o componente de frequência alta não é refletida, um ganho de componente de frequência alta não combina e a qualidade do sinal de saída se degrada. O removedor de sobreposição espectral 113, portanto, deve referenciar a informação de ganho transmitida como a informação de componente de frequência alta, para o ajuste do ganho, de modo que os componentes de sobreposição espectral sejam reduzidos para um nível inaudível, desse modo impedindo uma degradação de áudio causada por componentes de sobreposição espectral e uma degradação de áudio causada pela não-combinação do ganho nos componentes de frequência alta.
Petição 870180003203, de 12/01/2018, pág. 17/59
13/39 [0043] Com base no fato de que os componentes de sobreposição espectral crescem conforme a diferença de ganho entre as subbandas adjacentes cresce, o removedor de sobreposição espectral 113 nesta modalidade da presente invenção regula um limite para a diferença de ganho entre as sub-bandas adjacentes, para a redução do efeito do componente de sobreposição espectral resultante.
[0044] Por exemplo, o removedor de sobreposição espectral 113 ajusta g[m] para todo m, para satisfação das relações a seguir:
g[m] < a*g[m-1] g[m] < a*g[m+1] [0045] onde g[m-1], g[m] e g[m+1] são os ganhos para as três subbandas consecutivas m-1, m, m+1, e a determina o limite superior para a relação de ganho entre sub-bandas adjacentes, e é aproximadamente 2,0. O valor do coeficiente a pode ser o mesmo para todas as sub-bandas m, ou um a diferente pode ser usado para subbandas m diferentes. Por exemplo, um a relativamente baixo pode ser aplicado às sub-bandas de frequência baixa, onde o efeito audível da sobreposição espectral é grande, e um a relativamente alto pode ser aplicado às sub-bandas de frequência alta, onde os efeitos de sobreposição espectral são relativamente fracos.
[0046] Este ajuste de ganho suprime o efeito do componente de sobreposição espectral e, assim, melhora a qualidade do som audível, porque limita a diferença de ganho entre sub-bandas adjacentes. Além disso, a distribuição de ganho de sinais de sub-banda de componente de frequência alta diferirá da distribuição de ganho com base na informação de ganho transmitida, mas as sub-bandas afetadas são apenas aquelas sub-bandas em que a relação de ganho com a sub-banda adjacente é significativamente alta. Além disso, devido ao fato de a mesma relação de ganho de sub-banda também ser mantida nos níveis de ganho ajustados, uma degradação de qualidade de som deviPetição 870180003203, de 12/01/2018, pág. 18/59
14/39 do a uma não-combinação de ganho nos sinais de sub-banda de frequência alta pode ser suprimida.
[0047] Além da limitação da relação de ganho entre sub-bandas adjacentes, um ajuste de ganho poderia ajustar o ganho usando o ganho médio de múltiplas sub-bandas. O uso do ganho médio das três sub-bandas é descrito em seguida, a título de exemplo. Neste caso, um ganho g'[m] para a sub-banda m após um ajuste de ganho pode ser obtido para satisfazer à relação a seguir:
g'[m]= (g[m-1]+g[m]+g[m+1])/3 [0048] onde g[m-1], g[m] e g[m+1] são os ganhos para as três subbandas consecutivas m-1, m, m+1 recebidas como os componentes de frequência alta.
[0049] Além disso, devido ao fato de o ganho ajustado g'[m-1] para a sub-banda m-1 poder ser usado para se ajustar, seqüencialmente, o nível de ganho começando a partir da sub-banda de frequência baixa, o ganho g'[m] pode ser obtido a partir da equação a seguir.
g'[m]= (g'[m-1]+g[m]+g[m+1])/3 [0050] Devido ao fato de as variações de ganho entre as subbandas poderem ser suavizadas e a diferença de ganho entre as subbandas adjacentes poder ser reduzida pelo ajuste do ganho, como descrito acima, os componentes de sobreposição espectral podem ser suprimidos e uma qualidade de som audível pode ser melhorada. Além disso, este processo de suavização torna a distribuição de ganho de diferentes sinais de sub-banda de frequência alta diferente da distribuição de ganho com base na informação de ganho transmitida, mas o formato da distribuição de ganho antes da suavização é retido após a suavização, e uma degradação de áudio devido a uma nãocombinação de ganho nos sinais de sub-banda de frequência alta também pode ser suprimida.
[0051] Deve ser notado que uma média simples do ganho de múlPetição 870180003203, de 12/01/2018, pág. 19/59
15/39 tiplas sub-bandas é usada no processo de suavização de ganho descrito acima, mas uma média ponderada, onde um coeficiente de peso predeterminado é primeiramente aplicado a cada nível de ganho, antes do cálculo da média, poderia ser usada.
[0052] Para se impedir o nível de ganho de tornar-se alto demais, como resultado do processo de suavização, embora o nível de ganho original fosse muito baixo, também é possível quando o nível de ganho original for menor do que um valor de limite predeterminado não aplicar uma suavização e usar a regulagem de ganho não ajustada original.
MODALIDADE 2 [0053] A figura 2 é um desenho esquemático de um aparelho de decodificação de acordo com uma segunda modalidade da presente invenção. Esta modalidade difere da configuração mostrada na figura 1 na adição de um meio de detecção de sobreposição espectral (detector de sobreposição espectral) 315, para a detecção de sub-bandas em que há uma alta probabilidade de componentes de sobreposição espectral serem introduzidos. Os dados de detecção 316 extraídos do detector de sobreposição espectral 315 são introduzidos no removedor de sobreposição espectral 313, o qual, então, ajusta o ganho dos componentes de frequência alta, com base nos dados de detecção 316.
[0054] A operação do aparelho de decodificação de acordo com esta segunda modalidade é a mesma que aquela da primeira modalidade, exceto pelo relativo ao detector de sobreposição espectral 315 e ao removedor de sobreposição espectral 313. Apenas a operação do detector de sobreposição espectral 315 e do removedor de sobreposição espectral 313, portanto, é descrita abaixo.
[0055] O princípio de operação do detector de sobreposição espectral 315 é descrito primeiramente.
Petição 870180003203, de 12/01/2018, pág. 20/59
16/39 [0056] A sobreposição espectral não pode ser logicamente evitado à medida que os sinais de sub-banda de valor real são usados, mas a quantidade de degradação de áudio causada pela sobreposição espectral difere grandemente de acordo com o aspecto dos sinais contidos no sinal de sub-banda. Como descrito com referência à figura 8, os componentes de sobreposição espectral aparecem em um local diferente do que o sinal original, mas se os sinais originais na mesma área forem fortes, o efeito dos componentes de sobreposição espectral é mascarado e os componentes de sobreposição espectral têm menos efeito prático sobre a qualidade do som. Inversamente, se os componentes de sobreposição espectral aparecerem onde um sinal não estava originalmente presente, apenas os componentes de sobreposição espectral serão audíveis e seu efeito sobre a qualidade do som é grande. Portanto, é possível conhecer quanto é o efeito de componentes de sobreposição espectral pela detecção da força do sinal em torno de onde os componentes de sobreposição espectral aparecem. [0057] Contudo, a distribuição de frequência dos sinais de subbanda deve ser determinada pelo uso de uma transformada de Fourier ou de um outro processo de conversão de frequência, por exemplo, de modo a se detectar a localização dos componentes de sobreposição espectral a serem gerados e a força dos sinais circundantes originais. O problema é que esta operação não é prática devido às computações requeridas. A invenção, portanto, usa um método de detecção do efeito de sobreposição espectral com poucas computações, pelo uso de um parâmetro que denota a inclinação da distribuição de frequência do sinal de sub-banda. Uma premissa deste método é que o efeito de sinais (sinais de ruído) com uma distribuição de frequência ampla em uma dada sub-banda será ignorado, porque mesmo se a sobreposição espectral ocorrer, o efeito é pequeno, devido ao fenômeno de mascaramento descrito acima.
Petição 870180003203, de 12/01/2018, pág. 21/59
17/39 [0058] A relação entre a posição de um sinal de tom e quaisquer componentes de sobreposição espectral resultantes é como descrita acima com referência à figura 8 para os sinais (sinais de tom) com uma distribuição de frequência limitada, e o efeito de sobreposição espectral quando o sinal de tom está próximo da fronteira de sub-banda é grande.
[0059] A figura 3 mostra a relação entre a posição de sinal de tom e a inclinação da distribuição de frequência da sub-banda contendo o sinal de tom. Na figura 3, o sinal de tom 401 e sua imagem 402 estão contidos no sinal de sub-banda m-1 403 e no sinal de sub-banda m 404, e um sinal de tom 401 e uma imagem 402 estão localizados simetricamente na fronteira de sub-banda 405.
[0060] Quando o sinal de tom 401 está próximo da fronteira de sub-banda 405, ambos o sinal de tom 401 e sua imagem 402 estão no lado de frequência alta de sub-banda m-1. A inclinação da distribuição de frequência 406 da sub-banda m-1, portanto, é positiva. Se o sinal de tom 401 estiver deslocado para o lado de frequência alta a partir da fronteira de sub-banda 405, sua imagem 402 se move na direção oposta (isto é, na direção de frequência baixa), a inclinação da distribuição de frequência de sub-banda m-1 torna-se mais gradual e, eventualmente, vai para o negativo. A inclinação da distribuição de frequência 407 da sub-banda m, da mesma forma, muda de negativo para positivo. Isso significa que se a inclinação da distribuição de frequência para a sub-banda m-1 for positiva e a inclinação da distribuição de frequência para a sub-banda m for negativa, um sinal de tom e sua imagem simétrica estão ambos, provavelmente, presentes próximos da fronteira de sub-banda 405.
[0061] Um coeficiente de predição linear (LPC) e um coeficiente de reflexão podem ser usados como parâmetros que podem ser facilmente calculados e denotam a inclinação da distribuição de frequência de
Petição 870180003203, de 12/01/2018, pág. 22/59
18/39 sinal de sub-banda. O coeficiente de reflexão de primeira ordem obtido pela equação a seguir é usado como este parâmetro, a título de exemplo:
- E{x(m,i) - x*(m,i -1)} k1[m] = —iE{x(m,i) - x*(m,i)} i [0062] onde x(m,i) denota o sinal de sub-banda m e i denota a amostra de tempo, e x*(m,i) denota o conjugado complexo de x(m,i) e k1[m] denota o coeficiente de reflexão de primeira ordem da subbanda m.
[0063] Devido ao fato de o coeficiente de reflexão primário ser positivo, quando a inclinação da distribuição de frequência é positiva, e ser negativo quando a inclinação é negativa, a probabilidade de uma sobreposição espectral ocorrer na fronteira entre as sub-bandas m-1 e m pode ser determinada como sendo alta se k1[m-1] for positivo e k[m] for negativo.
[0064] Entretanto, se um QMF comum (filtro de espelho de quadratura) for usado como o filtro de divisão de sub-banda, a distribuição de frequência inverte entre sub-bandas pares e sub-bandas ímpares, devido às características do filtro. Considerando-se isto, as condições para a detecção de sobreposição espectral podem ser estabelecidas como se segue.
[0065] Quando m é par: k1[m-1] < 0 e k1[m] < 0 [0066] Quando m é ímpar: k1[m-1] > 0 e k1[m] > 0 [0067] Esta condição é referida abaixo como a condição de detecção 1. A condição de detecção 1 define as condições usadas para a detecção se houver qualquer sobreposição espectral entre duas subbandas adjacentes. Quando a condição de detecção 1 é aplicada, uma sobreposição espectral não será detectada duas vezes para duas subbandas consecutivas m e m+1, porque as condições não podem ser satisfeitas simultaneamente para m par e m ímpar.
Petição 870180003203, de 12/01/2018, pág. 23/59
19/39 [0068] A banda de passagem de um QMF, geralmente, se espalha para três sub-bandas, isto é, a sub-banda desejada e as sub-bandas em cada um dos lados. Neste caso, se houver um sinal de tom próximo do centro da sub-banda desejada, ou houver um sinal de tom em ambas as faixas de frequência alta e baixa na sub-banda desejada, um componente de imagem aparecerá nas sub-bandas em um dos lados da sub-banda desejada.
[0069] A figura 4A e a figura 4B mostram a distribuição de frequência quando há um sinal de tom nas faixas de frequência baixa e alta de uma dada sub-banda. Na figura 4A, há sinais de tom 501 e 502 em ambas as faixas de frequência baixa e alta da sub-banda m-1, e há sinais de tom 511 e 512 na figura 4B. Os componentes de imagem dos sinais de tom 501 e 511 na faixa de frequência baixa da sub-banda m1 aparecem como os sinais 503 e 513, respectivamente, na sub-banda m-2. Os componentes de imagem dos sinais de tom 502, 512 na faixa de frequência alta da sub-banda m-1 aparecem como os sinais 504 e 514, respectivamente, na sub-banda m.
[0070] Como mostrado pela distribuição de frequência 506 na figura 4A e a distribuição de frequência 516 na figura 4B, a inclinação da distribuição de frequência de sub-banda m-1 é determinada pela relação de energia dos sinais de tom de frequência baixa e alta. Portanto, não é possível detectar uma sobreposição espectral através das três sub-bandas usando-se a condição de detecção 1, a qual é aplicada para a detecção de sobreposição espectral entre duas sub-bandas, usando-se o sinal do coeficiente de reflexão de sub-banda m-1. Por outro lado, na sub-banda m-2 e na sub-banda m, o sinal da inclinação da distribuição de frequência é determinado estável pelos componentes de imagem, como mostrado pelas distribuições de frequência 505 e 507 na figura 4A e pelas distribuições de frequência 515 e 517 na figura 4B, independentemente da relação de energia entre os sinais de
Petição 870180003203, de 12/01/2018, pág. 24/59
20/39 tom de frequência baixa e alta na sub-banda m-1.
[0071] Isso pode ser aplicado para a regulagem de condições para a detecção de sobreposição espectral através das três sub-bandas, usando-se os coeficientes de reflexão de sub-banda m-2 e sub-banda
m.
[0072] Quando m é par: k1[m-2] > 0 e k1[m] < 0 [0073] Quando m é ímpar: k1[m-2] < 0 e k1[m] > 0 [0074] Estes são referenciados abaixo como a condição de detecção 2.
[0075] Entretanto, uma sobreposição espectral através de três sub-bandas torna-se um problema quando a inclinação da distribuição de frequência na sub-banda m-2 e na sub-banda m é alta, e erros de detecção aumentam apenas quando a condição de detecção 2 é aplicada. A inclinação da distribuição de frequência nas sub-bandas m-2 e m muda dependendo da relação de energia entre os sinais de tom nas faixas de frequência baixa e alta de sub-banda m-1.
[0076] Isto é, se a energia do sinal de tom na faixa de frequência baixa de sub-banda m-1 for baixa, se comparada com a energia do sinal de tom na faixa de frequência alta (o caso mostrado na figura 4A), o valor absoluto de coeficiente de reflexão k1[m-2] para a subbanda m-2 será menor do que o valor absoluto de coeficiente de reflexão k1[m] de sub-banda m. Inversamente, quando a energia do sinal de tom de frequência baixa na sub-banda m-1 é maior do que a energia do sinal de tom de frequência alta (o caso mostrado na figura 4B), o valor absoluto de coeficiente de reflexão k1[m-2] de sub-banda m-2 é maior do que o valor absoluto de coeficiente de reflexão k1[m] da subbanda m. Esta característica é referida abaixo como a característica 1.
[0077] Portanto, é desejável simultaneamente considerar a inclinação da distribuição de frequência em ambas a sub-banda m-2 e a subPetição 870180003203, de 12/01/2018, pág. 25/59
21/39 banda m. Além disso, usando-se o fato de que o valor absoluto do coeficiente de reflexão é de 0 a 1, as condições para a detecção de sobreposição espectral através de três sub-bandas, preferencialmente, em primeiro lugar, satisfazem à condição de detecção 2 acima e, também, satisfazem às condições a seguir:
[0078] Quando m é par: k1[m-2] - k1[m] > T [0079] Quando m é ímpar: k1[m] - k1[m-2] > T [0080] onde T é um valor de limite predeterminado, tal como um valor de aproximadamente T = 1,0. Estes são referidos abaixo como a condição de detecção 3. A faixa de detecção da condição de detecção 3 é mais estreita do que aquela da condição de detecção 2. Note que, por causa da condição -1 < k1[m] < 1, em relação à faixa do coeficiente de reflexão, as condições não se sobrepõem em três subbandas consecutivas, m, m+1, e m+2, quando a condição de detecção 2 ou a condição de detecção 3 é aplicada, e, assim, uma sobreposição espectral não será detectada em três sub-bandas consecutivas. Além disso, a sobreposição espectral não será detectada em três subbandas consecutivas, mesmo se a condição de detecção 1 for usada em conjunto com a condição de detecção 2 ou com a condição de detecção 3. Também será óbvio que as condições de detecção de sobreposição espectral podem ser estabelecidas para três sub-bandas consecutivas, usando-se os coeficientes de reflexão para sub-bandas m-2, m-1 e m.
[0081] o número de sub-banda em que as condições de detecção são verdadeiras é extraído para o detector de sobreposição espectral 315 como os dados de detecção de sobreposição espectral 316. O removedor de sobreposição espectral 313, então, ajusta o ganho para apenas a sub-banda indicada pelos dados de detecção 316, para limitação da sobreposição espectral. Se, por exemplo, os dados de detecção 316 indicarem uma ocorrência de sobreposição espectral através
Petição 870180003203, de 12/01/2018, pág. 26/59
22/39 de duas sub-bandas, de acordo com a condição de detecção 1, o ganho pode ser ajustado pela combinação do ganho em sub-bandas m-1 e m, ou pela limitação da diferença de ganho ou da relação de ganho entre as duas sub-bandas para um valor de limite predeterminado ou menos. Quando o mesmo nível de ganho é regulado para ambas as sub-bandas, um ganho poderia ser regulado para ser o nível de ganho mais baixo das duas sub-bandas, para o nível de ganho mais alto, ou para um nível mediano entre os níveis de ganho alto e baixo (tal como a média).
[0082] Para evitar erros de detecção pelo detector de sobreposição espectral 315, o removedor de sobreposição espectral 313 poderia aplicar uma combinação de métodos. Por exemplo, o removedor de sobreposição espectral 313 poderia aplicar uma combinação de ganho a sub-bandas em que uma sobreposição espectral fosse detectada, e aplicaria um ganho limitante às outras sub-bandas, para limitação da diferença de ganho ou da relação de ganho para ou para abaixo de um valor de limite predeterminado.
[0083] Além disso, quando os dados de detecção 316 indicarem a ocorrência de sobreposição espectral através de três sub-bandas com base na condição de detecção 2 ou na condição de detecção 3, o removedor de sobreposição espectral 313 poderia ajustar o ganho pela combinação do nível de ganho para todas as três sub-bandas. Alternativamente, um método de combinação de ganho de duas sub-bandas, como descrito acima, poderia ser aplicado em ordem ascendente a partir da sub-banda m-2, isto é, após o ajuste do ganho para as subbandas m-2 e m-1, aquele nível de ganho e o ganho para sub-banda m podem ser combinados. Isso também poderia ser aplicado em ordem descendente para a combinação do ganho entre duas subbandas, começando a partir da sub-banda m. Ainda alternativamente, uma combinação de ganho de duas sub-bandas em ordem ascendenPetição 870180003203, de 12/01/2018, pág. 27/59
23/39 te e em ordem descendente, como citado acima, poderia ser aplicada, e a mediana de ambos os níveis de ganho poderia, então, ser determinada e aplicada. Quando o mesmo nível de ganho é regulado para duas sub-bandas, o ganho poderia ser regulado para o nível de ganho mais baixo, para o nível de ganho mais alto ou para um nível mediano entre os níveis de ganho alto e baixo (tal como a média).
[0084] Ainda alternativamente, a diferença de ganho ou a relação de ganho entre as duas sub-bandas poderia ser regulada para um valor de limite predeterminado ou menos, ao invés de se regular o mesmo nível de ganho para ambas as sub-bandas.
[0085] Ainda mais alternativamente, para impedir a detecção de erros pelo detector de sobreposição espectral 315, o removedor de sobreposição espectral 313 poderia aplicar uma combinação de métodos. Por exemplo, o removedor de sobreposição espectral 313 poderia aplicar uma combinação de ganho a sub-bandas em que uma sobreposição espectral fosse detectada, e aplicaria uma limitação de ganho às outras sub-bandas para limitação da diferença de ganho ou da relação de ganho para ou abaixo de um valor de limite predeterminado. [0086] Com a configuração acima, o ganho apenas para as subbandas nas quais uma sobreposição espectral afeta a qualidade do som é ajustado, e o nível de ganho indicado no fluxo de bit recebido pode ser usado para outras sub-bandas. Uma qualidade de som degradada, devido a uma sobreposição espectral, portanto, pode ser impedida, e uma degradação de áudio devido a um ganho nãocombinado também pode ser impedida. Por exemplo, quando o removedor de sobreposição espectral 313 usa um método como descrito acima para uma combinação de ganho, o ganho pode ser ajustado para o nível de ganho transmitido em uma unidade de pelo menos duas sub-bandas, se a condição de detecção 1 for aplicada pelo detector de sobreposição espectral 315, e pode ser ajustado para o nível de ganho
Petição 870180003203, de 12/01/2018, pág. 28/59
24/39 recebido em uma unidade de pelo menos quatro sub-bandas, se um detector de sobreposição espectral 315 usar a condição de detecção 2 ou a condição de detecção 3.
[0087] Deve ser notado que o parâmetro denotando a inclinação da distribuição de frequência dos sinais de sub-banda poderia ser determinado pelo cálculo de vários parâmetros em relação à base de tempo e, então, suavizando-se esses parâmetros.
[0088] Mais ainda, quando o coeficiente de predição linear ou coeficiente de reflexão usado como o parâmetro denotando a inclinação da distribuição de frequência de sinal de sub-banda é usado como um parâmetro intermediário em um meio de expansão de banda convencional, todos ou parte desses parâmetros podem ser compartilhados, desse modo reduzindo-se o número de operações requeridas para o processamento.
MODALIDADE 3 [0089] O detector de sobreposição espectral 315 na segunda modalidade acima compara um valor de limite predeterminado com os coeficientes de reflexão de cada sub-banda, e com base na relação entre esses valores, detecta e extrai como um valor binário se uma sobreposição espectral ocorre ou não. Quando o valor de avaliação muda próximo do valor de limite usando-se um método de detecção de valor binário, o valor de detecção de sobreposição espectral para ocorrência / não-ocorrência muda freqüentemente. Isto complica um acompanhamento para se ajustar ou não o ganho e pode afetar adversamente a qualidade do som.
[0090] O detector de sobreposição espectral 315 na presente modalidade, portanto, detecta o grau de ocorrência de sobreposição espectral. Isto é, ao invés de se usar um valor binário para simplesmente indicar se a sobreposição espectral é detectada ou não, a ocorrência de sobreposição espectral é indicada por um valor contínuo que denoPetição 870180003203, de 12/01/2018, pág. 29/59
25/39 ta o grau de ocorrência de sobreposição espectral. O ganho, então, é ajustado com base neste valor contínuo para a obtenção de uma transição suave. Mudanças súbitas no ganho causadas por uma troca de ajuste de ganho e não-ajuste podem ser suprimidas e, assim, a degradação resultante da qualidade de som pode ser reduzida. Deve ser notado que a configuração de um aparelho de decodificação de áudio de acordo com esta terceira modalidade é a mesma que aquela da segunda modalidade mostrada na figura 2.
[0091] O valor denotando o grau de ocorrência de sobreposição espectral é descrito em seguida.
[0092] Quando da detecção de uma sobreposição espectral entre duas sub-bandas, o grau de sobreposição espectral d[m] na subbanda m pode ser calculado a partir da relação a seguir:
i) quando m é par e k1[m] < q, k1[m-1] < q: se k1[m]>k1[m-1], d[m]=(-k1[m]+q)/p se k1[m]<k1[m-1], d[m]=(-k1[m-1]+q)/p ii) quando m é ímpar e k1[m] > -q, k1[m-1] > -q: se k1[m]>k1[m-1], d[m]=(k1[m-1]+q)/p se k1[m]<k1[m-1], d[m]=(-k1[m]+q)/p iii) caso contrário:
d[m] = 0 [0093] onde p e q são valores de limite predeterminados e, preferencialmente, p = q = aproximadamente 0,25. O limite superior de d[m] também é preferencialmente limitado a 1,0.
[0094] Os ganhos g[m] e g[m-1] para a sub-banda m e a subbanda m-1 são ajustados como se segue, usando-se o grau de sobrePetição 870180003203, de 12/01/2018, pág. 30/59
26/39 posição espectral d[m].
Quando g[m]>g[m-1], g[m]=(1,0-d[m])-g[m]+d[m]-g[m-1]
Quando g[m]<g[m-1], g[m-1]=(1,0-d[m])-g[m-1]+d[m]-g[m] [0095] Quando a detecção de sobreposição espectral entre três sub-bandas usando-se a condição de detecção 2 ou a condição de detecção 3 é combinada com a detecção de sobreposição espectral entre duas sub-bandas usando-se a condição de detecção 1, o grau de ocorrência de sobreposição espectral d[m] pode ser calculado usando-se o método a seguir.
[0096] Em primeiro lugar, d[m] é regulado para 0,0 para todo m. Então, d[m] e d[m-1] são determinados para m pela aplicação do método a seguir em ordem ascendente.
[0097] Em primeiro lugar, se a condição de detecção 1 for verdadeira, então, d[m] = 1,0. Em segundo lugar, o grau de sobreposição espectral d[m] é regulado como se segue, apenas se a condição de detecção 2 ou a condição de detecção 3 for verdadeira.
i) quando m é par: se d[m]=0,0, d[m]=(k1[m-2]-k1[m]-T)/s se d[m-1]=0,0 d[m-1]=(k1[m-2]-k1[m]-T)/s ii) quando m é ímpar: se d[m]=0,0, d[m]=(k1[m]-k1[m-2]-T)/s se d[m-1]=0,0 d[m-1]=(k1[m]-k1[m-2]-T)/s [0098] onde T e s são valores de limite predeterminados e, preferencialmente, T = 0,8 e s = 0,4 aproximadamente. O limite superior de
Petição 870180003203, de 12/01/2018, pág. 31/59
27/39 d[m] também é limitado preferencialmente para 1,0.
[0099] O grau de ocorrência de sobreposição espectral d[m] também pode ser calculado usando-se o método a seguir.
[00100] Em primeiro lugar, d[m] é regulado para 0,0 para todo m. Então, d[m] e d[m-1] são determinados por m pela aplicação do método a seguir em ordem ascendente.
[00101] Em primeiro lugar, se a condição de detecção 1 for verdadeira, então, d[m] = 1,0. Em segundo lugar, os graus de ocorrência de sobreposição espectral d[m] e d[m-1] são regulados como se segue, apenas se a condição de detecção 2 ou a condição de detecção 3 for verdadeira.
i) quando m é par: se d[m]=0,0, d[m]=(k1 [m-2]-k1 [m]-abs(k1 [m-1])) se d[m-1]=0,0 d[m-1]=(k1[m-2]-k1[m]-abs(k1[m-1])) ii) quando m é ímpar: se d[m]=0,0, d[m]=(k1[m]-k1[m-2]-abs(k1[m-1])) se d[m-1]=0,0 d[m-1]=(k1[m]-k1[m-2]-abs(k1[m-1])) [00102] Note que abs() denota uma função provendo um valor absoluto.
[00103] Quando, por exemplo, uma combinação de ganho entre duas sub-bandas em ordem ascendente é aplicada como descrito acima para o ajuste do ganho entre três sub-bandas de acordo com o grau de ocorrência de sobreposição espectral d[m], os ganhos g[m] e g[m-1] para as sub-bandas m e m-1 podem ser ajustados como se segue.
Quando g[m]>g[m-1]:
Petição 870180003203, de 12/01/2018, pág. 32/59
28/39 g[m]=(1,0-d[m])-g[m]+d[m]-g[m-1]
Quando g[m]<g[m-1]:
g[m-1]=(1,0-d[m])-g[m-1]+d[m]-g[m] [00104] Pelo ajuste do ganho usando-se o grau de ocorrência de sobreposição espectral d[m] determinado como descrito acima, uma degradação de áudio causada por uma troca de processo de ajuste de ganho, quando o ganho é ajustado com base em um valor binário simplesmente indicando se uma sobreposição espectral ocorre ou não é detectado, pode ser suprimida.
[00105] Mais ainda, considerando-se a característica 1 descrita com referência à figura 4A e à figura 4B, de modo a reduzir múltiplas distorções em sub-bandas sucessivas, a característica 1 pode ser usada para o cálculo do grau de ocorrência de sobreposição espectral d[m] para ajuste do ganho.
[00106] Mais especificamente, no caso mostrado na figura 4a, a amplitude do componente de imagem na sub-banda m é maior do que a amplitude da componente de imagem da sub-banda m-2 e, assim, o grau de ocorrência de sobreposição espectral é maior na sub-banda m do que na sub-banda m-2. Inversamente, no caso mostrado na figura 4B, o grau de ocorrência de sobreposição espectral é maior na subbanda m-2 do que na sub-banda m. Portanto, é possível reduzir uma distorção de sobreposição espectral de acordo com o grau da distorção pela regulagem do grau de ocorrência de sobreposição espectral d[m] considerando-se esta característica 1. O grau de ocorrência de sobreposição espectral d[m] regulado de acordo com esta característica pode ser obtido a partir das equações a seguir.
d[m]=1-k1[m-1]-k1[m-1] ou d[m]=1-abs(k1[m-1]) [00107] Este método é preferido porque o grau de ocorrência de
Petição 870180003203, de 12/01/2018, pág. 33/59
29/39 sobreposição espectral d[m] vai para 1 (ou um máximo) quando k1[m1] = 0. Isto é porque quando a amplitude de tons de baixa frequência e tons de alta frequência na sub-banda m-1 na figura 4A e na figura 4B é a mesma, a inclinação da distribuição de frequência para a sub-banda m-1 torna-se zero, isto é, o coeficiente de reflexão k1[m-1] vai para 0, os componentes de imagem na sub-banda m-2 e na sub-banda m estão no mesmo nível e, assim, o grau de ocorrência de sobreposição espectral deve ser o mesmo para ambos.
[00108] Um exemplo de um método para o cálculo do grau de ocorrência de sobreposição espectral d[m] com base na prioridade determinada pela característica 1 é descrito em seguida. Note que o método descrito abaixo usa ambas uma detecção de sobreposição espectral por três sub-bandas com base na condição de detecção 2 ou na condição de detecção 3 e uma detecção de sobreposição espectral entre duas sub-bandas com base na condição de detecção 1.
[00109] O grau de ocorrência de sobreposição espectral d[m], primeiramente, é determinado a partir da equação a seguir.
i) quando m é par:
se k1[m]<0 e k1[m-1]<0, d[m]=S, se k1[m]<0 e k1[m-1]<0 e k1[m-2]>0, d[m-1]=1-k1[m-1].k1[m-1], se k1[m]<0 e k1[m-1]>0 e k1[m-2]>0, d[m]=1-k1[m-1]-k1[m-1] ii) quando m é ímpar: se k1[m]>0 e k1[m-1]>0, d[m]=S, se k1[m]>0 e k1[m-1]>0 e k1[m-2]<0, d[m-1]=1-k1[m-1]-k1[m-1], se k1[m]>0 e k1[m-1]<0 e k1 [m-2]<0,
Petição 870180003203, de 12/01/2018, pág. 34/59
30/39 d[m]=1-k1[m-1]-k1[m-1] iii) caso contrário:
d[m] = 0 [00110] onde S é um valor predeterminado e, preferencialmente, S = 1,0 aproximadamente. Note que o valor S pode ser regulado apropriadamente usando-se o coeficiente de reflexão na sub-banda alvo. [00111] Se, por exemplo, uma combinação de ganho entre duas sub-bandas na ordem ascendente, como descrito acima, for aplicada exatamente como no método descrito acima para o ajuste do ganho entre três sub-bandas de acordo com o grau de ocorrência de sobreposição espectral d[m], o ganho g[m] e g[m-1] para as sub-bandas m e m-1 pode ser ajustado como se segue.
Quando g[m]>g[m-1]: g[m]=(1,0-d[m])-g[m]+d[m]-g[m-1]
Quando g[m]<g[m-1]: g[m-1]=(1,0-d[m])-g[m-1]+d[m]-g[m] [00112] Deve ser notado que qualquer característica pode ser usada como o valor d[m] denotando o grau de ocorrência de sobreposição espectral à medida que ele mudar suavemente a quantidade máxima de ajuste de ganho quando uma sobreposição espectral ocorrer e a quantidade mínima de ajuste quando uma sobreposição espectral não ocorrer, de acordo com o grau de ocorrência de sobreposição espectral.
[00113] Mais ainda, vários valores denotando o grau de ocorrência de sobreposição espectral referenciados à base de tempo podem ser calculados e suavizados para uso como o grau d[m] de ocorrência de sobreposição espectral.
MODALIDADE 4 [00114] A figura 5 é um diagrama de blocos esquemático que mostra um aparelho de decodificação de acordo com uma quarta modaliPetição 870180003203, de 12/01/2018, pág. 35/59
31/39 dade da presente invenção. Este aparelho de decodificação difere do aparelho de decodificação das segunda e terceira modalidades descritas acima pelo fato da informação de componente de frequência alta 108 do demultiplexador de fluxo de bit 101 ser introduzida no detector de sobreposição espectral além do sinal de sub-banda de frequência baixa 617 do banco de filtro de análise 103.
[00115] Esta configuração permite que o detector de sobreposição espectral 615 detecte uma sobreposição espectral usando ambos o sinal de sub-banda de frequência baixa 617 e a informação de ganho contida na informação de componente de frequência alta 108.
[00116] Como descrito acima, uma sobreposição espectral torna-se um problema quando a diferença de ganho entre as sub-bandas adjacentes é grande. Mais ainda, se os níveis de sinal original próximos de quando a sobreposição espectral ocorre forem baixos, apenas o componente de sobreposição espectral será audível, desse modo resultando em uma degradação significativa na qualidade do som.
[00117] Considerando-se o fato, o detector de sobreposição espectral 615 desta modalidade, portanto, referencia, primeiramente, à informação de ganho na informação de componente de frequência alta 108 para a detecção de sub-bandas, onde a diferença de ganho entre sub-bandas adjacentes é maior do que um nível predeterminado, então, referencia o sinal de sub-banda de frequência baixa a ser copiado para a sub-banda detectada e avalia o nível de cada sub-banda de frequência baixa. Se, como resultado desta avaliação a diferença de nível entre uma dada sub-banda e a sub-banda adjacente for maior do que ou igual a um valor de limite predeterminado, aquela sub-banda é determinada como sendo uma sub-banda em que é provável que uma sobreposição espectral ocorra. A energia de sinal de sub-banda, a amplitude máxima, a amplitude total, a amplitude média ou um outro valor poderia ser usado para indicação do nível de cada sub-banda.
Petição 870180003203, de 12/01/2018, pág. 36/59
32/39 [00118] O detector de sobreposição espectral 615 extrai o número de sub-bandas que se adequam às condições acima como os dados de detecção de sobreposição espectral 616. O removedor de sobreposição espectral 613, então, ajusta o ganho apenas para as sub-bandas indicadas pelos dados de detecção de sobreposição espectral 616 para supressão de sobreposição espectral.
[00119] O ganho pode ser ajustado pela regulagem do mesmo nível de ganho para as sub-bandas adjacentes ou pela limitação da diferença de ganho ou da relação de ganho entre as sub-bandas para um valor de limite predeterminado ou menos. Quando o mesmo nível de ganho é regulado para ambas as sub-bandas, um ganho poderia ser regulado para o nível de ganho mais baixo das duas sub-bandas, para o nível de ganho mais alto ou para um nível mediano entre os dois níveis de ganho alto e baixo (tal como a média).
[00120] Mais ainda, uma combinação de métodos poderia ser usada para evitar erros de detecção pelo detector de sobreposição espectral 615. Por exemplo, uma combinação de ganho poderia ser aplicada a sub-bandas em que uma sobreposição espectral fosse detectada e uma limitação de ganho poderia ser aplicada às outras sub-bandas para limitação da diferença de ganho ou da relação de ganho para ou para abaixo de um valor predeterminado.
[00121] Esta configuração, assim, apenas ajusta o ganho para subbandas nas quais uma sobreposição espectral afetando a qualidade do som é esperado e usa o nível de ganho indicado no fluxo de bit recebido para as outras sub-bandas. Uma qualidade de som degradada devido a uma sobreposição espectral, portanto, pode ser evitada e uma degradação de áudio devido a um ganho não-combinado também pode ser evitada.
MODALIDADE 5 [00122] Os aparelhos de decodificação de áudio descritos acima da
Petição 870180003203, de 12/01/2018, pág. 37/59
33/39 primeira à quarta modalidade assumem que uma informação de ganho para sub-bandas de alta frequência esteja contida nos dados de componente de frequência alta e diretamente ajustam apenas aquela informação de ganho. Entretanto, uma informação de ganho pode ser transmitida pelo envio da informação de ganho real, ou pelo envio da energia do sinal de sub-banda de frequência alta decodificado. O processo de decodificação, neste caso, obtém a informação de ganho pela determinação da relação entre a energia de sinal após a decodificação e a energia de sinal da sub-banda de frequência baixa a ser copiada para a sub-banda de frequência alta. Isto, contudo, requer o cálculo do ganho do sinal de sub-banda de frequência alta antes do processo para a remoção de sobreposição espectral. Esta modalidade da invenção, portanto, descreve um aparelho de decodificação de áudio habilitado com um método de transmissão de informação de ganho que transmite o nível de energia após uma decodificação de subbanda de frequência alta.
[00123] A figura 6 é um diagrama de blocos esquemático de um aparelho de decodificação de áudio de acordo com esta modalidade da invenção. Como mostrado na figura, este aparelho de decodificação de áudio adiciona um calculador de ganho 718 para o cálculo do ganho para um sinal de sub-banda de frequência alta, antes do processo para a remoção da sobreposição espectral para a configuração do aparelho de decodificação mostrada na primeira modalidade. [00124] A informação 108 transmitida para a decodificação do nível de ganho da sub-banda de frequência alta inclui dois valores: a energia R da sub-banda de frequência alta após a decodificação e a relação Q entre a energia R e a energia adicionada pelo sinal adicional. O calculador de ganho 718 é idêntico a uma parte de cálculo de ganho do expansor de banda 104. Este calculador de ganho 718 calcula um ganho g para a sub-banda de frequência alta a partir desses dois valoPetição 870180003203, de 12/01/2018, pág. 38/59
34/39 res, isto é, a energia R e relação Q, e a energia E do sinal de subbanda de frequência alta 617.
g=sqrt(R/E/(1+Q)) [00125] onde sqrt denota um operador de raiz quadrada.
[00126] A informação de ganho 719 assim calculada para cada subbanda, então, é enviada para o removedor de sobreposição espectral 713 juntamente com a outra informação de frequência alta para a remoção de sobreposição espectral pelo mesmo processo descrito na primeira modalidade. Deve ser notado que esta informação de ganho 720 é enviada com a informação de sinal adicional para o gerador de sinal adicional 711. Esta configuração permite que o removedor de sobreposição espectral (meio de remoção) da presente invenção também possa ser aplicado quando os valores de energia de sub-banda de frequência alta forem transmitidos, ao invés de uma informação de ganho de sub-banda de frequência alta.
[00127] Mais ainda, mesmo quando valores de energia de subbanda de frequência alta forem transmitidos, o removedor de sobreposição espectral desta modalidade também pode ser aplicado da segunda à quarta modalidade pelo cálculo do ganho de sinal de subbanda de frequência alta antes da remoção de sobreposição espectral e introduzindo-se o ganho calculado da sub-banda de frequência alta para o removedor de sobreposição espectral 113.
[00128] Deve ser notado que, devido ao fato da energia de sinal de sub-banda de frequência baixa poder ser usada nesta modalidade da invenção, o ganho g entre duas sub-bandas adjacentes pode ser ajustado como se segue.
[00129] A energia total Et[m] de sub-bandas m-1 e m, antes do ajuste de ganho, primeiramente, é calculada usando-se a equação:
Et[m]=g[m]2'E[m]+g[m-1]2'E[m-1] [00130] onde g[m-1] e g[m] são os ganhos das sub-bandas m-1 e
Petição 870180003203, de 12/01/2018, pág. 39/59
35/39 m, antes do ajuste de ganho e E[m] e E[m-1] são a energia correspondente aos sinais de sub-banda de frequência baixa, respectivamente. [00131] A energia total Et[m], então, é regulada como a energia alvo e o ganho para a energia de referência (isto é, a energia de sinal de sub-banda de frequência baixa) requerida para a obtenção da energia alvo é calculado. Devido ao fato deste ganho poder ser expresso como a raiz quadrada da relação de energia alvo e energia de referência, um ganho médio Gt[m] de sub-banda m-1 e sub-banda m é calculado, usando-se a equação a seguir.
Gt[m]=sqrt(Et[m]/(E[m]+E[m-1])) [00132] O ganho g'[m] de sub-banda m após o ajuste de ganho, então, é calculado usando-se este ganho médio Gt[m] e o grau de ocorrência de sobreposição espectral d[m] na sub-banda m.
g'[m]=d[m]-Gt[m]+(1,0-d[m])-g[m] [00133] A energia de sub-banda m muda como resultado deste ajuste de ganho. O ganho g'[m-1] de sub-banda m-1 após o ajuste pode ser computado a partir da equação a seguir, para se impedir a energia total Et[m] de sub-banda m-1 e de sub-banda m de mudar porque a energia de sub-banda m-1 é igual a Et[m] menos a energia de sub-banda m.
g'[m-1]=sqrt((Et[m]-g'[m]2-E[m])/E[m-1]) [00134] Se o ganho de sub-banda m-1 e de sub-banda m for ajustado como descrito acima, a energia total de sub-bandas m-1 e m, antes do ajuste de ganho e a energia total de sub-bandas m-1 e m após um ajuste de ganho serão as mesmas. Em outras palavras, uma degradação de áudio causada por uma mudança na energia de sinal acompanhando um ajuste de ganho pode ser evitada, porque o ganho de cada sub-banda pode ser ajustado sem se mudar a energia total das duas sub-bandas.
[00135] Além disso, a energia total Et[m] de sub-bandas m-1 e m é
Petição 870180003203, de 12/01/2018, pág. 40/59
36/39 calculada, apenas a partir de sinais copiados das sub-bandas de frequência baixa correspondentes e não contém componentes de energia os quais são denotados pela relação de energia Q e adicionados pelos sinais adicionais. Uma degradação na qualidade do som pode portanto ser evitada porque a distribuição de energia dos sinais de sub-bandas copiados a partir da sub-banda de frequência baixa pode ser mantida sem ser afetada pelos sinais adicionais.
[00136] Quando este método de ajuste de ganho é aplicado pelas três sub-bandas, um valor de g[I]2 · E[I] é calculado para cada subbanda I (I = m-2, m-1, m) a ser regulado para o mesmo nível de ganho, e a soma dos três valores, então, é usada como Et[m]. Como com o ajuste de ganho entre duas sub-bandas, o ganho médio Gt[m] é obtido a partir da equação a seguir e um ajuste de ganho regula o ganho da sub-banda alvo para combinar com Gt[m].
Gt[m]=sqrt(Et[m]/(E[m-2]+E[m-1]+E[m])) [00137] Este método também é usado quando o número de subbandas para as quais o ganho é ajustado é 4 ou mais.
[00138] Note, também, que este processo de ajuste de ganho de duas sub-bandas pode ser aplicado em ordem ascendente ou descendente, como descrito previamente com referência ao removedor de sobreposição espectral 113.
[00139] O ganho pode ser ajustado, alternativamente, usando-se o grau de ocorrência de sobreposição espectral d[m] para duas ou mais sub-bandas, como se segue. Assumindo, por exemplo, que o ganho é ajustado por três sub-bandas, a energia é calculada para cada uma das sub-bandas m-2, m-1, m para as quais um ganho é para ser ajustado e a energia total Et[m] é obtida como se segue.
Et[m]=g[m-2]2’E[m-2]+g[m-1]2’E[m-1]+g[m]2’E[m] [00140] O quadrado do ganho médio G2t[m], então, é calculado a partir da equação a seguir, usando-se esta energia total Et[m].
Petição 870180003203, de 12/01/2018, pág. 41/59
37/39
G2t[m]=Et[m]/(E[m-2]+E[m-1]+E[m]) [00141] Usando-se G2t[m], o ganho de sub-banda alvo I (I = m-2, m-1, m), então, é provisoriamente calculado como se segue. Note que o ganho é interpolado usando-se o quadrado nesta modalidade.
g2[I]=f[I]-G2t[m]+(1,0-f[I])-g[I]2 [00142] onde f[I] é o maior dentre d[I] e d[I+1]. A energia total E't [m] usando-se este ganho provisório g2[I] é obtida como se segue:
E't[m]=g2[m-2]E[m-2]+g2[m-1 ]'E[m-1]+g2[m]'E[m] [00143] Note que a energia total E't [m] não necessariamente equivale à energia total Et[m] descrita acima. Portanto, para impedir a energia total de mudar devido a um ajuste de ganho, o ganho ajustado g'[I] de sub-banda alvo I (I = m-2, m-1, m) pode ser regulado para:
g'[I]=sqrt(b-g2[I]) b= Et[m]/E't[m].
[00144] Este método também pode ser usado se o número de subbandas de ganho ajustado for 2 ou 4 ou mais.
[00145] Se este método de ajuste de ganho for usado, como quando o ganho é ajustado entre duas sub-bandas, a energia total antes do ajuste de ganho e a energia total após o ajuste de ganho podem ser as mesmas, mesmo quando o ganho for ajustado usando-se o grau de ocorrência de sobreposição espectral d[m] por mais de duas subbandas. Isso significa que uma degradação de qualidade de som resultante de uma mudança na energia de sinal que acompanha um ajuste de ganho pode ser evitada, porque o ganho de cada sub-banda pode ser ajustado sem se mudar a energia de sinal total. Como quando o ganho é ajustado por duas sub-bandas, como descrito acima, a qualidade do som também não é afetada pelos sinais adicionais. [00146] A configuração de aparelho de decodificação de áudio descrita nas modalidades acima também pode ser usada quando sinais de sub-banda de frequência baixa de valor complexo extraídos do banco
Petição 870180003203, de 12/01/2018, pág. 42/59
38/39 de filtro de análise 103 são convertidos em sinais de sub-banda de frequência baixa de valor real no expansor de banda 104, e sinais de sub-banda de frequência alta são gerados por uma operação de número real. O processo de detecção de sobreposição espectral também pode ser aplicado a sinais de sub-banda de frequência baixa de valor real convertido no expansor de banda 104. Ambos os casos podem ser obtidos sem se mudar a configuração ou o método de processamento do aparelho de decodificação de áudio de acordo com a presente invenção pela conversão do sinal processado de um sinal de valor complexo para um sinal de valor real, isto é, um sinal em que a parte imaginária do sinal de valor complexo é 0. Esta configuração reduz o número de operações realizadas pelo expansor de banda 104 pelo uso de operações de número real, enquanto se aplica um processo de remoção de sobreposição espectral aos sinais de sub-banda de frequência alta de valor real gerados. Uma degradação na qualidade de som devido a uma sobreposição espectral, portanto, pode ser evitada.
[00147] Além disso, a configuração de um aparelho de decodificação de áudio descrito acima também pode ser aplicada quando o banco de filtro de análise 103 é um banco de filtros de coeficiente de valor real. Os sinais de sub-banda resultantes da divisão de banda pelo banco de filtro de análise de coeficiente de valor real 103 são sinais de valor real e, assim, a sobreposição espectral torna-se um problema durante a geração de sinal de sub-banda de frequência alta da mesma forma que quando um sinal de valor complexo é convertido em um sinal de valor real. A sobreposição espectral pode ser impedido a partir da ocorrência e portanto a degradação na qualidade de som causada pela sobreposição espectral pode ser impedida pelo uso de uma configuração de um aparelho de decodificação de áudio descrito em qualquer uma das modalidades acima. O número de operações realizadas
Petição 870180003203, de 12/01/2018, pág. 43/59
39/39 pode ser grandemente reduzido com esta configuração, porque todas as operações de decodificação são feitas com operações de número real.
[00148] O processo realizado pelo aparelho de decodificação de áudio descrito nas modalidades acima da invenção também pode ser obtido com um programa de software codificado em uma linguagem de programação predeterminada. Este aplicativo de software também pode ser gravado em um meio de gravação de dados que pode ser lido em computador para distribuição.
[00149] Embora a presente invenção tenha sido descrita em relação com modalidades específicas da mesma, muitas outras modificações, correções e aplicações são evidentes para aqueles versados na técnica. Portanto, a presente invenção não está limitada pela descrição provida aqui, mas limitada apenas ao escopo das reivindicações em apenso.
[00150] Será notado, adicionalmente, que a presente invenção se refere ao Pedido de Patente Japonesa 2002-300490, depositado em 15 de outubro de 2002, cujo conteúdo é incorporado aqui como referência.
Petição 870180003203, de 12/01/2018, pág. 44/59
1/10

Claims (28)

  1. REIVINDICAÇÕES
    1. Aparelho de decodificação de áudio para a decodificação de um sinal de áudio de banda larga a partir de um fluxo de bit contendo uma informação codificada para um sinal de áudio de banda estreita, o referido aparelho caracterizado por compreender:
    um demultiplexador de fluxo de bit (101) operável para demultiplexar uma informação codificada a partir do fluxo de bit;
    um decodificador (107) operável para decodificar um sinal de áudio de banda estreita a partir da informação codificada demultiplexada;
    um banco de filtro de análise (103) operável para dividir o sinal de áudio de banda estreita decodificado em múltiplos sinais de sub-banda compondo um primeiro sinal de sub-banda;
    um expansor de banda (104), operável para gerar um segundo sinal de sub-banda a partir do primeiro sinal de sub-banda, o segundo sinal sendo composto de múltiplos sinais de sub-banda, tendo cada um uma banda de frequência mais alta do que a banda de frequência do primeiro sinal de sub-banda;
    um removedor de sobreposição espectral (313) operável para ajustar um ganho com base em um grau de ocorrência de componentes de sobreposição espectral nos sinais de sub-banda do segundo sinal de sub-banda, de modo a suprimir os componentes de sobreposição espectral que ocorrem nos sinais de sub-banda do segundo sinal de sub-banda; e um banco de filtro de síntese de cálculo de valor real (105) operável para sintetizar o primeiro sinal de sub-banda e o segundo sinal de sub-banda para a obtenção de um sinal de áudio de banda larga.
  2. 2. Aparelho de decodificação de áudio de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalPetição 870180003203, de 12/01/2018, pág. 45/59
    2/10 mente um detector de sobreposição espectral (315) operável para detectar um grau de ocorrência de componentes de sobreposição espectral em cada sinal de sub-banda do segundo sinal de sub-banda gerados pelo expansor de banda (104), em que o removedor de sobreposição espectral (313) é operável para ajustar o ganho dos sinais de sub-banda do segundo sinal de sub-banda com base no grau de ocorrência de componentes de sobreposição espectral detectado pelo detector (315) de sobreposição espectral.
  3. 3. Aparelho de decodificação de áudio, de acordo com a reivindicação 2, caracterizado pelo fato de que os componentes de sobreposição espectral contêm pelo menos componentes que são suprimidos após a síntese pelo banco de filtro de síntese (105), o qual realiza um cálculo de valor complexo.
  4. 4. Aparelho de decodificação de áudio, de acordo com a reivindicação 2, caracterizado pelo fato de que o primeiro sinal de sub-banda é um sinal de sub-banda de frequência baixa e o segundo sinal de sub-banda é um sinal de sub-banda de frequência alta.
  5. 5. Aparelho de decodificação de áudio, de acordo com a reivindicação 4, caracterizado pelo fato de que o detector de sobreposição espectral (315) usa um parâmetro que denota uma inclinação de uma distribuição de frequência dos sinais de sub-banda do primeiro sinal de sub-banda para detectar o grau de ocorrência de componentes de sobreposição espectral.
  6. 6. Aparelho de decodificação de áudio, de acordo com a reivindicação 5, caracterizado pelo fato de que o detector de sobreposição espectral (315) avalia um parâmetro que denota uma inclinação de uma distribuição de frequência em cada uma de dois sinais de sub-bandas adjacentes dos sinais de sub-banda para detectar o grau de sobreposição espectral nos dois sinais de sub-bandas adjacentes.
    Petição 870180003203, de 12/01/2018, pág. 46/59
    3/10
  7. 7. Aparelho de decodificação de áudio, de acordo com a reivindicação 5, caracterizado pelo fato de que o detector de sobreposição espectral (315) avalia um parâmetro que denota uma inclinação de uma distribuição de frequência em cada um de três sinais de sub-banda adjacentes para detectar o grau de sobreposição espectral nos três sinais de sub-banda adjacentes.
  8. 8. Aparelho de decodificação de áudio, de acordo com a reivindicação 5, caracterizado pelo fato de que o parâmetro que denota a inclinação da distribuição de frequência é um coeficiente de reflexão.
  9. 9. Aparelho de decodificação de áudio, de acordo com a reivindicação 2, caracterizado pelo fato de que:
    o fluxo de bit contém uma informação adicional usada para habilitar uma banda estreita para banda larga, a informação adicional contém a informação de componente de frequência alta descrevendo um aspecto de um sinal em uma banda de frequência mais alta do que a banda de frequência dos primeiros sinais de sub-banda; e o demultiplexador de fluxo de bit (101) é ainda operável para demultiplexar a informação adicional do fluxo de bit; e o expansor de banda (104) é operável para gerar o segundo sinal de sub-banda dos múltiplos sinais de sub-banda tendo cada um uma banda de frequência mais alta do que a banda de frequência do primeiro sinal de sub-banda a partir do primeiro sinal de sub-banda e da informação de componente de frequência alta.
  10. 10. Aparelho de decodificação de áudio, de acordo com a reivindicação 9, caracterizado pelo fato de que a informação de componente de frequência alta contém uma informação de ganho para uma banda de frequência mais alta do que a banda de frequência dos primeiros sinais de sub-banda;
    Petição 870180003203, de 12/01/2018, pág. 47/59
    4/10 o expansor de banda (104) é operável para gerar o segundo sinal de sub-banda a partir do primeiro sinal de sub-banda com base na informação de ganho; e o removedor de sobreposição espectral (313) é operável para ajustar o ganho dos sinais de sub-banda do segundo sinal de sub-banda com base no grau detectado de ocorrência de componentes de sobreposição espectral e na informação de ganho, de modo a suprimir os componentes de sobreposição espectral.
  11. 11. Aparelho de decodificação de áudio, de acordo com a reivindicação 9, caracterizado pelo fato de que a informação de componente de frequência alta contém informação de energia para sinais em uma banda de frequência mais alta do que a banda de frequência dos primeiros sinais de sub-banda;
    o expansor de banda (104) é operável para gerar o segundo sinal de sub-banda a partir do primeiro sinal de sub-banda com base na informação de ganho calculada a partir da informação de energia; e o removedor de sobreposição espectral (313) é operável para ajustar o ganho dos sinais de sub-banda do segundo sinal de sub-banda com base no grau detectado de ocorrência de componentes de sobreposição espectral pelo detector de sobreposição espectral (315) e na informação de ganho, de modo a suprimir os componentes de sobreposição espectral.
  12. 12. Aparelho de decodificação de áudio, de acordo com a reivindicação 11, caracterizado pelo fato de que o removedor de sobreposição espectral (313) ajusta o ganho dos sinais de sub-banda do segundo sinal de sub-banda de modo que a energia total do segundos sinal de sub-banda com ganho ajustado seja igual à energia total provida pela informação de energia do segundos sinal de sub-banda correspondente.
    Petição 870180003203, de 12/01/2018, pág. 48/59
    5/10
  13. 13. Aparelho de decodificação de áudio, de acordo com a reivindicação 11, caracterizado pelo fato de que o expansor de banda (104) é operável para adicionar um sinal adicional ao segundo sinal de sub-banda gerado;
    a informação de energia contém a energia R do segundo sinal de sub-banda e a relação Q entre a energia R e a energia do sinal adicional; e o expansor de banda (104) calcula a energia E do primeiro sinal de sub-banda e calcula o ganho g do segundo sinal de subbanda correspondente com base na energia R, na energia E e na energia do sinal adicional representado pela relação de energia Q.
  14. 14. Aparelho de decodificação de áudio, de acordo com a reivindicação 13, caracterizado pelo fato de que o ganho g do segundo sinal de sub-banda é:
    g = sqrt {R/E/ (1+Q)} onde sqrt é um operador de raiz quadrada.
  15. 15. Método de decodificação de áudio para a decodificação de um sinal de áudio de banda larga a partir de um fluxo de bit contendo uma informação codificada para um sinal de áudio de banda estreita, caracterizado por compreender:
    a demultiplexação de uma informação codificada a partir do fluxo de bit;
    a decodificação de um sinal de áudio de banda estreita a partir da informação codificada demultiplexada;
    a divisão do sinal de áudio de banda estreita decodificado em múltiplos sinais de sub-banda compondo um primeiro sinal de subbanda;
    a geração de segundos sinais de sub-banda a partir do primeiro sinal de sub-banda, o segundo sinal de sub-banda sendo composto de múltiplos sinais de sub-banda cada um tendo uma banda de
    Petição 870180003203, de 12/01/2018, pág. 49/59
    6/10 frequência mais alta do que a banda de frequência dos primeiros sinais de sub-banda;
    o ajuste de um ganho com base no grau de sobreposição espectral nos sinais de sub-banda do segundo sinal de sub-banda, de modo a suprimir os componentes de sobreposição espectral que ocorrem nos sinais de sub-banda do segundo sinal de sub-banda; e a sintetização do primeiro sinal de sub-banda e do segundo sinal de sub-banda com um cálculo de filtração de valor real para a obtenção de um sinal de áudio de banda larga.
  16. 16. Método de decodificação de áudio de acordo com a reivindicação 15, para a decodificação de um sinal de áudio de banda larga a partir de um fluxo de bit contendo uma informação codificada para um sinal de áudio de banda estreita, caracterizado por ainda compreende:
    a demultiplexação de uma informação codificada a partir do fluxo de bit;
    a decodificação de um sinal de áudio de banda estreita a partir da informação codificada demultiplexada;
    a divisão do sinal de áudio de banda estreita decodificado em múltiplos primeiros sinais de sub-banda;
    a geração de múltiplos segundos sinais de sub-banda a partir de pelo menos um primeiro sinal de sub-banda, cada segundo sinal de sub-banda tendo uma banda de frequência mais alta do que a banda de frequência dos primeiros sinais de sub-banda;
    a detecção de um grau de ocorrência de componentes de sobreposição espectral em cada um dos múltiplos segundos sinais de sub-banda gerados, antes do segundo sinais de sub-banda ser gerado;
    o ajuste de um ganho dos sinais de sub-banda do segundo sinal de sub-banda com base no grau detectado de ocorrência de
    Petição 870180003203, de 12/01/2018, pág. 50/59
    7/10 componentes de sobreposição espectral de modo a se suprimirem os componentes de sobreposição espectral; e a síntese do primeiro sinal de sub-banda e do segundo sinal de sub-banda com um cálculo da filtração de valor real para a obtenção de um sinal de áudio de banda larga.
  17. 17. Método de decodificação de áudio, de acordo com a reivindicação 16, caracterizado pelo fato de que os componentes de sobreposição espectral contêm pelo menos componentes que são suprimidos após a sintetização com um cálculo de filtração de valor complexo.
  18. 18. Método de decodificação de áudio, de acordo com a reivindicação 16, caracterizado pelo fato de que o primeiro sinal de sub-banda é um sinal de sub-banda de frequência baixa e o segundo sinal de sub-banda é um sinal de sub-banda de frequência alta.
  19. 19. Método de decodificação de áudio, de acordo com a reivindicação 18, caracterizado pelo fato de que na detecção do grau de ocorrência de sobreposição espectral, um parâmetro que denota uma inclinação de uma distribuição de frequência dos sinais de subbanda do primeiro sinal de sub-banda é usado para a detecção do grau de ocorrência de componentes de sobreposição espectral.
  20. 20. Método de decodificação de áudio, de acordo com a reivindicação 19, caracterizado pelo fato de que na detecção do grau sobreposição espectral, um parâmetro que denota uma inclinação de uma distribuição de frequência em cada um dos dois sinais de subbanda adjacentes é avaliado para a detecção do grau de sobreposição espectral nos dois sinais de sub-bandas adjacentes.
  21. 21. Método de decodificação de áudio, de acordo com a reivindicação 19, caracterizado pelo fato de que na detecção de um grau, um parâmetro que denota uma inclinação de uma distribuição de frequência em cada um dos três sinais de sub-bandas adjacentes dos
    Petição 870180003203, de 12/01/2018, pág. 51/59
    8/10 sinais de sub-banda do primeiro sinal de sub-banda é avaliado para a detecção do grau de ocorrência de componentes de sobreposição espectral nos três sinais de sub-bandas adjacentes.
  22. 22. Método de decodificação de áudio, de acordo com a reivindicação 19, caracterizado pelo fato de que o parâmetro que denota a inclinação da distribuição de frequência é um coeficiente de reflexão.
  23. 23. Método de decodificação de áudio, de acordo com a reivindicação 16, caracterizado pelo fato de que:
    o fluxo de bit contém uma informação codificada para um sinal de áudio de banda estreita e uma informação adicional usada para habilitar uma banda estreita para banda larga, a informação adicional contém a informação de componente de frequência alta descrevendo um aspecto de um sinal em uma banda de frequência mais alta do que a banda de frequência do primeiro sinal de sub-banda; e na demultiplexação da informação codificada, a informação adicional é demultiplexada a partir do fluxo de bit; e na geração do segundo sinal de sub-banda, o segundo sinal de sub-banda composto dos múltiplos sinais de sub-banda, cada um tendo uma banda de frequência mais alta do que a banda de frequência dos primeiros sinais de sub-banda é gerado a partir de pelo menos um primeiro sinal de sub-banda e da informação de componente de frequência alta.
  24. 24. Método de decodificação de áudio, de acordo com a reivindicação 23, caracterizado pelo fato de que a informação de componente de frequência alta contém uma informação de ganho para uma banda de frequência mais alta do que a banda de frequência dos primeiros sinais de sub-banda;
    na geração do segundo sinal de sub-banda, o segundo siPetição 870180003203, de 12/01/2018, pág. 52/59
    9/10 nal de sub-banda é gerado a partir do primeiro sinal de sub-banda com base na informação de ganho; e no ajuste de um ganho, o ganho dos sinais de sub-banda do segundo sinal de sub-banda é ajustado com base no grau detectado de ocorrência de componentes de sobreposição espectral e na informação de ganho, de modo a suprimir os componentes de sobreposição espectral.
  25. 25. Método de decodificação de áudio, de acordo com a reivindicação 23, caracterizado pelo fato de que a informação de componente de frequência alta contém uma informação de energia para sinais em uma banda de frequência mais alta do que a banda de frequência dos primeiros sinais de sub-banda;
    na geração do segundo sinal de sub-banda, o segundo sinal de sub-banda é gerado a partir do primeiro sinal de sub-banda com base na informação de ganho calculada a partir da informação de energia; e no ajuste de um ganho, o ganho dos sinais de sub-banda do segundo sinal de sub-banda é ajustado com base no grau detectado de ocorrência de componentes de sobreposição espectral e na informação de ganho, de modo a suprimir os componentes de sobreposição espectral.
  26. 26. Método de decodificação de áudio, de acordo com a reivindicação 25, caracterizado pelo fato de que no ajuste de um ganho, o ganho dos sinais de sub-banda do segundo sinal de sub-banda é ajustado de modo que a energia total do segundo sinal de sub-banda com ganho ajustado seja igual à energia total provida pela informação de energia de um segundo sinal de sub-banda correspondente.
  27. 27. Método de decodificação de áudio, de acordo com a reivindicação 25, caracterizado pelo fato de que a geração do segundo sinal de sub-banda inclui a adição de um sinal adicional ao segundo
    Petição 870180003203, de 12/01/2018, pág. 53/59
    10/10 sinal de sub-banda gerado;
    a informação de energia contém a energia R do segundo sinal de sub-banda e a relação Q entre a energia R e a energia do sinal adicional; e a geração do segundo sinal de sub-banda ainda inclui o cálculo da energia E do primeiro sinal de sub-banda e o cálculo do ganho g do segundo sinal de sub-banda correspondente com base na energia R, na energia E e na energia do sinal adicional representado pela relação de energia Q.
  28. 28. Método de decodificação de áudio, de acordo com a reivindicação 27, caracterizado pelo fato de que o ganho g do segundo sinal de sub-banda é:
    g = sqrt {R/E/ (1+Q)} onde sqrt é um operador de raiz quadrada.
    Petição 870180003203, de 12/01/2018, pág. 54/59
    1/8 (Ο ο
    • ··· ·· ·· ········ Γ ψ
    2/8 ·»· · · · ·« ···· ·· · · · ····· «· ··· »··· · · · « ····«··············· * ···»· ·· ·· ·· · ·· ♦
    3/8 <Ο
    LL
    4/8
    5/8
BRPI0306434-4A 2002-09-19 2003-09-11 Aparelho e método de decodificação de áudio BRPI0306434B1 (pt)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2002273557 2002-09-19
JP2002-273557 2002-09-19
JP2002-283722 2002-09-27
JP2002283722 2002-09-27
JP2002-300490 2002-10-15
JP2002300490 2002-10-15
PCT/JP2003/011601 WO2004027368A1 (en) 2002-09-19 2003-09-11 Audio decoding apparatus and method

Publications (3)

Publication Number Publication Date
BR0306434A BR0306434A (pt) 2004-10-26
BRPI0306434A8 BRPI0306434A8 (pt) 2017-10-10
BRPI0306434B1 true BRPI0306434B1 (pt) 2018-06-12

Family

ID=32034073

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0306434-4A BRPI0306434B1 (pt) 2002-09-19 2003-09-11 Aparelho e método de decodificação de áudio

Country Status (14)

Country Link
US (1) US7069212B2 (pt)
EP (1) EP1543307B1 (pt)
JP (1) JP3646939B1 (pt)
KR (1) KR100728428B1 (pt)
CN (1) CN100492492C (pt)
AT (1) ATE318405T1 (pt)
AU (1) AU2003260958A1 (pt)
BR (1) BRPI0306434B1 (pt)
CA (1) CA2469674C (pt)
DE (1) DE60303689T2 (pt)
ES (1) ES2259158T3 (pt)
HK (1) HK1074877A1 (pt)
TW (1) TWI313856B (pt)
WO (1) WO2004027368A1 (pt)

Families Citing this family (121)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
DE10121532A1 (de) * 2001-05-03 2002-11-07 Siemens Ag Verfahren und Vorrichtung zur automatischen Differenzierung und/oder Detektion akustischer Signale
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
ES2237706T3 (es) * 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP4741476B2 (ja) * 2004-04-23 2011-08-03 パナソニック株式会社 符号化装置
EP1744139B1 (en) * 2004-05-14 2015-11-11 Panasonic Intellectual Property Corporation of America Decoding apparatus and method thereof
CN101656077B (zh) * 2004-05-14 2012-08-29 松下电器产业株式会社 音频编码装置、音频编码方法以及通信终端和基站装置
ATE394774T1 (de) 2004-05-19 2008-05-15 Matsushita Electric Ind Co Ltd Kodierungs-, dekodierungsvorrichtung und methode dafür
PL1810281T3 (pl) * 2004-11-02 2020-07-27 Koninklijke Philips N.V. Kodowanie i dekodowanie sygnałów audio z wykorzystaniem banków filtrów o wartościach zespolonych
CN101076853B (zh) * 2004-12-10 2010-10-13 松下电器产业株式会社 宽带编码装置、宽带线谱对预测装置、频带可扩展编码装置以及宽带编码方法
JP5224017B2 (ja) * 2005-01-11 2013-07-03 日本電気株式会社 オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
DE602006009215D1 (de) * 2005-01-14 2009-10-29 Panasonic Corp Audioumschaltungsvorrichtung und -methode
JP5129115B2 (ja) * 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 高帯域バーストの抑制のためのシステム、方法、および装置
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8086451B2 (en) * 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
TWI324336B (en) * 2005-04-22 2010-05-01 Qualcomm Inc Method of signal processing and apparatus for gain factor smoothing
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
DE602006010712D1 (de) * 2005-07-15 2010-01-07 Panasonic Corp Audiodekoder
US8443026B2 (en) 2005-09-16 2013-05-14 Dolby International Ab Partially complex modulated filter bank
US7917561B2 (en) * 2005-09-16 2011-03-29 Coding Technologies Ab Partially complex modulated filter bank
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
TWI311856B (en) * 2006-01-04 2009-07-01 Quanta Comp Inc Synthesis subband filtering method and apparatus
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
JP5185254B2 (ja) * 2006-04-04 2013-04-17 ドルビー ラボラトリーズ ライセンシング コーポレイション Mdct領域におけるオーディオ信号音量測定と改良
US8000825B2 (en) 2006-04-13 2011-08-16 Immersion Corporation System and method for automatically producing haptic events from a digital audio file
US7979146B2 (en) * 2006-04-13 2011-07-12 Immersion Corporation System and method for automatically producing haptic events from a digital audio signal
US8378964B2 (en) 2006-04-13 2013-02-19 Immersion Corporation System and method for automatically producing haptic events from a digital audio signal
DE102006047197B3 (de) * 2006-07-31 2008-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten
EP2076901B8 (en) * 2006-10-25 2017-08-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
WO2008062990A1 (en) 2006-11-21 2008-05-29 Samsung Electronics Co., Ltd. Method, medium, and system scalably encoding/decoding audio/speech
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
KR101049143B1 (ko) 2007-02-14 2011-07-15 엘지전자 주식회사 오브젝트 기반의 오디오 신호의 부호화/복호화 장치 및 방법
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP4984983B2 (ja) * 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
KR101355376B1 (ko) * 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
CN101458930B (zh) * 2007-12-12 2011-09-14 华为技术有限公司 带宽扩展中激励信号的生成及信号重建方法和装置
CN101329870B (zh) * 2008-08-01 2012-12-12 威盛电子股份有限公司 音频解码器以及相关的电子装置以及抑制高频调制噪声的方法
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
EP2360687A4 (en) * 2008-12-19 2012-07-11 Fujitsu Ltd VOICE BAND EXTENSION DEVICE AND VOICE BAND EXTENSION METHOD
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US11657788B2 (en) * 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
AU2015264887B2 (en) * 2009-05-27 2017-12-07 Dolby International Ab Efficient Combined Harmonic Transposition
TWI643187B (zh) * 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
AU2013263712B2 (en) * 2009-05-27 2015-11-12 Dolby International Ab Efficient Combined Harmonic Transposition
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JPWO2011048741A1 (ja) * 2009-10-20 2013-03-07 日本電気株式会社 マルチバンドコンプレッサ
JP5345737B2 (ja) 2009-10-21 2013-11-20 ドルビー インターナショナル アーベー 結合されたトランスポーザーフィルターバンクにおけるオーバーサンプリング
UA102347C2 (ru) 2010-01-19 2013-06-25 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
EP2357649B1 (en) * 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
WO2011114192A1 (en) * 2010-03-19 2011-09-22 Nokia Corporation Method and apparatus for audio coding
JP5651980B2 (ja) 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN103069484B (zh) * 2010-04-14 2014-10-08 华为技术有限公司 时/频二维后处理
CA3027803C (en) * 2010-07-19 2020-04-07 Dolby International Ab Processing of audio signals during high frequency reconstruction
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN103270553B (zh) 2010-08-12 2015-08-12 弗兰霍菲尔运输应用研究公司 对正交镜像滤波器式音频编译码器的输出信号的重新取样
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
CA3067155C (en) * 2010-09-16 2021-01-19 Dolby International Ab Cross product enhanced subband block based harmonic transposition
JP5707842B2 (ja) * 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
FR2969804A1 (fr) * 2010-12-23 2012-06-29 France Telecom Filtrage perfectionne dans le domaine transforme.
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5969513B2 (ja) 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
WO2012110478A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Information signal representation using lapped transform
KR101551046B1 (ko) 2011-02-14 2015-09-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법
WO2012110415A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
EP2676270B1 (en) 2011-02-14 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding a portion of an audio signal using a transient detection and a quality result
BR112013020587B1 (pt) * 2011-02-14 2021-03-09 Fraunhofer-Gesellschaft Zur Forderung De Angewandten Forschung E.V. esquema de codificação com base em previsão linear utilizando modelagem de ruído de domínio espectral
EP2676265B1 (en) 2011-02-14 2019-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using an aligned look-ahead portion
GB2491173A (en) * 2011-05-26 2012-11-28 Skype Setting gain applied to an audio signal based on direction of arrival (DOA) information
GB2493327B (en) 2011-07-05 2018-06-06 Skype Processing audio signals
US9210506B1 (en) * 2011-09-12 2015-12-08 Audyssey Laboratories, Inc. FFT bin based signal limiting
GB2495278A (en) 2011-09-30 2013-04-10 Skype Processing received signals from a range of receiving angles to reduce interference
GB2495131A (en) 2011-09-30 2013-04-03 Skype A mobile device includes a received-signal beamformer that adapts to motion of the mobile device
GB2495130B (en) 2011-09-30 2018-10-24 Skype Processing audio signals
GB2495128B (en) 2011-09-30 2018-04-04 Skype Processing signals
GB2495129B (en) 2011-09-30 2017-07-19 Skype Processing signals
GB2495472B (en) 2011-09-30 2019-07-03 Skype Processing audio signals
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
GB201120392D0 (en) 2011-11-25 2012-01-11 Skype Ltd Processing signals
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
RU2725416C1 (ru) * 2012-03-29 2020-07-02 Телефонактиеболагет Лм Эрикссон (Пабл) Расширение полосы частот гармонического аудиосигнала
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
KR101920029B1 (ko) * 2012-08-03 2018-11-19 삼성전자주식회사 모바일 장치 및 제어방법
JP2014074782A (ja) * 2012-10-03 2014-04-24 Sony Corp 音声送信装置、音声送信方法、音声受信装置および音声受信方法
CN103778918B (zh) * 2012-10-26 2016-09-07 华为技术有限公司 音频信号的比特分配的方法和装置
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
WO2015189533A1 (en) * 2014-06-10 2015-12-17 Meridian Audio Limited Digital encapsulation of audio signals
CN106683681B (zh) * 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
KR101641418B1 (ko) * 2014-07-25 2016-07-20 포항공과대학교 산학협력단 청각 주목도에 기반한 햅틱 신호 생성 방법 및 이를 위한 장치
CN104269173B (zh) * 2014-09-30 2018-03-13 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
EP3067889A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for signal-adaptive transform kernel switching in audio coding
US10049684B2 (en) 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection
CN108140396B (zh) * 2015-09-22 2022-11-25 皇家飞利浦有限公司 音频信号处理
JP6210338B2 (ja) * 2015-12-28 2017-10-11 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN110050304B (zh) * 2016-12-16 2022-11-29 瑞典爱立信有限公司 用于处理包络表示系数的方法、编码器和解码器
JP6769299B2 (ja) * 2016-12-27 2020-10-14 富士通株式会社 オーディオ符号化装置およびオーディオ符号化方法
US11540279B2 (en) * 2019-07-12 2022-12-27 Meteorcomm, Llc Wide band sensing of transmissions in FDM signals containing multi-width channels
US11916668B2 (en) 2020-12-08 2024-02-27 Meteorcomm, Llc Soft decision differential demodulator for radios in wireless networks supporting train control
CN113299313B (zh) * 2021-01-28 2024-03-26 维沃移动通信有限公司 音频处理方法、装置及电子设备
CN113539277B (zh) * 2021-09-17 2022-01-18 北京百瑞互联技术有限公司 一种保护听力的蓝牙音频解码方法、装置、介质及设备
CN114189410B (zh) * 2021-12-13 2024-05-17 深圳市日声数码科技有限公司 一种车载数码广播音频接收系统

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4691292A (en) * 1983-04-13 1987-09-01 Rca Corporation System for digital multiband filtering
DE3510573A1 (de) * 1985-03-23 1986-09-25 Philips Patentverwaltung Digitale analyse-synthese-filterbank mit maximaler taktreduktion
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
JPH04206035A (ja) * 1990-11-30 1992-07-28 Kogaku Denshi Kk Cd―romおよびcd―romの再生システム
FR2680924B1 (fr) * 1991-09-03 1997-06-06 France Telecom Procede de filtrage adapte d'un signal transforme en sous-bandes, et dispositif de filtrage correspondant.
US5508949A (en) * 1993-12-29 1996-04-16 Hewlett-Packard Company Fast subband filtering in digital signal coding
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
JPH08162964A (ja) 1994-12-08 1996-06-21 Sony Corp 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体
EP0732687B2 (en) * 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
JP2956548B2 (ja) 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3437421B2 (ja) 1997-09-30 2003-08-18 シャープ株式会社 楽音符号化装置及び楽音符号化方法並びに楽音符号化プログラムを記録した記録媒体
EP0957580B1 (en) 1998-05-15 2008-04-02 Thomson Method and apparatus for sampling-rate conversion of audio signals
EP0957579A1 (en) 1998-05-15 1999-11-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for sampling-rate conversion of audio signals
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6718300B1 (en) * 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech

Also Published As

Publication number Publication date
AU2003260958A1 (en) 2004-04-08
BRPI0306434A8 (pt) 2017-10-10
TWI313856B (en) 2009-08-21
CN100492492C (zh) 2009-05-27
JP3646939B1 (ja) 2005-05-11
KR100728428B1 (ko) 2007-06-13
JP2005520219A (ja) 2005-07-07
ATE318405T1 (de) 2006-03-15
EP1543307B1 (en) 2006-02-22
HK1074877A1 (en) 2005-11-25
CA2469674C (en) 2012-04-24
DE60303689T2 (de) 2006-10-19
TW200407846A (en) 2004-05-16
KR20050042075A (ko) 2005-05-04
CA2469674A1 (en) 2004-04-01
BR0306434A (pt) 2004-10-26
DE60303689D1 (de) 2006-04-27
EP1543307A1 (en) 2005-06-22
WO2004027368A1 (en) 2004-04-01
ES2259158T3 (es) 2006-09-16
US20050149339A1 (en) 2005-07-07
CN1606687A (zh) 2005-04-13
US7069212B2 (en) 2006-06-27
AU2003260958A8 (en) 2004-04-08

Similar Documents

Publication Publication Date Title
BRPI0306434B1 (pt) Aparelho e método de decodificação de áudio
KR100602975B1 (ko) 오디오 복호 장치와 복호 방법 및 프로그램을 기록한 컴퓨터 판독가능 기록매체
US8639500B2 (en) Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101345695B1 (ko) 대역폭 확장 출력 데이터를 생성하기 위한 장치 및 방법
US10255928B2 (en) Apparatus, medium and method to encode and decode high frequency signal
KR101375582B1 (ko) 대역폭 확장 부호화 및 복호화 방법 및 장치
BRPI0517949B1 (pt) dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador
BRPI0305710B1 (pt) &#34;apparatus and method of decoding of audio&#34;
PT2888737T (pt) Aparelho e método para reproduzir um sinal de áudio, aparelho e método para gerar um sinal de áudio codificado, programa de computador e sinal de áudio codificado
US11935549B2 (en) Apparatus and method for encoding an audio signal using an output interface for outputting a parameter calculated from a compensation value
TW200404273A (en) Improved audio coding system using spectral hole filling
BRPI0722269A2 (pt) Encodificador para encodificar um sinal de áudio, método para encodificar um sinal de áudio; decodificador para decodificar um sinal de áudio; método para decodificar um sinal de áudio; aparelho; dispositivo eletrônico; produto de programa de comoputador configurado para realizar um método para encodificar e para decodificar um sinal de áudio
KR100970446B1 (ko) 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
BRPI0510014B1 (pt) Dispositivo de codificação, dispositivo de decodificação e método do mesmo
EP3608910B1 (en) Decoding device and method, and program
JPH09261064A (ja) 符号器及び復号器
JP2004053940A (ja) オーディオ復号化装置およびオーディオ復号化方法

Legal Events

Date Code Title Description
B25D Requested change of name of applicant approved

Owner name: NEC CORPORATION (JP) , PANASONIC CORPORATION (JP)

Free format text: NOME ALTERADO DE: MATSUSHITA ELECTRIC INDUSTRIAL CO., LTD.

B15K Others concerning applications: alteration of classification

Ipc: G10L 19/02 (2000.01), G10L 21/038 (2013.01)

B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]