BRPI0305710B1 - "apparatus and method of decoding of audio" - Google Patents

"apparatus and method of decoding of audio" Download PDF

Info

Publication number
BRPI0305710B1
BRPI0305710B1 BRPI0305710-0A BRPI0305710A BRPI0305710B1 BR PI0305710 B1 BRPI0305710 B1 BR PI0305710B1 BR PI0305710 A BRPI0305710 A BR PI0305710A BR PI0305710 B1 BRPI0305710 B1 BR PI0305710B1
Authority
BR
Brazil
Prior art keywords
signal
subband
amplitude
information
time
Prior art date
Application number
BRPI0305710-0A
Other languages
English (en)
Inventor
Tsushima Mineo
Tanaka Naoya
Norimatsu Takeshi
Seng Chong Kok
Hann Kuah Kim
Hong Neo Sua
Nomura Toshiyuki
Shimada Osamu
Takamizawa Yuichiro
Serizawa Masahiro
Original Assignee
Panasonic Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=31492144&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI0305710(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Panasonic Corporation filed Critical Panasonic Corporation
Publication of BRPI0305710B1 publication Critical patent/BRPI0305710B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

"aparelho de decodificação de áudio e método de decodificação de áudio". a invenção refere-se a um sinal de áudio de alta qualidade, de banda larga, decodificado com poucos cálculos a uma baixa taxa de bits. os componentes de espectro indesejados que acompanham a injeção de sinal senoidal por um filtro de sub-banda de síntese construído com operações de valor real são suprimidos pela inserção de um sinal de supressão nas sub-bandas adjacentes à sub-banda na qual a onda senoidal é injetada. isto toma possível injetar uma senóide desejada com poucos cálculos.

Description

Relatório Descritivo da Patente de Invenção para "APARELHO E MÉTODO DE DECODIFICAÇÃO DE ÁUDIO".
Campo da Invenção [001] A presente invenção refere-se a um aparelho de decodifi-cação e a um método de decodificação para um sistema de expansão de largura de banda de áudio para gerar um sinal de áudio de banda larga a partir de um sinal de áudio de banda estreita pela adição de informações adicionais que contêm poucas informações, e refere-se à tecnologia que permite que este sistema proporcione uma reprodução de alta qualidade de áudio com poucos cálculos. Técnica Anterior [002] Muitas tecnologias de codificação de áudio para codificar um sinal de áudio em um pequeno tamanho de dados e então reproduzir o sinal de áudio a partir do fluxo de bits codificado são conhecidas. O padrão internacional ISO/IEC 13818-7 (MPEG-2 AAC) em particular é conhecido como um método superior que permite uma reprodução de alta qualidade de áudio com um pequeno tamanho de código. Este método de codificação AAC é também utilizado no sistema ISO/IEC 14496-3 (MPEG-4 Áudio) mais recente.
[003] Os métodos de codificação de áudio tais como o AAC convertem um sinal de áudio discreto a partir do domínio do tempo para um sinal no domínio da frequência pela amostragem do sinal do domínio do tempo em intervalos de tempo específicos, dividindo as informações de frequência convertidas em bandas de frequência plurais, e então codificando o sinal pela quantificação de cada uma das bandas de frequência com base em uma distribuição de dados apropriada. Para a decodificação, as informações de frequência são recriadas a partir do fluxo de códigos, e o som de reprodução é obtido pela conversão das informações de frequência em um sinal de domínio do tempo. Se a quantidade de informações suprida para a codificação for pequena (tal como na codificação de baixa taxa de bits), o tamanho dos dados alocados para cada uma das bandas de frequência segmentadas no processo de codificação diminui, e algumas bandas de frequência podem como um resultado não conter nenhuma informação. Neste caso o processo de decodificação produz o áudio de reprodução sem som no componente de frequência da banda de frequência que não contém nenhuma informação.
[004] Em geral, como a sensibilidade ao som com uma frequência acima de aproximadamente 10 kHz é mais baixa que ao som em frequências mais baixas, os dados de componentes de alta frequência são geralmente diminuídos para prover uma reprodução de áudio de banda estreita se o esquema de codificação de áudio distribuir as informações por um processo baseado na percepção audível humana.
[005] Se os dados forem supridos a uma taxa de bits de aproximadamente 96 kbps, mesmo o método AAC pode codificar um sinal estéreo de 44,1 kHz para uma banda de aproximadamente 16 kHz, mas se os dados forem codificados com dados supridos na metade desta taxa, isto é, 48 kbps, a largura de banda que pode ser quantificada e codificada enquanto mantendo a qualidade do som é reduzida a no máximo aproximadamente 10 kHz. Além de ser de banda estreita, o som reproduzido codificado com uma baixa taxa de bits de 48 kbps também soa nebuloso.
[006] Um método que permite uma reprodução em banda larga pela adição de uma pequena quantidade de informações adicionais a um fluxo de códigos para uma reprodução de áudio de banda estreita está descrito, por exemplo, no Relatório Descritivo de Digital Radio Mondiale (DRM) System (ETSI TS 101 980) publicado pelo European Telecommunication Standards Institute (ETSI). Uma tecnologia similar conhecida como SBR (replicação de banda espectral) é descrita, por exemplo, nos documentos da convenção da AES (Audio Engineering Society) 5553, 3339, 5560 (112â Convenção, 10 - 13 de Maio de 2002, Munique, Alemanha).
[007] A Figura 2 é um diagrama de blocos esquemático de um exemplo de um decodificador para expansão de banda que utiliza a SBR. O fluxo de bits de entrada 206 é separado pelo demultiplexador de fluxo de bits 201 em informações de componente de baixa frequência 207, informações de componente de alta frequência 208, e informações de adição de onda senoidal 209. As informações de componente de baixa frequência 207 são, por exemplo, informações codificadas utilizando o MPEG-4 AAC ou outro método de codificação, e são decodificadas pelo decodificador de banda baixa 202 por meio de que um sinal de tempo que representa o componente de baixa frequência é gerado. Este sinal de tempo que representa o componente de baixa frequência é separado em múltiplas (M) sub-bandas pelo banco de filtros de análise 203 e inserido no gerador de sinal de alta frequência 204.
[008] O gerador de sinal de alta frequência 204 compensa o componente de alta frequência perdido devido à limitação de largura de banda copiando o sinal de sub-banda de baixa frequência que representa o componente de baixa frequência para uma sub-banda de alta frequência. As informações do componente de alta frequência 208 inseridas no gerador de sinal de alta frequência 204 contêm as informações de ganho para a sub-banda de alta frequência compensada de modo que o ganho é ajustado para cada sub-banda de alta frequência gerada.
[009] Um gerador de sinal 211 adicional gera um sinal de injeção 212 por meio de que uma onda senoidal de ganho controlado é adicionada a cada sub-banda de alta frequência. O sinal de sub-banda de alta frequência gerado pelo gerador de sinal de alta frequência 204 é então inserido com o sinal de sub-banda de baixa frequência no banco de filtros de síntese 205 para a síntese da banda, e o sinal de saída 210 é gerado. A contagem de sub-banda no lado do banco de filtros de síntese não precisa ser a mesma que o número de sub-bandas no lado do banco de filtros de análise. Por exemplo, se na Figura 2 N = 2M, a frequência de amostragem do sinal de saída será o dobro da frequência de amostragem do sinal de tempo inserido no banco de filtros de análise.
[0010] Nesta configuração as informações contidas nas informações do componente de alta frequência 208 ou nas informações de adição de onda senoidal 209 refere-se somente ao controle de ganho, e a quantidade de informações requeridas é portanto muito pequena comparada com as informações do componente de baixa frequência 207, as quais também contêm informações espectrais. Este método portanto é adequado para codificar um sinal de banda larga a uma baixa taxa de bits.
[0011] O banco de filtros de síntese 205 na Figura 2 é composto de filtros que recebem tanto uma entrada de número real quanto uma entrada de número imaginário para cada sub-banda, e executam um cálculo de valor complexo.
[0012] O decodificador configurado como acima para a expansão de banda tem dois filtros, o banco de filtros de análise e o banco de filtros de síntese, que executam cálculos de valor complexo, e a decodifica ção requer muitos cálculos. Um problema quando o decodificador é construído para dispositivos de LSI, por exemplo, é que o consumo de energia aumenta e o tempo de reprodução que é possível com uma dada capacidade de suprimento de energia diminui. Como os sinais que se ouve na saída do banco de filtros de síntese são sinais de número real, o banco de filtros de síntese pode ser configurado com bancos de filtros de números reais de modo a reduzir os cálculos. Apesar disto reduzir o número de cálculos, se uma onda senoidal for adiciona- da utilizando o mesmo método que quando o banco de filtros de síntese executa os cálculos de valor complexo, uma onda senoidal pura não é realmente adicionada e o resultado pretendido não é conseguido no áudio reproduzido.
[0013] A presente invenção está portanto direcionada a resolver estes problemas da técnica anterior, e provê um aparelho e método de decodificação para um sistema de expansão de banda que opera com poucos cálculos pela utilização de um banco de filtros de cálculo de valor real por meio de que a reprodução de áudio pretendida é conseguida pela adição de uma ligeira mudança em um sinal de geração de onda senoidal adicionado tal como seria inserido para um banco de filtros de cálculo de valor complexo.
Descrição da Invenção [0014] A presente invenção provê um aparelho de decodificação de áudio para decodificar um sinal de áudio de um fluxo de bits, o fluxo de bits contendo as informações codificadas sobre um sinal de áudio de banda estreita e informações adicionais para expandir o sinal de banda estreita para um sinal de banda larga, e as informações adicionais contendo informações de componente de alta frequência que denotam uma característica de uma banda de frequência mais alta do que a banda das informações codificadas, e informações de adição de senóide que denotam um sinal senoidal adicionado a uma banda de frequência específica, o aparelho de decodificação de áudio compreendendo: um demultiplexador de fluxo de bits para demultiplexar as informações codificadas e as informações adicionais do fluxo de bits; um meio de decodificação para decodificar um sinal de áudio de banda estreita a partir das informações codificadas demultiple-xadas; um filtro de sub-banda de análise para separar o sinal de áudio de banda estreita em múltiplos primeiros sinais de sub-banda; um gerador de sinal de alta frequência para gerar múltiplos segundos sinais de sub-banda em uma banda de frequência mais alta do que a banda das informações adicionais codificadas a partir de pelo menos um primeiro sinal de sub-banda e informações de componente de alta frequência das informações adicionais demultiplexadas; um meio de adição de sinal senoidal para adicionar um sinal senoidal a uma sub-banda específica dos múltiplos segundos sinais de sub-banda com base nas informações de adição de senóide das informações adicionais demultiplexadas; um gerador de sinal de compensação para gerar, com base na característica de fase e na característica de amplitude do sinal senoidal, um sinal de compensação para suprimir os sinais de componente de contorno produzidos em sub-bandas próximo de uma sub-banda específica como um resultado da adição de um sinal senoidal; e um filtro de sub-banda de síntese de cálculo de valor real para combinar os primeiros sinais de sub-banda e os segundos sinais de sub-banda para obter um sinal de áudio de banda larga.
[0015] Assim compreendida, uma reprodução de áudio de alta qualidade pode ser conseguida a uma baixa taxa de bits utilizando poucos cálculos.
Breve Descrição dos Desenhos [0016] Figura 1 é um diagrama de blocos esquemático que mostra um exemplo de um aparelho de decodificação de áudio de acordo com a presente invenção;
Figura 2 mostra um exemplo da configuração de um aparelho de decodificação de áudio da técnica anterior;
Figura 3 mostra um exemplo de um gerador de sinal adicional para descrever o princípio da presente invenção;
Figura 4 mostra um exemplo de um gerador de sinal adido- nal em uma primeira modalidade da presente invenção;
Figuras 5A e 5B, cada uma mostra um exemplo de um sinal de valor complexo injetado;
Figura 6 mostra exemplos dos sinais de injeção gerados pelo gerador de sinal adicional mostrado na Figura 3;
Figura 7 mostra somente a parte de número real dos sinais de injeção gerados pelo gerador de sinal adicional mostrado na Figura 3;
Figura 8 mostra exemplos de sinais de injeção e de sinais de compensação gerados pelo gerador de sinal adicional e pelo gerador de sinal de compensação mostrados na Figura 4;
Figura 9 é um diagrama de espectro de quando uma onda senoidal para somente a parte de valor real é injetada no filtro de síntese de valor real;
Figura 10 é um diagrama de espectro de quando uma onda senoidal para somente a parte de valor real e um sinal de compensação são injetados no filtro de síntese de valor real;
Figura 11 mostra outro exemplo do sinal de injeção e do sinal de compensação mostrados como exemplos na Figura 8;
Figura 12 mostra um exemplo do gerador de sinal adicional em uma segunda modalidade da presente invenção; e Figura 13 é um diagrama de blocos que mostra o princípio da presente invenção.
Melhor Modo para Executar a Invenção [0017] A Figura 13 é um diagrama de blocos que mostra os princípios da presente invenção. A música e outros sinais de áudio contêm um componente de banda de baixa frequência e um componente de banda de alta frequência. As informações de sinal de áudio codificadas são carregadas pelo componente de banda de baixa frequência, e as informações de tom (as informações senoidais) e as informações de ganho são carregadas pelo componente de banda de alta frequência. O receptor decodifica o sinal de áudio do componente de banda de baixa frequência, mas para o componente de banda de alta frequência, copia e processa o componente de banda de baixa frequência utilizando as informações de tom e as informações de ganho para sintetizar um pseudo-sinal de áudio. As informações de fase e as informações de amplitude são necessárias para sintetizar este pseudo-sinal de áudio, e a síntese assim requer um cálculo de valor complexo. Como os cálculos de valor complexo requerem operações tanto na parte de número real quanto na parte de número imaginário, o processo de cálculo é complexo e demorado. Para simplificar este processo de cálculo a presente invenção opera utilizando somente a parte de número real. No entanto, se os cálculos forem feitos utilizando somente a parte de valor real para certas sub-bandas, sinais de ruído aparecem nas sub-bandas adjacentes mais alta e mais baixa. Um sinal de compensação para cancelar estes sinais de ruído é gerado utilizando as informações de fase, as informações de amplitude, e as informações de tempo contidas nas informações de tom.
[0018] Um aparelho e método de decodificação de áudio de acordo com uma modalidade preferida da presente invenção estão abaixo descritos com referência às figuras acompanhantes.
Modalidade 1 [0019] A Figura 1 é um diagrama esquemático que mostra um aparelho de decodificação que executa uma expansão de largura de banda por meio de replicação de banda espectral (SBR) com base em uma primeira modalidade da presente invenção.
[0020] O fluxo de bits de entrada 106 é demultiplexado pelo de-multiplexador de fluxo de bits 101 em informações de componente de baixa frequência 107, informações de componente de alta frequência 108, e informações de adição de sinal senoidal 109. As informações de componente de baixa frequência 107 são informações que são codificadas utilizando, por exemplo, o método de codificação MPEG-4 AAC, são decodificadas pelo decodificador de baixa frequência 102, e um sinal de tempo que representa o componente de baixa frequência é gerado. O sinal de tempo resultante que representa o componente de baixa frequência é então dividido em múltiplas (M) sub-bandas pelo banco de filtros de análise 103, e inserido no meio de expansão de largura de banda (gerador de sinal de alta frequência) 104. O gerador de sinal de alta frequência 104 copia o sinal de sub-banda de baixa frequência que representa o componente de baixa frequência para uma sub-banda de alta frequência para compensar o componente de alta frequência perdido pelo limite de largura de banda. As informações do componente de alta frequência 108 inseridas no gerador de sinal de alta frequência 104 contém as informações de ganho para a sub-banda de alta frequência a ser gerada, e o ganho é ajustado para cada sub-banda de alta frequência gerada.
[0021] Um gerador de sinal 111 adicional produz um sinal de injeção 112 de modo que uma onda senoidal de ganho controlado é adicionada a cada sub-banda de alta frequência de acordo com as informações de adição de sinal senoidal (também denominadas informações de tom) 109. Os sinais de sub-banda de alta frequência gerados pelo gerador de sinal de alta frequência 104 são inseridos com os sinais de sub-banda de baixa frequência no banco de filtros de síntese 105 para uma síntese de banda, resultando no sinal de saída 110. O número de sub-bandas no banco de filtros de síntese não precisa coincidir com o número de sub-bandas do lado do banco de filtros de análise. Por exemplo, se na Figura 1 N = 2M, a frequência de amostragem do sinal de saída será o dobro da frequência de amostragem do sinal de tempo inserido no banco de filtros de análise.
[0022] O fluxo de bits de entrada 106 contém informações codifi- cadas de banda estreita para o sinal de áudio (isto é, informações de componente de baixa frequência 107) e informações adicionais para expandir este sinal de banda estreita em um sinal de banda larga (isto é, informações de componente de alta frequência 108 e informações de adição de sinal senoidal 109).
[0023] O banco de filtros de síntese 105 do aparelho de decodifi-cação mostrado na Figura 1 é composto de filtros de cálculo de valor real. Será também óbvio que um filtro de cálculo de valor complexo que pode executar cálculos de valor real poderia ser utilizado.
[0024] O aparelho de decodificação mostrado na Figura 1 também tem um gerador de sinal de compensação 114 para gerar um sinal de compensação 113 para compensar a diferença que resulta da adição do sinal senoidal.
[0025] O fluxo de bits de entrada 106 é demultiplexado pelo de-multiplexador de fluxo de bits 101 em informações de componente de baixa frequência 107, informações de componente de alta frequência 108, e informações de adição de sinal senoidal 109.
[0026] As informações de componente de baixa frequência 107 são, por exemplo, um fluxo de bits codificado em MPEG-4 AAC, MPEG-1 Áudio, ou MPEG-2 Áudio que são decodificadas por um de-codificador de baixa frequência 102 que tem uma função de decodificação compatível, e um sinal de tempo que representa o componente de baixa frequência é gerado. O sinal de tempo resultante que representa o componente de baixa frequência é então dividido em múltiplas (M) primeiras sub-bandas S1 pelo banco de filtros de análise 103, e inserido no gerador de sinal de alta frequência 104. O banco de filtros de análise 103 e o banco de filtros de síntese 105 abaixo descritos são construídos de um banco de filtros polifásicos ou um conversor MDCT. Os bancos de filtros de divisão de banda são conhecidos para alguém versado na técnica relativa.
[0027] Os primeiros sinais de sub-banda S1 para o componente de sinal de baixa frequência do banco de filtros de análise 103 são emitidos diretamente pelo gerador de sinal de alta frequência 104 e também enviados para a parte de síntese. A parte de geração de sinal de alta frequência do gerador de sinal de alta frequência 104 recebe os sinais da primeira sub-banda S1 e utilizando as informações de componente de alta frequência 108, o sinal de injeção 112, e o sinal de compensação 113, gera sinais de múltiplas segundas sub-bandas S2. Os segundos sinais de sub-banda S2 estão em uma banda de frequência mais alta do que os primeiros sinais de sub-banda S1. As informações de componente de alta frequência 108 incluem informações que indicam quais dos primeiros sinais de sub-banda S1 devem ser copiados, e quais dos segundos sinais de sub-banda S2 devem ser gerados, e as informações de controle de ganho que indicam quanto do primeiro sinal de sub-banda S1 copiado deve ser amplificado.
[0028] Se não existirem informações de adição de sinal senoidal 109 ou nenhum sinal realmente gerado utilizando as informações de adição de sinal senoidal 109, o banco de filtros de síntese 105 com N (onde N é maior ou igual a M) filtros de síntese de sub-banda combinam os sinais de sub-banda de largura de banda expandida do gerador de sinal de alta frequência 104 e o componente de sinal de baixa frequência do banco de filtros de análise 103 para produzir um sinal de saída de banda larga 110.
[0029] Nesta primeira modalidade da invenção o banco de filtros de síntese 105 é um banco de filtros de cálculo de valor real. Isto é, o banco de filtros de síntese 105 não utiliza uma entrada de número imaginário, somente tem uma parte de entrada de número real, e utiliza filtros que executam cálculos de valor real. Este banco de filtros de síntese 105 é portanto mais simples e opera mais rápido do que um filtro que opera com cálculos de valor complexo.
[0030] Se existirem informações de adição de sinal senoidal 109, as informações de adição de sinal senoidal 109 são inseridas no gerador de sinal adicional 111 por meio de que o sinal de injeção 112 é gerado, e adicionado ao sinal de saída do gerador de sinal de alta frequência 104. As informações de adição de sinal senoidal 109 são também inseridas no gerador de sinal de compensação 114 por meio de que um sinal de compensação 113 é produzido, e similarmente adicionado ao sinal de saída do gerador de sinal de alta frequência 104.
[0031] O sinal de saída do gerador de sinal de alta frequência 104 é inserido no banco de filtros de síntese 105. O banco de filtros de síntese 105 emite o sinal de saída 110 independente se existe um sinal adicionado com base nas informações de adição de sinal senoidal 109.
[0032] A geração do sinal de injeção 112 e do sinal de compensação 113 com base nas informações de adição de sinal senoidal 109 está abaixo descrita em mais detalhes utilizando a Figura 3 e a Figura 4.
[0033] A Figura 3 mostra o gerador de sinal adicional 111 utilizado no método de decodificação de áudio descrevendo o princípio básico da presente invenção, e a Figura 4 mostra o gerador de sinal adicional 111 e o gerador de sinal de compensação 114 em uma primeira modalidade da presente invenção.
[0034] O gerador de sinal adicional 111 é descrito primeiro com referência à Figura 3. As informações contidas nas informações de adição de sinal senoidal 109 incluem as informações de número de sub-bandas injetadas denotando para qual banco de filtros de síntese a onda senoidal é injetada, as informações de fase denotando a fase na qual o sinal senoidal injetado inicia, as informações de tempo denotando o momento no qual o sinal senoidal injetado inicia, e as informações de amplitude denotando a amplitude do sinal senoidal injetado.
[0035] Um meio de extração de informações de sub-banda injetada 406 extrai o número de sub-bandas injetadas. O meio de extração de informações de fase 402 determina, com base nas informações de fase se as informações de fase estão contidas nas informações de adição de sinal senoidal 109, a fase na qual o sinal senoidal injetado inicia. Se as informações de fase não estiverem contidas nas informações de adição de sinal senoidal 109, o meio de extração de informações de fase 402 determina a fase na qual o sinal senoidal injetado inicia com consideração pela continuidade para a fase do quadro de tempo anterior.
[0036] O meio de extração de amplitude 403 extrai as informações de amplitude. O meio de extração de tempo 404 extrai as informações de tempo que indicam em qual momento iniciar a injeção de onda senoidal e em qual momento terminar a injeção quando uma onda senoidal é injetada no banco de filtros de síntese.
[0037] Com base nas informações do meio de extração de informações de fase 402, do meio de extração de amplitude 403, e do meio de extração de tempo 404, o meio de geração de senóide 405 gera a onda senoidal (sinal de tom) a ser injetada. Deve ser notado que a frequência da onda senoidal gerada pode ser desejavelmente ajustada para, por exemplo, a frequência central da sub-banda ou uma frequência deslocada de um deslocamento predeterminado da frequência central. Ainda, a frequência poderia ser preajustada de acordo com o número de sub-banda da sub-banda injetada, por exemplo, uma onda senoidal para o limite de frequência superior ou inferior da sub-banda poderia ser gerada conforme o número da sub-banda fosse ímpar ou par. É abaixo assumido que uma onda senoidal com a frequência central da sub-banda é produzida, isto é, um sinal periódico com quatro períodos de amostragem de sinal de sub-banda é produzido.
[0038] O meio de injeção de onda senoidal 407 insere a saída de onda senoidal do meio de geração de senóide 405 para a sub-banda de filtro de síntese coincidindo com o número adquirido pelo meio de extração de informações de sub-banda injetada 406. O sinal de saída do meio de injeção de onda senoidal 407 é o sinal de injeção 112.
[0039] Considere um sinal de valor complexo com quatro períodos e amplitude S injetado na sub-banda K como mostrado na tabela da Figura 6. Os valores denotados (a, b) na tabela significam o sinal de valor complexo a + jb onde j é uma valor imaginário. Referindo à Figura 5A, o sinal inserido na sub-banda K na Figura 6 é um sinal periódico que muda 501, 502, 503, 504 na Figura 5A devido à relação entre a parte de valor real e a parte de valor imaginário.
[0040] Se, ao contrário da presente invenção, o banco de filtros de síntese for um filtro que recebe uma entrada de valor complexo e executa cálculos de valor complexo, o sinal de saída do sistema de deco-dificação obtido por este sinal de injeção tem um único espectro de frequência e uma assim chamada onda senoidal pura é injetada. No entanto, se o banco de filtros de síntese for um filtro que recebe somente uma entrada de valor real e executa somente cálculos de valor real como na presente invenção, um sinal de número real que não contém a parte de número imaginário mostrado na Figura 6 é injetado na sub-banda K como mostrado na Figura 7. Com este sinal de injeção o sistema de decodificação que utiliza um filtro de síntese que recebe somente valores reais emite um único espectro de frequência como mostrado na Figura 9 (espectro 902 da onda senoidal injetada) e espectros indesejados nas bandas acima e abaixo do espectro de onda senoidal (espectro indesejado 903). Isto é porque um filtro de síntese que utiliza o cálculo de valor real não pode eliminar completamente a fuga de espectro em sub-bandas adjacentes devido às características do filtro, e estas fugas de espectro aparecem como componentes de contorno.
[0041] Provendo um gerador de sinal de compensação 114 como mostrado na Figura 4 além do gerador de sinal adicional 111 mostrado na Figura 3 em um banco de filtros de síntese que utiliza o cálculo de valor real com somente uma entrada de valor real, os componentes de espectro indesejados mostrados na Figura 9 podem ser removidos.
[0042] O gerador de sinal adicional 111 e o gerador de sinal de compensação 114 de acordo com a presente invenção são descritos a seguir com referência à Figura 4. Na Figura 4 as informações de adição de sinal senoidal 109, o meio de extração de informações de fase 402, o meio de extração de amplitude 403, o meio de extração de tempo 404, o meio de geração de senóide 405, o meio de extração de informações de sub-banda injetada 406, o meio de injeção de onda senoidal 407, e o sinal de injeção 408 são os mesmos como descritos com referência à Figura 3. O que difere da Figura 3 é a adição de um meio de determinação de informações de sub-banda de compensação 409 e um gerador de sinal de compensação 410.
[0043] O meio de determinação de informações de sub-banda de compensação 409 determina a sub-banda a ser compensada com base nas informações obtidas pelo meio de extração de informações de sub-banda injetada 406 que indica o número do banco de filtros de síntese no qual a onda senoidal é injetada. A sub-banda a ser compensada é uma sub-banda próxima da sub-banda na qual a onda senoidal é injetada, e pode ser uma sub-banda de alta frequência ou uma sub-banda de baixa frequência. A sub-banda de alta frequência e a sub-banda de baixa frequência a serem compensadas variarão de acordo com as características do banco de filtros de síntese 105, mas são aqui assumidas serem as sub-bandas adjacentes à sub-banda da onda senoidal injetada. Por exemplo, quando a onda senoidal é injetada na sub-banda K, a sub-banda K+1 e a sub-banda K-1 são, respectivamente, a sub-banda de alta frequência e a sub-banda de baixa fre- quência a serem compensadas.
[0044] O gerador de sinal de compensação 410 gera um sinal que cancela o espectro de contorno na sub-banda compensada com base na saída do meio de extração de informações de fase 402, no meio de extração de amplitude 403, e no meio de extração de tempo 404, e emite este sinal como o sinal de compensação 113. Este sinal de compensação 113 é adicionado ao sinal de entrada para o banco de filtros de síntese 105 no mesmo modo que o sinal de injeção 112. A amplitude S e a fase do sinal de compensação 113 são ajustadas para a sub-banda K-1 e a sub-banda K+1 como mostrado na tabela na Figura 8.
[0045] Na Figura 8 Alfa e Beta são valores determinados de acordo com as características do banco de filtros de síntese específico, e mais especificamente são determinados com consideração pela quantidade de fuga de espectro para as sub-bandas adjacentes no banco de filtros.
[0046] Como será conhecido da Figura 8, se um sinal senoidal for adicionado à sub-banda K, a amplitude de um sinal senoidal do período de ciclo T é amplitude S no tempo 0, a amplitude 0 no tempo 1T/4, a amplitude -S no tempo 2T/4, e a amplitude 0 no tempo 3T/4. Um sinal de compensação é aplicado na sub-banda K-1 e na sub-banda K+1. Nos desenhos, TEMPOs 0, 1, 2 e 3 correspondem aos tempos 0, 1T/4, 2T/4 e 3T/4, respectivamente.
[0047] O sinal de compensação aplicado na sub-banda K-1 tem uma amplitude 0 no tempo 0, uma amplitude Alfa*S no tempo 1T/4, uma amplitude 0 no tempo 2T/4, e uma amplitude Beta*S no tempo 3T/4.
[0048] O sinal de compensação aplicado na sub-banda K+1 tem uma amplitude 0 no tempo 0, uma amplitude Beta*S no tempo 1T/4, uma amplitude 0 no tempo 2T/4, e uma amplitude Alfa*S no tempo 3Τ/4.
[0049] A Figura 10 é um gráfico de espectro para a onda senoidal injetada por uma modalidade preferida desta invenção. Como será conhecido da Figura 10, o componente de espectro indesejado 903 observado na Figura 9 é suprimido.
[0050] Pela introdução deste sinal de compensação, os componentes de espectro indesejado não são produzidos mesmo se um sinal senoidal for injetado em um banco de filtros de valor real, e uma onda senoidal pode ser injetada em uma sub-banda desejada com cálculos mínimos.
[0051] A invenção foi descrita com referência a um sinal senoidal injetado na sub-banda K onde a fase inicial é 0 e ou a parte de valor real ou a parte de valor imaginário vai para 0 como mostrado na Figura 5A. Como mostrado na Figura 5B, no entanto, a presente invenção pode também ser aplicada quando a fase é deslocada de δ do estado mostrado na Figura 5A. A relação entre o sinal de injeção e o sinal de compensação neste caso pode ser expressa como mostrado na tabela na Figura 11, por exemplo, onde S, P, e Q são valores determinados de acordo com as características do banco de filtros com consideração pela quantidade de fuga de espectro pelo banco de filtros para as sub-bandas adjacentes.
[0052] Mais ainda, para uma sub-banda K na qual a onda senoidal é injetada um sinal de compensação é injetado nas sub-bandas K-1 e K+1 adjacentes, mas outras sub-bandas adjacentes do que a K-1 e K+1 podem necessitar de correção dependendo das características do filtro de síntese. Neste caso o sinal de compensação é simplesmente injetado nas sub-bandas que necessitam da correção.
Modalidade 2 [0053] A Figura 12 é um diagrama esquemático que mostra um gerador de sinal adicional em uma segunda modalidade da presente invenção. Este gerador de sinal adicional difere do gerador de sinal adicional 111 mostrado na Figura 4 pelo fato de que informações in-terpoladas 1201 calculadas pelo meio de geração de senóide 405 são inseridas no gerador de sinal de compensação 410 de modo que o sinal de compensação 113 é calculado com base nas informações inter-poladas 1201.
[0054] O meio de geração de senóide 405 na primeira modalidade acima ajusta a amplitude da onda senoidal gerada com base somente nas informações de amplitude do quadro atual extraídas pelo meio de extração de amplitude 403. O meio de geração de senóide 405 desta segunda modalidade, no entanto, interpola as informações de amplitude utilizando as informações de amplitude dos quadros vizinhos, e ajusta a amplitude da onda senoidal gerada com base nestas informações de amplitude interpoladas.
[0055] Como a amplitude da onda senoidal gerada muda suavemente como um resultado deste processo, a qualidade de som observado do sinal de saída pode ser aperfeiçoada.
[0056] Como a amplitude da onda senoidal gerada é mudada por interpolação com esta configuração, a amplitude do sinal de compensação correspondente deve também ser ajustada. Portanto, as informações interpoladas emitidas pelo meio de geração de senóide 405 são também inseridas no gerador de sinal de compensação 410 para ajustar a amplitude do sinal de compensação 113 sincronizada com a amplitude variável interpolada da onda senoidal.
[0057] Esta configuração da invenção pode calcular corretamente o sinal de compensação e suprime os componentes de espectro inde-sejados mesmo quando a amplitude da onda senoidal gerada é interpolada.
[0058] Ficará também aparente que o processo do aparelho de decodificação de áudio mostrado na Figura 1 pode também ser escrito em software utilizando uma linguagem de programação. Além disso, este programa de software pode ser gravado e distribuído por um meio de gravação de dados.
[0059] Quando utilizando um banco de filtros de síntese que reduz o número de operações utilizando somente os cálculos de valor real, os componentes de espectro indesejados que acompanham a adição de onda senoidal podem ser suprimidos e somente a onda senoidal desejada pode ser injetada pela injeção de um sinal de compensação na sub-banda de baixa frequência ou de alta frequência da sub-banda à qual a onda senoidal é adicionada.
REIVINDICAÇÕES

Claims (12)

1. Aparelho de decodificação de áudio para decodificar um sinal de áudio a partir de um fluxo de bits (106), o fluxo de bits contendo as informações codificadas sobre um sinal de áudio de banda estreita (107) e informações adicionais (108, 109) para expandir o sinal de banda estreita (107) para um sinal de banda larga, e as informações adicionais (108, 109) contendo informações de componente de alta frequência (108) que denotam uma característica de uma banda de frequência mais alta do que a banda das informações codificadas, e informações de adição de senóide (109) que denotam um sinal senoidal adicionado a uma banda de frequência específica, caracterizado pelo fato de que o aparelho de decodificação de áudio compreende: um demultiplexador de fluxo de bits (101) operável para demultiplexar as informações codificadas e as informações adicionais (108,109) a partir do fluxo de bits (106); um decodificador (102) operável para decodificar um sinal de áudio de banda estreita (107) a partir das informações codificadas demultiplexadas; um filtro de sub-banda de análise (103) operável para separar o sinal de áudio de banda estreita (107) em um primeiro sinal de sub-banda composto de uma pluralidade de sinais de sub-banda; um gerador de sinal senoidal adicional (111) operável para adicionar um sinal senoidal a uma sub-banda específica em uma banda de frequência mais alta do que a banda de frequência das informações codificadas com base nas informações de adição de senoide (109) a partir das informações adicionais (108,109) demultiplexadas; um gerador de sinal de correção (114) operável para gerar, com base na característica de fase e na característica de amplitude do sinal senoidal, um sinal de correção adicionado em sub-bandas próximas de uma sub-banda específica para suprimir os sinais de componente de contorno que produzidos nas sub-bandas próximas da sub-banda específica; um gerador de sinal de alta frequência (104) operável para gerar um segundo sinal de sub-banda composto de uma pluralidade de sinais de sub-banda em uma banda de frequência mais alta do que a banda de frequência das informações codificadas a partir do primeiro sinal de sub-banda e das informações de componentes de alta frequência (108) nas informações adicionais (108, 109) demultiplexadas, e adicionar o sinal senoidal e o sinal de correção ao segundo sinal de sub-banda; e um filtro de sub-banda de síntese de cálculo de valor real (105) operável para combinar o primeiro sinal de sub-banda e o segundo sinal de sub-banda para obter o sinal de áudio de banda larga.
2. Aparelho de decodificação de áudio, de acordo com a reivindicação 1, caracterizado pelo fato de que o componente de contorno contém pelo menos componentes suprimidos após a síntese por um filtro de sub-banda de síntese que executa cálculos de valor complexo.
3. Aparelho de decodificação de áudio, de acordo com a reivindicação 1, caracterizado pelo fato de que o primeiro sinal de sub-banda é composto de sinal de sub-banda de baixa frequência, e o segundo sinal de sub-banda é composto de sinal de sub-banda de alta frequência.
4. Aparelho de decodificação de áudio, de acordo com a reivindicação 1, caracterizado pelo fato de que o sinal de correção gerado pelo gerador de sinal de correção (114) suprime os sinais de componente de contorno produzidos em uma sub-banda adjacente à sub-banda à qual o sinal senoidal é adicionado.
5. Aparelho de decodificação de áudio, de acordo com a reivindicação 1, caracterizado pelo fato de que a amplitude do sinal de correção gerado pelo gerador de sinal de correção (114) é ajustada em sincronização com a amplitude do sinal senoidal.
6. Aparelho de decodificação de áudio, de acordo com a reivindicação 4, caracterizado pelo fato de que quando o sinal senoidal é adicionado à sub-banda K, um sinal senoidal de período T tem amplitude S no tempo 0, amplitude 0 no tempo 1T/4, amplitude -S no tempo 2T/4, e amplitude 0 no tempo 3T/4, e o sinal de correção é aplicado na sub-banda K-1 e na sub-banda K+1, o sinal de correção aplicado na sub-banda K-1 tem amplitude 0 no tempo 0, amplitude Alfa*S no tempo 1T/4, amplitude 0 no tempo 2T/4, e amplitude Beta*S no tempo 3T/4, e o sinal de correção aplicado na sub-banda K+1 tem amplitude 0 no tempo 0, amplitude Beta*S no tempo 1T/4, amplitude 0 no tempo 2T/4, e amplitude Alfa*S no tempo 3T/4, onde Alfa e Beta são constantes.
7. Método de decodificação de áudio para decodificar um sinal de áudio de um fluxo de bits (106), o fluxo de bits contendo as informações codificadas sobre um sinal de áudio de banda estreita (107) e informações adicionais (108, 109) para expandir o sinal de banda estreita (107) para um sinal de banda larga, e as informações adicionais (108, 109) contendo informações de componente de alta frequência (108) que denotam uma característica de uma banda de frequência mais alta do que a banda das informações codificadas, e informações de adição de senóide (109) que denotam um sinal senoidal adicionado a uma banda de frequência específica, caracterizado pelo fato de que o método de decodificação de áudio compreende: demultiplexar as informações codificadas e as informações adicionais (108,109) do fluxo de bits (106); decodificar um sinal de áudio de banda estreita (107) a partir das informações codificadas demultiplexadas; separar o sinal de áudio de banda estreita (107) em um primeiro sinal de sub-banda composto de uma pluralidade de sinais de sub-banda; adicionar um sinal senoidal a uma sub-banda específica em uma banda de frequência mais alta do que a banda de frequência das informações codificadas com base nas informações de adição de se-nóide (109) das informações adicionais (108,109) demultiplexadas; gerar, com base na característica de fase e na característica de amplitude do sinal senoidal, um sinal de correção adicionado em sub-bandas próximas de uma sub-banda específica para suprimir os sinais de componente de contorno produzidos em sub-bandas próximas de uma sub-banda específica; gerar um segundo sinal de sub-banda composto de uma pluralidade de sinais de sub-banda em uma banda de frequência mais alta do que a banda de frequência das informações codificadas a partir do primeiro sinal de sub-banda e das informações de componente de alta frequência (108) nas informações adicionais (108, 109) demultiplexadas, e adicionar o sinal senoidal e o sinal de correção ao segundo sinal de sub-banda; e sintetizar o primeiro sinal de sub-banda e o segundo sinal de sub-banda para obter um sinal de áudio de banda larga.
8. Método de decodificação de áudio, de acordo com a reivindicação 7, caracterizado pelo fato de que os componente de contorno contém pelo menos componentes suprimidos após a síntese pela sintetização que executa cálculos de valor complexo.
9. Método de decodificação de áudio, de acordo com a reivindicação 7, caracterizado pelo fato de que o primeiro sinal de sub-banda é composto de sinais de sub-banda de baixa frequência, e o segundo sinal de sub-banda é composto de sinais de sub-banda de alta frequência.
10. Método de decodificação de áudio, de acordo com a reivindicação 7, caracterizado pelo fato de que o sinal de correção gerado pela etapa de geração de sinal de correção que suprime os sinais de componente de contorno produzidos em uma sub-banda adjacente à sub-banda à qual o sinal senoidal é adicionado.
11. Método de decodificação de áudio, de acordo com a reivindicação 7, caracterizado pelo fato de que a amplitude do sinal de correção gerado pela etapa de geração do sinal de correção é ajustada em sincronização com a amplitude do sinal senoidal.
12. Método de decodificação de áudio, de acordo com a reivindicação 10, caracterizado pelo fato de que quando o sinal senoidal é adicionado à sub-banda K, um sinal senoidal de período T tem amplitude S no tempo 0, amplitude 0 no tempo 1T/4, amplitude -S no tempo 2T/4, amplitude 0 no tempo 3T/4, e o sinal de correção é aplicado na sub-banda K-1 e na sub-banda K+1, o sinal de correção aplicado na sub-banda K-1 tem amplitude 0 no tempo 0, amplitude Alfa*S no tempo 1T/4, amplitude 0 no tempo 2T/4, e amplitude Beta*S no tempo 3T/4, e o sinal de correção aplicado na sub-banda K+1 tem amplitude 0 no tempo 0, amplitude Beta*S no tempo 1T/4, amplitude 0 no tempo 2T/4, e amplitude Alfa*S no tempo 3T/4, onde Alfa e Beta são constantes
BRPI0305710-0A 2002-08-01 2003-07-30 "apparatus and method of decoding of audio" BRPI0305710B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2002-225068 2002-08-01
JP2002225068 2002-08-01
PCT/JP2003/009646 WO2004013841A1 (en) 2002-08-01 2003-07-30 Audio decoding apparatus and audio decoding method based on spectral band repliction

Publications (1)

Publication Number Publication Date
BRPI0305710B1 true BRPI0305710B1 (pt) 2017-11-07

Family

ID=31492144

Family Applications (2)

Application Number Title Priority Date Filing Date
BR0305710-0A BR0305710A (pt) 2002-08-01 2003-07-30 Aparelho de decodificação de áudio e método de decodificação de áudio
BRPI0305710-0A BRPI0305710B1 (pt) 2002-08-01 2003-07-30 "apparatus and method of decoding of audio"

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BR0305710-0A BR0305710A (pt) 2002-08-01 2003-07-30 Aparelho de decodificação de áudio e método de decodificação de áudio

Country Status (14)

Country Link
US (1) US7058571B2 (pt)
EP (1) EP1527442B1 (pt)
JP (1) JP3646938B1 (pt)
KR (1) KR100723753B1 (pt)
CN (1) CN1286087C (pt)
AT (1) ATE322735T1 (pt)
AU (1) AU2003252727A1 (pt)
BR (2) BR0305710A (pt)
CA (1) CA2464408C (pt)
DE (1) DE60304479T2 (pt)
ES (1) ES2261974T3 (pt)
HK (1) HK1073525A1 (pt)
TW (1) TWI303410B (pt)
WO (1) WO2004013841A1 (pt)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
WO2003046891A1 (en) 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
US8082156B2 (en) * 2005-01-11 2011-12-20 Nec Corporation Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal
WO2006090852A1 (ja) * 2005-02-24 2006-08-31 Matsushita Electric Industrial Co., Ltd. データ再生装置
UA92742C2 (ru) * 2005-04-01 2010-12-10 Квелкомм Инкорпорейтед Способ и устройство для кодирования речевых сигналов с расщеплением полосы
US7917561B2 (en) * 2005-09-16 2011-03-29 Coding Technologies Ab Partially complex modulated filter bank
CN100568863C (zh) * 2005-09-30 2009-12-09 中国科学院上海微系统与信息技术研究所 基于多子带滤波器组的发射、接收装置及其方法
WO2007043648A1 (ja) 2005-10-14 2007-04-19 Matsushita Electric Industrial Co., Ltd. 変換符号化装置および変換符号化方法
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
AU2008215231B2 (en) 2007-02-14 2010-02-18 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US8214200B2 (en) * 2007-03-14 2012-07-03 Xfrm, Inc. Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid
KR101080421B1 (ko) * 2007-03-16 2011-11-04 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
KR101425355B1 (ko) * 2007-09-05 2014-08-06 삼성전자주식회사 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법
EP2212884B1 (en) * 2007-11-06 2013-01-02 Nokia Corporation An encoder
CN102568489B (zh) * 2007-11-06 2015-09-16 诺基亚公司 编码器
CN101896968A (zh) * 2007-11-06 2010-11-24 诺基亚公司 音频编码装置及其方法
WO2009059632A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
RU2443028C2 (ru) * 2008-07-11 2012-02-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Устройство и способ расчета параметров расширения полосы пропускания посредством управления фреймами наклона спектра
CN101751925B (zh) * 2008-12-10 2011-12-21 华为技术有限公司 一种语音解码方法及装置
EP2380172B1 (en) 2009-01-16 2013-07-24 Dolby International AB Cross product enhanced harmonic transposition
KR101599884B1 (ko) * 2009-08-18 2016-03-04 삼성전자주식회사 멀티 채널 오디오 디코딩 방법 및 장치
US8515768B2 (en) * 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
WO2011114192A1 (en) * 2010-03-19 2011-09-22 Nokia Corporation Method and apparatus for audio coding
JP5651980B2 (ja) 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
US9514768B2 (en) 2010-08-06 2016-12-06 Samsung Electronics Co., Ltd. Audio reproducing method, audio reproducing apparatus therefor, and information storage medium
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
JP2011059714A (ja) * 2010-12-06 2011-03-24 Sony Corp 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5569476B2 (ja) * 2011-07-11 2014-08-13 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US9472199B2 (en) 2011-09-28 2016-10-18 Lg Electronics Inc. Voice signal encoding method, voice signal decoding method, and apparatus using same
CN103493130B (zh) * 2012-01-20 2016-05-18 弗劳恩霍夫应用研究促进协会 用以利用正弦代换进行音频编码及译码的装置和方法
KR101248125B1 (ko) 2012-10-15 2013-03-27 (주)알고코리아 주변소음 소거와 주파수 채널별 압축 기능을 가진 보청기
WO2014081736A2 (en) * 2012-11-20 2014-05-30 Dts, Inc. Reconstruction of a high frequency range in low-bitrate audio coding using predictive pattern analysis
CN107545900B (zh) * 2017-08-16 2020-12-01 广州广晟数码技术有限公司 带宽扩展编码和解码中高频弦信号生成的方法和装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4691292A (en) * 1983-04-13 1987-09-01 Rca Corporation System for digital multiband filtering
DE3510573A1 (de) * 1985-03-23 1986-09-25 Philips Patentverwaltung Digitale analyse-synthese-filterbank mit maximaler taktreduktion
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
FR2680924B1 (fr) * 1991-09-03 1997-06-06 France Telecom Procede de filtrage adapte d'un signal transforme en sous-bandes, et dispositif de filtrage correspondant.
US5508949A (en) 1993-12-29 1996-04-16 Hewlett-Packard Company Fast subband filtering in digital signal coding
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
JPH08162964A (ja) 1994-12-08 1996-06-21 Sony Corp 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3437421B2 (ja) 1997-09-30 2003-08-18 シャープ株式会社 楽音符号化装置及び楽音符号化方法並びに楽音符号化プログラムを記録した記録媒体
EP0957579A1 (en) 1998-05-15 1999-11-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for sampling-rate conversion of audio signals
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
US6718300B1 (en) 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
US6889182B2 (en) 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech

Also Published As

Publication number Publication date
ES2261974T3 (es) 2006-11-16
EP1527442B1 (en) 2006-04-05
TWI303410B (en) 2008-11-21
JP3646938B1 (ja) 2005-05-11
HK1073525A1 (en) 2005-10-07
DE60304479T2 (de) 2006-12-14
AU2003252727A8 (en) 2004-02-23
JP2005520217A (ja) 2005-07-07
CA2464408C (en) 2012-02-21
US20050080621A1 (en) 2005-04-14
ATE322735T1 (de) 2006-04-15
US7058571B2 (en) 2006-06-06
WO2004013841A1 (en) 2004-02-12
EP1527442A1 (en) 2005-05-04
KR20050042020A (ko) 2005-05-04
CN1286087C (zh) 2006-11-22
BR0305710A (pt) 2004-09-28
CN1585972A (zh) 2005-02-23
CA2464408A1 (en) 2004-02-12
KR100723753B1 (ko) 2007-05-30
DE60304479D1 (de) 2006-05-18
AU2003252727A1 (en) 2004-02-23
TW200405267A (en) 2004-04-01

Similar Documents

Publication Publication Date Title
BRPI0305710B1 (pt) "apparatus and method of decoding of audio"
ES2683870T3 (es) Procesador de audio y método para procesar una señal de audio usando corrección de fase
KR101355376B1 (ko) 고주파수 영역 부호화 및 복호화 방법 및 장치
RU2491658C2 (ru) Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
KR101169596B1 (ko) 오디오 신호 합성
JP5792710B2 (ja) 正弦波符号化
US10255928B2 (en) Apparatus, medium and method to encode and decode high frequency signal
RU2612584C2 (ru) Управление фазовой когерентностью для гармонических сигналов в перцепционных аудиокодеках
KR101411900B1 (ko) 오디오 신호의 부호화 및 복호화 방법 및 장치
KR20050010744A (ko) 오디오 복호 장치와 복호 방법 및 프로그램
BRPI0306434B1 (pt) Aparelho e método de decodificação de áudio
BRPI0910523B1 (pt) Aparelho e método para gerar dados de saída de extensão de largura de banda
JP4313993B2 (ja) オーディオ復号化装置およびオーディオ復号化方法
BR112016030374B1 (pt) Calculadora e método para determinação de dados de correção de fase para um sinal de áudio