BR112015004556B1 - Aparelho e método para reproduzir um sinal de áudio, aparelho e método para gerar um sinal de áudio codificado - Google Patents

Aparelho e método para reproduzir um sinal de áudio, aparelho e método para gerar um sinal de áudio codificado Download PDF

Info

Publication number
BR112015004556B1
BR112015004556B1 BR112015004556-1A BR112015004556A BR112015004556B1 BR 112015004556 B1 BR112015004556 B1 BR 112015004556B1 BR 112015004556 A BR112015004556 A BR 112015004556A BR 112015004556 B1 BR112015004556 B1 BR 112015004556B1
Authority
BR
Brazil
Prior art keywords
audio signal
signal
antenna
audio
secondary data
Prior art date
Application number
BR112015004556-1A
Other languages
English (en)
Other versions
BR112015004556A2 (pt
Inventor
Disch Sascha
Schubert Benjamin
Multrus Markus
Helmrich Christian
Schmidt Konstantin
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Publication of BR112015004556A2 publication Critical patent/BR112015004556A2/pt
Publication of BR112015004556B1 publication Critical patent/BR112015004556B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

aparelho e método para reproduzir um sinal de áudio, aparelho e método para gerar um sinal de áudio codificado, programa de computador e sinal de áudio codificado. um aparelho para reproduzir um sinal de áudio com base em dados primários , que representam urna versão codificada de urna primeira parte do sinal de áudio em urna primeira faixa de frequência , e dados secundários , que representam a informação adicional em urna segunda parte do sinal de áudio em urna segunda faixa de frequência , a segunda faixa de frequência compreendendo frequências mais altas do que a primeira faixa de frequência , compreende um primeiro reprodutor configurado para reproduzir a primeira parte do sinal de áudio com base nos dados primários . um provedor é configurado para prover um sinal da antena na segunda faixa de frequência , caracterizado pelo sinal da antena estar , pelo menos , parcialmente sem correlação com relação à primeira parte do sinal de áudio ou ser , pelo menos , parcialmente urna versão decorrelacionada da primeira parte do sinal de áudio que foi deslocado para a segunda faixa de frequência . um segundo reprodutor é configurado para reproduzi a segunda parte do sinal de áudio na segunda faixa de frequência com base nos dados secundários e no sinal da antena . um combinado r é configurado para combinar sinal de áudio reproduzido e o sinal a primeira parte do da antena antes da segunda parte do sinal de áudio ser reproduzida pelo segundo reprodutor ou para combinar a primeira parte do sinal de áudio reproduzido e a segunda parte do sinal de áudio reproduzido .

Description

DESCRIÇÃO
[0001] A presente invenção refere-se a um aparelho e método para reproduzir um sinal de áudio e, em particular, a um aparelho e método para reproduzir um sinal de áudio em situações nas quais a taxa de dados disponível é reduzida. Além disso, a presente invenção refere-se a um aparelho e método para gerar um sinal de áudio codificado e um sinal de áudio codificado correspondente.
[0002] A codificação perceptualmente adaptada dos sinais de áudio para armazenamento e transmissão eficientes destes sinais reduzidos da taxa de dados ganhou aceitação em muitos campos. Os algoritmos de codificação são conhecidos, em particular, como MPEG-1/2, camada 3 “MP3”, Codificação de Áudio Avançada (AAC | Advanced Audio Coding) MPEG-2/4 ou Codificação de Áudio e Fala Unificados MPEG-H (USAC | Unified Speech and Audio Coding). As técnicas de codificação subjacentes, em particular quando atingem as taxas de bit mais baixas, levam a uma redução da qualidade do áudio. A deficiência é geralmente principalmente causada por uma limitação adicional do codificador da largura de banda do sinal de áudio a ser transmitida.
[0003] Nesta situação, sabe-se que o estado da técnica submete o sinal de áudio a uma limitação de banda no lado do codificador e codifica apenas uma banda inferior do sinal de áudio por meio de um codificador de áudio de alta qualidade. A banda superior, entretanto, é apenas muito brutamente caracterizada por um conjunto de parâmetros, que conduzem, por exemplo, o envelope espectral da banda superior. No lado do decodificador, a banda superior é então sintetizada reparando o sinal da banda inferior decodificado na banda superior de outra forma vazia e realizando os ajustes controlados do parâmetro subsequente.
[0004] Os métodos padrões para uma extensão da largura de banda dos sinais de áudio limitados por banda utilizam uma função de cópia das partes do sinal de baixa frequência (LF) em faixa de alta frequência (HF), a fim de aproximar a informação ausente devido à limitação de banda. A princípio, esta função de cópia é tecnicamente equivalente a um deslocamento espectral calculado no domínio de tempo por meios da modulação de única banda lateral (SSB | single sideband), mas de forma computacional muito menos complexa. Estes métodos, como Replicação de Banda Espectral (SBR | Spectral Band Replication), são descritos em M. Dietz, L. Liljeryd, K. Kjorling e 0. Kunz, “Spectral Band Replication, a novel approach in audio coding”,na 112aConvenção AES, Munique, maio de 2002; S. Meltzer, R. Bohm e F. Henn, “SBR enhanced audio codecs for digital broadcasting such as “Digital Radio Mondiale” (DRM),” 112a Convenção AES, Munique, maio de 2002; T. Ziegler, A. Ehret, P. Ekstrand e M. Lutzky, “Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm”, na 112a Convenção AES, Munique, maio de 2002; Padrão Internacional ISO/IEC 14496-3:2001/FPDAM l, “Bandwidth Extension” ISO/IEC, 2002, ou “ Speech bandwidth extension method and apparatus”, Vasu Iyengar et al. Patente Norte-Americana n° 5,455,888.
[0005] Nestes métodos nenhuma transposição harmônica é realizada, mas sinais sucessivos de gama de comprimentos da faixa inferior são introduzidos nos canais sucessivos do banco de filtro da faixa superior. Por causa disso, uma bruta aproximação da faixa superior do sinal de áudio é obtida. Esta bruta aproximação do sinal está então em uma etapa aproximada ao original por um pós-processamento utilizando a informação de controle obtida do sinal original. Aqui, por exemplo, os fatores de escala servem para adaptar o envelope espectral, uma filtragem inversa e a adição de um nível de ruído para adaptar a tonalidade e uma suplementação pelas partes do sinal sinusoidal, como é descrito no Padrão MPEG-4.
[0006] É conhecido das técnicas de extensões da largura de banda harmônicas descritas em Nagel, F.; Disch, S. A Harmonic Bandwidth Extension Method for Audio Codecs, IEEE Conferência Internacional sobre Acústica, Discurso e Processamento de Sinal (ICASSP), 2009; Nagel, F.; Disch, S.; Rettelbach, N. A Phase Vocoder Driven Bandwidth Extension Method with Novel Transient Handling for Audio Codecs, 126a Convenção AES, 2009; Zhong, H.; Villemoes, L.; Ekstrand, P. et al. QMF Based Harmonic Spectral Band Replication, 131a Convenção da Sociedade de Engenharia de Áudio, 2011; Villemoes, L.; Ekstrand, P.; Hedelin, P. Methods for enhanced harmonic transposition, Workshop IEEE sobre as Aplicações do Processamento do Sinal em Áudio e Acústica, (WASPAA | Workshop on Applications of Signal Processing to Audio and Acoustics), 2011, que na sintetização da faixa superior a aspereza auditiva indesejada pode ser introduzida no sinal. Uma causa (de muitas) da referida aspereza é o desalinhamento espectral do pedaço e/ou efeitos de dissonância nas regiões de transição entre a faixa inferior e primeiro pedaço ou entre os pedaços consecutivos. As técnicas de extensões da largura de banda harmônicas são projetadas para melhorar nestes dois aspectos, embora no custo da complexidade computacional.
[0007] Os cálculos do banco de filtro e a reparação no domínio do banco de filtro, especialmente na extensão da largura de banda harmônica, podem ainda se tornar um esforço computacional alto. Em WO 98/57436 uma técnica de reparação avançada é descrita podendo, em alguma extensão limitada, evitar os efeitos de dissonância pela introdução das chamadas bandas de proteção entre os diferentes pedações espectrais e realizando uma reparação da cópia modificada para reduzir o desalinhamento espectral enquanto mantém a complexidade computacional moderada.
[0008] Além disso, outros métodos existem, como a chamada “extensão da largura de banda cega”, descrita em E. Larsen, R.M. Aarts, e M. Danessis, “Efficient high-frequency bandwidth extension of music and speech”, na 112° Convenção AES, Munique, Alemanha, maio de 2002 em que nenhuma informação sobre a faixa HF original é utilizada. Ainda, o método da chamada “Extensão da largura de banda artificial”, existe sendo descrita em K. Kãyhko, A Robust Wideband Enhancement for Narrowband Speech Signal; Relatório de Pesquisa, Helsinki University of Technology, Laboratório de Acústica e Processamento do Sinal de Áudio, 2001.
[0009] Em J. Mãkinen et al.: AMR-WB+: um novo padrão de codificação de áudio para as Transmissões dos serviços de áudio móvel da 3ageração, IEEE, ICASSP ’05, um método para extensão da largura de banda é descrito, caracterizado pela operação de cópia da extensão da largura de banda com uma cópia de sinais sucessivos da gama de comprimentos de acordo com a tecnologia SBR ser substituída pela reflexão, por exemplo, pela amostragem.
[0010] Outras tecnologias para a extensão da largura de banda são descritas nos seguintes documentos. R.M. Aarts, E. Larsen, e O. Ouweltjes, “A unified approach to low- and high frequency bandwidth extension”, 115a Convenção AES, Nova Iorque, EUA, outubro de 2003; E. Larsen e R.M. Aarts, “Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design”, John Wiley & Sons, Ltd., 2004; E. Larsen, R.M. Aarts, e M. Danessis, “Efficient high- frequency bandwidth extension of music and speech”, 112a Convenção AES, Munique, maio de 2002; J. Makhoul, “Spectral Analysis of Speech by Linear Prediction”, IEEE Transações sobre Áudio e Eletroacústica, AU-21(3), junho de 1973; Pedido de Patente Norte-Americano 08/951,029; Patente Norte- Americana No. 6,895,375.
[0011] Os métodos conhecidos da extensão da largura de banda harmônica mostram uma alta complexidade. Por outro lado, os métodos da extensão da largura de banda reduzida por complexidade mostram perdas de qualidade. Em particular com uma baixa taxa de bit e em combinação com uma baixa largura de banda da faixa LF, distúrbios como aspereza e um timbre percebidos como desagradáveis podem ocorrer. Uma razão para isso é principalmente o fato que a parte HF aproximada é baseada em uma ou mais operações da cópia ou reflexão direta da parte LF do espectro.
[0012] É o objetivo da invenção fornecer um aparelho e um método para reproduzir um sinal de áudio em uma forma melhorada. Além disso, é um objeto da invenção fornecer um aparelho e um método para gerar um sinal de áudio codificado que pode ser reproduzido em uma forma melhorada. Ainda é um objetivo da invenção fornecer um programa de computador correspondente e um sinal de áudio codificado correspondente.
[0013] Este objetivo é atingido por um aparelho para reproduzir um sinal de áudio, de acordo com a reivindicação 1, um método para reproduzir um sinal de áudio, de acordo com a reivindicação 13, um aparelho para gerar um sinal de áudio codificado, de acordo com a reivindicação 12, um método para gerar um sinal de áudio codificado, de acordo com a reivindicação 13, um programa de computador, de acordo com a reivindicação 14 e um sinal de áudio codificado, de acordo com a reivindicação 15.
[0014] As aplicações invenção fornecem um aparelho para reproduzir um sinal de áudio com base em dados primários que representam uma versão codificada de uma primeira parte do sinal de áudio em uma primeira faixa de frequência e dados secundários que representam a informação adicional sobre uma segunda parte do sinal de áudio em uma segunda faixa de frequência, a segunda faixa de frequência compreendendo frequências mais altas do que a primeira faixa de frequência, o dispositivo compreendendo:
[0015] um primeiro reprodutor configurado para reproduzir a primeira parte do sinal de áudio com base nos dados primários;
[0016] um provedor configurado para fornecer um sinal da antena na segunda faixa de frequência, em que o sinal da antena não está correlacionado com relação à primeira parte do sinal de áudio ou é uma versão decorrelacionada da primeira parte do sinal de áudio, que foi deslocada à segunda faixa de frequência;
[0017] um segundo reprodutor configurado para reproduzir a segunda parte do sinal de áudio na segunda faixa de frequência com base nos dados secundários e no sinal da antena; e
[0018] um combinador para combinar a primeira parte do sinal de áudio reproduzido e o sinal da antena antes da segunda parte do sinal de áudio é reproduzido pelo segundo reprodutor ou para combinar a primeira parte do sinal de áudio reproduzido e a segunda parte do sinal de áudio reproduzido.
[0019] As aplicações da invenção fornecem um método para reproduzir um sinal de áudio com base em dados primários que representam uma versão codificada de uma primeira parte do sinal de áudio em uma primeira faixa de frequência e dados secundários que representam a informação adicional sobre uma segunda parte do sinal de áudio em uma segunda faixa de frequência, a segunda faixa de frequência compreendendo frequências mais altas do que a primeira faixa de frequência, o método compreendendo:
[0020] reproduzir o sinal de áudio na primeira faixa de frequência com base nos dados primários;
[0021] fornecer um sinal da antena na segunda faixa de frequência, em que o sinal da antena não está correlacionado com relação à primeira parte do sinal de áudio ou é uma versão decorrelacionada da primeira parte do sinal de áudio, que foi deslocada à segunda faixa de frequência;
[0022] reproduzir o sinal de áudio na segunda faixa de frequência com base nos dados secundários e no sinal da antena; e
[0023] combinar a primeira parte do sinal de áudio reproduzido e o sinal da antena antes da segunda parte do sinal de áudio ser reproduzida ou combinar a primeira parte do sinal de áudio reproduzido e a segunda parte do sinal de áudio reproduzido.
[0024] As aplicações da invenção referem-se a uma reprodução de um sinal de áudio que fornece uma extensão da largura de banda, utilizando os sinais de áudio de sub-banda decorrelacionada. Ao contrário dos métodos já existentes, a maioria das distorções e distúrbios do sinal, que atualmente são típicos para as extensões da largura de banda, pode ser evitada utilizando sinais de áudio de sub-banda decorrelacionada para extensão da largura de banda, ao invés dos sinais de áudio da sub-banda correlacionada (copiados ou espelhados). Isso é atingido fornecendo o sinal de áudio, que forma a base para uma reprodução de uma parte do sinal de áudio de alta frequência, não correlacionada ou decorrelacionada com relação à primeira parte (parte LF) do sinal de áudio. As aplicações da invenção são baseadas no reconhecimento que a correlação entre a parte de baixa frequência e a parte de alta frequência não precisam ser mantidas ao reproduzir a segunda parte do sinal do sinal de áudio. Ainda, os inventores reconheceram que os distúrbios, como aspereza e um timbre recebido para ser desagradável pode ser evitado fazendo uso de um sinal da antena decorrelacionado ou completamente não correlacionado.
[0025] As aplicações da invenção fornecem um aparelho para gerar um sinal de áudio codificado, o sinal de áudio codificado compreendendo dados primários que representam uma versão codificada de uma primeira parte do sinal de áudio em uma primeira faixa de frequência e dados secundários que representam a informação adicional sobre uma segunda parte do sinal de áudio em uma segunda faixa de frequência, a segunda faixa de frequência compreendendo frequências mais altas do que a primeira faixa de frequência, o aparelho compreendendo:
[0026] um somador da informação da decorrelação configurado para adicionar ao sinal de áudio codificado a informação sobre um grau de decorrelação a ser utilizado entre a primeira parte do sinal de áudio e um sinal da antena com base no qual a segunda parte do sinal de áudio é reproduzida ao reproduzir o sinal de áudio do sinal de áudio codificado.
[0027] As aplicações da invenção fornecem um método para gerar um sinal de áudio codificado, o sinal de áudio codificado compreendendo dados primários que representam uma versão codificada de uma primeira parte do sinal de áudio em uma primeira faixa de frequência e dados secundários que representam informação adicional sobre uma segunda parte do sinal de áudio em uma segunda faixa de frequência, a segunda faixa de frequência compreendendo frequências mais altas do que a primeira faixa de frequência, o método compreendendo:
[0028] adicionar ao sinal de áudio codificado a informação sobre um grau de decorrelação a ser utilizado entre a primeira parte do sinal de áudio e um sinal da antena com base no qual a segunda parte do sinal de áudio é reproduzida ao reproduzir o sinal de áudio do sinal de áudio codificado.
[0029] As aplicações da invenção fornecem um sinal de áudio codificado, compreendendo:
[0030] dados primários que representam uma versão codificada de uma primeira parte do sinal de áudio em uma primeira faixa de frequência;
[0031] dados secundários que representam informação adicional sobre uma segunda parte do sinal de áudio em uma segunda faixa de frequência, a segunda faixa de frequência compreendendo frequências mais altas do que a primeira faixa de frequência; e
[0032] informação sobre um grau de decorrelação a ser utilizado entre a primeira parte do sinal de áudio e um sinal da antena com base no qual a segunda parte do sinal de áudio é reproduzida ao reproduzir o sinal de áudio do sinal de áudio codificado.
[0033] Assim, as aplicações da invenção permitem gerar um sinal de áudio codificado de uma forma que permite a decodificação do sinal de áudio codificado em uma forma apropriada, utilizando um grau de decorrelação apropriado. O grau de decorrelação apropriado pode ser determinado no lado do codificador com base nas propriedades da primeira parte e/ou da segunda parte do sinal de áudio.
[0034] A seguir, as aplicações da presente invenção são explicadas em mais detalhes com referência aos desenhos anexos, nos quais:
[0035] A Figura 1a mostra um diagrama em blocos de uma aplicação de um aparelho para reproduzir um sinal de áudio;
[0036] A Figura 1b mostra um diagrama em blocos de outra aplicação de um aparelho para reproduzir um sinal de áudio;
[0037] A Figura 2 mostra um diagrama em blocos de outra aplicação de um aparelho para reproduzir um sinal de áudio;
[0038] A Figura 3 mostra um diagrama em blocos de uma aplicação de um aparelho para gerar um sinal de áudio codificado;
[0039] A Figura 4a mostra uma ilustração esquemática de um lado do codificador no contexto de aplicações da invenção;
[0040] A Figura 4b mostra uma ilustração esquemática de um lado do decodificador no contexto das aplicações da invenção;
[0041] As Figuras 5a e 5b mostram diagramas que ilustram vantagens das aplicações da invenção;
[0042] A Figura 6 mostra um diagrama em blocos de um aparelho para reproduzir um sinal de áudio do qual a invenção começa; e
[0043] As Figuras 7a a 7d mostram diagramas do sinal úteis na explicação da operação do aparelho mostrado na Figura 6.
[0044] Antes de explicar as aplicações da invenção em detalhes, é considerado útil discutir brevemente os pensamentos teóricos subjacentes à invenção.
[0045] Conforme explicado acima, as extensões da largura de banda com base nas operações de cópia (ou operações de espelho), como, por exemplo, SBR (spectral band replication | replicação de faixa espectral) copia grandes partes de um espectro LF diretamente na faixa HF.
[0046] Um exemplo de um aparelho SBR é descrito como referência nas figuras 6 e 7. O envelope de um sinal de áudio 2 é mostrado na Figura 7a. O sinal de áudio 2 compreende uma parte de baixa frequência (ou faixa de baixa frequência) 4 e uma parte de alta frequência (ou faixa de alta frequência) 6. Tipicamente, na codificação perceptual dos sinais de áudio, a parte de baixa frequência 4 é codificada por meio de um codificador de áudio de alta qualidade, como um codificador PCM (pulse code modulation |modulação por código de pulso), enquanto a faixa superior é apenas muito brutamente caracterizada pela informação adicional. Os dados que representam a parte de baixa frequência codificada e os dados que representam a informação adicional são transmitidos utilizando um codec central correspondente. A figura 6 mostra um sinal de banda base 8 de um codec central, que representam a parte de baixa frequência 4 mostrada na Figura 7b. Este sinal 8 é aplicado em uma única unidade de cópia/modulação de banda lateral, na qual o sinal 8 é deslocado para a faixa de frequência da parte de alta frequência 6. Este sinal deslocado é mostrado como o sinal 10 na Figura 7c. O sinal deslocado 10 e o sinal 8 são aplicados em uma unidade de reparação 12, na qual ambos os sinais são combinados (somados) para obter o espectro mostrado na Figura 7c. A parte do sinal 8 pode ser deslocada em faixas de frequência mais altas diferentes p, em que p >1. Assim, uma combinação de um ou mais (p) sinais deslocados e sinal 8 pode ocorrer na unidade de reparação 12.
[0047] O sinal de saída da unidade de reparação 12 é aplicado em uma unidade de pós-processamento 14, que também recebe a informação adicional 16 que representa o sinal de áudio na parte de alta frequência 6. Assim, a parte de alta frequência 10’ do sinal de áudio 6 é reproduzida com base na informação adicional 16 e no sinal de áudio da parte de baixa frequência 4. O sinal de áudio resultante é mostrado na Figura 7d. A unidade de pós-processamento 14 emite a saída da banda completa que cobre as faixas de frequência da parte de baixa frequência 4 e da parte de alta frequência 6.
[0048] Certamente, as extensões da largura de banda com base nas operações de cópia (ou operações de reflexão), como, por exemplo, SBR, partes grandes de cópia de um espectro de baixa frequência diretamente na faixa de alta frequência. Isso pode ser obtido empregando uma modulação de única banda lateral da representação de domínio de tempo do sinal de áudio ou por um processo de cópia direta (cópia) na representação espectral do sinal de áudio. Esta etapa de processamento é geralmente chamada “reparação”.
[0049] Geralmente, pode haver uma pluralidade de pedaços copiados em diferentes faixas de alta frequência. As respectivas faixas de frequência podem sobrepor ou não. Cada um dos pedaços HF correspondentes é então completamente correlacionado à faixa de baixa frequência da qual foi extraído. Os inventores reconheceram que, assim, as modulações do envelope temporal podem ocorrer pela sobreposição de ambos os sinais com uma frequência que depende da distância espectral entre a banda LF e a localização espectral do respectivo pedaço HF.
[0050] A partir de um ponto de vista teórico do sistema, este fenômeno deve ser referido como duplo para a operação de um filtro do pente de resposta por impulso finito (FIR | finite impulse response) compreendendo um atraso de n amostras com Fs como frequência de amostra. Este filtro tem uma resposta de frequência de magnitude com uma largura do pente (distância espectral entre dois máximos da resposta de frequência da magnitude) de 1/n*Fs. Assim, a dualidade teórica do sistema tem as seguintes correspondências diretas:
[0051] atraso de tempo <->translação de frequência.
[0052] resposta da frequência de magnitude <-> envelope temporal.
[0053] Os inventores reconheceram que as modulações temporais resultantes são audíveis de forma perturbadora e podem se tornar visíveis na função de autocorrelação da magnitude da forma de onda na forma de máximos adicionais de repetição periódica. Estes máximos adicionais de repetição periódica na sequência de autocorrelação de um envelope do sinal de ruído para cópia SBR são mostrados na Figura 5a. A Figura 5a mostra a função de autocorrelação do envelope de magnitude de ruído branco, em que a largura de banda é estendida com pedaços de cópia direta, que são completamente correlacionados entre eles e com a banda LF.
[0054] Apenas quando o sinal LF e HF mostram a mesma amplitude, uma profundidade de modulação máxima é obtida. Na prática, o efeito de modulação é então geralmente um pouco mais baixo, pois tipicamente a faixa HF é significativamente mais silenciosa (menos alta) do que a faixa LF. Os sinais do tipo ruído ou sinais quase estacionários com uma estrutura de implicação pronunciada devem ser referidos como particularmente críticos com relação aos distúrbios de modulação.
[0055] Para a presença de vários pedaços (p na Figura 6) que são completamente correlacionados entre eles, a dualidade mencionada acima é válida também certamente. Uma modulação temporal do envelope de magnitude parece que é dupla à resposta da frequência de magnitude de um filtro FIR correspondente.
[0056] Assim, de acordo com as aplicações da invenção, o pedaço ou os pedaços são decorrelacionados entre si e da banda LF. Nas aplicações da invenção, um ou mais decorrelacionadores são utilizados para decorrelacionar o sinal derivado dos componentes do sinal de baixa frequência, respectivamente, antes de ser inserido na(s) faixa(s) de frequência mais alta e, como pode ser o caso, pós-processado.
[0057] As aplicações da invenção evitam os problemas explicados que ocorrem devido a uma operação de cópia ou uma operação de reflexão utilizando os pedaços mutualmente decorrelacionados. Nas aplicações da invenção, os respectivos pedaços HF são decorrelacionados da banda LF em uma forma individual utilizando os decorrelacionadores, por exemplo, por meios de filtros passa-tudo ou outros métodos conhecidos de decorrelação, ou para criar os pedaços sinteticamente em uma forma naturalmente decorrelacionada direta.
[0058] Nas aplicações da invenção, o grau de decorrelação pode ser fixamente determinado ou ajustado no lado do decodificador, ou pode ser transmitido como um parâmetro do codificador ao decodificador. Além disso, todo o pedaço pode ser decorrelacionado, ou apenas partes específicas do pedaço. As partes do pedaço a ser decorrelacionado também serão transmitidas como um parâmetro do codificador ao decodificador como parte da informação correspondente adicionada ao sinal de áudio codificado.
[0059] A abordagem inventiva é útil quando comparada às abordagens convencionais para extensão da largura de banda visto que as distorções e colorações de som pela perturbação ou modulações de envelope parasítico, pois eles existem com os métodos atuais com base na modulação/cópia de única banda lateral da banda LF, são inerentemente evitados com a abordagem inventiva. Isso é obtido utilizando pedaços HF que são decorrelacionados pela versão da parte do sinal LF ou que são completamente não correlacionados com relação à parte do sinal LF.
[0060] Um cenário no qual as aplicações da invenção podem ser implementadas é agora descrito com referência às 4a e 4b.
[0061] Um lado do codificador é mostrado na Figura 4a e um lado do decodificador é mostrado na Figura 4b. Um sinal de áudio é inserido em uma combinação passa baixo/passa alto em uma entrada 700. A combinação passa baixo/passa alto por um lado inclui um passa-baixo (LP | lowpass), para gerar uma versão filtrada passa baixo do sinal de áudio, ilustrada em 703 na Figura 7a. Este sinal de áudio filtrado passa baixo é codificado com um codificador de áudio 704. O codificador de áudio é, por exemplo, um codificador MP3 (MPEG-1/2camada 3) ou um codificador AAC, descrito no padrão MPEG-2/4. Codificadores de áudio alternativos que fornecem uma representação transparente ou representação vantajosamente perceptualmente transparente do sinal de áudio limitado por banda 703 podem ser utilizados no codificador 704 para gerar um sinal de áudio completamente codificado ou perceptualmente codificado e perceptualmente transparentemente codificado 705, respectivamente. A faixa superior do sinal de áudio é emitida em uma saída 706 pela parte passa alto do filtro 702, designada por “HP”. A parte passa alto do sinal de áudio, ou seja, a faixa superior ou banda HF, também designada como a parte HF, é fornecida a uma calculadora de parâmetro 707 que é implementada para calcular os diferentes parâmetros (que representam a informação adicional que representa a parte de alta frequência do sinal de áudio). Estes parâmetros são, por exemplo, o envelope espectral da faixa superior 706 em uma resolução relativamente bruta, por exemplo, pela representação de um fator de escala para cada grupo de frequência em uma escala perceptualmente adaptada (bandas críticas), por exemplo, para cada banda Bark na escala Bark. Outro parâmetro que pode ser calculado pela calculadora de parâmetro 707 é o nível de ruído na faixa superior, cuja energia por banda pode ser relacionada à energia do envelope nesta banda. Outros parâmetros que podem ser calculados pela calculadora de parâmetro 707 incluem uma medição de tonalidade para cada banda parcial da faixa superior que indica como a energia espectral é distribuída em uma banda, ou seja, se a energia espectral na banda é distribuída relativamente de forma uniforme, em que então um sinal não tonal existe nesta banda, ou se a energia nesta banda é relativamente concentrada de forma forte em uma determinada localização na banda, em que outro sinal tonal existe para esta banda. Outros parâmetros consistem em codificar explicitamente picos relativamente fortes projetando na faixa superior com relação a sua altura e sua frequência, como o conceito da extensão da largura de banda, na reconstrução sem tal codificação explícita das partes sinusoidais proeminentes na faixa superior, apenas recuperará o mesmo muito elementarmente, ou de nenhuma forma.
[0062] Em qualquer caso, a calculadora de parâmetro 707 é implementada para gerar apenas parâmetros 708 para a faixa superior que pode ser submetida às etapas de redução por entropia semelhantes, pois eles também podem ser realizados no codificador de áudio 704 para os valores espectrais quantizados, como, por exemplo, codificação diferencial, previsão ou codificação de Huffman, etc. A representação do parâmetro 708 e o sinal de áudio 705 são então fornecidos em um formatador do fluxo de dados 709 que é implementado para fornecer um fluxo de dados de saída 710 que tipicamente será um fluxo contínuo de dados de acordo com um certo formato como é, por exemplo, normalizado no Padrão MPEG4.
[0063] O lado do decodificador, como pode ser adequado para a presente invenção, é mostrado na Figura 7b. O fluxo de dados 710 insere um intérprete de fluxo de dados 711 que é implementado para separar a parte do parâmetro 708 da parte do sinal de áudio 705. A parte do parâmetro 708 é decodificada por um parâmetro decodificador 712 para obter parâmetros decodificados 713. Em paralelo a isso, a parte do sinal de áudio 705 é decodificada por um decodificador de áudio 714 para obter o sinal de áudio 777 que foi ilustrado em 8 na Figura 6, por exemplo.
[0064] Dependendo da implementação, o sinal de áudio 777 pode ser emitido através de uma primeira saída 715. Na saída 715, um sinal de áudio com uma pequena largura de banda e, ainda, também, uma baixa qualidade pode então ser obtida. Para uma melhoria da qualidade, entretanto, a extensão da largura de banda 720 pode ser realizada fazendo uso da abordagem inventiva conforme descrito a seguir com referência às figuras 1a, 1b e 2 para obter o sinal de áudio 112 no lado de saída com uma largura de banda estendida ou alta, respectivamente, e uma alta qualidade.
[0065] Uma aplicação de um aparelho inventivo para reproduzir um sinal de áudio e, assim, estendendo a largura de banda deste, é mostrada na Figura 1a. O aparelho compreende um primeiro reprodutor 100, um provedor 102, um combinador 104 e um segundo reprodutor 106. Opcionalmente, um detector de transição 108 pode ser fornecido. O primeiro reprodutor 100 recebe em uma entrada destes dados primários 120 que representam uma versão codificada de uma primeira parte dos dados de áudio em uma primeira faixa de frequência. Por exemplo, os dados primários 120 podem corresponder à parte do sinal de áudio 705 mostrada na Figura 4b. O primeiro reprodutor 100 reproduz o sinal de áudio na primeira faixa de frequência com base nos dados primários 120. Por exemplo, o primeiro reprodutor 100 pode ser formado pelo decodificador de áudio 714 mostrado na Figura 4b. O primeiro reprodutor 110 emite o sinal de áudio na primeira faixa de frequência, que pode corresponder ao sinal de áudio 777 mostrado na Figura 4b. O sinal de áudio 777 é aplicado ao provedor 102, que fornece um sinal da antena 122 na segunda faixa de frequência. O sinal da antena 122 é pelo menos parcialmente não correlacionado com relação à primeira parte do sinal de áudio 777 ou é pelo menos parcialmente uma versão decorrelacionada da primeira parte do sinal de áudio, que foi deslocada à segunda faixa de frequência. O sinal de áudio 777 e o sinal da antena 122 são combinados, como somados, no combinador 104. O sinal combinado 124 é emitido e aplicado ao segundo reprodutor 106. O segundo reprodutor 106 recebe o sinal combinado 124 e dados secundários 126 que representam a informação adicional sobre uma segunda parte do sinal de áudio em uma segunda faixa de frequência. Por exemplo, os dados secundários 126 podem corresponder aos parâmetros decodificados 713 descritos acima com relação à Figura 4b. O segundo reprodutor 106 reproduz o sinal de áudio na segunda faixa de frequência com base no sinal da antena (dentro do sinal combinado 124) e com base nos dados secundários 126.
[0066] Nas aplicações da invenção, a primeira faixa de frequência pode corresponder à faixa de frequência associada com a primeira parte do sinal de áudio mostrada na Figura 7a, e a segunda faixa de frequência pode corresponder à faixa de frequência associada com a segunda parte do sinal de áudio mostrado na Figura 7a.
[0067] De acordo com a aplicação mostrada na Figura 1a, o segundo reprodutor 106 emite um sinal de áudio 128 reproduzido com uma alta largura de banda.
[0068] Na aplicação alternativa mostrada na Figura 1b, a saída do provedor 102 é acoplada ao segundo reprodutor 106 e a saída do segundo reprodutor 106 é acoplada ao combinador 104. Assim, de acordo com a aplicação mostrada na Figura 1b, um sinal de áudio 130 na segunda faixa de frequência é reproduzido do sinal da antena fornecido pelo provedor 102 antes de combinar o sinal da antena com a primeira parte 777 do sinal de áudio. Novamente, o segundo reprodutor reproduz o sinal de áudio 130 na segunda faixa de frequência com base nos dados secundários 126 e o sinal da antena 122. De acordo com a aplicação mostrada na Figura 1b, o combinador 104 emite o sinal de áudio reproduzido 128.
[0069] Nas aplicações da invenção, o provedor compreende uma unidade de mudança e um decorrelacionador, que são configurados para gerar o sinal da antena como uma versão decorrelacionada da primeira parte do sinal de áudio deslocada para a segunda faixa de frequência. Nas aplicações da invenção, o provedor é configurado para fornecer um sinal da antena sintético que não está correlacionado com relação à primeira parte do sinal de áudio. Nas aplicações da invenção, o provedor é configurado para fornecer uma pluralidade de sinais da antena para uma pluralidade de faixas de frequência mais altas. Nestas aplicações o segundo reprodutor e o segundo combinador são adaptados para reproduzir uma pluralidade de segundas partes do sinal e para combinar a pluralidade de partes do sinal no sinal de áudio reproduzido.
[0070] Uma aplicação de um aparelho para reproduzir um sinal de áudio utilizando a extensão da largura de banda, que utiliza os sinais de áudio da sub-banda decorrelacionada, é mostrada na Figura 2. O aparelho recebe um sinal de banda base do codec central, que pode ser o sinal 777 mostrado na Figura 4b. O sinal 777 é aplicado em uma unidade de mudança 200. A unidade de mudança 200 é configurada para deslocar o sinal 777 da faixa de baixa frequência para a faixa de alta frequência, como de uma faixa de frequência associada com a parte de baixa frequência 4 na Figura 7a à faixa de frequência associada com a parte de alta frequência 6 na Figura 7a.
[0071] A unidade de mudança 200 pode ser configurada para simplificar a parte do sinal de cópia 777 à faixa de alta frequência no domínio de frequência. De modo alternativo, a unidade de mudança 200 pode ser implementada como uma única unidade de modulação da banda lateral configurada para realizar uma única modulação da banda lateral no domínio de tempo para deslocar a primeira parte do sinal de áudio da primeira faixa de frequência à segunda faixa de frequência.
[0072] A primeira parte do sinal de áudio deslocada é aplicada em uma unidade de decorrelação 202a. A primeira parte do sinal de áudio decorrelacionada deslocada é emitida pela unidade de decorrelação 202a como um sinal da antena 204. O sinal da antena 204 é aplicado em uma unidade de reparação 206, na qual o sinal da antena 204 é combinado com a primeira parte 777 do sinal de áudio. Por exemplo, o sinal da antena e a primeira parte do sinal de áudio são concatenados ou somados na unidade de reparação 206. O sinal combinado é emitido da unidade de reparação 206 e aplicado em uma unidade de pós-processamento 210.
[0073] A unidade de pós-processamento 210 recebe dados secundários 212 e representa um segundo reprodutor configurado para reproduzir a segunda parte do sinal de áudio em uma segunda faixa de frequência com base nos dados secundários 212 e o sinal da antena 204 (que é incluído no sinal combinado 208). Novamente, os dados secundários 212 representam a informação adicional e podem correspondente aos parâmetros decodificados 713 explicados acima com relação à Figura 4b. Uma saída da banda completa 214 da unidade de pós- processamento 210 representa o sinal de áudio reproduzido.
[0074] Na aplicação mostrada na Figura 2, a unidade de mudança 200 e a unidade de decorrelação 202a representam um provedor configurado para fornecer um sinal da antena 204.
[0075] Nas aplicações da invenção, a unidade de mudança 200 pode ser configurada para deslocar a primeira parte 777 do sinal de áudio em uma pluralidade de p diferentes faixas de frequência. Uma unidade de decorrelação 202a-202p pode ser fornecida para cada versão deslocada a fim de fornecer p sinais da antena. No caso mais do que um pedaço é utilizado, (como pedaços p), os pedaços p não deveriam ser correlacionados entre eles e a banda LF. Então, as versões deslocadas associadas com cada faixa de frequência são combinadas dentro da unidade de reparação 206. Os dados secundários que representam a informação adicional para cada uma das faixas de frequência mais altas podem ser fornecidos à unidade de pós-processamento 210 de modo que uma pluralidade de partes de frequência mais alta do sinal de áudio seja reproduzida na unidade de pós-processamento 210.
[0076] Nas aplicações da invenção, a primeira e a segunda faixas de frequência (e as faixas de frequência opcionalmente adicionais) podem ou não sobrepor-se na direção de frequência.
[0077] Certamente, nas aplicações da invenção, o provedor compreende uma unidade deslocadora configurada para deslocar uma primeira parte de um sinal de áudio em uma primeira faixa de frequência em uma segunda faixa de frequência ou em uma pluralidade de diferentes segundas faixas de frequência, e um decorrelacionador para decorrelacionar a versão deslocada da primeira parte do sinal de áudio da primeira parte do sinal de áudio. Nas aplicações da invenção, o decorrelacionador pode ter as mesmas propriedades que as conhecidas, por exemplo, da decorrelação de codificação de áudio espacial. Nas aplicações da invenção, o decorrelacionador pode fornecer uma decorrelação suficiente a fim de evitar as distorções e distúrbios do sinal que são típicos para extensões da largura de banda convencionais utilizando a réplica da banda espectral. O decorrelacionador pode fornecer uma preservação do envelope espectral da primeira parte do sinal de áudio e/ou pode fornecer uma preservação do envelope temporal, ou seja, os transientes, da primeira parte do sinal de áudio. Desenhar um decorrelacionador apropriado pode então envolver tipicamente um compromisso a ser feito entre a preservação transitória e a decorrelação.
[0078] Nas aplicações da invenção, o decorrelacionador pode ser implementado como um filtro IIR no domínio de tempo ou domínio de tempo da sub-banda, por exemplo, um filtro passa-tudo, no qual a decorrelação é obtida através das variações de atraso por grupo. Nas aplicações da invenção, o decorrelacionador pode ser configurado para fornecer a randomização de fase dos coeficientes espectrais em uma representação complexa de transformada/banco de filtro (sobreamostrada) (representação DFT, QMF) (DFT: Discrete Fourier Transform | Transformada Discreta de Fourier; QMF: quadrature mirror filter | filtro de espelho em quadratura). Nas aplicações da invenção, o decorrelacionador pode ser configurado a fim de fornecer um pedido de um atraso de tempo dependente da frequência em uma representação do banco de filtro.
[0079] As aplicações da invenção podem compreender um decorrelacionador adaptativo do sinal que varia o grau de decorrelação a fim de preservar os transientes. Uma alta decorrelação pode ser fornecida para sinais quase estacionários, e uma baixa decorrelação pode ser fornecida para sinais transientes. Certamente, nas aplicações da invenção, o provedor para fornecer o sinal da antena pode ser alternável entre os diferentes graus de decorrelação.
[0080] Nas aplicações, o provedor para fornecer o sinal da antena pode ser alternável entre os diferentes graus de decorrelação dependendo se a primeira parte do sinal compreende um indicador para uma forte correlação entre a primeira parte do sinal de áudio e a segunda parte do sinal de áudio. As aplicações para este indicador são um transiente na primeira parte do sinal de áudio, discursos de voz que consistem em trens de pulso na primeira parte do sinal de áudio e/ou no som de instrumentos de sopro na primeira parte do sinal de áudio. A seguir, as aplicações são descritas, nas quais o indicador é um transiente na primeira parte do sinal de áudio.
[0081] Nas aplicações da invenção, o aparelho pode compreender um detector configurado para detectar se a primeira parte do sinal de áudio compreende um transiente. Este detector 108 é esquematicamente mostrado nas figuras 1a e 1b. Dependendo do sinal de saída do detector 108, o provedor 102 pode ser configurado para fornecer o sinal da antena com uma alta decorrelação para sinais quase estacionários, ou seja, quando a primeira parte do sinal de áudio não tem um transiente), e uma baixa decorrelação se a primeira parte do sinal de áudio tem sinais transientes.
[0082] Nas aplicações alternativas da invenção, o aparelho pode compreender um decorrelacionador adaptativo do sinal que é ativado para os sinais quase estacionários e desativado para a parte dos sinais transientes. Em outras palavras, o provedor pode ser configurado para emitir a primeira parte do sinal deslocada sem a decorrelação deste quando a primeira parte do sinal compreende partes do sinal transiente e para emitir o sinal da antena decorrelacionado apenas quando a primeira parte do sinal não compreende transientes ou partes do sinal transiente. Nestas aplicações, o segundo reprodutor é configurado para reproduzir o sinal de áudio na segunda faixa de frequência com base nos dados secundários e no sinal da antena se a primeira parte do sinal de áudio não compreender um transiente e ser configurada para reproduzir o sinal de áudio em uma segunda faixa de frequência com base nos dados secundários e uma versão da primeira parte do sinal de áudio, que foi deslocada à segunda faixa de frequência e que não foi decorrelacionada, se a primeira parte do sinal de áudio compreender um transiente.
[0083] Um transiente ou partes transientes pode(m) ser referido(s) como consistindo no fato de que o sinal de áudio muda muito no total, ou seja, que, por exemplo, a energia do sinal de áudio muda mais do que 50% da parte temporal feita para a próxima parte temporal, ou seja, aumenta ou diminui. O limite de 50% é apenas um exemplo, entretanto, e também pode ser valores menores ou maiores. De modo alternativo, para uma detecção transitória, a mudança de distribuição de energia também pode ser considerada, por exemplo, na transição de um vocal a um sibilante.
[0084] Nas aplicações da invenção, o provedor pode ser configurado para fornecer um sinal da antena sintético que não está correlacionado com relação à primeira parte do sinal de áudio. Em outras palavras, a reparação com um sinal da antena sintético não correlacionado (como ruído sintético) já pode ser suficiente se o pós-processamento paramétrico for granulados (cenário do codec de alta taxa de bit) ou se a banda HF do sinal for do tipo ruído.
[0085] Nas aplicações da invenção, uma correlação da banda LF e da banda HF dentro de uma extensão da largura de banda (como SBR) é entretanto útil para melhorar uma grade de tempo muito bruta de pós-processamento paramétrico (por exemplo, devido a um cenário de codec de baixa taxa de bit), uma reprodução precisa de transientes e uma preservação de tons que têm uma estrutura rica de implicação (geralmente, a tonalidade não é afetada pela decorrelação e, assim, a preservação da tonalidade não representa um problema ao desenhar um decorrelacionador).
[0086] Desde que os decorrelacionadores conhecidos, por exemplo, da decorrelação de codificação de áudio espacial sejam referidos, a referência é feita a WO 2007/118583 A1, por exemplo.
[0087] Nas aplicações da invenção, o provedor 102 pode compreender um decorrelacionador adaptativo, que ajusta a decorrelação dos pedaços HF com base em um parâmetro transmitido de um codificador ao decodificador. Nestas aplicações, o aparelho é configurado para reproduzir um sinal de áudio com base nos dados primários, os dados secundários e terceiros dados compreendendo a informação sobre um grau de decorrelação a ser utilizado entre a primeira parte do sinal de áudio e um sinal da antena com base no qual a segunda parte é reproduzida ao reproduzir o sinal de áudio do sinal de áudio codificado. Estes terceiros dados podem ser somados aos dados de áudio codificado no lado do codificador, como por um somador da informação da decorrelação 300 mostrado na Figura 3 do presente pedido. O aparelho mostrado na Figura 3 corresponde ao aparelho mostrado na Figura 4a exceto para o somador da informação da decorrelação.
[0088] O somador da informação da decorrelação 300 recebe a saída do filtro passa-baixo 702 e pode detectar propriedades do sinal de saída do filtro passa-baixo 702. Por exemplo, o somador da informação da decorrelação pode detectar transientes no sinal de saída do filtro passa-baixo 702. Dependendo das propriedades da saída do filtro passa- baixo 702, o somador da informação da decorrelação adiciona ao sinal de áudio codificado 710 a informação sobre um grau de decorrelação a ser utilizado entre a primeira parte do sinal de áudio e um sinal da antena com base no qual a segunda parte é reproduzida ao reproduzir o sinal de áudio do sinal de áudio codificado. Por exemplo, a informação de decorrelação pode instruir o provedor no lado do decodificador para realizar uma baixa decorrelação ou nenhuma decorrelação no caso em que há partes transientes na parte de baixa frequência do sinal de áudio.
[0089] Nas aplicações da invenção, o somador da informação da decorrelação pode também receber a parte de alta frequência 706 do sinal de áudio e pode ser configurado para derivar propriedades dele. Por exemplo, no caso em que o somador da informação da decorrelação detecta que a banda HF é do tipo ruído, ele pode aconselhar o provedor no lado do decodificador para fornecer o sinal da antena com base em um sinal de ruído sintético.
[0090] Nestas aplicações, o sinal de áudio codificado 320 representado pelo fluxo de dados 710 compreende dados primários 321 que representam uma versão codificada de uma primeira parte de um sinal de áudio, dados secundários 322 que representam informação adicional sobre uma segunda parte do sinal de áudio em uma segunda faixa de frequência, e informação 323 sobre um grau de decorrelação a ser utilizado entre a primeira parte do sinal de áudio e um sinal da antena com base no qual a segunda parte é reproduzida ao reproduzir o sinal de áudio do sinal de áudio codificado.
[0091] Certamente, aplicações da invenção fornecem uma abordagem melhorada para reproduzir um sinal de áudio, ou seja, para uma extensão do lado do decodificador da largura de banda do sinal de áudio. Em outras aplicações, a invenção fornece um aparelho para gerar um sinal de áudio codificado. Ainda em outras aplicações, a invenção refere-se a estes sinais de áudio codificados.
[0092] O efeito vantajoso obtido pela abordagem inventiva pode se tornar visível por uma comparação da sequência de autocorrelação do envelope do sinal de ruído para a cópia SBR (mostrada na Figura 5a) com a sequência de autocorrelação do envelope do sinal de ruído dos pedaços decorrelacionados conforme mostrado na Figura 5b do presente pedido. A figura 5b é a função de autocorrelação do envelope de magnitude de ruído branco, em que a largura de banda é estendida com três pedaços não correlacionados entre eles a à banda LF. A Figura 5b mostra claramente o desaparecimento dos máximos laterais indesejados mostrado na Figura 5a.
[0093] O presente pedido é aplicável ou adequado a todas as presentes aplicações de áudio nas quais a largura de banda completa não está disponível. A abordagem inventiva pode encontrar o uso na distribuição ou transmissão de conteúdo de áudio, como, por exemplo com rádio digital, transmissão por internet e aplicações de comunicação de áudio. As aplicações da invenção estão relacionadas a uma extensão da largura de banda utilizando sinais de áudio de sub-banda decorrelacionada.
[0094] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é evidente que estes aspectos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa do método ou uma característica de uma etapa do método. De forma análoga, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco correspondente ou item ou característica de um aparelho correspondente.
[0095] Dependendo de certas exigências de implementação, as aplicações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um CD, uma memória ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória FLASH, tendo sinais de controle eletronicamente legíveis armazenados nele (ou são capazes de cooperar) com um sistema de computador programável, de modo que o respectivo método seja realizado.
[0096] Algumas aplicações, de acordo com a invenção, compreendem um transportador de dados não transientes tendo sinais de controle eletronicamente legíveis que são capazes de cooperar com um sistema de computador programável, de modo que um dos métodos descritos neste documento seja realizado.
[0097] De forma geral, as aplicações da presente invenção podem ser implementadas como um produto do programa de computador com um código do programa, o código do programa sendo operativo para realizar um dos métodos quando o produto do programa de computador é executado em um computador. O código do programa pode, por exemplo, ser armazenado em um transportador legível por máquina.
[0098] Outras aplicações compreendem o programa de computador para realizar um dos métodos descritos neste documento, armazenados em um transportador legível por máquina ou em um meio de armazenamento não transitório.
[0099] Em outras palavras, uma aplicação do método inventivo é, assim, um programa de computador tendo um código do programa para realizar um dos métodos descritos neste documento, quando o programa de computador é executado em um computador.
[0100] Outra aplicação dos métodos inventivos é, assim, um transportador de dados (ou um meio de armazenamento digital, ou um meio legível por computador) compreendendo, gravado nele, o programa de computador para realizar um dos métodos descritos neste documento.
[0101] Outra aplicação do método inventivo é, assim, um fluxo de dados ou uma sequência de sinais que representam o programa de computador para realizar um dos métodos descritos neste documento. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurado para ser transferido através de uma conexão de comunicação de dados, por exemplo, através da Internet.
[0102] Outra aplicação compreende um meio de processamento, por exemplo, um computador, ou um dispositivo lógico programável, configurado para ou adaptado para realizar um dos métodos descritos neste documento.
[0103] Outra aplicação compreende um computador tendo instalado nele o programa de computador para realizar um dos métodos descritos neste documento.
[0104] Em algumas aplicações, um dispositivo lógico programável (por exemplo, um arranjo de portas de campo programáveis) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos descritos neste documento. Em algumas aplicações, um arranjo de portas de campo programáveis pode cooperar com um microprocessador, a fim de realizar um dos métodos descritos neste documento. De forma geral, os métodos são preferivelmente realizados por qualquer aparelho de hardware.
[0105] As aplicações descritas acima são meramente ilustrativas para os princípios da presente invenção. Entende-se que as modificações e variações das disposições e os detalhes descritos no presente documento serão evidentes a outros especialistas na técnica. É intenção, portanto, ser limitada apenas pelo escopo das reivindicações da patente anexas e não pelos detalhes específicos apresentados em forma de descrição e explicação das aplicações no presente documento.

Claims (13)

1. Um aparelho para reproduzir um sinal de áudio com base nos dados primários (120; 321; 705), que representam uma versão codificada de uma primeira parte do sinal de áudio em uma primeira faixa de frequência, e dados secundários (126; 322; 708), que representam a informação adicional sobre uma segunda parte do sinal de áudio em uma segunda faixa de frequência, a segunda faixa de frequência compreendendo frequências mais altas do que a primeira faixa de frequência, o referido dispositivo compreendendo: um primeiro reprodutor (100) configurado para reproduzir a primeira parte (777) do sinal de áudio com base nos dados primários (120; 321; 705); um provedor (102; 200, 202a) configurado para fornecer um sinal da antena (122; 204) na segunda faixa de frequência, caracterizado pelo sinal da antena (122; 204) ser pelo menos parcialmente não correlacionado com relação à primeira parte (777) do sinal de áudio ou ser pelo menos parcialmente uma versão decorrelacionada da primeira parte (777) do sinal de áudio, que foi deslocada à segunda faixa de frequência; um segundo reprodutor (106) (106) que representa um pós-processador e configurado para reproduzir a segunda parte do sinal de áudio na segunda faixa de frequência com base nos dados secundários (126; 322; 708) e do sinal da antena (122; 204), pelo pós-processamento do sinal da antena com base nos dados secundários, em que um envelope espectral da segunda parte do sinal de áudio, um nível de ruído na segunda parte do sinal de áudio, uma medição de tonalidade para cada banda parcial na segunda parte do sinal de áudio, e uma codificação explícita de partes sinusoidais proeminentes na segunda parte do sinal de áudio representam a informação adicional representada pelos dados secundários; e um combinador (104) para combinar a primeira parte reproduzida (777) do sinal de áudio e do sinal da antena (122; 204) antes da segunda parte do sinal de áudio ser reproduzida pelo segundo reprodutor ou para combinar a primeira parte reproduzida (777) do sinal de áudio e a segunda parte do sinal de áudio reproduzido, em que um provedor (102; 200, 202a) é para prover o sinal da antena antes do sinal da antena ser pós- processado pelo segundo reprodutor (106) com base nos dados secundários.
2. O aparelho de acordo com a reivindicação 1, caracterizado pelo segundo reprodutor (106) ser configurado para reproduzir o sinal de áudio na segunda faixa de frequência com base nos dados secundários (126; 322; 708) e o sinal da antena (122; 204) se a primeira parte (777) do sinal de áudio não compreender um indicador para uma correlação entre a primeira parte do sinal de áudio e a segunda parte do sinal de áudio e em que o segundo reprodutor (106) é configurado para reproduzir o sinal de áudio na segunda faixa de frequência com base nos dados secundários (126; 322; 708) e uma versão da primeira parte do sinal de áudio, que foi deslocada à segunda faixa de frequência e que não foi decorrelacionada, se a primeira parte (777) do sinal de áudio compreender um indicador para uma correlação entre a primeira parte do sinal de áudio e a segunda parte do sinal de áudio.
3. O aparelho de acordo com a reivindicação 1 ou 2, caracterizado pelo provedor (102) ser configurado para fornecer um sinal da antena sintético que não está correlacionado com relação à primeira parte do sinal de áudio.
4. O aparelho de acordo com a reivindicação 3, caracterizado pelo sinal da antena sintético ser um sinal de ruído.
5. O aparelho de acordo com a reivindicação 1 ou 2, caracterizado pelo provedor (102) compreender uma unidade de mudança (200) e um decorrelacionador (202a ... 202p) que são configurados para gerar o sinal da antena (122; 204) como uma versão decorrelacionada da primeira parte (777) do sinal de áudio deslocada à segunda faixa de frequência.
6. O aparelho de acordo com a reivindicação 5, caracterizado pelo decorrelacionador (202a . 202p) ser configurado para preservar, pelo menos, um dentre um envelope espectral da primeira parte (777) do sinal de áudio e um envelope temporal da primeira parte (777) do sinal de áudio.
7. O aparelho de acordo com a reivindicação 5 ou 6, caracterizado pelo decorrelacionador (202a . 202p) compreender um dentre: um filtro passa-tudo configurado para produzir variações de atraso por grupo na primeira parte do sinal de áudio; um randomizador de fase configurado para produzir randomização de fase de coeficientes espectrais da primeira parte do sinal de áudio; e um aplicador configurado para aplicar um atraso de tempo dependente da frequência às subpartes da primeira parte do sinal de áudio.
8. O aparelho de acordo com uma das reivindicações de 5 a 7, caracterizado pelo decorrelacionador (202a ... 202p) compreender um decorrelacionador adaptativo do sinal configurado para variar o grau de decorrelação, a fim de aplicar uma decorrelação mais alta se a primeira parte (777) do sinal de áudio não compreender um indicador para uma correlação entre a primeira parte do sinal de áudio e a segunda parte do sinal de áudio e para aplicar uma decorrelação inferior ou não aplicar uma decorrelação se a primeira parte (777) do sinal de áudio compreender um indicador para uma correlação entre a primeira parte do sinal de áudio e a segunda parte do sinal de áudio.
9. O aparelho de acordo com uma das reivindicações de 2 e 8, compreendendo um detector (108) configurado para detectar se a primeira parte do sinal (777) do sinal de áudio compreende o indicador para uma correlação entre a primeira parte do sinal de áudio e a segunda parte do sinal de áudio.
10. O aparelho de acordo com uma das reivindicações de 1 a 9, caracterizado pelo provedor (200, 202a . 202p) ser configurado para fornecer um segundo sinal da antena em uma terceira faixa de frequência, em que o segundo sinal da antena não está correlacionado com relação à primeira parte do sinal de áudio ou é uma versão decorrelacionada da primeira parte do sinal de áudio, que foi deslocada à terceira faixa de frequência, em que o segundo sinal da antena não está correlacionado ou decorrelacionado com relação ao primeiro sinal da antena, em que o aparelho compreende um terceiro reprodutor, em que o terceiro reprodutor é configurado para reproduzir uma terceira parte do sinal de áudio com base no segundo sinal da antena e nos terceiros dados que representam informação adicional sobre a terceiro parte do sinal de áudio na terceira faixa de frequência, a terceira faixa de frequência compreendendo frequências mais altas do que a segunda faixa de frequência.
11. Um método para reproduzir um sinal de áudio com base nos dados primários (120; 321; 705), que representam uma versão codificada de uma primeira parte do sinal de áudio em uma primeira faixa de frequência, e dados secundários (126; 322; 708), que representam a informação adicional sobre uma segunda parte do sinal de áudio em uma segunda faixa de frequência, a segunda faixa de frequência compreendendo frequências mais altas do que a primeira faixa de frequência, o referido método compreendendo: reproduzir o sinal de áudio (777) na primeira faixa de frequência com base nos dados primários (120; 321; 705); fornecer um sinal da antena (122; 204) na segunda faixa de frequência, caracterizado pelo sinal da antena (122; 204) ser, pelo menos, parcialmente não correlacionado com relação à primeira parte (777) do sinal de áudio ou ser, pelo menos, parcialmente uma versão decorrelacionada da primeira parte (777) do sinal de áudio, que foi deslocada à segunda faixa de frequência; reproduzir a segunda parte do sinal de áudio na segunda faixa de frequência com base nos dados secundários (126; 322; 708) e o sinal da antena (122; 204) por meios de um pós-processador que pós-processa o sinal da antena com base nos dados secundários, em que um envelope espectral da segunda parte do sinal de áudio, um nível de ruído na segunda parte do sinal de áudio, uma medição de tonalidade para cada banda parcial na segunda parte do sinal de áudio, e uma codificação explícita das partes sinusoidais proeminentes na segunda parte do sinal de áudio representam a informação adicional representada pelos dados secundários; e combinar a primeira parte reproduzida (777) do sinal de áudio e do sinal da antena (122; 204) antes da segunda parte do sinal de áudio ser reproduzida ou combinar a primeira parte reproduzida (777) do sinal de áudio e da segunda parte do sinal de áudio reproduzido, em que um provedor (102; 200, 202a) é para prover o sinal da antena antes do sinal da antena ser pós- processado pelo segundo reprodutor (106) com base nos dados secundários
12. Um aparelho para gerar um sinal de áudio codificado (320), o sinal de áudio codificado (320) compreendendo dados primários (321) que representam uma versão codificada de uma primeira parte (703) do sinal de áudio em uma primeira faixa de frequência e dados secundários (322) que representam a informação adicional sobre uma segunda parte (706) do sinal de áudio em uma segunda faixa de frequência, a segunda faixa de frequência compreendendo frequências mais altas do que a primeira faixa de frequência, compreendendo: um somador da informação da decorrelação (300) configurado para adicionar ao sinal de áudio codificado (320), além dos dados primários (321) e dos dados secundários (322), a informação (323) sobre um grau de decorrelação a ser utilizado entre a primeira parte do sinal de áudio e um sinal da antena com base no qual a segunda parte do sinal de áudio é reproduzida por meios de um pós-processador ao reproduzir o sinal de áudio do sinal de áudio codificado, em que um envelope espectral da segunda parte do sinal de áudio, um nível de ruído na segunda parte do sinal de áudio, uma medição de tonalidade para cada banda parcial na segunda parte do sinal de áudio, e uma codificação explícita de partes sinusoidais proeminentes na segunda parte do sinal de áudio representam a informação adicional representada pelos dados secundários, e em que as informações sobre um grau de decorrelação devem ser usadas antes do sinal de correção ser pós-processado com base nos dados secundários pelo pós- processador na reprodução da segunda parte do sinal de áudio.
13. Um método para gerar um sinal de áudio codificado (320), o sinal de áudio codificado (320) compreendendo dados primários (321) que representam uma versão codificada de uma primeira parte (703) do sinal de áudio em uma primeira faixa de frequência e dados secundários (322) que representam a informação adicional sobre uma segunda parte (706) do sinal de áudio em uma segunda faixa de frequência, a segunda faixa de frequência compreendendo frequências mais altas do que a primeira faixa de frequência, compreendendo: adicionar ao sinal de áudio codificado (320), além dos dados primários (321) e dos dados secundários (322), a informação (323) sobre um grau de decorrelação a ser utilizado entre a primeira parte do sinal de áudio e um sinal da antena com base no qual a segunda parte do sinal de áudio é reproduzida por meios de um pós-processador ao reproduzir o sinal de áudio do sinal de áudio codificado (320), caracterizado por um envelope espectral da segunda parte do sinal de áudio, de um nível de ruído na segunda parte do sinal de áudio, de uma medição de tonalidade para cada banda parcial na segunda parte do sinal de áudio, e de uma codificação explícita das partes sinusoidais proeminentes na segunda parte do sinal de áudio representarem a informação adicional representada pelos dados secundários, e em que as informações sobre um grau de decorrelação devem ser usadas antes do sinal de correção ser pós-processado com base nos dados secundários pelo pós-processador na reprodução da segunda parte do sinal de áudio.
BR112015004556-1A 2012-08-27 2013-08-27 Aparelho e método para reproduzir um sinal de áudio, aparelho e método para gerar um sinal de áudio codificado BR112015004556B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261693575P 2012-08-27 2012-08-27
US61/693,575 2012-08-27
EP12187265.9 2012-10-04
EP12187265.9A EP2704142B1 (en) 2012-08-27 2012-10-04 Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
PCT/EP2013/067730 WO2014033131A1 (en) 2012-08-27 2013-08-27 Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal

Publications (2)

Publication Number Publication Date
BR112015004556A2 BR112015004556A2 (pt) 2017-07-04
BR112015004556B1 true BR112015004556B1 (pt) 2021-10-13

Family

ID=47010331

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112015004556-1A BR112015004556B1 (pt) 2012-08-27 2013-08-27 Aparelho e método para reproduzir um sinal de áudio, aparelho e método para gerar um sinal de áudio codificado

Country Status (15)

Country Link
US (1) US9305564B2 (pt)
EP (2) EP2704142B1 (pt)
JP (1) JP6229957B2 (pt)
KR (1) KR101711312B1 (pt)
CN (1) CN104603872B (pt)
AR (1) AR092228A1 (pt)
BR (1) BR112015004556B1 (pt)
CA (1) CA2882775C (pt)
ES (2) ES2549953T3 (pt)
MX (1) MX347592B (pt)
PL (1) PL2888737T3 (pt)
PT (1) PT2888737T (pt)
RU (1) RU2607262C2 (pt)
TW (1) TWI523004B (pt)
WO (1) WO2014033131A1 (pt)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
WO2014126688A1 (en) * 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
JP6242489B2 (ja) * 2013-07-29 2017-12-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法
US9831843B1 (en) 2013-09-05 2017-11-28 Cirrus Logic, Inc. Opportunistic playback state changes for audio devices
US9774342B1 (en) 2014-03-05 2017-09-26 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system
US10284217B1 (en) 2014-03-05 2019-05-07 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system
US10785568B2 (en) 2014-06-26 2020-09-22 Cirrus Logic, Inc. Reducing audio artifacts in a system for enhancing dynamic range of audio signal path
EP2980792A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980789A1 (en) 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
US9596537B2 (en) 2014-09-11 2017-03-14 Cirrus Logic, Inc. Systems and methods for reduction of audio artifacts in an audio system with dynamic range enhancement
CN104195726B (zh) * 2014-09-23 2016-04-13 宜兴市华恒高性能纤维织造有限公司 一种自动化2.5d立体编织装置
US9503027B2 (en) 2014-10-27 2016-11-22 Cirrus Logic, Inc. Systems and methods for dynamic range enhancement using an open-loop modulator in parallel with a closed-loop modulator
WO2016200391A1 (en) * 2015-06-11 2016-12-15 Interactive Intelligence Group, Inc. System and method for outlier identification to remove poor alignments in speech synthesis
US9959856B2 (en) 2015-06-15 2018-05-01 Cirrus Logic, Inc. Systems and methods for reducing artifacts and improving performance of a multi-path analog-to-digital converter
US9955254B2 (en) 2015-11-25 2018-04-24 Cirrus Logic, Inc. Systems and methods for preventing distortion due to supply-based modulation index changes in an audio playback system
US9543975B1 (en) 2015-12-29 2017-01-10 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system with low-pass filter between paths
US9880802B2 (en) 2016-01-21 2018-01-30 Cirrus Logic, Inc. Systems and methods for reducing audio artifacts from switching between paths of a multi-path signal processing system
US9998826B2 (en) 2016-06-28 2018-06-12 Cirrus Logic, Inc. Optimization of performance and power in audio system
US10545561B2 (en) 2016-08-10 2020-01-28 Cirrus Logic, Inc. Multi-path digitation based on input signal fidelity and output requirements
US10263630B2 (en) 2016-08-11 2019-04-16 Cirrus Logic, Inc. Multi-path analog front end with adaptive path
US9813814B1 (en) 2016-08-23 2017-11-07 Cirrus Logic, Inc. Enhancing dynamic range based on spectral content of signal
US9780800B1 (en) 2016-09-19 2017-10-03 Cirrus Logic, Inc. Matching paths in a multiple path analog-to-digital converter
US9929703B1 (en) 2016-09-27 2018-03-27 Cirrus Logic, Inc. Amplifier with configurable final output stage
US9967665B2 (en) * 2016-10-05 2018-05-08 Cirrus Logic, Inc. Adaptation of dynamic range enhancement based on noise floor of signal
EP3382704A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal
US10321230B2 (en) 2017-04-07 2019-06-11 Cirrus Logic, Inc. Switching in an audio system with multiple playback paths
US10008992B1 (en) 2017-04-14 2018-06-26 Cirrus Logic, Inc. Switching in amplifier with configurable final output stage
US9917557B1 (en) 2017-04-17 2018-03-13 Cirrus Logic, Inc. Calibration for amplifier with configurable final output stage
US10896684B2 (en) * 2017-07-28 2021-01-19 Fujitsu Limited Audio encoding apparatus and audio encoding method
US11158297B2 (en) * 2020-01-13 2021-10-26 International Business Machines Corporation Timbre creation system
GB202203733D0 (en) * 2022-03-17 2022-05-04 Samsung Electronics Co Ltd Patched multi-condition training for robust speech recognition

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5757973A (en) * 1991-01-11 1998-05-26 Sony Corporation Compression of image data seperated into frequency component data in a two dimensional spatial frequency domain
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
WO2002013183A1 (fr) * 2000-08-09 2002-02-14 Sony Corporation Procede et dispositif de traitement de donnees vocales
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
JP4227772B2 (ja) * 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
JP4597967B2 (ja) 2003-04-17 2010-12-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号生成
CN1774957A (zh) * 2003-04-17 2006-05-17 皇家飞利浦电子股份有限公司 音频信号生成
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
JP4821131B2 (ja) * 2005-02-22 2011-11-24 沖電気工業株式会社 音声帯域拡張装置
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
WO2007118583A1 (en) 2006-04-13 2007-10-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decorrelator
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
EP2301026B1 (en) * 2008-07-11 2020-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal synthesizer and audio signal encoder
EP2176862B1 (en) * 2008-07-11 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
WO2010003557A1 (en) * 2008-07-11 2010-01-14 Frauenhofer- Gesellschaft Zur Förderung Der Angewandten Forschung E. V. Apparatus and method for generating a bandwidth extended signal
EP2301028B1 (en) * 2008-07-11 2012-12-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus and a method for calculating a number of spectral envelopes
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN102725791B (zh) * 2009-11-19 2014-09-17 瑞典爱立信有限公司 用于音频编解码中的响度和锐度补偿的方法和设备
JP5651980B2 (ja) * 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
KR101461774B1 (ko) * 2010-05-25 2014-12-02 노키아 코포레이션 대역폭 확장기
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
KR101572034B1 (ko) * 2011-05-19 2015-11-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 파라메트릭 오디오 코딩 방식들의 포렌식 검출

Also Published As

Publication number Publication date
KR20150047607A (ko) 2015-05-04
WO2014033131A1 (en) 2014-03-06
BR112015004556A2 (pt) 2017-07-04
JP2015526769A (ja) 2015-09-10
US9305564B2 (en) 2016-04-05
EP2888737B1 (en) 2016-06-22
PL2888737T3 (pl) 2016-12-30
EP2704142B1 (en) 2015-09-02
MX2015002509A (es) 2015-06-10
RU2015110702A (ru) 2016-10-20
CA2882775A1 (en) 2014-03-06
KR101711312B1 (ko) 2017-02-28
EP2888737A1 (en) 2015-07-01
CN104603872A (zh) 2015-05-06
RU2607262C2 (ru) 2017-01-10
MX347592B (es) 2017-05-03
TWI523004B (zh) 2016-02-21
CN104603872B (zh) 2017-08-11
ES2549953T3 (es) 2015-11-03
AR092228A1 (es) 2015-04-08
EP2704142A1 (en) 2014-03-05
CA2882775C (en) 2017-08-29
JP6229957B2 (ja) 2017-11-15
ES2593072T3 (es) 2016-12-05
PT2888737T (pt) 2016-10-04
US20150170663A1 (en) 2015-06-18
TW201419269A (zh) 2014-05-16

Similar Documents

Publication Publication Date Title
BR112015004556B1 (pt) Aparelho e método para reproduzir um sinal de áudio, aparelho e método para gerar um sinal de áudio codificado
CA2918804C (en) Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
Nagel et al. A harmonic bandwidth extension method for audio codecs
AU2010268160B2 (en) Bandwidth extension encoder, bandwidth extension decoder and phase vocoder
WO2014115225A1 (ja) 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法
AU2014201331B2 (en) Bandwidth extension encoder, bandwidth extension decoder and phase vocoder

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 27/08/2013, OBSERVADAS AS CONDICOES LEGAIS.