BR122017006820A2 - codificador e decodificador de áudio para codificação em forma de onda intercalada - Google Patents

codificador e decodificador de áudio para codificação em forma de onda intercalada Download PDF

Info

Publication number
BR122017006820A2
BR122017006820A2 BR122017006820A BR122017006820A BR122017006820A2 BR 122017006820 A2 BR122017006820 A2 BR 122017006820A2 BR 122017006820 A BR122017006820 A BR 122017006820A BR 122017006820 A BR122017006820 A BR 122017006820A BR 122017006820 A2 BR122017006820 A2 BR 122017006820A2
Authority
BR
Brazil
Prior art keywords
frequency
signal
encoded
waveform
crossing
Prior art date
Application number
BR122017006820A
Other languages
English (en)
Other versions
BR122017006820B1 (pt
Inventor
Mundt Harald
Purnhagen Heiko
Jonas Roeden Karl
Kjoerling Kristofer
Thesing Robin
Original Assignee
Dolby Int Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Int Ab filed Critical Dolby Int Ab
Publication of BR122017006820A2 publication Critical patent/BR122017006820A2/pt
Publication of BR122017006820B1 publication Critical patent/BR122017006820B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)

Abstract

codificador e decodificador de áudio para codificação em forma de onda intercalada a presente invenção refere-se a métodos e aparelhos para decodificação e codificação de sinais de áudio. em particular, um método para decodificação inclui receber um sinal codificado em forma de onda tendo um conteúdo espectral correspondente a um subconjunto da faixa de frequência acima de uma frequência de cruzamento. o sinal codificado em forma de onda é intercalado com uma reconstrução de alta frequência paramétrica do sinal de áudio acima da frequência de cruzamento. desta forma uma reconstrução melhorada das bandas de alta frequência do sinal de áudio é alcançada.

Description

Relatório Descritivo da Patente de Invenção para CODIFICADOR E DECODIFICADOR DE ÁUDIO PARA CODIFICAÇÃO EM FORMA DE ONDA INTERCALADA.
Dividido do BR112015025022-0, depositado em 4 de abril de 2014.
Campo Técnico da Invenção [001] A presente invenção neste documento geralmente refere-se à codificação e decodificação de áudio. Em particular, ela se refere a um codificador de áudio e um decodificador de áudio adaptados para executar a reconstrução de alta frequência de sinais de áudio. Antecedentes da Invenção [002] Sistemas de codificação de áudio usam metodologias diferentes para codificar áudio, tal como codificação em forma de onda pura, codificação espacial paramétrica e algoritmos de reconstrução de alta frequência, incluindo o algoritmo de Replicação de Banda Espectral (SBR). O padrão MPEG-4 combina codificação em forma de onda e SBR de sinais de áudio. Mais precisamente, um codificador pode codificar em forma de onda um sinal de áudio para bandas espectrais até uma frequência de cruzamento e codificar as bandas espectrais acima da frequência de cruzamento usando codificação de SBR. A parte codificada em forma de onda do sinal de áudio é, então, transmitida para um decodificador juntamente com parâmetros de SBR determinados durante a codificação de SBR. Com base na parte codificada em forma de onda do sinal de áudio e nos parâmetros de SBR o decodificador, então, reconstrói o sinal de áudio nas bandas espectrais acima da frequência de cruzamento como discutido no artigo de revisão Brinker et al., An overview of the Coding Standard MPEG-4 Audio Amendments 1 and 2: HE-AAC, SSC, and HE-AAC v2, EURASIP Journal on Audio, Speech, and Music Processing, Volume 2009, Article ID 468971.
Petição 870170021816, de 03/04/2017, pág. 21/66
2/39 [003] Um problema com esta abordagem é que fortes componentes tonais, isto é, fortes componentes harmônicos, ou qualquer componente nas bandas espectrais altas que não seja bem reconstruído pelo algoritmo de SBR, serão perdidos na saída.
[004] Para este fim, o algoritmo de SBR implementa um procedimento de detecção de harmônicos faltantes. Componentes tonais que não serão regenerados adequadamente pela reconstrução de alta frequência de SBR são identificados no lado do codificador. Informação da localização de frequência destes componentes tonais fortes é transmitida para o decodificador onde o conteúdo espectral das bandas espectrais onde os componentes tonais ausentes estão localizados é substituído pelas senoides geradas no decodificador.
[005] Uma vantagem da detecção de harmônicos ausentes fornecida no algoritmo de SBR é que é uma solução de taxa de bits muito baixa, um pouco simplificada, apenas o local de frequência do componente tonal e seu nível de amplitude precisam ser transmitidos para o decodificador.
[006] Um empecilho da detecção de harmônicos ausentes do algoritmo de SBR é que ele é um modelo muito grosseiro. Outro empecilho é que quando a taxa de transmissão é baixa, isto é, quando o número de bits que podem ser transmitidos por segundo é baixo, e como consequência dos mesmos as bandas espectrais são largas, uma faixa de frequência grande será substituída por uma senoide.
[007] Outro empecilho do algoritmo de SBR é que ele tem uma tendência a manchar transientes ocorrendo no sinal de áudio. Tipicamente, haverá um pré-eco e um pós-eco do transiente no sinal de áudio reconstruído de SBR. Assim, há espaço para melhorias.
Breve Descrição dos Desenhos [008] No que se segue, modalidades de exemplo serão descritas mais detalhadamente e com referência aos desenhos em anexo, nos
Petição 870170021816, de 03/04/2017, pág. 22/66
3/39 quais:
a Fig. 1 é um desenho esquemático de um decodificador de acordo com modalidades de exemplo;
a Fig. 2 é um desenho esquemático de um decodificador de acordo com modalidades de exemplo;
a Fig. 3 é um fluxograma de um método de decodificação de acordo com modalidades de exemplo;
a Fig. 4 é um desenho esquemático de um decodificador de acordo com modalidades de exemplo;
a Fig. 5 é um desenho esquemático de um codificador de acordo com modalidades de exemplo;
a Fig. 6 é um fluxograma de um método de codificação de acordo com modalidades de exemplo;
a Fig. 7 é uma ilustração esquemática de um esquema de sinalização de acordo com modalidades de exemplo; e as Figs 8a-b são uma ilustração esquemática de um estágio de intercalação de acordo com modalidades de exemplo.
[009] Todas as figuras são esquemáticas e geralmente só mostram as peças que são necessárias a fim de elucidar a invenção, ao passo que outras partes podem ser omitidas ou meramente sugeridas. A menos que indicado em contrário, numerais de referência similares se referem a partes similares em figuras diferentes.
Descrição Detalhada da Invenção [0010] Em vista do acima, é um objeto fornecer um codificador e um decodificador e métodos associados que proporcionem uma reconstrução melhorada de transientes e componentes tonais nas bandas de alta frequência.
I. Visão Geral - Decodificador [0011] Como usado aqui, um sinal de áudio pode ser um sinal de áudio puro, uma parte de áudio de um sinal audiovisual ou sinal de
Petição 870170021816, de 03/04/2017, pág. 23/66
4/39 multimídia ou qualquer um destes em combinação com metadados. [0012] De acordo com um primeiro aspecto, modalidades de exemplo propõem métodos de decodificação, dispositivos de decodificação e produtos de programa de computador para decodificação. Os métodos, dispositivos e produtos de programa de computador propostos em geral podem ter as mesmas características e vantagens.
[0013] De acordo com as modalidades de exemplo é fornecido um método de decodificação em um sistema de processamento de áudio compreendendo: receber um primeiro sinal codificado em forma de onda tendo um conte espectral até uma primeira frequência de cruzamento; receber um segundo sinal codificado em forma de onda tendo um conteúdo espectral correspondente a um subconjunto da faixa de frequência acima da primeira frequência de cruzamento; receber parâmetros de reconstrução de alta frequência; realizar reconstrução de alta frequência usando o primeiro sinal codificado em forma de onda e os parâmetros de reconstrução de alta frequência, de modo a gerar um sinal em frequência tendo um conteúdo espectral acima da primeira frequência de cruzamento; e intercalar o sinal estendido em frequência com o segundo sinal codificado em forma de onda.
[0014] Como usado aqui, um sinal codificado em forma de onda será interpretado como um sinal que foi codificado por quantização direta de uma representação da forma de onda; mais preferida uma quantização das linhas de uma transformada de frequência do sinal em forma de onda de entrada. Isto se opõe a uma codificação paramétrica, onde o sinal é representado por variações de um modelo genérico de um atributo de sinal.
[0015] O método de decodificação assim sugere usar dados codificados em forma de onda em um subconjunto da faixa de frequência acima da primeira frequência de cruzamento e intercalar esses com um sinal reconstruído de alta frequência. Deste modo, partes importanPetição 870170021816, de 03/04/2017, pág. 24/66
5/39 tes de um sinal na banda de frequência acima da primeira frequência de cruzamento, tal como componentes tonais ou transientes que são tipicamente não bem reconstruídos por algoritmos de reconstrução de alta frequência paramétrica, podem ser codificadas em forma de onda. Como resultado, a reconstrução destas partes importantes de um sinal na banda de frequência acima da primeira frequência de cruzamento é melhorada.
[0016] De acordo com modalidades exemplares, o subconjunto da faixa de frequência acima da primeira frequência de cruzamento é um subconjunto esparso. Por exemplo, ele pode compreender uma pluralidade de intervalos de frequência isolados. Isto é vantajoso em que o número de bits para codificar o segundo sinal codificado em forma de onda é baixo. Ainda, por ter uma pluralidade de componentes tonais de intervalos de frequência isolados, por exemplo, harmônicos simples, o sinal de áudio pode ser bem capturado pelo segundo sinal codificado em forma de onda. Como resultado, uma melhoria da reconstrução de componentes tonais para bandas de alta frequência é alcançada a um baixo custo de bit.
[0017] Como usado aqui, um harmônico ausente ou um único harmônico significa qualquer parte tonal forte arbitrariamente do espectro. Em particular, é para ser entendido que um harmônico ausente ou um único harmônico não é limitado a um harmônico de uma série harmônica.
[0018] De acordo com modalidades exemplares, o segundo sinal codificado em forma de onda pode representar um transiente no sinal de áudio a ser reconstruído. Um transiente é tipicamente limitado a uma faixa temporal curta, tal como aproximadamente centena de amostras temporais a uma taxa de amostragem de 48kHz, por exemplo, uma faixa temporal na ordem de 5 a 10 milissegundos, mas pode ter uma ampla faixa de frequência. Para capturar o transiente, o subPetição 870170021816, de 03/04/2017, pág. 25/66
6/39 conjunto da faixa de frequência acima da primeira frequência de cruzamento pode, portanto, compreender um intervalo de frequência se estendendo entre a primeira frequência de cruzamento e uma segunda frequência de cruzamento. Isto é vantajoso em que uma reconstrução melhorada de transientes pode ser alcançada.
[0019] De acordo com modalidades exemplares, a segunda frequência de cruzamento varia em função do tempo. Por exemplo, a segunda frequência de cruzamento pode variar dentro de um quadro de tempo definido ajustado pelo sistema de processamento de áudio. Desta forma, a faixa temporal curta de transientes pode ser contabilizada.
[0020] De acordo com modalidades exemplares, a etapa de executar reconstrução de alta frequência compreende executar replicação de banda espectral, SBR. Reconstrução de alta frequência tipicamente é executada em um domínio de frequência, tal como um domínio pseudo de Filtros de Espelho de Quadratura, QMF, de, por exemplo, 64 sub-bandas.
[0021] De acordo com modalidades exemplares, a etapa de intercalar o sinal estendido em frequência com o segundo sinal codificado em forma de onda é executada em um domínio de frequência, tal como um domínio QMF. Tipicamente, para facilidade de implementação e melhor controle sobre as características de tempo e frequência dos dois sinais, a intercalação é executada no mesmo domínio de frequência como a reconstrução de alta frequência.
[0022] De acordo com modalidades exemplares, o primeiro e o segundo sinais codificados em forma de onda como recebidos são codificados usando a mesma Transformada de Cosseno Discreta Modificada, MDCT.
[0023] De acordo com modalidades exemplares, o método de decodificação pode compreender ajustar o conteúdo espectral do sinal
Petição 870170021816, de 03/04/2017, pág. 26/66
7/39 estendido em frequência de acordo com os parâmetros de reconstrução de alta frequência, de modo a ajustar o envelope espectral do sinal estendido em frequência.
[0024] De acordo com modalidades exemplares, a intercalação pode compreender adicionar o segundo sinal codificado em forma de onda ao sinal estendido em frequência. Esta é a opção preferida se o segundo sinal codificado em forma de onda representar componentes tonais, tal como quando o subconjunto da faixa de frequência acima da primeira frequência de cruzamento compreender uma pluralidade de intervalos de frequência isolados. A adição do segundo sinal codificado em forma de onda ao sinal estendido em frequência imita a adição paramétrica de harmônicos como conhecido de SBR e permite que o sinal de cópia de SBR seja usado para evitar que grandes faixas de frequência sejam substituídas por um único componente tonal misturando-o num nível adequado.
[0025] De acordo com modalidades exemplares, a intercalação compreende substituir o conteúdo espectral do sinal estendido em frequência pelo conteúdo espectral do segundo sinal codificado em forma de onda no subconjunto da faixa de frequência acima da primeira frequência de cruzamento que corresponde ao conteúdo espectral do segundo sinal codificado em forma de onda. Esta é a opção preferida quando o segundo sinal codificado em forma de onda representa um transiente, por exemplo, quando o subconjunto da faixa de frequência acima da primeira frequência de cruzamento, portanto, pode compreender um intervalo de frequência se estendendo entre a primeira frequência de cruzamento e uma segunda frequência de cruzamento. A substituição tipicamente é apenas executada por uma faixa de tempo coberta pelo segundo sinal codificado em forma de onda. Desta forma, tão pouco quanto possível pode ser substituído, embora ainda suficiente para substituir um transiente e mancha de tempo potencial prePetição 870170021816, de 03/04/2017, pág. 27/66
8/39 sentes no sinal estendido em frequência e a intercalação não é, assim, limitada a um segmento de tempo especificado pela grade de tempo de envelope de SBR.
[0026] De acordo com modalidades exemplares, o primeiro e o segundo sinais codificados em forma de onda podem ser sinais separados significando que eles foram codificados separadamente. Alternativamente, o primeiro sinal codificado em forma de onda e o segundo sinal codificado em forma de onda formam a primeira e a segunda porções de sinal de um sinal comum, codificado em conjunto. A última alternativa é mais atraente do ponto de vista implementação.
[0027] De acordo com modalidades exemplares, o método de decodificação pode compreender receber um sinal de controle compreendendo dados relativos a uma ou mais faixas de tempo e uma ou mais faixas de frequência acima da primeira frequência de cruzamento para a qual o segundo sinal codificado em forma de onda está disponível, em que a etapa de intercalar o sinal estendido em frequência com o segundo sinal codificado em forma de onda é baseada no sinal de controle. Isto é vantajoso em que fornece uma maneira eficiente de controlar a intercalação.
[0028] De acordo com modalidades exemplares, o sinal de controle compreende pelo menos um de um segundo vetor indicando as uma ou mais faixas de frequência acima da primeira frequência de cruzamento para a qual o segundo sinal codificado em forma de onda está disponível para intercalação com o sinal estendido em frequência e um terceiro vetor indicando as uma ou faixas de tempo para as quais o segundo sinal codificado em forma de onda está disponível para intercalação com o sinal estendido em frequência. Esta é uma maneira conveniente de implementar o sinal de controle.
[0029] De acordo com modalidades exemplares, o sinal de controle compreende um primeiro vetor indicando uma ou mais faixas de frePetição 870170021816, de 03/04/2017, pág. 28/66
9/39 quência acima da primeira frequência de cruzamento a ser reconstruída parametricamente com base nos parâmetros de reconstrução de alta frequência. Desta forma, ao sinal estendido em frequência pode ser dada precedência sobre o segundo sinal codificado em forma de onda para certas bandas de frequência.
[0030] De acordo com modalidades exemplares, também é fornecido um produto de programa de computador compreendendo um meio legível por computador com instruções para executar qualquer método de decodificação do primeiro aspecto.
[0031] De acordo com modalidades exemplares, também é fornecido um decodificador para um sistema de processamento de áudio compreendendo: um estágio de recepção configurado para receber um primeiro sinal codificado em forma de onda tendo um conteúdo espectral de uma primeira frequência de cruzamento, um segundo sinal codificado em forma de onda tendo um conteúdo espectral correspondente a um subconjunto da faixa de frequência acima da frequência de cruzamento e parâmetros de reconstrução de alta frequência; um estágio de reconstrução de alta frequência configurado para receber o primeiro sinal decodificado em forma de onda e os parâmetros de reconstrução de alta frequência do estágio de recepção e realizar reconstrução de alta frequência usando o primeiro sinal codificado em forma de onda e os parâmetros de reconstrução de alta frequência, de modo a gerar um sinal estendido em frequência tendo um conteúdo espectral acima da primeira frequência de cruzamento; e um estágio de intercalação configurado para receber o sinal estendido em frequência do estágio de reconstrução de alta frequência e o segundo sinal codificado em forma de onda do estágio de recepção e intercalar o sinal estendido em frequência com o segundo sinal codificado em forma de onda.
[0032] De acordo com modalidades exemplares, o decodificador pode ser configurado para executar qualquer método de decodificação
Petição 870170021816, de 03/04/2017, pág. 29/66
10/39 descrito neste documento.
II. Visão Geral - Codificador [0033] De acordo com um segundo aspecto, modalidades de exemplo propõem métodos de codificação, dispositivos de codificação e produtos de programa de computador para codificação. Os métodos, dispositivos e produtos de programa de computador propostos em geral podem ter as mesmas características e vantagens.
[0034] Vantagens em relação a características e configurações como apresentadas na visão geral do decodificador acima geralmente podem ser válidas para as características e configurações para o codificador [0035] De acordo com modalidades de exemplo é fornecido um método de codificação em um sistema de processamento de áudio compreendendo as etapas de: receber um sinal de áudio a ser codificado; calcular, com base no sinal de áudio recebido, parâmetros de reconstrução de alta frequência permitindo reconstrução de alta frequência do sinal de áudio recebido acima da primeira frequência de cruzamento; identificar, com base no sinal de áudio recebido, um subconjunto da faixa de frequência acima da primeira frequência de cruzamento para o qual o conteúdo espectral do sinal de áudio recebido será codificado em forma de onda e posteriormente, em um decodificador, será intercalado com uma reconstrução de alta frequência do sinal de áudio; gerar um primeiro sinal codificado em forma de onda por codificação em forma de onda do sinal de áudio recebido para bandas espectrais até uma primeira frequência de cruzamento; e um segundo sinal codificado em forma de onda por codificação em forma de onda do sinal de áudio recebido para bandas espectrais correspondentes ao subconjunto identificado da faixa de frequência acima da primeira frequência de cruzamento.
[0036] De acordo com modalidades de exemplo, o subconjunto da
Petição 870170021816, de 03/04/2017, pág. 30/66
11/39 faixa de frequência acima da primeira frequência de cruzamento pode compreender uma pluralidade de intervalos de frequência isolados.
[0037] De acordo com modalidades de exemplo, o subconjunto da faixa de frequência acima da primeira frequência de cruzamento pode compreender um intervalo de frequência se estendendo entre a primeira frequência de cruzamento e a segunda frequência de cruzamento.
[0038] De acordo com modalidades de exemplo, a segunda frequência de cruzamento pode variar em função do tempo.
[0039] De acordo com modalidades de exemplo, os parâmetros de reconstrução de alta frequência são calculados usando codificação de replicação de banda espectral, SBR.
[0040] De acordo com modalidades de exemplo, o método de codificação pode compreender ainda ajustar níveis de envelope espectral compreendidos nos parâmetros de reconstrução de alta frequência, de modo a compensar a adição de uma reconstrução de alta frequência do sinal de áudio recebido com o segundo sinal codificado em forma de onda em um decodificador. Quando o segundo sinal codificado em forma de onda é adicionado a um sinal reconstruído de alta frequência no decodificador, os níveis de envelope espectral do sinal combinado são diferentes níveis de envelope espectral do sinal reconstruído de alta frequência. Esta mudança nos níveis de envelope espectral pode ser levada em conta no codificador, de modo que o sinal combinado no decodificador obtenha um envelope espectral de alvo. Realizando o ajuste do lado do codificador, a inteligência necessária no lado do decodificador pode ser reduzida, ou dito de outro modo; a necessidade de definir regras específicas no decodificador para como lidar com a situação é removida por sinalização específica do codificador para o decodificador. Isto permite otimizações futuras do sistema por futuras otimizações do codificador sem ter que atualizar decodificadores implantado potencialmente de modo amplo.
Petição 870170021816, de 03/04/2017, pág. 31/66
12/39 [0041] De acordo com modalidades de exemplo, a etapa de ajustar os parâmetros de reconstrução de alta frequência pode compreender: medir uma energia do segundo sinal codificado em forma de onda; e ajustar os níveis de envelope espectral, conforme pretendido para controlar o envelope espectral do sinal Reconstruído de Alta Frequência subtraindo a energia medida do sinal segundo codificado em forma de onda dos níveis de envelope espectral para bandas espectrais correspondentes ao conteúdo espectral do segundo sinal codificado em forma de onda.
[0042] De acordo com modalidades exemplares, também é fornecido um produto de programa de computador compreendendo um meio legível por computador com instruções para executar qualquer método de codificação do segundo aspecto.
[0043] De acordo com modalidades de exemplo, é fornecido um codificador para um sistema de processamento de áudio compreendendo: um estágio de recepção configurado para receber um sinal de áudio a ser codificado; um estágio de codificação de alta frequência configurado para receber o sinal de áudio do estágio de recepção e calcular, com base no sinal de áudio recebido, parâmetros de reconstrução de alta frequência permitindo reconstrução de alta frequência do sinal de áudio recebido acima da primeira frequência de cruzamento; um estágio de detecção de codificação de intercalação configurado para identificar, com base no sinal de áudio recebido, um subconjunto da faixa de frequência acima da primeira frequência de cruzamento para o qual o conteúdo espectral do sinal de áudio recebido será codificado em forma de onda e posteriormente, em um decodificador, será intercalado com uma reconstrução de alta frequência do sinal de áudio; e um estágio de codificação em forma de onda configurado para receber o sinal de áudio do estágio de recepção e gerar um primeiro sinal codificado em forma de onda por codificação em forma de onda
Petição 870170021816, de 03/04/2017, pág. 32/66
13/39 do sinal de áudio recebido para bandas espectrais até uma primeira frequência de cruzamento; e receber o subconjunto identificado de faixa de frequência acima da primeira frequência de cruzamento do estágio de detecção de codificação de intercalação e gerar um segundo sinal codificado em forma de onda por codificação em forma de onda do sinal de áudio recebido para bandas espectrais correspondentes ao subconjunto identificado recebido da faixa de frequência.
[0044] De acordo com modalidades de exemplo, o codificador ainda pode compreender um estágio de ajuste de envelope configurado para receber os parâmetros de reconstrução de alta frequência do estágio de codificação de alta frequência e o subconjunto identificado da faixa de frequência acima da primeira frequência de cruzamento do estágio de detecção de codificação de intercalação e, com base nos dados recebidos, ajustar os parâmetros de reconstrução de alta frequência de modo a compensar a subsequente intercalação de uma reconstrução de alta frequência do sinal de áudio recebido com o segundo sinal codificado em forma de onda no decodificador.
[0045] De acordo com modalidades de exemplo, o decodificador pode ser configurado para executar qualquer método de decodificação descrito neste documento.
III. Modalidades de exemplo - Decodificador [0046] Fig. 1 ilustra uma modalidade de exemplo de um decodificador 100. O decodificador compreende um estágio de recepção 110, um estágio de reconstrução de alta frequência 120 e um estágio de intercalação 130.
[0047] A operação do decodificador 100 agora será explicada mais detalhadamente com referência á modalidade de exemplo da Fig. 2, mostrando um decodificador 200 e o fluxograma da Fig. 3. O objetivo do decodificador 200 é dar uma reconstrução de sinal melhorada para altas frequências no caso onde há fortes componentes tonais nas
Petição 870170021816, de 03/04/2017, pág. 33/66
14/39 bandas de alta frequência do sinal de áudio a ser reconstruído. O estágio de recepção 110 recebe, na etapa D02, um primeiro sinal codificado em forma de onda 201. O primeiro sinal codificado em forma de onda 201 tem um conteúdo espectral até uma primeira frequência de cruzamento fc, isto é, o primeiro sinal codificado em forma de onda 201 é um sinal de banda baixa que é limitado à faixa de frequência abaixo da primeira frequência de cruzamento fc.
[0048] O estágio de recepção 110 recebe, na etapa D04, um segundo sinal codificado em forma de onda 202. O segundo sinal codificado em forma de onda 202 tem um conteúdo espectral que corresponde a um subconjunto da faixa de frequência acima da primeira frequência de cruzamento fc. No exemplo ilustrado da Fig. 2, o segundo sinal codificado em forma de onda 202 tem um conteúdo espectral correspondente a uma pluralidade de intervalos de frequência isolados 202a e 202b. O segundo sinal codificado em forma de onda 202 pode, assim, ser visto como sendo composto de uma pluralidade de sinais limitados em banda, cada sinal limitado em banda correspondente a um dos intervalos de frequência isolados 202a e 202b. Na Fig. 2 apenas dois intervalos de frequência 202a e 202b são mostrados. Geralmente, o conteúdo espectral do segundo sinal codificado em forma de onda pode corresponder a qualquer número de intervalos de frequência de largura variável.
[0049] O estágio de recepção 110 pode receber o primeiro e o segundo sinais codificados em forma de onda 201 e 202 como dois sinais separados. Alternativamente, o primeiro e o segundo sinais codificados em forma de onda 201 e 202 podem formar primeira e segunda porções de sinal de um sinal comum recebido pelo estágio de recepção 110. Em outras palavras, o primeiro e o segundo sinais codificados em forma de onda podem ser conjuntamente codificados, por exemplo, usando a mesma transformada MDCT.
Petição 870170021816, de 03/04/2017, pág. 34/66
15/39 [0050] Tipicamente, o primeiro sinal codificado em forma de onda 201 e o segundo sinal codificado em forma de onda 202 como recebidos pelo estágio de recepção 110 são codificados usando uma transformada de janela de sobreposição, tal como uma transformada MDCT. O estágio de recepção pode compreender um estágio de decodificação em forma de onda 240 configurado para transformar o primeiro e o segundo sinais codificados em forma de onda 201 e 202 no domínio do tempo. O estágio de decodificação em forma de onda 240 tipicamente compreende um banco de filtros MDCT configurado para executar transformada MDCT inversa do primeiro e do segundo sinais codificados em forma de onda 201 e 202.
[0051] O estágio de recepção 110 ainda recebe, na etapa D06, parâmetros de reconstrução de alta frequência que são utilizados pelo estágio da fase de reconstrução de alta frequência 120 como será descrita a seguir.
[0052] O primeiro sinal codificado em forma de onda 201 e os parâmetros de alta frequência recebidos pelo estágio de recepção 110 são, então, inseridos no estágio de reconstrução de alta frequência 120. O estágio de reconstrução de alta frequência 120 tipicamente opera em sinais em um domínio de frequência, de preferência um domínio QMF. Antes de ser inserido no estágio de reconstrução de alta frequência 120, o primeiro sinal codificado em forma de onda 201 é, portanto, de preferência transformado no domínio de frequência, de preferência o domínio QMF, por um estágio de análise QMF 250. O estágio de análise QMF 250 tipicamente compreende um banco de filtros QMF configurado para executar uma transformada QMF do primeiro sinal codificado em forma de onda 201.
[0053] Com base no primeiro sinal codificado em forma de onda
201 e nos parâmetros de reconstrução de alta frequência, o estágio de reconstrução de alta frequência 120, na etapa D08, estende o primeiro
Petição 870170021816, de 03/04/2017, pág. 35/66
16/39 sinal codificado em forma de onda 201 para frequências acima da primeira frequência de cruzamento fc. Mais especificamente, o estágio de reconstrução de alta frequência 120 gera um sinal estendido em frequência 203 o qual tem um conteúdo espectral acima da primeira frequência de cruzamento fc. O sinal estendido em frequência 203 é, assim, um sinal de banda alta.
[0054] O estágio de reconstrução de alta frequência 120 pode operar de acordo com qualquer algoritmo conhecido para realizar reconstrução de alta frequência. Em particular, o estágio de reconstrução de alta frequência 120 pode ser configurado para executar SBR conforme descrito no artigo de revisão Brinker et al., An overview of the Coding Standard MPEG-4 Audio Amendments 1 and 2: HE-AAC, SSC, and HE-AAC v2, EURASIP Journal on Audio, Speech, and Music Processing, Volume 2009, Article ID 468971. Como tal, o estágio de reconstrução de alta frequência pode compreender uma série de subestágios configurados para gerar o sinal estendido em frequência 203 numa série de etapas. Por exemplo, o estágio de reconstrução de alta frequência 120 pode compreender um estágio de geração de alta frequência 221, um estágio de adição de componentes de alta frequência 222 e um estágio de ajuste de envelope 223.
[0055] Em resumo, o estágio de geração de alta frequência 221, numa primeira subetapa D08a, estende o primeiro sinal codificado em forma de onda 201 para a faixa de frequência acima da frequência de cruzamento fc a fim de gerar o sinal estendido em frequência 203. A geração é realizada selecionando porções de sub-banda do primeiro sinal codificado em forma de onda 201 e de acordo com regras específicas guiadas pelos parâmetros de reconstrução de alta frequência, espelho ou cópia das porções de sub-banda selecionadas do primeiro sinal codificado em forma de onda 201 para porções de sub-banda selecionadas da faixa de frequência acima da primeira frequência de
Petição 870170021816, de 03/04/2017, pág. 36/66
17/39 cruzamento fc.
[0056] Os parâmetros de reconstrução de alta frequência ainda podem compreender parâmetros harmônicos ausentes para adicionar harmônicos ausentes ao sinal estendido em frequência 203. Como discutido acima, um harmônico ausente será interpretado como qualquer parte tonal forte arbitrária do espectro. Por exemplo, os parâmetros de harmônicos ausentes podem compreender parâmetros relativos à frequência e amplitude dos harmônicos ausentes. Com base nos parâmetros de harmônicos ausentes, o estágio de adição de componentes de alta frequência paramétricos 222 gera, na subetapa D08b, componentes de senoide e adiciona os componentes de senoide ao sinal estendido em frequência 203.
[0057] Os parâmetros de reconstrução de alta frequência ainda podem compreender parâmetros de envelope espectral descrevendo os níveis de energia de alvo do sinal estendido em frequência 203. Com base nos parâmetros de envelope espectral, o estágio de ajuste de envelope 223 pode, na subetapa D08c, ajustar o conteúdo espectral do sinal estendido em frequência 203, isto é, os coeficientes espectrais do sinal estendido em frequência 203, de modo que os níveis de energia do sinal estendido em frequência 203 correspondam aos níveis de energia de alvo descritos pelos parâmetros de envelope espectral.
[0058] O sinal estendido em frequência 203 do estágio de reconstrução de alta frequência 120 e o segundo sinal codificado em forma de onda do estágio de recepção 110 são, então, inseridos no estágio de intercalação 130. O estágio de intercalação 130 tipicamente opera no mesmo domínio de frequência, de preferência o domínio QMF, que o estágio de reconstrução de alta frequência 120. Assim, o segundo sinal codificado em forma de onda 202 é tipicamente inserido no estágio de intercalação via o estágio de análise QMF 250. Além disso, o
Petição 870170021816, de 03/04/2017, pág. 37/66
18/39 segundo sinal codificado em forma de onda 202 tipicamente é retardado por um estágio de retardo 260, para compensar o tempo que leva para o estágio de reconstrução de alta frequência 120 realizar a reconstrução de alta frequência. Desta forma, o segundo sinal codificado em forma de onda 202 e o sinal estendido em frequência 203 serão alinhados de modo que o estágio de intercalação 130 opere em sinais correspondentes ao mesmo quadro de tempo.
[0059] O estágio de intercalação 130, na etapa D10, então, intercala, isto é, combina o segundo sinal codificado em forma de onda 202 com o sinal estendido em frequência 203 a fim de gerar um sinal intercalado 204. Diferentes abordagens podem ser utilizadas para intercalar o segundo sinal codificado em forma de onda 202 com o sinal estendido em frequência 203.
[0060] De acordo com uma modalidade de exemplo, o estágio de intercalação 130 intercala o sinal estendido em frequência 203 com o segundo sinal codificado em forma de onda 202 adicionando o sinal estendido em frequência 203 e o segundo sinal codificado em forma de onda 202. O conteúdo espectral do segundo sinal codificado em forma de onda 202 se sobrepõe ao conteúdo espectral do sinal estendido em frequência 203 no subconjunto da faixa de frequência correspondente ao conteúdo espectral do segundo sinal codificado em forma de onda 202. Adicionando o sinal estendido em frequência 203 e o segundo sinal codificado em forma de onda 202 o sinal intercalado 204, assim, compreende o conteúdo espectral do sinal estendido em frequência 203, bem como o conteúdo espectral do segundo sinal codificado em forma de onda 202 para as frequências de sobreposição. Como resultado da adição, os níveis de envelope espectral do sinal intercalado 204 aumentam as frequências de sobreposição. De preferência, e como será descrito mais tarde, o aumento nos níveis de envelope espectral devido à adição é contabilizado no lado do codificador
Petição 870170021816, de 03/04/2017, pág. 38/66
19/39 ao determinar níveis de envelope de energia compreendidos nos parâmetros de reconstrução de alta frequência. Por exemplo, os níveis de envelope espectral das frequências de sobreposição podem ser diminuídos no lado do codificador por uma quantidade correspondente ao aumento nos níveis de envelope espectral devido à intercalação no lado do decodificador.
[0061] Alternativamente, o aumento nos níveis de envelope espectral devido à adição pode ser contabilizado no lado do decodificador. Por exemplo, pode haver um estágio de medição de energia o qual mede a energia do segundo sinal codificado em forma de onda 202, compara a energia medida com os níveis de energia de alvo descritos pelos parâmetros de envelope espectral e ajusta o sinal de frequência estendido 203 de modo que os níveis de envelope espectral para o sinal intercalado 204 seja igual aos níveis de energia de alvo.
[0062] De acordo com outra modalidade de exemplo, o estágio de intercalação 130 intercala o sinal estendido em frequência 203 com o segundo sinal codificado em forma de onda 202 substituindo o conteúdo espectral do sinal estendido em frequência 203 pelo conteúdo espectral conteúdo do segundo sinal codificado em forma de onda 202 para essas frequências onde o sinal estendido em frequência 203 e o segundo sinal codificado em forma de onda 202 se sobrepõem. Em modalidades de exemplo onde o sinal estendido em frequência 203 é substituído pelo segundo sinal codificado em forma de onda 202 não é necessário ajustar os níveis do envelope espectral para compensar a intercalação do sinal estendido em frequência 203 e do segundo sinal codificado em forma de onda 202.
[0063] O estágio de reconstrução de alta frequência 120 de preferência opera com uma taxa de amostragem que é igual à taxa de amostragem do codificador de núcleo subjacente que foi usado para codificar o primeiro sinal codificado em forma de onda 201. Desta forPetição 870170021816, de 03/04/2017, pág. 39/66
20/39 ma, a mesma transformada de janela de sobreposição, tal como a mesma MDCT, pode ser utilizada para codificar o segundo sinal codificado em forma de onda 202 como foi utilizada para codificar o primeiro sinal codificado em forma de onda 202.
[0064] O estágio de intercalação 130 ainda pode ser configurado para receber o primeiro sinal codificado em forma de onda 201 do estágio de recepção, de preferência via o estágio de decodificação em forma de onda 240, o estágio de análise QMF 250 e o estágio de retardo 260 e combinar o sinal intercalado 204 com o primeiro sinal codificado em forma de onda 201 a fim de gerar um sinal combinado 205 tendo um conteúdo espectral para frequências abaixo bem como acima da primeira frequência de cruzamento.
[0065] O sinal de saída do estágio de intercalação 130, isto é, o sinal intercalado 204 ou o sinal combinado 205, pode posteriormente, por um estágio de síntese QMF 270, ser transformado de volta ao domínio do tempo.
[0066] De preferência, o estágio de análise QMF 250 e o estágio de síntese QMF 270 têm o mesmo número de sub-bandas, significando que a taxa de amostragem do sinal sendo inserido no estágio de análise QMF 250 é igual à taxa de amostragem do sinal sendo enviado do estágio de síntese QMF 270. Como consequência, o codificador em forma de onda (usando MDCT) que foi usado para codificar em forma de onda o primeiro e o segundo sinais codificados em forma de onda pode operar na mesma taxa de amostragem que o sinal de saída. Assim, o primeiro e o segundo sinais codificados em forma de onda podem eficientemente e estruturalmente facilmente ser codificados usando a mesma transformada MDCT. Isto se opõe à técnica anterior onde a taxa de amostragem do codificador em forma de onda tipicamente era limitada à metade daquela do sinal de saída e o módulo de reconstrução de alta frequência subsequente fazia uma amostragem para
Petição 870170021816, de 03/04/2017, pág. 40/66
21/39 cima, bem como uma reconstrução de alta frequência. Isto limita a capacidade de codificar em forma de onda frequências cobrindo a faixa de frequência de saída inteira.
[0067] Fig. 4 ilustra uma modalidade exemplar de um decodificador 400. O decodificador 400 se destina a dar uma reconstrução de sinal melhorada para altas frequências no caso onde existem transientes no sinal de áudio de entrada a serem reconstruídos. A principal diferença entre o exemplo da Fig. 4 e aquele da Fig. 2 é a forma do conteúdo espectral e a duração do segundo sinal codificado em forma de onda.
[0068] Fig. 4 ilustra a operação do decodificador 400 durante uma pluralidade de porções de tempo subsequentes de um quadro de tempo; aqui, três porções de tempo subsequentes são mostradas. Um quadro de tempo, por exemplo, pode corresponder a 2048 amostras de tempo. Especificamente, durante uma primeira porção de tempo, o estágio de recepção 110 recebe um primeiro sinal codificado em forma de onda 401a tendo um conteúdo espectral até uma primeira frequência de cruzamento fc1. Nenhum segundo sinal codificado em forma de onda é recebido durante a primeira porção de tempo.
[0069] Durante a segunda porção de tempo o estágio de recepção 110 recebe um primeiro sinal codificado em forma de onda 401b tendo um conteúdo espectral até a primeira frequência de cruzamento fc1 e um segundo sinal codificado em forma de onda 402b tendo um conteúdo espectral que corresponde a um subconjunto da faixa de frequência acima da primeira frequência de cruzamento fc1. No exemplo ilustrado da Fig. 4, o segundo sinal codificado em forma de onda 402b tem um conteúdo espectral correspondente a um intervalo de frequência se estendendo entre a primeira frequência de cruzamento fc1 e uma segunda frequência de cruzamento fc2. O segundo sinal codificado em forma de onda 402b é, assim, um sinal limitado em banda sendo limiPetição 870170021816, de 03/04/2017, pág. 41/66
22/39 tado à banda de frequência entre a primeira frequência de cruzamento fc1 e a segunda frequência de cruzamento fc2.
[0070] Durante a terceira porção de tempo o estágio de recepção 110 recebe um primeiro sinal codificado em forma de onda 401c tendo um conteúdo espectral até a primeira frequência de cruzamento fc1. Nenhum segundo sinal codificado em forma de onda é recebido da terceira porção de tempo.
[0071] Para a primeira e a terceira porções de tempo ilustradas não há nenhum segundo sinal codificado em forma de onda. Para estas porções de tempo o decodificador operará de acordo com um decodificador convencional configurado para executar reconstrução de alta frequência, tal como um decodificador SBR convencional. O estágio de reconstrução de alta frequência 120 gerará sinais estendidos em frequência 403a e 403c com base nos primeiros sinais codificados em forma de onda 401a e 401c, respectivamente. No entanto, uma vez que não há nenhum segundo sinal codificado em forma de onda, nenhuma intercalação será realizada pelo estágio de intercalação 130.
[0072] Para a segunda porção de tempo ilustrada há um segundo sinal codificado em forma de onda 402b. Para a segunda porção de tempo o decodificador 400 operará da mesma maneira como descrita em relação à Fig. 2. Em particular, o estágio de reconstrução de alta frequência 120 executa a reconstrução de alta frequência com base no primeiro sinal codificado em forma de onda e nos parâmetros de reconstrução de alta frequência de modo a gerar um sinal estendido em frequência 403b. O sinal estendido em frequência 403b posteriormente é inserido no estágio de intercalação 130 onde ele é intercalado com o segundo sinal codificado em forma de onda 402b num sinal intercalado 404b. Conforme discutido em conexão com a modalidade de exemplo da Fig. 2, a intercalação pode ser realizada usando uma abordagem de adição ou substituição.
Petição 870170021816, de 03/04/2017, pág. 42/66
23/39 [0073] No exemplo acima, não há nenhum segundo sinal codificado em forma de onda para a primeira e a terceira porções de tempo. Para estas porções de tempo a segunda frequência de cruzamento é igual à primeira frequência de cruzamento e nenhuma intercalação é executada. Para o segundo quadro de tempo a segunda frequência de cruzamento é maior do que a primeira frequência de cruzamento e a intercalação é executada. Geralmente, a segunda frequência de cruzamento pode, assim, variar em função do tempo. Particularmente, a segunda frequência de cruzamento pode variar dentro de um quadro de tempo. A intercalação será executada quando a segunda frequência de cruzamento é maior do que a primeira frequência de cruzamento e menor do que uma frequência máxima representada pelo decodificador. O caso em que a segunda frequência de cruzamento é igual à frequência máxima corresponde à codificação em forma de onda pura e nenhuma reconstrução de alta frequência é necessária.
[0074] É de notar que as modalidades descritas em relação às Figs 2 e 4 podem ser combinadas. Fig. 7 ilustra uma matriz de tempo frequência 700 definida com respeito ao domínio da frequência, de preferência o domínio QMF, na qual a intercalação é realizada pelo estágio de intercalação 130. A matriz de tempo frequência ilustrada 700 corresponde a um quadro de um sinal de áudio a ser decodificado. A matriz ilustrada 700 é dividida em 16 fendas de tempo e uma pluralidade de sub-bandas de frequência começando a partir da primeira frequência de cruzamento fc1. Adicionalmente, uma primeira faixa de tempo T1 cobrindo a faixa de tempo abaixo da oitava fenda de tempo, uma segunda faixa de tempo T2 cobrindo a oitava fenda de tempo e uma faixa de tempo T3 cobrindo as fendas de tempo acima da oitava fenda de tempo são mostradas. Envelopes espectrais diferentes, como parte dos dados de SBR, podem estar associados com as faixas de tempo diferentes T1 a T3.
Petição 870170021816, de 03/04/2017, pág. 43/66
24/39 [0075] No presente exemplo, foram identificados dois fortes componentes tonais nas bandas de frequências 710 e 720 no sinal de áudio do lado do codificador. As bandas de frequências de 710 e 720 podem ser da mesma largura de banda como, por exemplo, bandas de envelope de SBR, isto é, a mesma resolução de frequência que é usada para representar o envelope espectral. Estes componentes tonais nas bandas 710 e 720 têm uma faixa de tempo correspondente ao quadro de tempo integral, isto é, a faixa de tempo dos componentes tonais inclui as faixas de tempo T1 a T3. Em um lado de codificador, foi decidido codificar em forma de onda os componentes tonais de 710 e 720 durante a primeira faixa de tempo T1, ilustrada pelo componente tonal 710a e 720 sendo tracejados durante a primeira faixa de tempo T1. Ainda mais, foi decidido em um lado do codificador que durante a segunda e a terceira faixas de tempo T2 e T3, o primeiro componente tonal 710 será parametricamente reconstruído no decodificador incluindo uma senoide, conforme explicado em relação ao estágio de componentes de alta frequência paramétricos 222 da Fig. 2. Isto é ilustrado pelo padrão quadrado do primeiro componente tonal 710b durante (a segunda faixa de tempo T2) e a terceira faixa de tempo T3. Durante a segunda e a terceira faixas de tempo T2 e T3, o segundo componente tonal 720 é ainda codificado em forma de onda. Além disso, nesta modalidade, o primeiro e o segundo componentes tonais serão intercalados com o sinal de áudio reconstruído de alta frequência por meio de adição e, portanto, o codificador ajustou o envelope espectral transmitido, o envelope de SBR, de modo correspondente.
[0076] Adicionalmente, foi identificado um transiente 730 no sinal de áudio no lado do codificador. O transiente 730 tem uma duração de tempo correspondente à segunda faixa de tempo T2 e corresponde a um intervalo de frequência entre a primeira frequência de cruzamento fc1 e uma segunda frequência de cruzamento fc2. Em um lado do codiPetição 870170021816, de 03/04/2017, pág. 44/66
25/39 ficador foi decidido codificar em forma de onda a porção de tempofrequência do sinal de áudio correspondente ao local do transiente. Nesta modalidade a intercalação do transiente codificado em forma de onda é feita por substituição. Um esquema de sinalização está configurado para sinalizar esta informação para o decodificador. O esquema de sinalização compreende informações relativas em cujas faixas de tempo e/ou em cujas faixas de frequência acima da primeira frequência de cruzamento fc1 um segundo sinal codificado em forma de onda está disponível. O esquema de sinalização também pode estar associado com regras relativas a como a intercalação será realizada, isto é, se a intercalação é por meio de adição ou substituição. O esquema de sinalização também pode estar associado com regras que definem a ordem de prioridade de adicionar ou substituir os sinais diferentes, como será explicado abaixo.
[0077] O esquema de sinalização inclui um primeiro vetor 740, rotulado de senoide adicional, indicando para cada sub-banda de frequência se uma senoide deve ser parametricamente adicionada ou não. Na Fig. 7, a adição do primeiro componente tonal 710b na segunda e na terceira faixas de tempo T2 e T3 é indicada por um 1 para a sub-banda correspondente do primeiro vetor 740. Sinalização incluindo o primeiro vetor 740 é conhecida do estado da técnica. Existem regras definidas no decodificador do estado da técnica para quando uma senoide é permitida começar. A regra é que se for detectada uma nova senoide, isto é, a sinalização de senoide adicional do primeiro vetor 740 vai de zero em um quadro a um no próximo quadro, para uma sub-banda específica, então, a senoide começa no início do quadro, a menos que haja um evento de transiente no quadro, para o qual a senoide começa no transiente. No exemplo ilustrado, há um evento de transiente 730 no quadro, explicando porque a reconstrução paramétrica por meio de uma senoidal para a banda de frequência 710 só
Petição 870170021816, de 03/04/2017, pág. 45/66
26/39 começa após o evento de transiente 730.
[0078] O esquema de sinalização ainda inclui ais o esquema inclui um segundo vetor 750, rotulado de codificação em forma de onda. O segundo vetor 750 indica para cada sub-banda de frequência se um sinal codificado em forma de onda está disponível para intercalação com uma reconstrução de alta frequência do sinal de áudio. Na Fig. 7, a disponibilidade de um sinal codificado em forma de onda para o primeiro e o segundo componentes tonais 710 e 720 é indicada por um 1 para a sub-banda correspondente do segundo vetor 750. No presente exemplo, a indicação de disponibilidade de dados codificados em forma de onda no segundo vetor 750 é também uma indicação de que a intercalação será realizada por meio de adição. No entanto, em outras modalidades a indicação de disponibilidade de dados codificados em forma de onda no segundo vetor 750 pode ser uma indicação de que a intercalação será realizada por meio de substituição.
[0079] O esquema de sinalização ainda inclui um terceiro vetor 760, rotulado codificação em forma de onda. O terceiro vetor 760 indica para cada fenda de tempo se um sinal codificado em forma de onda está disponível para intercalação com uma reconstrução de alta frequência do sinal de áudio. Na Fig. 7, a disponibilidade de um sinal codificado em forma de onda para o transiente 730 é indicada por um 1 para a fenda de tempo correspondente do terceiro vetor 760. No presente exemplo, a indicação de disponibilidade de dados codificados em forma de onda no terceiro vetor 760 é também uma indicação de que a intercalação será realizado por meio de substituição. No entanto, em outras modalidades a indicação de disponibilidade de dados codificados em forma de onda no terceiro vetor 760 pode ser uma indicação de que a intercalação será realizada por meio de adição.
[0080] Há muitas alternativas para como configurar o primeiro, o segundo e o terceiro vetores 740, 750, 760. Em algumas modalidades,
Petição 870170021816, de 03/04/2017, pág. 46/66
27/39 os vetores, 740, 750, 760 são vetores binários que usam um zero lógico ou um lógico um para fornecer suas indicações. Em outras modalidades, os vetores, 740, 750, 760 podem assumir diferentes formas. Por exemplo, um primeiro valor, tal como 0, do vetor pode indicar que nenhum dado codificado em forma de onda está disponível para a banda de frequência ou fenda de tempo específica. Um segundo valor, tal como 1, do vetor pode indicar que a intercalação será executada por meio de adição para a banda de frequência ou fenda de tempo específica. Um terceiro valor, tal como 2, no vetor pode indicar que a intercalação será executada por meio de substituição para a banda de frequência oi fenda de tempo específica.
[0081] O esquema de sinalização exemplar acima também pode ser associado com uma ordem de prioridade a qual pode ser aplicada em caso de conflito. A título de exemplo, o terceiro vetor 760, representando intercalação de um transiente por meio de substituição, pode ter precedência sobre o primeiro e o segundo vetores 740 e 750. Além disso, o primeiro vetor 740 pode ter precedência sobre o segundo vetor 750. Entende-se que qualquer ordem de prioridade entre os vetores 740, 750, 760 pode ser definida.
[0082] Fig. 8a ilustra o estágio de intercalação 130 da Fig. 1 mais detalhadamente. O estágio de intercalação 130 pode compreender um componente de decodificação de sinalização 1301, um componente de lógica de decisão 1302 e um componente de intercalação 1303. Como discutido acima, o estágio de intercalação 130 recebe um segundo sinal codificado em forma de onda 802 e um sinal estendido em frequência 803. O estágio de intercalação 130 também pode receber um sinal de controle 805. O componente de decodificação de sinalização 1301 decodifica o sinal de controle 805 em três partes correspondentes ao primeiro vetor 740, ao segundo vetor 750 e ao terceiro vetor 760 do esquema de sinalização descrito em relação à Fig. 7. Estas são enPetição 870170021816, de 03/04/2017, pág. 47/66
28/39 viadas para o componente de lógica de decisão 1302 que com base na lógica cria uma matriz de tempo/frequência 870 para o quadro QMF indicando qual do segundo sinal codificado em forma de onda 802 e do sinal estendido em frequência 803 usar para qual ladrilho de tempo/frequência. A matriz de tempo/freqüência 870 é enviada para o componente de intercalação 1303 e é usada quando intercalando o segundo sinal codificado em forma de onda 802 com o sinal estendido em frequência 803.
[0083] O componente de lógica de decisão 1302 é mostrado em mais detalhe na Fig. 8b. Os componentes de lógica de decisão 1302 podem compreender uma matriz de tempo/freqüência gerando o componente 13021 e um componente de priorização 13022. O componente de geração de tempo/frequência 13021 gera uma matriz de tempo/frequência 870 tendo ladrilhos de tempo/freqüência correspondentes ao quadro QMF atual. O componente de geração de tempo/frequência 13021 inclui informações do primeiro vetor 740, do segundo vetor 750 e do terceiro vetor 760 na matriz de tempo/frequência. Por exemplo, conforme ilustrado na Fig. 7, se houver um 1 (ou mais geralmente, qualquer número diferente de zero) no segundo vetor 750 para uma certa frequência, os ladrilhos de tempo/frequência correspondentes a certa frequências são ajustados como 1 (ou mais geralmente para o número presente no vetor 750) na matriz de tempo/frequência 870 indicando que a intercalação com o segundo sinal codificado em forma de onda 802 será realizada para esses ladrilhos de tempo/frequência. Da mesma forma, se houver um 1 (ou mais genericamente qualquer número diferente de zero) no terceiro vetor 760 em uma determinada fenda de tempo, os ladrilhos de tempo/frequência correspondentes à determinada fenda de tempo são ajustados para 1 (ou mais genericamente qualquer número diferente de zero) na matriz de tempo/frequência 870 indicando a intercalação
Petição 870170021816, de 03/04/2017, pág. 48/66
29/39 com o segundo sinal codificado em código em forma de onda 802 será realizada para aqueles ladrilhos de tempo/frequência. Da mesma forma, se houver um 1 no primeiro vetor 740 para uma certa frequência, os ladrilhos de tempo/frequência correspondentes à certa frequência são ajustados para 1 na matriz de tempo/frequência 870 indicando que o sinal de saída 804 será baseado no sinal estendido em frequência 803 no qual a certa frequência foi parametricamente reconstruída, por exemplo, pela inclusão de um sinal senoidal.
[0084] Para alguns ladrilhos de tempo/frequência haverá um conflito entre as informações do primeiro vetor 740, do segundo vetor 750 e do terceiro vetor 760, significando que mais de um dos vetores 740760 indica um número diferente de zero, tal como um 1, para o mesmo ladrilho de tempo/frequência da matriz de tempo/frequência 870. Em tal situação, o componente de priorização 13022 precisa tomar uma decisão sobre como priorizar as informações dos vetores a fim de remover os conflitos na matriz de tempo/frequência 870. Mais precisamente, o componente de priorização 13022 decide se o sinal de saída 804 será baseado no sinal estendido em frequência 803 (desse modo dando prioridade para o primeiro vetor 740) por intercalação do segundo sinal codificado em forma de onda 802 em uma direção de frequência (desse modo dando prioridade para o segundo vetor 750), ou por intercalação do segundo sinal codificado em forma de onda 802 em uma direção de tempo (desse modo dando prioridade para o terceiro vetor 750).
[0085] Para esta finalidade o componente de priorização 13022 compreende regras pré-definidas relativas a uma ordem de prioridade dos vetores 740-760. O componente de priorização 13022 também pode compreender regras pré-definidas relativas a como a intercalação será realizada, isto é, se a intercalação será executada por meio de adição ou substituição.
Petição 870170021816, de 03/04/2017, pág. 49/66
30/39 [0086] De preferência, essas regras são as seguintes:
· À intercalação na direção de tempo, isto é, intercalação como definida pelo terceiro vetor 760, é dada a prioridade mais alta. Intercalação na direção de tempo é de preferência executada substituindo o sinal estendido em frequência 803 nesses ladrilhos de tempo/frequência definidos pelo terceiro vetor 760. A resolução de tempo do terceiro vetor 760 corresponde a uma fenda de tempo do quadro QMF. Se o quadro QMF corresponder a 2048 amostras no domínio de tempo, uma fenda de tempo tipicamente pode corresponder a 128 amostras no domínio do tempo.
· À reconstrução paramétrica de frequências, isto é, usando o sinal estendido em frequência 803 conforme definido pelo primeiro vetor 740, é dada a segunda mais alta prioridade. A resolução de frequência do primeiro vetor 740 é a resolução de frequência do quadro QMF, tal como uma banda de envelope de SBR. As regras do estado da técnica relativas à sinalização e interpretação do primeiro vetor 740 permanecem válidas.
· À intercalação na direção de frequência, isto é, intercalação conforme definida pelo vetor segundo 750, é dada a mais baixa ordem de prioridade. Intercalação na direção de frequência é realizada adicionando o sinal estendido em frequência 803 nesses ladrilhos de tempo/frequência definidos pelo segundo vetor 750. A resolução de frequência do segundo vetor 750 corresponde à resolução de frequência do quadro QMF, tal como uma banda de envelope de SBR.
III. Modalidades de exemplo - Codificador [0087] Fig. 5 ilustra uma modalidade exemplar de um codificador 500 que é adequado para uso em um sistema de processamento de áudio. O codificador 500 compreende um estágio de recepção 510, um estágio de codificação em forma de onda 520, um estágio de codificação de alta frequência 530, um estágio de detecção de codificação de
Petição 870170021816, de 03/04/2017, pág. 50/66
31/39 intercalação 540 e um estágio de transmissão 550. O estágio de codificação de alta frequência 530 pode compreender um estágio de calcular parâmetros de reconstrução de alta frequência 530a e um estágio de ajuste de parâmetros de reconstrução de alta frequência 530b.
[0088] A operação do codificador 500 será descrita a seguir com referência à Fig. 5 e ao fluxograma da Fig. 6. Na etapa E02, o estágio de recepção 510 recebe um sinal de áudio a ser codificado.
[0089] O sinal de áudio recebido é inserido no estágio de codificação de alta frequência 530. Com base no sinal de áudio recebido, o estágio de codificação de alta frequência 530 e, em particular o estágio de cálculo de parâmetros de reconstrução de alta frequência 530a, calculam, na etapa E04, parâmetros de reconstrução de alta frequência permitindo a reconstrução de alta frequência do sinal de áudio recebido acima da primeira frequência de cruzamento fc. O estágio de cálculo de parâmetros de reconstrução de alta frequência 530a podem usar qualquer técnica conhecida para calcular os parâmetros de reconstrução de alta frequência, tal como codificação de SBR. O estágio de codificação de alta frequência 530 tipicamente opera em um domínio QMF. Assim, antes de calcular os parâmetros de reconstrução de alta frequência, o estágio de codificação de alta frequência 530 pode realizar análise QMF do sinal de áudio recebido. Como resultado, os parâmetros de reconstrução de alta frequência são definidos em relação a um domínio QMF.
[0090] Os parâmetros de reconstrução de alta frequência calculados podem compreender um número de parâmetros relativos a reconstrução de alta frequência.
[0091] Por exemplo, os parâmetros de reconstrução de alta frequência podem compreender parâmetros relativos a como espelhar ou copiar o sinal de áudio de porções de sub-banda da faixa de frequência abaixo da primeira frequência de cruzamento fc para porções de
Petição 870170021816, de 03/04/2017, pág. 51/66
32/39 sub-banda da faixa de frequência acima da primeira frequência de cruzamento fc. Tais parâmetros são por vezes denominados como parâmetros que descrevem a estrutura de conserto.
[0092] Os parâmetros de reconstrução de alta frequência podem ainda compreender parâmetros de envelope espectral descrevendo os níveis de energia de alvo de porções de sub-banda da faixa de frequência acima da primeira frequência de cruzamento.
[0093] Os parâmetros de reconstrução de alta frequência ainda podem compreender parâmetros de harmônicos ausentes indicando harmônicos, ou fortes componentes tonais, que serão ausentes se o sinal de áudio for reconstruído na faixa de frequência acima da primeira frequência de cruzamento usando os parâmetros que descrevem a estrutura de conserto.
[0094] O estágio de detecção de codificação de intercalação 540, então, na etapa E06, identifica um subconjunto da faixa de frequência acima da primeira frequência de cruzamento fc para a qual o conteúdo espectral do sinal de áudio recebido será codificado em forma de onda. Em outras palavras, o papel do estágio de detecção de codificação de intercalação 540 é identificar frequências acima da primeira frequência de cruzamento para as quais a reconstrução de alta frequência não dá um resultado desejável.
[0095] O estágio de detecção de codificação de intercalação 540 pode assumir diferentes abordagens para identificar um subconjunto relevante da faixa de frequência acima da primeira frequência de cruzamento fc. Por exemplo, o estágio de detecção de codificação de intercalação 540 pode identificar fortes componentes tonais que não serão bem reconstruídos pela reconstrução de alta frequência. A identificação de fortes componentes tonais pode se basear no sinal de áudio recebido, por exemplo, determinando a energia do sinal de áudio em função da frequência e identificando as frequências tendo uma alta
Petição 870170021816, de 03/04/2017, pág. 52/66
33/39 energia como compreendendo fortes componentes tonais. Além disso, a identificação pode se basear no conhecimento sobre como o sinal de áudio recebido será reconstruído no decodificador. Em particular, essa identificação pode se basear em cotas de tonalidade sendo a razão de uma medida de tonalidade do sinal de áudio recebido e da medida de tonalidade de uma reconstrução do sinal de áudio recebido por bandas de frequências acima da primeira frequência de cruzamento. Uma cota de alta tonalidade indica que o sinal de áudio não será bem reconstruído para a frequência correspondente à cota de tonalidade.
[0096] O estágio de detecção de codificação de intercalação 540 também pode detectar transientes no sinal de áudio recebido que não serão bem reconstruídos pela reconstrução de alta frequência. Essa identificação pode ser o resultado de uma análise tempo-frequência do sinal de áudio recebido. Por exemplo, um intervalo de tempofrequência onde ocorre um transiente pode ser detectado de um espectrograma do sinal de áudio recebido. Esse intervalo de tempofrequência tipicamente tem uma faixa de tempo que é mais curta que um quadro de tempo do sinal de áudio recebido. A faixa de frequência correspondente tipicamente corresponde a um intervalo de frequência que se estende até uma segunda frequência de cruzamento. O subconjunto da faixa de frequência acima da primeira frequência de cruzamento, portanto, pode ser identificado pelo estágio de detecção de codificação de intercalação 540 como um intervalo se estendendo da primeira frequência de cruzamento para uma segunda frequência de cruzamento.
[0097] O estágio de detecção de codificação de intercalação 540 ainda pode receber parâmetros de reconstrução de alta frequência do estágio de cálculo de parâmetros de reconstrução de alta frequência 530a. Com base nos parâmetros de harmônicos ausentes dos parâmetros de reconstrução de alta frequência, o estágio de detecção de
Petição 870170021816, de 03/04/2017, pág. 53/66
34/39 codificação de intercalação 540 pode identificar frequências de harmônicos ausentes e decidir incluir pelo menos algumas das frequências dos harmônicos ausentes no subconjunto identificado da faixa de frequência acima da primeira frequência de cruzamento fc. Essa abordagem pode ser vantajosa se houver forte componente tonal no sinal de áudio que não possa ser modelado corretamente dentro dos limites do modelo paramétrico.
[0098] O sinal de áudio recebido também é entrada para o estágio de codificação em forma de onda 520. O estágio de codificação em forma de onda 520, na etapa E08, executa codificação em forma de onda do sinal de áudio recebido. Em particular, o estágio de codificação em forma de onda 520 gera um primeiro sinal codificado em forma de onda por codificação em forma de onda do sinal de áudio para bandas espectrais até a primeira frequência de cruzamento fc. Além disso, o estágio de codificação em forma de onda 520 recebe o subconjunto identificado do estágio de detecção de codificação de intercalação 540. O estágio de codificação em forma de onda 520, então, gera um segundo sinal codificado em forma de onda por codificação em forma de onda do sinal de áudio recebido para bandas espectrais correspondentes para o subconjunto identificado da faixa de frequência acima da primeira frequência de cruzamento. O segundo sinal codificado em forma de onda, portanto, terá um conteúdo espectral correspondente ao subconjunto identificado de faixa de frequência acima da primeira frequência de cruzamento fc.
[0099] De acordo com modalidades de exemplo, o estágio de codificação em forma de onda 520 pode gerar o primeiro e o segundo sinais codificados em forma de onda primeiro codificando em forma de onda o sinal de áudio recebido para todas as bandas espectrais e, então, em seguida, removendo o conteúdo espectral do sinal assim codificado em forma de onda para as frequências correspondentes ao
Petição 870170021816, de 03/04/2017, pág. 54/66
35/39 subconjunto identificado de frequências acima da primeira frequência de cruzamento fc.
[00100] O estágio de codificação em forma de onda, por exemplo, pode executar codificação em forma de onda usando um banco de filtros de transformada em janelas de sobreposição, tal como um banco de filtros MDCT. Tais bancos de filtros de transformada em janelas de sobreposição usam janelas tendo um determinado comprimento temporal, fazendo com que os valores do sinal transformado em um quadro de tempo sejam influenciados por valores do sinal no quadro de tempo anterior e no seguinte. A fim de reduzir o efeito deste fato, pode ser vantajoso para realizar uma certa quantidade de supercodificação temporal, o que significa que o estágio de codificação em forma de onda 520 não apenas codifica em forma de onda o quadro de tempo atual do sinal de áudio recebido, mas também o quadro de tempo anterior e o seguinte do sinal de áudio recebido. Da mesma forma, também o estágio de codificação de alta frequência 530 pode codificar não somente o quadro de tempo atual do sinal de áudio recebido, mas também o quadro de tempo anterior e seguinte do sinal de áudio recebido. Desta forma, um desvanecimento de cruzamento melhorado entre o segundo sinal codificado em forma de onda e uma reconstrução de alta frequência do sinal de áudio pode ser alcançado no domínio QMF. Além disso, isto reduz a necessidade de ajuste das fronteiras de dados de envelope espectral.
[00101] É de notar que o primeiro e o segundo sinais codificados em forma de onda podem ser sinais separados. No entanto, de preferência eles formam primeira e segunda porções de sinal codificado em forma de onda de um sinal comum. Se assim, eles podem ser gerados realizando de uma única operação de codificação em forma de onda no sinal de áudio recebido, tal como aplicando uma única transformada MDCT ao sinal de áudio recebido.
Petição 870170021816, de 03/04/2017, pág. 55/66
36/39 [00102] O estágio de codificação de alta frequência 530 e, em particular o estágio de ajuste de parâmetros de reconstrução de alta frequência 530b, podem também receber o subconjunto identificado da faixa de frequência acima da primeira frequência de cruzamento fc. Com base nos dados recebidos o estágio de ajuste de parâmetros de reconstrução de alta frequência 530b pode, na etapa E10, ajustar os parâmetros de reconstrução de alta frequência. Em particular, o estágio de ajuste de parâmetros de reconstrução de alta frequência 530b pode ajustar os parâmetros de reconstrução de alta frequência correspondentes a bandas espectrais compreendidas no subconjunto identificado.
[00103] Por exemplo, o estágio de ajuste de parâmetros de reconstrução de alta frequência 530b pode ajustar os parâmetros de envelope espectral descrevendo os níveis de energia de alvo de porções de sub-banda da faixa de frequência acima da primeira frequência de cruzamento. Isto é particularmente relevante se o segundo sinal codificado em forma de onda for adicionado com uma reconstrução de alta frequência do sinal de áudio em um decodificador desde, então, a energia do segundo sinal codificado em forma de onda será adicionada à energia da reconstrução de alta frequência. A fim de compensar por tal adição, o estágio de ajuste de parâmetros de reconstrução de alta frequência 530b pode ajustar os parâmetros de envelope de energia subtraindo uma energia medida do segundo sinal codificado em forma de onda dos níveis de energia de alvo para bandas espectrais correspondentes ao subconjunto identificado da faixa de frequência acima da primeira frequência de cruzamento fc. Desta forma, a energia de sinal total será preservada quando o segundo sinal codificado em forma de onda e a reconstrução de alta frequência forem adicionados no decodificador. A energia do segundo sinal codificado em forma de onda, por exemplo, pode ser medida pelo estágio de detecção de codiPetição 870170021816, de 03/04/2017, pág. 56/66
37/39 ficação de intercalação 540.
[00104] O estágio de ajuste de parâmetros de reconstrução de alta frequência 530b também pode ajustar os parâmetros de harmônicos ausentes. Mais particularmente, se uma sub-banda compreendendo um harmônico ausente, conforme indicado pelos parâmetros de harmônicos ausentes, for parte do subconjunto identificado da faixa de frequência acima a primeira frequência de cruzamento fc, essa subbanda será codificada em forma de onda pelo estágio de codificação em forma de onda 520. Assim, o estágio de ajuste de parâmetros de reconstrução de alta frequência 530b pode remover tais harmônicos ausentes dos parâmetros de harmônicos ausentes, uma vez que esses harmônicos ausentes não precisam ser reconstruídos parametricamente no lado do decodificador.
[00105] O estágio de transmissão 550, então, recebe o primeiro e o segundo sinais codificados em forma de onda do estágio de codificação em forma de onda 520 e os parâmetros de reconstrução de alta frequência do estágio de codificação de alta frequência 530. O estágio de transmissão 550 formata os dados recebidos em um fluxo de bits para transmissão para um decodificador.
[00106] O estágio de detecção de codificação de intercalação 540 ainda pode sinalizar informações para o estágio de transmissão 550 para inclusão no fluxo de bits. Em particular, o estágio de detecção de codificação de intercalação 540 pode sinalizar como o segundo sinal codificado em forma de onda será intercalado com uma reconstrução de alta frequência do sinal de áudio, tal como se a intercalação for executada por adição dos sinais ou por substituição de um dos sinais por outro e para que faixa de frequência e que intervalo de tempo os sinais codificados em forma de onda devem ser intercalados. Por exemplo, a sinalização pode ser efetuada usando o esquema de sinalização discutido com referência à Fig. 7.
Petição 870170021816, de 03/04/2017, pág. 57/66
38/39
Equivalentes, extensões, alternativas e diversos [00107] Mais modalidades da presente descrição se tornarão aparentes para uma pessoa versada na técnica depois de estudar a descrição acima. Muito embora a presente descrição e os desenhos divulguem modalidades e exemplos, a descrição não está restrita a estes exemplos específicos. Inúmeras modificações e variações podem ser feitas sem nos afastarmos do escopo da presente descrição, o qual é definido pelas reivindicações em anexo. Quaisquer sinais de referência aparecendo nas reivindicações não serão entendidos como limitando seu escopo.
[00108] Adicionalmente, variações às modalidades divulgadas podem ser compreendidas e efetuadas pela pessoa versada na técnica na prática da descrição, de um estudo dos desenhos, da descrição e das reivindicações anexas. Nas reivindicações, a palavra compreendendo não exclui outros elementos ou etapas e o artigo indefinido um ou uma não exclui uma pluralidade. O simples fato de que certas medidas são recitadas em reivindicações dependentes mutuamente diferentes não indica que uma combinação destas medidas não pode ser usada com vantagem.
[00109] Os sistemas e métodos descritos acima podem ser implementados como software, firmware, hardware ou uma combinação dos mesmos. Em uma implementação de hardware, a divisão de tarefas entre unidades funcionais citadas na descrição acima não corresponde necessariamente à divisão em unidades físicas; ao contrário, um componente físico pode ter múltiplas funcionalidades e uma tarefa pode ser efetuada por vários componentes físicos em cooperação. Certos componentes ou todos os componentes podem ser implementados como software executado por um processador de sinal digital ou microprocessador, ou ser implementados como hardware ou como um circuito integrado específico de aplicação. Esse software pode ser disPetição 870170021816, de 03/04/2017, pág. 58/66
39/39 tribuído em mídia legível por computador, a qual pode compreender mídia de armazenamento em computador (ou mídia não transitória) e mídia de comunicação (ou mídia transitória). Como é bem sabido por uma pessoa versada na técnica, o termo mídia de armazenamento em computador inclui ambas as mídias voláteis e não voláteis, removíveis e não removíveis implementadas em qualquer método ou tecnologia para armazenamento de informações, tal como instruções legíveis por computador, estruturas de dados, módulos de programa ou outros dados. Mídia de armazenamento em computador inclui, mas não está limitada a, RAM, ROM, EEPROM, memória flash ou outra tecnologia de memória, CD-ROM, discos versáteis digitais (DVD) ou outro armazenamento de disco óptico, cassetes magnéticos, fita magnética, armazenamento de disco magnético ou outros dispositivos de armazenamento magnético ou qualquer outro meio que possa ser usado para armazenar as informações desejadas e que possa ser acessado por um computador. Além disso, é bem conhecido dos versados na técnica que mídia de comunicação tipicamente encarna instruções legíveis por computador, estruturas de dados, módulos de programa, ou outros dados em um sinal de dados modulado, tal como uma onda portadora ou outro mecanismo de transporte e inclui qualquer mídia de distribuição de informações.

Claims (20)

  1. REIVINDICAÇÕES
    1. Método para decodificar um sinal de áudio em um sistema de processamento de áudio, o método caracterizado por compreender:
    receber um primeiro sinal codificado em forma de onda tendo um conteúdo espectral até uma primeira frequência de cruzamento, receber um segundo sinal codificado em forma de onda tendo um conteúdo espectral correspondente a um subconjunto da faixa de frequência acima da primeira frequência de cruzamento, em que o subconjunto da faixa de frequência acima da primeira frequência de cruzamento inclui um intervalo de frequência isolado não contíguo com o conteúdo espectral do primeiro sinal codificado em forma de onda, receber parâmetros de reconstrução de alta frequência, realizar reconstrução de alta frequência usando pelo menos uma primeira porção do primeiro sinal codificado em forma de onda e os parâmetros de reconstrução de alta frequência, de modo a gerar um sinal estendido em frequência tendo um conteúdo espectral acima da primeira frequência de cruzamento, e intercalar o sinal estendido em frequência com o segundo sinal codificado em forma de onda, em que o sistema de processamento de áudio é implementado pelo menos em parte com hardware.
  2. 2. Método de decodificação, de acordo com a reivindicação 1, caracterizado pelo fato de que o conteúdo espectral do segundo sinal codificado em forma de onda tem um limite superior variável no tempo.
  3. 3. Método de decodificação, de acordo com reivindicação 1, caracterizado por compreender combinar o sinal estendido de frequência, o segundo sinal codificado em forma de onda e o primeiro sinal codificado em forma de onda para formar um sinal de áudio de
    Petição 870170021816, de 03/04/2017, pág. 60/66
    2/6 largura de banda total.
  4. 4. Método de decodificação, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa de executar reconstrução de alta frequência compreende copiar uma banda de frequência inferior para uma banda de frequência superior.
  5. 5. Método de decodificação, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa de executar reconstrução de alta frequência é executada em um domínio de frequência.
  6. 6. Método de decodificação, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa de intercalar o sinal estendido em frequência com o segundo sinal codificado em forma de onda é executada em um domínio de frequência.
  7. 7. Método de decodificação, de acordo a reivindicação 5, caracterizado pelo fato de que o domínio de frequência é um domínio de Filtros de Espelho de Quadratura, QMF.
  8. 8. Método de decodificação, de acordo com a reivindicação
    1, caracterizado pelo fato de que o primeiro e o segundo sinais codificados em forma de onda como recebidos são codificados usando a mesma transformada MDCT.
  9. 9. Método de decodificação, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende ajustar o conteúdo espectral do sinal estendido em frequência conforme os parâmetros de reconstrução de alta frequência, de modo a ajustar o envelope espectral do sinal estendido em frequência.
  10. 10. Método de decodificação, de acordo com a reivindicação 1, caracterizado pelo fato de que a intercalação compreende adicionar o segundo sinal codificado em forma de onda ao sinal estendido em frequência.
  11. 11. Método de decodificação, de acordo com a reivindicação 1, caracterizado pelo fato de que a intercalação compreende subs-
    Petição 870170021816, de 03/04/2017, pág. 61/66
    3/6 tituir o conteúdo espectral do sinal estendido em frequência pelo conteúdo espectral do segundo sinal codificado em forma de onda no subconjunto da faixa de frequência acima da primeira frequência de cruzamento que corresponde ao conteúdo espectral do segundo sinal codificado em forma de onda.
  12. 12. Método de decodificação, de acordo com a reivindicação 1, caracterizado pelo fato de que o primeiro sinal codificado em forma de onda e o segundo sinal codificado em forma de onda formam primeira e segunda porções de sinal de um sinal comum.
  13. 13. Método de decodificação, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende receber um sinal de controle compreendendo dados relativos a uma ou mais faixas de tempo e uma ou mais faixas de frequência acima da primeira frequência de cruzamento para a qual o segundo sinal codificado em forma de onda está disponível, em que a etapa de intercalar o sinal estendido em frequência com o segundo sinal codificado em forma é baseado no sinal de controle.
  14. 14. Método de decodificação, de acordo com reivindicação 13, caracterizado pelo fato de que o sinal de controle compreende pelo menos um dentre um segundo vetor indicando as uma ou mais faixas de frequência acima da primeira frequência de cruzamento para as quais o segundo sinal codificado em forma de onda está disponível para intercalação com o sinal estendido em frequência, e um terceiro vetor indicando a uma ou mais faixas de tempo para as quais o segundo sinal codificado em forma de onda está disponível para intercalação com o sinal estendido de frequência.
  15. 15. Método de decodificação, de acordo com a reivindicação 13, caracterizado pelo fato de que o sinal de controle compreende um primeiro vetor indicando uma ou mais faixas de frequência acima da primeira frequência de cruzamento para serem reconstruídas pa-
    Petição 870170021816, de 03/04/2017, pág. 62/66
    4/6 rametricamente com base nos parâmetros de reconstrução de alta frequência.
  16. 16. Meio legível por computador não transitório caracterizado por compreender instruções que, quando executadas por um processador, realizam o método como definido na reivindicação 1.
  17. 17. Decodificador de áudio para decodificar um sinal de áudio codificado, o decodificador de áudio caracterizado por compreender:
    uma interface de entrada configurada para receber um primeiro sinal codificado em forma de onda tendo um conteúdo espectral até uma primeira frequência de cruzamento, um segundo sinal codificado em forma de onda tendo um conteúdo espectral correspondente a um subconjunto da faixa de frequência acima da primeira frequência de cruzamento, e parâmetros de reconstrução de alta frequência, em que o subconjunto da faixa de frequência acima da primeira frequência de cruzamento inclui um intervalo de frequência isolado não contíguo com o conteúdo espectral do primeiro sinal codificado em forma de onda;
    um reconstrutor de alta frequência configurado para receber o primeiro sinal decodificado em forma de onda e os parâmetros de reconstrução de alta frequência a partir do estágio de recepção e para realizar reconstrução de alta frequência usando o primeiro sinal codificado em forma de onda e os parâmetros de reconstrução de alta frequência, de modo a gerar um sinal estendido em frequência tendo um conteúdo espectral acima da primeira frequência de cruzamento; e um intercalador configurado para receber o sinal estendido em frequência a partir do estágio de reconstrução de alta frequência e o segundo sinal codificado em forma de onda a partir do estágio de recepção, e para intercalar o sinal estendido em frequência com o segundo sinal codificado em forma de onda,
    Petição 870170021816, de 03/04/2017, pág. 63/66
    5/6 em que o decodificador de áudio é implementado pelo menos em parte com hardware.
  18. 18. Método de codificação em um sistema de processamento de áudio, caracterizado pelo fato de que compreende as etapas de:
    receber um sinal de áudio a ser codificado;
    calcular, com base no sinal de áudio recebido, parâmetros de reconstrução de alta frequência permitindo reconstrução de alta frequência do sinal de áudio recebido acima de uma primeira frequência de cruzamento, identificar, com base no sinal de áudio recebido, um subconjunto da faixa de frequência acima da primeira frequência de cruzamento para a qual o conteúdo espectral do sinal de áudio recebido é para ser codificado em forma de onda e subsequentemente, em um decodificador, para ser intercalado com uma reconstrução de alta frequência do sinal de áudio;
    gerar um primeiro sinal codificado em forma de onda por codificação em forma de onda do sinal áudio recebido para bandas espectrais até a primeira frequência de cruzamento, e um segundo sinal codificado em forma de onda por codificação em forma de onda do sinal de áudio recebido para bandas espectrais correspondentes ao subconjunto identificado da faixa de frequência acima da primeira frequência de cruzamento, em que o subconjunto da faixa de frequência acima da primeira frequência de cruzamento inclui um intervalo de frequência isolado não contíguo com o conteúdo espectral do primeiro sinal codificado em forma de onda, em que o sistema de processamento de áudio é implementado pelo menos em parte com hardware.
  19. 19. Método de codificação, de acordo com a reivindicação 18, caracterizado pelo fato de que um conteúdo espectral do segundo
    Petição 870170021816, de 03/04/2017, pág. 64/66
    6/6 sinal codificado em forma de onda tem um limite superior variável no tempo.
  20. 20. Método de codificação, de acordo com a reivindicação 18, caracterizado pelo fato de os parâmetros de reconstrução de alta frequência são calculados usando codificação de replicação de banda espectral, SBR.
BR122017006820-2A 2013-04-05 2014-04-04 Método para decodificar um sinal de áudio em um sistema de processamento de áudio, meio legível por computador não transitório e decodificador de áudio para decodificar um sinal de áudio codificado BR122017006820B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201361808687P 2013-04-05 2013-04-05
US61/808,687 2013-04-05
PCT/EP2014/056856 WO2014161995A1 (en) 2013-04-05 2014-04-04 Audio encoder and decoder for interleaved waveform coding
BR112015025022-0A BR112015025022B1 (pt) 2013-04-05 2014-04-04 Método de decodificação, decodificador em um sistema de processamento de áudio, método de codificação, e codificador em um sistema de processamento de áudio

Publications (2)

Publication Number Publication Date
BR122017006820A2 true BR122017006820A2 (pt) 2019-09-03
BR122017006820B1 BR122017006820B1 (pt) 2022-04-19

Family

ID=50442508

Family Applications (4)

Application Number Title Priority Date Filing Date
BR122020020705-1A BR122020020705B1 (pt) 2013-04-05 2014-04-04 Método de decodificação, decodificador, método de codificação e codificador e de áudio para codificação de forma de onda interestratificada
BR122020020698-5A BR122020020698B1 (pt) 2013-04-05 2014-04-04 Método para decodificação, meio legível por computador não transitório para decodificação, decodificador, e método de codificação de áudio para codificação em forma de onda intercalada
BR122017006820-2A BR122017006820B1 (pt) 2013-04-05 2014-04-04 Método para decodificar um sinal de áudio em um sistema de processamento de áudio, meio legível por computador não transitório e decodificador de áudio para decodificar um sinal de áudio codificado
BR112015025022-0A BR112015025022B1 (pt) 2013-04-05 2014-04-04 Método de decodificação, decodificador em um sistema de processamento de áudio, método de codificação, e codificador em um sistema de processamento de áudio

Family Applications Before (2)

Application Number Title Priority Date Filing Date
BR122020020705-1A BR122020020705B1 (pt) 2013-04-05 2014-04-04 Método de decodificação, decodificador, método de codificação e codificador e de áudio para codificação de forma de onda interestratificada
BR122020020698-5A BR122020020698B1 (pt) 2013-04-05 2014-04-04 Método para decodificação, meio legível por computador não transitório para decodificação, decodificador, e método de codificação de áudio para codificação em forma de onda intercalada

Family Applications After (1)

Application Number Title Priority Date Filing Date
BR112015025022-0A BR112015025022B1 (pt) 2013-04-05 2014-04-04 Método de decodificação, decodificador em um sistema de processamento de áudio, método de codificação, e codificador em um sistema de processamento de áudio

Country Status (10)

Country Link
US (5) US9514761B2 (pt)
EP (4) EP3742440B1 (pt)
JP (6) JP6026704B2 (pt)
KR (7) KR102170665B1 (pt)
CN (7) CN117253497A (pt)
BR (4) BR122020020705B1 (pt)
ES (1) ES2688134T3 (pt)
HK (1) HK1217054A1 (pt)
RU (4) RU2622872C2 (pt)
WO (1) WO2014161995A1 (pt)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3742440B1 (en) * 2013-04-05 2024-07-31 Dolby International AB Audio decoder for interleaved waveform coding
CN105493182B (zh) * 2013-08-28 2020-01-21 杜比实验室特许公司 混合波形编码和参数编码语音增强
RU2665281C2 (ru) * 2013-09-12 2018-08-28 Долби Интернэшнл Аб Временное согласование данных обработки на основе квадратурного зеркального фильтра
EP3288031A1 (en) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
EP3337065B1 (en) * 2016-12-16 2020-11-25 Nxp B.V. Audio processing circuit, audio unit and method for audio signal blending
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
JP7270836B2 (ja) 2019-08-08 2023-05-10 ブームクラウド 360 インコーポレイテッド 音響心理学的周波数範囲拡張のための非線形適応フィルタバンク
CN113192521B (zh) * 2020-01-13 2024-07-05 华为技术有限公司 一种音频编解码方法和音频编解码设备
CN113808596A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置
JP7253208B2 (ja) 2021-07-09 2023-04-06 株式会社ディスコ ダイヤモンド成膜方法及びダイヤモンド成膜装置

Family Cites Families (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2598159B2 (ja) * 1990-08-28 1997-04-09 三菱電機株式会社 音声信号処理装置
DE69322805T2 (de) 1992-04-03 1999-08-26 Yamaha Corp. Verfahren zur Steuerung von Tonquellenposition
US5598478A (en) 1992-12-18 1997-01-28 Victor Company Of Japan, Ltd. Sound image localization control apparatus
EP0695109B1 (en) 1994-02-14 2011-07-27 Sony Corporation Device for reproducing video signal and audio signal
JP3849210B2 (ja) * 1996-09-24 2006-11-22 ヤマハ株式会社 音声符号化復号方式
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6442275B1 (en) * 1998-09-17 2002-08-27 Lucent Technologies Inc. Echo canceler including subband echo suppressor
CA2311817A1 (en) 1998-09-24 2000-03-30 Fourie, Inc. Apparatus and method for presenting sound and image
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
EP1158494B1 (en) * 2000-05-26 2002-05-29 Lucent Technologies Inc. Method and apparatus for performing audio coding and decoding by interleaving smoothed critical band evelopes at higher frequencies
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
CN1177433C (zh) 2002-04-19 2004-11-24 华为技术有限公司 一种移动网络中广播多播业务源的管理方法
KR20050057288A (ko) 2002-09-09 2005-06-16 코닌클리케 필립스 일렉트로닉스 엔.브이. 스마트 스피커들
US7191136B2 (en) * 2002-10-01 2007-03-13 Ibiquity Digital Corporation Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
DE10338694B4 (de) 2003-08-22 2005-08-25 Siemens Ag Wiedergabeeinrichtung, umfassend wenigstens einen Bildschirm zur Darstellung von Informationen
RU2374703C2 (ru) 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
EP1719117A1 (en) 2004-02-16 2006-11-08 Koninklijke Philips Electronics N.V. A transcoder and method of transcoding therefore
KR20070009644A (ko) * 2004-04-27 2007-01-18 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
CA2581810C (en) * 2004-10-26 2013-12-17 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
JP4939424B2 (ja) 2004-11-02 2012-05-23 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化
DE102005008343A1 (de) 2005-02-23 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Liefern von Daten in einem Multi-Renderer-System
JP5129117B2 (ja) * 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 音声信号の高帯域部分を符号化及び復号する方法及び装置
US7684981B2 (en) * 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US7693709B2 (en) * 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US8199828B2 (en) 2005-10-13 2012-06-12 Lg Electronics Inc. Method of processing a signal and apparatus for processing a signal
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
CN101086845B (zh) * 2006-06-08 2011-06-01 北京天籁传音数字技术有限公司 声音编码装置及方法以及声音解码装置及方法
WO2008004812A1 (en) 2006-07-04 2008-01-10 Electronics And Telecommunications Research Institute Apparatus and method for restoring multi-channel audio signal using he-aac decoder and mpeg surround decoder
JP2008096567A (ja) 2006-10-10 2008-04-24 Matsushita Electric Ind Co Ltd オーディオ符号化装置およびオーディオ符号化方法ならびにプログラム
JP4973919B2 (ja) 2006-10-23 2012-07-11 ソニー株式会社 出力制御システムおよび方法、出力制御装置および方法、並びにプログラム
EP3288027B1 (en) 2006-10-25 2021-04-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating complex-valued audio subband values
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
US8363842B2 (en) 2006-11-30 2013-01-29 Sony Corporation Playback method and apparatus, program, and recording medium
JPWO2008084688A1 (ja) * 2006-12-27 2010-04-30 パナソニック株式会社 符号化装置、復号装置及びこれらの方法
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
JP2008268384A (ja) * 2007-04-17 2008-11-06 Nec Lcd Technologies Ltd 液晶表示装置
US8015368B2 (en) 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
US8630863B2 (en) * 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
CN101743586B (zh) * 2007-06-11 2012-10-17 弗劳恩霍夫应用研究促进协会 音频编码器、编码方法、解码器、解码方法
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
DK2571024T3 (en) 2007-08-27 2015-01-05 Ericsson Telefon Ab L M Adaptive transition frequency between the noise filling and bandwidth extension
JP5008542B2 (ja) * 2007-12-10 2012-08-22 花王株式会社 トナー用結着樹脂の製造方法
EP3296992B1 (en) * 2008-03-20 2021-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for modifying a parameterized representation
JP5010743B2 (ja) * 2008-07-11 2012-08-29 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法
CA2836871C (en) * 2008-07-11 2017-07-18 Stefan Bayer Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
EP2144171B1 (en) * 2008-07-11 2018-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
CN102089814B (zh) * 2008-07-11 2012-11-21 弗劳恩霍夫应用研究促进协会 对编码的音频信号进行解码的设备和方法
EP2301028B1 (en) * 2008-07-11 2012-12-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus and a method for calculating a number of spectral envelopes
ES2592416T3 (es) * 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
JP5215077B2 (ja) 2008-08-07 2013-06-19 シャープ株式会社 コンテンツ再生装置、コンテンツ再生方法、プログラムおよび記録媒体
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
PL4231290T3 (pl) * 2008-12-15 2024-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
DK2211339T3 (en) 2009-01-23 2017-08-28 Oticon As listening System
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
TWI556227B (zh) * 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US8515768B2 (en) * 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102257567B (zh) 2009-10-21 2014-05-07 松下电器产业株式会社 音响信号处理装置、音响编码装置及音响解码装置
CN102667920B (zh) * 2009-12-16 2014-03-12 杜比国际公司 Sbr比特流参数缩混
CN108989721B (zh) 2010-03-23 2021-04-16 杜比实验室特许公司 用于局域化感知音频的技术
US9275650B2 (en) * 2010-06-14 2016-03-01 Panasonic Corporation Hybrid audio encoder and hybrid audio decoder which perform coding or decoding while switching between different codecs
WO2012000882A1 (en) * 2010-07-02 2012-01-05 Dolby International Ab Selective bass post filter
CN103155033B (zh) * 2010-07-19 2014-10-22 杜比国际公司 高频重建期间的音频信号处理
JP5533502B2 (ja) 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
US9117440B2 (en) 2011-05-19 2015-08-25 Dolby International Ab Method, apparatus, and medium for detecting frequency extension coding in the coding history of an audio signal
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
BR122021018240B1 (pt) * 2012-02-23 2022-08-30 Dolby International Ab Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
EP3742440B1 (en) 2013-04-05 2024-07-31 Dolby International AB Audio decoder for interleaved waveform coding

Also Published As

Publication number Publication date
JP2021113975A (ja) 2021-08-05
RU2015147173A (ru) 2017-05-15
RU2665228C1 (ru) 2018-08-28
KR102170665B1 (ko) 2020-10-29
US11875805B2 (en) 2024-01-16
KR102694669B1 (ko) 2024-08-14
KR20160075806A (ko) 2016-06-29
JP2019168712A (ja) 2019-10-03
CN110265047B (zh) 2021-05-18
JP7317882B2 (ja) 2023-07-31
JP2018101160A (ja) 2018-06-28
JP6026704B2 (ja) 2016-11-16
EP3742440A1 (en) 2020-11-25
US20170018279A1 (en) 2017-01-19
WO2014161995A1 (en) 2014-10-09
KR20220137791A (ko) 2022-10-12
KR20200123490A (ko) 2020-10-29
BR112015025022B1 (pt) 2022-03-29
HK1217054A1 (zh) 2016-12-16
EP2981959A1 (en) 2016-02-10
RU2020101868A (ru) 2021-07-19
RU2694024C1 (ru) 2019-07-08
BR122020020698B1 (pt) 2022-05-31
US20240194210A1 (en) 2024-06-13
KR102107982B1 (ko) 2020-05-11
JP6541824B2 (ja) 2019-07-10
KR101632238B1 (ko) 2016-06-21
CN110223703B (zh) 2023-06-02
EP2981959B1 (en) 2018-07-25
CN105103224A (zh) 2015-11-25
BR112015025022A2 (pt) 2017-07-18
EP3382699A1 (en) 2018-10-03
CN110265047A (zh) 2019-09-20
EP4428860A2 (en) 2024-09-11
US20160042742A1 (en) 2016-02-11
CN117253497A (zh) 2023-12-19
KR102243688B1 (ko) 2021-04-27
ES2688134T3 (es) 2018-10-31
EP3382699B1 (en) 2020-06-17
RU2622872C2 (ru) 2017-06-20
US9514761B2 (en) 2016-12-06
US11145318B2 (en) 2021-10-12
BR122020020705B1 (pt) 2022-05-03
KR20240127481A (ko) 2024-08-22
KR20200049881A (ko) 2020-05-08
EP3742440B1 (en) 2024-07-31
US10121479B2 (en) 2018-11-06
US20190066708A1 (en) 2019-02-28
JP6859394B2 (ja) 2021-04-14
JP2017058686A (ja) 2017-03-23
CN117275495A (zh) 2023-12-22
JP6317797B2 (ja) 2018-04-25
RU2713701C1 (ru) 2020-02-06
US20220101865A1 (en) 2022-03-31
KR20150122245A (ko) 2015-10-30
JP2016515723A (ja) 2016-05-30
CN110136728B (zh) 2023-08-04
KR102450178B1 (ko) 2022-10-06
KR20210044321A (ko) 2021-04-22
CN110136728A (zh) 2019-08-16
CN110223703A (zh) 2019-09-10
JP7551860B2 (ja) 2024-09-17
CN117253498A (zh) 2023-12-19
BR122017006820B1 (pt) 2022-04-19
CN105103224B (zh) 2019-08-02
JP2023143924A (ja) 2023-10-06

Similar Documents

Publication Publication Date Title
BR122017006820A2 (pt) codificador e decodificador de áudio para codificação em forma de onda intercalada
RU2809586C2 (ru) Аудиокодер и декодер для кодирования по форме волны с перемежением

Legal Events

Date Code Title Description
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 04/04/2014, OBSERVADAS AS CONDICOES LEGAIS.

B25G Requested change of headquarter approved

Owner name: DOLBY INTERNATIONAL AB (IE)