BR122017006819A2 - codificador e decodificador de áudio - Google Patents

codificador e decodificador de áudio Download PDF

Info

Publication number
BR122017006819A2
BR122017006819A2 BR122017006819A BR122017006819A BR122017006819A2 BR 122017006819 A2 BR122017006819 A2 BR 122017006819A2 BR 122017006819 A BR122017006819 A BR 122017006819A BR 122017006819 A BR122017006819 A BR 122017006819A BR 122017006819 A2 BR122017006819 A2 BR 122017006819A2
Authority
BR
Brazil
Prior art keywords
signal
encoded
frequency
signals
waveform
Prior art date
Application number
BR122017006819A
Other languages
English (en)
Other versions
BR122017006819B1 (pt
Inventor
Mundt Harald
Purnhagen Heiko
Jonas Roeden Karl
Kjoerling Kristofer
Sehlstrom Leif
Original Assignee
Dolby Int Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Int Ab filed Critical Dolby Int Ab
Publication of BR122017006819A2 publication Critical patent/BR122017006819A2/pt
Publication of BR122017006819B1 publication Critical patent/BR122017006819B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)

Abstract

codificador e decodificador de áudio a presente invenção refere-se a métodos, dispositivos e produtos de programa de computador para codificar e decodificar um sinal de áudio de múltiplos canais com base em um sinal de entrada. de acordo com a descrição, uma abordagem híbrida de utilização de ambas; codificação, estéreo, paramétrica, e representação discreta do sinal de áudio de múltiplos canais, processado; é usada a qual pode aperfeiçoar a qualidade do áudio codificado e decodificado para certas taxas de bits.

Description

Relatório Descritivo da Patente de Invenção para CODIFICADOR E DECODIFICADOR DE ÁUDIO.
[001] Divido do BR112015019711-6, depositado em 04.04.2014. Referência Cruzada a Pedidos Relacionados [002] Esse pedido reivindica prioridade para o Pedido de Patente Provisional dos Estados Unidos N° 61/808.680, depositado em 5 de abril de 2013, o qual é aqui incorporado mediante referência.
Campo Técnico [003] A presente invenção refere-se geralmente à codificação de áudio de múltiplos canais. Especificamente se refere a um codificador e a um decodificador para codificação híbrida compreendendo codificação paramétrica e codificação discreta de múltiplos canais. Antecedentes [004] Na codificação de áudio de múltiplos canais, convencional, os possíveis esquemas de codificação incluem codificação discreta de múltiplos canais ou codificação paramétrica tal como MPEG Surround. O esquema usado depende da largura de banda do sistema de áudio. Métodos de codificação paramétrica são conhecidos como sendo escaláveis e eficientes em termos de qualidade de escuta, que torna os mesmos particularmente atraentes em aplicações de baixa taxa de bits. Em aplicações de alta taxa de bits, a codificação discreta de múltiplos canais normalmente é usada. Os formatos de processamento ou distribuição existentes e as técnicas de codificação associadas podem ser aperfeiçoados do ponto de vista de sua eficiência de largura de banda, especialmente em aplicações com uma taxa de bits entre a taxa de bits baixa e a taxa de bits alta.
[005] US7292901 (Kroon e outros) se refere a um método de codificação híbrida em que um sinal de áudio híbrido é formado a partir de pelo menos um componente espectral mixado de forma descendente e pelo menos um componente espectral não mixado. O método
Petição 870170021813, de 03/04/2017, pág. 8/56
2/32 apresentado naquele pedido pode aumentar a capacidade de uma aplicação que tem certa taxa de bits, mas aperfeiçoamentos adicionais podem ser necessários para aumentar ainda mais a eficiência de um sistema de processamento de áudio.
Breve Descrição Dos Desenhos [006] Modalidades exemplares serão descritas agora com referência aos desenhos anexos, nos quais:
[007] a Figura 1 é um diagrama de blocos generalizado de um sistema de decodificação de acordo com uma modalidade exemplar;
[008] a Figura 2 ilustra uma primeira parte do sistema de decodificação na Figura 1;
[009] a Figura 3 ilustra uma segunda parte do sistema de decodificação na Figura 1;
[0010] a Figura 4 ilustra uma terceira parte do sistema de decodificação na Figura 1;
[0011] a Figura 5 é um diagrama em blocos generalizado de um sistema de codificação de acordo com uma modalidade exemplar;
[0012] a Figura 6 é um diagrama em blocos generalizado de um sistema de decodificação de acordo com uma modalidade exemplar;
[0013] a Figura 7 ilustra uma terceira parte do sistema de decodificação da Figura 6; e [0014] a Figura 8 é um diagrama em blocos generalizado de um sistema de codificação de acordo com uma modalidade exemplar.
[0015] Todas as figuras são esquemáticas e em geral mostram apenas partes que são necessárias para elucidar a descrição, ao passo que outras partes podem ser omitidas ou apenas sugeridas. A menos que de outro modo indicado, numerais de referência semelhantes se referem a partes semelhantes em diferentes figuras.
Descrição Detalhada
Visão Geral - Decodificador
Petição 870170021813, de 03/04/2017, pág. 9/56
3/32 [0016] Como aqui usado, um sinal de áudio pode ser um sinal de áudio puro, uma parte de áudio de um sinal audiovisual ou sinal de multimídia ou qualquer desses em combinação com metadados.
[0017] Como usado aqui, mixagem descendente de uma pluralidade de sinais significa combinar a pluralidade de sinais, por exemplo, mediante formação de combinações lineares, e de tal modo que um número inferior de sinais seja obtido. A operação inversa à mixagem descendente é referida como uma upmixação (upmixing), isto é, realizar uma operação em um número inferior de sinais para obter um número superior de sinais.
[0018] De acordo com um primeiro aspecto, modalidades exemplares propõem métodos, dispositivos e produtos de programa de computador, para reconstruir um sinal de áudio de múltiplos canais com base em um sinal de entrada. Os métodos propostos, dispositivos e produtos de programa de computador podem ter geralmente as mesmas características e vantagens.
[0019] De acordo com modalidades exemplares, um decodificador para um sistema de processamento de áudio de múltiplos canais para reconstruir M canais codificados, em que M > 2, é provido. O decodificador compreende um primeiro estágio de recepção configurado para receber N sinais de mixagem descendente, codificados em forma de onda compreendendo coeficientes espectrais correspondendo às frequências entre uma primeira e uma segunda frequência de cruzamento, em que 1<N<M.
[0020] O decodificador compreende ainda um segundo estágio de recepção configurado para receber M sinais codificados em forma de onda compreendendo coeficientes espectrais correspondendo às frequências até a primeira frequência de cruzamento, cada um dos M sinais codificados em forma de onda correspondendo a um canal respectivo dos M canais codificados.
Petição 870170021813, de 03/04/2017, pág. 10/56
4/32 [0021] O decodificador compreende ainda estágio de mixagem descendente a jusante do segundo estágio de recepção configurado para mixar de forma descendente os M sinais codificados em forma de onda em N sinais e mixagem descendente compreendendo coeficientes espectrais correspondendo às frequências até a primeira frequência de cruzamento.
[0022] O decodificador compreende ainda um primeiro estágio de combinação a jusante do primeiro estágio de recepção e o sinal de mixagem descendente configurado para combinar cada um dos N sinais de mixagem descendente recebidos pelo primeiro estágio de recepção com um sinal correspondente dos N sinais de mixagem descendente a partir do estágio de mixagem descendente em N sinais de mixagem descendente, combinados.
[0023] O decodificador compreende ainda um estágio de reconstrução de alta frequência a jusante do primeiro estágio de combinação configurado para estender cada um dos N sinais de mixagem descendente, combinados a partir do estágio de combinação para uma faixa de frequências acima da segunda frequência de cruzamento mediante realização de reconstrução de alta frequência.
[0024] O decodificador compreende ainda um estágio de upmixação a jusante do estágio de reconstrução de alta frequência configurado para realizar uma upmixação paramétrica dos N sinais estendidos de frequência a partir do estágio de reconstrução de alta frequência em M sinais de upmixação compreendendo coeficientes espectrais correspondendo às frequências acima da primeira frequência de cruzamento, cada um dos M sinais de upmixação correspondendo a um dos M canais codificados.
[0025] O decodificador compreende ainda um segundo estágio de combinação a jusante do estágio de upmixação e o segundo estágio de recepção configurado para combinar os M sinais de upmixação a
Petição 870170021813, de 03/04/2017, pág. 11/56
5/32 partir do estágio de upmixação com os M sinais codificados em forma de onda recebidos pelo segundo estágio de recepção.
[0026] Os M sinais codificados em forma de onda são puramente sinais codificados em forma de onda sem sinais paramétricos mixados, isto é, eles são uma representação discreta não mixada descendentemente do sinal de áudio de múltiplos canais, processado. Uma vantagem de ter as frequências inferiores representadas nesses sinais codificados em forma de onda pode ser que a audição humana é mais sensível à parte do sinal de áudio que tem baixas frequências. Mediante codificação dessa parte com uma melhor qualidade, a impressão global do áudio decodificado pode aumentar.
[0027] Uma vantagem de ter pelo menos dois sinais de mixagem descendente é que essa modalidade proporciona uma dimensionalidade aumentada dos sinais de mixagem descendentes em comparação com os sistemas com apenas um canal de mixagem descendente. De acordo com essa modalidade, uma melhor qualidade de áudio decodificado pode ser assim provida que pode superar o ganho em taxa de bits provido por um sistema de sinal de mixagem descendente.
[0028] Uma vantagem do uso de codificação híbrida compreendendo a mixagem descendente paramétrica e codificação discreta de múltiplos canais é que isso pode aperfeiçoar a qualidade do sinal de áudio decodificado para certas taxas de bits em comparação com o uso de uma abordagem de codificação paramétrica convencional, isto é, MPEG Surround com HE-AAC. Em taxas de bits de aproximadamente 72 quilo bits por segundo (kbps), o modelo de codificação paramétrica convencional pode saturar, isto é, a qualidade do sinal de áudio codificado é limitada pelos empecilhos do modelo paramétrico e não pela ausência de bits para codificação. Consequentemente, para taxas de bits de aproximadamente 72 kbps, pode ser mais vantajoso utilizar bits em frequências inferiores de codificação em forma de onda,
Petição 870170021813, de 03/04/2017, pág. 12/56
6/32 discretamente. Ao mesmo tempo, a abordagem híbrida de uso de uma mixagem descendente paramétrica e codificação de múltiplos canais, discreta é que isso pode aperfeiçoar a qualidade do áudio decodificado para certas taxas de bits, por exemplo, em 128 kbps ou abaixo, em comparação com o uso de uma abordagem onde todos os bits são usados em frequências inferiores de codificação em forma de onda e utilizando replicação de banda espectral (SBR) para as frequências restantes.
[0029] Uma vantagem de ter N sinais de mixagem descendente, codificados em forma de onda que compreendem apenas dados espectrais correspondendo às frequências entre a primeira frequência de cruzamento e uma segunda frequência de cruzamento é que a taxa de transmissão de bits, exigida para o sistema de processamento de sinal de áudio pode ser diminuída. Alternativamente, os bits salvos pelo fato de se ter um sinal de mixagem descendente filtrado de passa-faixa podem ser usados em frequências inferiores de codificação em forma de onda, por exemplo, a frequência de amostragem para aquelas frequências pode ser superior ou a primeira frequência de cruzamento pode ser aumentada.
[0030] Uma vez que, como mencionado acima, a audição humana é mais sensível à parte do sinal de áudio que tem frequências baixas, altas frequências, como a parte do sinal de áudio que tem frequências acima da segunda frequência de cruzamento, podem ser recriadas mediante reconstrução de alta frequência sem reduzir a qualidade de áudio percebida do sinal de áudio decodificado.
[0031] Uma vantagem adicional com a presente modalidade pode ser que, como a upmixação para a métrica realizada no estágio de upmixação opera apenas em coeficientes espectrais correspondendo às frequências acima da primeira frequência de cruzamento, a complexidade da upmixação é reduzida.
Petição 870170021813, de 03/04/2017, pág. 13/56
7/32 [0032] De acordo com outra modalidade, a combinação realizada no primeiro estágio de combinação, em que cada um dos N sinais de mixagem descendente, codificados em forma de onda compreendendo coeficientes espectrais correspondendo às frequências entre uma primeira e uma segunda frequência de cruzamento é combinado com um sinal correspondente dos N sinais de mixagem descendente compreendendo coeficientes espectrais correspondendo às frequências até a primeira frequência de cruzamento em N mixagens descendentes combinadas, é realizado em um domínio de frequência.
[0033] Uma vantagem dessa modalidade pode ser que M sinais codificados em forma de onda e N sinais de mixagem descendente, codificados em forma de onda podem ser codificados por um codificador de forma de onda utilizando transformadas em janelas de sobreposição com janelamento independente para os M sinais codificados em forma de onda e N sinais de mixagem descendente, codificados em forma de onda, respectivamente, e ainda poder ser decodificados pelo decodificador.
[0034] De acordo com outra modalidade, estender cada um dos N sinais de mixagem descendente combinados para uma faixa de frequências acima da segunda frequência de cruzamento no estágio de reconstrução de alta frequência é realizado em um domínio de frequência.
[0035] De acordo com uma modalidade adicional, a combinação realizada na segunda etapa de combinação, isto é, a combinação dos M sinais de upmixação compreendendo coeficientes espectrais correspondendo às frequências acima da primeira frequência de cruzamento com os M sinais codificados em forma de onda compreendendo coeficientes espectrais correspondendo às frequências até a primeira frequência de cruzamento, é realizada em um domínio de frequência. Conforme mencionado acima, uma vantagem de combinar os sinais no
Petição 870170021813, de 03/04/2017, pág. 14/56
8/32 domínio QMF é que janelamento independente das transformadas em janelas de sobreposição usadas para codificar os sinais no domínio MDCT pode ser usado.
[0036] De acordo com outra modalidade, a upmixação paramétrica realizada dos N sinais de mixagem descendente combinados de frequência estendida em M sinais de upmixação no estágio de upmixação é realizada em um domínio de frequência.
[0037] De acordo ainda com outra modalidade, a mixagem descendente dos M sinais codificados em forma de onda em N sinais de mixagem descendente compreendendo coeficientes espectrais correspondendo às frequências até a primeira frequência de cruzamento é realizada em um domínio de frequência.
[0038] De acordo com uma modalidade, o domínio de frequência é um domínio de Filtros de Espelho de Quadratura, QMF.
[0039] De acordo com outra modalidade, a mixagem descendente realizada no estágio de mixagem descendente, em que os M sinais codificados em forma de onda são mixados descendentemente em N sinais de mixagem descendente compreendendo coeficientes espectrais correspondendo às frequências até a primeira frequência de cruzamento, é realizada no domínio de tempo.
[0040] De acordo com ainda outra modalidade, a primeira frequência de cruzamento depende de uma taxa de transmissão de bits do sistema de processamento de áudio de múltiplos canais. Isso pode resultar em que a largura de banda disponível seja utilizada para aperfeiçoar a qualidade do sinal de áudio decodificado uma vez que a parte do sinal de áudio que tem frequências abaixo da primeira frequência de cruzamento é simplesmente codificada em forma de onda.
[0041] De acordo com outra modalidade, estender cada um dos N sinais de mixagem descendente combinados para uma faixa de frequências acima da segunda frequência de cruzamento mediante realiPetição 870170021813, de 03/04/2017, pág. 15/56
9/32 zação de reconstrução de alta frequência no estágio de reconstrução de alta frequência é realizado utilizando parâmetros de reconstrução de alta frequência. Os parâmetros de reconstrução de alta frequência podem ser recebidos pelo decodificador, por exemplo, no estágio de recepção e então enviados para um estágio de reconstrução de alta frequência. A reconstrução de alta frequência pode, por exemplo, compreender a realização de replicação de banda espectral, SBR.
[0042] De acordo com outra modalidade, a upmixação paramétrica no estágio de upmixação é feita com o uso de parâmetros de upmix. Os parâmetros de upmix são recebidos pelo codificador, por exemplo, no estágio de recepção e enviados para o estágio de upmixação. Uma versão correlacionada inversamente dos N sinais de mixagem descendente combinados, estendidos em frequência é gerada e os N sinais de mixagem descendente combinados, estendidos em frequência e a versão correlacionada inversamente dos N sinais de mixagem descendente, combinados, estendidos em frequência são submetidos a uma operação de matriz. Os parâmetros da operação de matriz são dados pelos parâmetros de upmix.
[0043] De acordo com outra modalidade, os N sinais de mixagem descendente, codificados em forma de onda, recebidos no primeiro estágio de recepção e os M sinais codificados em forma de onda recebidos no segundo estágio de recepção são codificados utilizando transformadas em janelas de sobreposição com janelamento independente para os N sinais de mixagem descendente, codificados em forma de onda e os M sinais codificados em forma de onda, respectivamente.
[0044] Uma vantagem disso pode ser que isso permite uma qualidade de codificação aperfeiçoada e assim uma qualidade aperfeiçoada do sinal de áudio de múltiplos canais, decodificado. Por exemplo, se um transiente for detectado nas bandas de frequência mais altas em
Petição 870170021813, de 03/04/2017, pág. 16/56
10/32 certo momento, o codificador de forma de onda pode codificar esse quadro de tempo específico com uma sequência mais curta de janelas enquanto que para a banda de frequência inferior, a sequência de janelas padrão pode ser mantida.
[0045] De acordo com modalidades, o decodificador pode compreender um terceiro estágio de recepção configurado para receber um sinal codificado em forma de onda adicional compreendendo coeficientes espectrais correspondendo a um subconjunto das frequências acima da primeira frequência de cruzamento. O decodificador pode compreender ainda um estágio de intercalação a jusante do estágio de upmixação. O estágio de intercalação pode ser configurado para intercalar o sinal codificado em forma de onda adicional com um dos M sinais de upmixação. O terceiro estágio de recepção pode ser configurado adicionalmente para receber uma pluralidade de sinais codificados em forma de onda adicionais e o estágio de intercalação pode adicionalmente ser configurado para intercalar a pluralidade de sinais codificados em forma de onda, adicionais com uma pluralidade dos M sinais de upmixação.
[0046] Isso é vantajoso em que certas partes da faixa de frequências acima da primeira frequência de cruzamento que são difíceis de reconstruir de forma paramétrica a partir dos sinais de mixagem descendente podem ser providas em uma forma codificada em forma de onda para intercalação com os sinais de upmixação reconstruídos de forma paramétrica.
[0047] Em uma modalidade exemplar, a intercalação é realizada mediante adição do sinal codificado em forma da onda adicional com um dos M sinais de upmixação. De acordo com outra modalidade exemplar, a etapa de intercalação do sinal codificado em forma de onda adicional com um dos M sinais de upmixação compreende substituir um dos M sinais de upmixação com o sinal codificado em forma de
Petição 870170021813, de 03/04/2017, pág. 17/56
11/32 onda adicional no subconjunto das frequências acima da primeira frequência de cruzamento correspondendo aos coeficientes espectrais do sinal codificado em forma de onda, adicional.
[0048] De acordo com modalidades exemplares, o decodificador pode ser configurado ainda para receber um sinal de controle, por exemplo, por intermédio do terceiro estágio de recepção. O sinal de controle pode indicar como intercalar o sinal codificado em forma de onda adicional com um dos M sinais de upmixação, em que a etapa de intercalação do sinal codificado em forma de onda adicional com um dos M sinais de upmixação se baseia no sinal de controle. Especificamente, o sinal de controle pode indicar uma faixa de frequências e uma faixa de tempo, tal como um ou mais blocos de tempo/frequência em um domínio QMF, para os quais um sinal codificado em forma de onda adicional deve ser intercalado com um dos M sinais de upmixação. Consequentemente, a intercalação pode ocorrer em tempo e frequência com um canal.
[0049] Uma vantagem disso é que faixas de tempo e faixas de frequência podem ser selecionadas que não sofrem de problemas de suavização ou de desvanecimento/inicialização da transformada em janelas de sobreposição usada para codificar os sinais codificados em forma de onda.
Visão Geral - Codificador [0050] De acordo com um segundo aspecto, modalidades exemplares propõem métodos, dispositivos e produtos de programa de computador para codificar um sinal de áudio de múltiplos canais com base em um sinal de entrada.
[0051] Os métodos propostos, dispositivos e produtos de programa de computador podem ter geralmente as mesmas características e vantagens.
[0052] Vantagens com relação às características e configurações
Petição 870170021813, de 03/04/2017, pág. 18/56
12/32 conforme apresentadas na visão geral do decodificador acima podem geralmente ser válidas para as características e configurações correspondentes para o codificador.
[0053] De acordo com as modalidades exemplares, é provido um codificador para um sistema de processamento de áudio de múltiplos canais para codificar M canais, em que M > 2.
[0054] O codificador compreende um estágio de recepção configurado para receber M sinais correspondendo aos M canais a serem codificados.
[0055] O codificador compreende ainda primeiro estágio de codificação de forma de onda configurado para receber os M sinais a partir do estágio de recepção e para gerar M sinais codificados em forma de onda mediante codificação em forma de onda individualmente dos M sinais para uma faixa de frequências correspondendo às frequências até uma primeira frequência de cruzamento, pelo que os M sinais codificados em forma de onda compreendem coeficientes espectrais correspondendo às frequências até a primeira frequência de cruzamento.
[0056] O codificador compreende ainda um estágio de mixagem descendente configurado para receber os M sinais a partir do estágio de recepção e mixar descendentemente os M sinais em N sinais de mixagem descendente, em que 1<N<M.
[0057] O codificador compreende ainda estágio de codificação de reconstrução de alta frequência configurado para receber os N sinais de mixagem descendente a partir do estágio de mixagem descendente e submeter os N sinais de mixagem descendente à codificação de reconstrução de alta frequência, pelo que o estágio de codificação de reconstrução de alta frequência é configurado para extrair parâmetros de reconstrução de alta frequência que possibilitam a reconstrução de alta frequência dos N sinais de mixagem descendente acima de uma segunda frequência de cruzamento.
Petição 870170021813, de 03/04/2017, pág. 19/56
13/32 [0058] O codificador compreende ainda um estágio de codificação paramétrica configurado para receber os M sinais a partir do estágio de recepção e os N sinais de mixagem descendente a partir do estágio de mixagem descendente, e submeter os M sinais à codificação paramétrica para a faixa de frequências correspondendo às frequências acima da primeira frequência de cruzamento, pelo que o estágio de codificação paramétrica é configurado para extrair parâmetros de upmix que possibilitam a upmixação dos N sinais de mixagem descendente em M sinais reconstruídos correspondendo aos M canais para a faixa de frequências acima da primeira frequência de cruzamento.
[0059] O codificador compreende ainda um segundo estágio de codificação de forma de onda configurado para receber N sinais de mixagem descendente a partir do estágio de mixagem descendente e gerar N sinais de mixagem descendente, codificados em forma de onda mediante codificação em forma de onda dos N sinais de mixagem descendente para uma faixa de frequências correspondendo às frequências entre a primeira e a segunda frequência de cruzamento, pelo que os N sinais de mixagem descendente, codificados em forma de onda compreendem coeficientes espectrais correspondendo às frequências entre a primeira frequência de cruzamento e a segunda frequência de cruzamento.
[0060] De acordo com uma modalidade, a sujeição dos N sinais de mixagem descendente à codificação de reconstrução de alta frequência no estágio de codificação de reconstrução de alta frequência é realizada em um domínio de frequência, preferivelmente um domínio de filtros de espelho de quadratura QMF.
[0061] De acordo com uma modalidade adicional, a sujeição dos
M sinais à codificação paramétrica no estágio de codificação paramétrica é realizada em um domínio de frequência, preferivelmente um domínio de Filtros de Espelho de Quadratura, QMF.
Petição 870170021813, de 03/04/2017, pág. 20/56
14/32 [0062] De acordo com ainda outra modalidade, gerar M sinais codificados em forma de onda mediante codificação em forma de onda individualmente dos M sinais no primeiro estágio de codificação em forma de onda compreende aplicar uma transformada em janelas de sobreposição aos M sinais, em que diferentes sequências de janelas de sobreposição são usadas para ao menos dois dos M sinais.
[0063] De acordo com as modalidades, o codificador pode compreender ainda um terceiro estágio de codificação em forma de onda configurado para gerar um sinal codificado em forma de onda adicional mediante codificação em forma de onda de um dos M sinais para uma faixa de frequência correspondendo a um subconjunto da faixa de frequências acima da primeira frequência de cruzamento.
[0064] De acordo com as modalidades, o codificador pode compreender um estágio de geração de sinal de controle. O estágio de geração de sinal de controle é configurado para gerar um sinal de controle indicando como intercalar o sinal codificado em forma de onda adicional com uma reconstrução paramétrica de um dos M sinais em um decodificador. Por exemplo, o sinal de controle pode indicar uma faixa de frequências e uma faixa de tempo para as quais o sinal codificado em forma de onda deve ser intercalado com um dos M sinais de upmixação.
Modalidades Exemplares [0065] A Figura 1 é um diagrama em blocos generalizado de um decodificador 100 em um sistema de processamento de áudio de múltiplos canais para reconstruir M canais codificados. O decodificador 100 compreende três partes conceptuais 200, 300, 400 que serão explicados em maior detalhe em conjunto com as Figuras 2-4 abaixo. Na primeira parte conceptual 200, o codificador recebe N sinais de mixagem descendente, codificados em forma de onda e M sinais codificados em forma de onda representando o sinal de áudio de múltiplos caPetição 870170021813, de 03/04/2017, pág. 21/56
15/32 nais a ser decodificado, em que 1<N<M. No exemplo ilustrado, N é ajustado para 2. Na segunda parte conceptual 300, os M sinais codificados em forma de onda são mixados descendentemente e combinados com os N sinais de mixagem descendente, codificados em forma de onda. A reconstrução de alta frequência (HFR) é então realizada para os sinais de mixagem descendente combinados. Na terceira parte conceptual 400, os sinais reconstruídos de alta frequência são mixados ascendentemente, e os M sinais codificados em forma de onda são combinados com os sinais de upmixação para reconstruir M canais codificados.
[0066] Na modalidade exemplar descrita em conjunto com a Figura 2-4, é descrita a reconstrução de um som ambiente 5.1 codificado. Pode-se observar que o sinal de efeito de baixa frequência não é mencionado na modalidade descrita ou nos desenhos. Isso não significa que quaisquer efeitos de baixa frequência sejam negligenciados. Os efeitos de baixa frequência (Lfe) são adicionados aos 5 canais reconstruídos em qualquer forma adequada bem conhecida por aqueles versados na técnica. Também pode ser observado que o decodificador descrito é igualmente bem adequado para outros tipos de som ambiente codificado tal como som ambiente 7.1 ou 9.1.
[0067] A Figura 2 ilustra a primeira parte conceptual 200 do decodificador 100 na Figura 1. O decodificador compreende dois estágios de recepção 212, 214. No primeiro estágio de recepção 212, um fluxo de bits 202 é decodificado e quantizado inversamente em dois sinais de mixagem descendente, codificados em forma de onda 208a-b. Cada um dos dois sinais de mixagem descendente, codificados em forma de onda 208a-b compreende coeficientes espectrais correspondendo às frequências entre uma primeira frequência de cruzamento ky e uma segunda frequência de cruzamento kx.
[0068] No segundo estágio de recepção 212, o fluxo de bits 202 é
Petição 870170021813, de 03/04/2017, pág. 22/56
16/32 decodificado e quantizado inversamente em cinco sinais codificados em forma de onda 210a-e. Cada um dos cinco sinais de mixagem descendente, codificados em forma de onda 208a-e compreende coeficientes espectrais correspondendo às frequências até a primeira frequência de cruzamento kx.
[0069] Como exemplo, os sinais 210a-e compreendem dois elementos de par de canais e um elemento de canal único para o centro. O elemento de par de canais pode, por exemplo, ser uma combinação do sinal ambiente esquerdo e frontal esquerdo e uma combinação do sinal ambiente direito e frontal direito. Um exemplo adicional é uma combinação dos sinais, frontal esquerdo e frontal direito e uma combinação do sinal ambiente esquerdo e ambiente direito. Esses elementos de par de canais podem, por exemplo, ser codificados em um formato de soma e diferença. Todos os cinco canais 210a-e podem ser codificados utilizando transformadas em janelas de sobreposição com janelamento independente e ainda poder ser decodificados pelo decodificador. Isso pode permitir uma qualidade de codificação aperfeiçoada e assim uma qualidade aperfeiçoada do sinal decodificado.
[0070] Como um exemplo, a primeira frequência de cruzamento ky é 1.1 kHz. Como exemplo, a segunda frequência de cruzamento kx está situada dentro da faixa de 5.6-8 kHz. Deve-se observar que a primeira frequência de cruzamento ky pode variar, mesmo em uma base de sinal individual, isto é, o codificador pode detectar que um componente de sinal em um sinal de saída, específico pode não ser reproduzido fielmente pelos sinais de mixagem descendente estéreo 208a-b e podem para esse caso específico aumentar a largura de banda, isto é, a primeira frequência de cruzamento ky, do sinal codificado em forma de onda relevante, isto é, 210a-e, para realizar a codificação de forma de onda apropriada do componente de sinal.
[0071] Como será descrito posteriormente nessa descrição, os esPetição 870170021813, de 03/04/2017, pág. 23/56
17/32 tágios restantes do codificador 100 operam tipicamente no domínio de Filtros de Espelho de Quadratura (QMF). Por essa razão, cada um dos sinais 208a-b, 210a-e recebidos pelo primeiro e segundo estágio de recepção 212, 214, que são recebidos em uma forma de transformada discreta de cosseno, modificada (MDCT), é transformado para o domínio de tempo mediante aplicação de uma MDCT inversa 216. Cada sinal é então transformado de volta para o domínio de frequência mediante aplicação de uma transformada QMF 218.
[0072] Na Figura 3, os cinco sinais codificados em forma de onda 210 são mixados descendentemente para dois sinais de mixagem descendente 310, 312 compreendendo coeficientes espectrais correspondendo às frequências até a primeira frequência de cruzamento ky em um estágio de mixagem descendente 308. Esses sinais de mixagem descendente 310, 312 podem ser formados mediante realização de uma mixagem descendente nos sinais de múltiplos canais passabaixa 210a-e utilizando o mesmo esquema de mixagem descendente conforme usado em um codificador para criar os dois sinais de mixagem descendente 208a-b mostrados na Figura 2.
[0073] Os dois novos sinais de mixagem descendente 310, 312 são então combinados em um primeiro estágio de combinação 320, 322 com o sinal de mixagem descendente correspondente 208a-b para formar sinais de mixagem descendente, combinados 302a-b. Cada um dos sinais de mixagem descendente, combinados 302a-b compreende assim coeficientes espectrais correspondendo às frequências até a primeira frequência de cruzamento ky originada dos sinais de mixagem descendente 310, 312 e coeficientes espectrais correspondendo às frequências entre a primeira frequência de cruzamento ky e a segunda frequência de cruzamento kx originadas dos dois sinais de mixagem descendentes codificados em forma de onda 208a-b recebidos no primeiro estágio de recepção 212 (mostrado na Figura 2).
Petição 870170021813, de 03/04/2017, pág. 24/56
18/32 [0074] O codificador compreende ainda um estágio de reconstrução de alta frequência (HFR) 314. O estágio HFR é configurado para estender cada um dos dois sinais de mixagem descendente, combinados 302a-b a partir do estágio de combinação para uma faixa de frequências acima da segunda frequência de cruzamento kx mediante realização de reconstrução de alta frequência. A reconstrução de alta frequência realizada pode de acordo com algumas modalidades compreender a realização de replicação de banda espectral, SBR. A reconstrução de alta frequência pode ser feita mediante uso de parâmetros de reconstrução de alta frequência que podem ser recebidos pelo estágio HFR 314 em qualquer forma adequada.
[0075] A saída a partir do estágio de reconstrução de alta frequência 314 são dois sinais 304a-b compreendendo os sinais de mixagem descendente 208a-b com a extensão HRF 316, 318 aplicada. Conforme descrito acima, o estágio HFR 314 está realizando reconstrução de alta frequência com base nas frequências presentes no sinal de entrada 210a-e a partir do segundo estágio de recepção 214 (mostrado na Figura 2) combinado com os dois sinais de mixagem descendente 208a-b. De certo modo simplificada, a faixa HFR 316, 318 compreende partes dos coeficientes espectrais a partir dos sinais de mixagem descendente 310, 312 que foram copiadas para a faixa HFR 316, 318. Consequentemente, partes dos cinco sinais codificados em forma de onda 210a-e aparecerão na faixa HFR 316, 318 da saída 304 a partir do estágio HFR 314.
[0076] Deve ser observado que a mixagem descendente, no estágio de mixagem descendente 308, e a combinação no primeiro estágio de combinação 320, 322, antes do estágio de reconstrução de alta frequência 314, pode ser feita no domínio de tempo, isto é, após cada sinal ter se transformado para o domínio de tempo mediante aplicação de uma transformada discreta de cosseno modificada inversa (MDCT)
Petição 870170021813, de 03/04/2017, pág. 25/56
19/32
216 (mostrada na Figura 2). Contudo, dado que os sinais codificados em forma de onda 210a-e e os sinais mixados descendentemente codificados em forma de onda 208a-b podem ser codificados por um codificador de forma de onda utilizando transformadas em janelas de sobreposição com janelamento independente, os sinais 210a-e e 208a-b podem não ser combinados de modo contínuo em um domínio de tempo. Assim, um cenário mais bem controlado é obtido se pelo menos a combinação no primeiro estágio de combinação 320, 322 for realizada no domínio QMF.
[0077] A Figura 4 ilustra a terceira e final parte conceptual 400 do codificador 100. A saída 304 a partir do estágio HFR 314 constitui a entrada para um estágio de upmixação 402. O estágio de upmixação 402 cria uma saída de cinco sinais 404a-e mediante realização de upmixação paramétrica nos sinais estendidos de frequência 304a-b. Cada um dos cinco sinais de upmixação 404a-e corresponde a um dos cinco canais codificados no som ambiente 5.1 codificado para frequências acima da primeira frequência de cruzamento ky. De acordo com um procedimento de upmixação paramétrica exemplar, o estágio de upmixação 402 primeiramente recebe os parâmetros de mixagem paramétrica. O estágio de upmixação 402 gera adicionalmente versões correlacionadas inversamente dos dois sinais de mixagem descendente, combinados estendidos em frequência 304a-b. O estágio de upmixação 402 adicionalmente submete os dois sinais de mixagem descendente, combinados, estendidos em frequência 304a-b e as versões correlacionadas inversamente dos dois sinais de mixagem descendente, combinados estendidos em frequência 304a-b a uma operação de matriz, em que os parâmetros da operação de matriz são dados pelos parâmetros de upmix. Alternativamente, qualquer outro procedimento de upmixação paramétrica conhecido na técnica pode ser empregado. Procedimentos aplicáveis de upmixação paramétrica são
Petição 870170021813, de 03/04/2017, pág. 26/56
20/32 descritos, por exemplo, em MPEG Surround- The ISO/MPEG Standard for Efficient and Compatible Multichannel Audio Coding (Herre et al., Journal of the Audio Engineering Society, Vol. 56, N° 11, Novembro de 2008).
[0078] A saída 404a-e a partir do estágio de upmixação 402 assim não compreende frequências abaixo da primeira frequência de cruzamento ky. Os coeficientes espectrais restantes correspondendo às frequências até a primeira frequência de cruzamento ky existe nos cinco sinais codificados em forma da onde 210a-e que foram retardados por intermédio de um estágio de retardo 412 para equiparar a temporização dos sinais de upmixação 404.
[0079] O codificador 100 compreende adicionalmente um segundo estágio de combinação 416, 418. O segundo estágio de combinação 416, 418 é configurado para combinar os cinco sinais de upmixação 404a-e com os cinco sinais codificados em forma de onda 210a-e que foram recebidos pelo segundo estágio de recepção 214 (mostrado na Figura 2).
[0080] Pode-se observar que qualquer sinal Lfe presente pode ser adicionado como um sinal separado ao sinal combinado resultante 422. Cada um dos sinais 422 é então transformado para o domínio de tempo mediante aplicação de uma transformada QMF inversa 420. A saída da transformada QMF inversa 414 é assim o sinal de áudio de canal 5.1 completamente decodificado.
[0081] A Figura 6 ilustra um sistema de decodificação 100' sendo uma modificação do sistema de decodificação 100 da Figura 1. O sistema de decodificação 100' tem partes conceptuais 200', 300' e 400' correspondendo às partes conceptuais 100, 200 e 300 da Figura 1. A diferença entre o sistema de decodificação 100' da Figura 6 e o sistema de decodificação da Figura 1 é que existe um terceiro estágio de recepção 616 na parte conceptual 200' e um estágio de intercalação
Petição 870170021813, de 03/04/2017, pág. 27/56
21/32
714 na terceira parte conceptual 400'.
[0082] O terceiro estágio de recepção 616 é configurado para receber um sinal codificado em forma de onda adicional. O sinal codificado em forma de onda adicional compreende coeficientes espectrais correspondendo a um subconjunto das frequências acima da primeira frequência de cruzamento. O sinal codificado em forma de onda adicional pode ser transformado para o domínio de tempo mediante aplicação de um MDCT inverso 216. Ele pode ser então transformado de volta para o domínio de frequência mediante aplicação de uma transformada QMF 218.
[0083] Deve ser entendido que o sinal codificado em forma de onda adicional pode ser recebido como um sinal separado. Contudo, o sinal codificado em forma de onda adicional também pode formar parte de um ou mais dos cinco sinais codificados em forma de onda 210a-e. Em outras palavras, o sinal codificado em forma de onda adicional pode ser codificado conjuntamente com um ou mais dos cinco sinais codificados em forma de onda 201a-e, por exemplo, utilizando a mesma transformada MCDT. Nesse caso, o terceiro estágio de recepção 616 corresponde ao segundo estágio de recepção, isto é, o sinal codificado em forma de onda adicional é recebido conjuntamente com os cinco sinais codificados em forma de onda 210a-e por intermédio do segundo estágio de recepção 214.
[0084] A Figura 7 ilustra a terceira parte conceptual 300' do decodificador 100' da Figura 6 em mais detalhe. O sinal codificado em forma de onda adicional 710 é introduzido na terceira parte conceptual 400' em adição aos sinais de mixagem descendente estendidos de alta frequência 304a-b e os cinco sinais codificados em forma de onda 210a-e. No exemplo ilustrado, o sinal codificado em forma de onda adicional 710 corresponde ao terceiro canal dos cinco canais. O sinal codificado em forma de onda adicional 710 compreende ainda coeficiPetição 870170021813, de 03/04/2017, pág. 28/56
22/32 entes espectrais correspondendo a um intervalo de frequência começando a partir da primeira frequência de cruzamento ky. Contudo, a forma do subconjunto da faixa de frequências acima da primeira frequência de cruzamento coberta pelo sinal codificado em forma de onda adicional 710 pode evidentemente variar em diferentes modalidades. Deve-se observar também que vários sinais codificados em forma de onda 710a-e podem ser recebidos, em que os diferentes sinais codificados em forma de onda podem corresponder a diferentes canais de saída. O subconjunto da faixa de frequências coberta pela pluralidade de sinais codificados em forma de onda adicionais 710a-e pode variar entre diferentes sinais da pluralidade de sinais codificados em forma de onda, adicionais 710a-e.
[0085] O sinal codificado em forma de onda adicional 710 pode ser retardado por intermédio de um estágio de retardamento 712 para combinar com a temporização dos sinais de upmixação 404 sendo emitidos a partir do estágio de upmixação 402. Os sinais de upmixação 404 e o sinal codificado em forma de onda adicional 710 são então introduzidos em um estágio de intercalação 714. O estágio de intercalação 714 intercala, isto é, combina os sinais de upmixação 404 com o sinal codificado em forma de onda adicional 710 para gerar um sinal intercalado 704. No presente exemplo, o estágio de intercalação 714 assim intercala o terceiro sinal de upmixação 404c com o sinal codificado em forma de onda adicional 710. A intercalação pode ser realizada mediante adição em conjunto dos dois sinais. Contudo, tipicamente, a intercalação é realizada mediante substituição dos sinais de upmixação 404 com o sinal codificado em forma de onda adicional 710 na faixa de frequências e na faixa de tempo onde os sinais se sobrepõem.
[0086] O sinal intercalado 704 é então introduzido no segundo estágio de combinação 416, 418 onde ele é combinado com os sinais codificados em forma de onda 201a-e para gerar um sinal de saída
Petição 870170021813, de 03/04/2017, pág. 29/56
23/32
722 da mesma maneira como descrito com referência à Figura 4. Deve-se observar que a ordem do estágio de intercalação 714 e do segundo estágio de combinação 416, 418 pode ser invertida de modo que a combinação seja realizada antes da intercalação.
[0087] Além disso, na situação onde o sinal codificado em forma de onda adicional 710 forma parte de um ou mais dos cinco sinais codificados em forma de onda 210a-e, o segundo estágio de combinação 416, 418 e o estágio de intercalação 714 podem ser combinados em um único estágio. Especificamente, tal estágio combinado utilizaria o conteúdo espectral dos cinco sinais codificados em forma de onda 210a-e para frequências até a primeira frequência de cruzamento ky. Para as frequências acima da primeira frequência de cruzamento, o estágio combinado utilizaria os sinais de upmixação 404, intercalados com o sinal codificado em forma de onda adicional 710.
[0088] O estágio de intercalação 714 pode operar sob o controle de um sinal de controle. Com esse propósito o decodificador 100 sem linha pode receber, por exemplo, por intermédio do terceiro estágio de recepção 616, um sinal de controle que indica como intercalar o sinal codificado em forma de onda adicional com um dos M sinais de upmixação. Por exemplo, o sinal de controle pode indicar a faixa de frequências e a faixa de tempo para a qual o sinal codificado em forma de onda adicional 710 deve ser intercalado com um dos sinais de upmixação 404. Por exemplo, a faixa de frequências e a faixa de tempo podem ser expressas em termos de blocos de tempo/frequência para os quais a intercalação deve ser feita. Os blocos de tempo/frequência podem ser blocos de tempo/frequência com relação à grade de tempo/frequência do domínio QMF onde ocorre a intercalação.
[0089] O sinal de controle pode usar vetores, tais como vetores binários, para indicar os blocos de tempo/frequência para os quais dePetição 870170021813, de 03/04/2017, pág. 30/56
24/32 ve ser feita a intercalação. Especificamente, pode haver um primeiro vetor relacionado a uma direção de frequência, indicando as frequências para as quais a intercalação deve ser realizada. A indicação pode, por exemplo, ser feita mediante indicação de uma lógica para o intervalo de frequência correspondente no primeiro vetor. Também pode haver um segundo vetor relacionado a uma direção de tempo, indicando os intervalos de tempo para os quais a intercalação deve ser realizada. A indicação pode, por exemplo, ser feita mediante indicação de uma lógica para o intervalo de tempo correspondente no segundo vetor. Com essa finalidade, um quadro de tempo é dividido tipicamente em uma pluralidade de fatias de tempo, de tal modo que a indicação de tempo pode ser feita em uma base de subquadro. Mediante interseção do primeiro e do segundo vetor, uma matriz de tempo/frequência pode ser construído. Por exemplo, a matriz de tempo/frequência pode ser uma matriz binária que compreende uma lógica para cada bloco de pixels adjacentes de tempo/frequência para o qual o primeiro e o segundo vetor indicam uma lógica. O estágio de intercalação 714 pode então utilizar a matriz de tempo/frequência quando da realização da intercalação, por exemplo, de tal modo que um ou mais dos sinais de upmixaçãos 704 são substituídos pelo sinal codificado de forma de onda adicional 710 para os blocos de tempo/frequência sendo indicados; tal como por intermédio de uma lógica, na matriz de tempo/frequência.
[0090] Observa-se que os vetores podem usar outro esquema exceto um esquema binário para indicar os blocos de pixel adjacentes de tempo/frequência para os quais a intercalação deve ser realizada. Por exemplo, os vetores poderiam indicar por intermédio de um primeiro valor tal como zero que nenhuma intercalação deve ser feita, e por intermédio de um segundo valor de que a intercalação deve ser feita com relação a um determinado canal identificado pelo segundo valor.
Petição 870170021813, de 03/04/2017, pág. 31/56
25/32 [0091] A Figura 5 mostra como um exemplo um diagrama em blocos, generalizado de um sistema de codificação 500 para um sistema de processamento de áudio de múltiplos canais para codificar M canais de acordo com uma modalidade.
[0092] Na modalidade exemplar descrita na Figura 5, a codificação de um som ambiente 5.1 é descrita. Assim, no exemplo ilustrado, M é ajustado para 5. Pode ser observado que o sinal de efeito de baixa frequência não é mencionado na modalidade descrita ou nos desenhos. Isso não significa que quaisquer efeitos de baixa frequência sejam negligenciados. Os efeitos de baixa frequência (Lfe) são adicionais ao fluxo de bits 552 de qualquer forma adequada conhecida daqueles versados na técnica. Também se pode observar que o codificador descrito é igualmente bem adequado para codificar outros tipos de som ambiente tal como som ambiente 7.1 ou 9.1. No codificador 500, cinco sinais 502, 504 são recebidos em um estágio de recepção (não mostrado). O codificador 500 compreende um primeiro estágio de codificação de forma de onda 506 configurado para receber os cinco sinais 502, 504 a partir do estágio de recepção e gerar cinco sinais codificados em forma de onda 518 mediante codificação em forma de onda individualmente dos cinco sinais 502, 504. O estágio de codificação em forma de onda 506 pode, por exemplo, submeter cada um dos cinco sinais recebidos 502, 504 a uma transformada MDCT. Como discutido com relação ao decodificador, o codificador pode escolher codificar cada um dos cinco sinais recebidos 502, 504 utilizando uma transformada MDCT com janelamento independente. Isso pode permitir uma qualidade de codificação aperfeiçoada e assim uma qualidade aperfeiçoada do sinal decodificado.
[0093] Os cinco sinais codificados em forma de onda 518 são codificados em forma de onda para uma faixa de frequências correspondendo às frequências até uma primeira frequência de cruzamento. AsPetição 870170021813, de 03/04/2017, pág. 32/56
26/32 sim, os cinco sinais codificados em forma de onda 518 compreendem coeficientes espectrais correspondendo às frequências até a primeira frequência de cruzamento. Isso pode ser obtido mediante sujeição de cada um dos cinco sinais codificados em forma de onda 518 para um filtro passa-baixa. Os cinco sinais codificados em formas de onda 518 são então quantizados 520 de acordo com um modelo psicoacústico. O modelo psicoacústico é configurado de forma tão exata quanto possível, considerando a taxa de bits disponível no sistema de processamento de áudio de múltiplos canais. A reprodução dos sinais codificados conforme percebida por um ouvinte quando decodificados em um lado de decodificador do sistema.
[0094] Conforme discutido acima, o codificador 500 realiza codificação híbrida compreendendo codificação discreta de múltiplos canais e codificação paramétrica. A codificação discreta de múltiplos canais é realizada por intermédio do estado de codificação em forma de onda 506 em cada um dos sinais de entrada 502, 504 para frequências até a primeira frequência de cruzamento como descrito acima. A codificação paramétrica é realizada para poder, em um lado de decodificador, reconstruir os cinco sinais de entrada 502, 504 a partir de N sinais de mixagem descendente para frequências acima da primeira frequência de cruzamento. No exemplo ilustrado na Figura 5, N é ajustado para 2. A mixagem descendente dos cinco sinais de entrada 502, 504 é realizada em um estágio de mixagem descendente 534. O estágio de mixagem descendente 534 opera vantajosamente em um domínio QMF. Portanto, antes de serem introduzidos no estágio de mixagem descendente 534, os cinco sinais 502, 504 são transformados para um domínio QMF por intermédio de um estágio de análise QMF 526. O estágio de mixagem descendente realiza uma operação de mixagem descendente linear nos cinco sinais 502, 504 e produz dois sinais de mixagem descendente 544, 546.
Petição 870170021813, de 03/04/2017, pág. 33/56
27/32 [0095] Esses dois sinais de mixagem descendente 544, 546 são recebidos por um segundo estágio de codificação de forma de onda 508 após terem sido transformados de volta para o domínio de tempo ao serem submetidos a uma transformada QMF inversa 554. O segundo estágio de codificação de forma de onda 508 está gerando dois sinais de mixagem descendente, codificados em forma de onda mediante codificação em forma de onda dos dois sinais de mixagem descendente 544, 546 para uma faixa de frequências correspondendo às frequências entre a primeira e a segunda frequência de cruzamento. O estágio de codificação de forma de onda 508 pode, por exemplo, submeter cada um dos dois sinais de mixagem descendente a uma transformada MDCT. Os dois sinais de mixagem descendente, codificados em forma de onda compreendem assim coeficientes espectrais correspondendo às frequências entre a primeira frequência de cruzamento e a segunda frequência de cruzamento. Os dois sinais de mixagem descendente, codificados em forma de onda são então quantizados 522 de acordo com o modelo psicoacústico.
[0096] Para poder reconstruir as frequências acima da segunda frequência de cruzamento em um lado de decodificador, parâmetros de reconstrução de alta frequência HFR 538 são extraídos a partir de dois sinais de mixagem descendente 544, 546. Esses parâmetros são extraídos em um estágio de codificação HFR 532.
[0097] Para poder reconstruir os cinco sinais a partir dos dois sinais de mixagem descendente 544, 546 em um lado de decodificador, os cinco sinais de entrada 502, 504 são recebidos pelo estágio de codificação paramétrica 530. Os cinco sinais 502, 504 são submetidos à codificação paramétrica para a faixa de frequências correspondendo às frequências acima da primeira frequência de cruzamento. O estágio de codificação paramétrica 530 é então configurado para extrair parâmetros de upmix 536 que possibilitam a upmixação dos dois sinais de
Petição 870170021813, de 03/04/2017, pág. 34/56
28/32 mixagem descendente 544, 546 em cinco sinais reconstruídos correspondendo aos cinco sinais de entrada 502, 504 (isto é, os cinco canais codificados no som ambiente 5.1) para a faixa de frequências acima da primeira frequência de cruzamento. Pode se observar que os parâmetros de upmix 536 são extraídos apenas para as frequências acima da primeira frequência de cruzamento. Isso pode reduzir a complexidade do estágio de codificação paramétrica 530, e a taxa de bits dos dados paramétricos correspondentes.
[0098] Pode-se observar que a mixagem descendente 534 pode ser realizada no domínio de tempo. Nesse caso, o estágio de análise QMF 526 deve ser posicionado a jusante do estágio de mixagem descendente 534 antes do estágio de codificação HFR 532 uma vez que o estágio de codificação HRF 532 opera tipicamente no domínio QMF. Nesse caso, o estágio QMF inverso 554 pode ser omitido.
[0099] O codificador 500 compreende ainda um estágio de geração de fluxo de bits, isto é, multiplexador de fluxo de bits, 524. De acordo com a modalidade exemplar do codificador 500, o estágio de geração de fluxo de bits é configurado para receber os cinco sinais codificados e quantizados 548, os dois sinais de parâmetro 536, 538 e os dois sinais de mixagem descendente, codificados e quantizados 550. Esses são convertidos em um fluxo de bits 552 por intermédio do estágio de geração de fluxo de bits 524, para serem distribuídos no sistema de áudio de múltiplos canais.
[00100] No sistema de áudio de múltiplos canais descrito, normalmente existe uma taxa de bits máxima disponível, por exemplo, quando realizando fluxo contínuo de áudio através da Internet. Como as características de cada quadro de tempo dos sinais de entrada 502, 504 são diferentes, a mesma alocação exata dos bits entre os cinco sinais codificados em forma de onda 548 e os dois sinais codificados em forma de onda de mixagem descendente 550 pode não ser usada.
Petição 870170021813, de 03/04/2017, pág. 35/56
29/32
Adicionalmente, cada sinal individual 548 e 550 pode precisar de mais ou menos bits alocados de tal modo que os sinais possam ser reconstruídos de acordo com o modelo psicoacústico. De acordo com uma modalidade exemplar, o primeiro e o segundo estágio de codificação de forma de onda 506, 508 compartilham um reservatório comum de bits. Os bits disponíveis por quadro codificado são primeiramente distribuídos entre o primeiro e o segundo estágio de codificação em forma de onda 506, 508 dependendo das características dos sinais a serem codificados e do modelo psicoacústico presente. Os bits são então distribuídos entre os sinais individuais 548, 550 conforme descrito acima. O número de bits usados para os parâmetros de reconstrução de alta frequência 538 e os parâmetros de upmix 536 são evidentemente considerados ao se distribuir os bits disponíveis. Toma-se cuidado para ajustar o modelo psicoacústico para o primeiro e o segundo estágio de codificação em forma de onda 506, 508 para uma transição suave em termos perceptuais em torno da primeira frequência de cruzamento com relação ao número de bits alocados no quadro de tempo específico.
[00101] A Figura 8 ilustra uma modalidade alternativa de um sistema de codificação 800. A diferença entre o sistema de codificação 800 da Figura 8 e o sistema de codificação 500 da Figura 5 é que o codificador 800 é arranjado para gerar um sinal codificado em forma de onda adicional mediante codificação em forma de onda de um ou mais dos sinais de entrada 502, 504 para uma faixa de frequências correspondendo a um subconjunto da faixa de frequências acima da primeira frequência de cruzamento.
[00102] Com esse propósito, o codificador 800 compreende um estágio de detecção de intercalação 802. O estágio de detecção de intercalação 802 é configurado para identificar partes dos sinais de entrada
502, 504 que não são bem reconstruídos pela reconstrução paramétriPetição 870170021813, de 03/04/2017, pág. 36/56
30/32 ca conforme codificados pelo estágio de codificação paramétrica 530 e o estágio de codificação de reconstrução de alta frequência 532. Por exemplo, o estágio de detecção de intercalação 802 pode comparar os sinais de entrada 502, 504 com uma reconstrução paramétrica do sinal de entrada 502, 504 conforme definido pelo estágio de codificação paramétrica 530 e pelo estágio de codificação de reconstrução de alta frequência 532. Com base na comparação, o estágio de detecção de intercalação 802 pode identificar um subconjunto 804 da faixa de frequências acima da primeira frequência de cruzamento que deve ser codificada em forma de onda. O estágio de detecção de intercalação 802 também pode identificar a faixa de tempo durante a qual o subconjunto identificado 804 da faixa de frequência acima da primeira frequência de cruzamento deve ser codificada na forma de onda. A frequência identificada e os subconjuntos de tempo 804, 806 podem ser introduzidos no primeiro estágio de codificação de forma de onda 506. Com base na frequência recebida e nos subconjuntos de tempo 804 e 806, o primeiro estágio de codificação de forma de onda 506 gera um sinal codificado em forma de onda adicional 808 mediante codificação em formas de onda de um ou mais dos sinais de entrada 502, 504 para as faixas de frequência e de tempo identificadas pelos subconjuntos 804, 806. O sinal codificado em forma de onda adicional 808 pode então ser codificado e quantizado por intermédio do estágio 520 e adicionado ao fluxo de bits 846.
[00103] O estágio de detecção de intercalação 802 pode compreender ainda um estágio de geração de sinal de controle. O estágio de geração de sinal de controle é configurado para gerar um sinal de controle 810 indicando como intercalar o sinal codificado em forma de onda adicional com uma reconstrução paramétrica de um dos sinais de entrada 502, 504 em um decodificador. Por exemplo, o sinal de controle pode indicar uma faixa de frequências e uma faixa de tempo para as
Petição 870170021813, de 03/04/2017, pág. 37/56
31/32 quais o sinal codificado em forma de onda adicional deve ser intercalado com uma reconstrução paramétrica conforme descrito com referência à Figura 7. O sinal de controle pode ser adicionado ao fluxo de bits 846.
Equivalentes, extensões, alternativas e diversos [00104] Modalidades adicionais da presente descrição se tornarão evidentes para aqueles versados na técnica após estudo da descrição acima. Embora a presente descrição e desenhos revelem modalidades e exemplos, a descrição não é limitada a esses exemplos específicos. Diversas modificações e variações podem ser feitas sem se afastar do escopo da presente descrição, o qual é definido pelas reivindicações anexas. Quaisquer sinais de referência aparecendo nas reivindicações não devem ser entendidos como limitando o seu escopo.
[00105] Adicionalmente, variações para as modalidades descritas podem ser entendidas e realizadas por aqueles versados na técnica na prática da descrição, a partir de um estudo dos desenhos, da descrição e das reivindicações anexas. Nas reivindicações, a palavra compreendendo não exclui outros elementos ou etapas, e o artigo indefinido um ou uma não exclui a pluralidade. O simples fato de que determinadas medidas são citadas em reivindicações dependentes mutuamente diferentes não indica que uma combinação dessas medidas não possa ser usada vantajosamente.
[00106] Os sistemas e métodos descritos acima podem ser implementados como software, firmware, hardware ou uma combinação dos mesmos. Em uma implementação de hardware, a divisão das tarefas entre unidades funcionais citadas na descrição acima não necessariamente corresponde à divisão em unidades físicas; ao contrário, um componente físico pode ter múltiplas funcionalidades, e uma tarefa pode ser realizada por vários componentes físicos em cooperação. Alguns componentes ou todos os componentes podem ser implemenPetição 870170021813, de 03/04/2017, pág. 38/56
32/32 tados como software executado por um processador de sinal digital ou microprocessador, ou podem ser implementados como hardware ou como um circuito integrado de aplicação específica. Tal software pode ser distribuído em mídia legível por computador, a qual pode compreende mídia de armazenamento de computador (ou mídia não transitória) e mídia de comunicação (ou mídia transitória). Com bem sabido por aqueles versados na técnica, o termo mídia de armazenamento de computador inclui mídia volátil, e não volátil, removível, e não removível implementada em qualquer método ou tecnologia para armazenamento de informação tal como instruções legíveis por computador, estruturas de dados, módulos de programa ou outros dados. Mídia de armazenamento de computador inclui, mas não é limitada a RAM, ROM, EEPROM, memória flash ou outra tecnologia de memória, CDROM, discos digitais versáteis (DVD), ou outro meio de armazenamento disco ótico, cassetes magnéticos, fita magnética, meio de armazenamento de disco magnético ou outros dispositivos de armazenamento magnético, ou qualquer outro meio que possa ser usado para armazenar a informação desejada e que possa ser acessada por um computador. Adicionalmente, é bem sabido por aqueles versados na técnica que mídia de comunicação incorpora tipicamente instruções legíveis por computador, estruturas de dados, módulos de programa ou outros dados em um sinal de dados modulado tal como uma onda portadora ou outro mecanismo de transporte e inclui qualquer mídia de fornecimento de informação.

Claims (16)

  1. REIVINDICAÇÕES
    1. Método para decodificar um fluxo de bits de áudio codificado em um sistema de processamento de áudio, o método caracterizado pelo fato de que compreende:
    extrair a partir do fluxo de bits de áudio codificado um primeiro sinal codificado em forma de onda compreendendo coeficientes espectrais correspondentes a frequências até uma primeira frequência de cruzamento;
    realizar decodificação paramétrica em uma segunda frequência de cruzamento para gerar um sinal reconstruído, em que a segunda frequência de cruzamento está acima da primeira frequência de cruzamento, e a decodificação paramétrica utiliza parâmetros de reconstrução derivados de um fluxo de bits de áudio codificado para gerar o sinal reconstruído;
    extrair a partir de um segundo fluxo de bits de áudio codificado um segundo sinal codificado em forma de onda compreendendo coeficientes espectrais correspondendo a um subconjunto de frequências acima da primeira frequência de cruzamento;
    intercalar o segundo sinal codificado em forma de onda com o sinal reconstruído para produzir um sinal intercalado; e combinar o sinal intercalado com o primeiro sinal codificado em forma de onda.
  2. 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a primeira frequência de cruzamento depende de uma taxa transmissão de bit do sistema de processamento de áudio.
  3. 3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a intercalação compreende (i) adicionar o segundo sinal codificado em forma de onda com o sinal reconstruído, (ii) combinar o segundo sinal codificado em forma de com o sinal reconstruído, ou (iii) substituir o sinal reconstruído com o segundo sinal codificado
    Petição 870170021813, de 03/04/2017, pág. 40/56
    2/4 em forma de onda.
  4. 4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que (i) a combinação do sinal intercalado com o primeiro sinal codificado em forma de onda é realizada em um domínio de frequência, ou (ii) a realização da decodificação paramétrica na segunda frequência de cruzamento para gerar o sinal reconstruído é realizado em um domínio de frequência.
  5. 5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que realizar a decodificação paramétrica compreende (i) upmixação paramétrica utilizando parâmetros de upmix, ou (ii) reconstrução de alta frequência utilizando parâmetros de reconstrução de alta frequência.
  6. 6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a realização da decodificação paramétrica compreende realizar replicação de banda espectral, SBR.
  7. 7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda receber um sinal de controle utilizado durante a intercalação para produzir o sinal intercalado.
  8. 8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que o sinal de controle indica como intercalar o segundo sinal codificado em forma de onda com o sinal reconstruído especificando uma faixa de frequência ou uma faixa de tempo para a intercalação.
  9. 9. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que o primeiro valor do sinal de controle indica que a intercalação é realizada para uma respectiva região de frequência.
  10. 10. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a intercalação é realizada antes da combinação.
  11. 11. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o sistema de processamento de áudio é um decodifi-
    Petição 870170021813, de 03/04/2017, pág. 41/56
    3/4 cador híbrido que realiza decodificação em forma de onda e decodificação paramétrica.
  12. 12. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o primeiro sinal codificado em forma de onda e o segundo sinal em forma de onda compartilham um reservatório comum de bit utilizando um modelo psicoacústico.
  13. 13. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a intercalação e a combinação são combinadas em um único estágio ou operação.
  14. 14. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o primeiro sinal codificado em forma de onda e o segundo sinal codificado em forma de onda são sinais representando uma forma de onda de um sinal de áudio no domínio de frequência.
  15. 15. Decodificador de áudio para decodificar um fluxo de bits de áudio codificado, o decodificador de áudio caracterizado pelo fato de que compreende:
    um demultiplexador para extrair a partir do fluxo de bits de áudio codificado um primeiro sinal codificado em forma de onda compreendendo coeficientes espectrais correspondendo a frequências até um primeira frequência de cruzamento;
    um decodificador paramétrico que opera em uma segunda frequência de cruzamento para gerar um sinal reconstruído, em que a segunda frequência de cruzamento está acima da primeira frequência de cruzamento e a decodificação paramétrica utiliza parâmetros de reconstrução derivados do fluxo de bits de áudio codificado para gerar o sinal reconstruído;
    um demultiplexador para extrair a partir do fluxo de bits de áudio codificado um segundo sinal codificado em forma de onda compreendendo coeficientes espectrais correspondentes a um subconjunto de frequências acima da primeira frequência de cruzamento;
    Petição 870170021813, de 03/04/2017, pág. 42/56
    4/4 um intercalador para intercalar o segundo sinal codificado em forma de onda com o sinal reconstruído para produzir um sinal intercalado; e um sintetizador para combinar o sinal intercalado com o primeiro sinal codificado em forma de onda.
  16. 16. Meio legível por computador não transitório caracterizado pelo fato de que compreende instruções que quando executas por um processador realizam o método como definido na reivindicação
    1.
BR122017006819-9A 2013-04-05 2014-04-04 Método para decodificar um período de tempo de um fluxo de bits de áudio codificado em um sistema de processamento de áudio, decodificador de áudio para decodificar um fluxo de bits de áudio codificado e meio legível por computador não transitório BR122017006819B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201361808680P 2013-04-05 2013-04-05
US61/808,680 2013-04-05
PCT/EP2014/056852 WO2014161992A1 (en) 2013-04-05 2014-04-04 Audio encoder and decoder
BR112015019711-6A BR112015019711B1 (pt) 2013-04-05 2014-04-04 Método de decodificação em um sistema de processamento de áudio de múltiplos canais, decodificador para um sistema de processamento de áudio de múltiplos canais, método de codificação em um sistema de processamento de áudio de múltiplos canais e codificador para um sistema de processamento de áudio de múltiplos canais

Publications (2)

Publication Number Publication Date
BR122017006819A2 true BR122017006819A2 (pt) 2019-09-03
BR122017006819B1 BR122017006819B1 (pt) 2022-07-26

Family

ID=50439393

Family Applications (7)

Application Number Title Priority Date Filing Date
BR112015019711-6A BR112015019711B1 (pt) 2013-04-05 2014-04-04 Método de decodificação em um sistema de processamento de áudio de múltiplos canais, decodificador para um sistema de processamento de áudio de múltiplos canais, método de codificação em um sistema de processamento de áudio de múltiplos canais e codificador para um sistema de processamento de áudio de múltiplos canais
BR122022004787-4A BR122022004787B1 (pt) 2013-04-05 2014-04-04 Método, meio legível por computador não transitório e aparelho para decodificação em um sistema de processamento de áudio multicanal
BR122020017065-4A BR122020017065B1 (pt) 2013-04-05 2014-04-04 Método de decodificação em um sistema de processamento de áudio de múltiplos canais e decodificador para um sistema de processamento de áudio de múltiplos canais
BR122021004537-2A BR122021004537B1 (pt) 2013-04-05 2014-04-04 Método de codificação para um sistema de processamento de áudio de múltiplos canais para codificar m canais, meio legível por computador e codificador para um sistema de processamento de áudio de múltiplos canais para codificar m canais
BR122022004784A BR122022004784B8 (pt) 2013-04-05 2014-04-04 Método de decodificação em um sistema de processamento de áudio de múltiplos canais e decodificador para um sistema de processamento de áudio de múltiplos canais
BR122022004786-6A BR122022004786B1 (pt) 2013-04-05 2014-04-04 Método e decodificador de áudio para decodificar um quadro de tempo de um fluxo de bits de áudio codificado em um sistema de processamento de áudio, e meio legível por computador não transitório
BR122017006819-9A BR122017006819B1 (pt) 2013-04-05 2014-04-04 Método para decodificar um período de tempo de um fluxo de bits de áudio codificado em um sistema de processamento de áudio, decodificador de áudio para decodificar um fluxo de bits de áudio codificado e meio legível por computador não transitório

Family Applications Before (6)

Application Number Title Priority Date Filing Date
BR112015019711-6A BR112015019711B1 (pt) 2013-04-05 2014-04-04 Método de decodificação em um sistema de processamento de áudio de múltiplos canais, decodificador para um sistema de processamento de áudio de múltiplos canais, método de codificação em um sistema de processamento de áudio de múltiplos canais e codificador para um sistema de processamento de áudio de múltiplos canais
BR122022004787-4A BR122022004787B1 (pt) 2013-04-05 2014-04-04 Método, meio legível por computador não transitório e aparelho para decodificação em um sistema de processamento de áudio multicanal
BR122020017065-4A BR122020017065B1 (pt) 2013-04-05 2014-04-04 Método de decodificação em um sistema de processamento de áudio de múltiplos canais e decodificador para um sistema de processamento de áudio de múltiplos canais
BR122021004537-2A BR122021004537B1 (pt) 2013-04-05 2014-04-04 Método de codificação para um sistema de processamento de áudio de múltiplos canais para codificar m canais, meio legível por computador e codificador para um sistema de processamento de áudio de múltiplos canais para codificar m canais
BR122022004784A BR122022004784B8 (pt) 2013-04-05 2014-04-04 Método de decodificação em um sistema de processamento de áudio de múltiplos canais e decodificador para um sistema de processamento de áudio de múltiplos canais
BR122022004786-6A BR122022004786B1 (pt) 2013-04-05 2014-04-04 Método e decodificador de áudio para decodificar um quadro de tempo de um fluxo de bits de áudio codificado em um sistema de processamento de áudio, e meio legível por computador não transitório

Country Status (21)

Country Link
US (6) US9489957B2 (pt)
EP (3) EP3171361B1 (pt)
JP (7) JP6031201B2 (pt)
KR (7) KR20240038819A (pt)
CN (2) CN109410966B (pt)
AU (1) AU2014247001B2 (pt)
BR (7) BR112015019711B1 (pt)
CA (1) CA2900743C (pt)
DK (1) DK2954519T3 (pt)
ES (2) ES2748939T3 (pt)
HK (1) HK1213080A1 (pt)
HU (1) HUE031660T2 (pt)
IL (1) IL240117A0 (pt)
MX (4) MX369023B (pt)
MY (3) MY185848A (pt)
PL (1) PL2954519T3 (pt)
RU (2) RU2641265C1 (pt)
SG (1) SG11201506139YA (pt)
TW (1) TWI546799B (pt)
UA (1) UA113117C2 (pt)
WO (1) WO2014161992A1 (pt)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
WO2015007774A1 (de) 2013-07-18 2015-01-22 Basf Se Vereinzelung einer polyarylenetherlösung
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
EP3067886A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
KR20240050483A (ko) 2015-06-17 2024-04-18 삼성전자주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
PL3405949T3 (pl) 2016-01-22 2020-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób szacowania międzykanałowej różnicy czasowej
US10146500B2 (en) * 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
US10354667B2 (en) 2017-03-22 2019-07-16 Immersion Networks, Inc. System and method for processing audio data
EP3588495A1 (en) 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5459B2 (pt) 1973-12-20 1979-01-05
IT1044736B (it) * 1975-04-23 1980-04-21 Cselt Centro Studi Lab Telecom Sistema numerico per la trasmissione dei canali di due fasci modulati a impulsi codificati alla velocita di un solo fascio
JP2000122679A (ja) * 1998-10-15 2000-04-28 Sony Corp 音声帯域拡張方法及び装置、音声合成方法及び装置
JP3677185B2 (ja) * 1999-11-29 2005-07-27 株式会社東芝 符号分割多重伝送方式と送信装置及び受信装置
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US20030220800A1 (en) 2002-05-21 2003-11-27 Budnikov Dmitry N. Coding multichannel audio signals
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
WO2005098824A1 (en) 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
DE602005011439D1 (de) 2004-06-21 2009-01-15 Koninkl Philips Electronics Nv Verfahren und vorrichtung zum kodieren und dekodieren von mehrkanaltonsignalen
US7756713B2 (en) * 2004-07-02 2010-07-13 Panasonic Corporation Audio signal decoding device which decodes a downmix channel signal and audio signal encoding device which encodes audio channel signals together with spatial audio information
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
CN101151660B (zh) 2005-03-30 2011-10-19 皇家飞利浦电子股份有限公司 多通道音频编码器、解码器以及相应方法
JP2006323037A (ja) * 2005-05-18 2006-11-30 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置
CN101253556B (zh) * 2005-09-02 2011-06-22 松下电器产业株式会社 能量整形装置以及能量整形方法
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
WO2007046659A1 (en) * 2005-10-20 2007-04-26 Lg Electronics Inc. Method for encoding and decoding multi-channel audio signal and apparatus thereof
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
WO2008031458A1 (en) * 2006-09-13 2008-03-20 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements for a speech/audio sender and receiver
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
KR101405972B1 (ko) 2007-07-02 2014-06-12 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
RU2443075C2 (ru) 2007-10-09 2012-02-20 Конинклейке Филипс Электроникс Н.В. Способ и устройство для генерации бинаурального аудиосигнала
WO2009068087A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation Multichannel audio coding
AU2008339211B2 (en) 2007-12-18 2011-06-23 Lg Electronics Inc. A method and an apparatus for processing an audio signal
WO2009084916A1 (en) * 2008-01-01 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2260487B1 (en) * 2008-03-04 2019-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mixing of input data streams and generation of an output data stream therefrom
MX2011000370A (es) * 2008-07-11 2011-03-15 Fraunhofer Ges Forschung Un aparato y un metodo para decodificar una señal de audio codificada.
ES2592416T3 (es) * 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
TWI413109B (zh) * 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
WO2010097748A1 (en) 2009-02-27 2010-09-02 Koninklijke Philips Electronics N.V. Parametric stereo encoding and decoding
US20100223061A1 (en) 2009-02-27 2010-09-02 Nokia Corporation Method and Apparatus for Audio Coding
BR122019023924B1 (pt) * 2009-03-17 2021-06-01 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
BRPI1004215B1 (pt) 2009-04-08 2021-08-17 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para upmixagem de sinal de áudio downmix utilizando uma atenuação de valor de fase
KR20110018107A (ko) 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
ES2644520T3 (es) * 2009-09-29 2017-11-29 Dolby International Ab Decodificador de señal de audio MPEG-SAOC, método para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC y programa informático usando un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia
MX2012004648A (es) * 2009-10-20 2012-05-29 Fraunhofer Ges Forschung Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing.
US9026236B2 (en) * 2009-10-21 2015-05-05 Panasonic Intellectual Property Corporation Of America Audio signal processing apparatus, audio coding apparatus, and audio decoding apparatus
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
RU2683175C2 (ru) * 2010-04-09 2019-03-26 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
PL3779979T3 (pl) 2010-04-13 2024-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji
RU2573774C2 (ru) 2010-08-25 2016-01-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство для декодирования сигнала, содержащего переходные процессы, используя блок объединения и микшер
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
FR2973551A1 (fr) 2011-03-29 2012-10-05 France Telecom Allocation par sous-bandes de bits de quantification de parametres d'information spatiale pour un codage parametrique
EP2702589B1 (en) 2011-04-28 2017-04-05 Dolby International AB Efficient content classification and loudness estimation
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
US9166864B1 (en) * 2012-01-18 2015-10-20 Google Inc. Adaptive streaming for legacy media frameworks
KR20230020553A (ko) * 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830061A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device

Also Published As

Publication number Publication date
JP6377110B2 (ja) 2018-08-22
BR122022004786A8 (pt) 2022-09-06
PL2954519T3 (pl) 2017-06-30
US9728199B2 (en) 2017-08-08
BR122020017065B1 (pt) 2022-03-22
US11830510B2 (en) 2023-11-28
BR112015019711A2 (pt) 2017-07-18
US20240153517A1 (en) 2024-05-09
RU2602988C1 (ru) 2016-11-20
DK2954519T3 (en) 2017-03-20
EP3171361B1 (en) 2019-07-24
BR122021004537B1 (pt) 2022-03-22
BR122022004787A8 (pt) 2022-09-06
KR102142837B1 (ko) 2020-08-28
US9489957B2 (en) 2016-11-08
EP3171361A1 (en) 2017-05-24
JP6808781B2 (ja) 2021-01-06
CN105308680A (zh) 2016-02-03
MX2019012711A (es) 2019-12-16
BR122022004784B1 (pt) 2022-06-07
ES2748939T3 (es) 2020-03-18
BR122022004786A2 (pt) 2017-07-18
EP2954519B1 (en) 2017-02-01
KR20150113976A (ko) 2015-10-08
MY185848A (en) 2021-06-14
JP7033182B2 (ja) 2022-03-09
JP2018185536A (ja) 2018-11-22
MX2022004397A (es) 2022-06-16
CA2900743C (en) 2016-08-16
KR20200033988A (ko) 2020-03-30
UA113117C2 (xx) 2016-12-12
CN109410966B (zh) 2023-08-29
BR122022004787B1 (pt) 2022-10-18
US20160343383A1 (en) 2016-11-24
WO2014161992A1 (en) 2014-10-09
BR112015019711B1 (pt) 2022-04-26
BR122017006819B1 (pt) 2022-07-26
AU2014247001A1 (en) 2015-08-13
JP2016513287A (ja) 2016-05-12
MY183360A (en) 2021-02-18
JP2021047450A (ja) 2021-03-25
KR20220044609A (ko) 2022-04-08
KR20200096328A (ko) 2020-08-11
JP7413418B2 (ja) 2024-01-15
CA2900743A1 (en) 2014-10-09
KR101763129B1 (ko) 2017-07-31
US20170301362A1 (en) 2017-10-19
KR102094129B1 (ko) 2020-03-30
US20220059110A1 (en) 2022-02-24
CN109410966A (zh) 2019-03-01
AU2014247001B2 (en) 2015-08-27
KR20170087529A (ko) 2017-07-28
KR20210005315A (ko) 2021-01-13
HK1213080A1 (zh) 2016-06-24
RU2641265C1 (ru) 2018-01-16
ES2619117T3 (es) 2017-06-23
IL240117A0 (en) 2015-09-24
BR122022004786B1 (pt) 2022-10-04
JP2022068353A (ja) 2022-05-09
KR102201951B1 (ko) 2021-01-12
CN105308680B (zh) 2019-03-19
US11114107B2 (en) 2021-09-07
JP6537683B2 (ja) 2019-07-03
KR102380370B1 (ko) 2022-04-01
MX2015011145A (es) 2016-01-12
BR122022004784B8 (pt) 2022-09-13
TW201505024A (zh) 2015-02-01
JP2024038139A (ja) 2024-03-19
EP2954519A1 (en) 2015-12-16
US10438602B2 (en) 2019-10-08
KR20240038819A (ko) 2024-03-25
US20160012825A1 (en) 2016-01-14
JP2019191596A (ja) 2019-10-31
JP6031201B2 (ja) 2016-11-24
SG11201506139YA (en) 2015-09-29
TWI546799B (zh) 2016-08-21
MY196084A (en) 2023-03-14
BR122022004787A2 (pt) 2017-07-18
MX369023B (es) 2019-10-25
EP3627506A1 (en) 2020-03-25
JP2017078858A (ja) 2017-04-27
MX347936B (es) 2017-05-19
US20200098381A1 (en) 2020-03-26
HUE031660T2 (en) 2017-07-28

Similar Documents

Publication Publication Date Title
BR122017006819A2 (pt) codificador e decodificador de áudio
BR122017006701A2 (pt) codificador e decodificador de áudio estereofônico

Legal Events

Date Code Title Description
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 04/04/2014, OBSERVADAS AS CONDICOES LEGAIS

B25G Requested change of headquarter approved

Owner name: DOLBY INTERNATIONAL AB (IE)