BR122018077089B1 - decodificador de áudio - Google Patents

decodificador de áudio Download PDF

Info

Publication number
BR122018077089B1
BR122018077089B1 BR122018077089-9A BR122018077089A BR122018077089B1 BR 122018077089 B1 BR122018077089 B1 BR 122018077089B1 BR 122018077089 A BR122018077089 A BR 122018077089A BR 122018077089 B1 BR122018077089 B1 BR 122018077089B1
Authority
BR
Brazil
Prior art keywords
filter
information
audio
bit stream
block
Prior art date
Application number
BR122018077089-9A
Other languages
English (en)
Other versions
BR122018077089B8 (pt
Inventor
Mark Stuart Vinton
Alan Jeffrey Seefeldt
Original Assignee
Dolby Laboratories Licensing Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corporation filed Critical Dolby Laboratories Licensing Corporation
Publication of BR122018077089B1 publication Critical patent/BR122018077089B1/pt
Publication of BR122018077089B8 publication Critical patent/BR122018077089B8/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Abstract

A presente invenção refere-se a certos tipos de codificadores de codificação espacial paramétrica utilizam diferenças de amplitude intercanal, diferenças de tempo intercanal e coerência ou correlação intercanal para construir um modelo paramétrico de um campo de som multicanal que é utilizado por um decodificador para construir uma aproximação do campo de som original. Entretanto, tal modelo paramétrico não reconstrói o envelope temporal original dos canais do campo de som, o que foi visto como sendo extremamente importante para alguns sinais de áudio. A presente invenção proporciona a reformatação do envelope temporal de um ou mais dos canais decodificados em um sistema de codificação espacial para melhor corresponder um ou mais envelopes temporais originais.

Description

[001] Dividido do PI0514650-0 depositado em 15 de agosto de 2005.
Campo Técnico
[002] A presente invenção relaciona-se com codificadores de áudio baseados em bloco nos quais a informação de áudio quando decodificada, possui uma resolução de envelope temporal limitada pela taxa de blocos, incluindo codificadores, decodificadores e sistemas de áudio perceptuais e paramétricos, com os métodos correspondentes, com programas de computador para implementar tais métodos e com um fluxo de bits produzido por tais codificadores.
Antecedentes da Técnica
[003] Várias técnicas de codificação de áudio com taxa de bits reduzida são "baseadas em bloco" pelo fato de que a codificação inclui processamento que divide cada um dos um ou mais sinais de áudio sendo codificados em blocos de tempo e atualiza pelo menos algumas das informações associadas com o áudio codificado não mais frequentemente do que a taxa de blocos. Como resultado, a informação de áudio, quando decodificada, possui uma resolução de envelope temporal limitada pela taxa de blocos. Por consequência, a estrutura detalhada dos sinais de áudio decodificados com o passar do tempo não é preservada para períodos de tempo menores do que a granularidade da técnica de codificação (tipicamente, na faixa de 8 à 50 milésimos de segundo por bloco).
[004] Tais técnicas de codificação de áudio baseadas em bloco incluem não somente conhecidas técnicas de codificação perceptual bem estabelecidas como AC-3, AAC e várias formas de MPEG nas quais canais separados geralmente são preservados através do processo de codificação / decodificação, mas também técnicas de codificação de taxa de bits limitada recentemente introduzidas, algumas vezes referidas como "Codificação de Sinal Binaural"e "Codificação Estéreo Paramétrica", nas quais vários canais de entrada são convertidos para menos canais e convertidos para mais canais a partir de um único canal através do processo de codificação / decodificação. Os detalhes de tais sistemas de codificação estão contidos nos vários documentos, incluindo estes citados abaixo sob o tópico "Incorporação por Referência". Como consequência do uso de um canal único em tais sistemas de codificação, os sinais de saída reconstruídos são, necessariamente, versões com amplitude graduada de cada outro - para um bloco particular, os vários sinais de saída necessariamente possuem substancialmente a mesma estrutura de envelope refinado.
[005] Apesar de todas as técnicas de codificação de áudio baseadas em bloco poderem se beneficiar de uma resolução de envelope temporal aperfeiçoada de seus sinais de áudio codificados, a necessidade por tal aperfeiçoamento é particularmente grande nas técnicas de codificação baseadas em bloco que não preservam canais separados por todo o processo de codificação / decodificação. Certos tipos de sinais de entrada, tal como aplausos, por exemplo, são particularmente problemáticos para tais sistemas, levando a imagem espacial percebida reproduzida a se estreitar ou desmoronar.
Descrição dos Desenhos
[006] A FIG 1 é um diagrama de blocos funcional esquemático de um codificador ou função de codificação incorporando aspectos da presente invenção.
[007] A FIG. 2 é um diagrama de blocos funcional esquemático de um decodificador ou função decodificadora incorporando aspectos da presente invenção.
Descrição da Invenção
[008] De acordo com um primeiro aspecto da invenção, é propor- cionado um método para codificação de sinal de áudio no qual um ou mais sinais de áudio são codificados em um fluxo de bits compreendendo informação de áudio e informação auxiliar relacionando-se com a informação de áudio e útil na decodificação do fluxo de bits, a codificação compreendendo processamento que divide cada um dos um ou mais sinais de áudio em blocos de tempo e atualiza pelo menos algumas das informações auxiliares não mais frequentemente do que a taxa de blocos, de modo que a informação de áudio, quando decodificada, possua uma resolução de envelope temporal limitada pela taxa de blocos. É executada a comparação entre o envelope temporal de pelo menos um sinal de áudio e o envelope temporal de uma reconstrução decodificada estimada de cada pelo menos um sinal de áudio, reconstrução estimada esta que emprega pelo menos algumas das informações de áudio e pelo menos algumas das informações auxiliares, as representações dos resultados da comparação sendo úteis para aperfeiçoar a resolução do envelope temporal de pelo menos algumas das informações de áudio quando decodificadas.
[009] De acordo com outro aspecto da invenção, é proporcionado um método para codificação e decodificação de sinal de áudio no qual um ou mais sinais de áudio de entrada são codificados em um fluxo de bits compreendendo informações de áudio e informações auxiliares relacionando-se com as informações de áudio e úteis na decodificação do fluxo de bits, o fluxo de bits é recebido e a informação de áudio é decodificada utilizando a informação auxiliar para proporcionar um ou mais sinais de áudio de saída, a codificação e a decodificação incluindo processamento que divide cada um dos um ou mais sinais de áudio de entrada e o fluxo de bits decodificado, respectivamente, em blocos de tempo, a codificação atualizando pelo menos algumas das informações auxiliares não mais frequentemente do que a taxa de blocos, de modo que a informação de áudio, quando decodificada, possui um en- velope temporal possuindo uma resolução limitada pela taxa de blocos. É executada uma comparação entre o envelope temporal de pelo menos um sinal de áudio de entrada e o envelope temporal de uma reconstrução decodificada estimada de cada tal pelo menos um sinal de áudio de entrada, reconstrução estimada esta que emprega pelo menos algumas das informações de áudio e pelo menos algumas das informações auxiliares, a comparação proporcionando uma representação dos resultados da comparação, tais representações sendo úteis para aperfeiçoar a resolução do envelope temporal de pelo menos algumas das informações de áudio quando decodificadas. A emissão de pelos menos algumas representações é executada e a decodificação do fluxo de bits é executada, a decodificação empregando a informação de áudio, a informação auxiliar e as representações emitidas.
[0010] De acordo com um aspecto adicional da invenção, é proporcionado um método para decodificação de sinal de áudio no qual um ou mais sinais de áudio de entrada foram codificados em um fluxo de bits compreendendo informações de áudio e informações auxiliares relacionando-se com as informações de áudio e úteis na decodificação do fluxo de bits, a codificação incluindo processamento que divide cada um dos um ou mais sinais de áudio de entrada em blocos de tempo e atualiza pelo menos algumas das informações auxiliares não mais frequentemente do que a taxa de blocos, de modo que a informação de áudio, quando decodificada utilizando a informação auxiliar, possui uma resolução de envelope temporal limitada pela taxa de blocos, a codificação adicionalmente incluindo comparar o envelope temporal de pelo menos um sinal de áudio de entrada com o envelope temporal de uma reconstrução decodificada estimada de cada tal pelo menos um sinal de áudio de entrada, reconstrução estimada esta que emprega pelo menos algumas das informações de áudio e pelo menos algumas das informações auxiliares, a comparação proporcionando uma representação dos resultados da comparação, tais representações sendo úteis para aperfeiçoar a resolução do envelope temporal de pelo menos algumas das informações de áudio quando decodificadas, e a codificação adicionalmente incluindo emitir pelos menos algumas das representações. A recepção e a decodificação do fluxo de bits são executadas, a decodificação empregando a informação de áudio, a informação auxiliar e as representações emitidas.
[0011] Outros aspectos da invenção incluem o aparelho adaptado para executar os métodos citados acima, um programa de computador, armazenado em um meio legível por computador para causar que um computador execute os métodos citados acima, um fluxo de bits produzido pelos métodos citados acima e um fluxo de bits produzido pelo aparelho adaptado para executar os métodos citados acima.
Descrição Detalhada da Invenção
[0012] A FIG. 1 apresenta um exemplo de um ambiente do codificador ou do processo de codificação no qual os aspectos da presente invenção podem ser incorporados. Vários sinais de áudio de entrada tal como sinais PCM, amostras de tempo dos respectivos sinais de áudio analógicos, 1 até n, são aplicados respectivamente para os conversores ou funções de conversão do domínio do tempo para o domínio da frequência ("T/F") 2-1 até 2-n. Os sinais de áudio podem representar, por exemplo, direções espaciais tal como esquerda, centro, direita, etc. Cada T/F pode ser implementada, por exemplo, por se dividir as amostras de áudio de entrada em blocos, colocando em janelas os blocos, sobrepondo os blocos, transformado cada um dos blocos colocados em janelas e sobrepostos para o domínio da frequência por se calcular uma transformação de frequência separada (DFT) e separando os espectros de frequência resultantes em bandas simulando as bandas críticas da audição, por exemplo, vinte e uma bandas utilizando, por exemplo, a escala de banda retangular equivalente (ERB). Tais processos DFT são bem conhecidos na técnica. Outros parâmetros e técnicas de conversão do domínio do tempo para o domínio da frequência podem ser empregados. Nem os parâmetros particulares nem a técnica particular são críticos para a invenção. Entretanto, para o propósito de facilidade na explicação, a descrição seguinte assume que tal técnica de conversão DFT é empregada.
[0013] As saídas no domínio da frequência da T/F 2-1 até 2-n são cada uma um conjunto de coeficientes espectrais. Estes conjuntos podem ser designados Y[k]i até Y[k]n, respectivamente. Todos estes conjuntos podem ser aplicados junto a um codificador ou função codificadora baseada em bloco ("codificador baseado em bloco") 4. O codificador baseado em bloco pode ser, por exemplo, qualquer um dos conhecidos codificadores baseados em bloco mencionados acima, sozinhos ou algumas vezes em combinação, ou quaisquer futuros codificadores baseados em bloco, incluindo variações destes codificadores mencionados acima. Apesar dos aspectos da invenção serem particularmente benéficos para uso em conexão com os codificadores baseados em bloco que não preservam canais separados durante a codificação e a decodificação, os aspectos da invenção são úteis em conexão com virtualmente qualquer codificador baseado em bloco.
[0014] As saídas de um típico codificador baseado em bloco 4 podem ser caracterizadas como "informação de áudio" e "informação auxiliar". A informação de áudio pode compreender dados representando vários canais de sinal quanto é possível nos sistemas de codificação baseados em bloco tal como AC-3, AAC e outros, por exemplo, ou, ela pode compreender somente um único canal derivado por se converter para menos canais vários canais de entrada, tal como a codificação de sinal binário e os sistemas de codificação estéreo paramétrica supracitados (o canal convertido para menos canais em um codificador de codificação de sinal binário ou em um sistema de codificação estéreo paramétrico também pode ser codificação por percepção, por exemplo, com a AAC ou com outra codificação adequada). Ela também pode compreender um único canal ou vários canais derivados por se converter para menos canais vários canais de entrada tal como revelado no Pedido de Patente Provisório US 60/588.256, depositado em 14 de julho de 2004, para Davis et al., denominado "Low Bit Rate Audio Enconding and Decoding in Which Multiples Channels are Represented By Monophonic Channel and Auxiliary Information". O dito pedido 60.588.256 é por meio deste documento incorporado por referência em sua totalidade. A informação auxiliar pode compreender dados que se relacionam com a informação de áudio e são úteis na decodificação. No caso de vários sistemas de codificação com conversão para menos canais, a informação auxiliar pode compreender parâmetros espaciais tal como, por exemplo, diferenças de amplitude intercanal, diferenças de tempo ou fase intercanal e correlação cruzada intercanal.
[0015] A informação de áudio e a informação auxiliar a partir do codificador baseado em bloco 4 podem então ser aplicadas junto aos respectivos conversores ou funções de conversão do domínio da frequência para o domínio do tempo ("F/T") 6, cada um dos quais geralmente executa as funções inversas de um T/F descrito acima, a saber, uma FFT inversa, seguida pela adição da colocação em janela e pela sobreposição. A informação no domínio de tempo a partir da F/T 6 é aplicada junto a um empacotador ou função de empacotamento de fluxo de bits ("empacotador de fluxo de bits") 10 que proporciona uma saída de fluxo de bits codificado. Alternativamente, se o codificador for para proporcionar um fluxo de bits representando informação no domínio da frequência, a F/T 6 podem ser omitidas.
[0016] A informação de áudio no domínio da frequência e a informação auxiliar, a partir do codificador baseado em bloco 4, também são aplicadas junto a um avaliador de decodificação ou função de avaliação ("avaliador de decodificação") 14. O avaliador de decodificação 14 pode simular pelo menos uma parte de um decodificador ou função de decodificação projetado para decodificar o fluxo de bits codificado proporcionado pelo empacotador de fluxo de bits 10. Um exemplo de tal decodificador ou função de decodificação é descrito abaixo em conexão com a FIG. 2. O avaliador de decodificação 14 pode proporcionar conjuntos de coeficientes espectrais X[k]i à X[k]n que se aproximam dos conjuntos de coeficientes espectrais Y[k]i à Y[k]n de sinais de áudio de entrada correspondentes que são esperados de serem obtidos no decodificador ou função de decodificação. Alternativamente, ele pode proporcionar coeficientes espectrais para menos do que todos os sinais de áudio de entrada, para menos do que todos os blocos de tempo dos sinais de áudio de entrada, e/ou para menos do que todas as bandas de frequência (isto é, ele pode não proporcionar todos os coeficientes espectrais). Isto pode proceder, por exemplo, se for desejado aperfeiçoar somente sinais de entrada representando canais julgados mais importantes que outros. Como outro exemplo, isto pode proceder se for desejado aperfeiçoar somente as partes de frequência inferiores dos sinais nos quais a audição é mais sensível aos detalhes refinados dos envelopes de forma de onda temporal.
[0017] Cada uma das saídas no domínio da frequência de T/F 2-1 à 2-n e dos conjuntos de coeficientes espectrais Y[k]i à Y[k]n são também aplicados para os respectivos dispositivos ou funções de comparar ("compare") 12-1 a 12-n. Tais conjuntos são comprados com os conjuntos correspondentes de blocos de tempo dos coeficientes espectrais estimados X[k]i a X[k]n no respectivo compare 12-1 a 12-n. Cada um dos resultados da comparação em cada compare 12-1 a 12- n é aplicado a um calculador de filtro ou função de cálculo ("calculo de filtro") 15-1 a 15-n. Esta informação deve ser suficiente para cada cál- culo de filtro para definir os coeficientes de um filtro para cada bloco de tempo, filtro este que, quando aplicado a uma reconstrução decodificada de um sinal de entrada, resultaria no sinal possuindo um envelope temporal com uma resolução aperfeiçoada. Em outras palavras, o filtro reformataria o sinal de modo que ele reproduzisse mais estritamente o envelope temporal do sinal original. A resolução aperfeiçoada é uma resolução mais refinada do que a taxa de blocos. Detalhes adicionais de um filtro preferido são expostos abaixo.
[0018] Apesar do exemplo da Fig. 1 apresentar a comparação e o cálculo do filtro no domínio da frequência, a comparação e o cálculo do filtro podem ser executados no domínio do tempo. Quer executado no domínio da frequência ou no domínio do tempo, somente uma configuração de filtro é determinada por bloco de tempo (apesar da mesma configuração de filtro poder ser aplicada junto a alguns dos blocos de tempo consecutivos). Em princípio, apesar de uma configuração de filtro poder ser determinada em uma banda baseado em banda (tal como por banda da escala ERB), fazer isto exigiria o envio de um grande número de bits de informação auxiliar, o que anularia a vantagem da invenção, a saber, aperfeiçoar a resolução do envelope temporal com pouco aumento na taxa de bits.
[0019] Cada uma das medidas da comparação em cada compare 21-1 a 12-n é aplicada para um dispositivo ou função de decisão ("decisão") 16-1 a 16-n. Cada decisão compara a medida da comparação com um limite. Uma medida da comparação pode tomar várias formas e não é crítica. Por exemplo, o valor absoluto da diferença de cada valor de coeficiente correspondente pode ser calculado e as diferenças somadas para proporcionar um único número cujo valor indica o grau até o qual as formas de onda do sinal diferem umas das outras durante um bloco de tempo. Este número pode ser comparado com um limite de modo que se ele exceder o limite, um indicador "sim" é proporci- onado para o cálculo de filtro correspondente. Na ausência de um indicador "sim", os cálculos de filtro podem ser inibidos para o bloco, ou, se calculado, eles podem não ser emitidos pelo cálculo de filtro. Tal informação sim / não para cada sinal constitui um indicador que também pode ser aplicado junto ao empacotador de fluxo de bits 10 para inclusão no fluxo de bits (aqui, pode existir uma pluralidade de indicadores, um para cada sinal de entrada e cada indicador pode ser representado por um bit).
[0020] Alternativamente, cada decisão 16-1 a 16-n pode receber informação a partir de um respectivo cálculo de filtro 14-1 a 14-n ao invés ou em adição à informação a partir de um respectivo compare 12-1 a 12-n. A respectiva decisão 16 pode empregar as características de filtro calculadas (por exemplo, suas magnitudes médias ou de pico) como a base para tomar uma decisão ou para ajudar em tomar uma decisão.
[0021] Como mencionado acima, cada cálculo de filtro 14-1 a 14-n proporciona uma representação dos resultados da comparação, a qual pode constituir os coeficientes de um filtro, filtro este que, quando aplicado junto a uma reconstrução decodificada de um sinal de entrada resultaria no sinal possuindo um envelope temporal com uma resolução aperfeiçoada. Se os coeficientes espectrais estimados do espectro X[k]i a X[k]n estiverem incompletos (no caso do avaliador de decodificação proporcionando coeficientes espectrais para menos do que todos os sinais de áudio de entrada, para menos do que todos os blocos de tempo dos sinais de áudio de entrada e / ou para menos do que todas as bandas de frequência), podem não existir saídas de cada comparação 12-1 a 12-n para todos os blocos de tempo, bandas de frequência e sinais de entrada. O leitor deve observar que X[k]i a X[k]n se referem às saídas reconstruídas, ao passo que Y[k]i a Y[k]n se referem às entradas.
[0022] A saída de cada cálculo de filtro 14-1 a 14-n pode ser aplicada junto ao montador de fluxo de bits 10. Apesar da informação de filtro poder ser enviada separadamente a partir do fluxo de bits, de preferência ela é enviada como parte do fluxo de bits e como parte da in-formação auxiliar. Quando os aspectos da invenção são aplicados junto aos sistemas existentes de codificação baseada em bloco, a informação adicional proporcionada pelos aspectos da presente invenção pode ser inserida nas partes do fluxo de bits de tais sistemas que são pretendidas para transportar a informação auxiliar.
[0023] Nas modalidades práticas, não somente a informação de áudio, mas também a informação auxiliar e os coeficientes de filtro serão provavelmente quantizados ou codificados de algum modo para minimizar seus custos de transmissão. Entretanto, nenhuma quantiza- ção e retirada de quantização é apresentada nas figuras, para o pro-pósito de simplicidade na apresentação, e porque tais detalhes são bem conhecidos e não ajudam no entendimento da invenção.
Projeto de Filtro Wiener no Domínio da Fregüência
[0024] Cada um dos dispositivos ou função de cálculo de filtro 14-1 a 14-n de preferência caracteriza um filtro FIR no domínio da frequência que representa alterações multiplicativas no domínio do tempo requeridas para se obter uma reprodução mais precisa de um envelope temporal original do canal do sinal. Este problema do filtro pode ser formulado como pelo menos um problema de mínimos quadrados, o qual frequentemente é referido como projeto de filtro Wiener. Veja, por exemplo, de X. Rong Li, Probability, Random Signals, and Statistics, CRC Press 1999, New York, pág. 423. Aplicar as técnicas de filtro Wiener tem a vantagem de reduzir os bits adicionais requeridos para transportar a informação de reformatação de filtro para urn decodificador. Aplicações convencionais do filtro Wiener tipicamente são projetadas e aplicadas no domínio do tempo.
[0025] O problema do projeto de filtro de mínimos quadrados no domínio da frequência pode ser definido como se segue: dada a representação espectral DFT de um sinal original Y[k] e a representação espectral de uma aproximação de tal canal original X[k], calcular um conjunto de coeficiente de filtro (am) que minimize a equação 1. Observe que Y[k] e X[k] são valores complexos e assim, em geral, am também será complexo.
Figure img0001
[0026] Onde k é o índice espectral, E é o operador de expectativa e M é o comprimento do filtro sendo projetado.
[0027] A equação 1 pode ser novamente expressa utilizando as expressões de matriz como apresentado na equação 2:
Figure img0002
[0028] Onde
Figure img0003
[0029] E
Figure img0004
[0030] Assim, por estabelecer as derivadas parciais na equação 2 com respeito a cada um dos coeficientes de filtro para zero, é simples apresentar a solução para o problema de minimização, o qual é dado pela equação 3.
Figure img0005
[0031] Onde
Figure img0006
[0032] E
Figure img0007
[0033] A equação 3 define o cálculo dos coeficientes de filtro ótimos que minimizam o erro entre o espectro original (Y[k]) e o espectro reconstruído (X[k]) de um canal particular. Geralmente, um conjunto de coeficientes de filtro é calculado para cada bloco de tempo de cada sinal de entrada.
[0034] Em uma modalidade prática dos aspectos da invenção um filtro Wiener de 12- ordem é empregado, apesar da invenção não estar limitada ao uso de um filtro Wiener de tal tamanho. Tal modalidade prática emprega processamento no domínio da frequência seguindo- se a uma DFT. Por consequência, os coeficientes do filtro Wiener são números complexos e cada filtro requer a transmissão de vinte e quatro números reais. Para de forma eficiente transportar tal informação de filtro para um decodificador, a quantização de vetor (VQ) pode ser utilizada para codificar os coeficientes de cada filtro. Um livro de códigos pode ser empregado de modo que somente um índice precise ser enviado para o decodificador para transportar a informação de filtro complexo de 12â ordem. Em uma modalidade prática, um livro de códigos da tabela VQ, possuindo 24 dimensões e 16.536 entradas, foi visto como sendo útil. A invenção não está limitada ao uso da quantização de vetor nem ao uso de um livro de códigos.
[0035] Enquanto a descrição acima assume o uso de uma DFT para avaliar o conteúdo espectral e para projetar o filtro Wiener, em geral, qualquer transformação pode ser utilizada.
[0036] A FIG. 2 apresenta um exemplo de um ambiente do decodificador ou do processo de decodificação no qual os aspectos da presente invenção podem ser empregados. Tal codificador ou função de decodificação pode ser adequado para operação em cooperação com um codificador ou processo de decodificação como descrito em conexão com o exemplo da FIG. 1. Um fluxo de bits codificado, tal como este produzido pela disposição da FIG. 1, é recebido por qualquer modo adequado de transmissão ou armazenamento de sinal e aplicado para um desempacotador de fluxo de bits 30 que desempacota o fluxo de bits à medida que necessário para separar a informação de áudio codificada da informação auxiliar e indicadores sim / não (se incluídos no fluxo de bits). A informação auxiliar de preferência inclui um conjunto de coeficientes de filtro para uso em aperfeiçoar a reconstrução de cada um dos um ou mais sinais de entrada que foram aplicados para a disposição de codificação da FIG. 1.
[0037] Neste exemplo, é assumido que existe um sinal reproduzido correspondendo a cada sinal de entrada e que a informação de filtro de reformatação de envelope temporal é proporcionada para cada sinal reproduzido, apesar disto não precisar ser o caso, como mencionado acima. Assim, 1 até n conjuntos de informações auxiliares de coeficiente de filtro são apresentados como saída a partir do desempacotador de fluxo de bits 30. A informação sobre coeficiente de filtro para cada sinal de entrada é aplicada para os respectivos filtros de reformatação 36-1 a 36-n, cuja operação é explicada abaixo. Cada um dos filtros também pode receber um respectivo indicador sim / não 31-1 a 31-n, indicando se o filtro deve estar ativo durante um bloco de tempo particular.
[0038] A informação auxiliar a partir do empacotador de fluxo de bits 30 também pode incluir outras informações tal como, por exemplo, diferenças de amplitude intercanal, diferenças de fase ou de tempo intercanal e correlação cruzada intercanal no caso de uma codificação de sinal binaural ou de sistema estéreo paramétrico. Um decodificador baseado em bloco 42 recebe a informação auxiliar a partir do desempacotador de fluxo de bits 30 junto com a informação de áudio convertida do domínio do tempo para da frequência a partir do desempacota- cação (42) empregando a informação de áudio, a informação auxiliar e as representações emitidas.
BR122018077089A 2004-08-25 2005-08-15 decodificador de áudio BR122018077089B8 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US60483604P 2004-08-25 2004-08-25
US60/604,836 2004-08-25
PCT/US2005/029157 WO2006026161A2 (en) 2004-08-25 2005-08-15 Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering
BRPI0514650-0A BRPI0514650B1 (pt) 2004-08-25 2005-08-15 Métodos para codificação e decodificação de sinais de áudio, codificador e decodificador de sinais de áudio

Publications (2)

Publication Number Publication Date
BR122018077089B1 true BR122018077089B1 (pt) 2020-11-10
BR122018077089B8 BR122018077089B8 (pt) 2021-01-05

Family

ID=35636849

Family Applications (3)

Application Number Title Priority Date Filing Date
BR122018077099-6A BR122018077099B1 (pt) 2004-08-25 2005-08-15 método para decodificação de sinal de áudio e decodificador de sinal de áudio
BRPI0514650-0A BRPI0514650B1 (pt) 2004-08-25 2005-08-15 Métodos para codificação e decodificação de sinais de áudio, codificador e decodificador de sinais de áudio
BR122018077089A BR122018077089B8 (pt) 2004-08-25 2005-08-15 decodificador de áudio

Family Applications Before (2)

Application Number Title Priority Date Filing Date
BR122018077099-6A BR122018077099B1 (pt) 2004-08-25 2005-08-15 método para decodificação de sinal de áudio e decodificador de sinal de áudio
BRPI0514650-0A BRPI0514650B1 (pt) 2004-08-25 2005-08-15 Métodos para codificação e decodificação de sinais de áudio, codificador e decodificador de sinais de áudio

Country Status (15)

Country Link
US (3) US8255211B2 (pt)
EP (4) EP3940697B1 (pt)
JP (2) JP5038138B2 (pt)
KR (3) KR101139880B1 (pt)
CN (3) CN102270453B (pt)
AU (2) AU2005280392B2 (pt)
BR (3) BR122018077099B1 (pt)
CA (1) CA2589623C (pt)
ES (3) ES2923661T3 (pt)
IL (3) IL181407A (pt)
MX (1) MX2007001948A (pt)
MY (2) MY151318A (pt)
PL (3) PL3279893T3 (pt)
TW (3) TWI497485B (pt)
WO (1) WO2006026161A2 (pt)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI497485B (zh) * 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
KR100866885B1 (ko) * 2005-10-20 2008-11-04 엘지전자 주식회사 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치
ES2446245T3 (es) * 2006-01-19 2014-03-06 Lg Electronics Inc. Método y aparato para procesar una señal de medios
WO2007091845A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
ATE505912T1 (de) * 2006-03-28 2011-04-15 Fraunhofer Ges Forschung Verbessertes verfahren zur signalformung bei der mehrkanal-audiorekonstruktion
WO2009011827A1 (en) 2007-07-13 2009-01-22 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness
CN101673545B (zh) * 2008-09-12 2011-11-16 华为技术有限公司 一种编解码方法及装置
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
EP2402941B1 (en) * 2009-02-26 2015-04-15 Panasonic Intellectual Property Corporation of America Channel signal generation apparatus
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
BR112012025878B1 (pt) 2010-04-09 2021-01-05 Dolby International Ab sistema decodificador, sistema codificador, método de decodificação e método de codificação.
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
US9978379B2 (en) * 2011-01-05 2018-05-22 Nokia Technologies Oy Multi-channel encoding and/or decoding using non-negative tensor factorization
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
US9015042B2 (en) 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
PL2883225T3 (pl) 2012-08-10 2017-10-31 Fraunhofer Ges Forschung Koder, dekoder, układ i sposób, wykorzystujące koncepcje resztki dla parametrycznego kodowania obiektów audio
CN109509478B (zh) * 2013-04-05 2023-09-05 杜比国际公司 音频处理装置
EP2830063A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for decoding an encoded audio signal
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
RU2744485C1 (ru) * 2017-10-27 2021-03-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Ослабление шума в декодере
JP7092047B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 符号化復号方法、復号方法、これらの装置及びプログラム
WO2023118138A1 (en) * 2021-12-20 2023-06-29 Dolby International Ab Ivas spar filter bank in qmf domain
KR102446720B1 (ko) * 2022-02-18 2022-09-26 오드컨셉 주식회사 이미지 복원 모델, 및 이미지 복원 모델의 학습 방법
KR102423552B1 (ko) * 2022-02-28 2022-07-21 오드컨셉 주식회사 적대적 생성 신경망으로 구성된 상품 이미지 복원 및 합성 모델, 및 상품 이미지 복원 및 합성 모델의 학습 방법

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4875095A (en) * 1987-06-30 1989-10-17 Kokusai Denshin Denwa Kabushiki Kaisha Noise-shaping predictive coding system
US4943855A (en) * 1988-07-22 1990-07-24 At&T Bell Laboratories Progressive sub-band image coding system
US6289308B1 (en) 1990-06-01 2001-09-11 U.S. Philips Corporation Encoded wideband digital transmission signal and record carrier recorded with such a signal
US5539829A (en) 1989-06-02 1996-07-23 U.S. Philips Corporation Subband coded digital transmission system using some composite signals
NL9000338A (nl) 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
EP0506680B1 (en) * 1989-10-11 1997-12-29 Cias Inc. Optimal error-detecting and error-correcting code and apparatus
KR100228688B1 (ko) 1991-01-08 1999-11-01 쥬더 에드 에이. 다차원 음장용 인코우더/디코우더
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
NL9100173A (nl) 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
DE4320990B4 (de) * 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
DE4331376C1 (de) * 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
BE1007616A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met vereenvoudigde broncodering.
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3365874B2 (ja) 1994-10-05 2003-01-14 富士写真フイルム株式会社 キノンジアジドの合成法およびこれを含むポジ型レジスト
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3747492B2 (ja) * 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
JP4132109B2 (ja) * 1995-10-26 2008-08-13 ソニー株式会社 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
GB9614209D0 (en) * 1996-07-05 1996-09-04 Univ Manchester Speech synthesis system
JP3259759B2 (ja) * 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JP4132154B2 (ja) * 1997-10-23 2008-08-13 ソニー株式会社 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
DE19747132C2 (de) 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
TW382094B (en) * 1997-12-11 2000-02-11 Inventec Corp Base tone synchronous differential coding method and device thereof
US6529730B1 (en) * 1998-05-15 2003-03-04 Conexant Systems, Inc System and method for adaptive multi-rate (AMR) vocoder rate adaption
AU2001288944A1 (en) * 2000-09-08 2002-03-22 Findthedot, Inc. A method and system of connecting printed media to electronic information as a response to a request
US6614365B2 (en) * 2000-12-14 2003-09-02 Sony Corporation Coding device and method, decoding device and method, and recording medium
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
CN1308913C (zh) * 2002-04-11 2007-04-04 松下电器产业株式会社 编码设备、解码设备及其方法
JP4399185B2 (ja) * 2002-04-11 2010-01-13 パナソニック株式会社 符号化装置および復号化装置
US7215787B2 (en) 2002-04-17 2007-05-08 Dirac Research Ab Digital audio precompensation
US8340302B2 (en) 2002-04-22 2012-12-25 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
DE60311794T2 (de) 2002-04-22 2007-10-31 Koninklijke Philips Electronics N.V. Signalsynthese
WO2003090207A1 (en) 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
US20040086130A1 (en) * 2002-05-03 2004-05-06 Eid Bradley F. Multi-channel sound processing systems
RU2363116C2 (ru) * 2002-07-12 2009-07-27 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
US7516066B2 (en) * 2002-07-16 2009-04-07 Koninklijke Philips Electronics N.V. Audio coding
US20040083417A1 (en) * 2002-10-29 2004-04-29 Lane Richard D. Multimedia transmission using variable error coding rate based on data importance
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
ATE527654T1 (de) 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
EP1769491B1 (en) * 2004-07-14 2009-09-30 Koninklijke Philips Electronics N.V. Audio channel conversion
TWI497485B (zh) * 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
US10113858B2 (en) 2015-08-19 2018-10-30 Medlumics S.L. Distributed delay-line for low-coherence interferometry
US9996281B2 (en) 2016-03-04 2018-06-12 Western Digital Technologies, Inc. Temperature variation compensation
CN113535073B (zh) 2020-04-22 2024-04-16 伊姆西Ip控股有限责任公司 管理存储单元的方法、电子设备和计算机可读存储介质

Also Published As

Publication number Publication date
IL201469A0 (en) 2011-07-31
TW201333933A (zh) 2013-08-16
BRPI0514650B1 (pt) 2019-09-24
CN102968996A (zh) 2013-03-13
IL214135A (en) 2015-10-29
JP5292498B2 (ja) 2013-09-18
EP1784818A2 (en) 2007-05-16
CA2589623A1 (en) 2006-03-09
JP2008511040A (ja) 2008-04-10
BRPI0514650A (pt) 2008-06-24
IL214135A0 (en) 2011-08-31
PL3940697T3 (pl) 2022-08-22
JP5038138B2 (ja) 2012-10-03
TW201316327A (zh) 2013-04-16
KR101253699B1 (ko) 2013-04-12
KR20120006077A (ko) 2012-01-17
US20080033731A1 (en) 2008-02-07
AU2011200680C1 (en) 2013-03-14
AU2011200680B2 (en) 2012-05-24
CN101006494A (zh) 2007-07-25
TWI498882B (zh) 2015-09-01
BR122018077089B8 (pt) 2021-01-05
BR122018077099B1 (pt) 2020-11-10
WO2006026161A3 (en) 2006-05-04
AU2011200680A1 (en) 2011-03-10
CN102270453A (zh) 2011-12-07
EP3940697A1 (en) 2022-01-19
CN102270453B (zh) 2014-06-18
US20080040103A1 (en) 2008-02-14
CN102968996B (zh) 2015-06-10
TWI497485B (zh) 2015-08-21
MY163042A (en) 2017-07-31
PL1784818T3 (pl) 2018-04-30
MY151318A (en) 2014-05-15
JP2012177939A (ja) 2012-09-13
ES2923661T3 (es) 2022-09-29
US8255211B2 (en) 2012-08-28
EP3279893A1 (en) 2018-02-07
KR20110069179A (ko) 2011-06-22
KR101139880B1 (ko) 2012-05-02
MX2007001948A (es) 2007-04-23
WO2006026161A2 (en) 2006-03-09
US20080046253A1 (en) 2008-02-21
EP3279893B1 (en) 2021-09-22
IL181407A0 (en) 2007-07-04
PL3279893T3 (pl) 2022-02-07
EP4036914A1 (en) 2022-08-03
IL181407A (en) 2011-10-31
AU2005280392A1 (en) 2006-03-09
US7945449B2 (en) 2011-05-17
CN101006494B (zh) 2011-09-07
TWI393120B (zh) 2013-04-11
EP3940697B1 (en) 2022-06-22
CA2589623C (en) 2014-10-28
ES2899286T3 (es) 2022-03-10
AU2005280392B2 (en) 2011-02-24
TW200611240A (en) 2006-04-01
KR20070051860A (ko) 2007-05-18
ES2658824T3 (es) 2018-03-12
IL201469A (en) 2012-07-31
EP1784818B1 (en) 2017-11-15

Similar Documents

Publication Publication Date Title
BR122018077089B1 (pt) decodificador de áudio
RU2645271C2 (ru) Стереофонический кодер и декодер аудиосигналов
JP2020170188A (ja) パラメトリック・マルチチャネル・エンコードのための方法
CN102150207B (zh) 通过二维变换压缩音频比例因子
RU2625939C2 (ru) Кодер, декодер и способы для зависимого от сигнала преобразования масштаба при пространственном кодировании аудиообъектов
US11074920B2 (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
BRPI0612218B1 (pt) codificação de áudio residual adaptativa
KR20100086000A (ko) 오디오 신호 처리 방법 및 장치
BR112012025863B1 (pt) sistema decodificador e método de decodificação para codificação estéreo por predição complexa baseada em mdct
JP5163545B2 (ja) オーディオ復号装置及びオーディオ復号方法
RU2367087C2 (ru) Кодирование информации без потерь с гарантированной максимальной битовой скоростью
US20190267012A1 (en) Methods and apparatus for decoding encoded audio signal(s)
KR20120095920A (ko) 최적의 저-스루풋 파라메트릭 코딩/디코딩
KR100745688B1 (ko) 다채널 오디오 신호 부호화/복호화 방법 및 장치
KR20110021803A (ko) 2개의 블록 변환으로의 중첩 변환의 분해
US20130282386A1 (en) Multi-channel encoding and/or decoding
US20120163608A1 (en) Encoder, encoding method, and computer-readable recording medium storing encoding program
KR20200145859A (ko) 채널 간 위상차 파라미터 추출 방법 및 장치
EP2595147B1 (en) Audio data encoding method and device
US11176954B2 (en) Encoding and decoding of multichannel or stereo audio signals
JP2008129250A (ja) Aacのためのウィンドウ切り替え方法およびm/s符号化の帯域決定方法
US11621010B2 (en) Coding apparatus, coding method, program, and recording medium
US20160035365A1 (en) Sound encoding device, sound encoding method, sound decoding device and sound decoding method
EP4198972A1 (en) Stereo signal processing
US9837085B2 (en) Audio encoding device and audio coding method

Legal Events

Date Code Title Description
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B12B Appeal against refusal [chapter 12.2 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 10/11/2020, OBSERVADAS AS CONDICOES LEGAIS.

B16C Correction of notification of the grant [chapter 16.3 patent gazette]

Free format text: REF. RPI 2601 DE 10/11/2020 QUANTO AO RELATORIO DESCRITIVO E AO QUADRO REIVINDICATORIO.