BR122018077099B1 - método para decodificação de sinal de áudio e decodificador de sinal de áudio - Google Patents

método para decodificação de sinal de áudio e decodificador de sinal de áudio Download PDF

Info

Publication number
BR122018077099B1
BR122018077099B1 BR122018077099-6A BR122018077099A BR122018077099B1 BR 122018077099 B1 BR122018077099 B1 BR 122018077099B1 BR 122018077099 A BR122018077099 A BR 122018077099A BR 122018077099 B1 BR122018077099 B1 BR 122018077099B1
Authority
BR
Brazil
Prior art keywords
audio
information
bit stream
decoding
encoding
Prior art date
Application number
BR122018077099-6A
Other languages
English (en)
Inventor
Mark Stuart Vinton
Alan Jeffrey Seefeldt
Original Assignee
Dolby Laboratories Licensing Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corporation filed Critical Dolby Laboratories Licensing Corporation
Publication of BR122018077099B1 publication Critical patent/BR122018077099B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Abstract

A presente invenção refere-se a certos tipos de codificadores de codificação espacial paramétrica utilizam diferenças de amplitude intercanal, diferenças de tempo intercanal e coerência ou correlação intercanal para construir um modelo paramétrico de um campo de som multicanal que é utilizado por um decodificador para construir uma aproximação do campo de som original. Entretanto, tal modelo paramétrico não reconstrói o envelope temporal original dos canais do campo de som, o que foi visto como sendo extremamente importante para alguns sinais de áudio. A presente invenção proporciona a reformatação do envelope temporal de um ou mais dos canais decodificados em um sistema de codificação espacial para melhor corresponder um ou mais envelopes temporais originais.

Description

[001] Dividido do PI0514650-0 depositado em 15 de agosto de 2005.
Campo Técnico
[002] A presente invenção relaciona-se com codificadores de áudio baseados em bloco nos quais a informação de áudio quando decodificada, possui uma resolução de envelope temporal limitada pela taxa de blocos, incluindo codificadores, decodificadores e sistemas de áudio perceptuais e paramétricos, com os métodos correspondentes, com programas de computador para implementar tais métodos e com um fluxo de bits produzido por tais codificadores.
Antecedentes da Técnica
[003] Várias técnicas de codificação de áudio com taxa de bits reduzida são "baseadas em bloco" pelo fato de que a codificação inclui processamento que divide cada um dos um ou mais sinais de áudio sendo codificados em blocos de tempo e atualiza pelo menos algumas das informações associadas com o áudio codificado não mais frequentemente do que a taxa de blocos. Como resultado, a informação de áudio, quando decodificada, possui uma resolução de envelope temporal limitada pela taxa de blocos. Por consequência, a estrutura detalhada dos sinais de áudio decodificados com o passar do tempo não é preservada para períodos de tempo menores do que a granularidade da técnica de codificação (tipicamente, na faixa de 8 à 50 milésimos de segundo por bloco).
[004] Tais técnicas de codificação de áudio baseadas em bloco incluem não somente conhecidas técnicas de codificação perceptual bem estabelecidas como AC-3, AAC e várias formas de MPEG nas quais canais separados geralmente são preservados através do processo de codificação / decodificação, mas também técnicas de codificação de taxa de bits limitada recentemente introduzidas, algumas vezes referidas como "Codificação de Sinal Binaural"e "Codificação Estéreo Paramétrica", nas quais vários canais de entrada são convertidos para menos canais e convertidos para mais canais a partir de um único canal através do processo de codificação / decodificação. Os detalhes de tais sistemas de codificação estão contidos nos vários docu-mentos, incluindo estes citados abaixo sob o tópico "Incorporação por Referência". Como consequência do uso de um canal único em tais sistemas de codificação, os sinais de saída reconstruídos são, necessariamente, versões com amplitude graduada de cada outro - para um bloco particular, os vários sinais de saída necessariamente possuem substancialmente a mesma estrutura de envelope refinado.
[005] Apesar de todas as técnicas de codificação de áudio baseadas em bloco poderem se beneficiar de uma resolução de envelope temporal aperfeiçoada de seus sinais de áudio codificados, a necessidade por tal aperfeiçoamento é particularmente grande nas técnicas de codificação baseadas em bloco que não preservam canais separados por todo o processo de codificação / decodificação. Certos tipos de sinais de entrada, tal como aplausos, por exemplo, são particularmente problemáticos para tais sistemas, levando a imagem espacial percebida reproduzida a se estreitar ou desmoronar.
Descrição dos Desenhos
[006] A FIG 1 é um diagrama de blocos funcional esquemático de um codificador ou função de codificação incorporando aspectos da presente invenção.
[007] A FIG. 2 é um diagrama de blocos funcional esquemático de um decodificador ou função decodificadora incorporando aspectos da presente invenção.
Descrição da Invenção
[008] De acordo com um primeiro aspecto da invenção, é proporcionado um método para codificação de sinal de áudio no qual um ou mais sinais de áudio são codificados em um fluxo de bits compreendendo informação de áudio e informação auxiliar relacionando-se com a informação de áudio e útil na decodificação do fluxo de bits, a codificação compreendendo processamento que divide cada um dos um ou mais sinais de áudio em blocos de tempo e atualiza pelo menos algumas das informações auxiliares não mais frequentemente do que a taxa de blocos, de modo que a informação de áudio, quando decodificada, possua uma resolução de envelope temporal limitada pela taxa de blocos. É executada a comparação entre o envelope temporal de pelo menos um sinal de áudio e o envelope temporal de uma reconstrução decodificada estimada de cada pelo menos um sinal de áudio, reconstrução estimada esta que emprega pelo menos algumas das informações de áudio e pelo menos algumas das informações auxiliares, as representações dos resultados da comparação sendo úteis para aperfeiçoar a resolução do envelope temporal de pelo menos algumas das informações de áudio quando decodificadas.
[009] De acordo com outro aspecto da invenção, é proporcionado um método para codificação e decodificação de sinal de áudio no qual um ou mais sinais de áudio de entrada são codificados em um fluxo de bits compreendendo informações de áudio e informações auxiliares relacionando-se com as informações de áudio e úteis na decodificação do fluxo de bits, o fluxo de bits é recebido e a informação de áudio é decodificada utilizando a informação auxiliar para proporcionar um ou mais sinais de áudio de saída, a codificação e a decodificação incluindo processamento que divide cada um dos um ou mais sinais de áudio de entrada e o fluxo de bits decodificado, respectivamente, em blocos de tempo, a codificação atualizando pelo menos algumas das informa-ções auxiliares não mais frequentemente do que a taxa de blocos, de modo que a informação de áudio, quando decodificada, possui um envelope temporal possuindo uma resolução limitada pela taxa de blocos. É executada uma comparação entre o envelope temporal de pelo menos um sinal de áudio de entrada e o envelope temporal de uma reconstrução decodificada estimada de cada tal pelo menos um sinal de áudio de entrada, reconstrução estimada esta que emprega pelo menos algumas das informações de áudio e pelo menos algumas das informações auxiliares, a comparação proporcionando uma representação dos resultados da comparação, tais representações sendo úteis para aperfeiçoar a resolução do envelope temporal de pelo menos algumas das informações de áudio quando decodificadas. A emissão de pelos menos algumas representações é executada e a decodificação do fluxo de bits é executada, a decodificação empregando a informação de áudio, a informação auxiliar e as representações emitidas.
[0010] De acordo com um aspecto adicional da invenção, é proporcionado um método para decodificação de sinal de áudio no qual um ou mais sinais de áudio de entrada foram codificados em um fluxo de bits compreendendo informações de áudio e informações auxiliares relacionando-se com as informações de áudio e úteis na decodificação do fluxo de bits, a codificação incluindo processamento que divide cada um dos um ou mais sinais de áudio de entrada em blocos de tempo e atualiza pelo menos algumas das informações auxiliares não mais frequentemente do que a taxa de blocos, de modo que a informação de áudio, quando decodificada utilizando a informação auxiliar, possui uma resolução de envelope temporal limitada pela taxa de blocos, a codificação adicionalmente incluindo comparar o envelope temporal de pelo menos um sinal de áudio de entrada com o envelope temporal de uma reconstrução decodificada estimada de cada tal pelo menos um sinal de áudio de entrada, reconstrução estimada esta que emprega pelo menos algumas das informações de áudio e pelo menos algumas das informações auxiliares, a comparação proporcionando uma representação dos resultados da comparação, tais representações sendo úteis para aperfeiçoar a resolução do envelope temporal de pelo menos algumas das informações de áudio quando decodificadas, e a codificação adicionalmente incluindo emitir pelos menos algumas das representações. A recepção e a decodificação do fluxo de bits são executadas, a decodificação empregando a informação de áudio, a informação auxiliar e as representações emitidas.
[0011] Outros aspectos da invenção incluem o aparelho adaptado para executar os métodos citados acima, um programa de computador, armazenado em um meio legível por computador para causar que um computador execute os métodos citados acima, um fluxo de bits produzido pelos métodos citados acima e um fluxo de bits produzido pelo aparelho adaptado para executar os métodos citados acima.
Descrição Detalhada da Invenção
[0012] A FIG. 1 apresenta um exemplo de um ambiente do codificador ou do processo de codificação no qual os aspectos da presente invenção podem ser incorporados. Vários sinais de áudio de entrada tal como sinais PCM, amostras de tempo dos respectivos sinais de áudio analógicos, 1 até n, são aplicados respectivamente para os conversores ou funções de conversão do domínio do tempo para o domínio da frequência ("T/F") 2-1 até 2-n. Os sinais de áudio podem representar, por exemplo, direções espaciais tal como esquerda, centro, direita, etc. Cada T/F pode ser implementada, por exemplo, por se dividir as amostras de áudio de entrada em blocos, colocando em jane-las os blocos, sobrepondo os blocos, transformado cada um dos blocos colocados em janelas e sobrepostos para o domínio da frequência por se calcular uma transformação de frequência separada (DFT) e separando os espectros de frequência resultantes em bandas simulando as bandas críticas da audição, por exemplo, vinte e uma bandas utilizando, por exemplo, a escala de banda retangular equivalente (ERB). Tais processos DFT são bem conhecidos na técnica. Outros parâmetros e técnicas de conversão do domínio do tempo para o domínio da frequência podem ser empregados. Nem os parâmetros particulares nem a técnica particular são críticos para a invenção. Entretanto, para o propósito de facilidade na explicação, a descrição seguinte assume que tal técnica de conversão DFT é empregada.
[0013] As saídas no domínio da frequência da T/F 2-1 até 2-n são cada uma um conjunto de coeficientes espectrais. Estes conjuntos podem ser designados Y[k]i até Y[k]n, respectivamente. Todos estes conjuntos podem ser aplicados junto a um codificador ou função codificadora baseada em bloco ("codificador baseado em bloco") 4. O codificador baseado em bloco pode ser, por exemplo, qualquer um dos conhecidos codificadores baseados em bloco mencionados acima, sozinhos ou algumas vezes em combinação, ou quaisquer futuros codificadores baseados em bloco, incluindo variações destes codificadores mencionados acima. Apesar dos aspectos da invenção serem particularmente benéficos para uso em conexão com os codificadores baseados em bloco que não preservam canais separados durante a codifi-cação e a decodificação, os aspectos da invenção são úteis em conexão com virtualmente qualquer codificador baseado em bloco.
[0014] As saídas de um típico codificador baseado em bloco 4 podem ser caracterizadas como "informação de áudio" e "informação auxiliar". A informação de áudio pode compreender dados representando vários canais de sinal quanto é possível nos sistemas de codificação baseados em bloco tal como AC-3, AAC e outros, por exemplo, ou, ela pode compreender somente um único canal derivado por se converter para menos canais vários canais de entrada, tal como a codificação de sinal binário e os sistemas de codificação estéreo paramétrica supracitados (o canal convertido para menos canais em um codificador de codificação de sinal binário ou em um sistema de codificação estéreo paramétrico também pode ser codificação por percepção, por exemplo, com a AAC ou com outra codificação adequada). Ela também po-de compreender um único canal ou vários canais derivados por se converter para menos canais vários canais de entrada tal como revelado no Pedido de Patente Provisório US 60/588.256, depositado em 14 de julho de 2004, para Davis et al., denominado "Low Bit Rate Audio Enconding and Decoding in Which Multiples Channels are Represented By Monophonic Channel and Auxiliary Information". O dito pedido 60.588.256 é por meio deste documento incorporado por referência em sua totalidade. A informação auxiliar pode compreender dados que se relacionam com a informação de áudio e são úteis na decodificação. No caso de vários sistemas de codificação com conversão para menos canais, a informação auxiliar pode compreender parâmetros espaciais tal como, por exemplo, diferenças de amplitude intercanal, diferenças de tempo ou fase intercanal e correlação cruzada intercanal.
[0015] A informação de áudio e a informação auxiliar a partir do codificador baseado em bloco 4 podem então ser aplicadas junto aos respectivos conversores ou funções de conversão do domínio da frequência para o domínio do tempo ("F/T") 6, cada um dos quais geralmente executa as funções inversas de um T/F descrito acima, a saber, uma FFT inversa, seguida pela adição da colocação em janela e pela sobreposição. A informação no domínio de tempo a partir da F/T 6 é aplicada junto a um empacotador ou função de empacotamento de fluxo de bits ("empacotador de fluxo de bits") 10 que proporciona uma saída de fluxo de bits codificado. Alternativamente, se o codificador for para proporcionar um fluxo de bits representando informação no domínio da frequência, a F/T 6 podem ser omitidas.
[0016] A informação de áudio no domínio da frequência e a informação auxiliar, a partir do codificador baseado em bloco 4, também são aplicadas junto a um avaliador de decodificação ou função de avaliação ("avaliador de decodificação") 14. O avaliador de decodificação 14 pode simular pelo menos uma parte de um decodificador ou função de decodificação projetado para decodificar o fluxo de bits codificado proporcionado pelo empacotador de fluxo de bits 10. Um exemplo de tal decodificador ou função de decodificação é descrito abaixo em conexão com a FIG. 2. O avaliador de decodificação 14 pode proporcionar conjuntos de coeficientes espectrais X[k]i à X[k]n que se aproximam dos conjuntos de coeficientes espectrais Y[k]i à Y[k]n de sinais de áudio de entrada correspondentes que são esperados de serem obtidos no decodificador ou função de decodificação. Alternativamente, ele pode proporcionar coeficientes espectrais para menos do que todos os sinais de áudio de entrada, para menos do que todos os blocos de tempo dos sinais de áudio de entrada, e / ou para menos do que todas as bandas de frequência (isto é, ele pode não proporcionar todos os coeficientes espectrais). Isto pode proceder, por exemplo, se for desejado aperfeiçoar somente sinais de entrada representando ca-nais julgados mais importantes que outros. Como outro exemplo, isto pode proceder se for desejado aperfeiçoar somente as partes de frequência inferiores dos sinais nos quais a audição é mais sensível aos detalhes refinados dos envelopes de forma de onda temporal.
[0017] Cada uma das saídas no domínio da frequência de T/F 2-1 à 2-n e dos conjuntos de coeficientes espectrais Y[k]i à Y[k]n são também aplicados para os respectivos dispositivos ou funções de comparar ("compare") 12-1 a 12-n. Tais conjuntos são comprados com os conjuntos correspondentes de blocos de tempo dos coeficientes espectrais estimados X[k]i a X[k]n no respectivo compare 12-1 a 12-n. Cada um dos resultados da comparação em cada compare 12-1 a 12- n é aplicado a um calculador de filtro ou função de cálculo ("calculo de filtro") 15-1 a 15-n. Esta informação deve ser suficiente para cada cálculo de filtro para definir os coeficientes de um filtro para cada bloco de tempo, filtro este que, quando aplicado a uma reconstrução decodificada de um sinal de entrada, resultaria no sinal possuindo um envelope temporal com uma resolução aperfeiçoada. Em outras palavras, o filtro reformataria o sinal de modo que ele reproduzisse mais estritamente o envelope temporal do sinal original. A resolução aperfeiçoada é uma resolução mais refinada do que a taxa de blocos. Detalhes adicionais de um filtro preferido são expostos abaixo.
[0018] Apesar do exemplo da Fig. 1 apresentar a comparação e o cálculo do filtro no domínio da frequência, a comparação e o cálculo do filtro podem ser executados no domínio do tempo. Quer executado no domínio da frequência ou no domínio do tempo, somente uma configuração de filtro é determinada por bloco de tempo (apesar da mesma configuração de filtro poder ser aplicada junto a alguns dos blocos de tempo consecutivos). Em princípio, apesar de uma configuração de filtro poder ser determinada em uma banda baseado em banda (tal como por banda da escala ERB), fazer isto exigiria o envio de um grande número de bits de informação auxiliar, o que anularia a vantagem da invenção, a saber, aperfeiçoar a resolução do envelope temporal com pouco aumento na taxa de bits.
[0019] Cada uma das medidas da comparação em cada compare 21-1 a 12-n é aplicada para um dispositivo ou função de decisão ("decisão") 16-1 a 16-n. Cada decisão compara a medida da comparação com um limite. Uma medida da comparação pode tomar várias formas e não é crítica. Por exemplo, o valor absoluto da diferença de cada valor de coeficiente correspondente pode ser calculado e as diferenças somadas para proporcionar um único número cujo valor indica o grau até o qual as formas de onda do sinal diferem umas das outras durante um bloco de tempo. Este número pode ser comparado com um limi- te de modo que se ele exceder o limite, um indicador "sim" é proporci-onado para o cálculo de filtro correspondente. Na ausência de um indicador "sim", os cálculos de filtro podem ser inibidos para o bloco, ou, se calculado, eles podem não ser emitidos pelo cálculo de filtro. Tal informação sim / não para cada sinal constitui um indicador que também pode ser aplicado junto ao empacotador de fluxo de bits 10 para inclusão no fluxo de bits (aqui, pode existir uma pluralidade de indicadores, um para cada sinal de entrada e cada indicador pode ser representado por um bit).
[0020] Alternativamente, cada decisão 16-1 a 16-n pode receber informação a partir de um respectivo cálculo de filtro 14-1 a 14-n ao invés ou em adição à informação a partir de um respectivo compare 12-1 a 12-n. A respectiva decisão 16 pode empregar as características de filtro calculadas (por exemplo, suas magnitudes médias ou de pico) como a base para tomar uma decisão ou para ajudar em tomar uma decisão.
[0021] Como mencionado acima, cada cálculo de filtro 14-1 a 14-n proporciona uma representação dos resultados da comparação, a qual pode constituir os coeficientes de um filtro, filtro este que, quando aplicado junto a uma reconstrução decodificada de um sinal de entrada resultaria no sinal possuindo um envelope temporal com uma resolução aperfeiçoada. Se os coeficientes espectrais estimados do espectro X[k]i a X[k]n estiverem incompletos (no caso do avaliador de decodificação proporcionando coeficientes espectrais para menos do que todos os sinais de áudio de entrada, para menos do que todos os blocos de tempo dos sinais de áudio de entrada e / ou para menos do que todas as bandas de frequência), podem não existir saídas de cada comparação 12-1 a 12-n para todos os blocos de tempo, bandas de frequência e sinais de entrada. O leitor deve observar que X[k]i a X[k]n se referem às saídas reconstruídas, ao passo que Y[k]i a Y[k]n se refe- rem às entradas.
[0022] A saída de cada cálculo de filtro 14-1 a 14-n pode ser aplicada junto ao montador de fluxo de bits 10. Apesar da informação de filtro poder ser enviada separadamente a partir do fluxo de bits, de preferência ela é enviada como parte do fluxo de bits e como parte da informação auxiliar. Quando os aspectos da invenção são aplicados junto aos sistemas existentes de codificação baseada em bloco, a informação adicional proporcionada pelos aspectos da presente invenção pode ser inserida nas partes do fluxo de bits de tais sistemas que são pretendidas para transportar a informação auxiliar.
[0023] Nas modalidades práticas, não somente a informação de áudio, mas também a informação auxiliar e os coeficientes de filtro serão provavelmente quantizados ou codificados de algum modo para minimizar seus custos de transmissão. Entretanto, nenhuma quantiza- ção e retirada de quantização é apresentada nas figuras, para o propósito de simplicidade na apresentação, e porque tais detalhes são bem conhecidos e não ajudam no entendimento da invenção.
Projeto de Filtro Wiener no Domínio da Fregüência
[0024] Cada um dos dispositivos ou função de cálculo de filtro 14-1 a 14-n de preferência caracteriza um filtro FIR no domínio da frequência que representa alterações multiplicativas no domínio do tempo requeridas para se obter uma reprodução mais precisa de um envelope temporal original do canal do sinal. Este problema do filtro pode ser formulado como pelo menos um problema de mínimos quadrados, o qual frequentemente é referido como projeto de filtro Wiener. Veja, por exemplo, de X. Rong Li, Probability, Random Signals, and Statistics, CRC Press 1999, New York, pág. 423. Aplicar as técnicas de filtro Wiener tem a vantagem de reduzir os bits adicionais requeridos para transportar a informação de reformatação de filtro para urn decodificador. Aplicações convencionais do filtro Wiener tipicamente são proje- tadas e aplicadas no domínio do tempo.
[0025] O problema do projeto de filtro de mínimos quadrados no domínio da frequência pode ser definido como se segue: dada a representação espectral DFT de um sinal original Y[k] e a representação espectral de uma aproximação de tal canal original X[k], calcular um conjunto de coeficiente de filtro (am) que minimize a equação 1. Observe que Y[k] e X[k] são valores complexos e assim, em geral, am também será complexo.
Figure img0001
[0026] Onde k é o índice espectral, E é o operador de expectativa e M é o comprimento do filtro sendo projetado.
[0027] A equação 1 pode ser novamente expressa utilizando as expressões de matriz como apresentado na equação 2:
Figure img0002
[0028] Onde
Figure img0003
[0029] E
Figure img0004
[0030] Assim, por estabelecer as derivadas parciais na equação 2 com respeito a cada um dos coeficientes de filtro para zero, é simples apresentar a solução para o problema de minimização, o qual é dado pela equação 3.
Figure img0005
[0031] Onde
Figure img0006
[0032] E
Figure img0007
[0033] A equação 3 define o cálculo dos coeficientes de filtro ótimos que minimizam o erro entre o espectro original (Y[k]) e o espectro reconstruído (X[k]) de um canal particular. Geralmente, um conjunto de coeficientes de filtro é calculado para cada bloco de tempo de cada sinal de entrada.
[0034] Em uma modalidade prática dos aspectos da invenção um filtro Wiener de 12â ordem é empregado, apesar da invenção não estar limitada ao uso de um filtro Wiener de tal tamanho. Tal modalidade prática emprega processamento no domínio da frequência seguindo- se a uma DFT. Por consequência, os coeficientes do filtro Wiener são números complexos e cada filtro requer a transmissão de vinte e quatro números reais. Para de forma eficiente transportar tal informação de filtro para um decodificador, a quantização de vetor (VQ) pode ser utilizada para codificar os coeficientes de cada filtro. Um livro de códigos pode ser empregado de modo que somente um índice precise ser enviado para o decodificador para transportar a informação de filtro complexo de 12â ordem. Em uma modalidade prática, um livro de códigos da tabela VQ, possuindo 24 dimensões e 16.536 entradas, foi visto como sendo útil. A invenção não está limitada ao uso da quantização de vetor nem ao uso de um livro de códigos.
[0035] Enquanto a descrição acima assume o uso de uma DFT para avaliar o conteúdo espectral e para projetar o filtro Wiener, em geral, qualquer transformação pode ser utilizada.
[0036] A FIG. 2 apresenta um exemplo de um ambiente do decodi- ficador ou do processo de decodificação no qual os aspectos da presente invenção podem ser empregados. Tal codificador ou função de decodificação pode ser adequado para operação em cooperação com um codificador ou processo de decodificação como descrito em conexão com o exemplo da FIG. 1. Um fluxo de bits codificado, tal como este produzido pela disposição da FIG. 1, é recebido por qualquer modo adequado de transmissão ou armazenamento de sinal e aplicado para um desempacotador de fluxo de bits 30 que desempacota o fluxo de bits à medida que necessário para separar a informação de áudio codificada da informação auxiliar e indicadores sim / não (se incluídos no fluxo de bits). A informação auxiliar de preferência inclui um conjunto de coeficientes de filtro para uso em aperfeiçoar a reconstrução de cada um dos um ou mais sinais de entrada que foram aplicados para a disposição de codificação da FIG. 1.
[0037] Neste exemplo, é assumido que existe um sinal reproduzido correspondendo a cada sinal de entrada e que a informação de filtro de reformatação de envelope temporal é proporcionada para cada sinal reproduzido, apesar disto não precisar ser o caso, como mencionado acima. Assim, 1 até n conjuntos de informações auxiliares de coeficiente de filtro são apresentados como saída a partir do desempacotador de fluxo de bits 30. A informação sobre coeficiente de filtro para cada sinal de entrada é aplicada para os respectivos filtros de reformatação 36-1 a 36-n, cuja operação é explicada abaixo. Cada um dos filtros também pode receber um respectivo indicador sim / não 31-1 a 31-n, indicando se o filtro deve estar ativo durante um bloco de tempo particular.
[0038] A informação auxiliar a partir do empacotador de fluxo de bits 30 também pode incluir outras informações tal como, por exemplo, diferenças de amplitude intercanal, diferenças de fase ou de tempo intercanal e correlação cruzada intercanal no caso de uma codificação de sinal binaural ou de sistema estéreo paramétrico. Um decodificador baseado em bloco 42 recebe a informação auxiliar a partir do desem- pacotador de fluxo de bits 30 junto com a informação de áudio convertida do domínio do tempo para da frequência a partir do desempacota- dor de fluxo de bits 30. A informação de áudio a partir do desempaco- tador 30 é aplicada via um conversor ou função conversora de domínio do tempo para o domínio da frequência ("T/F") 46, o qual pode ser o mesmo que qualquer um dos conversores ou funções conversoras para domínio da frequência ("T/F") 2-1 à 2-n da FIG. 1.
[0039] O decodificador baseado em bloco 42 proporciona uma ou mais saídas, cada uma das quais é uma aproximação de um sinal de entrada correspondente na FIG. 1. Apesar de alguns sinais de entrada poderem não ter um sinal de saída correspondente, o exemplo da FIG. 2 apresenta sinais de saída 1 a n, cada um dos quais é uma aproximação correspondendo a respectivo sinal dos sinais de entrada 1 a n da FIG. 1. Neste exemplo, cada um dos sinais de saída 1 até n do decodificador 42 é aplicado junto a um respectivo filtro de reformataçâo 36-1 a 36-n, cada um dos quais pode ser implementado como um filtro FIR. Os coeficientes de cada filtro FIR são controlados, em uma base de bloco, pela respectiva informação de filtro relacionando-se com um canal de entrada particular cuja saída reconstruída é para ser aperfeiçoada. A reformação multiplicativa de envelope no domínio do tempo de preferência é alcançada por se convolver cada filtro FIR com uma saída do decodificador baseado em bloco em cada um dos filtros 36-1 a 36-n. Assim, a formatação do envelope temporal de acordo com os aspectos da presente invenção tira vantagem da dualidade da frequência no tempo - a convolução no domínio do tempo é equivalente à multiplicação no domínio da frequência e vice-versa. Cada um dos sinais de saída decodificado e filtrado é então aplicado junto aos respectivos conversores ou funções de conversão do domínio de frequência para o domínio do tempo ("F/T") 44-1 a 44-n, cada um dos quais executa as funções inversas de um T/F descrito acima, a saber, uma FFT inversa, seguida pelo complemento de colocação em janela e de sobreposição. Alternativamente, um filtro adequado de reformação no domínio do tempo pode ser empregado seguindo-se cada um dos conversores do domínio da frequência para o domínio do tempo. Por exemplo, os n coeficientes polinomiais de uma curva polinomial de n-ésima ordem podem ser enviados como informação auxiliar ao invés dos coeficientes de filtro FIR e a curva aplicada pela multiplicação no domínio do tempo. Apesar de ser preferido empregar as técnicas de filtro FIR para transportar a informação de filtro de reformatação para o decodificador, outras técnicas no domínio da frequência e no domínio do tempo podem ser empregadas tais como estas expostas no Pedido de Patente 10/113.858 de Truman e Vinton, denominado "Broadband Frequency Translation for High Frequency Regeneration", depositado em 28 de março de 2002 e publicado como US 2003/0187663 A1 e 2 de outubro de 2003. O dito pedido é por meio deste documento incorporado por referência em sua totalidade.
Implementação
[0040] A invenção pode ser implementada em hardware ou software, ou em uma combinação de ambos (por exemplo, arranjos lógicos programáveis). A não ser que de outro modo especificado, os algoritmos incluídos como parte da invenção não estão inerentemente relacionados com qualquer computador ou outro aparelho particular. Em particular, várias máquinas de propósito geral podem ser utilizadas com programas escritos de acordo com as instruções neste documento, ou pode ser mais conveniente construir aparelhos mais especializados (por exemplo, circuitos integrados) para executar as etapas requeridas do método. Assim, a invenção pode ser implementada em um ou mais programas de computador executando em um ou mais siste- mas de computadores programáveis, cada um compreendendo pelo menos um processador, pelo menos um sistema de armazenamento de dados (incluindo memória e/ou elementos de armazenamento voláteis e não-voláteis), pelo menos um dispositivo ou porta de entrada, e pelo menos um dispositivo ou porta de saída. O código do programa é aplicado para dados de entrada para se executar as funções descritas neste documento e gerar a informação de saída. A informação de saída é aplicada junto a um ou mais dispositivos de saída, de modo conhecido.
[0041] Cada programa pode ser implementado em qualquer linguagem de computador desejada (incluindo linguagens de programação de máquina, assembly, ou de alto nível procedural, lógica ou orientada a objeto) para comunicação com um sistema de computador. Em qualquer caso, a linguagem pode ser uma linguagem compilada ou interpretada.
[0042] Cada programa de computador de preferência é armazenado ou transferido para um meio ou dispositivo de armazenamento (por exemplo, memória ou meio de estado sólido, ou meio magnético ou ótico) legível por um computador programável de propósito geral ou especial, para configurar e operar o computador quando o meio ou dispositivo de armazenamento é lido pelo sistema de computador para executar os procedimentos descritos neste documento. O sistema da invenção também pode ser considerado como sendo implementado como um meio de armazenamento legível por computador, configurado com um programa de computador, onde o meio de armazenamento desse modo configurado causa que um sistema de computador opere de uma maneira específica e predefinida para executar as funções descritas neste documento.
[0043] Várias modalidades da invenção foram descritas. Entretanto, será entendido que várias modificações podem ser feitas sem se afastar do espírito e do escopo da invenção. Por exemplo, algumas das etapas descritas neste documento podem ser independentes da ordem e assim, podem ser executadas em uma ordem diferente desta descrita.
Incorporação por Referência
[0044] As seguintes patentes, pedidos de patente e publicações são incorporados por este documento por referência em sua totalidade.
[0045] AC-3
[0046] ATSC Standard A52/A: Digital Audio Compression Standard (AC-3), Revision A, Advanced Television Systems Committee, 20 de agosto de 2001. O documento A/52A está disponível na Internet em http://www.atsc.orq/standards.html.
[0047] "Design and Implementation of AC-3 Coders", por Steve Vernon, IEEE Trans. Consumer Electronics, Vol. 41, N2 3, agosto de 1995.
[0048] "The AC-3 Multichannel Coder" por Mark Davis, Audio Engineering Society Preprint 3774, 95th AES Convention, outubro, 1993.
[0049] "High Quality, Low-Rate Audio Transform Coding for Transmission and Multimedia Applications", por Bosi et al, Audio Engineering Society Preprint 3365, 93rd AES Convention, outubro, 1992.
[0050] Patentes dos Estados Unidos 5.583.962; 5.632.005; 5.633.981; 5.727.119; e 6.021.386.
[0051] AAC
[0052] ISO/IEC JTC1/SC29, "Information Technology - very low bitrate audio-visual coding", ISO/IEC IS-14496 (Part 3, Audio), 1996
[0053] ISO/IEC 13818-7. "MPEG-2 advanced audio coding, AAC". International Standard, 1997;
[0054] De M. Bosi, K. Brandenburg, S. Quackenbush, L. Fielder, K. Akagiri, H. Fuchs, M. Dietz, J. Herre, G. Davdson e Y. Oikawa: "ISO/IEC MPEG-2 Advanced Audio Coding". Proc. Of the 101st AES- Convention, 1996;
[0055] De M. Bosi, K. Brandenburg, S. Quackenbush, L. Fielder, K. Akagiri, H. Fuchs, M. Dietz, J. Herre, G. Davdson e Y. Oikawa: "ISO/IEC MPEG-2 Advanced Audio Coding", Journal of the AES, Vol. 45 No. 10, Outubro, 1997, pps. 789 até 814;
[0056] Kartheinz Brandenburg: "MP3 and AAC explained". Proc. Of the AES 17th International Conference on High Quality Audio Coding, Florence, Italia, 1999; e
[0057] G. A. Soulodre et al.: "Subjective Evaluation of State-of-the- Art Two-Channel Audio Codecs" J. Audio Eng. Soc., Vol. 46, No. 3, pp. 164 até 177, Março, 1998.
[0058] Estéreo de Intensidade MPEG
[0059] Patentes dos Estados Unidos 5.323.396; 5.539.829; 5.606.618 e 5.621.855.
[0060] Pedido de Patente dos Estados Unidos Publicado US 2001/0044713, publicado.
[0061] Codificação Espacial e Paramétrica
[0062] Pedido de Patente Provisório 60/588.256, depositado em 14 de julho de 2004, de Davis et al., denominado "Low Bit Rate Audio Encoding and Decoding in Which Multiple Channels are Represented By Monophonic Channel and Auxiliary Information".
[0063] Pedido de Patente Publicado US 2003/0026441, publicado em 6 de fevereiro de 2003.
[0064] Pedido de Patente Publicado dos Estados Unidos US 2003/0035553, publicado em 20 de fevereiro de 2003.
[0065] Pedido de Patente dos Estados Unidos Publicado US 2003/0219130 (Baumgarte &Faller), publicado em 27 de Novembro de 2003.
[0066] Audio Engineering Society Paper 5852, março, 2003.
[0067] Pedido de Patente Internacional Publicado WO 03/090206, publicado em 30 de outubro de 2003.
[0068] Pedido de Patente Internacional Publicado WO 03/090207, publicado em 30 de outubro de 2003.
[0069] Pedido de Patente Internacional Publicado WO 03/090208, publicado em 30 de outubro de 2003.
[0070] Pedido de Patente Internacional Publicado WO 03/007656, publicado em 22 de janeiro de 2003.
[0071] Publicação de Pedido de Patente Publicada dos Estados Unidos US 2003/0236583 A1, Baumgarte et al., publicado em 25 de dezembro de 2003, "Hybrid Multi-Channel/Cue Coding/Decoding of Audio Signals", Pedido Número de Série 10/246.570.
[0072] "Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression", por Faller et al., Audio Engineering Society Convention Paper 5574, 112th Convention, Munique, maio de 2002.
[0073] "Why Binaural Cue Coding is Better than Intensity Stereo Coding", por Baumgarte et al., Audio Engineering Society Convention Paper 5575, 112th Convention, Munique, maio de 2002.
[0074] "Design and Evaluation of Binaural Cue Coding Schemes", por Baumgarte et al., Audio Engineering Society Convention Paper 5706, 113th Convention, Los Angeles, outubro de 2002.
[0075] "Efficient Representation of Spatial Audio Using Peceptual Parameterization", por Faller et al., IEEE Workshop on Application of Signal Processing to Audio and Acoustics 2001, New Paltz, New York, Outubro de 2001, pp. 199 a 202.
[0076] "Estimation of Auditory Spatial Cues for Binaural Cue Coding", por Baumgarte et al., Proc. ICASSP, Orlando, Florida, maio de 2002, pp. 11-1801 à 1804.
[0077] "Binaural Cue Coding: A Novel and Efficient Representation of Spatial Audio", por Faller et al., Proc. ICASSP 2002, Orlando, Flori- da, maio de 2002, pp. II - 1841 - II - 1844.
[0078] "High-quality parametric spatial audio coding at low bitrates", por Breebaart et al., Audio Engineering Society Convention Paper 6072, 116th Convention, Berlim, maio de 2004.
[0079] "Audio Coder Enhancement using Scalable Binaural Cue Coding with Equalized Mixing", por Baumgarte et al., Audio Engineering Society Convention Paper 6060, 116th Convention, Berlim, Maio de 2004.
[0080] "Low complexity parametric stereo coding", por Schuijers et al., Audio Engineering Society Convention Paper 6073, 116th Convention, Berlim, Maio de 2004.
[0081] "Synthetic Ambience in Parametric Stereo Coding", por En- gdegard et al., Audio Engineering Society Convention Paper 6074, 116th Convention, Berlim, Maio de 2004.
[0082] Outros
[0083] Patente US 5.812.971, Herre, Enhanced Join Stereo Co ding Method Using Temporal Envelope Shaping", 22 de setembro de 1998.
[0084] "Intensity Stereo Coding", por Herre et al., Audio Engineering Society Preprint 3799, 96th Convention, Amsterdam, 1994.

Claims (6)

1. Método para decodificação de sinal de áudio no qual uma pluralidade de sinais de áudio de entrada foi combinada em um sinal composto e codificada (4) em um fluxo de bits compreendendo informação de áudio e informação auxiliar relativa à informação de áudio e útil na decodificação (42) do fluxo de bits, em que a informação de áudio é uma versão perceptual codificada do sinal composto, a co-dificação (4) incluindo o processamento que divide cada um da plurali-dade de sinais de áudio de entrada em blocos de tempo e atualiza pelo menos algumas das informações auxiliares não mais frequentemente do que a taxa de blocos, de modo que a informação de áudio, quando decodificada (42) utilizando a informação auxiliar, possua uma resolução de envelope temporal limitada pela taxa de blocos, a codificação (4) ainda incluindo a comparação (12-1; 12-n) do envelope temporal de pelo menos um sinal de áudio de entrada com o envelope temporal de uma reconstrução decodificada estimada (14) de cada tal pelo menos um sinal de áudio de entrada, reconstrução estimada esta que emprega pelo menos algumas das informações de áudio e pelo menos algumas das informações auxiliares, a comparação (12-1; 12-n) fornecendo uma representação dos resultados da comparação (12- 1 ;12-n), tais representações sendo úteis para aperfeiçoar a resolução de envelopes temporal de pelo menos algumas das informações de áudio quando decodificadas (42), e a codificação (4) ainda incluindo a emissão de pelo menos algumas das representações, caracterizado pelo fator de que compreende as etapas de: receber o fluxo de bits, e decodificar (42) o fluxo de bits, a decodificação (42) empre-gando a informação de áudio, a informação auxiliar e as representações emitidas.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fator de que a pluralidade dos sinais de áudio de entrada compreende uma representação de domínio de frequência.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fator de que a pluralidade dos sinais de áudio de entrada com-preende uma representação de domínio de tempo.
4. Decodificador de sinal de áudio no qual uma pluralidade de sinais de áudio de entrada foi combinada em um sinal composto e codificada (4) em um fluxo de bits compreendendo informação de áudio e informação auxiliar relativa à informação de áudio e útil na decodificação (42) do fluxo de bits, em que a informação de áudio é uma versão perceptual codificada do sinal composto, a codificação (4) incluindo processamento que divide cada uma da pluralidade de sinais de áudio de entrada em blocos de tempo e atualiza pelo menos algumas das informações auxiliares não mais frequentemente do que a taxa de blocos, de modo que a informação de áudio, quando decodificada (42) utilizando a informação auxiliar, possua uma resolução de envelope temporal limitada pela taxa de blocos, a codificação (4) ainda incluindo a comparação (12-1 ;12-n) do envelope temporal de pelo menos um sinal de áudio de entrada com o envelope temporal de uma reconstrução decodificada estimada (14) de cada tal pelo menos um sinal de áudio de entrada, reconstrução estimada esta que emprega pelo menos algumas das informações de áudio e pelo menos algumas das informações auxiliares, a comparação (12-1 ;12-n) fornecendo uma representação dos resultados da comparação (12-1 ;12-n), tais representações sendo úteis para aperfeiçoar a resolução de envelopes temporal de pelo menos algumas das informações de áudio quando decodificadas (42), e a codificação (4) ainda incluindo a emissão de pelo menos algumas das representações, caracterizado pelo fator de que compreende: meio para recebimento do fluxo de bits, e meio para decodificação (42) do fluxo de bits, a decodificação (42) empregando a informação de áudio, a informação auxiliar e as representações emitidas.
5. Decodificador, de acordo com a reivindicação 4, caracte-rizado pelo fator de que a pluralidade dos sinais de áudio de entrada compreende uma representação de domínio de frequência.
6. Decodificador, de acordo com a reivindicação 4, caracte-rizado pelo fator de que a pluralidade dos sinais de áudio de entrada compreende uma representação de domínio de tempo.
BR122018077099-6A 2004-08-25 2005-08-15 método para decodificação de sinal de áudio e decodificador de sinal de áudio BR122018077099B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US60483604P 2004-08-25 2004-08-25
US60/604,836 2004-08-25
BRPI0514650-0A BRPI0514650B1 (pt) 2004-08-25 2005-08-15 Métodos para codificação e decodificação de sinais de áudio, codificador e decodificador de sinais de áudio
PCT/US2005/029157 WO2006026161A2 (en) 2004-08-25 2005-08-15 Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering

Publications (1)

Publication Number Publication Date
BR122018077099B1 true BR122018077099B1 (pt) 2020-11-10

Family

ID=35636849

Family Applications (3)

Application Number Title Priority Date Filing Date
BR122018077099-6A BR122018077099B1 (pt) 2004-08-25 2005-08-15 método para decodificação de sinal de áudio e decodificador de sinal de áudio
BR122018077089A BR122018077089B8 (pt) 2004-08-25 2005-08-15 decodificador de áudio
BRPI0514650-0A BRPI0514650B1 (pt) 2004-08-25 2005-08-15 Métodos para codificação e decodificação de sinais de áudio, codificador e decodificador de sinais de áudio

Family Applications After (2)

Application Number Title Priority Date Filing Date
BR122018077089A BR122018077089B8 (pt) 2004-08-25 2005-08-15 decodificador de áudio
BRPI0514650-0A BRPI0514650B1 (pt) 2004-08-25 2005-08-15 Métodos para codificação e decodificação de sinais de áudio, codificador e decodificador de sinais de áudio

Country Status (15)

Country Link
US (3) US8255211B2 (pt)
EP (4) EP4036914A1 (pt)
JP (2) JP5038138B2 (pt)
KR (3) KR101253699B1 (pt)
CN (3) CN102270453B (pt)
AU (2) AU2005280392B2 (pt)
BR (3) BR122018077099B1 (pt)
CA (1) CA2589623C (pt)
ES (3) ES2899286T3 (pt)
IL (3) IL181407A (pt)
MX (1) MX2007001948A (pt)
MY (2) MY163042A (pt)
PL (3) PL3940697T3 (pt)
TW (3) TWI393120B (pt)
WO (1) WO2006026161A2 (pt)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI393120B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126844A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
JP5536335B2 (ja) * 2005-10-20 2014-07-02 エルジー エレクトロニクス インコーポレイティド マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置
JP4801174B2 (ja) * 2006-01-19 2011-10-26 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
EP1982326A4 (en) * 2006-02-07 2010-05-19 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
US8116459B2 (en) * 2006-03-28 2012-02-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Enhanced method for signal shaping in multi-channel audio reconstruction
EP2168122B1 (en) 2007-07-13 2011-11-30 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness
CN101673545B (zh) * 2008-09-12 2011-11-16 华为技术有限公司 一种编解码方法及装置
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
WO2010098120A1 (ja) * 2009-02-26 2010-09-02 パナソニック株式会社 チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CA3076786C (en) 2010-04-09 2021-04-13 Dolby International Ab Mdct-based complex prediction stereo coding
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
EP2661746B1 (en) * 2011-01-05 2018-08-01 Nokia Technologies Oy Multi-channel encoding and/or decoding
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
US9015042B2 (en) 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
PT2883225T (pt) 2012-08-10 2017-09-04 Fraunhofer Ges Forschung Codificador, descodificador, sistema e método empregando um conceito residual para codificação de objeto de áudio paramétrico
BR112015025092B1 (pt) * 2013-04-05 2022-01-11 Dolby International Ab Sistema de processamento de áudio e método para processar um fluxo de bits de áudio
EP2830059A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling energy adjustment
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
EP3701523B1 (en) 2017-10-27 2021-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise attenuation at a decoder
JP7092047B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 符号化復号方法、復号方法、これらの装置及びプログラム
TW202334938A (zh) * 2021-12-20 2023-09-01 瑞典商都比國際公司 正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫
KR102446720B1 (ko) * 2022-02-18 2022-09-26 오드컨셉 주식회사 이미지 복원 모델, 및 이미지 복원 모델의 학습 방법
KR102423552B1 (ko) * 2022-02-28 2022-07-21 오드컨셉 주식회사 적대적 생성 신경망으로 구성된 상품 이미지 복원 및 합성 모델, 및 상품 이미지 복원 및 합성 모델의 학습 방법

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4875095A (en) * 1987-06-30 1989-10-17 Kokusai Denshin Denwa Kabushiki Kaisha Noise-shaping predictive coding system
US4943855A (en) * 1988-07-22 1990-07-24 At&T Bell Laboratories Progressive sub-band image coding system
US5539829A (en) 1989-06-02 1996-07-23 U.S. Philips Corporation Subband coded digital transmission system using some composite signals
US6289308B1 (en) 1990-06-01 2001-09-11 U.S. Philips Corporation Encoded wideband digital transmission signal and record carrier recorded with such a signal
NL9000338A (nl) 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
AU6723490A (en) * 1989-10-11 1991-05-16 Cias, Inc. Optimal error-detecting and error-correcting code and apparatus
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
ATE138238T1 (de) 1991-01-08 1996-06-15 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
NL9100173A (nl) 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
DE4320990B4 (de) * 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
DE4331376C1 (de) * 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
BE1007616A3 (nl) * 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met vereenvoudigde broncodering.
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3365874B2 (ja) 1994-10-05 2003-01-14 富士写真フイルム株式会社 キノンジアジドの合成法およびこれを含むポジ型レジスト
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3747492B2 (ja) * 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
JP4132109B2 (ja) * 1995-10-26 2008-08-13 ソニー株式会社 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
GB9614209D0 (en) * 1996-07-05 1996-09-04 Univ Manchester Speech synthesis system
JP3259759B2 (ja) * 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JP4132154B2 (ja) * 1997-10-23 2008-08-13 ソニー株式会社 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
DE19747132C2 (de) * 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
TW382094B (en) * 1997-12-11 2000-02-11 Inventec Corp Base tone synchronous differential coding method and device thereof
US6529730B1 (en) * 1998-05-15 2003-03-04 Conexant Systems, Inc System and method for adaptive multi-rate (AMR) vocoder rate adaption
CA2421742A1 (en) * 2000-09-08 2002-03-14 Findthedot, Inc. A method and system of connecting printed media to electronic information as a response to a request
US6614365B2 (en) * 2000-12-14 2003-09-02 Sony Corporation Coding device and method, decoding device and method, and recording medium
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
CN1308913C (zh) * 2002-04-11 2007-04-04 松下电器产业株式会社 编码设备、解码设备及其方法
JP4399185B2 (ja) * 2002-04-11 2010-01-13 パナソニック株式会社 符号化装置および復号化装置
US7215787B2 (en) 2002-04-17 2007-05-08 Dirac Research Ab Digital audio precompensation
JP4714416B2 (ja) 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的オーディオのパラメータ表示
US8498422B2 (en) 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
ATE354161T1 (de) 2002-04-22 2007-03-15 Koninkl Philips Electronics Nv Signalsynthese
US20040086130A1 (en) * 2002-05-03 2004-05-06 Eid Bradley F. Multi-channel sound processing systems
BRPI0305434B1 (pt) * 2002-07-12 2017-06-27 Koninklijke Philips Electronics N.V. Methods and arrangements for encoding and decoding a multichannel audio signal, and multichannel audio coded signal
AU2003247040A1 (en) * 2002-07-16 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
US20040083417A1 (en) * 2002-10-29 2004-04-29 Lane Richard D. Multimedia transmission using variable error coding rate based on data importance
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
EP2065885B1 (en) * 2004-03-01 2010-07-28 Dolby Laboratories Licensing Corporation Multichannel audio decoding
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
EP1769491B1 (en) * 2004-07-14 2009-09-30 Koninklijke Philips Electronics N.V. Audio channel conversion
TWI393120B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
US10113858B2 (en) 2015-08-19 2018-10-30 Medlumics S.L. Distributed delay-line for low-coherence interferometry
US9996281B2 (en) 2016-03-04 2018-06-12 Western Digital Technologies, Inc. Temperature variation compensation
CN113535073B (zh) 2020-04-22 2024-04-16 伊姆西Ip控股有限责任公司 管理存储单元的方法、电子设备和计算机可读存储介质

Also Published As

Publication number Publication date
AU2011200680A1 (en) 2011-03-10
AU2011200680C1 (en) 2013-03-14
IL201469A (en) 2012-07-31
KR20120006077A (ko) 2012-01-17
TW201333933A (zh) 2013-08-16
WO2006026161A2 (en) 2006-03-09
EP3940697B1 (en) 2022-06-22
BR122018077089B1 (pt) 2020-11-10
BRPI0514650A (pt) 2008-06-24
TWI393120B (zh) 2013-04-11
CN101006494A (zh) 2007-07-25
ES2658824T3 (es) 2018-03-12
KR101253699B1 (ko) 2013-04-12
KR20110069179A (ko) 2011-06-22
BRPI0514650B1 (pt) 2019-09-24
ES2899286T3 (es) 2022-03-10
US8255211B2 (en) 2012-08-28
MX2007001948A (es) 2007-04-23
US20080033731A1 (en) 2008-02-07
AU2011200680B2 (en) 2012-05-24
CN102968996B (zh) 2015-06-10
TWI497485B (zh) 2015-08-21
CN102270453A (zh) 2011-12-07
CN102270453B (zh) 2014-06-18
AU2005280392A1 (en) 2006-03-09
US20080040103A1 (en) 2008-02-14
EP3279893B1 (en) 2021-09-22
IL201469A0 (en) 2011-07-31
EP4036914A1 (en) 2022-08-03
IL214135A (en) 2015-10-29
IL214135A0 (en) 2011-08-31
EP3279893A1 (en) 2018-02-07
US7945449B2 (en) 2011-05-17
AU2005280392B2 (en) 2011-02-24
CA2589623A1 (en) 2006-03-09
EP3940697A1 (en) 2022-01-19
JP2008511040A (ja) 2008-04-10
MY163042A (en) 2017-07-31
JP5292498B2 (ja) 2013-09-18
BR122018077089B8 (pt) 2021-01-05
JP2012177939A (ja) 2012-09-13
KR20070051860A (ko) 2007-05-18
TWI498882B (zh) 2015-09-01
MY151318A (en) 2014-05-15
CA2589623C (en) 2014-10-28
JP5038138B2 (ja) 2012-10-03
TW201316327A (zh) 2013-04-16
PL1784818T3 (pl) 2018-04-30
ES2923661T3 (es) 2022-09-29
US20080046253A1 (en) 2008-02-21
EP1784818B1 (en) 2017-11-15
CN101006494B (zh) 2011-09-07
IL181407A (en) 2011-10-31
IL181407A0 (en) 2007-07-04
PL3940697T3 (pl) 2022-08-22
WO2006026161A3 (en) 2006-05-04
TW200611240A (en) 2006-04-01
KR101139880B1 (ko) 2012-05-02
CN102968996A (zh) 2013-03-13
EP1784818A2 (en) 2007-05-16
PL3279893T3 (pl) 2022-02-07

Similar Documents

Publication Publication Date Title
BR122018077099B1 (pt) método para decodificação de sinal de áudio e decodificador de sinal de áudio
JP7122076B2 (ja) マルチチャネル符号化におけるステレオ充填装置及び方法
RU2665214C1 (ru) Стереофонический кодер и декодер аудиосигналов
KR101178060B1 (ko) 공간 오디오 코딩에서의 복수채널 역상관
US9570082B2 (en) Method, medium, and apparatus encoding and/or decoding multichannel audio signals
KR102380370B1 (ko) 오디오 인코더 및 디코더
EP2904609A1 (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
KR102033985B1 (ko) 공간적 오디오 객체 코딩에 오디오 정보를 적응시키기 위한 장치 및 방법
KR101783967B1 (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법
AU2012205170B2 (en) Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Weiner Filtering
KR20160078321A (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B12B Appeal against refusal [chapter 12.2 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 10/11/2020, OBSERVADAS AS CONDICOES LEGAIS.