BRPI0508146B1 - Codificação baseada na freqüência de canais em sistemas de codificação paramétrica multicanais - Google Patents
Codificação baseada na freqüência de canais em sistemas de codificação paramétrica multicanais Download PDFInfo
- Publication number
- BRPI0508146B1 BRPI0508146B1 BRPI0508146-7A BRPI0508146A BRPI0508146B1 BR PI0508146 B1 BRPI0508146 B1 BR PI0508146B1 BR PI0508146 A BRPI0508146 A BR PI0508146A BR PI0508146 B1 BRPI0508146 B1 BR PI0508146B1
- Authority
- BR
- Brazil
- Prior art keywords
- audio
- channels
- channel
- parametric
- frequency
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 60
- 230000005236 sound signal Effects 0.000 claims abstract description 22
- 230000005540 biological transmission Effects 0.000 claims description 14
- 230000002194 synthesizing effect Effects 0.000 claims 2
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
codificação baseada na freqüência de canais em sistemas de codificação paramétrica multicanais para um sinal de áudio multicanais, a codificação paramétrica é aplicada a diferentes subconjuntos de canais de entrada de áudio para diferentes regiões de freqüências. por exemplo, para um sinal de som surround 5.1 tendo cinco canais regulares e um canal de baixa freqüncia (lfe), pode ser aplicada a binaural cue coding (bcc) a todos os seis canais de áudio para sub-bandas com freqüências iguais ou abaixo de um freqüência de corte especificada, mas a somente cinco canais de áudio (excluindo o canal (lfe) para sub-bandas acima da freqüência de corte. essa codificação de canais baseada em freqüência pode reduzir as cargas de processamento de codificação e de coficação e/ou o tamanho da seqüência de bits codificada de áudio relativos ás técnicas de codificação paramétrica que são aplicadas a todos os canais de entrada em toda a faixa de freqüências.
Description
CODIFICAÇÃO BASEADA NA FREQÜÊNCIA DE CANAIS EM SISTEMAS DE CODIFICAÇÃO PARAMÉTRICA MULTICANAIS
HISTÓRICO DA INVENÇÃO
Campo da Invenção
A presente invenção se refere à codificação de sinais de áudio e à síntese subsequente das cenas de auditório a partir de dados de áudio codificados.
Referência Cruzada com as Aplicações Relacionadas presente pedido reivindica o benefício da data 10 de depósito do pedido provisório dos Estados Unidos n2 60/549.972, ’ depositado em 04/03/04 como o protocolo n2 Faller 14-2. A matéria do assunto do presente pedido se relaciona com a matéria do assunto do pedido de patente dos Estados Unidos número de série 09/848.877 depositado em 04/05/2001 como o protocolo n2 Faller 5 ' 15 (o pedido '877), o pedido de patente dos Estados Unidos número 1 de série 10/045.458 depositado em 07/11/2001 como o protocolo n2
Baumgarte 1-6-8 (o pedido '458), e o pedido de patente dos
Estados Unidos número de série 10/155.437 depositado em 24/05/2002 como o protocolo n2 Baumgarte 2-10 (o pedido '437), e o pedido de patente dos Estados Unidos número de série 10/815.591 depositado em 01/04/2004 como o protocolo n2 Baumgarte 7-12 (o pedido '591), cujos ensinamentos de todos são incorporados ao presente como referência.
Descrição da Técnica Relacionada
Os sistemas de áudio surround multicanais têm sido padrão nos cinemas por anos. Com o avanço tecnológico, tornou-se possível a produção de sistemas surround multicanais para uso doméstico. Hoje, esses sistemas são vendidos em grande fr «frfr fr » frfr* fr fr · fr fr··· frfr ·., frfr fr · fr · « • ♦♦•••fr • fr fr ♦ · • frfr fr
C. Faller representation of spatial coding using perceptual •v · parte como sistemas home theater. De acordo com uma recomendação ITU-R, a grande maioria desses sistemas proporciona cinco canais regulares de áudio e um canal subwoofer de baixa frequência (indicando os efeitos de baixa frequência ou canal LFE) . Esse, sistema multicanais é denominado sistema surround 5.1. Existem outros sistemas surround, como o 7.1 (sete canais regulares e um canal LFE) e 10.2 (dez canais regulares e dois canais LFE).
e F. Baumgarte, Efficient audio parametrization IEEE Workshop on Appl. of Sig. Proc. Co Audio and Acoust., October 2001, and C. Faller and F. Baumgarte, Binaural
Cue Coding Applied to Stereo and Multi-Channel Audio Compression,
Preprint 112th Conv. Aud. Eng. Soc., May 2002, (coletivamente, os documentos BCC), cujos ensinamentos de ambos estão incorporados '15 ao presente por referência, descrevem uma técnica de codificação paramétrica de áudio multicanais (denominada como codificação
BCC) .
A Fig. 1 mostra um diagrama de blocos de um sistema de processamento de áudio 100 que realiza o binaural cue coding (BCC) de acordo com os documentos BCC. O sistema BCC 100 tem um codificador BCC 102 que recebe C canais de entrada de áudio
108, por exemplo, um de cada qual dos C diferentes microfones 106.
codificador BCC 102 tem um downmixer 110, que : converte os C canais de entrada de áudio em um sinal de soma monoáudio 112.
Além disso, o codificador BCC 102 tem um analisador BCC 114, que gera uma seqüência de dados cue code BCC
116 para os C canais de entrada. Os cue codes BCC (também denominados como parâmetros de cena de auditório) incluem dados de • * . » · · · · · · · · • , · · ··♦···« » * .,··#··· » • . · *** diferenças de níveis intercanais (ICLD) e diferença de tempo intercanais (ICTD) para cada canal de entrada. O analisador BCC 114 realiza um processamento baseado em banda para gerar dados ICLD e ICTD para cada uma ou mais diferentes sub-bandas de frequência. (ex., diferentes bandas críticas) dos canais de entrada de áudio.
O codificador BCC 102 transmite o sinal de soma
112 e a seqüência de dados cue code BCC 116 (ex., tanto como informações colaterais em banda como fora da banda, em relação ao sinal de soma) para um decodificador BCC 104 do sistema BCC 100. 0 decodificador BCC 104 tem um processador de informações colaterais 118, que processa a seqüência de dados 116 para recuperar os cue codes BCC 120 (ex., dados ICLD e ICTD). O decodif icador BCC 104 também tem um sintetizador BCC 122, que usa os cue codes BCC J 15 recuperados 120 para sintetizar C canais de saída de áudio 124 do sinal de soma 112 para reprodução pelos C alto-falantes 126, respectivamente.
O sistema de processamento de áudio 100 pode ser implementado no contexto de sinais de áudio multicanais, como o som surround 5.1. Em particular, o downmixer 110 do codificador
BCC 102 convertería os seis canais de entrada do som surround 5.1 convencional (isto é, cinco canais regulares + um canal LFE) no sinal de soma 112. Além disso, o analisador BCC 114 do codificador
102 transformaria os seis canais de entrada no domínio de frequência para gerar os cue codes BCC 116 correspondentes. De maneira análoga, o processador de informações colaterais 118 do decodificador BCC 104 recuperaria os cue codes BCC 120 da seqüência de informações colaterais recebida 116 e o sintetizador
• « | • · • * · | • | • | • | • • | • • * | • ♦ |
• · | * · | • | * | ||||
• · | • | • | • | • | |||
• · | • | • | • | • · |
λ;
* ' 15 ?J <
8’
BCC 122 do decodificador 104 (1) transformaria ò sinal de soma recebido 112 no domínio de freqüência, (2) aplicaria os cue codes BCC recuperados 120 ao sinal de soma no domínio de freqüência para gerar seis sinais no domínio de freqüência e (3) transformaria esses sinais no domínio de freqüência em seis canais no domínio de freqüência do som surround 5.1 sintetizado (isto é, cinco canais regulares sintetizados + um canal LFE sintetizado) para reprodução pelos alto-falantes 126.
SUMÁRIO DA INVENÇÃO
Para aplicações de som surround, as configurações da presente invenção envolvem uma técnica de codificação para paramétrica de áudio baseada em BCC, em que a .codificação BCC baseada em banda não é aplicada ao(s) canal(is) (LFE) subwoofer de baixa freqüência para sub-bandas de freqüência acima da freqüência de corte. Por exemplo, para o som surround 5.1, a codificação BCC é aplicada a todos os seis canais (isto é, os cinco canais regulares mais o canal LFE) para sub-bandas abaixo da freqüência de corte, enquanto a codificação BCC é aplicada a somente os cinco canais regulares (isto é, e não ao canal LFE) para sub-bandas acima da freqüência de corte. Evitando a codificação BCC do canal
LFE em altas frequências, essas configurações da presente
Ϊ invenção têm (1) reduzidas cargas de processamento tanto no codificador como no decodificador e (2) menores sequências de bits de código BCC do que os sistemas baseados em BCC correspondentes que processam todos os seis canais em todas as freqüências.
I
De modo geral, a presente invenção envolve a aplicação de técnicas de codificação paramétrica de áudio, como a codificação BCC, mas não necessariamente limitada à codificação • * • · ·< ·· · ·
BCC, onde dois ou mais diferentes subconjuntos de canais de entrada são processados para duas ou mais diferentes faixas de frequências. Como usado na presente especificação, o termo subconjunto pode ser referir ao conjunto que contém todos os canais de entrada, assim como àqueles subconjuntos adequados que incluem menos do que todos os canais de entrada. A aplicação da presente invenção à codificação BCC de 5.1 e de outros sinais de som surround ê somente um exemplo particular da presente invenção.
BREVE DESCRIÇÃO DOS DESENHOS
Outros aspectos, características e vantagens da presente invenção se tornarão mais totalmente aparentes a partir da descrição detalhada a seguir, das reivindicações anexas e dos desenhos de acompanhamento, onde:
A Fig. 1 mostra um diagrama de blocos de um 15 sistema de processamento de áudio que realiza o binaural cue coding (BCC); e
A Fig. 2 mostra um diagrama de blocos de um sistema de processamento de áudio que realiza a codificação BCC de acordo com uma configuração da presente invenção.
DESCRIÇÃO DETALHADA
A Fig. 2 mostra um diagrama de blocos de um sistema de processamento de áudio 200 que realiza o binaural cue coding (BCC) para áudio surround 5.1, de acordo com uma configuração da presente invenção. 0 sistema BCC 200 tem um codificador BCC 202, que recebe seis canais de entrada de áudio 208 (isto é, cinco canais regulares e um canal LFE). 0 codificador
BCC 202 tem um downmixer 210, que converte (ex., faz a média) dos canais de entrada de áudio (incluindo o canal LFE) em um ou mais,
AO • j· mas menos do que seis, canais combinados 212.
Além disso, o codificador BCC 202 tem um analisador BCC 214 que gera uma seqüência de dados cue code BCC 216 para os canais de entrada. Como indicado na Fig. 2, para as sub-bandas de freqüência em ou abaixo de uma frequência de corte fc especificada, o analisador BCC 214 usa todos os seis canais de entrada de som surround 5.1 (incluindo o canal LFE) ao gerar dados cue code BCC. Para todos as demais sub-bandas (isto é, alta freqüência), o analisador BCC 214 usa somente os cinco canais regulares (e não o canal LFE) para gerar os dados cue code BCC. ' Como resultado, o canal LFE contribui com os códigos BCC somente nas sub-bandas BCC na ou abaixo da freqüência de corte, em vez de em toda a gama de frequências BCC, reduzindo, assim, o tamanho geral da seqüência de dados de informações colaterais.
*15 A freqüência de corte é escolhida preferivelmente de maneira que a largura de banda efetiva de áudio do canal LFE seja menor ou igual a fc (isto ê, o canal LFE tem energia substancialmente zero ou teor não substancial de áudio além da freqüência de corte) . A menos que as sub-bandas de freqüência estejam alinhadas com a freqüência de corte, esta se situa dentro de uma determinada sub-banda de freqüência. Nesse caso, parte da sub-banda ultrapassará a freqüência de corte. Para os objetivos da presente especificação, essa sub-banda é denominada como estando na freqüência de corte. Nas configurações preferidas, toda aquela sub-banda do canal LFE tem codificação BCC, e a próxima mais alta sub-banda de freqüência é a primeira sub-banda de alta freqüência que não tem codificação BCC.
Em uma possível implementação, os cue codes BCC
• · · · • · · · • ·
incluem dados de diferença de nível intercanais (ICLD), de diferença de tempo intercanais (ICTD) e de correlação intercanais (ICC) para os canais de entrada. O analisador BCC 214 realiza preferivelmente o processamento análogo baseado em banda ao descrito nos pedidos '877 e '458, para gerar dados ICLD e ICTD para diferentes sub-bandas de frequência dos canais de entrada de áudio. Além disso, o analisador BCC 214 gera preferivelmente medidas de coerência como os dados ICC para as diferentes subbandas de frequências. Essas medidas de coerência estão descritas em maiores detalhes nos pedidos '437 e '591.
O codificador BCC 202 transmite um ou mais canais combinados 212 e a seqüência de dados cue code BCC 216 (ex., tanto como informações colaterais na banda ou fora da banda em relação aos canais combinados) para um decodificador BCC 204 do sistema BCC 200. O decodificador BCC 204 tem um processador de informações colaterais 218, que processa seqüência de dados 216 para recuperar os cue codes BCC 220 (ex. , dados ICLD, ICTD e ICC). O decodif icador BCC 204 também tem um sintetizador BCC 222, que usa os cue codes BCC recuperados 22 0 para sintetizar seis canais de saída de áudio 224 de um ou mais canais combinados 212 para reproduzir em seis alto-falantes de som surround 226, respectivamente.
Como indicado na Fig. 2, o sintetizador BCC 222 realiza a síntese BCC de seis canais para sub-bandas com freqüências iguais ou abaixo da freqüência de corte fc para gerar teor de freqüência para todos os seis canais surround 5.1 (isto é, incluindo o canal LFE), enquanto realiza a síntese BCC de cinco canais para sub-bandas acima da freqüência de corte para gerar
* 15 teor de frequência para somente os cinco canais regulares de som surround 5.1. Em particular, o sintetizador BCC 222 decompõe o(s) canal(is) combinados recebidos 212 em um número de sub-bandas de frequência (ex., bandas críticas). Nessas sub-bandas, são aplicados diferentes processamentos para obter as sub-bandas correspondentes dos canais de áudio de saída. O resultado é que, para o canal LFE, somente são obtidas sub-bandas com freqüências iguais ou abaixo da frequência de corte. Em outras palavras, o canal LFE tem teor de frequência somente para sub-bandas com frequência igual ou abaixo da frequência de corte. As sub-bandas superiores do canal LFE (isto é, aquelas acima da freqüência de corte) podem ser preenchidas com sinais zero (se necessário).
Dependendo da implementação particular, o codificador BCC pode ser projetado para gerar cue codes BCC para todas as freqüências e simplesmente não transmitir esses códigos para determinadas sub-bandas (ex., sub-bandas acima da freqüência de corte e/ou sub-bandas dotadas de energia substancialmente zero). De forma similar, o decodificador BCC correspondente poderia ser projetado para realizar a síntese BCC convencional para todas as freqüências, onde o decodificador BCC aplica os adequados valores cue code BCC para aquelas sub-bandas que não possuem códigos explicitamente transmitidos.
Apesar da presente invenção ter sido descrita no contexto dos decodificadores BCC que aplicam técnicas dos pedidos '877 e '458 para sintetizar as cenas de auditório, a presente invenção também pode ser implementada no contexto dos decodificadores BCC que aplicam outras técnicas para sintetizar cenas de auditório que não necessariamente têm apoio nas técnicas
dos pedidos '877 e '458. Por exemplo, o processamento BCC da presente invenção pode ser implementado sem dados ICTD, ICLD e/ou ICC, com ou sem outros cue codes adequados como, por exemplo, aqueles associados com as funções de transferência pelo pavilhão auricular.
Na configuração da Fig. 2, o som surround é codificado aplicando a análise BCC de seis canais â sub-bandas com frequência igual ou abaixo da freqüência de corte e análise BCC de cinco canais âs sub-bandas acima da freqüência de corte. Em outra configuração, a presente invenção pode ser aplicada ao som surround 7.1, em que é aplicada a análise BCC de oito canais às sub-bandas com freqüência igual ou abaixo de uma freqüência de corte especificada e é aplicada análise BCC de sete canais (excluindo o canal único LFE) às sub-bandas acima da freqüência de corte.
A presente invenção também pode ser aplicada ao áudio surround com mais do que um canal LFE. Por exemplo, para o som surround 10.2, poderia ser aplicada a análise BCC de doze canais às sub-bandas com freqüência igual ou abaixo da freqüência especificada de corte, enquanto a análise BCC de dez canais (excluindo os dois canais LFE) poderia ser aplicada às sub-bandas acima da freqüência de corte. De maneira alternativa, poderia haver duas diferentes frequências de corte especificadas: uma primeira freqüência de corte para um primeiro canal LFE do som surround 10.2 e uma segunda freqüência de corte para o segundo canal LFE. Nesse caso, e supondo que a primeira freqüência de corte fosse menor do que a segunda freqüência de corte, poderia ser aplicada a análise BCC de doze canais às sub-bandas com * · · · · · • · · ·· · · • · · · · · freqüência igual ou abaixo da primeira frequência de corte, poderia ser aplicada a análise BCC de onze canais (excluindo o primeiro canal LFE) às sub-bandas (1) que estiverem acima da primeira freqüência de corte e (2) que forem iguais ou menores que a segunda freqüência de corte, e a análise BCC de dez canais (excluindo ambos os canais LFE) poderia ser aplicada às sub-bandas acima da segunda freqüência de corte.
De maneira similar, alguns equipamentos multicanais de consumidor são projetados intencionalmente com diferentes canais de saída dotados de diferentes faixas de freqüências. Por exemplo, alguns equipamentos de som surround 5.1 têm dois canais traseiros projetados para reproduzirem somente freqüências abaixo de 7 kHz. A presente invenção poderia ser aplicada a tais sistemas especificando duas freqüências de corte: uma para o canal LFE e uma maior para os canais traseiros. Nesse caso, a análise BCC de seis canais poderia ser aplicada às subbandas com freqüência igual ou abaixo da freqüência de corte LFE, a análise BCC de cinco canais (excluindo o canal LFE) poderia ser aplicada às sub-bandas que (1) estivessem acima da freqüência de corte LFE e (2) tivessem freqüência igual ou abaixo da freqüência de corte do canal traseiro, e a análise BCC de três canais (excluindo o canal LFE e os dois canais traseiros) poderia ser aplicada às sub-bandas acima da freqüência de corte do canal traseiro.
A presente invenção pode ser, ainda, generalizada para aplicar codificação paramétrica de áudio a dois ou mais diferentes subconjuntos de canais de entrada para duas ou mais diferentes regiões de freqüências, onde a codificação paramétrica lí>
de áudio pudesse ser diferente da codificação BCC , sendo as diferentes regiões de freqüência escolhidas de maneira que o teor de freqüência dos diferentes canais de entrada refletisse nessas regiões. Dependendo da aplicação particular, poderíam ser excluídos diferentes canais de diferentes regiões de freqüência em quaisquer combinações adequadas. Por exemplo, poderiam ser excluídos canais de baixa freqüência das regiões de alta freqüência e/ou canais de alta freqüência de regiões de baixa freqüência. Pode até ser o caso que nenhuma região de freqüência única envolva todos os canais de entrada.
Como descrito anteriormente, apesar dos canais de entrada 208 poderem passar por downmix para formarem um canal único combinado (por ex., mono) 212, em implementações alternativas, os canais múltiplos de entrada podem passar por downmix para formarem dois ou mais diferentes canais combinados, dependendo da particular aplicação de processamento de áudio. Maiores informações sobre essas técnicas podem ser encontradas no pedido de patente dos Estados Unidos n2 10/762.100, depositada em 20/01/04, cujos ensinamentos são ora incorporados como referência.
Em determinadas implementações, quando o downmix gera múltiplos canais combinados, os dados do canal combinado podem ser transmitidos usando técnicas convencionais de transmissão de áudio. Por exemplo, quando são gerados dois canais combinados, devem poder ser empregadas técnicas convencionais de transmissão estéreo. Nesse caso, o decodificador BCC pode extrair e usar os códigos BCC para sintetizar um sinal multicanais (ex., som surround 5.1) a partir dos dois canais combinados. Além disso, isto pode prover compatibilidade backwards, quando os dois canais
BCC combinados são operados usando decodificadores estéreo convencionais (isto é, não baseados em BCC) que ignoram os códigos BCC. De maneira análoga, a compatibilidade backwards pode ser obtida para um decodificador convencional mono quando um único canal BCC combinado é gerado. Notar que, em teoria, quando existem múltiplos canais combinados, um ou mais desses canais podem realmente se basear em canais individuais de entrada.
Apesar do sistema BCC 200 poder ter o mesmo número de canais de entrada de áudio que os canais de saída de 10 áudio, em configurações alternativas, o número de canais de entrada poderia ser maior ou menor que o número de canais de saída, dependendo da aplicação em particular. Por exemplo, o áudio de entrada poderia corresponder ao som surround 7.1 e o áudio sintetizado de saída poderia corresponder ao som surround 5.1, ou * 15 vice-versa.
Em geral, os codificadores BCC da presente invenção podem ser implementados no contexto da conversão de M canais de áudio de entrada em N canais combinados de áudio e um ou mais conjuntos correspondentes de códigos BCC, onde M>N>1. De maneira similar, os decodificadores BCC da presente invenção podem ser implementados no contexto de gerar P canais de saída de áudio a partir de N canais combinados de áudio e os conjuntos correspondentes de códigos BCC, onde P>N, e P pode ser igual ou diferente de M.
Dependendo de implementação particular, os vários sinais recebidos e gerados tanto pelo codificador BCC 202 como pelo decodificador BCC 204 da Fig. 2 podem ter qualquer combinação adequada de sinais análogos e/ou digitais, incluindo todo análogo
• · · · • · · · • « · • ·· · como todo digital. Apesar de não estar mostrado na Fig. 2, os peritos na técnica verão que um ou mais canais combinados 212 e seqüência de dados cue code BCC 216 podem, ainda, ser codificados pelo codificador BCC 202 e decodificados, correspondentemente, pelo decodificador BCC 204, por exemplo, com base em algum esquema adequado de compressão (ex., ADPCM) para ainda reduzir mais o tamanho dos dados comprimidos.
A definição da transmissão de dados do codificador BCC 202 para o decodif icador BCC 204 dependerá da aplicação particular do sistema de processamento de áudio 200. Por exemplo, em certas aplicações, como transmissões ao vivo de concertos musicais, a transmissão pode envolver transmissões em tempo real dos dados para playback imediato em local distante. Em outras aplicações, a transmissão pode envolver o arquivamento dos dados em CDs ou em outra mídia adequada de armazenamento para subsequente playback (isto é, não em tempo real) . É claro que também são possíveis outras aplicações.
Dependendo da implementação em particular, os canais de transmissão podem ser com fio ou sem fio e podem usar protocolos customizados ou padronizados (ex., IP). Pode ser usada mídia como CD, DVD, gravadores digitais de fita e memórias em estado sólido para a armazenagem. Além disso, a transmissão e/ou a armazenagem podem, mas não precisam, incluir codificação de canal. De maneira similar, apesar da presente invenção ter sido descrita no contexto de sistemas digitais de áudio, os peritos na técnica entenderão que a presente invenção também pode ser implementada no contexto de sistemas análogos de áudio, como rádio AM, rádio FM e a porção de áudio da difusão de televisão análoga, cada uma das quais suportando a inclusão de mais um canal de transmissão com baixa taxa de bits em banda.
A presente invenção pode ser implementada para muitas aplicações diferentes, como reprodução de música, difusão e telefonia. Por exemplo, a presente invenção pode ser implementada para a difusão de rãdio/TV/Internet digital (ex., Webcast) como o Sirius Satellite Radio ou XM. Outras aplicações incluem voz em IP,
PSTN ou outras redes de voz, difusão de radio análogo e Internet rádio.
Dependendo da aplicação em particular, podem ser empregadas técnicas diferentes para integrar os conjuntos de códigos BCC em um canal combinado, para obter um sinal BCC da presente invenção. A disponibilidade de qualquer técnica particular depende, pelo menos em parte, do(s) meio(s) particular(es) de transmissão/armazenagem usado (s) para o sinal BCC. Por exemplo, os protocolos para difusão de rádio digital normalmente suportam a inclusão de novos bits de ampliação (ex., a porção do cabeçalho de pacotes de dados), que são ignorados pelos receptores convencionais. Esses bits adicionais podem ser usados para representar os conjuntos de parâmetros de cenas de auditório, para prover um sinal BCC. Em geral, a presente invenção pode ser implementada usando qualquer técnica adequada para marcas d'água de sinais de áudio, em que os dados que correspondem aos conjuntos de parâmetros de cenas de auditório são integrados no sinal de áudio para formar um sinal BCC. Por exemplo, essas técnicas podem envolver a ocultação de dados sob curvas de mascaramento perceptual ou a ocultação de dados em ruído pseudo-randômico. 0 ruído pseudo-randômico pode ser percebido como ruído de conforto.
• · ··
A integração de dados também pode ser implementada usando métodos similares à técnica de bit-robbing usada na transmissão TDM (Multiplexagem por Divisão no Tempo) para sinalização em banda. Outra possível técnica é a da inversão de bits mu-law LSB, onde os bits menos significativos são usados para a transmissão de dados.
A presente invenção pode ser implementada como processos baseados em circuitos, incluindo possível implementação em um único circuito integrado. Como seria aparente aos peritos na técnica, também podem ser implementadas várias funções de elementos de circuitos como etapas de processamento em um programa de software. Tal software poderia ser empregado, por exemplo, em um processador digital de sinais, um micro-controlador ou em um computador de uso geral.
A presente invenção pode ser configurada sob a forma de métodos e equipamentos para a prática desses métodos. A presente invenção também pode ser configurada sob a forma de código de programa configurada em mídia tangível, como em disquetes de computador, CD-ROMs, discos rígidos ou em qualquer mídia de armazenagem com leitura por máquina, caracterizada pelo fato de que, quando o código de programa é carregado e executado por uma máquina, como um computador, a máquina se torna um equipamento para a prática da invenção. A presente invenção também pode ser configurada sob a forma de código de programa, por exemplo, se armazenada em meio de armazenagem, carregada e/ou executada por uma máquina ou transmitida por algum meio ou portador de transmissão, como por fiação ou cabeamento elétrico, por fibra ótica ou via radiações eletromagnéticas, ao passo que, quando o código de programa é carregado e executado por uma • ·* máquina, como um computador, a máquina se torna um equipamento para a prática da invenção. Quando implementados em um processador de uso geral, os segmentos do código de programa combinam com o processador para prover um dispositivo exclusivo que opera de maneira análoga aos circuitos lógicos específicos.
Será ainda visto que podem ser feitas várias alterações pelos peritos na técnica nos detalhes, nos materiais e nas disposições das peças que foram descritas e ilustradas para explicar a natureza da presente invenção, sem abandonar o escopo da invenção, como determinado nas reivindicações a seguir.
Claims (13)
- R E I V I N D I C A Ç Õ E S1. Método para a codificação de um sinal de áudio multicanais dotado de uma pluralidade de canais de entrada de áudio compreendendo uma pluralidade de canais regulares e pelo menos um canal de baixa frequência, o método compreendendo:aplicar uma técnica de codificação paramétrica de áudio para gerar códigos paramétricos de áudio para todos canais de entrada de áudio para uma primeira região de frequência correspondente às sub-bandas abaixo da frequência de corte; e
aplicar a técnica de codificação paramétrica de áudio para gerar códigos paramétricos de áudio para apenas os canais regulares para uma segunda região de frequência correspondente às sub-bandas acima da frequência de corte; caracterizado pelo fato de que: a técnica de codificação de áudio paramétrica gera os códigos de áudio paramétricos com base em diferenças intercanal;para a primeira região de frequência, a técnica de codificação de áudio paramétrica gera informações de diferença intercanal correspondentes a todos os canais de entrada de áudio;e para a segunda região de frequência, a técnica de codificação de áudio paramétrica gera informações de diferença intercanal correspondentes apenas aos canais regulares e não com relação ao pelo menos um canal de baixa frequência. - 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a técnica de codificação paramétrica de áudio é uma codificação binaural cue coding (BCC).
- 3. Método, de acordo com a reivindicação 1,Petição 870190009215, de 29/01/2019, pág. 15/252/6 caracterizado pelo fato de que:o sinal de áudio multicanais é um sinal de som surround tendo a pluralidade de canais regulares e pelo menos um canal de baixa freqüência (LFE).
- 4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que a técnica de codificação paramétrica de áudio é uma codificação BCC.
- 5. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que a freqüência de corte é pelo menos a largura de banda de áudio efetiva do canal LFE.
- 6. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que o sinal de áudio multicanais é um sinal de som surround 5.1.
- 7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende a transmissão de códigos paramétricos de áudio para o primeiro e o segundo subconjuntos de canais de entrada de áudio.
- 8. Codificador paramétrico de áudio para a
codificação de um sinal de áudio multicanais, tendo uma pluralidade de canais de entrada de áudio compreendendo uma pluralidade de canais regulares e pelo um canal de baixa frequência, o equipamento compreendendo:meios para aplicar uma técnica de codificação paramétrica de áudio para gerar códigos paramétricos de áudio para todos canais de entrada de áudio para uma primeira região de frequência correspondente às sub-bandas abaixo da frequência de corte; e meios para aplicar a técnica de codificaçãoPetição 870190009215, de 29/01/2019, pág. 16/253/6 paramétrica de áudio para gerar códigos paramétricos de áudio para apenas os canais regulares para uma segunda região de frequência correspondente às sub-bandas acima da frequência de corte, caracterizado pelo fato de que:a técnica de codificação de áudio paramétrica gera os códigos de áudio paramétricos com base em diferenças intercanal;para a primeira região de frequência, a técnica de codificação de áudio paramétrica gera informações de diferença intercanal correspondentes a todos os canais de entrada de áudio;e para a segunda região de frequência, a técnica de codificação de áudio paramétrica gera informações de diferença intercanal correspondentes apenas aos canais regulares e não com relação ao pelo menos um canal de baixa frequência. - 9. Codificador paramétrico de áudio, de acordo com a reivindicação 8, compreendendo:um downmixer adaptado para gerar um ou mais canais combinados da pluralidade de canais de entrada de áudio de um sinal de áudio multicanais; e caracterizado pelos meios para aplicar uma técnica de codificação paramétrica de áudio compreende em um analisador adaptado para gerar:(1) Os códigos paramétricos de áudio para todos os canais de entrada de áudio na primeira região de frequência; e (2) Os códigos paramétricos de áudio para apenas os canais regulares na segunda região de frequência.
- 10. Codificador paramétrico de áudio, de acordo com as reivindicações 8 ou 9, caracterizado pelo fato de que osPetição 870190009215, de 29/01/2019, pág. 17/254/6 códigos paramétricos de áudio são códigos BCC.
- 11. Codificador paramétrico de áudio, de acordo com as reivindicações 8 ou 9, caracterizado pelo fato de que:o sinal de áudio multicanais é um sinal de som surround tendo a pluralidade de canais regulares e pelo menos um canal de baixa frequência.
- 12. Codificador paramétrico de áudio, de acordo com as reivindicações 8 ou 9, caracterizado pelo fato de que ainda o codificador paramétrico de áudio é adaptado para transmitir os códigos paramétricos de áudio para a primeira e a segunda região de frequência.
- 13. Método para sintetizar um sinal de áudio multicanais, tendo uma pluralidade de canais de saída de áudio, compreendendo uma pluralidade de canais regulares e pelo menos um canal de baixa frequência, o método compreende:aplicar uma técnica de decodificação paramétrica de áudio para gerar todos canais de saída de áudio para uma primeira região de frequência correspondente às sub-bandas abaixo de uma frequência de corte especificada; e aplicar a técnica de decodificação paramétrica de áudio para gerar apenas canais regulares para uma segunda região de frequência correspondente às sub-bandas acima de uma frequência de corte especificada; caracterizado pelo fato de que:a técnica de decodificação de áudio paramétrica gera canais de saída de áudio que usam códigos de áudio paramétricos com base em diferenças intercanal;para a primeira região de frequência, os códigos de áudio paramétrico correspondem às informações de diferençaPetição 870190009215, de 29/01/2019, pág. 18/255/6 intercanal correspondentes a todos os canais de saída de áudio; e para a segunda região de frequência, os códigos de áudio paramétrico correspondem às informações de diferença intercanal correspondentes apenas aos canais regulares e não com relação ao pelo menos um canal de baixa frequência.
14. Método, de acordo com a reivindicação 13, caracterizado pelo fato de que a técnica de decodificação paramétrica de áudio é uma decodificação BCC. 15. Método, de acordo com a reivindicação 13, caracterizado pelo fato de que: o sinal de áudio multicanais é um sinal de som surround tendo a pluralidade de canais regulares e pelo menos um canal de baixa frequência. 16. Método, de acordo com a reivindicação 15, caracterizado pelo fato de que a técnica de decodificação paramétrica de áudio é uma decodificação BCC. 17 . Método, de acordo com a reivindicação 15, caracterizado pelo fato de que a freqüência de corte é pelo menos a largura de banda efetiva de áudio do canal de baixa frequência. 18. Método, de acordo com a reivindicação 15, caracterizado pelo fato de que o sinal de áudio multicanais é um sinal de som surround 5.1.19. Equipamento para sintetizar um sinal de áudio multicanais, tendo uma pluralidade de canais de saída de áudio, compreendendo uma pluralidade de canais regulares e pelo menos um canal de baixa frequência, o equipamento compreende:meios para aplicar uma técnica de decodificação paramétrica de áudio para gerar todos canais de saída de áudioPetição 870190009215, de 29/01/2019, pág. 19/256/6 para uma primeira região de frequência corresponde às sub-bandas abaixo da frequência de corte; e meios para aplicar a técnica de decodificação paramétrica de áudio para gerar apenas os canais regulares para uma segunda região de frequência corresponde às sub-bandas acima da frequência de corte, caracterizado pelo fato de que:a técnica de decodificação de áudio paramétrica gera canais de saída de áudio que usam códigos de áudio paramétricos com base em diferenças intercanal;para a primeira região de frequência, os códigos de áudio paramétrico correspondem às informações de diferença intercanal correspondentes a todos os canais de saída de áudio;e para a segunda região de frequência, os códigos de áudio paramétrico correspondem às informações de diferença intercanal correspondentes apenas aos canais regulares e não com relação ao pelo menos um canal de baixa frequência.20. Equipamento, de acordo com a reivindicação19, caracterizado por ser implementado como um decodificador paramétrico de áudio.21. Decodificador, de acordo com as reivindicações 19 ou 20, caracterizado pelo fato de que os códigos paramétricos são códigos BCC.22. Decodificador, de acordo com as reivindicações 19 ou 20, caracterizado pelo fato de que:o sinal de áudio multicanais é um sinal de som surround tendo a pluralidade de canais regulares e pelo menos um canal de baixa frequência.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US54997204P | 2004-03-04 | 2004-03-04 | |
US60/549,972 | 2004-03-04 | ||
US10/827,900 US7805313B2 (en) | 2004-03-04 | 2004-04-20 | Frequency-based coding of channels in parametric multi-channel coding systems |
US10/827,900 | 2004-04-20 | ||
PCT/US2005/005605 WO2005094125A1 (en) | 2004-03-04 | 2005-02-23 | Frequency-based coding of audio channels in parametric multi-channel coding systems |
Publications (2)
Publication Number | Publication Date |
---|---|
BRPI0508146A BRPI0508146A (pt) | 2007-07-31 |
BRPI0508146B1 true BRPI0508146B1 (pt) | 2019-04-16 |
Family
ID=34915657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0508146-7A BRPI0508146B1 (pt) | 2004-03-04 | 2005-02-23 | Codificação baseada na freqüência de canais em sistemas de codificação paramétrica multicanais |
Country Status (16)
Country | Link |
---|---|
US (1) | US7805313B2 (pt) |
EP (1) | EP1721489B1 (pt) |
JP (1) | JP4418493B2 (pt) |
KR (1) | KR100717598B1 (pt) |
AT (1) | ATE373402T1 (pt) |
AU (1) | AU2005226536B2 (pt) |
BR (1) | BRPI0508146B1 (pt) |
CA (1) | CA2557993C (pt) |
DE (1) | DE602005002463T2 (pt) |
ES (1) | ES2293556T3 (pt) |
HK (1) | HK1101634A1 (pt) |
MX (1) | MXPA06009931A (pt) |
NO (1) | NO340421B1 (pt) |
PT (1) | PT1721489E (pt) |
TW (1) | TWI376967B (pt) |
WO (1) | WO2005094125A1 (pt) |
Families Citing this family (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
JP2007528025A (ja) * | 2004-02-17 | 2007-10-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ配信システム、オーディオエンコーダ、オーディオデコーダ、及びそれらの動作方法 |
KR101183862B1 (ko) * | 2004-04-05 | 2012-09-20 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 스테레오 신호를 처리하기 위한 방법 및 디바이스, 인코더 장치, 디코더 장치 및 오디오 시스템 |
WO2005098821A2 (en) * | 2004-04-05 | 2005-10-20 | Koninklijke Philips Electronics N.V. | Multi-channel encoder |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
WO2006004048A1 (ja) * | 2004-07-06 | 2006-01-12 | Matsushita Electric Industrial Co., Ltd. | オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム |
DE602005016931D1 (de) * | 2004-07-14 | 2009-11-12 | Dolby Sweden Ab | Tonkanalkonvertierung |
JP4892184B2 (ja) * | 2004-10-14 | 2012-03-07 | パナソニック株式会社 | 音響信号符号化装置及び音響信号復号装置 |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
EP1905002B1 (en) * | 2005-05-26 | 2013-05-22 | LG Electronics Inc. | Method and apparatus for decoding audio signal |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
WO2007032647A1 (en) * | 2005-09-14 | 2007-03-22 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
US20080221907A1 (en) * | 2005-09-14 | 2008-09-11 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
KR101218776B1 (ko) * | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
KR100803212B1 (ko) * | 2006-01-11 | 2008-02-14 | 삼성전자주식회사 | 스케일러블 채널 복호화 방법 및 장치 |
US8208641B2 (en) * | 2006-01-19 | 2012-06-26 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
EP1974344A4 (en) * | 2006-01-19 | 2011-06-08 | Lg Electronics Inc | METHOD AND APPARATUS FOR DECODING A SIGNAL |
EP1989704B1 (en) * | 2006-02-03 | 2013-10-16 | Electronics and Telecommunications Research Institute | Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue |
KR100863479B1 (ko) * | 2006-02-07 | 2008-10-16 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
US20090177479A1 (en) * | 2006-02-09 | 2009-07-09 | Lg Electronics Inc. | Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof |
US9009057B2 (en) | 2006-02-21 | 2015-04-14 | Koninklijke Philips N.V. | Audio encoding and decoding to generate binaural virtual spatial signals |
JP5390197B2 (ja) | 2006-02-23 | 2014-01-15 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
KR100773562B1 (ko) | 2006-03-06 | 2007-11-07 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
KR100773560B1 (ko) | 2006-03-06 | 2007-11-05 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
FR2899423A1 (fr) * | 2006-03-28 | 2007-10-05 | France Telecom | Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme. |
US7965848B2 (en) * | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
KR20080071971A (ko) * | 2006-03-30 | 2008-08-05 | 엘지전자 주식회사 | 미디어 신호 처리 방법 및 장치 |
EP1853092B1 (en) * | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
KR100763920B1 (ko) * | 2006-08-09 | 2007-10-05 | 삼성전자주식회사 | 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치 |
US20080235006A1 (en) | 2006-08-18 | 2008-09-25 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
US20100040135A1 (en) * | 2006-09-29 | 2010-02-18 | Lg Electronics Inc. | Apparatus for processing mix signal and method thereof |
US8364497B2 (en) * | 2006-09-29 | 2013-01-29 | Electronics And Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel |
EP2084901B1 (en) * | 2006-10-12 | 2015-12-09 | LG Electronics Inc. | Apparatus for processing a mix signal and method thereof |
KR100891670B1 (ko) | 2006-10-13 | 2009-04-02 | 엘지전자 주식회사 | 신호 처리 방법 및 장치 |
CN103400583B (zh) * | 2006-10-16 | 2016-01-20 | 杜比国际公司 | 多声道下混对象编码的增强编码和参数表示 |
BRPI0715312B1 (pt) * | 2006-10-16 | 2021-05-04 | Koninklijke Philips Electrnics N. V. | Aparelhagem e método para transformação de parâmetros multicanais |
JP4838361B2 (ja) * | 2006-11-15 | 2011-12-14 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及びその装置 |
JP5463143B2 (ja) * | 2006-12-07 | 2014-04-09 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及びその装置 |
KR101111520B1 (ko) * | 2006-12-07 | 2012-05-24 | 엘지전자 주식회사 | 오디오 처리 방법 및 장치 |
CN101578656A (zh) * | 2007-01-05 | 2009-11-11 | Lg电子株式会社 | 用于处理音频信号的装置和方法 |
JP2010518452A (ja) * | 2007-02-13 | 2010-05-27 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
US20100121470A1 (en) * | 2007-02-13 | 2010-05-13 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
JP5328637B2 (ja) * | 2007-02-20 | 2013-10-30 | パナソニック株式会社 | マルチチャンネル復号装置、マルチチャンネル復号方法、プログラム及び半導体集積回路 |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8184726B2 (en) * | 2007-09-10 | 2012-05-22 | Industrial Technology Research Institute | Method and apparatus for multi-rate control in a multi-channel communication system |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
US8249883B2 (en) | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
US20100324708A1 (en) * | 2007-11-27 | 2010-12-23 | Nokia Corporation | encoder |
EP2227804B1 (en) * | 2007-12-09 | 2017-10-25 | LG Electronics Inc. | A method and an apparatus for processing a signal |
KR101441898B1 (ko) * | 2008-02-01 | 2014-09-23 | 삼성전자주식회사 | 주파수 부호화 방법 및 장치와 주파수 복호화 방법 및 장치 |
US9111525B1 (en) * | 2008-02-14 | 2015-08-18 | Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) | Apparatuses, methods and systems for audio processing and transmission |
WO2009113516A1 (ja) * | 2008-03-14 | 2009-09-17 | 日本電気株式会社 | 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム |
WO2009131066A1 (ja) * | 2008-04-21 | 2009-10-29 | 日本電気株式会社 | 信号分析制御及び信号制御のシステム、装置、方法及びプログラム |
US20100223061A1 (en) * | 2009-02-27 | 2010-09-02 | Nokia Corporation | Method and Apparatus for Audio Coding |
EP2513898B1 (en) * | 2009-12-16 | 2014-08-13 | Nokia Corporation | Multi-channel audio processing |
CN104050969A (zh) | 2013-03-14 | 2014-09-17 | 杜比实验室特许公司 | 空间舒适噪声 |
US10199044B2 (en) | 2013-03-20 | 2019-02-05 | Nokia Technologies Oy | Audio signal encoder comprising a multi-channel parameter selector |
EP3023984A4 (en) * | 2013-07-15 | 2017-03-08 | Electronics and Telecommunications Research Institute | Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal |
US9911423B2 (en) | 2014-01-13 | 2018-03-06 | Nokia Technologies Oy | Multi-channel audio signal classifier |
WO2015147434A1 (ko) * | 2014-03-25 | 2015-10-01 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 처리 장치 및 방법 |
CN104064194B (zh) * | 2014-06-30 | 2017-04-26 | 武汉大学 | 用于提高三维音频空间感距离感的参数编解码方法及系统 |
WO2016003206A1 (ko) * | 2014-07-01 | 2016-01-07 | 한국전자통신연구원 | 다채널 오디오 신호 처리 방법 및 장치 |
CN106471575B (zh) | 2014-07-01 | 2019-12-10 | 韩国电子通信研究院 | 多信道音频信号处理方法及装置 |
KR20180056032A (ko) * | 2016-11-18 | 2018-05-28 | 삼성전자주식회사 | 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법 |
JP2022511156A (ja) | 2018-11-13 | 2022-01-31 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ信号及び関連するメタデータによる空間オーディオの表現 |
CN110366752B (zh) * | 2019-05-21 | 2023-10-10 | 深圳市汇顶科技股份有限公司 | 一种语音分频传输方法、源端、播放端、源端电路和播放端电路 |
Family Cites Families (81)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4236039A (en) * | 1976-07-19 | 1980-11-25 | National Research Development Corporation | Signal matrixing for directional reproduction of sound |
CA1268546A (en) * | 1985-08-30 | 1990-05-01 | Shigenobu Minami | Stereophonic voice signal transmission system |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
DE3943879B4 (de) * | 1989-04-17 | 2008-07-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Digitales Codierverfahren |
SG49883A1 (en) * | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
DE4209544A1 (de) * | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
US5703999A (en) * | 1992-05-25 | 1997-12-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels |
DE4236989C2 (de) * | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
US5371799A (en) * | 1993-06-01 | 1994-12-06 | Qsound Labs, Inc. | Stereo headphone sound source localization system |
US5463424A (en) * | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
JP3227942B2 (ja) | 1993-10-26 | 2001-11-12 | ソニー株式会社 | 高能率符号化装置 |
DE4409368A1 (de) * | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
JP3277679B2 (ja) * | 1994-04-15 | 2002-04-22 | ソニー株式会社 | 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置 |
JPH0969783A (ja) | 1995-08-31 | 1997-03-11 | Nippon Steel Corp | オーディオデータ符号化装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5771295A (en) * | 1995-12-26 | 1998-06-23 | Rocktron Corporation | 5-2-5 matrix system |
JP3793235B2 (ja) * | 1996-02-08 | 2006-07-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 2チャネル伝送及び1チャネル伝送に適合するnチャネル伝送 |
US7012630B2 (en) * | 1996-02-08 | 2006-03-14 | Verizon Services Corp. | Spatial sound conference system and apparatus |
US5825776A (en) * | 1996-02-27 | 1998-10-20 | Ericsson Inc. | Circuitry and method for transmitting voice and data signals upon a wireless communication channel |
US5889843A (en) * | 1996-03-04 | 1999-03-30 | Interval Research Corporation | Methods and systems for creating a spatial auditory environment in an audio conference system |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
KR0175515B1 (ko) * | 1996-04-15 | 1999-04-01 | 김광호 | 테이블 조사 방식의 스테레오 구현 장치와 방법 |
US6987856B1 (en) * | 1996-06-19 | 2006-01-17 | Board Of Trustees Of The University Of Illinois | Binaural signal processing techniques |
US6697491B1 (en) * | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
JP3707153B2 (ja) | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
SG54383A1 (en) * | 1996-10-31 | 1998-11-16 | Sgs Thomson Microelectronics A | Method and apparatus for decoding multi-channel audio data |
US5912976A (en) * | 1996-11-07 | 1999-06-15 | Srs Labs, Inc. | Multi-channel audio enhancement system for use in recording and playback and methods for providing same |
US6131084A (en) | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
US6111958A (en) * | 1997-03-21 | 2000-08-29 | Euphonics, Incorporated | Audio spatial enhancement apparatus and methods |
US6236731B1 (en) * | 1997-04-16 | 2001-05-22 | Dspfactory Ltd. | Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids |
US5860060A (en) * | 1997-05-02 | 1999-01-12 | Texas Instruments Incorporated | Method for left/right channel self-alignment |
US5946352A (en) * | 1997-05-02 | 1999-08-31 | Texas Instruments Incorporated | Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain |
US6108584A (en) * | 1997-07-09 | 2000-08-22 | Sony Corporation | Multichannel digital audio decoding method and apparatus |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6021389A (en) * | 1998-03-20 | 2000-02-01 | Scientific Learning Corp. | Method and apparatus that exaggerates differences between sounds to train listener to recognize and identify similar sounds |
US6016473A (en) | 1998-04-07 | 2000-01-18 | Dolby; Ray M. | Low bit-rate spatial coding method and system |
TW444511B (en) | 1998-04-14 | 2001-07-01 | Inst Information Industry | Multi-channel sound effect simulation equipment and method |
JP3657120B2 (ja) * | 1998-07-30 | 2005-06-08 | 株式会社アーニス・サウンド・テクノロジーズ | 左,右両耳用のオーディオ信号を音像定位させるための処理方法 |
JP2000152399A (ja) * | 1998-11-12 | 2000-05-30 | Yamaha Corp | 音場効果制御装置 |
US6408327B1 (en) * | 1998-12-22 | 2002-06-18 | Nortel Networks Limited | Synthetic stereo conferencing over LAN/WAN |
US6282631B1 (en) * | 1998-12-23 | 2001-08-28 | National Semiconductor Corporation | Programmable RISC-DSP architecture |
US6539357B1 (en) * | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
JP4438127B2 (ja) | 1999-06-18 | 2010-03-24 | ソニー株式会社 | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 |
US6823018B1 (en) * | 1999-07-28 | 2004-11-23 | At&T Corp. | Multiple description coding communication system |
US6434191B1 (en) * | 1999-09-30 | 2002-08-13 | Telcordia Technologies, Inc. | Adaptive layered coding for voice over wireless IP applications |
US6614936B1 (en) * | 1999-12-03 | 2003-09-02 | Microsoft Corporation | System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding |
US6498852B2 (en) * | 1999-12-07 | 2002-12-24 | Anthony Grimani | Automatic LFE audio signal derivation system |
US6845163B1 (en) * | 1999-12-21 | 2005-01-18 | At&T Corp | Microphone array for preserving soundfield perceptual cues |
EP1208725B1 (en) * | 1999-12-24 | 2009-06-03 | Koninklijke Philips Electronics N.V. | Multichannel audio signal processing device |
US6782366B1 (en) * | 2000-05-15 | 2004-08-24 | Lsi Logic Corporation | Method for independent dynamic range control |
US6850496B1 (en) * | 2000-06-09 | 2005-02-01 | Cisco Technology, Inc. | Virtual conference room for voice conferencing |
US6973184B1 (en) * | 2000-07-11 | 2005-12-06 | Cisco Technology, Inc. | System and method for stereo conferencing over low-bandwidth links |
US7236838B2 (en) * | 2000-08-29 | 2007-06-26 | Matsushita Electric Industrial Co., Ltd. | Signal processing apparatus, signal processing method, program and recording medium |
JP3426207B2 (ja) | 2000-10-26 | 2003-07-14 | 三菱電機株式会社 | 音声符号化方法および装置 |
TW510144B (en) | 2000-12-27 | 2002-11-11 | C Media Electronics Inc | Method and structure to output four-channel analog signal using two channel audio hardware |
US6885992B2 (en) * | 2001-01-26 | 2005-04-26 | Cirrus Logic, Inc. | Efficient PCM buffer |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US6934676B2 (en) * | 2001-05-11 | 2005-08-23 | Nokia Mobile Phones Ltd. | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
US7668317B2 (en) * | 2001-05-30 | 2010-02-23 | Sony Corporation | Audio post processing in DVD, DTV and other audio visual products |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
KR20040080003A (ko) | 2002-02-18 | 2004-09-16 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 파라메트릭 오디오 코딩 |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
ES2323294T3 (es) | 2002-04-22 | 2009-07-10 | Koninklijke Philips Electronics N.V. | Dispositivo de decodificacion con una unidad de decorrelacion. |
CN1647156B (zh) * | 2002-04-22 | 2010-05-26 | 皇家飞利浦电子股份有限公司 | 参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备 |
EP2879299B1 (en) | 2002-05-03 | 2017-07-26 | Harman International Industries, Incorporated | Multi-channel downmixing device |
US6940540B2 (en) * | 2002-06-27 | 2005-09-06 | Microsoft Corporation | Speaker detection and tracking using audiovisual data |
AU2003244932A1 (en) * | 2002-07-12 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
WO2004008437A2 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
CN1669358A (zh) | 2002-07-16 | 2005-09-14 | 皇家飞利浦电子股份有限公司 | 音频编码 |
ES2278192T3 (es) | 2002-11-28 | 2007-08-01 | Koninklijke Philips Electronics N.V. | Codificacion de una señal de audio. |
CN1748247B (zh) * | 2003-02-11 | 2011-06-15 | 皇家飞利浦电子股份有限公司 | 音频编码 |
FI118247B (fi) | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
WO2004086817A2 (en) | 2003-03-24 | 2004-10-07 | Koninklijke Philips Electronics N.V. | Coding of main and side signal representing a multichannel signal |
US20050069143A1 (en) * | 2003-09-30 | 2005-03-31 | Budnikov Dmitry N. | Filtering for spatial audio rendering |
US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7840401B2 (en) * | 2005-10-24 | 2010-11-23 | Lg Electronics Inc. | Removing time delays in signal paths |
-
2004
- 2004-04-20 US US10/827,900 patent/US7805313B2/en active Active
-
2005
- 2005-02-22 TW TW094105257A patent/TWI376967B/zh not_active IP Right Cessation
- 2005-02-23 AU AU2005226536A patent/AU2005226536B2/en active Active
- 2005-02-23 AT AT05723489T patent/ATE373402T1/de active
- 2005-02-23 PT PT05723489T patent/PT1721489E/pt unknown
- 2005-02-23 EP EP05723489A patent/EP1721489B1/en active Active
- 2005-02-23 BR BRPI0508146-7A patent/BRPI0508146B1/pt active IP Right Grant
- 2005-02-23 WO PCT/US2005/005605 patent/WO2005094125A1/en active IP Right Grant
- 2005-02-23 CA CA2557993A patent/CA2557993C/en active Active
- 2005-02-23 JP JP2007501824A patent/JP4418493B2/ja active Active
- 2005-02-23 ES ES05723489T patent/ES2293556T3/es active Active
- 2005-02-23 KR KR1020067017673A patent/KR100717598B1/ko active IP Right Grant
- 2005-02-23 MX MXPA06009931A patent/MXPA06009931A/es active IP Right Grant
- 2005-02-23 DE DE602005002463T patent/DE602005002463T2/de active Active
-
2006
- 2006-10-03 NO NO20064472A patent/NO340421B1/no unknown
-
2007
- 2007-06-12 HK HK07106238.2A patent/HK1101634A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
US20050195981A1 (en) | 2005-09-08 |
DE602005002463T2 (de) | 2008-06-12 |
KR20060131866A (ko) | 2006-12-20 |
EP1721489B1 (en) | 2007-09-12 |
EP1721489A1 (en) | 2006-11-15 |
HK1101634A1 (en) | 2007-10-18 |
TWI376967B (en) | 2012-11-11 |
KR100717598B1 (ko) | 2007-05-15 |
BRPI0508146A (pt) | 2007-07-31 |
TW200603653A (en) | 2006-01-16 |
WO2005094125A1 (en) | 2005-10-06 |
ES2293556T3 (es) | 2008-03-16 |
ATE373402T1 (de) | 2007-09-15 |
CA2557993A1 (en) | 2005-10-06 |
JP4418493B2 (ja) | 2010-02-17 |
MXPA06009931A (es) | 2007-03-21 |
US7805313B2 (en) | 2010-09-28 |
AU2005226536A1 (en) | 2005-10-06 |
CA2557993C (en) | 2012-11-27 |
AU2005226536B2 (en) | 2008-09-04 |
PT1721489E (pt) | 2007-12-21 |
JP2007526520A (ja) | 2007-09-13 |
NO340421B1 (no) | 2017-04-18 |
DE602005002463D1 (de) | 2007-10-25 |
NO20064472L (no) | 2006-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BRPI0508146B1 (pt) | Codificação baseada na freqüência de canais em sistemas de codificação paramétrica multicanais | |
RU2323551C1 (ru) | Частотно-ориентированное кодирование каналов в параметрических системах многоканального кодирования | |
JP5260665B2 (ja) | ダウンミックスを用いたオーディオコーディング | |
Faller et al. | Binaural cue coding: a novel and efficient representation of spatial audio | |
JP4772279B2 (ja) | オーディオ信号のマルチチャネル/キュー符号化/復号化 | |
NO343321B1 (no) | Apparat og fremgangsmåte for å kombinere multiple parametrisk kodede audiokilder | |
RU2608847C1 (ru) | Кодирование звуковых сцен | |
KR20200074243A (ko) | 인코딩된 오디오 메타데이터-기반 등화 | |
US20200013426A1 (en) | Synchronizing enhanced audio transports with backward compatible audio transports | |
JP2008512708A (ja) | マルチチャネル信号またはパラメータデータセットを生成する装置および方法 | |
BRPI0608753A2 (pt) | codificador e decodificador de áudio, métodos para codificar e para gerar um sinal de áudio de multicanal, sinal de áudio de multicanal codificado, meio de armazenamento, código de programa executável por computador, e, dispositivo | |
BRPI0509113B1 (pt) | Codificador de multicanal, método para codificar sinais de entrada, conteúdo de dados codificados, portador de dados, e, decodificador operável para decodificar dados de saída codificados | |
WO2016057646A1 (en) | Normalization of ambient higher order ambisonic audio data | |
US11081116B2 (en) | Embedding enhanced audio transports in backward compatible audio bitstreams | |
JP4809234B2 (ja) | オーディオ符号化装置、復号化装置、方法、及びプログラム | |
US11062713B2 (en) | Spatially formatted enhanced audio data for backward compatible audio bitstreams | |
WO2020201619A1 (en) | Spatial audio representation and associated rendering | |
Breebaart et al. | 19th INTERNATIONAL CONGRESS ON ACOUSTICS MADRID, 2-7 SEPTEMBER 2007 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06A | Patent application procedure suspended [chapter 6.1 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 16/04/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) 10 (DEZ) ANOS CONTADOS A PARTIR DE 16/04/2019, OBSERVADAS AS CONDICOES LEGAIS |