BRPI0512763B1 - equipamento e método para gerar um sinal de saída multicanais - Google Patents
equipamento e método para gerar um sinal de saída multicanais Download PDFInfo
- Publication number
- BRPI0512763B1 BRPI0512763B1 BRPI0512763A BRPI0512763A BRPI0512763B1 BR PI0512763 B1 BRPI0512763 B1 BR PI0512763B1 BR PI0512763 A BRPI0512763 A BR PI0512763A BR PI0512763 A BRPI0512763 A BR PI0512763A BR PI0512763 B1 BRPI0512763 B1 BR PI0512763B1
- Authority
- BR
- Brazil
- Prior art keywords
- channel
- channels
- input
- transmission
- cancellation
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 42
- 230000005540 biological transmission Effects 0.000 claims abstract description 113
- 238000005303 weighing Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 description 32
- 230000005236 sound signal Effects 0.000 description 21
- 230000015572 biosynthetic process Effects 0.000 description 18
- 238000003786 synthesis reaction Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000010365 information processing Effects 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 238000004090 dissolution Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 101001099542 Aspergillus niger Pectin lyase A Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Mobile Radio Communication Systems (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Logic Circuits (AREA)
- Time-Division Multiplex Systems (AREA)
Abstract
equipamento e método para gerar um sinal de saída multicanais. equipamento para gerar um sinal de saída multicanais executa um cancelamento de canal central para obter canais de base melhorados para reconstruir canais de saída do lado esquerdo ou canais de saída do lado direito. em especial, o equipamento inclui um calculador de canal de cancelamento (20) para calcular um canal de cancelamento usando informação relacionada ao canal central original disponível no decodificador. o dispositivo inclui ainda um combinador (22) para combinar um canal de transmissão com o canal de cancelamento. finalmente, o equipamento inclui um reconstrutor (26) para gerar o sinal de saída multicanais. devido ao cancelamento do canal central, o reconstrutor de canal (26) não apenas usa um canal de base diferente para reconstruir o canal central, mas também usa canais de base diferentes dos canais de transmissão para reconstruir canais de saída esquerdo e direito que têm uma influência reduzida ou mesmo completamente cancelada do canal central original.
Description
"EQUIPAMENTO E MÉTODO PARA GERAR UM SINAL DE SAÍDA MULTICANAIS" Campo da Invenção A presente invenção se refere à decodificação de multicanais e, especificamente, a decodificação de multicanais na qual pelo menos dois canais de transmissão estão presentes, isto é, a qual é compatível com áudio estéreo.
Na atualidade, a técnica de reprodução de áudio de multicanais está se tornando mais importante. Isto pode ser devido ao fato de que as técnicas de compressão/codificação de áudio, tal como a bem conhecida técnica de mp3, tornaram possível distribuir gravações de áudio através da Internet ou outros canais de transmissão que têm uma largura de banda limitada. A técnica de codificação de mp3 se tornou famosa devido ao fato de permitir a distribuição de todas as gravações em um formato estéreo, isto é, uma representação digital da gravação de áudio que inclui um primeiro canal estéreo ou canal estéreo esquerdo e um segundo canal estéreo ou canal estéreo direito.
No entanto, existem desvantagens básicas nos sistemas de dois canais convencionais. Portanto, a técnica surround foi desenvolvida. Uma representação surround recomendada de multicanais inclui, além dos dois canais estéreos L e R, um canal central adicional C e dois canais surround Ls, Rs. Este formato de som de referência é também referido como estéreo três/dois, que significa três canais frontais e dois canais surround. De forma geral, cinco canais de transmissão são requeridos. Em um ambiente de reprodução são necessários pelo menos cinco falantes nos respectivos cinco locais diferentes para obter um local ideal a certa distância dos cinco alto-falantes bem posicionados. Várias técnicas são conhecidas na técnica para reduzir a quantidade de dados requerida para transmissão de um sinal de áudio de multicanais. Estas técnicas são denominadas de técnicas conjuntas de estéreo. Para esta finalidade, é feito referência à Figura 10, que mostra um dispositivo conjunto de estéreo 60. Este dispositivo pode ser um dispositivo que implementa, por exemplo, codificação de estéreo de intensidade (IS) ou sinal de som biauricular (BCC). Este dispositivo geralmente recebe - como uma entrada - pelo menos dois canais (CHI, CH2, ... CHn) , e envia um canal transportador único e dados paramétricos. Os dados paramétricos são definidos de modo que, em um decodificador, uma aproximação de um canal original (CHI, CH2, ... CHn) pode ser calculada.
Normalmente, o canal transportador incluirá amostras de sub-bandas, coeficientes espectrais, amostras de domínio de tempo, etc., que provêem uma representação comparativamente satisfatória do sinal subjacente, enquanto os dados paramétricos não incluem estas amostras de coeficientes espectrais, mas incluem parâmetros de controle para controlar um certo algoritmo de reconstrução, tal como uma pesagem por multiplicação, mudança de tempo, mudança de frequência, .... Os dados paramétricos, portanto, incluem apenas uma representação comparativamente não refinada do sinal ou do canal associado. Apresentado em números, a quantidade de dados requerida por um canal transportador estará na faixa de 60 - 70 kbit/s, enquanto a quantidade de dados requerida por informação paramétrica de lado para um canal estará na faixa de 1,5 - 2,5 kbit/s. Um exemplo de dados paramétricos são os fatores de escala bem conhecidos, informação de estéreo de intensidade ou parâmetros de sinal de som biauricular como será descrito abaixo. A codificação de estéreo de intensidade é descrita na pré-impressão AES 3799, "Intensity Stereo Coding", J.
Herre, K. H. Bandenburg, D. Lederer, Fevereiro de 1994, Amsterdã.
De forma geral, o conceito de estéreo de intensidade é baseado em uma transformação de eixo principal a ser aplicada aos dados de ambos os canais de áudio estereofônico. Se a maioria dos pontos de dados está concentrada ao redor do primeiro eixo de princípio, um ganho de codificação pode ser atingido pela rotação de ambos os sinais por um ângulo determinado anteriormente à codificação. Isto, entretanto, nem sempre é verdadeiro para técnicas de produção estereofônica real. Portanto, esta técnica é modificada pela exclusão do segundo componente ortogonal da transmissão na corrente de bit. Dessa maneira, os sinais reconstruídos para o canal esquerdo e canal direito consistem de versões diferentemente pesadas ou escalonadas do mesmo sinal transmitido. No entanto, os sinais reconstruídos diferem em sua amplitude, mas são idênticos com relação a sua informação de fase.
Os envelopes de energia-tempo de ambos os canais de áudio originais, entretanto, são preservados através da operação de escalonamento seletiva, que tipicamente opera de uma maneira seletiva à freqüência. Isto está adequado à percepção humana de som em altas freqüências, onde os sinais de som espaciais dominantes são determinados pelos envelopes de energia.
Além disso, em implementações práticas, o sinal transmitido, isto é, o canal transportador é gerado a partir da soma de sinal do canal esquerdo e do canal direito, ao invés de ser gerado da rotação de ambos os componentes. Além do mais, este processamento, isto é, a geração de parâmetros de estéreo de intensidade para executar a operação de escalonamento, é executado seletivamente à frequência, isto é, independentemente para cada banda de fator de escala, isto é, partição de frequência de codificador. Preferivelmente, ambos os canais são combinados para formar um canal "transportador" ou combinado, e, além do canal combinado, a informação de estéreo de intensidade é determinada, a qual depende da energia do primeiro canal, da energia do segundo canal ou da energia do combinado ou canal. A técnica BCC é descrita no documento da convenção AES 5574, "Binaural cue coding applied to stereo and multi-channel audio compression", C. Faller, F. Baumgarte, Maio 2002, Munique. Na codificação BCC, diversos canais de entrada de áudio são convertidos em uma representação espectral usando uma transformação baseada em DFT com janelas sobrepostas. O espectro uniforme resultante é dividido em partições não sobrepostas, cada uma tendo um índice. Cada partição tem uma largura de banda proporcional à largura de banda retangular equivalente (ERB). As diferenças de nível entre os canais (ICLD) e as diferenças de tempo entre os canais (ICTD) são estimadas para cada partição para cada quadro k. A ICLD e a ICTD são quantificadas e codificadas, resultando em uma corrente de bit BCC. As diferenças de nível entre os canais e as diferenças de tempo entre os canais são providas para cada canal em relação a um canal de referência.
Então, os parâmetros são calculados de acordo com fórmulas prescritas, que dependem de certas partições do sinal a ser processado.
Em um lado do decodif icador, o decodif icador recebe um sinal mono e a corrente de bit BCC. O sinal mono é transformado no domínio de freqüência e inserido em um bloco de síntese espacial, que também recebe valores ICLD e ICTD decodificados. No bloco de síntese espacial, os valores dos parâmetros BCC (ICLD e ICTD) são usados para executar operação de pesagem do sinal mono de modo a sintetizar os sinais de multicanais, que, após uma conversão freqüência/tempo, representa uma reconstrução do sinal de áudio de multicanais original.
No caso de BCC, o módulo estéreo conjunto 6 0 é operacional para enviar a informação de lado do canal, de modo que os dados de canal paramétrico são parâmetros ICLD ou ICTD quantificados e codificados, onde um dos canais originais é usado como o canal de referência para codificar a informação de lado do canal.
Normalmente, o canal transportador é formado da soma dos canais originais participantes.
Naturalmente, as técnicas acima provêem apenas uma representação mono para um decodificador, que pode apenas processar o canal transportador, mas não é capaz de processar os dados paramétricos para gerar uma ou mais aproximações de mais que um canal de entrada. A técnica de codificação de áudio conhecida como codificação de sinal de som biauricular (BCC) é também bem descrita nas publicações dos pedidos de Patente Norte-Americana N9 US 2003, 0219130 Al, 2003/0026441 Al e 2003/0035553 Al. Referência adicional é também feita a "Binaural Cue Coding. Part II: Schemes and Applications", C. Faller e F. Baumgarte, IEEE Trans. no "Audio and Speech Proc.", Vol. 11, N9 6, Nov. 2993. As publicações de pedidos de Patente Norte-Americana citadas e as duas publicações técnicas citadas sobre a técnica BCC de autoria de Faller e Baumgarte são incorporadas aqui por referência em suas totalidades. A seguir, um esquema BCC genérico típico para codificação de áudio de multicanais é elaborado de forma mais detalhada com referências às Figuras 11 a 13. A Figura 11 mostra este esquema de codificação de sinal de som biauricular genérico para codificação/transmissão de sinais de áudio de multicanais. É efetuado um downmix do sinal de entrada de áudio de multicanais em uma entrada 110 de um codificador BCC 112 em um bloco de downmix 114. No presente exemplo, o sinal de multicanais original na entrada 110 é um sinal surround de 5 canais tendo um canal esquerdo frontal, um canal direito frontal, um canal esquerdo surround, um canal direito surround e um canal central. Por exemplo, o bloco de downmix 114 produz uma soma de sinal pela simples adição destes cinco canais em um sinal mono. Outros esquemas de downmix são conhecidos na técnica, de modo que usando um sinal de entrada de multicanais, um sinal de downmix tendo um canal único pode ser obtido. Este canal único é enviado em uma linha de soma de sinal 115. Uma informação de lado obtida por um bloco de análise BCC 116 é enviada em uma linha de informação de lado 117. No bloco de análise BCC, diferenças de nível entre os canais (ICLD), e diferenças de tempo entre os canais (ICTD) são calculadas como foi descrito acima. Recentemente, o bloco de análise BCC 116 foi aumentado para calcular também valores de correlação entre os canais (valores ICC) . A soma de sinal e a informação de lado são transmitidas, preferivelmente em uma forma quantificada e codificada, para um decodificador BCC 120. O decodificador BCC decompõe a soma de sinal transmitida em diversas sub-bandas e aplica escalonamento, atrasos e outros processamentos para gerar as sub-bandas dos sinais de áudio de multicanais de saída. Este processamento é executado de modo que os parâmetros de ICLD, ICTD e ICC (sinais de som) de um sinal de multicanais reconstruído em uma saída 121 sejam similares aos sinais de som respectivos para o sinal de multicanais originais na entrada 110 no codificador BCC 112. Para esta finalidade, o decodificador BCC 120 inclui um bloco de síntese BCC 122 e um bloco de processamento de informação de lado 123. A seguir, a construção interna do bloco de síntese BCC 122 é explicada com referência à Figura 12. O sinal de soma na linha 115 é inserido em uma unidade de conversão de tempo/freqüência ou banco de filtro FB 125. Na saída do bloco 125, existe um número N de sinais de sub-bandas ou, em um caso extremo, um bloco de um coeficiente espectral, quando o banco de filtro de áudio 125 executa uma transformação 1:1, isto é, uma transformação que produz N coeficientes espectrais de N amostras de domínio de tempo. 0 bloco de síntese BCC 122 compreende ainda um estágio de atraso 126, um estágio de modificação de nível 127, um estágio de processo de correlação 128 e um estágio de banco de filtro inverso IFB 129. Na saída do estágio 129, o sinal de áudio de multicanais reconstruído que tem, por exemplo, cinco canais no caso de um sistema surround de 5 canais, pode ser enviado a um conjunto de alto-falantes 124 conforme ilustrado na Figura 11.
Conforme mostrado na Figura 12, o sinal de entrada s(n) é convertido no domínio de freqüência ou domínio de banco de filtro através do elemento 125. A saída de sinal pelo elemento 125 é multiplicada de modo que várias versões do mesmo sinal são obtidas conforme ilustrado pelo nó de multiplicação 130. O número de versões do sinal original é igual ao número de canais de saída no sinal de saída a ser reconstruído. Quando, de forma geral, cada versão do sinal original no nó 130 é submetida a certo atraso dx, d2, ..., dt, ..., d,j. Os parâmetros de atraso são computados pelo bloco de processamento de informação de lado 123 na Figura 11 e são derivados das diferenças de tempo entre os canais conforme determinado pelo bloco de análise BCC 116. O mesmo é verdadeiro para parâmetros de multiplicação ai, a2, ..., ai, aN, que também são calculados pelo bloco de processamento de informação de lado 123 com base nas diferenças de nível entre os canais conforme calculado pelo bloco de análise BCC 116.
Os parâmetros ICC calculados pelo bloco de análise BCC 116 são usados para controlar a funcionalidade do bloco 128, de modo que certas correlações entre os sinais atrasados e de nível manipulado são obtidas nas saídas do bloco 128. Deve ser aqui observado que a ordem entre os estágios 126, 127, 128 pode ser diferente do caso mostrado na Figura 12.
Deve ser aqui observado que, em um processamento relativo ao quadro de um sinal de áudio, a análise BCC é executada em relação ao quadro, isto é, com variação de tempo, e também em relação à freqüência. Isto significa que, para cada banda espectral, os parâmetros BCC são obtidos. Isto significa que, no caso do banco de filtro de áudio 125 decompor o sinal de entrada em, por exemplo, 32 sinais de passagem de banda, o bloco de análise BCC obtém um conjunto de parâmetros BCC para cada uma das 32 bandas. Naturalmente, o bloco de síntese BCC 122 da Figura 11, que é mostrado em detalhe na Figura 12, executa uma reconstrução que é também baseada nas 32 bandas no exemplo. A seguir, é feito referência à Figura 13 que mostra um ajuste para determinar certos parâmetros BCC.
Normalmente, parâmetros ICLD, ICTD e ICC podem ser definidos entre pares de canais. Entretanto, é preferido determinar parâmetros ICLD e ICTD entre um canal de referência e cada canal diferente. isto é, ilustrado na Figura 13A.
Os parâmetros ICC podem ser definidos de maneiras diferentes. Mais comumente, os parâmetros ICC podem ser estimados no codificador entre todos os pares possíveis de canais conforme indicado na Figura 13B. Neste caso, um decodificador sintetizaria ICC de modo que ele fosse aproximadamente igual ao sinal original de multicanais entre todos os pares possíveis de canais. Foi, entretanto, proposto que se estimassem apenas parâmetros ICC entre os dois canais mais fortes de cada vez. Este esquema é ilustrado na Figura 13C, onde um exemplo é mostrado, no qual em um caso único, um parâmetro ICC é estimado entre os canais 1 e 2, e, em um outro caso no tempo, um parâmetro ICC é calculado entre os canais 1 e 5. O decodificador, então, sintetiza a correlação entre canais em relação aos canais mais fortes no decodificador e aplica alguma regra heurística para computar e sintetizar a coerência entre os canais para os pares de canais remanescentes.
Com relação ao cálculo, por exemplo, dos parâmetros de multiplicação aj, aN com base nos parâmetros ICLD
transmitidos, é feito referência ao documento da convenção AES 5574 citado acima. Os parâmetros ICLD representam uma distribuição de energia em um sinal original de multicanais. Sem perda de generalidade, é mostrado na Figura 13A que existem quatro parâmetros ICLD que mostram a diferença de energia entre todos os outros canais e o canal esquerdo frontal. No bloco de processamento de informação de lado 123, os parâmetros de multiplicação ax, ..., aN são derivados dos parâmetros ICLD, de modo que a energia total de todos os canais de saída reconstruídos é igual (ou proporcional) à energia do sinal de soma transmitido. Uma maneira simples para determinar estes parâmetros é um processo de 2 estágios, no qual, em um primeiro estágio, o fator de multiplicação para o canal frontal esquerdo é ajustado para a unidade, enquanto os fatores de multiplicação para os outros canais na Figura 13A são ajustados aos valores ICLD transmitidos.
Então, em um segundo estágio, a energia de todos os cinco canais é calculada e comparada com a energia do sinal de soma transmitido.
Então, todos os canais são escalonados de forma decrescente usando um fator de escalonamento decrescente que é igual para todos os canais, onde o fator de escalonamento decrescente é selecionado de modo que a energia total de todos os canais de saída reconstruídos seja, após escalonamento decrescente, igual à energia total do sinal de soma transmitido.
Naturalmente, existem outros métodos para calcular os fatores de multiplicação, que não se baseiam no processo de 2 estágios, mas que necessitam apenas um processo de 1 estágio.
Com relação aos parâmetros de atraso, deve ser observado que os parâmetros ICTD de atraso, que são transmitidos de um codificador BCC podem ser usados diretamente, quando o parâmetro de atraso dj para o canal frontal esquerdo é ajustado para zero. Nenhum rescalonamento tem que ser efetuado aqui, visto que o atraso não altera a energia do sinal.
Com referência a medição de coerência entre canais ICC transmitida do codificador BCC para o decodificador BCC, deve ser aqui observado que uma manipulação de coerência pode ser feita através da modificação dos fatores de multiplicação alz ..., an tal como pela multiplicação dos fatores de pesagem de todas as sub-bandas com números aleatórios com uma faixa de (201ogl0(-6) e 201ogl0(6)]. A seqüência pseudo-aleatória é preferivelmente escolhida de modo que a variação seja aproximadamente constante para todas as bandas críticas, e a média seja zero dentro de cada banda crítica. A mesma seqüência é aplicada aos coeficientes espectrais para cada quadro diferente. Dessa maneira, a largura da imagem auditiva é controlada pela modificação da variação da seqüência pseudo-aleatória. Uma variação maior cria uma largura de imagem maior. A modificação na variação pode ser executada em bandas individuais que sejam larguras de bandas críticas. Isto permite a existência simultânea de diversos objetos em uma cena auditiva, cada objeto tendo uma largura de imagem diferente. Uma distribuição de amplitude adequada para a seqüência pseudo-aleatória é uma distribuição uniforme em uma escala logarítmica conforme ela é descrita na publicação de pedido de Patente Norte- Americana N9 2003/0219130 Al. No entanto, todo o processamento de síntese BCC está relacionado com um único canal de entrada transmitido como o sinal de soma do codificador BCC para o decodificador BCC conforme mostrado na Figura 11.
Para transmitir os cinco canais de uma maneira compatível, isto é, em um formato de corrente de bits, que é também compreensível para um decodificador estéreo normal, a técnica denominada de matriz tem sido usada conforme descrita no "surround MUSICAM: um sistema de codificação de multicanais universal compatível com a ISO 11172-3", G. Theile e G. Stoll, pré-impressão AES 3403, Outubro de 1992, São Francisco. Os cinco canais de entrada, L, R, C, Ls, e Rs são alimentados em um dispositivo de matriz que executa uma operação de matriz para calcular os canais de estéreo básicos ou compatíveis, a partir dos cinco canais de entrada. Em especial, estes canais estéreos básicos Lo/Ro são calculados conforme definido abaixo: Lo = L + xC + yLs Ro = R + xC + yRs x e y são constantes. Os outros três canais C, Ls, Rs são transmitidos como estão em uma camada de extensão, além da camada de estéreo básica, que inclui uma versão codificada dos sinais de estéreo básicos Lo/Ro. Com relação à corrente de bits, esta camada de estéreo básica Lo/Ro inclui um cabeçalho, informação como fatores de escala e amostras de sub-bandas. A camada de extensão de multicanais, isto é, o canal central e os dois canais surround são incluídos no campo de extensão de multicanais, que é também denominado de campo de dados auxiliares.
No lado do decodificador, uma operação de matriz inversa é executada de modo a formar reconstruções dos canais esquerdo e direto na representação de cinco canais, usando os canais de estéreo básicos Lo, Ro e os três canais adicionais. Além disso, os três canais adicionais são decodificados a partir da informação auxiliar, de modo a obter uma representação de cinco canais ou surround decodificada do sinal original de áudio de multicanais.
Uma outra abordagem para codificação de multicanais é descrita na publicação "Improved MPEG-2 audio multichannel encoding", B. Grill, J. Herre, K. H. Brandenburg, E.
Eberlein, J. Koller, J. Mueller, pré-impressão AES 3865, Fevereiro de 1994, Amsterdã, na qual, de modo a obter compatibilidade regressiva, modos compatíveis regressivos são considerados. Para esta finalidade, uma matriz de compatibilidade é usada para obter dois canais de downmix denominados Lc, Rc dos cinco canais originais de entrada. Além do mais, é possível selecionar dinamicamente os três canais auxiliares transmitidos como dados auxiliares.
De modo a explorar a irrelevância do estéreo, uma técnica de estéreo conjugado é aplicada a grupos de canais, por exemplo, os três canais frontais, isto, para o canal esquerdo, o canal direito e o canal central. Para esta finalidade, estes três canais são combinados para obter um canal combinado. Este canal combinado é quantificado e empacotado na corrente de bits. Então, este canal combinado, com a informação de estéreo conjugado correspondente, é colocado em um módulo de decodificação de estéreo conjugado para obter canais decodificados de estéreo conjugados, isto é, um canal esquerdo decodificado de estéreo conjugado, um canal direito decodificado de estéreo conjugado e um canal central decodificado de estéreo conjugado. Estes canais decodificados de estéreo conjugado são, com o canal surround esquerdo e o canal surround direito, inseridos em um bloco de matriz de compatibilidade para formar o primeiro e o segundo canais de downmix Lc, Rc. Então, versões quantificadas de ambos os canais de downmix e uma versão quantificada do canal combinado são empacotadas na corrente de bits com parâmetros de codificação de estéreo conjugado.
Usando codificação de estéreo de intensidade, portanto, um grupo de sinais de canal originais independentes é transmitido dentro de uma porção única de dados "transportadores". 0 decodificador, então, reconstrói os sinais envolvidos como dados idênticos, que são novamente escalonados de acordo com seus envelopes de energia-tempo originais. Consequentemente, uma combinação linear dos canais transmitidos conduzirá a resultados, que são bastante diferentes do downmix original. Isto se aplica a qualquer tipo de codificação de estéreo conjugado baseada no conceito de estéreo de intensidade. Para um sistema de codificação que provê canais de downmix compatíveis, existe uma consequência direta: A reconstrução por dissolução de matriz, conforme descrito na publicação anterior, sofre de artefatos causados pela reconstrução imperfeita. Usando um esquema denominado de pré-distorção de estéreo conjugado, no qual uma codificação de estéreo conjugado dos canais esquerdo, direito e central é executada antes da execução de matriz no codificador, alivia este problema. Desta maneira, o esquema de dissolução de matriz para reconstrução introduz menos artefatos, visto que, no lado do codificador, os sinais decodificados de estéreo conjugado foram usados para gerar os canais de downmix. Dessa maneira, o processo de reconstrução imperfeita é mudado para os canais de downmix compatíveis Lc e Rc, onde ele é muito mais provável de ser disfarçado pelo próprio sinal de áudio.
Embora este sistema tenha resultado em menos artefatos devido à dissolução de matriz no lado do decodificador, ele, no entanto, apresenta algumas desvantagens. Uma desvantagem é que os canais de downmix Lc e Rc compatíveis com estéreo são derivados não dos canais originais, mas de versões codificadas/decodifiçadas de estéreo de intensidade dos canais originais. Portanto, perdas de dados devido ao sistema de codificação de estéreo de intensidade são incluídas nos canais de downmix compatíveis. Um decodificador apenas estéreo, que decodifica apenas os canais compatíveis ao invés dos canais codificados de estéreo de intensidade melhorados, portanto, provê um sinal de saída, que é afetado pelas perdas de dados induzidas por estéreo de intensidade.
Além disso, um canal adicional completo tem que ser transmitido além dos dois canais de downmix. Este canal é o canal combinado, que é formado através de codificação de estéreo conjugado do canal esquerdo, canal direito e canal central. Além disso, a informação de estéreo de intensidade para reconstruir os canais originais L, R, C a partir do canal combinado também tem que ser transmitida para o decodificador. No decodificador, uma construção de matriz inversa, isto é, uma operação de dissolução de matriz é executada para derivar os canais surround dos dois canais de downmix. Além disso, os canais originais esquerdo, direito e central são aproximados por decodificação de estéreo conjugado usando o canal combinado transmitido e os parâmetros de estéreo conjugado transmitidos. Deve ser observado que os canais originais esquerdo, direito e central são derivados por decodificação de estéreo conjugado do canal combinado.
Um melhoramento do esquema BCC mostrado na Figura 11 é um esquema BCC com pelo menos dois canais de transmissão de áudio, de modo que um processamento compatível com estéreo é obtido. No codificador, os canais de entrada C são submetidos a downmix para canais de áudio de transmissão E. Os sinais de som ICTD, ICLD e ICC entre certos pares de canais de entrada são estimados como uma função de freqüência e tempo. Os sinais de som estimados são transmitidos para o decodificador como informação de lado. Um esquema BCC com canais de entrada C e canais de transmissão E é denominado de BCC C-2-E.
De forma geral, processamento BCC é um põs- processamento seletivo à freqüência, com variação de tempo dos canais transmitidos. A seguir, com a compreensão implícita disto, um índice de banda de freqüência não será introduzido. Ao invés disso, variáveis como xn, s„, yn, an, etc. são presumidas como sendo vetores com dimensão (1, f) , onde f denota o número de bandas de freqüência. O esquema denominado BCC regular é descrito por C. Faller e F. Baumgarte, "Binaural Cue Coding applied to stereo and multi-channel audio compression," na "Preprint 112th Conv. Aud. Engl. Soc.", Maio de 2002, F. Baumgarte e C. Faller, "Binaural Cue Coding - Part I: Psychoacoustic fundamentais and design principies," IEEE Trans. no "Speech and Audio Proc.", vol. 11, n9 6, Nov. de 2003, e C. Faller e F. Baumgarte, "Binaural Cue Coding - Part II; Schemes and applications," IEEE Trans. no "Speech and Audio Proc.”, vol. 11, n9 6, Nov. de 2003. Aqui, tem-se um canal de áudio transmitido único conforme mostrado na Figura 11, é uma extensão compatível regressiva de sistemas mono existentes para reprodução de áudio estéreo ou de multicanais. Visto que o canal de áudio único transmitido é um sinal mono válido, ele é adequado para reprodução por receptores legacy.
Entretanto, a maioria dos equipamentos de infra- estrutura de transmissão instalados (rádio, televisão análogos e digitais, etc.) e sistemas de armazenagem de áudio (vinil, discos, fitas cassete, disco compacto, vídeo VHS, armazenagem de som MP3, etc.) são baseados em estéreo de dois canais. Por outro lado, sistemas de home theater em conformidade com a norma 5.1 (Rec. ITU-R BS.775, Mui ti-Channel Stereophonic Sound System with or without Accompanying Picture, ITU, 1993, http://wwvz.itu.org) , estão se tornando mais populares. Dessa maneira, BCC com dois canais de transmissão (C-para-2 BCC), conforme ele é descrito por J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, e C.
Spenger, "MP3 Surround: Efficient and compatible coding of multichannel audio, " na "Preprint 116th Conv. Aud. Eng. Soc. ", Maio de 2004, é especialmente interessante para estender os sistemas estéreo existentes para surround de multicanais. Em conexão com isto, é feito também referência ao pedido de Patente Norte- Americana "Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal", número de série 10/762,100, depositada em 20 de Janeiro de 2004.
No domínio análogo, algoritmos de matriz como "Dolby Surround", "Dolby Pro Logic", e "Dolby Pro Logic II" (J.
Hull, "Surround sound past, present, and future," Techn. Rep., Dolby Laboratories, 1999, www.dolby.com/tech/; R. Dressler, "Dolby Surround Prologic II Decoder - Principies of operation," Techn Rep., Dolby Laboratories, 2000, www.dolby.com/tech/) têm sido populares por muitos anos. Estes algoritmos se aplicam a "execução de matriz" para mapear os canais de áudio 5.1 para um par de canais compatível com estéreo. Entretanto, algoritmos de matriz provêem apenas flexibilidade e qualidade significativamente reduzidas se comparados com canais de áudio discretos como é descrito por J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, e C. Spenger, "MP3 Surround: Efficient and compatible coding of multi-channel audio," na "Preprint 116th Conv. Aud. Eng. Soc.", Maio de 2004. Se limitações de algoritmos de matriz já são considerados ao misturar sinais de áudio para surround 5.1, alguns dos efeitos desta imperfeição podem ser reduzidos como é descrito por J. Hilson, "Mixing with Dolby Pro Logic II Technology," Tech. Rep., Dolby Laboratories, 2004, www.dolby.com/tech/PLII.Mixing.JimHilson.html. BCC C-para-2 pode ser visto como um esquema com funcionalidade similar a um algoritmo de matriz com informação de lado auxiliar adicional. Ele é, entretanto, mais geral em sua natureza, visto que ele suporta mapeamento de qualquer número de canais originais para qualquer número de canais transmitidos. BCC C-para-E é destinado a domínio digital e sua informação de lado adicional de baixa taxa de bit usualmente pode ser incluída na transmissão de dados existente de uma maneira compatível regressiva. Isto significa que receptores legacy ignorarão a informação de lado adicional e reproduzirão os 2 canais transmitidos diretamente como é descrito por J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, e C. Spenger, "MP3 Surround·.
Efficient and compatible coding of multi-channel audio," na "Preprint 116th Conv. Aud. Eng. Soc.", Maio de 2004. O objetivo permanente é atingir uma qualidade de áudio similar a uma transmissão discreta de todos os canais de áudio originais, isto é, qualidade significativamente melhor que aquela que pode ser esperada de um algoritmo de matriz convencional. A seguir, é feito referência à Figura 6a de modo a ilustrar a operação de downmix do codificador convencional para gerar dois canais de transmissão a partir de cinco canais de entrada, que são um canal esquerdo L ou xlf um canal direito R ou x2, um canal central C ou x3, um canal esquerdo surround sL ou x4 e um canal direito surround sR ou x5. A situação de downmix é esquematicamente mostrada na Figura 6a. Se torna claro que o primeiro canal de transmissão é formado usando um canal esquerdo x3, um canal central x3 e um canal esquerdo surround x4.
Além disso, a Figura 6a deixa claro que o canal de transmissão direito y2 é formado usando o canal direito x2, o canal central x3 e o canal direito surround x5. A regra de downmix ou matriz de downmix geralmente preferida é mostrada na Figura 6C. Fica claro que o canal central x3 é pesado por um fator de pesagem 1/^2, que significa que a primeira metade da energia do canal central x3 é colocada no canal de transmissão esquerdo ou primeiro canal de transmissão Lt, enquanto a segunda metade da energia no canal central é introduzida no segundo canal de transmissão ou canal de transmissão direito Rt. Dessa maneira, o downmix mapeia os canais de entrada para os canais transmitidos. O downmix é convenientemente descrito por uma matriz (m, n), mapeando n amostras de entrada para m amostras de saída. As entradas desta matriz são os pesos aplicados aos canais correspondendo a canais antes da soma para formar o canal de saída relacionado.
Existem métodos de downmix diferentes que podem ser encontrados nas recomendações ITU (Rec. ITU-R BS.775, MultiChannel Stereophonic Sound System with or without Accompanying Picture, ITU, 1993, http://www.itu.org). Além disso, é feito referência a J. Herre, C. Faller, C. Ertel, J. Hilpert, A.
Hoelzer, e C. Spenger, "MP3 Surround: Efficient and compatible coding of multi-channel audio," na "Preprint 116Lh Conv. Aud. Eng. Soc.", Maio de 2004, Seção 4.2 com relação a diferentes métodos de downmix. O downmix pode ser executado tanto no domínio de tempo como no de freqüência. Ele pode ter variação de tempo em um sinal de forma adaptada ou dependente de freqüência (banda). A designação de canal é mostrada pela matriz à direita da Figura 6a e é provida como segue: Assim, para o caso importante de BCC 5-para-2, um canal transmitido é computado da direita, direita posterior e centro, e o outro canal transmitido da esquerda, esquerda posterior e centro, correspondendo a uma matriz de downmix, por exemplo, de que é também mostrada na Figura 6c.
Nesta matriz de downmix, os fatores de pesagem podem ser escolhidos de modo que a soma do quadrado dos valores em cada coluna seja um, de modo que a força de cada sinal de entrada contribua igualmente para os sinais de downmix. Obviamente outros esquemas de downmix poderiam, também, ser usados.
Especificamente, é feito referência à Figura 6b ou 7b, que mostra uma implementação específica de um esquema de downmix de codificador. O processamento para uma sub-banda é mostrado. Em cada sub-banda, os fatores de escalonamento ex e e2 são controlados para "equalizar" a altura dos componentes de sinal no sinal de downmix. Neste caso, o downmix é executado no domínio de freqüência, com a variável n (Figura 7b) designando um índice de tempo de sub-banda de domínio de freqüência e k sendo o índice do bloco de sinal de domínio de tempo transformado. Especificamente, é dirigida atenção ao dispositivo de pesagem para pesar o canal central antes da versão pesada do canal central ser introduzida no canal esquerdo de transmissão e no canal direito de transmissão pelos respectivos dispositivos de soma. A operação de upmix correspondente no decodif icador é mostrada com relação às Figuras 7a, 7b e 7c. No decodif icador, um upmix tem que ser calculado, o qual mapeia o canal transmitido para os canais de saída. 0 upmix é convenientemente descrito por uma matriz (i, j) (linhas i, colunas j), mapeando amostras transmitidas i para amostras de saída j. Novamente, as entradas desta matriz são os pesos aplicados aos canais correspondentes antes de somar para formar o canal de saída relacionado. O upmix pode ser executado tanto no domínio de tempo como no de freqüência. Além disso, ele pode ter variação de tempo de uma maneira adaptativa ao sinal ou dependente de freqüência (banda). Em oposição à matriz de downmix, os valores absolutos das entradas de matriz não representam os pesos finais dos canais de saída, visto que estes canais de upmix são modificados, além disso, no caso de processamento BCC. Em especial, a modificação ocorre usando a informação provida pelos sinais de som espaciais como ICLD, etc. Aqui, neste exemplo, todas as entradas são definidas como 0 ou 1. A Figura 7a mostra a situação de upmix para um sistema surround de 5 falantes. Além de cada falante, o canal base usado para síntese de BCC é mostrado. Especificamente, com relação ao canal de saída surround esquerdo, um primeiro canal transmitido yi é usado. 0 mesmo é verdadeiro para o canal esquerdo. Este canal é usado como um canal base, também denominado o "canal esquerdo transmitido".
Quanto ao canal de saída direito e ao canal de saída surround direito, eles também usam o mesmo canal, isto é, o segundo canal ou canal direito transmitido y2. Quanto ao canal central, deve ser aqui observado que o canal base para a síntese do canal central BCC é formado de acordo com a matriz de upmix mostrada na Figura 7c, isto é, pela adição de ambos os canais transmitidos. O processo para gerar o sinal de saída de 5 canais, sendo providos os dois canais transmitidos, é mostrado na Figura 7b. Aqui, o upmix é efetuado no domínio de freqüência com a variável n denotando um índice de tempo de sub-banda de domínio de freqüência, e k sendo o índice do bloco de sinal de domínio de tempo transformado. Deve ser aqui observado que a síntese ICTD e ICC é aplicada entre os pares de canal para os quais o mesmo canal base é usado, isto é, entre esquerda e esquerda posterior, e entre direita e direita posterior, respectivamente. Os dois blocos denotados como A na Figura 7b incluem também esquemas para síntese de ICC de 2 canais. A informação de lado estimada no codificador, que é necessária para computar todos os parâmetros para a síntese de sinal de saída do decodificador inclui os seguintes sinais de som: ÁLn, AL13, AL14, AL15, r14, r25, ci4, e c2S (ALij é a diferença de nível entre o canal i e j, é a diferença de tempo entre o canal i e j, e Cij é um coeficiente de correlação entre o canal i e j) . Deve ser aqui observado que outras diferenças de nível podem também ser usadas. Existe um requisito de que informação suficiente esteja disponível no decodificador para computação, por exemplo, fatores de escala, atrasos, etc. para síntese BCC. A seguir, é feito referência à Figura 7d de modo a ilustrar, além disso, a modificação de nível para cada canal, isto é, o cálculo de a^ e a normalização geral subsequente, que não é mostrada na Figura 7b. Preferivelmente, as diferenças de nível entre canais ALt são transmitidas como informação de lado, isto é, como ICLD. Aplicadas a um sinal de canal, deve ser usada a relação exponencial entre o canal de referência Fref e um canal a ser calculado, isto é, Ft. isto é, mostrado na parte superior da Figura 7d. O que não é mostrado na Figura 7b é a normalização geral subsequente ou final, que pode ocorrer antes dos blocos de correlação A ou após os blocos de correlação A.
Quando os blocos de correlação afetam a energia dos canais pesados por ai,a normalização geral deve ocorrer após os blocos de correlação A. Para certificar-se que a energia de todos os canais de saída é igual à energia de todos os canais transmitidos, o canal de referência é escalonado conforme mostrado na Figura 7d.
Preferivelmente, o canal de referência é a raiz da soma do quadrado dos canais transmitidos. A seguir, os problemas associados com estes esquemas de downmix/upmix são descritos. Quando o esquema BCC 5-para-2 conforme ilustrado na Figura 6 e Figura 7 é considerado, o seguinte se torna claro. O canal central original é introduzido em ambos os canais transmitidos e, consequentemente, também nos canais de saída esquerdo e direito reconstruídos.
Além disso, neste esquema, a contribuição do centro comum tem a mesma amplitude em ambos os canais de saída reconstruídos.
Além do mais, o sinal central original é substituído durante a decodificação por um sinal central, que é derivado dos canais esquerdo e direito transmitidos e, dessa maneira, não pode ser independente (isto é, não correlacionado) com os canais esquerdo e direito reconstruídos.
Este efeito tem consequências desfavoráveis na qualidade de som percebida para sinais com uma imagem de som muito ampla que é caracterizada por um alto grau de não correlação (isto é, baixa coerência) entre todos os canais de áudio. Um exemplo para estes sinais é o som de uma platéia aplaudindo, ao usar diferentes microfones com um espaçamento suficientemente amplo para gerar os sinais de multicanais originais. Para estes sinais, a imagem de som do som decodificado se torna mais estreita e sua amplidão natural é reduzida.
Sumário da Invenção É objetivo da presente invenção prover um cõnceito de reconstrução de multicanais de alta qualidade que resulte em um sinal de saída multicanais que tem uma percepção de som melhorada.
De acordo com o primeiro aspecto desta invenção, este objetivo é atingido por um equipamento para gerar um sinal de saída multicanais que tem canais de saída K, o sinal de saída multicanais correspondendo a um sinal de entrada de multicanais que tem canais de entrada C, usando canais de transmissão E, os canais de transmissão E representando um resultado de uma operação de downmix tendo canais de entrada C como uma entrada, e usando informação paramétrica de lado relacionada com os canais de entrada, onde E é 2, C é > E, eKé>le^C, e onde a operação de downmix é efetiva para introduzir um primeiro canal de entrada em um primeiro canal de transmissão e em um segundo canal de transmissão, e introduzir, além disso, um segundo canal de entrada no primeiro canal de transmissão, compreendendo: um calculador de canal de cancelamento para calcular um canal de cancelamento usando informação relacionada com o primeiro canal de entrada incluída no primeiro canal de transmissão, no segundo canal de transmissão ou na informação paramétrica de lado; um combinador para combinar o canal de cancelamento e o primeiro canal de transmissão ou uma versão processada deste para obter um segundo canal de base, no qual uma influência do primeiro canal de entrada é reduzida se comparada à influência do primeiro canal de entrada no primeiro canal de transmissão; e um reconstrutor de canal para reconstruir um segundo canal de saída correspondendo ao segundo canal de entrada, usando o segundo canal de base e informação paramétrica de lado relacionada com o segundo canal de entrada, e para reconstruir um primeiro canal de saída correspondendo ao primeiro canal de entrada usando um primeiro canal de base diferente do segundo canal de base pela influência do primeiro canal ser maior se comparada com o segundo canal base, e informação paramétrica de lado relacionada com o primeiro canal de entrada.
De acordo com um segundo aspecto da presente invenção, este objetivo é atingido por um método para gerar um sinal de saída multicanais que tem canais de saída K, o sinal de saída multicanais correspondendo ao sinal de entrada de multicanais tendo canais de entrada C, usando canais de transmissão E, os canais de transmissão E representando um resultado de uma operação de downmix tendo canais de entrada C como uma entrada, e usando informação paramétrica de lado relacionada com os canais de entrada, onde E é > 2, Cé>E, eKé > 1 e £ C, e onde a operação de downmix é efetiva para introduzir um primeiro canal de entrada em um primeiro canal de transmissão e em um segundo canal de transmissão, e para, além disso, introduzir um segundo canal de entrada no primeiro canal de transmissão, compreendendo: calcular um canal de cancelamento usando informação relacionada com o primeiro canal de entrada incluída no primeiro canal de transmissão, no segundo canal de transmissão ou na informação paramétrica de lado; combinando o canal de cancelamento e o primeiro canal de transmissão ou uma versão processada deste para obter um segundo canal de base, no qual uma influência do primeiro canal de entrada é reduzida se comparada com a influência do primeiro canal de entrada no primeiro canal de transmissão; e reconstruindo um segundo canal de saída correspondendo ao segundo canal de entrada usando o segundo canal base e informação paramétrica de lado relacionada com o segundo canal de entrada, e um primeiro canal de saída correspondendo ao primeiro canal de entrada usando um primeiro canal de base diferente do segundo canal de base pela influência do primeiro canal ser maior se comparada com o segundo canal de base, e informação paramétrica de lado relacionada com o primeiro canal de entrada.
De acordo com um terceiro aspecto da presente invenção, este objetivo é atingido por um programa de computador que tem um código de programa para executar o método para gerar um sinal de saída multicanais, quando o programa é executado em um computador.
Deve ser aqui observado que, preferivelmente, K é igual a C. No entanto, menos canais de saída poderiam também ser reconstruídos, tal como três canais de saída, L, R, C e Ls e Rs não seriam reconstruídos. Neste caso, os canais de saída K (=3) correspondem a três dos canais originais de entrada C ( = 5) L, R, C. A presente invenção é baseada na descoberta de que, para melhorar a qualidade do som do sinal de saída multicanais, certo canal de base é calculado através da combinação de um canal transmitido e um canal de cancelamento, que é calculado no receptor ou decodificador-final. O canal de cancelamento é calculado de modo que o canal de base modificado obtido pela combinação do canal de cancelamento e do canal transmitido tem uma influência reduzida do canal central, isto é, o canal que é introduzido em ambos os canais de transmissão. Dito de maneira diferente, a influência do canal central, isto é, o canal que é introduzido em ambos os canais de transmissão, que inevitavelmente ocorre ao efetuar as operações de downmix e subsequente upmix, é reduzida se comparada com uma situação na qual nenhum canal de cancelamento é calculado e combinado a um canal de transmissão.
Em contraste à técnica anterior, por exemplo, o canal de transmissão esquerdo não é simplesmente usado como o canal de base para reconstruir o canal esquerdo ou canal surround esquerdo. Em contraste a isto, o canal de transmissão esquerdo é modificado pela combinação com o canal de cancelamento, de modo que a influência do canal de entrada central original no canal de base para reconstruir o canal de saída esquerdo ou direito, é reduzida ou mesmo completamente eliminada.
Inventivamente, o canal de cancelamento é calculado no decodificador usando informação no canal central original que já está presente no decodificador ou gerador de saída de multicanais. A informação no canal central é incluída no canal transmitido esquerdo, no canal transmitido direito e na informação paramétrica de lado, tais como nas diferenças de nível, diferenças de tempo ou parâmetros de correlação para o canal central. Dependendo de certas configurações, toda esta informação pode ser usada para obter um cancelamento de canal central de alta qualidade. Em outras configurações de nível mais baixo, entretanto, apenas uma parte desta informação no canal de entrada central é usada. Esta informação pode ser o canal de transmissão esquerdo, o canal de transmissão direito ou a informação paramétrica de lado. Além disso, pode-se usar informação estimada no codificador e transmitida para o decodificador.
Dessa maneira, em um ambiente de 5-para-2, o canal transmitido esquerdo ou o canal transmitido direito não é usado diretamente para a reconstrução esquerda e direita, mas são modificados através da combinação com o canal de cancelamento para obter um canal de base modificado, que é diferente do canal transmitido correspondente. Preferivelmente, um fator de pesagem adicional, que dependerá da operação de downmix executada em um codificador para gerar os canais de transmissão, é também incluído no cálculo de canal de cancelamento. Em um ambiente 5-para-2, pelo menos dois canais de cancelamento são calculados, de modo que cada canal de transmissão pode ser combinado com um canal de cancelamento designado para obter canais de base modificados para reconstruir os canais de saída esquerdo e surround esquerdo, e os canais de saída direito e surround direito, respectivamente. A presente invenção pode ser incorporada em uma séria de sistemas ou aplicações incluindo, por exemplo, reprodutores digitais de vídeo, reprodutores digitais de áudio, computadores, receptores de satélite, receptores de cabo, receptores de transmissão terrestre e sistemas de entretenimento domésticos.
Breve Descrição dos Desenhos As configurações preferidas da presente invenção são subsequentemente descritas através de referência às figuras anexas, nas quais: A Fig. 1 é um diagrama de bloco de um codificador de multicanais que produz canais de transmissão e informação paramétrica de lado nos canais de entrada; A Fig. 2 é um diagrama de bloco esquemático do equipamento preferido para gerar um sinal de saída multicanais de acordo com a presente invenção; A Fig. 3 é um diagrama esquemático do equipamento da invenção de acordo com uma primeira configuração da presente invenção; A Fig. 4 é uma implementação de circuito da configuração preferida da Fig. 3; A Fig. 5a é um diagrama de bloco do equipamento da invenção de acordo com uma segunda configuração da presente invenção; A Fig. 5b é uma representação matemática de upmix dinâmico conforme mostrado na Fig. 5a; A Fig. 6a é um diagrama geral para ilustrar a operação de downmix; A Fig. 6b é um diagrama de circuito para implementar a operação de downmix da Figura 6a; A Fig. 6c é uma representação matemática da operação de downmix; A Fig. 7a é um diagrama esquemático para indicar canais de base usados para upmix em um ambiente compatível com estéreo; A Fig. 7b é um diagrama de circuito para implementar uma reconstrução de multicanais em um ambiente compatível com estéreo; A Fig. 7c é uma representação matemática da matriz de upmix usada na Fig. 7b; A Fig. 7d é uma ilustração matemática da modificação de nível para cada canal e a normalização geral subsequente; A Fig. 8 ilustra um decodificador; A Fig. 9 ilustra um decodificador; A Fig. 10 ilustra um codificador estéreo conjugado da técnica anterior. A Fig. 11 é uma representação de diagrama de bloco de um sistema codificador/decodificador BCC da técnica anterior; A Fig. 12 é um diagrama de bloco de uma implementação da técnica anterior de um bloco de síntese BCC da Fig. 11; e A Fig. 13 é uma representação de um esquema bem conhecido para determinar parâmetros ICLD, ICTD e ICC.
Antes de uma descrição detalhada de configurações preferidas ser provida, o problema subjacente à invenção e a solução dos problemas são descritos em termos gerais. A técnica inventiva para melhorar a largura da imagem espacial auditiva para canais de saída reconstruídos é aplicável a todos os casos quando um canal de entrada é misturado em mais que um dos canais transmitidos em um sistema paramétrico de multicanais C-para-E. A configuração preferida é a implementação da invenção em um sistema de codificação de sinal de som biauricular (BCC) . Para simplicidade da discussão, mas sem perda de generalidade, a técnica inventiva é descrita com relação ao caso específico de um esquema BCC para codificação/decodificação de sinais surround 5.1 de uma maneira compatível regressiva. 0 problema mencionado anteriormente de redução de largura de imagem auditiva ocorre principalmente para sinais de áudio que contêm transientes de repetição rápida independentes de direções diferentes, tais como um sinal de aplauso de uma platéia em qualquer tipo de gravação ao vivo. Embora a redução da largura da imagem possa, em princípio, ser tratada pelo uso de uma resolução de tempo maior para síntese ICLD, isto resultaria em uma taxa de informação de lado aumentada e também requerería uma alteração no tamanho da janela do banco de filtro de análise/síntese usado. Deve ser aqui observado que esta possibilidade resulta, além disso, em efeitos negativos nos componentes totais, visto que um aumento na resolução de tempo automaticamente significa uma diminuição na resolução de freqüência.
Ao invés disso, a invenção é um conceito simples que não possui estas desvantagens e objetiva reduzir a influência do componente de sinal do canal central nos canais laterais.
Como foi discutido em conexão com as Figuras 7a -7d, os canais de base para os cinco canais de saída reconstruídos de 5-para-2 são: Deve ser observado que o componente de sinal do canal central original x3 aparece amplificado em 3 dB na sub-banda de canal de base central (fator 1/^2) e atenuado em 3 dB nas sub- bandas de canal de base (canal lateral) remanescentes.
De modo a atenuar ainda mais a influência do componente de sinal de canal central nas sub-bandas de canal de base lateral de acordo com esta invenção, a idéia geral a seguir é aplicada conforme ilustrado na Figura 2.
Uma estimativa do sinal de canal central decodificado final é computada preferivelmente por escalonamento deste para o nível alvo desejado conforme descrito pela informação de nível correspondente, tal como um valor ICLD nos ambientes BCC.
Preferivelmente, este sinal central decodificado é calculado no domínio espectral de modo a economizar computação, isto é, nenhum processamento de banco de filtro de síntese é aplicado.
Além disso, este sinal central decodificado ou sinal central reconstruído, que corresponde ao canal de cancelamento, pode ser pesado e, então, combinado a ambos os sinais de canal de base dos outros canais de saída. Esta combinação é preferivelmente uma subtração. No entanto, quando os fatores de pesagem têm um sinal diferente, então uma adição também resulta na redução da influência do canal central no canal de base usado para reconstruir o canal de saída esquerdo ou direito. Este processamento resulta na formação de um canal de base modificado para reconstrução de canal esquerdo ou surround esquerdo ou para reconstrução de canal direito ou surround direito.
Preferivelmente, é preferido um fator de pesagem de -3 dB, mas também qualquer outro valor é possível.
Ao invés dos sinais de canal de base de transmissão original conforme usado na Figura 7b, os sinais de canal de base modificados são usados para a computação do canal de saída decodificado dos outros canais de saída, isto é, os canais diferentes do canal central. A seguir, um diagrama de bloco do conceito da invenção será discutido com referência à Figura 2. A Figura 2 mostra um equipamento para gerar um sinal de saída multicanais tendo canais de saída K, o sinal de saída multicanais correspondendo a um sinal de entrada de multicanais que tem canais de entrada C, usando canais de transmissão E, os canais de transmissão E representando um resultado de uma operação de downmix que tem os canais de entrada C como uma entrada, e usando informação paramétrica de lado nos canais de entrada, onde C é S 2, Cé>E, eKé>le^C. Além disso, a operação de downmix é efetiva para introduzir um primeiro canal de entrada em um primeiro canal de transmissão e em um segundo canal de transmissão. 0 dispositivo da invenção inclui o calculador de canal de cancelamento 20 para calcular pelo menos um canal de cancelamento 21, que é inserido em um combinador 22, que recebe, em uma segunda entrada 23, o primeiro canal de transmissão diretamente ou uma versão processada do primeiro canal de transmissão. 0 processamento do primeiro canal de transmissão para obter a versão processada do primeiro canal de transmissão é executado através de um processador 24, que pode estar presente em algumas configurações, mas é, no geral, opcional. O combinador é operado para obter um segundo canal de base 25 para ser inserido em um reconstrutor de canal 26. O canal reconstrutor usa um segundo canal de base 25 e informação paramétrica de lado no canal de entrada esquerdo original, que são inseridos no reconstrutor de canal 26 em uma outra entrada 27, para gerar o segundo canal de saída. Na saída do reconstrutor de canal, é obtido um segundo canal de saída 28, que pode ser o canal de saída esquerdo reconstruído, que é, comparado ao cenário na Figura 7b, gerado por um canal de base, que tem uma influência pequena ou mesmo uma influência totalmente eliminada do canal central de entrada original, se comparado com a situação na Figura 7b.
Embora o canal de saída esquerdo gerado conforme mostrado na Figura 7b inclua certa influência, como foi descrito acima, esta certa influência é reduzida no segundo canal de base conforme gerado na Figura 2, devido à combinação do canal de cancelamento e do primeiro canal de transmissão ou do primeiro canal de transmissão processado.
Como é mostrado na Figura 2, o calculador de canal de cancelamento 20 calcula o canal de cancelamento usando informação sobre o canal central original disponível como um decodificador, isto é, informação para gerar o sinal de saída multicanais. Esta informação inclui informação paramétrica de lado no primeiro canal de entrada 30, ou inclui o primeiro canal de transmissão 31, que também inclui alguma informação sobre o canal central, devido à operação de downmix, ou inclui o segundo canal de transmissão 32, que também inclui informação sobre o canal central devido à operação de downmix. Preferivelmente, toda esta informação é usada para reconstrução ideal do canal central para obter o canal de cancelamento 21.
Esta configuração ideal será subsequentemente descrita com relação à Figura 3 e Figura 4. Em contraste à Figura 2, a Figura 3 mostra o dispositivo de 2 funções da Figura 2, isto é, um dispositivo para cancelar a influência do canal central no canal de base esquerdo sl assim como no canal de base direito s2. O calculador de canal de cancelamento 20 da Figura 2 inclui um dispositivo de reconstrução de canal central 20a e um dispositivo de pesagem 20b para obter o canal de cancelamento 21 na saída do dispositivo de pesagem. O combinador 22 na Figura 2 é um dispositivo de subtração simples que é operacional para subtrair o canal de cancelamento 21 do primeiro canal de transmissão 21 para obter - em termos da Figura 2 - o segundo canal de base 25 para reconstruir o segundo canal de saída (tal como o canal de saída esquerdo) e, opcionalmente, também o canal de saída surround esquerdo. 0 canal central reconstruído x3 (k) pode ser obtido na saída do dispositivo de reconstrução de canal central 20a. A Figura 4 indica uma configuração preferida implementada como um diagrama de circuito, que usa a técnica que foi discutida com relação à Figura 3. Além disso, a Figura 4 mostra o processamento seletivo à freqüência que é opcionalmente adequado para ser integrado em um dispositivo direto de reconstrução BCC seletivo à freqüência. A reconstrução do canal central 26 ocorre através da soma de dois canais de transmissão em um somador 40. Então, a informação paramétrica de lado para as diferenças de nível de canal, ou o fator a3 derivado da diferença de nível entre canais conforme discutido na Figura 7d, é usado para gerar uma versão modificada do primeiro canal de base (em termos da Figura 2) que é inserido no reconstrutor de canal 26 na primeira entrada do canal de base 29 na Figura 2. 0 canal central reconstruído na saída do multiplicador 41 pode ser usado para reconstrução de saída de canal central (após a normalização geral que é descrita na Figura 7d) .
Para reconhecer a influência do canal central no canal de base para a reconstrução à esquerda e à direita, um fator de pesagem de 1/^2 é aplicado, o qual é ilustrado através de um multiplicador 42 na Figura 4. Então, o canal central reconstruído e pesado novamente é alimentado aos somadores 43a e 43b, que correspondem ao combinador 22 na Figura 2.
Dessa maneira, o segundo canal de base s3 ou s4 (ou s2 e s5) é diferente do canal de transmissão y3 pela influência do canal central ser reduzida se comparada ao caso na Figura 7b.
As sub-bandas de canal de base resultantes são providas em termos matemáticos como segue: Dessa maneira, o dispositivo da Figura 4 provê uma subtração de uma estimativa de sub-banda de canal central a partir dos canais de base para os canais laterais, de modo a melhorar a independência entre os canais e, portanto, prover uma largura espacial melhor do sinal de multicanais de saída reconstruído.
De acordo com uma outra configuração da presente invenção, que será subsequentemente descrita com relação à Figura 5a e Figura 5b, um canal de cancelamento diferente do canal de cancelamento calculado na Figura 3 é determinado. Em contraste com a configuração da Figura 3/figura 4, o canal de cancelamento 21 para cálculo do segundo canal de base sl(k) não é derivado do primeiro canal de transmissão, assim como do segundo canal de transmissão, mas é derivado do segundo canal de transmissão y2(k) sozinho usando certo fator de pesagem x_lr, que é ilustrado pelo dispositivo de multiplicação 51 da Figura 5a. Dessa maneira, o canal de cancelamento 21 na Figura 5a é diferente do canal de cancelamento na Figura 3, mas também contribui para uma redução da influência do canal central no canal de base sl (k) usado para reconstruir o segundo canal de saída, isto é, o canal de saída esquerdo xl (k).
Na configuração da Figura 5a, é mostrada também uma configuração preferida do processador 24. Em especial, o processador 24 é implementado como um outro dispositivo de multiplicação 52 que aplica uma multiplicação por um fator de multiplicação (l-x_lr). Preferivelmente, como é mostrado na Figura la, o fator de multiplicação aplicado pelo processador 24 ao primeiro canal de transmissão depende do fator de multiplicação 51, que é usado para multiplicar o segundo canal de transmissão para obter o canal de cancelamento 21. Finalmente, a versão processada do primeiro canal de transmissão em uma entrada 23 para o combinador 22 é usada para combinação, que consiste na subtração do canal de cancelamento 21 da versão processada do primeiro canal de transmissão. Tudo isto resulta, novamente, no segundo canal de base 25, que tem uma influência reduzida ou completamente cancelada do canal de entrada central original.
Como é mostrado na Figura 5a, o mesmo procedimento é repetido para obter o terceiro canal de base s2 (k) em uma entrada no dispositivo de reconstrução direito/surround direito. Entretanto, como é mostrado na Figura 5a, o terceiro canal de base s2(k) é obtido pela combinação da versão processada do segundo canal de transmissão y(k) e um outro canal de cancelamento 53, que é derivado do primeiro canal de transmissão yl(k) através da multiplicação em um dispositivo de multiplicação 54, que tem um fator de multiplicação x_rl, que pode ser idêntico a x_lr para o dispositivo 51, mas que também pode ser diferente deste valor. 0 processador para processar o segundo canal de transmissão conforme indicado na Figura 5a é um dispositivo de multiplicação 55. 0 combinador para combinar o segundo canal de cancelamento 53 e a versão processada do segundo canal de transmissão y2(k) é ilustrado pelo número de referência 56 na Figura 5a. O calculador de canal de cancelamento da Figura 2 inclui ainda um dispositivo para computar os coeficientes de cancelamento, que é indicado pelo número de referência 57 na Figura 5a. 0 dispositivo 57 é operacional para obter informação paramétrica de lado no canal central original ou de entrada como diferença de nível entre canais, etc. 0 mesmo é verdadeiro para o dispositivo 20a na Figura 3, onde o dispositivo de reconstrução de canal central 20a também inclui uma entrada para receber informação paramétrica de lado tal como valores de nível ou diferenças de nível entre canais, etc. A Equação a seguir mostra a descrição matemática da configuração da Figura 5a e ilustra, em seu no lado direito, o processamento de cancelamento no calculador de canal de cancelamento por um lado e os processadores (21, 24 na Figura 2) pelo outro lado. Nesta configuração específica, que é ilustrada aqui, os fatores x_lr e x_rl são idênticos entre si. A configuração acima deixa claro que a invenção inclui uma composição dos canais de base de reconstrução como uma combinação linear adaptativa de sinal dos canais transmitidos esquerdo e direito. Esta topologia é ilustrada na Figura 5a.
Quando observado de um ângulo diferente, o dispositivo da invenção pode também ser compreendido como um procedimento de upmix dinâmico, no qual uma matriz de upmix diferente para cada sub-banda e cada caso de tempo k é usada. Esta matriz de upmix dinâmico é ilustrada na Figura 5b. Deve ser observado que para cada sub-banda, isto é, para cada saída do dispositivo de banco de filtro na Figura 4, existe uma matriz de upmix U. Com relação à maneira dependente de tempo, deve ser observado que a Figura 5b inclui o índice de tempo k. Quando se tem informação de nível para cada índice de tempo, a matriz de upmix alteraria de cada momento no tempo para o próximo momento no tempo. Quando, entretanto, a mesma informação de nível a3 é usada para um bloco completo de valores transformados em uma representação de freqüência pelo banco de filtro de entrada FB, então um valor a3 estará presente para um bloco completo de, por exemplo, 1024 ou 2048 valores de amostragem. Neste caso, a matriz de upmix mudaria a direção de tempo de bloco para bloco ao invés de valor para valor. No entanto, existem técnicas para suavizar os valores paramétricos de nível, de modo que se possa obter fatores de modificação de amplitude a3 diferentes durante o upmix em uma certa banda de freqüência.
De forma geral, fatores diferentes poderíam também ser usados para computação das sub-bandas de canal central de saída e dos fatores para "upmix dinâmico", resultando em uma fator a3, que é uma versão escalonada de a3 conforme computado acima.
Em uma configuração preferida, a resistência de pesagem do cancelamento do componente central é adaptativamente controlada por meio de uma transmissão explícita de informação de lado do codificador para o decodificador. Neste caso, o calculador de canal de cancelamento 20 mostrado na Figura 2 incluirá uma entrada de controle adicional, que recebe um sinal de controle explícito que poderia ser calculado para indicar uma interdependência direta entre o canal esquerdo e central ou canal direito e central. Com relação a isto, este sinal de controle seria diferente das diferenças de nível para o canal central e canal esquerdo devido as estas diferenças de nível estarem relacionadas com um tipo de canal de referência virtual, que poderia ser a soma da energia no primeiro canal de transmissão e a soma da energia no segundo canal de transmissão, conforme é ilustrado no topo da Figura 7d.
Este parâmetro de controle poderia, por exemplo, indicar que o canal central está abaixo de um limite e está se aproximando de zero, enquanto existe um sinal no canal esquerdo ou direito, que está acima do limite. Neste caso, uma reação adequada do calculador de canal de cancelamento para um sinal de controle correspondente seria desligar o cancelamento de canal e aplicar um esquema de upmix normal conforme mostrado na Figura 7b para evitar "excesso de cancelamento" do canal central, que não está presente na entrada. Isto seria um tipo extremo de controle de resistência de pesagem conforme descrito acima.
Preferivelmente, como fica claro na Figura 4, nenhuma operação de processamento de atraso de tempo é executada para calcular a reconstrução do canal central. Isto é vantajoso, pois a retroalimentação funciona sem ter que considerar quaisquer atrasos de tempo. No entanto, isto pode ser obtido sem perda de qualidade, quando o canal central original é usado como o canal de referência para calcular as diferenças de tempo dx.O mesmo é verdadeiro para qualquer medida de correlação. É preferido não executar qualquer processamento de correlação para reconstrução do canal central. Dependendo do tipo de cálculo de correlação, isto pode ser feito sem perda de qualidade, quando o canal central original é usado como uma referência para quaisquer parâmetros de correlação.
Deve ser observado que a invenção não depende de um esquema de downmix determinado. Isto significa que pode ser usado um esquema de downmix automática ou de downmix manual executado por um engenheiro de som. É possível, ainda, usar informação paramétrica gerada automaticamente com canais de downmix gerados manualmente.
Dependendo do ambiente de aplicação, os métodos da invenção para construção ou geração podem ser implementados em hardware ou em software. A implementação pode ser um meio de armazenagem digital tal como um disco ou um CD que tenha sinais de controle eletronicamente legíveis, que podem cooperar com um sistema de computador programável, de modo que os métodos da invenção são executados. Dito de forma geral, a invenção, portanto, também se refere a um produto de programa de computador que tem um código de programa armazenado em um transportador que pode ser lido por máquina, o código de programa sendo adaptado para executar os métodos da invenção, quando o produto de programa de computador opera em um computador. Em outras palavras, a invenção, portanto, também se refere a um programa de computador que tem um código de programa para executar os métodos, quando o programa de computador opera em um computador. A presente invenção pode ser usada em conjunto ou incorporada em uma variedade de diferentes aplicações ou sistemas, incluindo sistemas para distribuição, transmissão, streaming (distribuição de informação de multimídia) e/ou recepção de televisão ou música eletrônica. Estes incluem sistemas para decodificação/codificação de transmissões através, por exemplo, de meio terrestre, satélite, cabo, internet, intranets, ou mídia física (por exemplo, discos compactos, discos versáteis digitais, chips semicondutores, discos rígidos, cartões de memória e similares). A presente invenção pode também ser empregada em jogos e sistemas de jogos incluindo, por exemplo, produtos de software interativo destinados para interagir com um usuário para entretenimento (ação, atuação, estratégia, aventura, simulações, corrida, esportes, arcade, jogos de cartão e tabuleiro) e/ou educação que podem ser publicados para diversas máquinas, plataformas ou mídias. Além disso, a presente invenção pode ser incorporada em reprodutores de áudio ou sistemas CD-ROM/DVD. A presente invenção pode também ser incorporada em aplicações de software para PC que incorporam decodificação digital (por exemplo, reprodutor, decodificador) e aplicações de software que incorporam capacidade de codificação digital (por exemplo, codificador, ripper (extrator), recodificador, e jukebox).
R E I V I N D I C A Ç Õ E S
Claims (20)
1. Equipamento para gerar um sinal de saída multicanais tendo canais de saída K, o sinal de saída multicanais correspondendo a um sinal de entrada de multicanais tendo canais de entrada C, usando canais de transmissão E, os canais de transmissão E representando um resultado de uma operação de downmix tendo canais de entrada C como uma entrada, e usando informação paramétrica relacionada aos canais de entrada, onde E é > 2, C é > E, e K é > 1 e < C, e onde a operação de downmix é efetiva para introduzir um primeiro canal de entrada em um primeiro canal de transmissão e em um segundo canal de transmissão, e para, além disso, introduzir um segundo canal de entrada no primeiro canal de transmissão caracterizado por compreender: um calculador de canal de cancelamento (20) para calcular um canal de cancelamento (21) usando informação relacionada ao primeiro canal de entrada incluída no primeiro canal de transmissão, no segundo canal de transmissão ou na informação paramétrica; um combinador (23) para combinar o canal de cancelamento (21) e o primeiro canal de transmissão (23) ou uma versão processada deste para obter um segundo canal de base (25) , no qual uma influência do primeiro canal de entrada é reduzida se comparada à influência do primeiro canal de entrada no primeiro canal de transmissão; e um reconstrutor de canal (26) para reconstruir um segundo canal de saída correspondendo ao segundo canal de entrada usando o segundo canal de base e informação paramétrica relacionada ao segundo canal de entrada, e para reconstruir um primeiro canal de saída correspondendo ao primeiro canal de entrada usando um primeiro canal de base que é diferente do segundo canal de base pelo fato da influência do primeiro canal ser maior se comparada com o segundo canal de base, e informação paramétrica relacionada com o primeiro canal de entrada.
2. Equipamento, de acordo com a reivindicação 1, caracterizado pelo fato de que o combinador (22) é operacional para subtrair o canal de cancelamento do primeiro canal de transmissão ou a versão processada do mesmo.
3. Equipamento, de acordo com a reivindicação 1 ou reivindicação 2, caracterizado pelo fato de que o calculador de canal de cancelamento (20) é operacional para calcular uma estimativa para o primeiro canal de entrada usando o primeiro canal de transmissão e o segundo canal de transmissão para obter o canal de cancelamento (21).
4. Equipamento, de acordo com qualquer uma das reivindicações de 1 a 3, caracterizado pelo fato de que a informação paramétrica inclui um parâmetro de diferença entre o primeiro canal de entrada e um canal de referência, e no qual o calculador de canal de cancelamento (20) é operacional para calcular uma soma do primeiro canal de transmissão e o segundo canal de transmissão e para pesar a soma usando o parâmetro de diferença.
5. Equipamento, de acordo com qualquer uma das reivindicações de 1 a 4, caracterizado pelo fato de que a operação de downmix é tal que o primeiro canal de entrada é introduzido no primeiro canal de transmissão após ter sido escalonado por um fator de downmix, e no qual o calculador de canal de cancelamento (20) é operacional para escalonar a soma do primeiro e do segundo canal de transmissão usando um fator de escalonamento, que depende do fator de downmix.
6. Equipamento, de acordo com a reivindicação 5, caracterizado pelo fato de que o fator de pesagem é igual ao fator de downmix.
7. Equipamento, de acordo com qualquer uma das reivindicações de 1 a 6, caracterizado pelo fato de que o calculador de canal de cancelamento (2) é operacional para determinar uma soma do primeiro e do segundo canal de transmissão para obter o primeiro canal de base.
8. Equipamento, de acordo com qualquer uma das reivindicações de 1 a 7, caracterizado por compreender ainda um processador (24) que é operacional para processar o primeiro canal de transmissão através de pesagem, usando um primeiro fator de pesagem, e no qual o calculador de canal de cancelamento (20) é operacional para pesar o segundo canal de transmissão usando um segundo fator de pesagem.
9. Equipamento, de acordo com a reivindicação 8, caracterizado pelo fato de que a informação paramétrica inclui o parâmetro de diferença entre o primeiro canal de entrada e um canal de referência, e no qual o calculador de canal de cancelamento (20) é operacional para determinar o segundo fator de pesagem com base no parâmetro de diferença.
10. Equipamento, de acordo com a reivindicação 8 ou 9, caracterizado pelo fato de que o primeiro fator de pesagem é igual a (1-h), onde h é um valor real, e no qual o segundo fator de pesagem é igual a h.
11. Equipamento, de acordo com a reivindicação 10, caracterizado pelo fato de que a informação paramétrica inclui um valor de diferença de nível, e onde h é derivado do valor paramétrico da diferença de nível.
12. Equipamento, de acordo com a reivindicação 11, caracterizado pelo fato de que h é igual a um valor derivado da diferença de nível dividido por um fator que depende da operação de downmix.
13. Equipamento, de acordo com a reivindicação 10, caracterizado pelo fato de que a informação paramétrica inclui a diferença de nível entre o primeiro canal e o canal de referência, e no qual h é igual a 1^2 x 10L/20, onde L é a diferença de nível.
14. Equipamento, de acordo com qualquer uma das reivindicações de 1 a 13, caracterizado pelo fato de que a informação paramétrica inclui ainda um sinal de controle dependente da relação entre o primeiro canal de entrada e o segundo canal de entrada, e no qual o calculador de canal de cancelamento (20) é controlado pelo sinal de controle para aumentar ou diminuir ativamente uma energia do canal de cancelamento ou mesmo desativar totalmente o cálculo de canal de cancelamento.
15. Equipamento, de acordo com qualquer uma das reivindicações de 1 a 14, caracterizado pelo fato de que a operação de downmix é, além disso, operacional para introduzir um terceiro canal de entrada no segundo canal de transmissão, o equipamento compreendendo ainda um combinador adicional para combinar o canal de cancelamento e o segundo canal de transmissão ou uma versão processada deste para obter um terceiro canal de base, no qual uma influência do primeiro canal de entrada é reduzida se comparada com a influência do primeiro canal de entrada no segundo canal de transmissão; e um reconstrutor de canal para reconstruir o terceiro canal de saída correspondendo ao terceiro canal de entrada usando o terceiro canal de base e informação paramétrica relacionada ao terceiro canal de entrada.
16. Equipamento, de acordo com qualquer uma das reivindicações de 1 a 15, caracterizado pelo fato de que a informação paramétrica inclui diferenças de nível entre canais, diferenças de tempo entre canais, diferenças de fase entre canais ou valores de correlação entre canais, e no qual o reconstrutor de canal (26) é operacional para aplicar qualquer um dos parâmetros do grupo acima em um canal de base para obter um canal de saída bruto.
17. Equipamento, de acordo com a reivindicação 16, caracterizado pelo fato de que o reconstrutor de canal (26) é operacional para escalonar o canal de saída bruto de modo que a energia total no canal de saída reconstruído final seja igual à energia total dos canais de transmissão E.
18. Equipamento, de acordo com qualquer uma das reivindicações de 1 a 17, caracterizado pelo fato de que a informação paramétrica é provida em relação a banda, e na qual o calculador de canal de cancelamento (20), o combinador (22) e o reconstrutor de canal (26) são operacionais para processar a pluralidade de bandas usando informação paramétrica provida relativa a bandas, e no qual o equipamento compreende ainda uma unidade de conversão de tempo/freqüência (IFB) para converter os canais de transmissão em uma representação de freqüência que tem bandas de freqüência, e uma unidade de conversão de freqüência/tempo para converter bandas de freqüência reconstruídas no domínio de tempo.
19. Equipamento, de acordo com qualquer uma das reivindicações de 1 a 18, caracterizado por compreender ainda: um sistema selecionado do grupo consistindo de um reprodutor de vídeo digital, um reprodutor de áudio digital, um computador, um receptor via satélite, um receptor via cabo, um receptor de transmissão terrestre, e um sistema de entretenimento doméstico; e onde o sistema compreende o calculador de canal, o combinador, e o reconstrutor do canal.
20. Método para gerar um sinal de saída multicanais tendo canais de saída K, o sinal de saída multicanais correspondendo a um sinal de entrada de multicanais tendo canais de entrada C, usando canais de transmissão E, os canais de transmissão E representando um resultado de uma operação de downmix tendo canais de entrada C como uma entrada, e usando informação paramétrica relacionada com os canais de entrada, onde E é > 2, C é > E, e K é > 1 e < C, e onde a operação de downmix é efetiva para introduzir um primeiro canal de entrada em um primeiro canal de transmissão e em um segundo canal de transmissão, e para introduzir, além disso, um segundo canal de entrada no primeiro canal de transmissão, caracterizado por compreender: calcular (20) um canal de cancelamento usando informação relacionada ao primeiro canal de entrada incluída no primeiro canal de transmissão, no segundo canal de transmissão ou na informação paramétrica; combinar (22) o canal de cancelamento e o primeiro canal de transmissão ou uma versão processada deste para obter um segundo canal de base, no qual uma influência do primeiro canal de entrada é reduzida se comparada com a influência do primeiro canal de entrada no primeiro canal de transmissão; e reconstruir (26) um segundo canal de saída correspondendo ao segundo canal de entrada usando o segundo canal de base e informação paramétrica relacionada ao segundo canal de entrada, e um primeiro canal de saída correspondendo ao primeiro canal de entrada usando um primeiro canal de base que é diferente do segundo canal de base pelo fato da influência do primeiro canal ser maior se comparada ao segundo canal de base, e informação paramétrica relacionada ao primeiro canal de entrada.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US58657804P | 2004-07-09 | 2004-07-09 | |
US10/935,061 US7391870B2 (en) | 2004-07-09 | 2004-09-07 | Apparatus and method for generating a multi-channel output signal |
PCT/EP2005/005199 WO2006005390A1 (en) | 2004-07-09 | 2005-05-12 | Apparatus and method for generating a multi-channel output signal |
Publications (2)
Publication Number | Publication Date |
---|---|
BRPI0512763A BRPI0512763A (pt) | 2008-04-08 |
BRPI0512763B1 true BRPI0512763B1 (pt) | 2018-08-28 |
Family
ID=34966842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0512763A BRPI0512763B1 (pt) | 2004-07-09 | 2005-05-12 | equipamento e método para gerar um sinal de saída multicanais |
Country Status (16)
Country | Link |
---|---|
US (1) | US7391870B2 (pt) |
EP (1) | EP1774515B1 (pt) |
JP (1) | JP4772043B2 (pt) |
KR (1) | KR100908080B1 (pt) |
CN (1) | CN1985303B (pt) |
AT (1) | ATE556406T1 (pt) |
AU (1) | AU2005262025B2 (pt) |
BR (1) | BRPI0512763B1 (pt) |
CA (1) | CA2572989C (pt) |
ES (1) | ES2387248T3 (pt) |
HK (1) | HK1099901A1 (pt) |
NO (1) | NO338725B1 (pt) |
PT (1) | PT1774515E (pt) |
RU (1) | RU2361185C2 (pt) |
TW (1) | TWI305639B (pt) |
WO (1) | WO2006005390A1 (pt) |
Families Citing this family (80)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
SE0301273D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
US8027478B2 (en) * | 2004-04-16 | 2011-09-27 | Dublin Institute Of Technology | Method and system for sound source separation |
PL2175671T3 (pl) * | 2004-07-14 | 2012-10-31 | Koninl Philips Electronics Nv | Sposób, urządzenie, urządzenie kodujące, urządzenie dekodujące i system audio |
TWI497485B (zh) * | 2004-08-25 | 2015-08-21 | Dolby Lab Licensing Corp | 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法 |
BRPI0517949B1 (pt) * | 2004-11-04 | 2019-09-03 | Koninklijke Philips Nv | dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador |
KR101183859B1 (ko) * | 2004-11-04 | 2012-09-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다중채널 오디오 신호들의 인코딩 및 디코딩 |
EP1817767B1 (en) * | 2004-11-30 | 2015-11-11 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
CN101147191B (zh) * | 2005-03-25 | 2011-07-13 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
DE602006002501D1 (de) * | 2005-03-30 | 2008-10-09 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
KR101271069B1 (ko) * | 2005-03-30 | 2013-06-04 | 돌비 인터네셔널 에이비 | 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법 |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
WO2006126844A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
EP1905004A2 (en) * | 2005-05-26 | 2008-04-02 | LG Electronics Inc. | Method of encoding and decoding an audio signal |
JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
JP4896449B2 (ja) * | 2005-06-29 | 2012-03-14 | 株式会社東芝 | 音響信号処理方法、装置及びプログラム |
WO2007004831A1 (en) * | 2005-06-30 | 2007-01-11 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
US8626503B2 (en) * | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
US8019614B2 (en) * | 2005-09-02 | 2011-09-13 | Panasonic Corporation | Energy shaping apparatus and energy shaping method |
WO2007037613A1 (en) * | 2005-09-27 | 2007-04-05 | Lg Electronics Inc. | Method and apparatus for encoding/decoding multi-channel audio signal |
CN101278598B (zh) * | 2005-10-07 | 2011-05-25 | 松下电器产业株式会社 | 音频信号处理装置以及音频信号处理方法 |
KR101218776B1 (ko) | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
TWI329462B (en) * | 2006-01-19 | 2010-08-21 | Lg Electronics Inc | Method and apparatus for processing a media signal |
JP5054035B2 (ja) * | 2006-02-07 | 2012-10-24 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
JP4997781B2 (ja) * | 2006-02-14 | 2012-08-08 | 沖電気工業株式会社 | ミックスダウン方法およびミックスダウン装置 |
ES2339888T3 (es) | 2006-02-21 | 2010-05-26 | Koninklijke Philips Electronics N.V. | Codificacion y decodificacion de audio. |
FR2899424A1 (fr) * | 2006-03-28 | 2007-10-05 | France Telecom | Procede de synthese binaurale prenant en compte un effet de salle |
FR2899423A1 (fr) | 2006-03-28 | 2007-10-05 | France Telecom | Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme. |
EP1853092B1 (en) * | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
US8027479B2 (en) | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
US20080004883A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Scalable audio coding |
CN101652810B (zh) * | 2006-09-29 | 2012-04-11 | Lg电子株式会社 | 用于处理混合信号的装置及其方法 |
EP2084901B1 (en) * | 2006-10-12 | 2015-12-09 | LG Electronics Inc. | Apparatus for processing a mix signal and method thereof |
DE602007013415D1 (de) * | 2006-10-16 | 2011-05-05 | Dolby Sweden Ab | Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung |
WO2008046530A2 (en) * | 2006-10-16 | 2008-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
JP5450085B2 (ja) | 2006-12-07 | 2014-03-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ処理方法及び装置 |
CA2645915C (en) | 2007-02-14 | 2012-10-23 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
KR101100213B1 (ko) | 2007-03-16 | 2011-12-28 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8064624B2 (en) * | 2007-07-19 | 2011-11-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for generating a stereo signal with enhanced perceptual quality |
US8032085B2 (en) * | 2007-09-10 | 2011-10-04 | Technion Research & Development Foundation Ltd. | Spectrum-blind sampling and reconstruction of multi-band signals |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
US8930197B2 (en) * | 2008-05-09 | 2015-01-06 | Nokia Corporation | Apparatus and method for encoding and reproduction of speech and audio signals |
BRPI0908630B1 (pt) * | 2008-05-23 | 2020-09-15 | Koninklijke Philips N.V. | Aparelho de 'upmix' estéreo paramétrico, decodificador estéreo paramétrico, método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de 'downmix' mono com base em parâmetros espaciais, dispositivo de execução de áudio, aparelho de 'downmix' estéreo paramétrico, codificador estéreo paramétrico, método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base nos parâmetros espaciais, e, produto de programa de computador |
US8060042B2 (en) * | 2008-05-23 | 2011-11-15 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
BRPI0905069A2 (pt) * | 2008-07-29 | 2015-06-30 | Panasonic Corp | Aparelho de codificação de áudio, aparelho de decodificação de áudio, aparelho de codificação e de descodificação de áudio e sistema de teleconferência |
JP5635502B2 (ja) * | 2008-10-01 | 2014-12-03 | ジーブイビービー ホールディングス エス.エイ.アール.エル. | 復号装置、復号方法、符号化装置、符号化方法、及び編集装置 |
DE102008056704B4 (de) * | 2008-11-11 | 2010-11-04 | Institut für Rundfunktechnik GmbH | Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates |
WO2010095083A1 (en) | 2009-02-18 | 2010-08-26 | Technion Research & Development Foundation Ltd | Efficient sampling and reconstruction of sparse multi-band signals |
CN101556799B (zh) * | 2009-05-14 | 2013-08-28 | 华为技术有限公司 | 一种音频解码方法和音频解码器 |
JP2011002574A (ja) * | 2009-06-17 | 2011-01-06 | Nippon Hoso Kyokai <Nhk> | 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム |
JP5345024B2 (ja) * | 2009-08-28 | 2013-11-20 | 日本放送協会 | 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム |
TWI433137B (zh) | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
US8774417B1 (en) * | 2009-10-05 | 2014-07-08 | Xfrm Incorporated | Surround audio compatibility assessment |
EP2367293B1 (en) * | 2010-03-14 | 2014-12-24 | Technion Research & Development Foundation | Low-rate sampling of pulse streams |
DE102010015630B3 (de) * | 2010-04-20 | 2011-06-01 | Institut für Rundfunktechnik GmbH | Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates |
WO2011135472A2 (en) | 2010-04-27 | 2011-11-03 | Technion Research & Development Foundation Ltd. | Multi-channel sampling of pulse streams at the rate of innovation |
WO2012009851A1 (en) * | 2010-07-20 | 2012-01-26 | Huawei Technologies Co., Ltd. | Audio signal synthesizer |
BR122021003884B1 (pt) | 2010-08-12 | 2021-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Reamostrar sinais de saída de codecs de áudio com base em qmf |
BR112013004362B1 (pt) * | 2010-08-25 | 2020-12-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida |
WO2012049591A1 (en) | 2010-10-13 | 2012-04-19 | Technion Research & Development Foundation Ltd. | Sub-nyquist sampling of short pulses |
TWI462087B (zh) * | 2010-11-12 | 2014-11-21 | Dolby Lab Licensing Corp | 複數音頻信號之降混方法、編解碼方法及混合系統 |
US20120155650A1 (en) * | 2010-12-15 | 2012-06-21 | Harman International Industries, Incorporated | Speaker array for virtual surround rendering |
UA107771C2 (en) * | 2011-09-29 | 2015-02-10 | Dolby Int Ab | Prediction-based fm stereo radio noise reduction |
ITTO20120067A1 (it) * | 2012-01-26 | 2013-07-27 | Inst Rundfunktechnik Gmbh | Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal. |
US9131313B1 (en) * | 2012-02-07 | 2015-09-08 | Star Co. | System and method for audio reproduction |
JP6248186B2 (ja) * | 2013-05-24 | 2017-12-13 | ドルビー・インターナショナル・アーベー | オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ |
US9338573B2 (en) | 2013-07-30 | 2016-05-10 | Dts, Inc. | Matrix decoder with constant-power pairwise panning |
WO2015036350A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby International Ab | Audio decoding system and audio encoding system |
EP3444815B1 (en) | 2013-11-27 | 2020-01-08 | DTS, Inc. | Multiplet-based matrix mixing for high-channel count multichannel audio |
EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
CN106997768B (zh) * | 2016-01-25 | 2019-12-10 | 电信科学技术研究院 | 一种语音出现概率的计算方法、装置及电子设备 |
EP3246923A1 (en) | 2016-05-20 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a multichannel audio signal |
RU2628198C1 (ru) * | 2016-05-23 | 2017-08-15 | Самсунг Электроникс Ко., Лтд. | Способ межканального предсказания и межканальной реконструкции для многоканального видео, снятого устройствами с различными углами зрения |
CA3045847C (en) * | 2016-11-08 | 2021-06-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder |
JP6866679B2 (ja) | 2017-02-20 | 2021-04-28 | 株式会社Jvcケンウッド | 頭外定位処理装置、頭外定位処理方法、及び頭外定位処理プログラム |
US12100403B2 (en) * | 2020-03-09 | 2024-09-24 | Nippon Telegraph And Telephone Corporation | Sound signal downmixing method, sound signal coding method, sound signal downmixing apparatus, sound signal coding apparatus, program and recording medium |
JP7385531B2 (ja) * | 2020-06-17 | 2023-11-22 | Toa株式会社 | 音響通信システム、音響送信装置、音響受信装置、プログラムおよび音響信号送信方法 |
CN117476026A (zh) * | 2023-12-26 | 2024-01-30 | 芯瞳半导体技术(山东)有限公司 | 一种多路音频数据混音的方法、系统、装置及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG49883A1 (en) | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
JP3577798B2 (ja) * | 1995-08-31 | 2004-10-13 | ソニー株式会社 | ヘッドホン装置 |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6249578B1 (en) | 1998-04-06 | 2001-06-19 | Ameritech Corporation | Interactive electronic ordering for telecommunications products and services |
JP3657120B2 (ja) | 1998-07-30 | 2005-06-08 | 株式会社アーニス・サウンド・テクノロジーズ | 左,右両耳用のオーディオ信号を音像定位させるための処理方法 |
US7006636B2 (en) | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US20030035553A1 (en) | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
TW589815B (en) * | 2002-01-16 | 2004-06-01 | Winbond Electronics Corp | Control method for multi-channel data transmission |
KR101049751B1 (ko) * | 2003-02-11 | 2011-07-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
-
2004
- 2004-09-07 US US10/935,061 patent/US7391870B2/en active Active
-
2005
- 2005-05-12 CN CN2005800231310A patent/CN1985303B/zh active Active
- 2005-05-12 CA CA2572989A patent/CA2572989C/en active Active
- 2005-05-12 RU RU2007104933/09A patent/RU2361185C2/ru active
- 2005-05-12 JP JP2007519630A patent/JP4772043B2/ja active Active
- 2005-05-12 EP EP05740130A patent/EP1774515B1/en active Active
- 2005-05-12 BR BRPI0512763A patent/BRPI0512763B1/pt active IP Right Grant
- 2005-05-12 AU AU2005262025A patent/AU2005262025B2/en active Active
- 2005-05-12 ES ES05740130T patent/ES2387248T3/es active Active
- 2005-05-12 WO PCT/EP2005/005199 patent/WO2006005390A1/en active Application Filing
- 2005-05-12 PT PT05740130T patent/PT1774515E/pt unknown
- 2005-05-12 AT AT05740130T patent/ATE556406T1/de active
- 2005-05-12 KR KR1020077000404A patent/KR100908080B1/ko active IP Right Grant
- 2005-07-07 TW TW094122951A patent/TWI305639B/zh active
-
2007
- 2007-01-02 NO NO20070034A patent/NO338725B1/no unknown
- 2007-07-12 HK HK07107471.6A patent/HK1099901A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
ATE556406T1 (de) | 2012-05-15 |
TW200617884A (en) | 2006-06-01 |
CA2572989A1 (en) | 2006-01-19 |
EP1774515B1 (en) | 2012-05-02 |
JP2008505368A (ja) | 2008-02-21 |
HK1099901A1 (en) | 2007-08-24 |
PT1774515E (pt) | 2012-08-09 |
CN1985303A (zh) | 2007-06-20 |
EP1774515A1 (en) | 2007-04-18 |
KR100908080B1 (ko) | 2009-07-15 |
US7391870B2 (en) | 2008-06-24 |
ES2387248T3 (es) | 2012-09-19 |
NO20070034L (no) | 2007-02-06 |
AU2005262025B2 (en) | 2008-10-09 |
TWI305639B (en) | 2009-01-21 |
BRPI0512763A (pt) | 2008-04-08 |
RU2007104933A (ru) | 2008-08-20 |
WO2006005390A1 (en) | 2006-01-19 |
KR20070027692A (ko) | 2007-03-09 |
CN1985303B (zh) | 2011-06-15 |
NO338725B1 (no) | 2016-10-10 |
RU2361185C2 (ru) | 2009-07-10 |
AU2005262025A1 (en) | 2006-01-19 |
CA2572989C (en) | 2011-08-09 |
JP4772043B2 (ja) | 2011-09-14 |
US20060009225A1 (en) | 2006-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BRPI0512763B1 (pt) | equipamento e método para gerar um sinal de saída multicanais | |
US7394903B2 (en) | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal | |
KR101215872B1 (ko) | 송신되는 채널들에 기초한 큐들을 갖는 공간 오디오의파라메트릭 코딩 | |
TWI427621B (zh) | 編碼聲音通道及解碼經傳輸之聲音通道之方法、裝置及機器可讀取媒體 | |
RU2383939C2 (ru) | Компактная дополнительная информация для параметрического кодирования пространственного звука | |
BR122018069726B1 (pt) | Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada | |
BRPI0516392B1 (pt) | conformação de som difuso para esquemas bcc e similares | |
BRPI0812669B1 (pt) | método e processador de áudio para gerar um sinal estéreo com qualidade perceptual | |
BRPI0509110B1 (pt) | Método e dispositivo para processar um sinal estéreo, aparelhos codificador e decodificador, e, sistema de áudio | |
BRPI0518507B1 (pt) | Informações auxiliares compactas para a codificação paramétrica de áudio espacial |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06T | Formal requirements before examination [chapter 6.20 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B15K | Others concerning applications: alteration of classification |
Ipc: G10L 19/008 (2013.01) |
|
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 28/08/2018, OBSERVADAS AS CONDICOES LEGAIS. |