BR122018069731B1

BR122018069731B1 - Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada.

Info

Publication number: BR122018069731B1
Application number: BR122018069731-8A
Authority: BR
Inventors: Juergen Herre; Johannes Hilpert; Stefan Geyersberger; Andreas Hoelzer; Claus Spenger
Original assignee: Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V.
Priority date: 2003-10-02
Filing date: 2004-09-30
Publication date: 2019-07-09
Also published as: RU2006114742A; US20190110146A1; US20050074127A1; NO344635B1; IL174286A0; ATE350879T1; AU2004306509A1; NO342804B1; NO345265B1; NO344760B1; US20130016843A1; CN1864436A; WO2005036925A2; PT1668959E; NO20180980A1; US20180359588A1; US10425757B2; CA2540851A1; US20090003612A1; US20190239018A1

Abstract

no processamento de um sinal de áudio multicanais tendo pelo menos três canais originais, são providos um primeiro canal downmix e um segundo canal downmix (12), que se derivam dos canais originais. para um canal original selecionado dos canais originais, são calculadas as informações colaterais de canal (14) de maneira que um canal downmix ou um canal downmix combinado incluindo o primeiro e o segundo canais downmix, quando pesados usando as informações colaterais de canal, resulta em uma aproximação do canal original selecionado. as informações colaterais de canal e o primeiro e o segundo canais downmix formam os dados de saída (20) a ser transmitidos a um decodificador que, no caso de um decodificador de baixo nível somente decodifica o primeiro e o segundo canais downmix ou, no caso de um decodificador de alto nível, provê total sinal de áudio multicanais baseado nos canais downmix e nas informações colaterais de canal. como as informações colaterais de canal somente ocupam um pequeno número de bits, e como o decodificador não usa dematrixing, é obtida uma extensão eficiente e de alta qualidade multicanais para os stereo players e os players ampliados multicanais.

Description

Campo da invenção [001] A presente invenção se refere a um aparelho e um método para o processamento de um sinal de áudio multicanais e, em particular, a um aparelho e um método para o processamento de um sinal de áudio multicanais de maneira estéreo-compatível.

Histórico da Invenção e da Técnica Anterior [002] Atualmente, a técnica de reprodução de áudio multicanais está se tornando mais e mais importante. Isto pode ser devido ao fato de que as técnicas de compressão/codificação de áudio como a bem conhecida técnica MP3 tornaram possível distribuir registros de áudio via Internet ou outros canais de transmissão dotados de largura de banda limitada. A técnica de codificação MP3 tornou-se tão famosa devido ao fato de permitir a distribuição de todos os registros em formato estéreo, isto é, uma representação digital do registro de áudio, incluindo um primeiro canal estéreo (ou canal estéreo esquerdo) e um segundo canal estéreo (ou canal estéreo direito).

[003] Não obstante, existem desvantagens básicas nos sistemas de som convencionais de dois canais. Portanto, foi desenvolvida a técnica surround. Uma representação multicanais surround recomendada inclui, além dos dois canais estéreo L e R, um outro canal central C e dois canais surround Ls, Rs. Esse

Petição 870190031598, de 02/04/2019, pág. 7/40

2/34 formato sonoro de referência é também denominado de estéreo três/dois, que significa três canais frontais e dois canais surround. Em geral, são necessários cinco canais de transmissão. Em um ambiente de playback, são necessários pelo menos cinco auto-falantes nos respectivos cinco diferentes locais para obter-se um local ideal agradável a uma certa distância a partir dos cinco auto-falantes bem localizados.

[004] São conhecidas várias técnicas nesse campo para reduzir a quantidade de dados necessários para a transmissão de um sinal de áudio multicanais. Essas técnicas são denominadas técnicas joint stereo. Para essa finalidade, é feita referência à Fig. 10, que mostra um dispositivo joint stereo 60. Esse dispositivo pode ser um dispositivo de implementação, por exemplo, intensity stereo(IS) ou binaural cue coding (BCC). Esse dispositivo geralmente recebe - como entrada - pelo menos dois canais (CH1, CH2, ... CHn), e emite um único canal portador e dados paramétricos. Os dados paramétricos são definidos de maneira que, em um decodificador, possa ser calculada uma aproximação de um canal original (CH1, CH2, ... CHn) .

[005] Normalmente, o canal portador incluirá amostras sub-banda, coeficientes espectrais, amostra de domínio no tempo, etc, que provêem uma representação comparativamente fina do sinal subjacente, enquanto os dados paramétricos não incluem essas amostras de coeficientes espectrais, mas incluem parâmetros de controle para o controle de um determinado algoritmo de reconstrução, como a pesagem por multiplicação, alteração de tempo, alteração de freqüência,... Os dados paramétricos, portanto, incluem somente uma representação

Petição 870190031598, de 02/04/2019, pág. 8/40

3/34 comparativamente rústica do sinal ou do canal associado. Explicado em números, a quantidade de dados necessária por um canal portador estará na faixa de 60 - 70 kbit/s, enquanto a quantidade de dados necessária pelas informações do lado paramétrico para um canal, estará na faixa de 1,5 - 2,5 kbit/s. Um exemplo de dados paramétricos são os bem conhecidos fatores de escala, as informações de intensity stereo ou binaural cue parameters como será descrito abaixo.

[006] A codificação intensity stereo é descrita na pré-impressão AES 3799, Intensity Stereo Coding, J. Herre, K. H. Brandenburg, D. Lederer, February 1994, Amsterdam. Em geral, o conceito de intensity stereo se baseia em uma transformada de eixo principal a ser aplicada aos dados de ambos os canais estereofônicos de áudio. Se a maioria dos pontos dos dados está concentrada à volta do primeiro eixo principal, pode ser obtido um ganho de codificação pela rotação de ambos os sinais de um determinado ângulo antes da codificação. Entretanto, isto nem sempre é verdade nas técnicas reais de produção estereofônica. Portanto, essa técnica é modificada pela exclusão da segunda componente ortogonal da transmissão no bit stream. Assim, os sinais reconstruídos para os canais esquerdo e direito consistem de versões pesadas ou medidas diferentemente do mesmo sinal transmitido. Não obstante, os sinais reconstruídos diferem em suas amplitudes, mas são idênticos em relação a suas informações de fase. Os envelopes energia-tempo de ambos os canais originais de áudio, entretanto, são preservados por meio de operação de medição seletiva, que tipicamente opera de maneira a selecionar a freqüência. Isto se conforma à percepção humana de som em

Petição 870190031598, de 02/04/2019, pág. 9/40

4/34 altas freqüências, onde os cues espaciais dominantes são determinados pelos envelopes de energia.

[007] Além disso, em implementações práticas, o sinal [008] transmitido, isto é, o canal portador é gerado a partir do sinal de soma do canal esquerdo e do canal direito ao invés de rotacionar ambos os componentes. Também, esse processamento, isto é, a geração de parâmetros intensity stereo para a realização da operação de medição, é feito com seleção de freqüência, isto é, independentemente de cada banda de fator de escala, isto é, da partição de freqüência codificadora. Preferencialmente, ambos os canais são combinados para formarem um canal combinador ou portador, e, além do canal combinador, as informações intensity stereo determinadas dependem da energia do primeiro canal, da energia do segundo canal ou da energia dos canais combinados.

[009] A técnica BCC é descrita no documento convenção da AES 5574, Binaural cue coding applied to stereo and multichannel audio compression, C. Faller, F. Baumgarte, May 2002, Munich. Na codificação BCC, alguns canais de entrada de áudio são convertidos em representação espectral usando uma transformada baseada DTF com janelas superpostas. O espectro uniforme resultante se divide em partições não superpostas, cada qual possuindo um índice. Cada partição tem uma largura de banda proporcional à largura de banda retangular equivalente (ERB). As diferenças de nível intercanais (ICLD) e as diferenças de tempos intercanais (ICTD) são estimadas para cada partição para o mesmo quadro k. O ICLD e o ICTD são quantificados e codificados,

Petição 870190031598, de 02/04/2019, pág. 10/40

5/34 resultando em um bit stream BCC. As diferenças de nível intercanais e as diferenças de tempos intercanais são dadas para cada canal com relação a um canal de referência. Então, os parâmetros são calculados de acordo com as formulas indicadas, que dependem de determinadas partições do sinal a ser processado.

[0010] No lado decodificador, este recebe um monosinal e o bit stream BCC. O mono-sinal é transformado em um domínio de freqüência e entra em um bloco de síntese espacial, que também recebe valores ICLD e ICTD decodificados. No bloco de síntese espacial, os valores dos parâmetros BCC (ICLD e ICTD) são usados para realizar uma operação de pesagem do mono-sinal para sintetizar os sinais multicanais, que após uma conversão freqüência/tempo, representam uma reconstrução do sinal original de áudio multicanais.

[0011] No caso BCC, o módulo joint stereo 60 é operativo para a saída das informações colaterais de canal, de maneira que os dados do canal paramétrico sejam parâmetros ICLD ou ICTD quantificados e codificados, considerando o fato de que um dos canais originais é usado como canal de referência para a codificação das informações colaterais de canal.

[0012] Normalmente, o canal portador é formado pela soma dos canais originais participantes.

[0013] Naturalmente, as técnicas acima somente provêem uma mono representação para um decodificador, que pode somente processar o canal portador, mas não consegue processar os dados paramétricos para a geração de uma ou mais aproximações de mais de um canal de entrada.

Petição 870190031598, de 02/04/2019, pág. 11/40

6/34 [0014] Para a transmissão dos cinco canais de maneira compatível, isto é, em formato bitstream, que também é compreensível para um decodificador estéreo normal, a denominada técnica de matrixing foi usada como descrito em MUSICAM surround: a universal multi-channel coding system compatible with ISO 11172-3, G. Theile and G. Stoll, AES preprint 3403, October 1992, San Francisco. Os cinco canais de entrada L, R, C,

Ls, e Rs são abastecidos em um dispositivo de matrixing e realizam uma operação de matrixing para calcular os canais estéreo compatíveis ou básicos Lo, Ro, a partir dos cinco canais

de	entrada.	Em	particular,	esses canais	estéreo básicos	Lo/Ro
são	calculados	como indicado	abaixo:
			Lo = L + xC	+ yLs
			Ro = R + xC	+ yRs
[0015]		x e y sendo	constantes.	Os outros três	canais

C, Ls, Rs são transmitidos como são em uma camada de extensão, além da camada estéreo básica, que inclui uma versão codificada dos sinais estéreo básicos Lo/Ro. Com respeito ao bitstream, essa camada estéreo básica Lo/Ro inclui um cabeçalho, informações como os fatores de escala e as amostras de subbanda. A camada de extensão multicanais, isto é, o canal central e os dois canais surround estão incluídos no campo de extensão multicanais, que também é denominado canal de dados auxiliares.

[0016]

No lado decodificador, é realizada uma operação matrixing inversa para formar reconstruções dos canais esquerdo e direito na representação de cinco canais usando os canais estéreo básicos Lo, Ro e os três canais adicionais. Além disso, os três canais adicionais são decodificados a partir das

Petição 870190031598, de 02/04/2019, pág. 12/40

7/34 informações auxiliares para obter uma representação de cinco canais decodificados ou surround do sinal de áudio multicanais original.

[0017] Outra abordagem de codificação multicanais está descrita na publicação Improved MPEG-2 audio multi-channel encoding, B. Grill, J. Herre, K. H. Brandenburg, E. Eberlein, J. Koller, J. Mueller, AES preprint 3865, February 1994, Amsterdam, na qual, para se obter uma compatibilidade backward, são considerados os modos compatíveis backward. Para esse fim, é usada uma matriz de compatibilidade para obter os dois chamados canais downmix Lc, Rc a partir dos cinco canais originais de entrada. Além disso, é possível selecionar dinamicamente os três canais auxiliares transmitidos como dados auxiliares.

[0018] Para explorar a irrelevância do estéreo, é aplicada uma técnica joint stereo aos grupos de canais, por exemplo, os três canais frontais, isto é, para o canal esquerdo, o canal direito e o canal central. Para isso, esses três canais são combinados para obter um canal combinado. Esse canal combinado é quantificado e embalado no bitstream. Depois, esse canal combinado juntamente com as correspondentes informações joint stereo são colocados em um módulo de decodificação joint stereo para obter os canais decodificados joint stereo isto é, um canal esquerdo decodificado joint stereo, um canal direito decodificado joint stereo e um canal central decodificado joint stereo. Esses canais decodificados joint stereo, juntamente com o canal surround esquerdo e o canal surround direito entram em um bloco matriz de compatibilidade para formar o primeiro e o segundo canais downmix Lc, Rc. Depois, as versões quantificadas

Petição 870190031598, de 02/04/2019, pág. 13/40

8/34 do canal combinado são embaladas no bitstream juntamente com os parâmetros de codificação joint stereo.

[0019] Usando codificação intensity stereo, portanto, um grupo de sinais independente de canais originais é transmitido dentro de uma porção dos dados portadores. O decodificador então reconstrói os sinais envolvidos como dados idênticos, que são reescalados de acordo com seus envelopes energia-tempo originais. Como conseqüência, uma combinação linear dos canais transmitidos conduzirá aos resultados, que são bastante diferentes do downmix original. Isto se aplica a qualquer tipo de codificação joint stereo baseada no conceito de intensity stereo. Para um sistema de codificação que provê canais downmix compatíveis, existe uma conseqüência direta: A reconstrução por dematrixing, como descrita na publicação anterior, sofre por problemas causados pela reconstrução imperfeita. Usando o denominado esquema de pré-distorção joint stereo, no qual é feita uma codificação joint stereo dos canais da esquerda, da direita e do centro antes de ser feito o matrixing no codificador, ameniza o problema. Assim, o esquema de dematrixing para a reconstrução introduz menos problemas, já que no lado do codificador, os sinais decodificados joint stereo foram usados para gerar os canais downmix. Assim, o processo de reconstrução imperfeito é alterado para os canais downmix compatíveis Lc e Rc, onde tem muito mais probabilidades de ser mascarado pelo próprio sinal de áudio.

[0020] Apesar desse sistema ter resultado em menos problemas devido ao dematrixing no lado do decodificador, tem ainda assim algumas desvantagens. A desvantagem é que os canais

Petição 870190031598, de 02/04/2019, pág. 14/40

9/34 downmix estéreo-compatíveis Lc e Rc se derivam não dos canais originais, mas das versões codificada/decodificada intensity stereo dos canais originais. Portanto, as perdas de dados devidas ao sistema de codificação intensity stereo estão incluídas nos canais downmix compatíveis. O decodificador somente estéreo, que somente decodifica os canais compatíveis ao invés de ampliar os canais codificados intensity stereo, portanto, provê um sinal de saída que é afetado pelas perdas de dados induzidas por intensity stereo.

[0021] Além disso, um outro canal completo tem que ser transmitido além dos dois canais downmix. Esse canal é o canal combinado, que é formado pelos meios de codificação intensity stereo do canal esquerdo, do canal direito e do canal central. Além disso, as informações intensity stereo para a reconstrução dos canais originais L, R, C do canal combinador também devem ser transmitidas ao decodificador. No decodificador, é feita uma matrixing inversa, isto é, é feita uma operação de dematrixing para derivar os canais surround dos dois canais downmix. Também, os canais esquerdo, direito e central originais são aproximados pela decodificação intensity stereo usando o canal combinado transmitido e os parâmetros intensity stereo transmitidos. Deve ser notado que os canais esquerdo, direito e central originais são derivados pela decodificação intensity stereo do canal combinado.

Sumário da Invenção [0022] É o objeto da presente invenção prover um conceito para um processamento bit-eficiente e com a redução de

Petição 870190031598, de 02/04/2019, pág. 15/40

10/34 problemas ou o processamento inverso de um sinal de áudio multicanais.

[0023] De acordo com um primeiro aspecto da presente invenção, este objeto é alcançado por um equipamento para processamento de um sinal de áudio multicanais, o sinal de áudio multicanais tendo pelo menos três canais originais, compreendendo: meios para prover um primeiro canal downmix e um segundo canal downmix, o primeiro e o segundo canais downmix sendo derivados dos canais originais; meios para calcular as informações colaterais de canal de um canal original selecionado dos sinais originais, os meios para cálculo sendo operativos para o cálculo das informações colaterais de canal, como de um canal downmix ou de um canal downmix combinado, incluindo o primeiro e o segundo canais downmix, quando pesados usando as informações colaterais de canal, resulta em uma aproximação do canal original selecionado; e meios para a geração de dados de saída, os dados de saída incluindo as informações colaterais de canal, o primeiro canal downmix ou um sinal derivado do primeiro canal downmix e do segundo canal downmix ou um sinal derivado do segundo canal downmix.

[0024] De acordo com um Segundo aspecto da presente invenção, este objeto é alcançado por um método para o processamento de um sinal de áudio multicanais, o sinal de áudio multicanais tendo pelo menos três canais originais, compreendendo: prover um primeiro canal downmix e um segundo canal downmix, o primeiro e o Segundo canais downmix sendo derivados dos canais originais; calcular as informações colaterais de canal para um canal original selecionado dos

Petição 870190031598, de 02/04/2019, pág. 16/40

11/34 sinais originais, de maneira que um canal downmix ou um canal downmix combinado, incluindo o primeiro e o segundo canais downmix, quando pesados usando as informações colaterais de canal, resulta em uma aproximação do canal original selecionado; e gerar dados de saída, os dados de saída incluindo as informações colaterais de canal, o primeiro canal downmix ou o sinal derivado do primeiro canal downmix e do segundo canal downmix ou um sinal derivado do segundo canal downmix.

[0025] De acordo com um terceiro aspecto da presente invenção, este objeto é alcançado por um equipamento para o processamento inverso dos dados de entrada, os dados de entrada incluindo as informações colaterais de canal, um primeiro canal downmix ou um sinal derivado do primeiro canal downmix e um segundo canal downmix ou um sinal derivado do segundo canal downmix, caracterizado pelo fato de que o primeiro canal downmix e o segundo canal downmix são derivados de pelo menos três canais originais de um sinal de áudio multicanais, e caracterizado pelo fato de que as informações colaterais de canal são calculadas de maneira que um canal downmix ou um canal downmix combinado, incluindo o primeiro canal downmix e o segundo canal downmix, quando pesados usando as informações colaterais de canal, resultam em uma aproximação do canal original selecionado, o equipamento compreendendo: uma leitora de dados de entrada para ler os dados de entrada de maneira a obter o primeiro canal downmix ou um sinal derivado do primeiro canal downmix e o segundo canal downmix ou um sinal derivado do segundo canal downmix e as informações colaterais de canal; e um reconstrutor de canais para a reconstrução da aproximação do

Petição 870190031598, de 02/04/2019, pág. 17/40

12/34 canal original selecionado usando as informações colaterais de canal e o canal downmix ou o canal downmix combinado para obter a aproximação do canal original selecionado.

[0026] De acordo com um quarto aspecto da presente invenção, este objeto é alcançado por um método de processamento inverso dos dados de entrada, os dados de entrada incluindo as informações colaterais de canal, um primeiro canal downmix ou um sinal derivado de um primeiro canal downmix e um segundo canal downmix ou um sinal derivado de um segundo canal downmix, caracterizado pelo fato de que o primeiro canal downmix e o segundo canal downmix são derivados de pelo menos três canais originais de um sinal de áudio multicanais, e caracterizado pelo fato de que as informações colaterais de canal são calculadas de maneira que um canal downmix ou um canal downmix combinado, incluindo o primeiro canal downmix e o segundo canal downmix, quando pesados usando as informações colaterais de canal, resultam em uma aproximação do canal original selecionado, o método compreendendo: leitura dos dados de entrada para obter o primeiro canal downmix ou um sinal derivado do primeiro canal downmix e um segundo canal downmix ou um sinal derivado do segundo canal downmix e as informações colaterais de canal; e reconstruir a aproximação do canal original selecionado usando as informações colaterais de canal e o canal downmix ou o canal downmix combinado para obter a aproximação do canal original selecionado.

[0027] De acordo com um quinto aspecto e sexto aspecto da presente invenção, este objeto é alcançado por um programa de

Petição 870190031598, de 02/04/2019, pág. 18/40

13/34 computador incluindo o método de processamento ou o método de processamento inverso.

[0028] A presente invenção se baseia na descoberta de que é obtida uma codificação eficiente e com menos problemas do sinal de áudio multicanais quando dois canais downmix, preferencialmente representando os canais estéreo esquerdo e direito são embalados nos dados de saída.

[0029] Inventivamente, as informações paramétricas colaterais do canal para um ou mais dos canais originais se derivam de maneira a se relacionarem com um dos canais downmix, ao invés de, como na técnica anterior, a um canal joint stereo combinado adicional. Isto significa que as informações paramétricas colaterais do canal são calculadas de maneira que, no lado do decodificador, um reconstrutor de canal usa as informações colaterais de canal e um dos canais downmix ou uma combinação dos canais downmix para reconstruir uma aproximação do canal de áudio original, para o qual as informações colaterais de canal são indicadas.

[0030] O conceito inventivo é vantajoso por prover uma extensão multicanais bit-eficiente, de maneira que possa ser reproduzido em um decodificador o sinal de áudio multicanais.

[0031] Além disso, o conceito inventivo é compatível backward, já que um decodificador de menor escala, que é somente adaptado para o processamento de dois canais, pode simplesmente ignorar a informação da extensão, isto é, as informações colaterais de canal. O decodificador de menor escala somente pode reproduzir os dois canais downmix para obter uma representação estéreo do sinal original de áudio multicanais.

Petição 870190031598, de 02/04/2019, pág. 19/40

14/34

Entretanto, um decodificador de maior escala habilitado para operações multicanais, pode usar as informações colaterais de canal transmitidas para reconstruir aproximações dos canais originais.

[0032] A presente invenção é vantajosa por ser biteficiente, já que, em contraste com a técnica anterior, não é necessário outro canal portador além do primeiro e do segundo canais downmix Lc, Rc. Ao invés disso, as informações colaterais de canal se relacionam com um ou ambos os canais downmix. Isto significa que os próprios canais downmix servem como canais portadores, para os quais as informações colaterais de canal são combinadas para reconstruir um canal de áudio original. Isto significa que as informações colaterais de canal são preferivelmente informações colaterais paramétricas, isto é, informações que não incluem quaisquer amostras de sub-banda ou coeficientes espectrais. Ao invés disso, as informações colaterais paramétricas são informações usadas para pesagem (no tempo e/ou freqüência) do respectivo canal downmix ou da combinação dos respectivos canais downmix para obter uma versão reconstruída de um canal original selecionado.

[0033] Em uma configuração preferida da presente invenção, é obtida uma codificação compatível backward de um sinal multicanais baseada em um sinal estéreo compatível. Preferencialmente, o sinal estéreo compatível (sinal downmix) é gerado usando o matrixing dos canais originais do sinal de áudio multicanais.

[0034] Inventivamente, as informações colaterais de canal de um canal original selecionado são obtidas com base nas

Petição 870190031598, de 02/04/2019, pág. 20/40

15/34 técnicas joint stereo como a codificação intensity stereo ou a binaural cue coding. Assim, no lado do decodificador, não devem ser feitas operações de dematrixing. Os problemas associados com dematrixing, isto é, são evitados alguns problemas relacionados com uma distribuição indesejada de ruídos de quantificação nas operações de dematrixing. Isto se deve ao fato do decodificador usar um reconstrutor de canais, que reconstrói um sinal original, usando um dos canais downmix ou uma combinação dos canais downmix e as informações colaterais de canal transmitidas.

[0035] Preferivelmente, todo conceito inventivo é aplicado a um sinal de áudio multicanais com cinco canais. Esses cinco canais são um canal esquerdo L, um canal direito R, um canal central C, um canal surround esquerdo Ls e um canal surround direito Rs. Preferencialmente, os canais downmix são canais downmix estéreo compatíveis Ls e Rs, que provêem uma representação estéreo do sinal de áudio multicanais original.

[0036] De acordo com a configuração preferida da presente invenção, para cada canal original, são calculadas as informações colaterais de canal em um lado codificador embalado nos dados de saída. As informações colaterais de canal do canal esquerdo original se derivam usando o canal downmix esquerdo. As informações colaterais de canal do canal surround esquerdo original se derivam usando o canal downmix esquerdo. As informações colaterais de canal do canal direito original se derivam do canal downmix direito. As informações colaterais de

Petição 870190031598, de 02/04/2019, pág. 21/40

16/34 canal para o canal surround direito original se derivam do canal downmix direito.

[0037] De acordo com a configuração preferida da presente invenção, as informações de canal do canal central original se derivam usando o primeiro canal downmix assim como o segundo canal downmix, isto é, usando uma combinação dos dois canais downmix. Preferencialmente, essa combinação é uma soma.

[0038] Assim, os subgrupos, isto é, a relação entre as informações colaterais de canal e o sinal portador, isto é, o canal downmix usado para prover as informações colaterais de canal para um canal original selecionado é de tal modo que, para a qualidade ideal, é selecionado um determinado canal downmix, que contém a maior quantidade relativa possível do respectivo sinal multicanais original que é representado por meio das informações colaterais de canal. Como um sinal portador joint stereo, são usados o primeiro e o segundo canais downmix. Preferencialmente, também a soma do primeiro e do segundo canais downmix pode ser usada. Naturalmente, a soma do primeiro e do segundo canais downmix pode ser usada para o cálculo das informações colaterais de canal de cada um dos canais originais. Preferencialmente, entretanto, a soma dos canais downmix é usada para calcular as informações colaterais de canal do canal central original em um ambiente surround, como o surround de cinco canais, surround de sete canais, surround 5.1 ou surround 7.1. Usar a soma do primeiro e do segundo canais downmix é especialmente vantajoso, já que não precisa ser realizado nenhum outro cabeçalho de transmissão. Isto se deve ao fato de que ambos os canais downmix estão presentes no decodificador, de

Petição 870190031598, de 02/04/2019, pág. 22/40

17/34 maneira que a soma desses canais downmix pode ser facilmente feita no decodificador sem a exigência de outros bits de transmissão.

[0039] Preferencialmente, as informações colaterais de canal que formam a extensão multicanais são inseridas no bit stream dos dados de saída de maneira compatível, de maneira que o decodificador de menor escala simplesmente ignora os dados de extensão multicanais e somente fornece uma representação estéreo do sinal de áudio multicanais. Não obstante, um codificador de maior escala não somente usa dois canais downmix, mas, além disso, emprega as informações colaterais de canal para reconstruir uma representação completa multicanais do sinal original de áudio.

[0040] Um decodificador inventivo é operativo para primeiramente decodificar ambos os canais downmix e ler as informações colaterais de canal dos canais originais selecionados. Depois, as informações colaterais de canal e os canais downmix são usados para reconstruir aproximações dos canais originais. Para essa finalidade, preferencialmente, não é feita nenhuma operação de dematrixing. Isto significa que, nesta configuração, cada um dos, por exemplo, cinco canais originais de entrada são reconstruídos usando, por exemplo, cinco conjuntos de diferentes informações colaterais de canal. No codificador, é realizado o mesmo agrupamento que no codificador para calcular a aproximação do canal reconstruído. Em um ambiente surround de cinco canais, isto significa que, para reconstruir o canal original esquerdo, são usados o canal downmix esquerdo e as informações colaterais de canal do canal

Petição 870190031598, de 02/04/2019, pág. 23/40

18/34 esquerdo. Para reconstruir o canal direito original, são usados o canal downmix direito e as informações colaterais de canal do canal direito. Para reconstruir o canal surround esquerdo original, são usados o canal downmix esquerdo e as informações colaterais do canal surround esquerdo. Para reconstruir o canal surround direito original, são usadas as informações colaterais de canal do canal surround direito e o canal downmix direito. Para reconstruir o canal central original, são usados um canal combinado formado a partir do primeiro canal downmix e o segundo canal downmix e as informações colaterais do canal central.

[0041] Naturalmente, também é possível reproduzir o primeiro e o Segundo canais downmix como os canais esquerdo e direito, de maneira que somente três conjuntos (entre, por exemplo, cinco) de parâmetros de informações colaterais do canal tenham que ser transmitidos. Isto é, entretanto, somente aconselhável em situações onde existam regras menos rigorosas com respeito à qualidade. Isto se deve ao fato que, normalmente, o canal downmix esquerdo e o canal downmix direito são diferentes do canal esquerdo original ou do canal direito original. Somente em situações em que não se possa transmitir as informações colaterais do canal para cada um dos canais originais, esse processo é vantajoso.

Breve Descrição dos Desenhos [0042] As configurações preferidas da presente invenção são agora discutidas com referência às figuras anexas, nas quais:

Fig. 1 é um diagrama de blocos de uma configuração preferida do decodificador do invento;

Petição 870190031598, de 02/04/2019, pág. 24/40

19/34

Fig. 2 é um diagrama de blocos de uma configuração preferida do decodificador do invento;

Fig. 3A é um diagrama de blocos de uma implementação preferida do meio de cálculo para obter informações colaterais de canal seletivo de freqüência;

Fig. 3B é uma configuração preferida de um calculador para a implementação de um processamento joint stereo como intensity coding ou binaural cue coding;

Fig. 4 ilustra outra configuração preferida do meio para calcular as informações colaterais de canal, na qual as informações colaterais de canal são fatores de ganho;

Fig. 5 ilustra uma configuração preferida de uma implementação do decodificador, quando o codificador é implementado como na Fig. 4;

Fig. 6 ilustra uma implementação preferida de um meio para prover canais downmix;

Fig. 7 ilustra agrupamentos de canais originais e downmix para o cálculo das informações colaterais de canal dos respectivos canais originais;

Fig. 8 ilustra outra configuração preferida do codificador do invento;

Fig. 9 ilustra outra implementação de um decodificador do invento; e

Fig. 10 ilustra um codificador joint stereo da técnica anterior.

Descrição____Detalhada____das____Configurações

Preferidas

Petição 870190031598, de 02/04/2019, pág. 25/40

20/34 [0043] A Fig. 1 mostra um equipamento para o processamento de um sinal de áudio multicanais 10 tendo pelo menos três canais originais como R, L e C. Preferencialmente, o sinal de áudio original tem mais do que três canais, como cinco canais no ambiente surround, que está ilustrado na Fig. 1. Os cinco canais são o canal esquerdo L, o canal direito R e o canal central C, o canal surround esquerdo Ls e o canal surround direito Rs. O equipamento do invento inclui o meio 12 para prover um primeiro canal downmix Lc e um segundo canal downmix Rc, o primeiro e o segundo canais downmix sendo derivados dos canais originais. Para derivar os canais downmix dos canais originais, existem várias possibilidades. Uma possibilidade é derivar os canais downmix Lc e Rc por meio de matrixing dos canais originais usando uma operação de matrixing como ilustrada na Fig. 6. Essa operação de matrixing é realizada no domínio do tempo.

[0044] Os parâmetros de matrixing a, b e t são selecionados de maneira que sejam menores ou iguais a 1. Preferencialmente, a e b são 0,7 ou 0,5. O parâmetro geral de pesagem t é, preferencialmente, escolhido de maneira que seja evitado o clipping de canais.

[0045] Alternativamente, como indicado na Fig. 1, os canais downmix Lc e Rc podem também ser fornecidos externamente. Isto pode ser feito, quando os canais downmix Lc e Rc forem o resultado de uma operação de “mistura manual”. Nesse cenário, o próprio engenheiro de som faz a mixagem dos canais downmix ao invés de usar uma operação automatizada de matrixing. O engenheiro de som faz uma mixagem criativa para obter os canais

Petição 870190031598, de 02/04/2019, pág. 26/40

21/34

downmix otimizados Lc e Rc,	que proporcionam	a melhor
representação	estéreo possível	do sinal de	áudio	multicanais
original.
[0046]	No caso de um	suprimento	externo	de canais

downmix, os meios não realizam uma operação matrixing, mas simplesmente encaminha os canais downmix supridos externamente para um meio subseqüente de cálculo 14.

[0047] O meio de cálculo 14 é operativo para calcular as informações colaterais de canal como li, lsi, ri ou rsi para os canais selecionados originais como L, Ls, R ou Rs, respectivamente. Em particular, o meio 14 para cálculo está operativo para calcular as informações colaterais de canal como de um canal downmix, quando pesado usando as informações colaterais de canal, resultando em uma aproximação do canal selecionado original.

[0048] Alternativa ou adicionalmente, o meio de cálculo das informações colaterais de canal é ainda operativo e para calcular as informações colaterais de canal para um canal original selecionado como um canal downmix combinador, incluindo uma combinação do primeiro e do segundo canais downmix, quando pesados usando as informações colaterais de canal calculadas, resulta em uma aproximação do canal original selecionado. Para mostrar essa característica na figura, são mostrados um somador 14a e um calculador de informações colaterais de canal combinado 14b.

[0049]	Está claro	para	os peritos na técnica	que esses
elementos	não precisam	ser	implementados como	elementos
distintos.	Ao invés disso,	toda	a funcionalidade dos	blocos 14,

Petição 870190031598, de 02/04/2019, pág. 27/40

22/34

14a e 14b pode ser implementada por meio de um determinado processador que pode ser um processador genérico ou qualquer outro meio para a realização da funcionalidade necessária.

[0050] Além disso, deve ser notado aqui que os sinais de canal sendo amostras sub-banda ou valores de domínio de freqüência estão indicados em letras maiúsculas. As informações colaterais do canal são, em contraste aos próprios canais, indicadas em letras minúsculas. As informações colaterais de canal ci são, portanto, as informações colaterais de canal do canal central original C.

[0051] As informações colaterais de canal, assim como os canais downmix Lc e Rc ou uma versão codificada Lc' e Rc', como produzidas por um codificador de áudio 16 são inseridas em um formatador de dados de saída 18. Em geral, o formatador de dados de saída 18 atua como meio para a geração dos dados de saída, os dados de saída incluindo as informações colaterais de canal de pelo menos um canal original, o primeiro canal downmix ou um sinal derivado do primeiro canal downmix (como uma versão codificada deste) e o segundo canal downmix ou um sinal derivado do segundo canal downmix (como uma versão codificada deste).

[0052] Os dados de saída ou o bitstream de saída 20 pode então ser transmitidos para um decodificador bitstream ou pode ser armazenado ou distribuído. Preferencialmente, o bitstream de saída 20 é um bitstream compatível que também pode ser lido por um decodificador de pequena escala não tendo capacidade de extensão multicanais. Esses codificadores de pequena escala, como a maioria dos decodificadores existentes MP3 da técnica atual, simplesmente ignoram os dados de extensão

Petição 870190031598, de 02/04/2019, pág. 28/40

23/34 multicanais, isto é, as informações colaterais de canal. Somente decodificarão o primeiro e o Segundo canais downmix para produzir uma saída estéreo. Os decodificadores de maior escala, como os decodificadores habilitados para multicanais lerão as informações colaterais de canal e então gerarão uma aproximação dos canais originais de áudio, como é obtida uma impressão de áudio multicanais.

[0053] A Fig. 8 mostra uma configuração preferida da presente invenção no ambiente de cinco canais surround / MP3. Aqui, é preferível escrever os dados de ampliação surround no campo de dados auxiliares na sintaxe bit stream MP3 padronizada, como um bitstream “MP3 surround” é obtido.

[0054] A Fig. 2 mostra uma ilustração de um decodificador do invento atuando como um equipamento de dados de entrada para processamento inverso recebido em uma porta de dados de entrada 22. Os dados recebidos na porta dos dados de entrada 22 são os mesmos dados de saída da porta dos dados de saída 20 da Fig. 1. De maneira alternativa, quando os dados não são transmitidos por canal com fio mas por canal sem fio, os dados recebidos na porta de entrada de dados 22 são derivados dos dados dos dados originais produzidos pelo codificador.

[0055] Os dados de entrada do decodificador são inseridos na leitora data stream 24 para a leitura dos dados de entrada e finalmente obter as informações colaterais de canal 26 e do canal downmix esquerdo 28 e do canal downmix direito 30. Caso os dados de entrada incluírem versões codificadas dos canais downmix, que correspondam ao caso em que o codificador de áudio 16 da Fig. 1 está presente, a leitora data stream 24

Petição 870190031598, de 02/04/2019, pág. 29/40

24/34 também inclui um decodificador de áudio, adaptado ao codificador de áudio usado para a codificação dos canais downmix. Nesse caso, o decodificador de áudio, que faz parte da leitora data stream 24, é operativo para gerar o primeiro canal downmix Lc e o segundo canal downmix Rc, ou, melhor explicado, uma versão decodificada desses canais. Para uma descrição mais fácil, a distinção entre sinais e suas versões decodificadas é feita

somente	quando	explicitamente declarada.
[0056]		As informações colaterais	de	canal 26	e os
canais	downmix	esquerdo e direito 28 e	30	produzidos	pela
leitora	data	stream 24 são alimentados	em	um reconstrutor

multicanais 32 para prover uma versão reconstruída 34 dos sinais originais de áudio, que podem ser reproduzidos por meio de um player multicanais 36. No caso em que o reconstrutor multicanais estiver operativo no domínio da freqüência, o player multicanais 36 receberá os dados de entrada do domínio de freqüência, que devem ser de certa forma decodificados como convertidos no domínio de tempo antes de serem reproduzidos. Para essa finalidade, o player multicanais 36 pode também incluir dispositivos para decodificação.

[0057] Deve ser notado aqui que o decodificador de menor escala somente terá a leitora data stream 24, que somente reproduz os canais downmix esquerdo e direito 28 e 30 em saída estéreo 38. Entretanto, o decodificador ampliado da invenção extrairá as informações colaterais de canal 26 e usará essas informações colaterais e os canais downmix 28 e 30 para reconstruir as versões reconstruídas 34 dos canais originais usando o reconstrutor multicanais 32.

Petição 870190031598, de 02/04/2019, pág. 30/40

25/34 [0058] A Fig. 3A mostra uma configuração da calculadora do invento 14 para o cálculo das informações colaterais de canal que, um codificador de áudio por um lado e a calculadora de informações colaterais de canal pelo outro lado operam na mesma representação espectral do sinal multicanais. Entretanto, a Fig. 1 mostra a outra alternativa, na qual o codificador de áudio por um lado e a calculadora de informações colaterais de canal pelo outro lado operam em diferentes representações espectrais do sinal multicanais.

Quando a computação de recursos não é tão importante quanto a qualidade de áudio, é preferida alternativa da Fig.1, já que podem ser usados os bancos de filtros otimizados individualmente para codificação de áudio cálculo de informações colaterais. Entretanto, quando os recursos de computação forem um problema, é preferida alternativa da Fig. 3A, já que essa alternativa requer menos potência de computação devido à utilização compartilhada dos elementos.

[0059] dispositivo mostrado na Fig. 3A é operativo para a recepção de dois canais

A, B. O dispositivo mostrado na

Fig. 3A é operativo para calcular as informações colaterais para o canal B, de maneira que usando essas informações colaterais de canal para o canal original selecionado B, pode ser calculada uma versão reconstruída do canal B a partir do sinal do canal A. Além disso, o dispositivo mostrado na Fig. 3A é operativo para formar informações colaterais de canal no domínio de freqüência, como parâmetros para a pesagem (multiplicando ou processando no tempo como na codificação BCC, p. exemplo) de valores espectrais

Petição 870190031598, de 02/04/2019, pág. 31/40

26/34 ou amostras sub-banda. Para essa finalidade, a calculadora do invento inclui meios de janelamento e de conversão tempo/freqüência 140a para obter uma representação de freqüência de canal A em uma saída 140b ou uma representação de domínio de freqüência do canal B em uma saída 140c.

[0060] Na configuração preferida, a determinação das informações colaterais (pelo meio de determinação de informações colaterais 140f) é feita usando valores espectrais quantificados. Depois, também está presente um quantificador 140d que, preferencialmente é controlado usando um modelo psicoacústico tendo uma entrada de controle de modelo psicoacústico

140e.

Não obstante, não é necessário um quantificador quando os meios de determinação de informações colaterais 140c usam uma representação não quantificada do canal

A para determinar as informações colaterais de canal do canal

B.

Caso as informações colaterais de canal do canal B forem calculadas por meio de uma representação de domínio de freqüência do canal A e da representação de domínio de freqüência do canal

B, os meios de janelamento e de conversão tempo/freqüência 140a podem ser os mesmos que os usados no codificador de áudio baseado no banco de filtros. Nesse caso, quando é considerada a AAC (ISO/IEC 13818-3), são implementados os meios 140a como um banco de filtros MDCT (MDCT = transformada co-seno discreta modificada) com 50% de funcionalidade overlapand-add [sobrepõe e soma].

[0062] Nesse caso, o quantificador 140d é um quantificador iterativo como o usado quando são gerados sinais de áudio codificados mp3 ou AAC. A representação do domínio de

Petição 870190031598, de 02/04/2019, pág. 32/40

27/34 freqüência do canal A que, preferencialmente já está

quantificado,

pode então ser usada diretamente para a

codificação entrópica usando um codificador de entropia 140g, que pode ser um codificador base Huffman ou um codificador de entropia implementando codificação aritmética.

[0063]	Quando comparada à Fig. 1, a saída do
dispositivo na	Fig. 3A são as informações colaterais como a l_i

para um canal original (correspondendo às informações colaterais de B na saída do dispositivo 140f). O bitstream com codificação entrópica do canal A corresponde, por ex., ao canal codificado downmix esquerdo Lc' na saída do bloco 16 da Fig. 1. Na Fig. 3A

torna-se claro

que o elemento 14 (Fig. 1), i.e., a calculadora

para o cálculo das informações colaterais de canal e do

codificador de	áudio 16 (Fig. 1) pode ser implementado como um
meio separado	ou pode ser implementado como uma versão
compartilhada,	de maneira que ambos os dispositivos compartilhem

vários elementos como o banco de filtros MDCT 140a, o

quantificador

140e e o codificador de entropia 140g.

Naturalmente, caso seja necessário uma transformada diferente, etc., para determinar as informações colaterais de canal, então o codificador 16 e a calculadora 14 (Fig. 1) serão implementados

em diferentes	dispositivos, tais como ambos os elementos não
compartilharem	o banco de filtros etc.
[0064]	Em geral, o real determinante para o cálculo

das informações colaterais (ou geralmente indicados pela calculadora 14) pode ser implementado como um módulo joint stereo como mostrado na Fig. 3B, que opera de acordo com

Petição 870190031598, de 02/04/2019, pág. 33/40

28/34 quaisquer das técnicas de joint stereo como a codificação intensity stereo ou o binaural cue coding.

[0065] Em contraste com esses codificadores intensity stereo da técnica anterior, o meio de determinação do invento 140f não tem que calcular o canal combinado. O “canal combinador ou canal portador, como se pode dizer, já existe e é o canal downmix compatível esquerdo Lc ou o canal downmix compatível direito Rc ou uma versão combinada desses canais downmix como Lc + Rc. Portanto, o dispositivo do invento 140f somente tem que calcular as medições de escala para escalar o canal downmix respectivo, de maneira que seja obtido o envelope energia/tempo do respectivo canal original, quando o canal downmix é pesado usando as informações de medição ou, como se pode dizer, as informações direcionais de intensidade.

[0066] Portanto, o módulo joint stereo 140f da Fig. 3B está ilustrado de maneira a receber, como entrada, o canal A combinado, que é o primeiro ou o segundo canal downmix ou uma combinação dos canais downmix, e o canal original selecionado. Esse módulo, naturalmente, reproduz o canal A combinado e os parâmetros joint stereo como informações colaterais de canal de maneira que, usando o canal A combinado e os parâmetros joint stereo possa ser calculada uma aproximação do canal original selecionado.

[0067] De maneira alternativa, o módulo joint stereo 140f pode ser implementado para realizar o binaural cue coding.

[0068] No caso do BCC, o módulo joint stereo 140f é operativo para reproduzir as informações colaterais de canal de maneira que as informações colaterais de canal sejam

Petição 870190031598, de 02/04/2019, pág. 34/40

29/34 quantificadas e codificados os parâmetros ICLD ou ICTD, caracterizado pelo fato de que o canal original selecionado serve como o canal real a ser processado, enquanto o canal downmix respectivo usado para calcular as informações colaterais, como o primeiro, o segundo ou uma combinação do primeiro e do segundo canais downmix seja usada como o canal de referência no sentido da técnica

BCC de codificação/decodificação.

Com referência à Fig. 4, é dada uma simples implementação direcionada para energia do elemento

140f. Esse dispositivo inclui um seletor de banda de freqüência 44 que seleciona uma banda de freqüência do canal

A e uma banda de freqüência correspondente do canal

B. Depois, em ambas as bandas de freqüência, é calculada uma energia por meio de uma calculadora de energia 42 para cada ramal. A implementação detalhada da calculadora de energia 42 dependerá de ser o sinal do bloco 40 é um sinal de sub-banda ou são coeficientes de freqüência. Em outras implementações, onde são calculados os fatores de escala para as bandas de fator de escala, pode-se usar já os fatores de escala do primeiro e do segundo canais A,

B como valores de energia EA e EB ou pelo menos como estimativas de energia. Em um dispositivo de cálculo de fator de ganho 44, é determinado um fator de ganho gB para a banda selecionada de freqüência com base em uma determinada regra, como a regra de determinação de ganho ilustrada no bloco 44 da Fig. 4. Aqui, o fator de ganho g_B pode ser usado diretamente para pesar amostras de domínio de tempo ou coeficientes de freqüência, como será descrito posteriormente na Fig. 5. Para esse fim, o fator de

Petição 870190031598, de 02/04/2019, pág. 35/40

30/34 ganho g_B, que é válido para a banda selecionada de freqüência é usado como informações colaterais de canal para o canal B sendo o canal original selecionado. Esse canal original selecionado B não será transmitido ao decodificador, mas será representado pelas informações colaterais de canal paramétrico calculadas pela calculadora 14 da Fig. 1.

[0070] Deve ser aqui notado que não é necessário transmitir valores de ganho como informações colaterais de canal. É também suficiente transmitir valores dependentes de freqüência relativos à energia absoluta do canal original selecionado. Depois, o decodificador deve calcular a energia real do canal downmix e o fator de ganho baseado na energia do canal downmix e na energia transmitida para o canal B.

[0071] A Fig. 5 mostra uma possível implementação de uma montagem de decodificador em conexão com um codificador de áudio perceptual baseado em transformada. Comparado com a Fig. 2, as funcionalidades do decodificador de entropia e do quantificador inverso 50 (Fig. 5) serão incluídas no bloco 24 da Fig. 2. A funcionalidade dos elementos conversores de freqüência/tempo 52a, 52b (Fig. 5) será, entretanto implementada no item 36 da Fig. 2. O elemento 50 da Fig. 5 recebe uma versão codificada do primeiro ou do segundo sinal downmix Lc' ou Rc'. Na saída do elemento 50, uma versão pelo menos parcialmente decodificada do primeiro e do segundo canais downmix está presente, sendo subseqüentemente denominada de canal A. O canal A é uma entrada em um seletor de banda de freqüência 54 para a seleção de uma determinada banda de freqüência do canal A. Essa banda selecionada de freqüência é pesada usando um multiplicador

Petição 870190031598, de 02/04/2019, pág. 36/40

31/34

56. O multiplicador 56 recebe, para a multiplicação, um determinado fator de ganho g_B, que é indicado para a banda de freqüência selecionada pelo seletor de banda de freqüência 54, que corresponde ao seletor de banda de freqüência 40 da Fig. 4 no lado do codificador. Na entrada do conversor freqüência tempo 52a, existe, juntamente com outras bandas, uma representação de domínio de freqüência do canal A. Na saída do multiplicador 56 e, em particular na entrada do meio de conversão freqüência/tempo 52b será reconstruída a representação de domínio de freqüência do canal B. Portanto, na saída do elemento 52a, será feita uma representação de domínio de tempo para o canal A, enquanto na saída do elemento 52b, haverá uma representação de domínio de tempo do canal B reconstruído.

[00 72] Deve ser aqui notado que, dependendo de uma determinada implementação, o canal downmix decodificado Lc ou Rc não tem playback em um decodificador ampliado multicanais. Em tal decodificador ampliado multicanais, os canais downmix decodificados são somente usados para reconstruir os canais originais. Os canais downmix originais são somente reproduzidos em decodificadores somente estéreo de menor escala.

[0073] Para isso, é feita referência à Fig. 9, que mostra a implementação preferida da presente invenção em um ambiente surround/mp3. Um bitstream surround ampliado mp3 é inserido em um decodificador mp3 padrão 24, que reproduz versões decodificadas dos canais downmix originais. Esses canais downmix podem então ser diretamente reproduzidos por meio de um decodificador de baixo nível. De maneira alternativa, esses dois canais são inseridos no dispositivo decodificador joint stereo

Petição 870190031598, de 02/04/2019, pág. 37/40

32/34 avançado 32, que também recebe os dados de extensão multicanais, que são, preferencialmente, inseridos no campo de dados auxiliares em um bitstream conforme mp3.

[0074] Subseqüentemente, é feita referência à Fig. 7 mostrando o agrupamento do canal original selecionado e o respectivo canal downmix ou canal downmix combinado. A esse respeito, a coluna direita da tabela da Fig. 7 corresponde ao canal A da Fig. 3A, 3B, 4 e 5, enquanto a coluna do meio corresponde ao canal B nessas figuras. Na coluna esquerda da Fig. 7, as respectivas informações colaterais de canal são explicitamente declaradas. De acordo com a tabela da Fig. 7, as informações colaterais de canal l_i do canal original esquerdo L

são calculadas usando	o	canal	downmix	esquerdo	Lc.	As
informações	colaterais	do	canal	surround	esquerdo	lsi	são
determinadas	por meio	do	canal	surround	esquerdo	original

selecionado Ls e o canal downmix esquerdo Lc é o portador. As informações colaterais do canal direito ri do canal direito original R são determinadas usando o canal downmix direito Rc. Além disso, as informações colaterais de canal do canal surround direito Rs são determinadas usando o canal downmix direito Rc como portador. Finalmente, as informações colaterais de canal ci do canal central C são determinadas usando o canal downmix combinado, que são obtidas por meio de uma combinação do primeiro e do segundo canais downmix, que podem ser facilmente calculadas tanto em um codificador como em um decodificador e que não exigem bits extra para transmissão.

[0075] Naturalmente, também é possível calcular as informações colaterais de canal para os canal esquerdo, por

Petição 870190031598, de 02/04/2019, pág. 38/40

33/34 exemplo, baseado em um canal downmix combinado ou mesmo em um canal downmix, que é obtido por uma adição pesada do primeiro e do segundo canais downmix, como 0,7 Lc e 0,3 Rc, enquanto os parâmetros de pesagem são conhecidos de um decodificador ou transmitidos de acordo. Para a maioria das aplicações, entretanto, será preferível somente derivar informações colaterais de canal para o canal central a partir do canal downmix combinado, i.e., a partir de uma combinação do primeiro e do segundo canais downmix.

[0076] Para demonstrar o potencial de economia de bits da presente invenção, é dado o seguinte exemplo típico. No caso de um sinal de áudio de cinco canais, um codificador comum precisa de uma taxa de bit de 64 kbit/s para cada canal, totalizando uma taxa de bit total de 320 kbit/s para o sinal dos cinco canais. Os sinais estéreo esquerdo e direito requerem uma taxa de bit de 128 kbit/s. As informações colaterais dos canais para um canal ficam entre 1,5 e 2 kbit/s. Portanto, mesmo em um caso em que sejam transmitidas as informações colaterais de canal dos cinco canais, esses dados adicionais somam-se a somente 7,5 a 10 kbit/s. Portanto, o conceito inventivo permite a transmissão de um sinal de áudio de cinco canais usando uma taxa de bit de 138 kbit/s (comparado a 320 (!) kbit/s) com boa qualidade, já que o decodificador não usa a problemática operação de dematrixing. Provavelmente ainda mais importante é o fato de que o conceito inventivo é totalmente compatível backward, já que cada um dos mp3 players pode reproduzir o primeiro canal downmix e o segundo canal downmix para produzir uma reprodução estéreo convencional.

Petição 870190031598, de 02/04/2019, pág. 39/40

34/34 [0077] Dependendo do ambiente da aplicação, o método inventivo para o processamento ou para o processamento inverso pode ser implementado em hardware ou software. A implementação pode ser um meio de armazenagem digital como um disco ou um CD com sinais de controle de leitura eletrônica, que pode cooperar com um sistema de computador programável de maneira que o método do invento para o processamento ou o processamento inverso seja realizado. No geral, portanto, a invenção também se relaciona com um produto de programa de computador dotado de um código de programa armazenado em um portador com leitura por máquina, o código do programa sendo adaptado para realizar o método inventivo, quando o produto de programa de computador opera em um computador. Em outras palavras, a invenção, portanto, também se relaciona com um programa de computador dotado de um código de programa para a realização do método, quando o programa de computador é operado em um computador.

Claims

R E I V I N D I C A Ç Õ E S

1. Equipamento para o processamento inverso dos dados de entrada, os dados de entrada incluindo informações colaterais de canal, um canal downmix esquerdo ou um sinal derivado do canal downmix esquerdo e um canal downmix direito ou um sinal derivado do canal downmix direito, onde o canal downmix esquerdo e o canal downmix direito se derivam de pelo menos três canais originais de um sinal de áudio multicanais e resultado, quando reproduzido, em uma representação estéreo do sinal de áudio multicanais, e onde as informações colaterais de canal são calculadas de maneira que um canal downmix ou um canal downmix combinado incluindo o canal downmix esquerdo e o canal downmix direito, quando pesados usando as informações colaterais de canal, resultam em uma aproximação do canal original selecionado, o equipamento compreendendo:

uma leitora de dados de entrada (24) para ler os dados de entrada para obter o canal downmix esquerdo ou um sinal derivado do canal downmix esquerdo e o canal downmix direito ou a sinal derivado do canal downmix direito e as informações colaterais de canal; e um reconstrutor de canais (32) para a reconstrução da aproximação do canal original selecionado usando as informações colaterais de canal e o canal downmix ou o canal downmix combinado para obter a aproximação do canal original selecionado,

Petição 870180134901, de 26/09/2018, pág. 43/116
2/3 caracterizado pelo reconstrutor (32) de canal ser configurado para reconstruir a aproximação de um canal direito original selecionado usando informação colateral de canal direito.

2. Equipamento em conformidade com a reivindicação 1, caracterizado pelo fato de compreender ainda um decodificador perceptual (24) para a decodificação do sinal derivado do canal downmix esquerdo para obter a versão decodificada do canal downmix esquerdo e para a decodificação do sinal derivado do canal downmix direito para obter uma versão decodificada do canal downmix direito.
3. Equipamento em conformidade com a reivindicação 1 ou 2, caracterizado pelo fato de compreender ainda um combinador para combinar o canal downmix esquerdo e o canal downmix direito para obter o canal downmix combinado.
4. Método para o processamento inverso dos dados de entrada, o método incluindo informação colateral do canal, um canal de downmix esquerdo ou um sinal derivado do canal de downmix esquerdo e um canal de downmix direito ou um sinal derivado do canal de downmix direito, onde o canal de downmix esquerdo e o canal de downmix direito serem derivados de, pelo menos, três canais originais de um sinal de áudio multicanal e resultado, quando reproduzido, em uma representação estéreo do sinal de áudio multicanal e em que a informação colateral do canal é calculada, de modo que um

Petição 870180134901, de 26/09/2018, pág. 44/116

3/3 canal de downmix ou um canal de downmix combinado, incluindo o canal de downmix esquerdo e o canal de downmix direito, quando ponderados utilizando a informação colateral do canal, resulte em uma aproximação do canal original selecionado, o método compreendendo:

leitura (24) dos dados de entrada para obter o canal de downmix esquerdo ou um sinal derivado do canal de downmix esquerdo e o canal de downmix direito ou um sinal derivado do canal de downmix direito e a informação colateral do canal; e reconstrução (32) da aproximação do canal original selecionado, utilizando a informação colateral do canal e do canal de downmix ou do canal de downmix combinado para obter a aproximação do canal original selecionado;

caracterizado pelo reconstrutor (32) de canais ser configurado para reconstruir a aproximação de um canal direito original selecionado usando informação colateral de canal direito.