Relatório Descritivo da Patente de Invenção para "NÚMERO REDUZIDO DE DECODIFICAÇÃO DE CANAIS".
CAMPO DA INVENÇÃO
A presente invenção refere-se à decodificação de sinais de áu- dio e, em particular, à decodificação de uma mixagem descendente em múl- tiplos canais paramétricos de um sinal em múltiplos canais original em um número de canais menor que o número de canais do sinal em múltiplos ca- nais original.
ANTECEDENTES DA INVENÇÃO E TÉCNICA ANTERIOR
O desenvolvimento recente de codificação de áudio tornou dis- ponível a capacidade de recriar uma representação em múltiplos canais de um sinal de áudio com base em um sinal estéreo (ou mono) e que corres- ponde aos dados de controle. Estes métodos se diferenciam das soluções baseadas em matriz mais velha, tal como Dolby Prologic, uma vez que o dado de controle adicional é transmitido para controlar a recriação, também referida como mixagem ascendente, dos canais surround baseados nos ca- nais mono ou estéreo transmitidos.
Portanto, tal decodificador de áudio em múltiplos canais paramé- tricos, por exemplo, MPEG Surround, reconstrói canais N baseados em ca- nais transmitidos M, onde N > M, e o dado de controle adicional. O dado de controle adicional representa uma taxa de dados significativamente mais baixa que a transmissão de todos os canais N, tornando a codificação muito eficiente enquanto assegura ao mesmo tempo a compatibilidade tanto com os dispositivos de canal M como os dispositivos de canal N.
Estes métodos de codificação surround paramétrica compreen- dem geralmente uma parametrização do sinal surround baseado em HD (Di- ferença de Intensidade Entre Canais) e ICC (Coerência Entre Canais). Estes parâmetros descrevem as razões de energia e a correlação entre os pares de canais no processo de mixagem ascendente. Os parâmetros adicionais também usados na técnica anterior compreendem os parâmetros de previ- são usados para prever os canais de saída ou intermediários durante o pro- cedimento de mixagem ascendente. Dois exemplos conhecidos de tal codificação em múltiplos ca- nais consistem na codificação BCC e MPEG surround. Na codificação BCC, inúmeros canais de entrada são convertidos em uma representação espec- tral que usa uma transformada baseada em DFT (Transformada de Fourier Discreta) com janelas sobrepostas. O espectro uniforme resultante é, então, dividido em partições não sobrepostas. Cada partição tem uma largura de banda proporcional à largura de banda retangular equivalente (ERB). Então, os parâmetros espaciais chamados de ICLD (Diferença de Nível Entre Ca- nais) e ICTD (Diferença de Tempo Entre Canais) são avaliados para cada partição. O parâmetro ICLD descreve uma diferença de nível entre dois ca- nais e o parâmetro ICTD descreve a diferença de tempo (deslocamento de fase) entre dois sinais de canais diferentes. As diferenças de nível e as dife- renças de tempo são fornecidas para cada canal com relação a um canal de referência comum. Após a derivação destes parâmetros, os parâmetros são quantizados e codificados para transmissão.
Os parâmetros individuais são avaliados com relação a um único canal de referência na codificação BCC. Em outros sistemas de codificação surround paramétrica, por exemplo, em MPEG surround, uma parametriza- ção estruturada em árvore é usada. Isto significa que os parâmetros não são mais avaliados com relação a um único canal de referência comum, mas com relação aos canais de referência diferentes que podem ainda ser uma combinação de canais do sinal em múltiplos canais original. Por exemplo, tendo um sinal de canal 5.1, os parâmetros podem ser avaliados entre uma combinação dos canais anteriores e entre uma combinação dos canais pos- teriores.
Certamente, uma compatibilidade com a versão anterior para padrões de áudio já estabelecidos é altamente desejável também para os esquemas de codificação paramétrica. Por exemplo, tendo um sinal mono de mixagem descendente é desejável também fornecer uma possibilidade de criar um sinal de reprodução estéreo com alta fidelidade. Isto significa que um sinal de mixagem descendente monofônica ser mixado ascendentemen- te em um sinal estéreo, tornando o uso dos parâmetros adicionalmente transmitidos do melhor modo possível.
Um problema comum na codificação em múltiplos canais consis- te na preservação de energia na mixagem ascendente, à medida que a per- cepção humana da posição espacial de uma fonte sonora é dominada pela intensidade do sinal, isto é, pela energia contida no sinal. Portanto, deve-se tomar cuidado na reprodução do sinal para atribuir a intensidade correta pa- ra cada canal reconstruído, tal como para evitar a introdução de artefatos que reduzem muito a qualidade perceptiva do sinal reconstruído. À medida que as amplitudes de mixagem descendente dos sinais são comumente so- madas, a possibilidade de interferência aumenta, sendo descrita através do parâmetro de correlação ou coerência.
Quando o mesmo se volta para a reconstrução de um número reduzido de canais (um número de canais menor que o número de canais original do sinal em múltiplos canais), os esquemas tipo BCC são simples de se lidar, uma vez que todo parâmetro e transmitido com relação ao mesmo canal de referência único. Portanto, tendo o conhecimento do canal de refe- rência, a informação de nível mais relevante (medida de energia absoluta) pode ser facilmente derivada para cada canal necessário para a mixagem ascendente. Deste modo, o número reduzido de canais pode ser reconstruí- do sem a necessidade de reconstruir o sinal em múltiplos canais completo primeiro. Deste modo, a computação de energia para as energias do sinal em múltiplos canais é mais fácil no BCC usando-se variáveis únicas em vez produtos de variáveis, porém esta é somente uma primeira etapa. Quando se tornam as energias e correlações de derivação de um número reduzido de canais tão próximas quanto possível das mixagens descendentes parciais dos sinais em múltiplos canais originais, o nível de dificuldade no MPEG Sur- round e BCC é comparável. Em contraste a isto, uma estrutura baseada em árvore como MPEG surround usa uma parametrização na qual a informação relevante para cada canal individual não é contida em um único parâmetro. Portanto, na técnica anterior, reconstruir número reduzidos de canais requer a reconstrução do sinal em múltiplos canais seguida por uma mixagem des- cendente nos números reduzidos de canais para não violar o requerimento de preservação de energia. Isto apresenta a desvantagem óbvia da comple- xidade computacional extremamente alta.
O Pedido de Patente Internacional WO 2005/101370 descreve uma abordagem particular de codificação de múltiplos canais de dados em um canal monofônico e uma informação lateral associada, tendo informação sobre as propriedades espaciais do sinal original de múltiplos canais. Quan- do transmitindo ambos canal de mixagem descendente e informação lateral, um decodificador apropriado é capaz de reconstruir uma aproximação do sinal original de múltiplos canais que constituiu a base para a geração da mixagem descendente e os parâmetros.
A parametrização é escolhida de modo que combinações espe- cíficas de canal dos canais originais podem ser reproduzidas sem utilizar todos os parâmetros transmitidos, de modo que a complexidade computa- cional na reconstrução pode ser reduzida quando, por exemplo, somente os canais frontais (o canal esquerdo, o de centro e o canal direito) de um sinal de canal 5.1 devem ser reconstruídos.
SUMÁRIO DA INVENÇÃO
Um objetivo da presente invenção é proporcionar um conceito para obter um número reduzido de canais de um sinal em múltiplos canais paramétrico de maneira mais eficiente.
De acordo com um primeiro aspecto da presente invenção, este objetivo é atingido por um calculador de parâmetro que deriva parâmetros de mixagem ascendente para mixar ascendentemente um sinal de mixagem descendente em uma representação de canal intermediário de um sinal em múltiplos canais que têm mais canais que o sinal de mixagem descendente e menos canais que o sinal em múltiplos canais, o sinal de mixagem descen- dente que tem associado a este, parâmetros em múltiplos canais que des- crevem propriedades espaciais do sinal em múltiplos canais, sendo que o sinal em múltiplos canais inclui canais não incluídos na representação de canal intermediário e sendo que os parâmetros em múltiplos canais incluem informações sobre os canais não incluídas na representação de canal inter- mediário, o calculador de parâmetro compreende: um recalculador de parâ- metro para derivar os parâmetros de mixagem ascendente a partir dos pa- râmetros em múltiplos canais que usam os parâmetros que têm informações sobre os canais não incluídas na representação de canal intermediário. De acordo com um segundo aspecto da presente invenção, este objetivo é atin- gido por um reconstrutor de canal que tem um reconstrutor de parâmetro, que compreende: um calculador de parâmetro para derivar parâmetros de mixagem ascendente para mixar ascendentemente um sinal de mixagem descendente em uma representação de canal intermediário de um sinal em múltiplos canais que têm mais canais que o sinal de mixagem descendente e menos canais que o sinal em múltiplos canais, o sinal de mixagem descen- dente tem associado a este, parâmetros em múltiplos canais que descrevem as propriedades espaciais do sinal em múltiplos canais, sendo que o sinal em múltiplos canais inclui canais não incluídos na representação de canal intermediário e sendo que os parâmetros em múltiplos canais incluem in- formações sobre os canais não incluídas na representação de canal inter- mediário, o calculador de parâmetro compreende: um recalculador de pa- râmetro para derivar os parâmetros de mixagem ascendente dos parâme- tros em múltiplos canais que usam os parâmetros que têm informações sobre os canais não incluídas na representação de canal intermediário; e um mixador ascendente para derivar a representação de canal intermediá- rio que usa os parâmetros de mixagem ascendente e o sinal de mixagem descendente.
De acordo com um terceiro aspecto da presente invenção, este objetivo é atingido por um método para geração de parâmetros de mixagem ascendente para mixar ascendentemente um sinal de mixagem descendente em uma representação de canal intermediário de um sinal em múltiplos ca- nais que têm mais canais que o sinal de mixagem descendente e menos canais que o sinal em múltiplos canais, o sinal de mixagem descendente tem associado a este, parâmetros em múltiplos canais que descrevem as propri- edades espaciais do sinal em múltiplos canais, sendo que o sinal em múlti- plos canais inclui canais não incluídos na representação de canal intermedi- ário e sendo que os parâmetros em múltiplos canais incluem informações sobre os canais não incluídas na representação de canal intermediário, o método compreende: derivar os parâmetros de mixagem ascendente dos parâmetros em múltiplos canais que usam parâmetros que têm informações sobre os canais não incluídas na representação de canal intermediário. De acordo com um quarto aspecto da presente invenção, este objetivo é atingi- do por receptor de áudio ou reprodutor de áudio, o receptor ou reprodutor de áudio tem um calculador de parâmetro para derivar parâmetros de mixagem ascendente para mixar ascendentemente um sinal de mixagem descendente em uma representação de canal intermediário de um sinal em múltiplos ca- nais que têm mais canais que o sinal de mixagem descendente e menos canais que o sinal em múltiplos canais, o sinal de mixagem descendente tem associado a este, parâmetros em múltiplos canais que descrevem as propri- edades espaciais do sinal em múltiplos canais, sendo que o sinal em múlti- plos canais inclui canais não incluídos na representação de canal intermedi- ário e sendo que os parâmetros em múltiplos canais incluem informações sobre os canais não incluídas representação de canal intermediário, o calcu- lador de parâmetro compreende: um recalculador de parâmetro para derivar os parâmetros de mixagem ascendente dos parâmetros em múltiplos canais que usam os parâmetros que têm informações sobre os canais não incluídas na representação de canal intermediário.
De acordo com um quinto aspecto da presente invenção, este objetivo é atingido por um método de recepção ou reprodução de áudio, o método tem um método para geração de parâmetros de mixagem ascenden- te para mixar ascendentemente um sinal de mixagem descendente em uma representação de canal intermediário de um sinal em múltiplos canais que têm mais canais que o sinal de mixagem descendente e menos canais que o sinal em múltiplos canais, o sinal de mixagem descendente tem associado a este, parâmetros em múltiplos canais que descrevem as propriedades espa- ciais do sinal em múltiplos canais, sendo que o sinal em múltiplos canais inclui canais não incluídos na representação de canal intermediário e sendo que os parâmetros em múltiplos canais incluem informações sobre os canais não incluídas na representação de canal intermediário, o método compreen- de: derivar os parâmetros de mixagem ascendente dos parâmetros em múl- tiplos canais que usam os parâmetros que têm informações sobre os canais não incluídas na representação de canal intermediário. A presente invenção é baseada na descoberta de que uma representação de canal intermediário de um sinal em múltiplos canais pode ser reconstruída de maneira mais efi- ciente e com alta fidelidade, quando os parâmetros de mixagem ascendente para mixar ascendentemente uma mixagem descendente de sinal transmiti- do para a representação de canal intermediário são derivados, o que permite a mixagem ascendente que usa os mesmo algoritmos mixar ascendente- mente como os que se encontram dentro da reconstrução em múltiplos ca- nais. Isto pode ser atingido quando um recalculador parâmetro é usado para derivar os parâmetros de mixagem ascendente que também levam em con- sideração os parâmetros que têm informações sobre os canais não incluídas na representação de canal intermediário.
Em uma modalidade da presente invenção, um decodificador é capaz de reconstruir um sinal de saída estéreo a partir de uma mixagem descendente paramétrica de um sinal em múltiplos canais com 5 canais, a mixagem descendente paramétrica compreende uma mixagem descendente de sinal monofônico e é associado aos parâmetros em múltiplos canais. De acordo com a invenção, os parâmetros espaciais são combinados para deri- varem os parâmetros de mixagem ascendente para a mixagem ascendente de um sinal estéreo, sendo que a combinação também leva em considera- ção os parâmetros em múltiplos canais não associados ao canal anterior esquerdo ou do canal anterior direito. Portanto, à medida que as energias para os canais estéreos mixados ascendentemente podem ser derivadas e uma medida de coerência entre o canal esquerdo e direito pode ser derivada levando em consideração uma reconstrução de estéreo perfeita do sinal em múltiplos canais. Além disso, um parâmetro ICC e um parâmetro CLD são derivados levando em consideração um mixar ascendentemente que usa os algoritmos e implementações já existentes. Usar os parâmetros de canais não associados aos canais estéreo reconstruídos levando em consideração a preservação da energia dentro do sinal com precisão mais alta. Isto é de máxima importância, à medida que as variações de intensidade não contro- ladas atrapalham a qualidade do sinal de reprodução.
Geralmente, a aplicação do conceito inventivo permite uma re- construção de um estéreo de mixagem ascendente a partir de um uma mi- xagem monodescendente de um sinal em múltiplos canais sem a necessi- dade de uma reconstrução intermediária completa do sinal em múltiplos ca- nais, como nos métodos da técnica anterior. Evidentemente, a complexidade computacional no lado do decodificador pode ser, deste modo, significativa- mente reduzida. Usar parâmetros em múltiplos canais também associados aos canais não incluídos na mixagem ascendente (isto é, o canal anterior esquerdo e o canal anterior direito) leva em consideração uma reconstrução que não introduz quaisquer variações de artefatos ou intensidade mas, em vez disso, conserva a energia do sinal perfeitamente. Para ser mais especí- fico, a razão da energia entre o canal reconstruído esquerdo e o direito é calculado a partir de inúmeros parâmetros em múltiplos canais disponíveis, levando em consideração também os parâmetros em múltiplos canais não associados ao canal anterior esquerdo e canal anterior direito. Evidentemen- te, a razão de intensidade entre o canal reconstruído esquerdo e o direito (ascendentemente mixada) é dominante com relação à qualidade ouvida do sinal estéreo reconstruído. Sem usar o conceito inventivo uma reconstrução de canais que têm a razão de energia precisamente correta não é possível nas estruturas baseadas em árvore discutidas neste documento.
Portanto, a implementação do conceito inventivo leva em consi- deração uma reprodução estéreo de alta qualidade de uma mixagem des- cendente de um sinal em múltiplos canais baseado em parâmetros em múl- tiplos canais, que não são derivados para uma reprodução precisa de um sinal estéreo.
Deve-se notar que o conceito inventivo também pode ser usado quando o número de canais reproduzido for diferente de dois, por exemplo, quando um canal central também deve ser reconstruído com alta fidelidade, como é o caso de alguns ambientes de reprodução.
Uma revisão mais detalhada dos esquemas de codificação em múltiplos canais da técnica anterior (particularmente de estruturas baseadas em árvore) será fornecida seguindo o esboço do benefício do conceito inven- tivo.
BREVE DESCRIÇÃO DOS DESENHOS
As modalidades da presente invenção são subseqüentemente descritas referindo-se aos desenhos delimitados, onde:
A Figura 1 mostra exemplos de parametrizações baseadas em árvore;
A Figura 2 mostra exemplos de esquemas de decodificação es- truturados em árvore;
A Figura 3 mostra um exemplo de um decodificador de múltiplos canais da técnica anterior;
A Figura 4 mostra exemplos de decodificadores da técnica ante- rior;
A Figura 5 mostra um exemplo da reconstrução de estéreo da técnica anterior de um sinal em múltiplos canais de mixagem descendente;
A Figura 6 mostra um diagrama em bloco de um exemplo de um calculador de parâmetro inventivo;
A Figura 7 mostra um exemplo para um reconstrutor de canal inventivo; e
A Figura 8 mostra um exemplo de um receptor ou reprodutor de áudio inventivo.
DESCRIÇÃO DETALHADA DAS MODALIDADES PREFERIDAS
O conceito inventivo será descrito a seguir principalmente com relação à codificação MPEG, porém, também é aplicável em outros esque- mas baseados na codificação paramétrica de sinais em múltiplos canais. As modalidades descritas abaixo são meramente ilustrativas dos princípios da presente invenção para o número reduzido de decodificação de canais para sistemas de múltiplos canais estruturados em árvore. Entende-se que as modificações e variações das disposições e dos detalhes descritos no pre- sente documento serão aparentes para aqueles versados na técnica. Portan- to, pretendem ser limitadas somente pelo escopo das reivindicações de pa- tente iminentes e não pelos detalhes específicos apresentados por meio de descrição e explicação das modalidades do presente documento.
Conforme mencionado acima, em alguns sistemas de codifica- ção surround paramétrica, por exemplo MPEG Surround, uma parametriza- ção estruturada em árvore é usada. Tal parametrização é delineada nas Fi- guras 1 e 2.
A Figura 1 mostra dois meios de parametrizar um cenário de áu- dio de canal 5.1 padrão, que tem um canal anterior esquerdo 2, um canal central 3, um canal anterior direito 4, um canal surround esquerdo 5 e um canal surround direito 6. De maneira opcional, um canal de acentuação de baixa freqüência 7 (LFE) também pode estar presente.
Geralmente, os canais individuais ou pares de canal são carac- terizados com relação uns aos outros através dos parâmetros em múltiplos canais, tal como por exemplo, um parâmetro correlação ICC e um parâmetro de nível CLD. As possíveis parametrizações serão brevemente explicadas no parágrafo a seguir, os esquemas de decodificação estruturados em árvo- re resultantes são, então, ilustrados na Figura 2.
No exemplo mostrado no lado esquerdo da Figura 1 (parametri- zação 5-1 -5i), o sinal em múltiplos canais é caracterizado por parâmetros CLD e ICC que descrevem a relação entre o canal surround esquerdo 5 e o canal surround direito 6, o canal anterior esquerdo 2 e o canal anterior direito 4 e entre o canal central 3 e o canal de acentuação de baixa freqüência 7. Entretanto, à medida que toda a configuração deve ser mixada descenden- temente em um único canal mono, para uma descrição completa do conjunto de canais, são requeridos parâmetros adicionais. Portanto, os parâmetros adicionais (CLDi, ICCi) que são usados, referem-se a uma combinação do alto-falante LFE 7 e do alto-falante central 3 para uma combinação do canal anterior esquerdo 2 e do canal anterior direito 4. Além disso, um conjunto adicional de parâmetros (CLD0, ICC0) é requerido, aqueles parâmetros que descrevem uma relação entre os canais surround combinados 5 e 6 e o res- to dos canais do sinal em múltiplos canais.
Na parametrização no lado direito (parametrização 5-1-52) são usados os parâmetros que referem-se ao canal anterior esquerdo 2 e o ca- nal surround esquerdo 5, ao canal anterior direito 4 e o canal surround direito 6 e ao canal central 3 e o canal de acentuação de baixa freqüência 7. Os parâmetros adicionais (CLD1 e ICC1) descrevem uma combinação dos ca- nais esquerdos 2 e 5 com relação a uma combinação dos canais direitos 4 e 6. Um conjunto adicional de parâmetros (CLD0 e ICC0) descreve a relação de uma combinação do canal central 3 e do canal LFE 7 com relação a uma combinação dos canais restantes.
A Figura 2 ilustra os conceitos de codificação que sustentam as diferentes parametrizações da Figura 1. No lado do decodificador, os módu- los autodenominados OTT (Um Para Dois) são usados em uma estrutura tipo árvore. Cada módulo OTT mixa ascendentemente um mono-sinal em dois sinais de saída. Quando ocorre a decodificação, os parâmetros para caixas OTT precisam ser aplicados na ordem inversa à codificação. Portan- to, na estrutura de árvore 5-1-51, o módulo OTT 20, que recebe o sinal de mixagem descendente 22 (M) é operativo para usar os parâmetros CLD0 e ICC0 para derivar dois canais, um sendo uma combinação do canal surround esquerdo 5 e do canal surround direito 6 e o outro canal sendo ainda uma combinação dos canais restantes do sinal em múltiplos canais.
Conseqüentemente, o módulo OTT 24 deriva, usando CLD1 e ICC1, o primeiro canal que é um canal combinado do canal central 3 e do canal de baixa freqüência 7 e um segundo canal que é uma combinação do canal anterior esquerdo 2 e do canal anterior direito 4. Da mesma maneira, o módulo OTT 26 deriva o canal surround esquerdo 5 e o canal surround direi- to 6, usando CLD2 e ICC2. O módulo OTT 27 deriva o canal central 3 e o canal de baixa freqüência 7, usando CLD4 e o módulo OTT 28 deriva o canal anterior esquerdo 2 e o canal anterior direito 4, usando CLD3 e ICC3. Final- mente, uma reconstrução do conjunto completo de canais 30 é derivada de um único de mixagem descendente monofônica 22. Para a estrutura de ár- vore 5-1-52, o esboço do módulo OTT é equivalente à estrutura de árvore 5- Ι-5-1. Entretanto, os únicos módulos OTT derivam de diferentes combinações de canal, as combinações de canal que correspondem à parametrização delineada na Figura 1 para o caso 5-1-52-
Torna-se evidente a partir das Figuras 1 e 2, que a estrutura de árvores das diferentes parametrizações é apenas uma visualização para a parametrização usada. Além disso, é importante notar que os parâmetros individuais são parâmetros que descrevem uma relação entre diferentes ca- nais em contraste, por exemplo, ao esquema de codificação BCC, sendo que os parâmetros similares são derivados com relação a um único canal de referência.
Portanto, nas parametrizações mostradas, os canais individuais não podem ser simplesmente derivados usando os parâmetros associados às caixas OTT na visualização, porém alguns ou todos os parâmetros res- tantes precisam ser adicionalmente levados em conta.
A estrutura de árvore da parametrização é apenas uma visuali- zação para um fluxo ou processamento de sinal real mostrado na Figura 3, que ilustra a mixagem ascendente de um número baixo transmitido de ca- nais obtido pela multiplicação de matriz. A Figura 3 mostra a decodificação baseada em um canal de mixagem descendente recebido 40. O canal des- cendentemente mixado 40 é lançado em um bloco de mixagem ascendente 42 que deriva do sinal em múltiplos canais reconstruído 44, sendo que a composição de canal difere entre as parametrizações usadas. Entretanto, os elementos de matriz da matriz usada pelo bloco de reconstrução 42 são dire- tamente derivados da estrutura de árvore. O bloco de reconstrução 42 pode, somente para propósitos ilustrativos, ser adicionalmente decomposto em uma matriz pré-decorrelatora 46, que deriva sinais descorrelacionados adi- cionais do canal transmitido 40. Estes são, então, lançados em uma matriz de mixagem 48 que deriva os sinais em múltiplos canais 44 mixando-se os canais de entrada individuais.
Conforme mostrado na Figura 4, uma abordagem direta para reduzir o número de canais reconstruído pode ser simplesmente "podar" a árvore de uma a duas caixas. A Figura 4 ilustra uma possível poda das árvo- res por linhas tracejadas, os módulos de omissão de poda de OTT no lado direito da árvore durante a reconstrução reduz, deste modo, o número de canais de saída. Entretanto, usar as parametrizações da técnica anterior mostradas nas Figuras 1 e 2, introduzidas porque oferecem codificação de taxa de bit baixa na maior qualidade possível, a poda simples não é possível para obter uma saída estéreo que representa uma mixagem descendente esquerda e uma mixagem descendente direita do sinal em múltiplos canais original de maneira adequada. A Figura 5 mostra uma abordagem da técnica anterior que cria uma saída estéreo dos sinais descritos acima, usando a abordagem óbvia que reconstrói primeiro o sinal em múltiplos canais com- pletamente, antes de mixar descendentemente, de maneira subseqüente, o sinal na representação estéreo que usa um mixador descendente adicional 60. Isto evidentemente apresenta diversas desvantagens, tal como alta com- plexidade e qualidade de som inferior.
Uma solução para o problema mencionado acima para obter a saída estéreo de uma mixagem mono descendente e parâmetros surround paramétricos em uma parametrização que não sustenta naturalmente a "po- da" em uma saída estéreo será em seguida derivada para o caso geral. Este é seguido por duas modalidades específicas que mostram o uso do conceito inventivo nas parametrizações descritas acima. Deste modo, as soluções são proporcionadas para o problema de obtenção de saída estéreo de uma mixagem mono descendente e parâmetros surround paramétricos em uma parametrização que não que não sustenta a "poda" em uma saída estéreo.
A abordagem geral do recálculo de parâmetro será delineada abaixo. Em particular, a mesma se aplica ao caso de computação de parâ- metros de saída estéreo de um número absoluto de múltiplos canais de ca- nais de áudio N. Além disso, presume-se que o sinal de áudio seja descrito por uma representação de sub-banda, derivado usando um banco de filtro que pode ser modulado com valor real ou complexo.
Permitir que todos os sinais considerados sejam vetores finitos de amostras de sub-banda que correspondem a um título de freqüência de tempo definido pelos parâmetros espaciais e permitir que as amostras de sub-banda de um sinal de áudio de múltiplos canais reconstruído y seja for- mado a partir de amostras de sub-banda de canais de áudio m1,m2,...,mM e amostras de sub-banda descorrelacionadas de canais de áudio d-i,d2.....dD de acordo com a operação de mixagem ascendente de matriz
y =Rx, onde
<formula>formula see original document page 15</formula>
Todos os sinais são observados como vetores de linha. A matriz R é do tamanho N x (M+D) e representa o efeito combinado das matrizes M1 e M2 da Figure 3 e tal como o bloco de mixagem superior 42. Um método geral para atingir parâmetros de energia e correlação adequados de uma versão mixada descendentemente para canais N0 das amostras de sub- banda sinal de áudio de múltiplos canais original serve para formar a matriz de covariância da mixagem descendente virtual definida por uma matriz N dè mixagem descendente ND x N, yD = Dy.
Esta matriz de covariância pode ser computada pela multiplica- ção com o conjugado complexo transposto para ser
yDyD*=Dyy*D =DRxx*R*D*,
onde a matriz de covariância interna xx é freqüentemente conhecida a partir das propriedades de decorrelatores e dos parâmetros transmitidos.
Um caso especial importante onde este se mantém verdadeiro serve para M=1, e freqüentemente esta matriz de covariância interna é, en- tão, realmente igual à matriz de identidade de tamanho M+D. Como uma conseqüência, para uma saída estéreo onde ND=2, os parâmetros CLD e ICC podem ser lidos a partir de
<formula>formula see original document page 15</formula>
no caso em que <formula>formula see original document page 16</formula>
Nota-se que aqui e a seguir, a seguinte notação é aplicada. Para os vetores complexos x,y , o produto interno complexo e a norma quadrada são definidos por
<formula>formula see original document page 16</formula>
em que o asterisco denota a conjugação complexa.
Subseqüentemente, duas modalidades da presente invenção devem ser derivadas para as parametrizações diferentes (5-1-5i e 5-l-52) mostradas nas Figuras 1 e 2. Nas modalidades da presente invenção ensi- na-se que para sinais estéreos de saída baseados em uma mixagem mono descendente e que corresponde aos parâmetros surround MPEG (parâme- tros em múltiplos canais), os parâmetros de mixagem ascendente precisam ser recalculados em um único conjunto de parâmetros CLD e ICC que po- dem ser usados em uma mixagem ascendente direta de um sinal estéreo a partir de um sinal mono.
Além disso, presume-se o processamento dos canais de áudio individuais é feito no sentido do quadro, isto é, em porções de tempo distin- tas. Deste modo, quando se fala sobre forças ou energias contidas em um canal, o termo "força" ou "energia" deve ser entendido como a energia ou força contida em um quadro de um canal específico.
Geralmente, os parâmetros como, por exemplo CLD e ICC, tam- bém são validos para um único quadro. Tendo um quadro com valores de amostra k a„ a energia E dentro do quadro pode ser, por exemplo, represen- tada pela soma quadrada dos valores de amostra de sub-banda dentro do quadro:
<formula>formula see original document page 16</formula>
As diferenças de nível de canal (CLD) transmitidas e usadas pa- ra o cálculo dos parâmetros de mixagem ascendente mixar ascendentemen- te o sinal de mixagem descendente M em uma representação de canal in- termediário (estéreo) do sinal em múltiplos canais são definidas da seguinte forma
<formula>formula see original document page 17</formula>
em que L0 e Ro denotam que a energia dos sinais na questão dentro do qua- dro para o parâmetro CLD deve ser derivada.
Portanto, para o caso 5-l-5i, os quatro parâmetros CLD CLDx, X=O,1,2,3, podem ser usados para obter as energias de canal normalizadas pela energia do canal de mixagem mono descendente m. Lf = (C10C11C13)2, Rf = (C10C11C23)2 C = (C10C21)2 Ls = (C20C12)2 Rs = (C20C22)2
Os ganhos de canal são definidos por
<formula>formula see original document page 17</formula>'
O objetivo final é derivar os canais estéreos 10 e r0 no sentido de que avaliações apropriadas das energias normalizadas e da correlação dos canais estéreos (representação de canal intermediário) formados por
l0 = l + cq, com I0 = G(lf + /J1 de modo que L0= Lf + Ls, r0 = l + cq com r = G(rf + rj, de modo que R = Rf +Rs,
são encontrados, onde o peso de mixagem descendente central é q = 1 V2 . As energias computadas a partir desta suposição fornecem o resultado
L0= L + q2C + 2Re{l,qc) ,
R0 = R +q2 C+ 2Re(r,qc),
Revela-se mais vantajoso presumir que tanto o canal esquerdo combinado/como o canal direito combinado r não são correlacionados com o canal central c, em vez de tentarem incorporar a informação de correlação transportada pelos parâmetros ICC, X = 0,1. As energias normalizadas dos canais estéreo de saída são, portanto, avaliadas por
<formula>formula see original document page 18</formula>
Tendo as energias derivadas dos canais de saída, o parâmetro desejado CLD pode ser facilmente computado usando a definição do parâ- metro CLD dado acima.
De acordo com o conceito inventivo, um parâmetro ICC é deri- vado para permitir uma mixagem descendente estéreo. A correlação entre os dois canais de saída é definida pela seguinte expressão:
<formula>formula see original document page 18</formula>
Um conjunto atrativo de suposições simplificadas é aqui nova- mente o canal esquerdo combinado/e o canal direito combinado r não são correlacionados com o canal central c e, além disso, que os canais surround não são correlacionados com os canais anteriores. Estas suposições podem ser expressas por
<formula>formula see original document page 18</formula>
Este cálculo resultante para ρ depende dos dois parâmetros ICC ICCx , X = 2,3, que descreve as correlações esquerda/direita normalizadas
Que podem ser escritas como
<formula>formula see original document page 18</formula>
Deste modo, o valor de correlação final depende de inúmeros parâmetros dos múltiplos canais parametrização, que levam em considera- ção a reconstrução de ata fidelidade do sinal. O parâmetro ICC é finalmente derivado usando a seguinte fórmula:
<formula>formula see original document page 18</formula>
De acordo com o conceito inventivo, a distribuição de energia entre os canais reconstruídos é reconstruída com alta precisão. Entretanto, um escalonamento de energia global aplicado em ambos os canais pode ser adicionalmente desejado, para assegurar a preservação de energia total. À medida que a distribuição de energia relativa entre os canais é vital para a percepção espacial do sinal reconstruído, o escalonamento global pode de- teriorar a qualidade perceptiva do sinal reconstruído. Deve-se enfatizar que o escalonamento global é global apenas dentro de um parâmetro definido por posicionamento de tempo-freqüência. Isto significa que escalonamentos er- rados irão afetar localmente o sinal na escala de posicionamentos de parâ- metro. Em outras palavras tanto os ganhos de freqüência como os ganhos de tempo dependem dos ganhos que serão aplicados que conduzem tanto à colorização espectral como aos artefatos de modulação de tempo. Um fator de ajuste de ganho para o escalonamento global é necessário para assegu- rar que o processo de mixagem ascendente estéreo preserva a energia do canal de mixagem mono descendente m.
Entretanto, este fator é definido por g = √L0 + R0, que eqüivale a g=I para a configuração 5-1-51, já que L0 +R0 =U +Rs +C + Ls + Rs =1. Como uma modalidade adicional, a aplicação do conceito inventivo na estrutura de árvore 5-1 -52 será delineada nos parágrafos a seguir. Para a criação de um sinal estéreo de alta fidelidade, os dois primeiros CLD e conjuntos de parâ- metro ICC que correspondem às ramificações superiores da árvore são rele- vantes.
Os dois CLD CLDx para = 0,1, são usados primeiro para obter a energia de canal normalizada dos canais direito e esquerdo combinados e o canal central.
L = (C10C11)2,
R= (C10C21),
C = C220,
em que os ganhos de canal são definidos por
<formula>formula see original document page 19</formula>
O objetivo é derivar as energias e a correlação dos canais de mixagem descendente lo = l + cq, ro =l + cq
em que o peso de mixagem descendente central é q = √1/2 . As energias de computação desta suposição fornecem o resultado
L0 = L + q2C + 2Re(l,qc), R0 = R + q2C + 2 Re(r, qc).
Uma suposição vantajosa consiste no fato de que ambos os ICC entre os canais/e c entre os canais I e c são os mesmo que o ICCo fornecido entre os canais l+r e c. Esta suposição leva aos cálculos
Re(l,c) = ICC0√LC
R e{r,c) = ICC0√RC
de modo que os cálculos das energias normalizadas se tornem
<formula>formula see original document page 20</formula>
Como na modalidade precedente, que tem os valores L0 e R0, o parâmetro CLD desejado pode ser derivado:
<formula>formula see original document page 20</formula>
Derivando a correlação e finalmente o parâmetro ICC começa a partir da definição geral do valor de correlação:
<formula>formula see original document page 20</formula>
Toda a informação necessária é disponível a partir dos parâme- tros da estrutura de árvore 5-1 -52 uma vez que
<formula>formula see original document page 20</formula>
Os resultados finais podem ser escritos como
<formula>formula see original document page 20</formula> <formula>formula see original document page 21</formula>
O fator de ajuste de ganho requerido g é definido por:
<formula>formula see original document page 21</formula>.
Pode-se notar que os parâmetros adicionalmente gerados CLD e ICC podem ser adicionalmente quantizados, para permitir o uso de tabelas de pesquisa no decodificador para a criação de mixagem ascendente de ma- triz em vez de realizar os cálculos complexos. Isto aumenta adicionalmente a eficiência do processo de mixagem ascendente.
Geralmente, a mixagem ascendente é possível usando os módu- los OTT já existentes. Isto apresenta a vantagem de que o conceito inventivo pode ser facilmente implementado nos cenários de decodificação já existen- tes.
Geralmente, a matriz de mixagem ascendente pode ser descrita da seguinte forma:
<formula>formula see original document page 21</formula>
onde:
<formula>formula see original document page 21</formula>
e, onde:
<formula>formula see original document page 21</formula>
Portanto, tendo derivado de maneira inventiva os parâmetros CLD e ICC, a mixagem ascendente estéreo de uma mixagem descendente transmitida pode ser realizada com alta fidelidade usando os módulos de mixagem ascendente padrões. Em uma modalidade adicional da presente invenção, um reconstrutor de canal inventivo compreende um calculador de parâmetro para derivar parâmetros de mixagem ascendente e um mixador ascendente para derivar uma representação de canal intermediário que usa os parâmetros de mixagem ascendente e uma mixagem descendente de sinal transmitido.
O conceito inventivo é novamente delineado na Figura 6, que mostra calculador de parâmetro inventivo 502, que recebe inúmeros parâme- tros ICC 504 e inúmeros parâmetros CLD 506. De acordo com uma modali- dade da presente invenção, o calculador de parâmetro inventivo 502 deriva um único parâmetro CLD 508 e um único parâmetro ICC 510 para a recria- ção de um sinal estéreo, que também usa os parâmetros em múltiplos ca- nais (ICC e CLD) que têm informações sobre os canais não incluídos ou re- acionados aos canais da mixagem ascendente estéreo.
Pode-se notar que o conceito inventivo pode ser facilmente a- daptado aos cenários com uma mixagem ascendente que compreende mais de dois canais. A mixagem ascendente é, neste caso, geralmente definida como uma representação de canal intermediário do sinal em múltiplos ca- nais, sendo que a representação de canal intermediário tem mais canais que o sinal de mixagem descendente e menos canais que o sinal em múltiplos canais. Um cenário comum consiste em uma configuração na qual um canal central adicional é reconstruído.
A aplicação do conceito inventivo é novamente delineado na Fi- gura 7, que mostra um calculador de parâmetro inventivo 502 e uma a duas caixas OTT 520. A caixa OTT 520 recebe como entrada o sinal mono trans- mitido 522, já detalhado na Figura 6. O calculador de parâmetro inventivo 502 recebe diversos valores ICC 504 e diversos valores CLD 506 para deri- var um único parâmetro CLD 508 e um único parâmetro ICC 510.
Os únicos parâmetros CLD e ICC 508 e 510 são lançados no módulo OTT 520 para conduzir a mixagem ascendente do sinal de mixagem descendente monofônico 522. Deste modo, na saída do módulo OTT 520, um sinal estéreo 524 pode ser proporcionado como uma representação de canal intermediário do sinal em múltiplos canais.
A Figura 8 mostra um receptor ou reprodutor de áudio inventivo 600, que tem um decodificador de áudio inventivo 601, uma entrada de fluxo de bit 602 e uma saída de áudio 604. Um fluxo de bit pode ser lançado na entrada 602 do recep- tor/reprodutor de áudio inventivo 600. O decodificador 601, então, decodifica o fluxo de bit e o sinal decodificado é lançado ou reproduzido na saída 604 do receptor/reprodutor de áudio inventivo 600.
Embora o conceito inventivo tenha sido principalmente delineado com relação à codificação surround MPEG, certamente o mesmo não se limita de modo algum à aplicação do cenário de codificação paramétrica es- pecífico. Devido à alta flexibilidade do conceito inventivo, o mesmo também pode ser facilmente aplicado em outros esquemas de codificação, tais como as configurações de canal ou esquemas BCC 7.1 ou 7.2.
Embora as modalidades da presente invenção se refiram à codi- ficação MPEG que introduz algumas suposições simplificadas para a gera- ção do CLD comum e do parâmetro ICC, isto não é obrigatório. Certamente também é possível não introduzir estas simplificações.
Dependendo de certos requerimentos de implementação dos métodos inventivos, os métodos inventivos podem ser implementados em hardware ou em software. A implementação pode ser realizada usando um meio de armazenamento digital, em particular, um disco, DVD ou um CD que tem sinais de controle eletronicamente legíveis armazenados no mes- mo, que coopera com um sistema de computador programável, de modo que os métodos inventivos sejam realizados. Geralmente, a presente in- venção é, portanto, um produto de programa de computador com um códi- go de programa armazenado em uma portadora legível por máquina, sendo que o código de programa é operativo para realizar os métodos inventivos quando o produto de programa de computador executa em um computador. Em outras palavras, os métodos inventivos são, portanto, um programa de computador que tem um código de programa para realizar por um dos mé- todos inventivos quando o programa de computador executa em um com- putador.
Embora a invenção anteriormente mencionada tenha sido parti- cularmente mostrada e descrita com referência às modalidades particular da mesma, será entendido por aqueles versados na técnica que diversas outras alterações na forma e nos detalhes podem ser feitos sem sair do espírito e escopo da mesma. Deve-se entender que diversas alterações podem ser feitas para se adaptar às diferentes modalidades sem sair dos conceitos mais amplos descritos no presente documento e compreendido através das reivindicações a seguir.