BRPI1005360B1 - dispositivo upmixador - Google Patents

dispositivo upmixador Download PDF

Info

Publication number
BRPI1005360B1
BRPI1005360B1 BRPI1005360-3A BRPI1005360A BRPI1005360B1 BR PI1005360 B1 BRPI1005360 B1 BR PI1005360B1 BR PI1005360 A BRPI1005360 A BR PI1005360A BR PI1005360 B1 BRPI1005360 B1 BR PI1005360B1
Authority
BR
Brazil
Prior art keywords
signal
downmix
audio signal
upmix
upmixed
Prior art date
Application number
BRPI1005360-3A
Other languages
English (en)
Inventor
Matthias Neusinger
Julien Robilliard
Johannes Hilpert
Original Assignee
Fraunhofer - Gesellschaft Zur Foerderung Der Angewandten Forschung E.V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer - Gesellschaft Zur Foerderung Der Angewandten Forschung E.V filed Critical Fraunhofer - Gesellschaft Zur Foerderung Der Angewandten Forschung E.V
Priority claimed from PCT/EP2010/050287 external-priority patent/WO2010086218A1/en
Publication of BRPI1005360B1 publication Critical patent/BRPI1005360B1/pt

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

UPMIXADOR, MÉTODO E PROGRAMA DE COMPUTADOR PARA UPMIXAR UM SINAL DE ÁUDIO DOWNMIX Um upmixador para um sinal de áudio downmix em um sinal de áudio upmixado que des-creve um ou mais canais de audio upmixados que compreendem um aplicador de parâ-metro configurado para aplicar parâmetros de upmixagem para realizar o upmix o sinal de áudio downmix, a fim de obter o sinal de áudio upmixado. O aplicador de parâmetro é configurado para aplicar uma troca de fase ao sinal de áudio downmix para obter uma versão de fase trocada do sinal de áudio downmix, enquanto deixa um sinal descorre-lacionado inalterado pela troca de fase. O aplicador de parâmetro é configurado adicional-mente para combinar a versão de fase trocada do sinal de áudio downmix com o sinal descorrelacionado para obter o sinal de áudio upmixado.

Description

HISTÓRICO DA INVENÇÃO
As configurações, de acordo com a invenção, referem-se a um upmixador para upmixar um sinal de áudio downmix em um sinal de áudio upmixado que descreve um ou mais canais de áudio upmixados. Algumas configurações, de acordo com a invenção, referem-se a um método e a um programa de computador para upmixar um sinal de áudio downmix.
Algumas configurações, de acordo com a invenção, referem-se a um processamento de fase melhorado para codificação de áudio de multicanais paramétrica.
A seguir, será dada uma breve visão geral e o contexto da invenção será descrito. Desenvolvimentos recentes na área de codificação de áudio paramétrica remetem técnicas para codificar juntamente um sinal de áudio de multicanais (por exemplo, 5.1) em um (ou mais) canal downmix mais uma corrente de informações paralelas. Essas técnicas são, por exemplo, conhecidas como Codificação de Indicador Biauricular, Estéreo Paramétrico, Surround MPEG etc.
Diversas publicações descrevem a denominada abordagem de codificação multicanais paramétrica de "Codificação de Indicador Biauricular", por exemplo, referências [1], [2], [3], [4] e [5], O "Estéreo Paramétrico"se refere a uma técnica para a codificação paramétrica de um sinal estéreo de dois canais com base em um sinal mono transmitido mais informações paralelas de parâmetro. Para detalhes, é feita referência às referências [6] e [7] . O "Surround MPEG" é um padrão ISO (Organização Internacional para Padronização) para codificação de multicanais paramétrica. Para detalhes, é feita referência a referência [8].
Essas técnicas têm base na transmissão dos indicadores perceptuais relevantes para audição espacial relevante em uma forma compacta ao recebedor junto ao sinal downmix mono ou estéreo associado. Indicadores tipicos podem ter diferenças de nivel intercanais (ILD), correlação ou coerência intercanais (ICC) assim como diferenças de tempo intercanais (ITD) e diferenças de fase intercanais (IPD).
Esses parâmetros são transmitidos em uma resolução de frequência e tempo adaptada à resolução auditiva humana.
Para recriar as propriedades do sinal original, o decodificador pode produzir uma ou mais versões descorrelacionadas do sinal downmix transmitido. Adicionalmente, uma rotação de fase dos sinais de saida pode ser realizada no decodificador para rearmazenar a relação de fase intercanais original.
Exemplo do Sistema de Codificação de Indicador Biauricular da Figura 4
A seguir, um esquema de Codificação de Indicador Biauricular genérico será descrito tendo como referência a Figura 4. A Figura 4 apresenta um diagrama em blocos esquemático de um sistema de transmissão de Codificação de Indicador Biauricular 400, que compreende um codificador de Codificação de Indicador Biauricular 410 e um decodificador de Codificação de Indicador Biauricular 420. O codificador de Codificação de Indicador Biauricular 410 pode, por exemplo, receber uma pluralidade de sinais de áudio 412a, 412b e 412c. Também, o codificador de Codificação de Indicador Biauricular 410 é configurado para realizar o downmix dos sinais de entrada de áudio 412a-412c utilizando um downmixador 414 para obter um sinal downmix 416, que pode, por exemplo, ser um sinal de soma. Além disso, o codificador de Codificação de Indicador Biauricular 410 pode ser configurado para analisar os sinais de entrada de áudio 412a-412c utilizando um analisador 418 para obter o sinal de informações paralelas 419. O sinal de soma 416 e o sinal de informações paralelas 419 são transmitidos a partir do codificador de Codificação de Indicador Biauricular 410 para o decodificador de Codificação de Indicador Biauricular 420. O decodificador de Codificação de Indicador Biauricular 420 pode ser configurado para sintetizar um sinal de saida de áudio de multicanais compreendendo, por exemplo, canais de áudio yl, y2,..., yN com base no sinal de soma 416 e indicadores intercanais 424. Para este fim, o decodificador de Codificação de Indicador Biauricular 420 pode compreender o sintetizador de Codificação de Indicador Biauricular 422 que recebe o sinal de soma 416 e os indicadores intercanais 424, e provê os sinais de áudio yl, y2,.„, yN. O decodif icador de Codificação de Indicador Biauricular 420 compreende ainda um processador de informações paralelas 426 que é configurado para receber as informações paralelas 419 e, opcionalmente, uma entrada de usuário 427. 0 processador de informações paralelas 426 é configurado para prover os indicadores intercanais 424 com base nas informações paralelas 419 e a entrada de usuário opcional 427.
Para resumir, os sinais de entrada de áudio são analisados e passam por downmix no Codificador de BCC 410. O sinal de soma mais as informações paralelas são transmitidos ao Decodificador de BCC 420. Os indicadores intercanais são gerados a partir das informações paralelas e local entrada de usuário. A sintese de codificação de Indicador Biauricular gera o sinal de saida de áudio de multicanais.
Para detalhes, é feita referência aos artigos "Binaural Cue Codification Part II: Schemes e applications,” por C. Faller e F. Baumgarte (publicado em: IEEE Transactions on Speech e Áudio Processing, vol. 11, no. 6, Nov. 2003).
Discussão das abordagens convencionais
Nas abordagens descritas acima, é dificil controlar adequadamente a relação intercanais.
Da mesma forma, é desejável criar um conceito para upmixar um sinal downmix, que provê uma boa precisão em relação a uma correlação intercanais.
SUMÁRIO DA INVENÇÃO
As configurações, de acordo com a invenção, criam um upmixador para upmixar um sinal de áudio downmix em um sinal de áudio upmixado que descreve um ou mais canais de áudio upmixados. O upmixador compreende um aplicador de parâmetro configurado para aplicar parâmetros de upmixagem para realizar o upmix do sinal de áudio downmix, a fim de obter o sinal de áudio upmixado. O aplicador de parâmetro é configurado para aplicar uma troca de fase para o sinal de áudio downmix, para obter uma versão de fase trocada do sinal de áudio downmix, enquanto deixa um sinal descorrelacionado inalterado pela troca de fase. O aplicador de parâmetro também é configurado para combinar uma versão de fase trocada do sinal de áudio downmix com o sinal descorrelacionado para obter o sinal upmix.
Algumas configurações, de acordo com a invenção, têm base na descoberta que uma correlação intercanais entre diferentes sinais de áudio upmixados é degradada ao aplicar uma troca de fase (por exemplo, uma troca de fase de tempo variável, que depende de indicadores espaciais) ao sinal descorrelacionado. Da mesma forma, descobriu-se que é desejável deixar o sinal descorrelacionado inalterado pela troca de fase, que é aplicada ao sinal downmix, a fim de obter uma troca de fase intercanais adequada entre diferentes canais de áudio upmixados.
Da mesma forma, o processamento de fase melhorado, de acordo com a invenção, contribui para prevenir correlação intercanais de saida incorreta (dos canais de áudio upmixados), que poderia ser causada por uma troca de fase da parte do sinal descorrelacionado.
Em uma configuração preferida, o upmixador é configurado para obter o sinal descorrelacionado, de maneira que o sinal descorrelacionado seja uma versão descorrelacionada do sinal de áudio downmix. Portanto, o sinal descorrelacionado pode ser facilmente obtido do sinal downmix. Entretanto, em algumas outras configurações, diferentes conceitos podem ser utilizados para obter o sinal descorrelacionado. Em uma solução muito simples, um sinal de ruido pode ser utilizado como o sinal descorrelacionado.
Em uma configuração preferida, o upmixador é configurado para realizar o upmix do sinal de áudio downmix em um sinal de áudio upmixado que descreve uma pluralidade de canais de configurado para aplicar os parâmetros de upmixagem para realizar o upmix do sinal de áudio downmix utilizando o sinal descorrelacionado, a fim de obter um primeiro sinal de canal de áudio upmixado e um segundo sinal de canal de áudio upmixado. O aplicador de parâmetro é configurado para aplicar uma troca de fase variante no tempo ao sinal de áudio downmix para obter pelo menos duas versões do sinal de áudio downmix, compreendendo uma troca de fase variante no tempo uma em relação à outra. O aplicador de parâmetro também é configurado para combinar pelo menos duas versões do sinal de áudio downmix com o sinal descorrelacionado para obter pelo menos dois sinais de canal de áudio upmixados de maneira que o sinal descorrelacionado permaneça não afetado pela troca de fase variante no tempo. Da mesma forma, sinais de múltiplos canais do sinal de áudio upmixado podem ser obtidos, onde as partes do sinal descorrelacionado dentro dos múltiplos canais upmixados (do sinal de áudio upmixado) não são afetadas pela relativa troca de fases introduzida entre as suas partes de sinal correlacionado. Consequentemente, a correlação intercanais entre os canais de áudio upmixados pode ser controlada com boa precisão.
Em uma configuração, o aplicador de parâmetro é configurado para combinar pelo menos duas versões do sinal de áudio downmix com o sinal descorrelacionado, de maneira que uma parte do sinal do primeiro sinal de canal de áudio upmixado que representa o sinal descorrelacionado e uma parte do sinal do segundo sinal de canal de áudio upmixado que representa o sinal descorrelacionado esteja em uma relação de fase constante temporalmente, por exemplo, na fase ou 180° fora da fase um em relação ao outro. Consequentemente, as partes do sinal que representam o sinal descorrelacionado podem servir de maneira efetiva para ajustar a correlação dos sinais de canal de áudio upmixados. Ao contrário, se as partes do sinal que representam o sinal descorrelacionado estivessem arbitrariamente ou variavelmente com a fase trocada uma em relação à outra nos diferentes sinais de canal de áudio upmixados, um ajuste da correlação intercanais desejada seria degradada ou até evitada.
Em uma configuração, de acordo com a invenção, o aplicador de parâmetro é configurado para obter pelo menos duas versões do sinal de áudio downmix compreendendo uma troca de fase variante no tempo uma em relação à outra antes de combinar pelo menos duas versões do sinal de áudio downmix (compreendendo a troca de fase variante no tempo uma em relação à outra) com o sinal descorrelacionado, esse sinal descorrelacionado é deixado não afetado pela troca de fase variante no tempo. Ao aplicar a troca de fase variante no tempo antes de combinar o seu resultado com o sinal descorrelacionado, o sinal descorrelacionado é deixado não afetado pela troca de fase variante no tempo. Consequentemente, as características de correlação dos sinais de canal de áudio upmixados resultantes podem ser precisamente ajustadas.
Em uma configuração, de acordo com a invenção, o upmixador compreende um determinador de parâmetro configurado para determinar a troca de fase a ser aplicada ao sinal de áudio downmix com base em um parâmetro de diferença de fase intercanais. Da mesma forma, a troca de fase é adaptada para ajustar a impressão da audição humana desejada.
Em uma configuração, de acordo com a invenção, o aplicador de parâmetro compreende um multiplicador de vetor de matriz configurado para multiplicar um vetor de entrada que representa uma ou mais amostras do sinal downmix e uma ou mais amostras do sinal descorrelacionado com uma matriz compreendendo entradas de matriz que representam parâmetros de upmix. A multiplicação é realizada para obter, como um resultado, um vetor de saida que representa uma ou mais amostras de um primeiro canal de sinal de áudio upmixado e uma ou mais amostras de um segundo canal de sinal de áudio upmixado. O upmixador compreende um determinador de parâmetro configurado para obter as entradas de matriz com base em indicadores espaciais associados ao sinal de áudio downmix. O determinador de parâmetro é configurado para aplicar uma rotação de fase de tempo variável somente para as entradas de matriz a serem aplicadas a uma ou mais amostras do sinal downmix, enquanto deixa uma fase das entradas de matriz a ser aplicada a uma ou mais amostras do sinal descorrelacionado não afetada pela rotação de fase de tempo variável. Ao deixar algumas das entradas de matriz, a saber, aquelas que são aplicadas ao sinal descorrelacionado, não afetadas pela rotação de fase de tempo variável, uma implementação eficiente do conceito inventivo pode ser obtida. O esforço computacional necessário pode ser reduzido ao ter alguns elementos de matriz, que compreendem um valor de fase fixo (ou que, por exemplo, pode ser de valor real independente dos indicadores espaciais). Além disso, a determinação das entradas de matriz é naturalmente de maneira relativa simples se os valores de fase forem constantes.
Em uma configuração, o multiplicador de vetor de matriz é configurado para receber as amostras do sinal de áudio downmix e as amostras do sinal descorrelacionado em uma representação de valor complexa. Além disso, o multiplicador de vetor de matriz é configurado para aplicar entradas de matriz de valor complexo ao vetor de entrada, a fim de aplicar uma troca de fase e para obter as amostras dos canais de sinal de áudio upmixado em uma representação de valor complexa. Nesse caso, o determinador de parâmetro é configurado para computar valores reais ou valores de magnitude das entradas de matriz com base em parâmetros de diferença de nivel intercanais e/ou parâmetros de correlação intercanais e/ou parâmetros de coerência intercanais (ou parâmetros de correlação ou coerência intercanais) associados ao sinal de áudio downmix. Além disso, o determinador de parâmetro é configurado para computar valores de fase das entradas de matriz a serem aplicados a uma ou mais amostras do sinal downmix com base em parâmetros de diferença de fase intercanais associados ao sinal de áudio downmix. Além disso, o determinador de parâmetro é configurado para aplicar uma rotação complexa aos valores de magnitude das entradas de matriz a serem aplicados a uma ou mais amostras do sinal downmix dependendo dos valores de fase correspondentes para obter as entradas de matriz a serem aplicadas a uma ou mais amostras do sinal downmix. Da mesma forma, uma determinação de diversas etapas eficiente das entradas de matriz pode ser implementada. Os valores reais ou valores de magnitude das entradas de matriz podem ser calculados sem considerar a diferença de fase intercanais. Semelhantemente, os valores de fase das entradas de matriz podem ser obtidos sem considerar os parâmetros de diferença de nivel intercanais ou parâmetros de correlação/coerência intercanais, que permitem uma paralelização opcional das computações. Além disso, as entradas de matriz podem ser adaptadas de maneira eficiente, de maneira que a correlação intercanais dos sinais de canal de áudio upmixados possa ser ajustada com boa precisão.
Uma configuração, de acordo com a invenção, cria um método para upmixar um sinal de áudio downmix em um sinal de áudio upmixado.
Uma outra configuração, de acordo com a invenção, compreende um programa de computador para realizar a funcionalidade do método inventivo.
BREVE DESCRIÇÃO DAS FIGURAS
As configurações, de acordo com a invenção, serão subsequentemente descritas tendo como referência as Figuras anexas, nas quais:
A Figura 1 apresenta uma diagrama em blocos esquemático de um upmixador para upmixar um sinal de áudio downmix em um sinal de áudio upmixado, de acordo com uma configuração da invenção;
A Figura 2 apresenta um diagrama em blocos esquemático detalhado de um upmixador para upmixar um sinal de áudio downmix em um sinal de áudio upmixado, de acordo com uma outra configuração da invenção;
A Figura 3a apresenta um fluxograma de um método para upmixar um sinal de áudio downmix em um sinal de áudio upmixado, de acordo com uma configuração da invenção;
A Figura 3b apresenta um diagrama em blocos esquemático de um método para obter um conjunto de parâmetros de upmix, de acordo com uma configuração da invenção; e
A Figura 4 apresenta uma diagrama em blocos esquemático de um esquema de Codificação de Indicador Biauricular genérico convencional.
DESCRIÇÃO DETALHADA DAS CONFIGURAÇÕES
A Figura 1 apresenta um diagrama em blocos esquemático de um upmixador 100, de acordo com uma configuração da invenção. A Figura 1 apresenta a upmixagem de um único canal visando à simplicidade. Naturalmente, o conceito aqui revelado pode ser aplicado em sistemas multicanais assim como, como será descrito, por exemplo, em relação à Figura 2.
O upmixador 100 é configurado para receber um sinal de áudio downmix 110 e para realizar o upmix o sinal de áudio downmix 110 em um sinal de áudio upmixado 120 que descreve um ou mais canais de áudio upmixados.
O upmixador compreende um aplicador de parâmetro 130, que é configurado para aplicar parâmetros de upmixagem para realizar o upmix o sinal de áudio downmix 110, a fim de obter o sinal de áudio upmixado 120. O aplicador de parâmetro 130 é configurado para aplicar uma troca de fase (apresentada no número de referência 140) para o sinal de áudio downmix 110 para obter uma versão de fase trocada 142 do sinal de áudio downmix 110, enquanto deixa o sinal descorrelacionado 150 inalterado pela troca de fase. O aplicador de parâmetro 130 é também configurado para combinar (apresentado no número de referência 160) uma versão de fase trocada 142 do sinal de áudio downmix 110 com o sinal descorrelacionado 150 para obter o sinal de áudio upmixado 120.
Ao aplicar a troca de fase somente ao sinal de áudio downmix 110, mas não ao sinal descorrelacionado 150 (que, por exemplo, pode ser uma versão descorrelacionada do sinal de áudio downmix 110), o sinal de áudio upmixado 120 compreende uma parte descorrelacionada, onde a parte descorrelacionada do sinal de áudio upmixado 120 tem base no sinal descorrelacionado 150, e onde a fase da parte descorrelacionada é deixada não afetada pela troca de fase aplicada ao sinal de áudio downmix 110. Da mesma forma, uma parte do sinal do sinal de áudio upmixado 120 que é correlacionada ao sinal de áudio downmix 110 é trocada por fase (por exemplo, em uma maneira variante no tempo) dependendo da troca de fase aplicada, enquanto uma parte do sinal de áudio upmixado 120 que é descorrelacionada do sinal de áudio downmix 110 é deixada não afetada pela troca de fase. Da mesma forma, um ajuste das características da correlação intercanais do sinal de áudio upmixado (em relação aos sinais de áudio upmixados adicionais) pode ser realizado com alta precisão sem ter a necessidade de considerar as trocas de fase variantes no tempo aplicadas ao sinal de áudio downmix.
As Figuras 2a e 2b apresentam um diagrama em blocos esquemático detalhado de um aparelho 200, de acordo com uma outra configuração da invenção.
O aparelho 200 é configurado para receber um sinal de áudio downmix 210 e para realizar o upmix o sinal de áudio downmix 210 em um sinal de áudio upmixado 220. O sinal de áudio upmixado 220 pode, por exemplo, descrever um primeiro canal de áudio upmixado 222a e um segundo canal de áudio upmixado 222b.
O sinal de áudio downmix 210 pode, por exemplo, ser um sinal de soma provido por um codificador de áudio espacial (por exemplo, o sinal de soma 416 provido pelo Codificador de Codificação de Indicador Biauricular 410). O sinal de áudio downmix 210 pode, por exemplo, ser representado na forma de uma decomposição de frequência de valor complexo. Por exemplo, o sinal de áudio downmix pode compreender uma amostra em cada banda de frequência (de uma pluralidade de bandas de frequência) para cada intervalo de atualização de amostra de áudio (indicado pelo indice temporal k).
A seguir, o processamento das amostras em uma banda de frequência será descrito. Entretanto, as amostras de áudio em outras bandas de frequência podem ser processadas semelhantemente. Em outras palavras, em algumas configurações, de acordo com a invenção, diferentes bandas de frequência podem ser processadas de maneira independente.
Semelhantemente, presume-se que o primeiro sinal de canal de áudio upmixado 222a representa, na forma de amostras de valor complexo, um conteúdo de áudio em uma banda de frequência especifica do sinal de áudio upmixado 220. Da mesma forma, presume-se que o segundo sinal de canal de áudio upmixado 222b representa, na forma de amostras de valor complexo, o conteúdo de áudio na banda de frequência especifica em consideração. Os sinais de canal de áudio upmixados para diferentes bandas de frequência podem ser obtidos, entretanto, de acordo com o mesmo conceito aqui descrito.
O processamento de banda de frequência (ou seja, a geração de um sinal upmix para uma única banda de frequência) do aparelho 200 é, portanto, configurado para receber uma corrente x(k) que descreve uma sequência de amostras de valor complexo subsequentes de um conteúdo de áudio da banda de frequência em consideração. Nessa notação, k serve como um indice de tempo. A seguir, x(k) será brevemente designado como "sinal de áudio downmix", tendo em mente que x(k) descreve meramente o conteúdo de áudio da banda de frequência única em consideração do sinal de áudio downmix geral (banda de multifrequências).
O processamento de banda de frequência compreende um descorrelacionador 230, que é configurado para receber o sinal de áudio downmix x(k) e prover, em sua base, uma versão descorrelacionada q(k) do sinal de áudio downmix x(k). Uma versão descorrelacionada q(k) pode ser representada por uma sequência de amostras de valor complexo. O processamento de banda de frequência também compreende um aplicador de parâmetro 240, que é configurado para receber o sinal de áudio downmix x(k) e a versão descorrelacionada q(k) do sinal de áudio downmix e prover, em sua base, o primeiro sinal de canal de áudio upmixado 222a e o segundo sinal de canal de áudio upmixado 222b.
Na configuração da Figura 2, o aplicador de parâmetro 240 compreende um multiplicador de vetor de matriz 242 (ou quaisquer outros meios adequados), que é configurado para realizar uma combinação linear ponderada do sinal de áudio downmix x(k) e a versão descorrelacionada q(k) do sinal de áudio downmix para obter os sinais de canal de áudio upmixados 222a, 222b. A ponderação de x(k) e q(k) é determinada pelas entradas de uma matriz de ponderação H(k), onde as entradas de matriz de ponderação podem ser variante no tempo (ou seja, dependente do indice de tempo k) . No geral, algumas das entradas da matriz de ponderação H(k) podem ser de valor complexo, assim como será discutido em detalhes a seguir.
Na configuração da Figura 2, uma amostra yi(k) do primeiro sinal de canal de áudio upmixado 222a pode ser obtida ao adicionar uma amostra x(k) do sinal de áudio downmix, ponderada por uma entrada de matriz de valor complexo Hn, e uma amostra temporalmente correspondente q(k) do sinal descorrelacionado, ponderado com uma entrada de matriz (tipicamente, mas não necessariamente, de valor real) H12. Semelhantemente, uma amostra y2(k) do segundo sinal de canal de áudio upmixado 222b é obtida ao adicionar uma amostra x(k) do sinal de áudio downmix, ponderada por uma entrada de matriz de valor complexo H2i, e uma amostra temporalmente correspondente q(k) do sinal descorrelacionado, ponderada com uma entrada de matriz (tipicamente de valor real) H22.
Da mesma forma, uma troca de fase ou rotação de fase é aplicada às amostras x(k) do sinal de áudio downmix (correlacionado) ao derivar essas amostras yi(k), y2(k) dos sinais de canal de áudio upmixados 222a, 222b. Ao contrário, a aplicação de uma troca de fase ou rotação de fase é evitada ao calcular a contribuição das amostras q(k) do sinal descorrelacionado para as amostras dos sinais de canal de áudio upmixados 222a, 222b.
A seguir, será descrito como as entradas de matriz Hu, HI2, H2I, H22 da matriz H podem ser obtidas.
Para este fim, o aparelho 200 compreende uma unidade de processamento de informações paralelas 260, que é configurada para receber as informações paralelas 262 que descrevem os parâmetros de upmix. As informações paralelas 262 podem, por exemplo, compreender indicadores espaciais como, por exemplo, parâmetros de diferença de nível intercanais, parâmetros de correlação ou coerência intercanais, parâmetros de diferença de tempo intercanais ou parâmetros de diferença de fase intercanais. Os referidos parâmetros ILD, ICC, ITD, IPD são bem conhecidos na técnica de codificação espacial e não serão descritos em detalhes aqui.
A unidade de processamento de informações paralelas 260 é configurada para prover as entradas de matriz (completas) Hn, H12, H2X, H22 ao multiplicador de vetor de matriz 242 (que é apresentado no número de referência 264). A unidade de processamento de informações paralelas 260 pode, portanto, também ser considerada como um "determinador de parâmetro".
A unidade de processamento de informações paralelas 260 compreende um determinador de valor real de parâmetro de upmix 270, que é configurado para receber indicadores espaciais que descrevem uma relação de amplitude ou relação de força entre diferentes componentes de sinal nos sinais de canal de áudio upmixados 222a, 222b. Por exemplo, o determinador de valor real de parâmetro de upmix 270 é configurado para receber parâmetros de diferença de nível intercanais e/ou parâmetros de correlação ou coerência intercanais. O determinador de valor real de parâmetro de upmix 270 é configurado para prover, com base nos referidos indicadores espaciais (por exemplo, ILD, ICC), entradas de matriz de valor real. O determinador de valor real de parâmetro de upmix 270 é configurado para prover as entradas de matriz de valor real Hn , Hn H2X , H22 com base nos indicadores espaciais recebidos (por exemplo, ILD, ICC) . As entradas de matriz de valor real são designadas com 272. Como a computação das entradas de matriz de valor real 272 é bem conhecida na técnica de decodificação espacial, uma descrição detalhada será omitida aqui. De preferência, é feita referência aos documentos citados na seção intitulada "Referências" e a quaisquer outras publicações bem conhecidas ao técnico no assunto.
A unidade de processamento de informações paralelas 260 compreende ainda um determinador de ângulo de troca de fase de parâmetro de upmix 280, que é configurado para receber indicadores espaciais que representam uma troca de fase entre diferentes componentes de sinal dos sinais de canal de áudio upmixados 222a, 222b. Por exemplo, o determinador de ângulo de troca de fase de parâmetro de upmix 280 é configurado para receber parâmetros de diferença de fase intercanais 282. O determinador de ângulo de troca de fase de parâmetro de upmix 280 também é configurado para prover valores de ângulo de troca de fase «i, «2 associados ao sinal de áudio downmix, que também são designados com 284. A computação de valores de ângulo de troca de fase com base nos parâmetros de diferença de fase intercanais 282 é bem conhecida na técnica, de maneira que uma descrição detalhada seja omitida aqui. É feita referência, por exemplo, aos documentos citados na seção "Referências", e também a quaisquer outras publicações bem conhecidas ao técnico no assunto.
A unidade de processamento de informações paralelas 260 compreende ainda um rotador de entrada de matriz 290, que é configurado para receber as entradas de matriz de valor real 272 e os valores de ângulo de troca de fase 284 e para computar, em sua base, as entradas de matriz (completas) da matriz H (também designada com H(k) para indicar a dependência de tempo).
Para este fim, o rotador de entrada de matriz 290 pode ser configurado para aplicar os valores de ângulo de troca de fase «i, a2 àquelas (e, preferivelmente, somente àquelas) entradas de matriz de valor real 272, que são direcionadas para aplicar o sinal de áudio downmix x(k). Ao contrário, o rotador de entrada de matriz 290 é preferivelmente configurado para deixar aquelas entradas de matriz de valor real, que são direcionadas para serem aplicadas às amostras do sinal descorrelacionado q(k), não afetadas pelos valores de ângulo de troca de fase cq, a2. Consequentemente, aquelas entradas de matriz, que são direcionadas para serem aplicadas (pelo multiplicador de vetor de matriz 242) às amostras do sinal descorrelacionado q(k), permaneçam valores reais, conforme providas pelo determinador de valor real de parâmetro de upmix 270. Entretanto, em algumas configurações, a inversão do sinal pode ocorrer.
Na configuração apresentada na Figura 2, as seguintes relações podem manter:
Figure img0001
Da mesma forma, o rotador de entrada de matriz 290 é configurado para derivar as entradas de matriz (completas) da matriz H e prover essas entradas de matriz (completas) ao multiplicador de vetor de matriz 242.
Como de costume, as entradas de matriz da matriz H podem ser atualizadas durante a operação do aparelho 200. Por exemplo, as entradas de matriz 264 da matriz H podem ser atualizadas sempre que um novo conjunto de informações paralelas 262 for recebido pelo aparelho 200. Em outras configurações, pode ser realizada a interpolação. Portanto, as entradas de matriz 264 podem ser atualizadas uma vez por intervalo de atualização de amostra de áudio k em algumas configurações onde uma interpolação pode ser aplicada.
A seguir, o conceito, de acordo com a presente invenção, que foi descrito em detalhes em relação às Figuras 2a e 2b, será brevemente resumido. As configurações, de acordo com a invenção, realçam técnicas de upmixagem por um processamento de fase melhorado, que evita a correlação intercanais de saida incorreta causada pela troca de fase da parte do sinal descorrelacionado.
Para simplificar, a configuração apresentada na Figura 2 e também a seguinte descrição se restringem a um upmix somente de um ou dois canais. O procedimento upmix do decodificador de, por exemplo, um a dois canais é realizado por uma multiplicação de matriz de um vetor que consiste no sinal downmix x, denominado "sinal seco", e uma versão descorrelacionada do sinal downmix q, denominado "sinal molhado", com uma matriz de upmix H. O sinal molhado q pode ser gerado ao alimentar o sinal downmix x por meio de um filtro de descorrelação (por exemplo, na forma do descorrelacionador 230) . O sinal de saida y é um vetor que contém o primeiro e o segundo canais da saida (por exemplo, o primeiro sinal de canal de áudio upmix 222a e o segundo canal de áudio upmix 222b).
Todos os sinais x, q, y podem estar disponíveis em uma decomposição de frequência de valor complexo. A operação de matriz pode ser realizada para todas as amostras de sub-banda de cada banda de frequência. A seguinte operação de matriz pode ser realizada:
Figure img0002
A referida operação de matriz, que pode ser realizada pelo multiplicador de vetor de matriz 242, também é apresentada na Figura 2, onde o indice de tempo k indica que as amostras de entrada x, y, as amostras de saida upmixadas ylf y2 e também a matriz de upmix H são tipicamente variantes no tempo.
Os coeficientes (ou entradas de matriz) Hu, H12, H2i< H22 da matriz de upmix H são derivados dos indicadores espaciais, por exemplo, utilizando a unidade de processamento de informações paralelas 260. A operação de matriz (que é realizada pelo multiplicador de vetor de matriz 242) aplica uma mixagem do sinal seco x e do sinal molhado q, de acordo com as ICCs e a ponderação dos canais de saida 222a, 222b, de acordo com as ILDs. Ao utilizar o valor complexo coeficientes, uma troca de fase adicional, de acordo com as IPDs, pode ser aplicada (como será descrito a seguir).
O sinal molhado q é criado ao passar o sinal downmix x através de um filtro de descorrelação (por exemplo, o descorrelacionador 230), que é designado de maneira que a correlação entre x e q seja suficientemente perto de zero. Para recriar o grau original de correlação entre dois canais, que são descritos pelas ICCs transmitidas, os sinais x e q são mixados de maneira diferente para os dois canais de saida 222a, 222b. Os coeficientes de matriz (por exemplo, as entradas de matriz da matriz H) são calculados de maneira que a correlação dos canais de saida corresponda as ICCs transmitidas.
A relação de fase entre os dois canais, que é descritas pelas IPDs transmitidas, é recriada ao aplicar a troca de fases ao sinal de saídas. Os dois sinais são geralmente rotacionados por diferentes ângulos.
Decodificadores convencionais aplicam a troca de fases aos sinais de saída completos, o que significa que tanto os componentes de sinal seco como o molhado são processados.
As IPDs transmitidas descrevem a diferença de ângulo de fase entre os dois canais. Descobriu-se que, como não pode ser definida a diferença de fase para sinais não correlacionados, os valores IPD têm sempre base nos componentes de sinal correlacionados. Descobriu-se que, portanto, não é necessário aplicar a rotação de fase à parte do sinal molhado dos canais de saída. Adicionalmente, descobriu-se que a aplicação de diferentes trocas de fase aos dois canais (compreendendo as partes do sinal descorrelacionado) pode até resultar em um grau errado da correlação de saída, como uma computação de mixagem seca e molhada pode ter base na presunção que o mesmo sinal descorrelacionado PE mixado em ambos os canais.
Uma abordagem comum para mixar os sinais seco e molhado é mixar a mesma quantidade de sinal molhado para ambos os canais com diferentes sinais. Descobriu-se que, se diferentes trocas de fases forem aplicadas aos canais de saída (por exemplo, após combinar o sinal seco x e o sinal molhado q), essa propriedade fora da fase da parte do sinal molhado é destruída, resultando em uma perda da descorrelação.
Ao contrário, a solução inventiva ajuda a manter o grau desejado de descorrelação.
A seguir, detalhes adicionais em relação à configuração descrita acima serão explicados. Em uma configuração, de acordo com a invenção, um upmix modificado (quando comprado às técnicas de upmix convencionais) é utilizado para evitar uma perda de descorrelação por essa rotação, de acordo com diferenças de fase intercanais (IPDs). Conforme descrito acima, descobriu-se que uma troca de fase da parte do sinal molhado pode resultar em uma perda de descorrelação e não é necessária a reconstrução da relação de fase original entre canais. Ao aplicar a troca de fase na matriz de upmix H utilizando coeficientes complexos, o processamento pode ser limitado ao sinal seco somente ao rotacionar esses coeficientes multiplicados com o sinal seco.
A seguir, um método será descrito, que pode ser utilizado para obter a matriz de upmix H ou os parâmetros de upmix (por exemplo, entradas da matriz de upmix H).
Em uma primeira etapa, a matriz de valor real H (ou suas entradas) é computada a partir das diferenças de nivel intercanais (ILDs) transmitidas e dos parâmetros de correlação ou coerência intercanais (ICCs), que indicadores espaciais podem ser recebidos pelo aparelho 200 como uma parte das informações paralelas 262. Essa computação (que pode ser realizada pelo determinador de valor real de parâmetro de upmix 270) pode ser feita da mesma maneira, se as diferenças de fase intercanais (IPDs) não puderem ser utilizadas.
Em uma próxima etapa (que pode, opcionalmente, ser realizada em paralela à primeira etapa, ou até antes da "primeira etapa"), os ângulos de troca de fase para, por exemplo, os dois canais de saida CQe «2 são calculados a partir (por exemplo, no determinador de ângulo de troca de fase de parâmetro de upmix 280) das IPDs transmitidas, como de costume.
Finalmente, uma rotação complexa daqueles elementos (ou entradas) da matriz H, que são multiplicados com o sinal seco, ou seja, a primeira coluna da matriz, é realizada para obter a matriz de upmix H (por exemplo, utilizando o rotador de entrada de matriz 290):
Figure img0003
Utilizando essa matriz de upmix modificada, a rotação de fase somente é aplicada às partes do sinal seco (por exemplo, pelo multiplicador de vetor de matriz 242 que aplica a matriz H) , enquanto a parte do sinal molhado não é modificada e descorrelação correta é preservada.
Método, de acordo com a Figura 3a
A Figura 3a apresenta um fluxograma de um método 300 para upmixar um sinal de áudio downmix em um sinal de áudio upmixado que descreve um ou mais canais de áudio upmixados. O método 300 compreende, de maneira geral, aplicar 310 parâmetros de upmixagem para realizar o upmix o sinal de áudio downmix a fim de obter o sinal de áudio upmixado. Aplicar 310 parâmetros de upmixagem compreende uma etapa 320 de aplicação de uma troca de fase para o sinal de áudio downmix para obter uma versão de fase trocada do sinal de áudio downmix, enquanto deixa um sinal descorrelacionado inalterado pela troca de fase. Aplicar 310 parâmetros de upmixagem compreende ainda uma etapa 330 de combinação de uma versão de fase trocada do sinal de áudio downmix com o sinal descorrelacionado, para obter o sinal de áudio upmixado.
Deve ser observado que o método 300 pode ser suplementado por qualquer uma das funcionalidades aqui descritas, também em relação ao aparelho inventivo.
Método, de acordo com a Figura 3b
A Figura 3b apresenta um método 350 para obter um conjunto de parâmetros de upmix, de acordo com uma configuração da invenção. O método 350 compreende uma primeira etapa 360 para obter parâmetros de upmix de valor real (por exemplo, entradas de matriz de valor real) que descrevem uma intensidade desejada das contribuições do sinal downmix (por exemplo, o sinal x) e do sinal descorrelacionado (por exemplo, o sinal q) para os sinais de canal de áudio upmixados (por exemplo, ylz y2) dependendo de um ou mais indicadores espaciais (por exemplo, ILD, ICC) que representam a intensidade das contribuições. 0 método 350 compreende ainda uma segunda etapa 370 para obter valores de ângulo de troca de fase (por exemplo, cg, 0Í2) que descrevem uma troca de fase desejada entre os componentes de sinal de áudio downmix em diferentes sinais de canal de áudio upmixados (por exemplo, ylz y2) dependendo de um ou mais indicadores espaciais que representam uma troca de fase intercanais (por exemplo, IPD). O método 350 compreende ainda uma etapa 380 para rotacionar (ou seja, trocar de fase) parâmetros de upmix de valor real direcionados a serem aplicados ao sinal de áudio downmix dependendo dos valores de ângulo de troca de fase, enquanto deixa parâmetros de upmix de valor real, direcionados para serem aplicados ao sinal descorrelacionado, não afetados pelos valores de ângulo de troca de fase, para obter parâmetros de upmix completos do conjunto de parâmetros de upmix. O método 350 pode ser suplementado por qualquer 5 uma das características e funcionalidades aqui descritas, também em relação ao aparelho inventivo.
Implementação de Programa de computador
Dependendo de determinadas exigências de implementação, as configurações da invenção podem ser 10 implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um CD, uma ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória FLASH, que têm sinais de controle possíveis de ler eletronicamente armazenados em si, que cooperam 15 (ou são capazes de cooperar) com um sistema de computador programável de maneira que o respectivo método seja realizado.
Algumas configurações, de acordo com a invenção, compreendem um carregador de dados que tem sinais de controle possiveis de ler eletronicamente, que são capazes de cooperar com 20 um sistema de computador programável, de maneira que um dos métodos aqui descritos seja realizado.
De maneira geral, as configurações da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, o código de programa sendo 25 operado para realizar um dos métodos quando o produto de programa de computador for executado em um computador. O código de programa pode, por exemplo, ser armazenado em um carregador possivel de ler de máquina.
Outras configurações compreendem o programa de computador para realizar um dos métodos aqui descritos, armazenados em um carregador possivel de ler de máquina. Em outras palavras, uma configuração do método inventivo é, portanto, um 5 programa de computador que tem um código de programa para realizar um dos métodos aqui descritos, quando o programa de computador for executado em um computador.
Uma configuração adicional dos métodos inventivos é, portanto, um carregador de dados (ou um meio de armazenamento 10 digital, ou um meio possivel de ser lido por computador) compreendendo, registrado em si, o programa de computador para realizar um dos métodos aqui descritos.
Uma configuração adicional do método inventivo é, portanto, uma corrente de dados ou uma sequência de sinais que 15 representam o programa de computador para realizar um dos métodos aqui descritos. A corrente de dados ou a sequência de sinais pode, por exemplo, ser configurada para ser transferida por meio de uma conexão de comunicação de dados, por exemplo, por meio da Internet.
Uma configuração adicional compreende meios de processamento, por exemplo, um computador ou um dispositivo de lógica programável, configurado ou adaptado para realizar um dos métodos aqui descritos. Al
Uma configuração adicional compreende um 25 computador tendo instalado em si o programa de computador para realizar um dos métodos aqui descritos.
Em algumas configurações, um dispositivo de lógica programável (por exemplo, uma matriz de portas de campo programáveis) pode ser utilizado para realizar alguma ou todas as funcionalidades dos métodos aqui descritos. Em algumas configurações, a matriz de portas de campo programáveis pode cooperar com um microprocessador, a fim de realizar um dos métodos aqui descritos.
Conclusão
Para resumir o descrito acima, foi descrito um método de upmixagem melhorado para recriar a diferença de fase intercanais original enquanto preserva a descorrelação correta. As configurações, de acordo com a invenção, substituem outras técnicas ao evitar a perda da descorrelação no sinal de saida causada por um processamento de fase não desejado da saida do descorrelacionador.
Referências: [1] C. Faller and F. Baumgarte, "Efficient representation of spatial audio using perceptual parametrization," IEEE WASPAA, Mohonk, NY, October 2001. [2] F. Baumgarte and C. Faller, "Estimation of auditory spatial cues for binaural cue coding," ICASSP, Orlando, FL, May 2002. [3] C. Faller and F. Baumgarte, "Binaural cue coding: a novel and efficient representation of spatial audio," ICASSP, Orlando, FL, May 2002. [4] C. Faller and F. Baumgarte, "Binaural cue coding applied to audio compression with flexible rendering," AES 113th Convention, Los Angeles, Preprint 5686, October 2002. [5] C. Faller and F. Baumgarte, "Binaural Cue Coding - Part II: Schemes and applications," IEEE Trans, on Speech and Audio Proc., vol. 11, no. 6, Nov. 2003. [6] J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, "High-Quality Parametric Spatial Audio Coding at Low Bitrates", AES 116th Convention, Berlin, Preprint 6072, May 2004. [7] E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, "Low Complexity Parametric Stereo Coding", AES 116th Convention, Berlin, Preprint 6073, May 2004. [8] ISO/IEC JTC 1/SC 29/WG 11, 23003-1, MPEG Surround. [9] J. Blauert, Spatial Hearing: The Psychophysics of Human Sound Localization, The MIT Press, Cambridge, MA, revised edition 1997.

Claims (14)

1. DISPOSITIVO UPMIXADOR, sendo o dito upmixador (100; 200) para upmixar um sinal de áudio downmix (110; 210) em um sinal de áudio upmixado (120; 220) que descreve um ou mais canais de áudio upmixados (222a, 22b), caracterizado por o upmixador compreender: um aplicador de parâmetro (130; 240) configurado para aplicar parâmetros de upmixagem (Hn, H12, H21, H22) para realizar o upmix o sinal de áudio downmix (110; 210) a fim de obter o sinal de áudio upmixado (120; 220), em que o aplicador de parâmetro (130; 240) é configurado para aplicar uma troca de fase para o sinal de áudio downmix (110; x) para obter uma versão de fase trocada do sinal de áudio downmix enquanto deixa a sinal descorrelacionado (150; q) inalterado pela troca de fase, e combinar a versão de fase trocada do sinal de áudio downmix com o sinal descorrelacionado (150; q) para obter o sinal de áudio upmixado (120; 220).
2. Dispositivo Upmixador (100; 200), de acordo com a reivindicação 1, caracterizado por o upmixador ser configurado para obter o sinal descorrelacionado (150; q) , de maneira que o sinal descorrelacionado seja uma versão descorrelacionada do sinal de áudio downmix (110; x) .
3. Dispositivo Upmixador (100; 200), de acordo com a reivindicação 1 ou 2, caracterizado por o upmixador (100; 200) ser configurado para realizar o upmix do sinal de áudio downmix (110; x) em um sinal de áudio upmixado (120; 220) que descreve uma pluralidade de canais de áudio upmixados (222a, 222b), em que o aplicador de parâmetro (130; 240) é configurado para aplicar os parâmetros de upmixagem (Hn, H12, H21, H22) para realizar o upmix do sinal de áudio downmix (110; x) utilizando o sinal descorrelacionado (150; q) , a fim de obter um primeiro sinal de canal de áudio upmixado (y2) e um segundo sinal de canal de áudio upmixado (y2) , em que o aplicador de parâmetro (130; 240) é configurado para aplicar uma troca de fase variante no tempo (a2, a2,) ao sinal de áudio downmix (110; x) para obter pelo menos duas versões (H12 x, H21 x) do sinal de áudio downmix que compreende uma troca de fase variante no tempo (cg - cg) uma em relação à outra; e em que o aplicador de parâmetro (130; 240) é configurado para combinar pelo menos duas versões do sinal de áudio downmix com o sinal descorrelacionado (150; q) para obter pelo menos dois sinais de canal de áudio upmixados (y2, y2) , de maneira que o sinal descorrelacionado permaneça não afetado pela troca de fase variante no tempo (cg - o/2) .
4. Dispositivo Upmixador (100; 200), de acordo com a reivindicação 3, caracterizado por o aplicador de parâmetro (130; 240) ser configurado para combinar pelo menos duas versões (H12X, H21X) do sinal de áudio downmix (110; x) com o sinal descorrelacionado (150; q) , de maneira que uma parte do sinal do primeiro sinal de canal de áudio upmixado (y2) que representa o sinal descorrelacionado (150; q) e uma parte do sinal do segundo sinal de canal de áudio upmixado (y2) que representa o sinal descorrelacionado (150; q) estejam em uma relação de fase constante temporalmente.
5. Dispositivo Upmixador (100; 200), de acordo com a reivindicação 3 ou com a reivindicação 4, caracterizado por o aplicador de parâmetro (130; 240) ser configurado para combinar pelo menos duas versões (Hn x, H2I x) do sinal de áudio downmix (110; x) com o sinal descorrelacionado (150; q) , de maneira que uma parte do sinal do primeiro sinal de canal de áudio upmixado (y2) que representa o sinal descorrelacionado (150; q) e uma parte do sinal do segundo sinal de canal de áudio upmixado (y2) que representa o sinal descorrelacionado (150; q) estejam na fase ou 180° fora da fase uma em relação à outra.
6. Dispositivo Upmixador (100; 200), de acordo com uma das reivindicações de 3 a 5, caracterizado por o aplicador de parâmetro (130; 240) ser configurado para obter pelo menos duas versões (Hn x, H21x) do sinal de áudio downmix que compreende uma troca de fase variante no tempo uma em relação à outra antes de combinar pelo menos as duas versões (H21 x, H21x) do sinal de áudio downmix com o sinal descorrelacionado (150; q) , esse sinal descorrelacionado é deixado não afetado pela troca de fase variante no tempo.
7. Dispositivo Upmixador (100; 200), de acordo com uma das reivindicações de 1 a 6, caracterizado por o upmixador compreender um determinador de parâmetro (260) configurado para determinar a troca de fase (cq, ct2) com base em um parâmetro de diferença de fase intercanais (282).
8. Dispositivo Upmixador (100; 200), de acordo com uma das reivindicações de 1 a 7, caracterizado por o aplicador de parâmetro (130; 240) compreender um multiplicador de vetor de matriz (242) configurado para multiplicar um vetor de entrada que representa uma ou mais amostras (x) do sinal de áudio downmix (110; 210) e uma ou mais amostras (q) do sinal descorrelacionado (150; q) com uma matriz (H) compreendendo entradas de matriz (Hllz H12, H21, H22) que representam os parâmetros de upmix para obter, com resultado, um vetor de saida que representa uma ou mais amostras (y2) de um primeiro sinal de canal de áudio upmixado (222a) e uma ou mais amostras (y2) de um segundo canal de áudio upmixado (222b), e em que o upmixador compreende um determinador de parâmetro de upmix (260) configurado para obter as entradas de matriz (H21, H12, H21, H22) com base nos indicadores espaciais associados ao sinal de áudio downmix (110; 210), e em que o determinador de parâmetro de upmix (260) é configurado para aplicar a rotação de fase variante no tempo somente às entradas de matriz (H21, H21) a serem aplicadas a uma ou mais amostras do sinal downmix (x) , enquanto deixa uma fase das entradas de matriz (H12, H22) a ser aplicada a uma ou mais amostras do sinal descorrelacionado (q) não afetada pela rotação de fase variante no tempo.
9. Dispositivo Upmixador (100; 200), de acordo com a reivindicação 8, caracterizado por o multiplicador de vetor de matriz (242) ser configurado para receber as amostras (x) do sinal de áudio downmix (110; 210) e as amostras (q) do sinal descorrelacionado (150; q) em uma representação de valor complexa; em que o multiplicador de vetor de matriz (242) é configurado para aplicar entradas de matriz de valor complexo (H21, H21) a uma ou mais entradas do vetor de entrada a fim de aplicar uma troca de fase, obter as amostras (y2, y2) dos canais de áudio upmixados (222a, 222b) em uma representação de valor complexa; e em que o determinador de parâmetro de upmix (260) é configurado para computar valores reais ou valores de magnitude (/Zn , Hn, H21r H22) das entradas de matriz com base em parâmetros de diferença de nivel intercanais, parâmetros de correlação intercanais ou parâmetros de coerência intercanais associados ao sinal de áudio downmix (110; 210), computar valores de fase (cg, cg) de entradas de matriz (H21, H21) a serem aplicados a uma ou mais amostras do sinal downmix com base nos parâmetros de diferença de fase intercanais (282) associados ao sinal de áudio downmix (110; 210), e aplicar uma rotação complexa aos valores reais ou valores de magnitude das entradas de matriz ( Hu , H21) a serem aplicados a uma ou mais amostras (x) do sinal downmix (110; 210) dependendo dos valores de fase correspondentes (^i, °t) para obter as entradas de matriz (Hn, H21) a serem aplicadas a uma ou mais amostras (x) do sinal downmix.
10. Dispositivo Upmixador (100; 200), de acordo com a reivindicação 8 ou com a reivindicação 9, caracterizado por o multiplicador de vetor de matriz (242) é configurado para obter o vetor de saida
Figure img0004
de acordo com a equação
Figure img0005
em que Yi designa uma amostra de valor complexo de um canal de áudio upmixado i-th; op designa um valor de fase associado ao canal de áudio upmixado i-th; n ii designa um valor de magnitude de valor real que descreve uma contribuição do sinal de áudio downmix ao canal de áudio upmixado i-th; ^12 designa um valor de magnitude de valor real que descreve uma contribuição do sinal descorrelacionado q ao canal de áudio upmix i-th; j designa uma unidade imaginária; x designa uma amostra do sinal de áudio downmix; q designa uma amostra do sinal descorrelacionado; e e" designa uma função exponencial.
11. Aparelho (260) para obter um conjunto de parâmetros de upmix (Hu, HI2, H2I, H22) para upmixar um sinal de áudio downmix (110; 210) em um sinal de áudio upmixado (120; 220) que descreve uma pluralidade de canais de áudio upmixados (222a, 222b), o aparelho (260) caracterizado por compreender: um determinador de valor real de parâmetro de upmix (270) configurado para obter parâmetros de upmix de valor real (H llf H12, H 21r^22)que descrevem uma intensidade desejada das contribuições do sinal downmix (x) e de um sinal descorrelacionado (q) aos sinais de canal de áudio upmixados (y2, y2) dependendo de um ou mais indicadores espaciais que representam a intensidade das contribuições; um determinador de ângulo de troca de fase de parâmetro de upmix (280) configurado para obter um ou mais valores de ângulo de troca de fase OÍ2) que descrevem uma troca de fase desejada entre componentes de sinal de áudio downmix em diferentes sinais de canal de áudio upmixados (y2, y2) dependendo de um ou mais indicadores espaciais que representam uma diferença de fase intercanais; e um rotador de parâmetro de upmix (290) configurado para rotacionar parâmetros de upmix de valor real (í/11, H 21) providos pelo determinador de valor real de parâmetro de upmix (270) e direcionados a serem aplicados ao sinal de áudio downmix (x) dependendo dos valores de ângulo de troca de fase (av a2) , enquanto deixa os parâmetros de upmix de valor real (H ]2í H22) providos pelo determinador de valor real de parâmetro de upmix (270) e direcionados a serem aplicados ao sinal descorrelacionado (q) não afetados pelos valores de ângulo de troca de fase, obter parâmetros de upmix completos (H21, H12, H22, H22) do conjunto de parâmetros de upmix.
12. Aparelho (260), de acordo com a reivindicação 11, caracterizado por o conjunto de parâmetros de upmix ser representado por uma matriz de upmix; em que os parâmetros de upmix de valor real são entradas de matriz de valor real; e em que os parâmetros de upmix completos são entradas de matriz completas; e em que o aparelho é configurado para obter os parâmetros de upmix completos de maneira que parâmetros de upmix que são aplicados ao sinal downmix compreendam uma fase que é dependente dos indicadores espaciais recebidos pelo aparelho, enquanto os parâmetros de upmix a serem aplicados ao sinal descorrelacionado compreendem um valor de fase predeterminado que é independente dos indicadores espaciais.
13. Método (300) para upmixar um sinal de áudio downmix em um sinal de áudio upmixado que descreve um ou mais canais de áudio upmixados, o método compreendendo: aplicar (310) parâmetros de upmixagem para realizar o upmix o sinal de áudio downmix, a fim de obter o sinal de áudio upmixado; caracterizado por a aplicação (310) dos parâmetros de upmixagem compreende aplicar (320) uma troca de fase to o sinal de áudio downmix para obter uma versão de fase trocada do sinal de áudio downmix enquanto deixa um sinal descorrelacionado inalterado pela troca de fase; e a aplicação (310) dos parâmetros de upmixagem compreende combinar (330) a versão de fase trocada do sinal de áudio downmix com o sinal descorrelacionado para obter o sinal de áudio upmixado.
14. Método (350) para obter um conjunto de parâmetros de upmix para upmixar um sinal de áudio downmix em um sinal de áudio upmixado que descreve uma pluralidade de sinais de áudio upmixados, o método caracterizado por compreender: obter (360) parâmetros de upmix de valor real que descrevem uma intensidade desejada das contribuições do sinal downmix e do sinal descorrelacionado aos sinais de canal de áudio upmixados dependendo de um ou mais indicadores espaciais que representam a intensidade da contribuição; obter (370) valores de ângulo de troca de fase que descrevem uma troca de fase desejada entre componentes de sinal de áudio downmix em diferentes sinais de canal de áudio upmixados dependendo de um ou mais indicadores espaciais que representam uma diferença de fase intercanais; e rotacionar (380) parâmetros de upmix de valor real direcionados para serem aplicados ao sinal de áudio downmix dependendo dos valores de ângulo de troca de fase, enquanto deixa os parâmetros de upmix de valor real direcionados para serem aplicados ao sinal descorrelacionado não afetados pelo valores de ângulo de troca de fase, obter parâmetros de upmix completos do conjunto de parâmetros de upmix.
BRPI1005360-3A 2009-01-28 2010-01-12 dispositivo upmixador BRPI1005360B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US14781009P 2009-01-28 2009-01-28
US61/147,810 2009-01-28
EP090122854 2009-09-28
EP09122854 2009-09-28
PCT/EP2010/050287 WO2010086218A1 (en) 2009-01-28 2010-01-12 Upmixer, method and computer program for upmixing a downmix audio signal

Publications (1)

Publication Number Publication Date
BRPI1005360B1 true BRPI1005360B1 (pt) 2020-11-03

Family

ID=73197072

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI1005360-3A BRPI1005360B1 (pt) 2009-01-28 2010-01-12 dispositivo upmixador

Country Status (1)

Country Link
BR (1) BRPI1005360B1 (pt)

Similar Documents

Publication Publication Date Title
CA2750451C (en) Upmixer, method and computer program for upmixing a downmix audio signal
EP2380167B1 (en) Apparatus, method and computer program for upmixing a downmix audio signal
BR112013018362B1 (pt) codificação e decodificação de posições de intervalo de eventos em um quadro de sinal de áudio
EP2296142A2 (en) Controlling spatial audio coding parameters as a function of auditory events
JP2011522472A (ja) パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ
US10163446B2 (en) Audio encoder and decoder
US10482888B2 (en) Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
KR102088337B1 (ko) 인코딩된 오디오 신호를 프로세싱하기 위한 장치 및 방법
BRPI1005360B1 (pt) dispositivo upmixador
BR112017006278B1 (pt) Método para aprimorar o diálogo num decodificador em um sistema de áudio e decodificador

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according art. 34 industrial property law
B06U Preliminary requirement: requests with searches performed by other patent offices: suspension of the patent application procedure
B06A Notification to applicant to reply to the report for non-patentability or inadequacy of the application according art. 36 industrial patent law
B09A Decision: intention to grant
B16A Patent or certificate of addition of invention granted

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 03/11/2020, OBSERVADAS AS CONDICOES LEGAIS.