BRPI0907610B1 - método de decodificação de matriz de áudio, aparelho, mídia não-transitória legível por computador e método para modificar um par de sinais estéreos - Google Patents

método de decodificação de matriz de áudio, aparelho, mídia não-transitória legível por computador e método para modificar um par de sinais estéreos Download PDF

Info

Publication number
BRPI0907610B1
BRPI0907610B1 BRPI0907610-7A BRPI0907610A BRPI0907610B1 BR PI0907610 B1 BRPI0907610 B1 BR PI0907610B1 BR PI0907610 A BRPI0907610 A BR PI0907610A BR PI0907610 B1 BRPI0907610 B1 BR PI0907610B1
Authority
BR
Brazil
Prior art keywords
signals
fact
pair
modifying
directions
Prior art date
Application number
BRPI0907610-7A
Other languages
English (en)
Inventor
David S. Mcgrath
Christophe Chabanne
Original Assignee
Dolby Laboratories Licensing Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corporation filed Critical Dolby Laboratories Licensing Corporation
Publication of BRPI0907610A2 publication Critical patent/BRPI0907610A2/pt
Publication of BRPI0907610B1 publication Critical patent/BRPI0907610B1/pt

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

MÉTODO DE DECODIFICAÇÃO DE MATRIZ DE ÁUDIO, MÉTODO PARA MODIFICAR UM PAR DE SINAIS ESTÉREOS, APARELHO E PROGRAMA DE COMPUTADOR. A presente invenção refere-se a decodificador de matriz de áudio envolvente exige processamento digital mínimo, útil em aplicações portáteis, particularmente em reprodução a partir de um reprodutor portátil usando um virtualizador de fone de ouvido ou de alto-falante. Em uma modalidade este desloca entradas Lt e Rt para saídas associadas com direções frontais em resposta a uma medida da soma de Lt e Rt sendo maior que uma medida da diferença entre Lt e Rt, e desloca Lt, e desloca Lt e Rt para saídas associadas com direções traseiras em resposta a uma medida da soma de Lt e Rt sendo menor que uma medida da diferença entre Lt e Rt. Lt e Rt são modificados para mudar a direção de sinais

Description

Referência Cruzada a Pedidos Relacionados
[0001] Este pedido reivindica o benefício de prioridade do pedido Provisório Estados Unidos No. 61/010.896, depositado em 11 de Janeiro de 2008, incorporado neste documento pela referência.
Campo da Invenção
[0002] A presente invenção refere-se ao processamento de sinal de áudio. Mais particularmente, a invenção refere-se a um decodificador ou função de decodificação de matriz de áudio ou a um programa de computador armazenado em uma mídia legível por computador executando a função de decodificação. Embora o decodificador ou função de decodificação seja particularmente útil para reprodução a partir de um reprodutor portátil usando um virtualizador de fone de ouvido ou de alto-falante, um decodificador ou função de decodificação de matriz de acordo com aspectos da presente invenção não está limitado a tais usos.
Sumário da Invenção
[0003] De acordo com um aspecto da presente invenção, um método de decodificação de matriz de áudio recebendo um par de sinais estéreos Lt, Rt, em cujo método as amplitudes e polaridades relativas do par determinam a direção reproduzida de sinais decodificados, compreende deslocar Lt e Rt para saídas associadas com direções frontais em resposta a uma medida da soma de Lt e Rt sendo maior que uma medida da diferença entre Lt e Rt, e deslocar Lt e Rt para saídas associadas com direções traseiras em resposta a uma medida da soma de Lt e Rt sendo menor que uma medida da diferença entre Lt e Rt, e modificar Lt e Rt para mudar a direção de sinais reproduzidos.
[0004] Modificar Lt e Rt para mudar a direção de sinais reproduzidos pode deslocar sinais movidos (“panned signals”) para saídas associadas com direções traseiras. Modificar Lt e Rt para mudar a direção de sinais reproduzidos desloca sinais movidos para saídas associadas com direções traseiras sendo possível deslocar sinais para longe da direção centro-traseira. Tal deslocamento para longe da direção centro-traseira pode ser na direção na qual tais sinais têm a maior amplitude. Tal deslocamento pode diminuir progressivamente para sinais em direções cada vez mais longe da direção centro-traseira.
[0005] Modificar Lt e Rt para mudar a direção de sinais reproduzidos também pode deslocar sinais movidos para saídas associadas com direções frontais. Tal deslocamento de sinais movidos para saídas associadas com direções frontais pode deslocar menos sinais na direção centro-frontal e tal deslocamento pode aumentar progressivamente para sinais em direções cada vez mais longe da direção centro-frontal.
[0006] O grau de deslocamento, se para frente ou para a traseira pode ser baseado em uma medida da diferença entre Lt e Rt.
[0007] O grau de deslocamento pode variar somente quando Lt e Rt são movidos para saídas associadas com direções traseiras.
[0008] De acordo com um aspecto adicional da presente invenção, em um método de decodificação de matriz de áudio recebendo um par de sinais estéreos Lt, Rt, em cujo método as amplitudes e polaridades relativas do par determinam a direção reproduzida de sinais decodificados, um método compreende mudar a direção de saídas associadas com direções frontais e traseiras para a esquerda ou direita, a direção de saídas associadas com direções traseiras sendo mudada por um grau maior que o da direção de saídas associadas com direções frontais, em que a modificação inclui modificar o par de sinais estéreos Lt, Rt ao formar um sinal diferencial de sinais Lt e Rt, escalonar o sinal diferencial por um fator de ganho de polarização, e somar o sinal diferencial escalonado a ambos os sinais Lt e Rt para produzir sinais Lt e Rt modificados de tal maneira que as amplitudes e polaridades relativas do par Lt e Rt modificado determinam a direção reproduzida de sinais decodificados.
[0009] De acordo com um aspecto adicional da presente invenção, um método para modificar um par de sinais estéreos Lt, Rt antes de o par de sinais ser decodificado por um decodificador ou método de decodificação de matriz de áudio, as amplitudes e polaridades relativas do par determinando a direção reproduzida de sinais decodificados compreende modificar o par de sinais estéreos Lt, Rt ao formar um sinal diferencial de sinais Lt e Rt, escalonar o sinal diferencial por um fator de ganho de polarização, e somar o sinal diferencial escalonado a ambos os sinais Lt e Rt para produzir sinais Lt e Rt modificados de tal maneira que as amplitudes e polaridades relativas do par Lt e Rt modificado determinam a direção reproduzida de sinais decodificados.
Descrição Resumida dos Desenhos
[00010] A figura 1 é um diagrama de blocos funcional esquemático mostrando um exemplo de como sinais Lt e Rt podem ser movidos ou guiados para direções frontais e traseiras de acordo com aspectos da presente invenção.
[00011] A figura 2 é um diagrama de blocos funcional esquemático mostrando um exemplo dos detalhes da "Determinação de Guiamento Frente-Traseira" da figura 1.
[00012] A figura 3 é um diagrama de blocos funcional esquemático mostrando um exemplo de como Lt e Rt podem ser modificados de acordo com aspectos da presente invenção.
[00013] A figura 4 é um diagrama conceitual útil para entender um efeito de modificar os sinais Lt e Rt de acordo com aspectos da presente invenção.
[00014] A figura 5 é um diagrama de blocos funcional esquemático mostrando um exemplo de como o Sinal de controle LR_bias da figura 3 pode ser derivado.
[00015] A figura 6 é um diagrama de blocos funcional esquemático mostrando o arranjo total dos arranjos das figuras 1, 2, 3 e 5.
Descrição da Invenção Deslocamento frente-traseira
[00016] O decodificador de matriz de acordo com aspectos da presente invenção trata os sinais Lt e Rt aplicados às suas entradas como um par de sinais estéreos, e ele desloca esses sinais para a frente (esquerda, L e direita, R) ou para a traseira (envolvente esquerda, Ls, e envolvente direita, Rs). Lt e Rt são deslocados para saídas associadas com direções frontais em resposta a uma medida da soma de Lt e Rt sendo maior que uma medida da diferença entre Lt e Rt. Lt e Rt são deslocados para saídas associadas com direções traseiras em resposta a uma medida da soma de Lt e Rt sendo menor que uma medida da diferença entre Lt e Rt. O deslocamento frente-traseira pode ser alcançado, por exemplo, tal como mostrado na figura 1. Neste diagrama de blocos, os sinais panF e panB são sinais de ganho de modificação lenta (sinais de áudio não de largura de banda total) que podem variar, por exemplo, entre 0 a 1. Os sinais panF e panB operam conjuntamente (eles são complementares um ao outro) para efetuar um desaparecimento gradual suave entre os sinais frontais L e R e os sinais traseiros Ls e Rs.
[00017] Referindo-se à figura 1, o sinal de entrada Lt é aplicado à saída L por meio de um multiplicador ou função multiplicadora 2 e à saída Ls por meio de um multiplicador ou função multiplicadora 4. O sinal de entrada Rt é aplicado à saída R por meio de um multiplicador ou função multiplicadora 6 e à saída Rs por meio de um multiplicador ou função multiplicadora 8. O ganho de cada um dos multiplicadores 2 e 6 é controlado pelo sinal de ganho panF; o ganho de cada um dos multiplicadores 4 e 8 é controlado pelo sinal de ganho panB. Os sinais de entrada Lt e Rt também são aplicados a um circuito ou função ("Determinação de Guiamento frente-traseira") 10 que gera os sinais panF e panB. Detalhes da Determinação de Guiamento Frente- Traseira estão mostrados na figura 2.
[00018] Submeter a suavização de tempo, tal como descrito a seguir, quando a "Determinação de Guiamento frente-traseira" 10 detecta áudio fora de fase, mas nenhum áudio em fase nos sinais de entrada Lt e Rt por um período de tempo suficiente, estabelece panB=1 e panF=0 direcionando, deslocando ou "guiando" assim os sinais de entrada Lt e Rt somente para os canais de saída envolvente Ls e Rs (guiamento traseiro rígido). Igualmente, quando existe áudio em fase, mas nenhum áudio fora de fase presente no sinal de entrada por um período de tempo suficiente, a "Determinação de Guiamento Frente-Traseira" 10 estabelece panB=0 e panF=l, guiando assim os sinais de entrada Lt e Rt somente para os canais de saída frontais, L e R (guiamento frontal rígido).
[00019] O arranjo na figura 2 gera, em uma base instantânea, a diferença entre as magnitudes da soma e a diferença dos sinais de entrada Lt e Rt (uma forma de onda variando rapidamente oscilando tanto positivamente quanto negativamente) e a compara com um pequeno limiar ε (epsilão). Isto é realizado pelo somador ou função de adição 12 que recebe Lt e Rt para produzir Lt + Rt na sua saída, cujo somador ou função de adição 14 subtrai Rt de Lt para produzir Lt - Rt na sua saída, pelos escalonadores ou funções de escalonamento 16 e 18 que escalonam as amplitudes de Lt + Rt e Lt - Rt para produzir sinais "frontais" e "traseiros" F e B,
Figure img0001
cujos sinais F e B são valores absolutos, mostrados nos dispositivos ou funções de valor absoluto 20 e 22, e por um somador ou função de adição 24 que subtrai o valor absoluto de B do valor absoluto de F e acrescenta um pequeno valor epsilão. Os elementos 12, 14, 16, 18, 20, 22 e 24 podem ser considerados coletivamente como um dispositivo ou função de "Diferença de Medidas de Soma e Diferença", elemento 25, como mostrado no arranjo total da figura 6.
[00020] A polaridade do resultado F -B + ε é determinada por um dispositivo ou função de "Detectar Polaridade" 26. Se negativa, a resposta é um valor, por exemplo, menos 1, se positiva, um outro valor, tal como zero. Claramente, valores a não ser menos 1 e zero podem ser empregados. O resultado é uma forma de onda de dois valores alternando entre dois níveis, menos 1 e 0, neste exemplo. Um filtro passa baixa ou função de filtragem ("Filtro Passa Baixa") ("LPF") 28 é aplicado, resultando em uma forma de onda FB variando mais lentamente que pode ter qualquer valor na faixa entre os valores dos dois níveis ou incluindo-os, dependendo da proporção de tempo que a onda quadrada gasta em cada um dos níveis. Em resposta aos sinais de áudio reais, a forma de onda suavizada produzida pelo LPF 28 tende a permanecer perto de um ou outro dos extremos. De fato, o LPF 28 entrega uma média de curta duração de sua entrada, tendo uma constante de tempo, por exemplo, na faixa de 5 a 100 milissegundos. Embora uma constante de tempo de 40 milissegundos tenha sido encontrada como sendo adequada, o valor não é crítico. O LPF 28 pode ser implementado como um filtro de único pólo.
[00021] Referindo-se ainda ao exemplo da figura 2, tendo determinado o sinal de controle intermediário FB, dois coeficientes de deslocamento complementares panF e panB podem então ser obtidos em qualquer um dos diversos modos por meio de um dispositivo ou função de "Determinar Funções de Deslocamento" 30. Em princípio, qualquer uma das várias funções de desaparecimento gradual usadas comumente pode ser empregada, tal como uma rampa linear, logarítmica, Hanming, Hamming e funções senoidais. Será percebido que as fórmulas reais variarão dependendo dos valores de saída escolhidos para a Detecção de Polaridade 26.
[00022] Se deslocamento de potência constante for desejado, as fórmulas seguintes podem ser empregadas:
Figure img0002
[00023] Alternativamente, se pressão de som constante for suposta preferível, ou pelo menos aceitável, as fórmulas seguintes podem ser empregadas:
Figure img0003
[00024] Embora as equações 3 e 4 acima forneçam potência constante (a soma dos quadrados dos coeficientes panF e panB é um), potência constante pode ser aproximada ao empregar as fórmulas seguintes:
Figure img0004
[00025] Os valores de cada um de panF e panB no exemplo das equações 7 e 8 podem se situar em qualquer lugar entre 0 e 1 e são complementares um ao outro, cada um seguindo o caminho de uma parábola. O resultado são dois coeficientes ou sinais de controle com faixas entre 0 e 1, cujos quadrados somam aproximadamente 1.
[00026] Se panF fosse declarado de forma consistente maior que panB em qualquer um dos conjuntos de fórmulas indicados acima, o que é o resultado, por exemplo, quando Lt e Rt são iguais com a mesma polaridade, de maneira que a entrada para o LPF 28 é 0 durante um longo tempo, o deslocamento direcionaria frontal rígido (panF=l e panB=0). Se panF fosse de forma consistente menor que panB, o que é o resultado, por exemplo, quando Lt e Rt são iguais, mas defasados, de maneira que a entrada para o LPF seria -1 durante um longo tempo, o deslocamento direcionaria traseiro rígido (panF=0 e panB=l). Em sinais reais, tal como com o sinal intermediário FB, deslocamento tende a permanecer frontal rígido ou traseiro rígido. Assim, Lt e Rt são deslocados para saídas associadas com direções frontais em resposta a uma medida da soma de Lt e Rt sendo maior que uma medida da diferença entre Lt e Rt, e Lt e Rt são deslocados para saídas associadas com direções traseiras em resposta a uma medida da soma de Lt e Rt sendo menor que uma medida da diferença entre Lt e Rt. Quando uma medida da soma de Lt e Rt é igual a uma medida da diferença entre Lt e Rt, Lt e Rt podem ser deslocados para saídas associadas com direções frontais, embora isto não seja crítico.
[00027] A figura 2 fornece um exemplo de geração de sinais de controle panF e panB adequados. Modificações da figura 2, por exemplo, tal como sugerido anteriormente, podem ser empregadas. Alternativamente, outros arranjos que fornecem sinais se deslocando suavemente em resposta às medidas da soma e diferença de Lt e Rt podem ser empregados.
Deslocamento Esquerda-Direita
[00028] Idealmente, deslocamento esquerda-direita é como se segue: quando Lt, Rt é deslocado para a frente (L, R), usa-se menos guiamento esquerda-direita do que é aplicado quando Lt, Rt é deslocado para a traseira, por causa de o sinal Lt, Rt provavelmente conter componentes de sinal L, C, R completos já misturados em um par estéreo em um modo que provavelmente é para fornecer um bom campo sonoro esquerda-direita quando reproduzido, incluindo uma imagem central imaginária.
[00029] Quando Lt, Rt é deslocado para a traseira (Ls, Rs), determina-se qual canal (Ls ou Rs) tem a maior amplitude, e então modifica-se os sinais Lt, Rt de maneira que sinais traseiros são deslocados para o lado no qual tais sinais têm a maior amplitude. Tal como explicado adicionalmente a seguir, em uma implementação da invenção, tal modificação também pode ter um efeito, embora um efeito menor, quando Lt, Rt é deslocado para a frente (L, R).
[00030] Um problema comum em muitos decodificadores de matriz é a incapacidade para trabalhar bem para o caso onde sinais de entrada são deslocados para a posição centro-traseira. Isto é um problema particularmente quando reprodução emprega um virtualizador de fone de ouvido ou um virtualizador de alto-falante. A posição centro-traseira, por exemplo, é codificada com Lt e Rt defasados um do outro. Consequentemente, quando os sinais Lt, Rt são deslocados para Ls, Rs, sinais de centro-traseira aparecem nos sinais Ls, Rs defasados. Uma imagem imaginária traseira não é bem formada por meio de tais sinais defasados.
[00031] Um aspecto da presente invenção é mudar sinais Ls, Rs para a esquerda ou direita, evitando assim a posição imaginária centro-traseira que causa dificuldade em imageamento. Isto pode ser alcançado ao executar uma operação de "mudança"nos sinais Lt, Rt, tal como mostrado na figura 3 e tal como descrito a seguir. A maior mudança pode ser aplicada aos sinais centro-traseira e menor mudança para posições progressivamente longes da centro-traseira. A mudança mínima (ou nenhuma mudança) pode ser aplicada aos sinais centro-frontal com uma mudança aumentando progressivamente para posições longe da centro-frontal. Em outras palavras, mudança deve alterar a centro-traseira com o máximo e a centro-frontal com o mínimo. Ao evitar ou minimizar mudança na posição centro-frontal sob todas as condições, mudanças de localização de imagem de vozes (diálogos), os quais são usualmente na centro-frontal, são evitadas ou minimizadas. Em princípio, um dispositivo ou função de mudança no modo do exemplo da figura 3 pode ser empregado a fim de modificar a entrada Lt, Rt para qualquer decodificador ou função de decodificação de matriz de duas entradas no qual a operação de decodificador ou de função de decodificação responde às amplitudes e polaridades relativas de Lt e Rt.
[00032] Uma operação de "mudança"adequada está mostrada na figura 3 na qual um sinal diferencial Lt-Rt é gerado. Então, uma quantidade ponderada deste sinal diferencial é misturada de volta para ambos Lt e Rt para produzir Ltponderado e Rtponderado. A entrada de controle (LR_bias) pode adotar um valor de +a ou -a, dependendo de se a "mudança" é pretendida para mudar os canais traseiros para a esquerda ou para a direita. A LR_bias pode ser determinada, por exemplo, tal como mostrado no exemplo da figura 5. Alfa pode ter um valor, por exemplo, na faixa de 0,05 a 0,2. Um valor de 0,1 tem sido encontrado para fornecer resultados úteis.
[00033] Referindo-se ao detalhes da figura 3, Rt é subtraído de Lt em um somador ou dispositivo de adição 32 para obter Lt-Rt que é então escalonado por LR_bias em um multiplicador ou função de multiplicação 34. A versão escalonada de Lt-Rt é então somada com cada um de Lt e Rt nos respectivos somadores ou funções de adição 36 e 38 para obter Ltponderado e Rtponderado.
[00034] Considerar diversos exemplos da operação do arranjo de mudança da figura 3 como se segue.
[00035] Por exemplo, quando LR_bias = +0,1 (indicando que a mudança deve ser para a esquerda), obtém-se:
Figure img0005
[00036] Continuando com este exemplo (LR_bias = +0,1), considerar o caso onde o sinal de entrada Lt, Rt é composto de um sinal deslocado para o centro: Lt = Rt = C. Neste caso, tem-se:
Figure img0006
[00037] Neste caso, os sinais Ltponderado e Rtponderado são os mesmos que Lt, Rt. Em outras palavras, o circuito de mudança não modifica os sinais Lt, Rt quando a entrada contém somente áudio deslocado centro-frontal.
[00038] Em contraste, considerar o caso onde o sinal de entrada Lt, Rt é composto de um sinal deslocado centro-traseira, S:Lt = S, Rt= -S. Neste caso, obtém-se:
Figure img0007
Figure img0008
[00039] Neste caso, os sinais Ltponderado e Rtponderado são modificados pelo circuito ou processo de mudança, de tal maneira que Ltponderado foram elevados em amplitude, e Rtponderado foram reduzidos em amplitude. Deve-se notar que, se LR_bias fosse estabelecida para -0,1 em vez de +0,1, as mudanças de amplitude seriam invertidas, com Rtponderado sendo elevado em nível enquanto que Lt Ltponderado é reduzido.
[00040] Idealmente, o circuito ou processo de mudança opera de maneira que os canais envolventes são deslocados para a esquerda ou direita, e os canais dianteiros são deslocados de forma similar, mas por um menor grau. Um exemplo de mudança para a esquerda está mostrado na figura 4 na qual o círculo de linha cheia representa um círculo de codificação de matriz, no qual as posições de canal L (esquerda), C (centro), R (direita), Ls (envolvente esquerda), S (envolvente ou envolvente traseira) e Rs (envolvente direita) tradicionais estão mostradas. Este círculo tem raio de unidade, refletindo o fato de que cada canal tem potência de unidade. O círculo de linha tracejada mostra o efeito sobre o círculo de unidade da operação de mudança. A mudança longe do círculo de unidade indica que a potência de algumas direções de sinal foi elevada ou atenuada. Em particular, deve-se notar que a posição centro-traseira S está mudada pela maior quantidade com progressivamente menos mudança para direções distantes e mais distantes de S sem mudança ocorrendo na posição centro-frontal C.
[00041] Um exemplo de um modo para determinar um sinal LR_bias adequado está mostrado na figura 5. O sinal LR_bias é baseado principalmente em LR, uma diferença de amplitude de média de curta duração entre os sinais Ltponderado e Rtponderado. Em outras palavras, LR é uma estimativa de Ltponderado versus Rtponderado. LR_bias é calculado no dispositivo ou função de "Determinar Mudança"40 em resposta a se cada um de LR, FB (figura 2) é menor ou maior que um limiar, e em resposta a Lt - Rt. Um cálculo como este pode ser expressado no pseudocódigo de programação:
Figure img0009
[00042] Alternativamente, FB e LR podem ser multiplicados e a polarização determinada por ser o resultado maior que um limiar. Tal cálculo pode ser expressado no pseudocódigo de programação:
Figure img0010
[00043] O sinal LR_bias pode ser determinado como se segue. Primeiro medir a amplitude relativa dos sinais Ltponderado e Rtponderado. Sinal intermediário, LR, uma estimativa de Ltponderado versus Rtponderado, uma diferença de amplitude de média de curta duração entre os sinais Ltponderado e Rtponderado, podem ser determinados como se segue:
Figure img0011
[00044] Deve-se notar que um pequeno deslocamento positivo, ε (epsilão), é acrescentado ao denominador da fração na equação 7, para assegurar que nenhum erro ocorre quando Lt e Rt são ambos zero. A fim de estimar LR, deve-se notar que o valor correto de LR deve resultar no ErroLR sendo igual a zero:
Figure img0012
[00045] Um modo para criar o valor suavizado de curta duração de LR é incrementar ou decrementar o valor instantâneo da diferença de amplitude entre os sinais Ltponderado e Rtponderado (por um pequeno incremento, tal como 2-10), baseado no valor do ErroLR, como se segue:
Figure img0013
[00046] Deste modo, o próximo valor de LR (referido como LR' na equação acima), se deslocará na direção do valor correto em um modo de degrau de escada.
[00047] A suavização ou média de curta duração (refletida nas equações 1,5 e 1,6 como "avg") é um resultado da suavização que resulta das etapas incrementais que tentam reduzir o erro LR. A suavização pode ter uma constante de tempo entre cerca de 5 e 100 milissegundos. Valores de 20 e 40 milissegundos têm sido encontrados como sendo úteis. Na implementação descrita, LR pode assumir valores de -1 (indicando um deslocamento esquerdo rígido) a +1 (indicando um deslocamento direito rígido). LR pode ter um valor inicial de zero, exigindo assim 1.024 incrementos para ele alcançar +1 ou -1. Obviamente, 2.048 incrementos são exigidos para LR ir de esquerdo rígido para direito rígido.
[00048] Se implementado em um sistema digital, os incrementos e decrementos podem ser feitos na taxa de bits de áudio (48 kHz, por exemplo, quando incrementos de 2-10são empregados). Em princípio, a presente invenção pode ser implementada completamente ou de forma parcial no domínio analógico.
[00049] Referindo-se de novo à figura 5, Ltponderado e Rtponderado têm seus valores absolutos considerados, mostrados nos dispositivos ou funções de valor absoluto 42 e 44. Um somador ou função de adição 46 adiciona o valor absoluto de Ltponderado e o valor absoluto Rtponderado ao pequeno valor epsilão e aplica o resultado a um multiplicador ou função multiplicadora 48 que também recebe uma versão atrasada de uma amostra de LR para produzir o produto de LR e a soma do valor absoluto de Ltponderado, o valor absoluto Rtponderado e epsilão. Um somador ou função de adição 50 subtrai o valor absoluto de Rtponderado do valor absoluto de Ltponderado. O sinal de erro (equação 8) é então obtido da saída do somador ou função de adição 52. O sinal de erro é aplicado ao dispositivo ou função signum() 54 que produz +1 se a entrada for maior que zero, -1 se a entrada for menor que zero, e 0 se a entrada for zero (embora algumas implementações DSP de uma função como esta sejam simplificadas, de maneira que signum() pode ser +1 para uma entrada que é igual ou maior que zero, e -1 para entrada negativa). A saída do dispositivo ou função signum 54 é multiplicada pelo fator de escala 2-10 no multiplicador ou função de multiplicação 56 e somada com a versão atrasada de uma amostra de LR (fornecida pelo dispositivo ou função de atraso 60) no somador ou função de adição 58. Os elementos 42, 44, 46, 48, 50, 52, 54, 56, 58 e 60 podem ser considerados coletivamente como um dispositivo ou função de "Determinar Diferença de Média de Curta Duração", elemento 61, tal como mostrado no arranjo total da figura 6.
[00050] Uma vez que o valor de LR tenha sido determinado, o valor de sinal LR_bias é atualizado na Determinação de Mudança 40 de acordo com o pseudocódigo mostrado primeiro acima e as seguintes regras lógicas:
[00051] 1. LR_bias será sempre igual a +a ou -a, onde a é na faixa de, por exemplo, 0,05 a 0,2. Na prática, um valor de 0,1 tem sido encontrado para fornecer resultados úteis.
[00052] 2. O sinal LR_bias somente muda entre seu dois valores admissíveis quando existe uma passagem por zero no sinal Lt-Rt. Isto minimiza a possibilidade na qual uma mudança em LR_bias resultará em um clique audível na saída.
[00053] 3. Quando o sinal LR indica que Ltponderado é maior em amplitude do que Rtponderado (quando LR>0), e quando o sinal FB indica que os sinais Lt, Rt devem ser deslocado na direção da traseira por mais que um limiar apropriado (por exemplo, quando FB<-0,1), estabelecer então LR_bias para +0,1 (quando existe uma passagem por zero no sinal diferencial Lt-Rt). Em outras palavras, é permitido que o valor de LR_bias mude quando os sinais Lt, Rt são deslocados para a traseira por mais que um limiar. Entretanto, o valor mais recente de LR_bias permanece efetivo se os sinais Lt, Rt são ou não deslocado para a traseira ou deslocado para a frente.
[00054] 4. Quando o sinal LR indica que Rtponderado é maior em amplitude do que Ltponderado (quando LR<0), e quando o sinal FB indica que os sinais Lt, Rt devem ser deslocado na direção da traseira por mais que um limiar (por exemplo, quando FB<-0,1 tal como mencionado anteriormente), estabelecer então LR_bias para -0,1 (quando existe uma passagem por zero no sinal diferencial Lt-Rt). A maneira na qual LR = 0 é manuseado não é crítica. Uma possibilidade é quando LR = 0 não fazer nada (deixar LR_bias inalterado) ou, alternativamente, agir tal como quando LR>0 tal como descrito exatamente acima no parágrafo 3.
[00055] Deve-se notar que o sinal LR_bias é determinado a partir das amplitudes dos sinais Ltponderado e Rtponderado, e os sinais Ltponderado e Rtponderado são modificados pelo sinal LR_bias, formando assim um laço de realimentação no algoritmo total. Este é um laço de realimentação positivo que torna o comportamento total biestável em natureza. Como resultado, o arranjo exibe histerese. Por exemplo, quando LR_bias = +0,1, isto faz com que o circuito de mudança exagere o sinal Ltponderado, elevando-o proporcionalmente em comparação com o sinal Rtponderado que, por sua vez, aumentará o sinal LR (empurrando-o para cima em uma direção positiva). Como resultado, um sinal Rt muito maior (em relação à Lt) é exigido para mudar LR_bias de volta para -0,1. Tal histerese assegura que é menos provável que o sistema exiba mudança rápida para frente e para trás no sinal LR_bias, o que de outro modo pode ser indesejável ao causar artefatos audíveis tais como mudança de imagem.
[00056] Mudança de imagem também é minimizada ao permitir que LR_bias mude somente quando o deslocamento é para a traseira. Mudanças de Imagem são mais perceptíveis quando na frente. Também, reter a mesma mudança quando deslocamento da traseira para frente e da frente para traseira evita mudanças de imagem quando tais deslocamentos ocorrem. Entretanto, mudanças no LR_bias tipicamente ocorrerão quando ocorre uma mudança em conteúdo de áudio. Assim, uma mudança em localização de imagem é frequentemente exigida em uma mudança como esta e é desejável.
[00057] Será notado que tanto o deslocamento frente-traseira quanto o deslocamento esquerda-direita empregam constantes de tempo. Embora valores sugeridos para tais constantes de tempo tenham sido dados, será entendido que valores de suavização para um grau são uma questão do gosto do projetista e podem ser escolhidos por tentativa e erro. Além do mais, valores de suavização desejáveis podem variar dependendo do conteúdo de áudio.
[00058] A figura 6 mostra a maneira na qual as figuras 1, 2, 3 e 5 descritas anteriormente encaixam-se conjuntamente.
Implementação
[00059] Embora em princípio a invenção possa ser praticada no domínio analógico ou digital (ou alguma combinação dos dois), em modalidades práticas da invenção, sinais de áudio são representados por amostras nos blocos de dados e processamento é feito no domínio digital.
[00060] A invenção pode ser implementada em hardware ou software, ou em uma combinação de ambos (por exemplo, matrizes lógicas programáveis). A não ser que especificado de outro modo, algoritmos e processos incluídos como parte da invenção não estão inerentemente relacionados a qualquer computador particular ou outro aparelho. Em particular, várias máquinas de uso geral podem ser usadas com programas gravados de acordo com os preceitos deste documento, ou pode ser mais conveniente construir aparelho mais especializado (por exemplo, circuitos integrados) para executar as etapas de método exigidas. Assim, a invenção pode ser implementada em um ou mais programas de computador executando em um ou mais sistemas de computadores programáveis, cada um compreendendo pelo menos um processador, pelo menos um sistema de armazenamento de dados (incluindo memória volátil e não volátil e/ou elementos de armazenamento), pelo menos um dispositivo ou porta de entrada, e pelo menos um dispositivo ou porta de saída. Código de programa é aplicado para introduzir dados para executar as funções descritas neste documento e gerar informação de saída. A informação de saída é aplicada a um ou mais dispositivos de saída, em modo conhecido.
[00061] Cada tal programa pode ser implementado em qualquer linguagem de computador desejada (incluindo linguagens de programação de máquina, montagem, ou alto nível processual, lógica, ou orientada por objeto) para se comunicar com um sistema de computador. Em qualquer caso, a linguagem pode ser uma linguagem compilada ou interpretada.
[00062] Cada tal programa de computador preferivelmente é armazenado em uma mídia ou dispositivo de armazenamento ou transferido para ela (por exemplo, memória ou mídia de estado sólido, ou mídia magnética ou ótica) legível por um computador programável de uso geral ou especial, para configurar e operar o computador quando a mídia ou dispositivo de armazenamento é lida pelo sistema de computador para executar os procedimentos descritos neste documento. O sistema inventivo também pode ser considerado para ser implementado como uma mídia de armazenamento legível por computador, configurada com um programa de computador, onde a mídia de armazenamento assim configurada faz com que um sistema de computador opere em uma maneira específica e predefinida para executar as funções descritas neste documento.
[00063] Diversas modalidades da invenção foram descritas. Apesar disso, será entendido que várias modificações podem ser feitas sem divergir do espírito e escopo da invenção. Por exemplo, algumas das etapas descritas neste documento podem ter ordem independente, e assim podem ser executadas em uma ordem diferente dessa descrita.

Claims (13)

1. Método de decodificação de matriz de áudio recebendo um par de sinais estéreos Lt, Rt, em cujo método as amplitudes e polaridades relativas do par determinam a direção reproduzida de sinais decodificados, compreendendo a etapa de: mover (2, 6) Lt e Rt para saídas associadas com direções frontais em resposta a uma medida da soma de Lt e Rt sendo maior que uma medida da diferença entre Lt e Rt, e mover (4, 8) Lt e Rt para saídas associadas com direções traseiras em resposta a uma medida da soma de Lt e Rt sendo menor que uma medida da diferença entre Lt e Rt, e caracterizado pelo fato de que compreende ainda: modificar o par de sinais estéreos Lt e Rt para mudar a direção de sinais reproduzidos formando (32) um sinal diferencial dos sinais Lt e Rt, escalonando (34) o sinal diferencial por um fator de ganho de descolamento, e somando (36, 38) o sinal diferencial escalonado aos sinais Lt e Rt para produzir sinais Lt e Rt modificados de modo que as amplitudes e polaridades relativas do par Lt e Rt modificado determinam a direção de reprodução de sinais decodificados.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa de modificar Lt e Rt para mudar a direção de sinais reproduzidos desloca sinais movidos (4, 8) para saídas associadas com direções traseiras.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a etapa de modificar Lt e Rt para mudar a direção de sinais reproduzidos desloca sinais movidos (4, 8) para saídas associadas com direções traseiras para deslocar sinais para longe da direção centro-traseira.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que sinais movidos (4, 8) para saídas associadas com direções traseiras são deslocados para longe da direção centro- traseira na direção nas quais os sinais têm a maior amplitude.
5. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que o grau de deslocamento é maior para sinais na posição centro-traseira, a mudança diminuindo progressivamente para sinais em direções cada vez mais longe da direção centro-traseira.
6. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a etapa de modificar Lt e Rt para mudar a direção de sinais reproduzidos também desloca sinais movidos (2, 6) para saídas associadas com direções frontais.
7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que a etapa de modificar Lt e Rt para mudar a direção de sinais reproduzidos desloca sinais movidos (2, 6) para saídas associadas com direções frontais para deslocar menos sinais na direção centro-frontal.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que o grau de deslocamento é mínimo para sinais na posição centro-frontal, o deslocamento aumentando progressivamente para sinais em direções cada vez mais longe da direção centro-frontal.
9. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o grau de deslocamento é baseado em uma medida da diferença entre Lt e Rt.
10. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o grau de deslocamento muda somente quando Lt e Rt são movidos (4, 8) para saídas associadas com direções traseiras.
11. Aparelho caracterizado pelo fato de que é adaptado para executar o método conforme definido na reivindicação 1.
12. Mídia não-transitória legível por computador caracterizada pelo fato de que compreende o método conforme definido na reivindicação 1.
13. Método para modificar um par de sinais estéreos Lt, Rt antes do par de sinais ser decodificado por um decodificador ou método de decodificação de matriz de áudio, as amplitudes e polaridades relativas do par determinando a direção reproduzida de sinais decodificados caracterizado pelo fato de que compreende as etapas de: modificar o par de sinais estéreos Lt, Rt formando (32)um sinal diferencial de sinais Lt e Rt, escalonar (34) o sinal diferencial por um fator de ganho de polarização, e somar (36, 38) o sinal diferencial escalonado aos sinais Lt e Rt para produzir sinais Lt e Rt modificados de modo que as amplitudes e polaridades relativas do par Lt e Rt modificado determinam a direção reproduzida de sinais decodificados.
BRPI0907610-7A 2008-01-11 2009-01-06 método de decodificação de matriz de áudio, aparelho, mídia não-transitória legível por computador e método para modificar um par de sinais estéreos BRPI0907610B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US1089608P 2008-01-11 2008-01-11
US61/010,896 2008-01-11
PCT/US2009/030204 WO2009089209A1 (en) 2008-01-11 2009-01-06 Matrix decoder

Publications (2)

Publication Number Publication Date
BRPI0907610A2 BRPI0907610A2 (pt) 2015-07-21
BRPI0907610B1 true BRPI0907610B1 (pt) 2020-12-29

Family

ID=40637689

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0907610-7A BRPI0907610B1 (pt) 2008-01-11 2009-01-06 método de decodificação de matriz de áudio, aparelho, mídia não-transitória legível por computador e método para modificar um par de sinais estéreos

Country Status (16)

Country Link
US (1) US8488798B2 (pt)
EP (1) EP2241119B1 (pt)
JP (1) JP5216102B2 (pt)
KR (1) KR101524514B1 (pt)
CN (1) CN101911731B (pt)
AU (1) AU2009204238B2 (pt)
BR (1) BRPI0907610B1 (pt)
CA (1) CA2711144C (pt)
HK (1) HK1144133A1 (pt)
IL (1) IL206555A (pt)
MX (1) MX2010008183A (pt)
MY (1) MY161520A (pt)
RU (1) RU2456766C2 (pt)
TW (1) TWI424755B (pt)
UA (1) UA99639C2 (pt)
WO (1) WO2009089209A1 (pt)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI540912B (zh) * 2010-05-25 2016-07-01 晨星半導體股份有限公司 音訊處理裝置及音訊處理方法
EP2645748A1 (en) 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4748669A (en) * 1986-03-27 1988-05-31 Hughes Aircraft Company Stereo enhancement system
US6624873B1 (en) * 1998-05-05 2003-09-23 Dolby Laboratories Licensing Corporation Matrix-encoded surround-sound channels in a discrete digital sound format
TW510143B (en) * 1999-12-03 2002-11-11 Dolby Lab Licensing Corp Method for deriving at least three audio signals from two input audio signals
US6970567B1 (en) * 1999-12-03 2005-11-29 Dolby Laboratories Licensing Corporation Method and apparatus for deriving at least one audio signal from two or more input audio signals
AU8852801A (en) * 2000-08-31 2002-03-13 Dolby Lab Licensing Corp Method for apparatus for audio matrix decoding
US7177432B2 (en) * 2001-05-07 2007-02-13 Harman International Industries, Incorporated Sound processing system with degraded signal optimization
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
JP2005223706A (ja) * 2004-02-06 2005-08-18 Victor Co Of Japan Ltd ビデオカメラの録音装置
TWI420918B (zh) * 2005-12-02 2013-12-21 Dolby Lab Licensing Corp 低複雜度音訊矩陣解碼器

Also Published As

Publication number Publication date
HK1144133A1 (en) 2011-01-28
US8488798B2 (en) 2013-07-16
UA99639C2 (en) 2012-09-10
TWI424755B (zh) 2014-01-21
BRPI0907610A2 (pt) 2015-07-21
KR20100108416A (ko) 2010-10-06
RU2456766C2 (ru) 2012-07-20
US20100284542A1 (en) 2010-11-11
CN101911731B (zh) 2012-12-05
IL206555A0 (en) 2010-12-30
JP2011509641A (ja) 2011-03-24
AU2009204238A1 (en) 2009-07-16
MY161520A (en) 2017-04-28
MX2010008183A (es) 2010-09-22
CA2711144A1 (en) 2009-07-16
CN101911731A (zh) 2010-12-08
CA2711144C (en) 2016-06-28
EP2241119A1 (en) 2010-10-20
IL206555A (en) 2015-06-30
WO2009089209A4 (en) 2009-10-08
JP5216102B2 (ja) 2013-06-19
TW200944047A (en) 2009-10-16
RU2010133557A (ru) 2012-02-20
WO2009089209A1 (en) 2009-07-16
KR101524514B1 (ko) 2015-06-02
AU2009204238B2 (en) 2013-04-04
EP2241119B1 (en) 2013-09-18

Similar Documents

Publication Publication Date Title
JP4624643B2 (ja) オーディオ・マトリックス・デコーディング装置に関する方法
Giannoulis et al. Digital dynamic range compressor design—A tutorial and analysis
BRPI0509110B1 (pt) Método e dispositivo para processar um sinal estéreo, aparelhos codificador e decodificador, e, sistema de áudio
ES2220572T3 (es) Metodo para derivar al menos tres señales de audio a partir de dos señales de audio de entrada.
BR112017026915B1 (pt) Processador e codificador de áudio e método para processar e gerar sinal de áudio
JP2005523672A (ja) マルチチャネル・ダウンミキシング装置
JP2017517020A (ja) ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置
BR122019024041B1 (pt) Método para filtrar um sinal multicanal de áudio e meio legível em computador
KR102349931B1 (ko) 상관해제 필터들의 적응적 제어를 위한 방법 및 장치
BRPI0923440B1 (pt) método de virtualização de som surround e sistema de virtualização de som surround
KR101756838B1 (ko) 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
BR112019021904A2 (pt) Dispositivo e método de processamento de sinal, e, programa.
BRPI0907610B1 (pt) método de decodificação de matriz de áudio, aparelho, mídia não-transitória legível por computador e método para modificar um par de sinais estéreos
CN107408929B (zh) 调节音量增益以适应放大器功率限制的方法和放大器
US8259970B2 (en) Adaptive remastering apparatus and method for rear audio channel
BR112017006325B1 (pt) Método de decodificação e decodificador para o realce de diálogo
MXPA02005520A (es) Metodo y aparato para derivar al menos una senal de audio a partir de dos o mas senales de audio de entrada.
BR112016006323B1 (pt) Conceito para gerar um sinal de downmix
Perraudin et al. Gabor dual windows using convex optimization
BR112015028914B1 (pt) Método e aparelho para reconstruir um bloco de tempo/frequência de objetos de áudio n, método e codificador para gerar pelo menos um parâmetro de ponderação, e meio legível por computador
ES2973047T3 (es) Mezclador descendente, codificador de audio, procedimiento y programa informático que aplican un valor de fase a un valor de magnitud
Lukin et al. A two-pass algorithm for automatic loudness correction
JP2006114998A (ja) ディジタル信号処理方式
JP2006221783A (ja) 非対称最尤検出のための機器、システム、信号担持媒体、および方法(非対称最尤検出のための機器、システム、および方法)

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 29/12/2020, OBSERVADAS AS CONDICOES LEGAIS.