DECODIFICADOR DE ÁUDIO, MÉTODO DE DECODIFICAÇÃO DE ÁUDIO, RECEPTOR PARA RECEBER UM SINAL DE N CANAIS, SISTEMA DE TRANSMISSÃO PARA TRANSMITIR UM SINAL DE ÁUDIO, MÉTODO PARA RECEBER UM SINAL DE ÁUDIO, MÉTODO PARA TRANSMITIR E RECEBER UM SINAL DE ÁUDIO, MÍDIA DE ARMAZENAMENTO LEGÍVEL POR COMPUTADOR, E, DISPOSITIVO DE REPRODUÇÃO DE ÁUDIO [001] A invenção relaciona-se à decodificação de áudio e em particular, mas não exclusivamente, à decodificação de sinais Envolventes de MPEG.
[002] Codificação digital de vários sinais de fonte se tornou crescentemente importante durante as últimas décadas como representação de sinal digital e comunicação substituiu crescentemente representação analógica e comunicação. Por exemplo, distribuição de conteúdo de mídia, tal como vídeo e música está baseado crescentemente em codificação de conteúdo digital.
[003] Além disso, na última década houve uma tendência para áudio de multicanais e especificamente para áudio espacial se estendendo além de sinais estéreos convencionais. Por exemplo, gravações estéreos tradicionais só incluem dois canais enquanto sistemas de áudio avançados modernos tipicamente usam cinco ou seis canais, como nos sistemas de som envolvente
5.1 populares. Isto provê uma experiência de audição mais envolvida, onde o usuário pode ser cercado por fontes de som.
[004] Várias técnicas e padrões foram desenvolvidos para comunicação de tais sinais de multicanais. Por exemplo, seis canais discretos que representando um sistema envolvente 5.1 podem ser transmitidos de acordo com padrões tais como os padrões de Codificação de Áudio Avançada (AAC) ou Digital Dolby.
[005] Porém, a fim de prover compatibilidade reversa, é conhecido
Petição 870190059486, de 26/06/2019, pág. 7/89 / 34 misturar descendentemente o número mais alto de canais a um número mais baixo e especificamente é frequentemente usado para misturar descendentemente um sinal de som envolvente 5.1 a um sinal estéreo permitindo um sinal estéreo ser reproduzido por decodificadores de legado (estéreo) e um sinal 5.1 por decodificadores de som envolvente.
[006] Um exemplo é o método de codificação compatível reverso de
MPEG2. Um sinal de multicanais é misturado descendentemente em um sinal estéreo. Sinais adicionais são codificados como dados de multicanais na porção de dados auxiliares permitindo a um decodificador de multicanais de MPEG2 gerar uma representação do sinal de multicanais. Um decodificador de MPEG1 desconsiderará os dados auxiliares e assim só decodificará a mixagem descendente estéreo. A desvantagem principal do método de codificação aplicado em MPEG2 é que a taxa de dados adicional requerida para os sinais adicionais está na mesma ordem de magnitude como a taxa de dados requerida para codificar o sinal estéreo. A taxa de bit adicional para estender estéreo a áudio de multicanais é, portanto, significante.
[007] Outros métodos existentes transmissão de multicanais compatível reversa sem informação de multicanais adicional podem ser caracterizados tipicamente como métodos envolventes matriciais. Exemplos de codificação envolvente matricial incluem métodos tais como Dolby Prologic II e Logic-7. O princípio comum destes métodos é que eles multiplicam em matriz os múltiplos canais do sinal de entrada por uma matriz adequada por esse meio gerando um sinal de saída com um número mais baixo de canais. Especificamente, um codificador matricial tipicamente aplica deslocamentos de fase aos canais envolventes antes de mixá-los com canais dianteiro e central.
[008] Outra razão para uma conversão de canal é eficiência de codificação. Foi achado que por exemplo sinais de áudio envolventes podem ser codificados como sinais de áudio de canal estéreo combinados com um
Petição 870190059486, de 26/06/2019, pág. 8/89 / 34 fluxo de bits de parâmetro descrevendo as propriedades espaciais do sinal áudio. O decodificador pode reproduzir os sinais de áudio estéreo com um grau muito satisfatório de precisão. Deste modo, economia de taxa de bit significativa pode ser obtida.
[009] Há vários parâmetros que podem ser usados para descrever as propriedades espaciais de sinais de áudio. Um tal parâmetro é a correlação cruzada inter-canal, tal como a correlação cruzada entre o canal esquerdo e o canal direito para sinais estéreos. Outro parâmetro é a relação de potência dos canais. Nos denominados codificadores de áudio espaciais (paramétricos), tal como o codificador de MPEG Envolvente, estes e outros parâmetros são extraídos do sinal áudio original assim para produzir um sinal de áudio tendo um número reduzido de canais, por exemplo só um único canal, mais um conjunto de parâmetros descrevendo as propriedades espaciais do sinal áudio original. Nos denominados decodificadores de áudio espaciais (paramétricos), as propriedades espaciais como descritas pelos parâmetros espaciais transmitidos são reinstalados.
[0010] Tal codificação de áudio espacial preferivelmente emprega uma estrutura hierárquica em cascata ou baseada em árvore compreendendo unidades padrões no codificador e no decodificador. No codificador, estas unidades padrões podem ser misturadores descendentes combinando canais em um número mais baixo de canais tais como 2 para 1, 3 para 1, 3 para 2, etc., misturadores descendentes, enquanto no decodificador unidades padrões correspondentes podem ser misturadores ascendentes dividindo canais em um número mais alto de canais tais como 1 para 2, 2 para 3 misturadores ascendentes.
[0011] Figura 1 ilustra um exemplo de um codificador para codificar sinais de áudio de multicanais de acordo com a abordagem atualmente sendo padronizada por MPEG sob o nome MPEG Envolvente. O sistema de MPEG
Envolvente codifica um sinal de multicanais como uma mixagem descendente
Petição 870190059486, de 26/06/2019, pág. 9/89 / 34 mono ou estéreo acompanhada por um conjunto de parâmetros. O sinal de mixagem descendente pode ser codificado por um codificador de áudio de legado, tal como por exemplo um codificador de MP3 ou AAC. Os parâmetros representam a imagem espacial do sinal de áudio de multicanais e podem ser codificados e embutidos de um modo compatível reverso ao fluxo áudio de legado.
[0012] No lado de decodificador, o fluxo de bit de núcleo é decodificado primeiro resultando no sinal de mixagem descendente mono ou estéreo sendo gerado. Decodificadores de legado, isto é, decodificadores que não fazem uso de decodificação de MPEG Envolvente, ainda podem decodificar este sinal de mixagem descendente. Se, porém, um decodificador de MPEG Envolvente estiver disponível, os parâmetros espaciais são reinstalados resultando em uma representação de multicanais que é perceptivamente perto do sinal de entrada de multicanais original. Um exemplo de um decodificador envolvente de MPEG é ilustrado na Figura 2.
[0013] À parte da codificação/decodificação espacial básica como ilustrada na Figura 1 e Figura 2, o sistema de MPEG Envolvente oferece um conjunto rico de características habilitando um grande domínio de aplicação. Uma das características mais proeminentes é chamada Compatibilidade de Matriz ou Compatibilidade Envolvente Matricial.
[0014] Exemplos de sistemas envolventes matriciais tradicionais são Dolby ProLogic I e II e 'Circle Surround'. Estes sistemas operam como ilustrado na Figura 3. O sinal de entrada de PCM de multicanais é transformado a um denominado sinal de mixagem descendente matricial usando tipicamente uma matriz de 5 (.1) para 2. A idéia atrás de sistemas envolventes matriciais é que os canais dianteiro e envolvente (traseiro) são misturados em fase e fora de fase respectivamente no sinal de mixagem descendente estéreo. Até certo ponto isto permite inversão no lado de decodificador resultando em uma reconstrução de multicanais.
Petição 870190059486, de 26/06/2019, pág. 10/89 / 34 [0015] Em sistemas envolventes matriciais, o sinal estéreo pode ser transmitido usando canais tradicionais pretendidos para transmissão estéreo. Consequentemente, semelhantemente ao sistema de MPEG Envolvente, sistemas envolventes matriciais também oferecem uma forma de compatibilidade reversa. Porém, devido às propriedades de fase específicas do sinal de mixagem descendente estéreo resultando da codificação envolvente matricial, estes sinais frequentemente não têm uma alta qualidade de som quando escutados como um sinal estéreo de por exemplo alto-falantes ou fones de cabeça.
[0016] Em uma decodificador envolvente matricial, uma matriz de M para N (onde por exemplo M=2 e N=5 (.1)) é aplicada para gerar o sinal de saída de PCM de multicanais. Porém, em geral um sistema de matriz de N para M, com (N > M) não é reversível, e assim sistemas envolventes matriciais geralmente não são capazes de reconstruir precisamente os sinais de saída de PCM de multicanais originais, que tendem a ter artefatos altamente notáveis.
[0017] Em contraste com tais sistemas envolventes matriciais tradicionais, Compatibilidade Envolvente de Matriz em MPEG Envolvente é alcançada aplicando uma matriz 2x2 a valores de amostra complexos nas subbandas de frequência do codificador de MPEG Envolvente seguindo a codificação envolvente de MPEG. Um exemplo de um tal codificador é ilustrado na Figura 4. A matriz 2x2 é geralmente uma matriz de valor complexo com coeficientes dependentes dos parâmetros espaciais. Em tal sistema, os parâmetros espaciais são ambos variantes em tempo e frequência, e consequentemente a matriz 2x2 também é ambos variante em tempo e frequência. Por conseguinte, a operação de matriz complexa é tipicamente aplicada a azulejos de tempo-frequência.
[0018] Aplicar a funcionalidade de Compatibilidade Envolvente de
Matriz em um codificador envolvente de MPEG permite ao sinal estéreo
Petição 870190059486, de 26/06/2019, pág. 11/89 / 34 resultante ser compatível com o sinal sendo gerado por codificadores envolventes matriciais convencionais, tal como Dolby ProLogic™. Isto permitirá a decodificadores de legado decodificarem o sinal envolvente. Além disso, a operação da Compatibilidade Envolvente de Matriz pode ser invertida em um decodificador de MPEG Envolvente compatível, por esse meio permitindo a um sinal de multicanais de alta qualidade ser gerado.
[0019] A matriz de codificação de compatibilidade de matriz pode descrita como seguindo:
Lmtx |
= h |
L |
_ |
h11 |
h12 |
’ L |
_Rmtx _ |
|
R |
|
h21 |
h22 _ |
R |
onde L, R é a mixagem descendente estéreo de MPEG convencional, LMTX, RMTX é a mixagem descendente codificada envolvente de matriz e onde hxy são os coeficientes complexos determinados em resposta aos parâmetros de multicanais.
[0020] Uma vantagem principal de prover sinais estéreos compatíveis de matriz por meio de uma matriz 2x2 é o fato que estas matrizes podem ser invertidas. Como resultado, o decodificador de MPEG Envolvente ainda pode entregar a mesma qualidade de áudio de saída indiferente de se ou não uma mixagem descendente estéreo compatível de matriz é empregada no codificador. Um exemplo de um decodificador envolvente de MPEG compatível é ilustrado na Figura 5.
[0021] O processamento inverso no lado de decodificador em um decodificador de MPEG Envolvente regular pode ser assim determinado por:
L |
= h 1 |
Lmtx |
_ |
h
n11,D |
h
12,D |
Lmtx |
R |
|
_Rmtx _ |
|
h
/ *21, D |
h
22,D _ |
_Rmtx _ |
[0022] Assim, como H pode ser invertida, a operação do codificador de compatibilidade de matriz pode ser invertida.
[0023] No sistema de MPEG Envolvente, o processamento, compreendendo as operações de compatibilidade de matriz, acontece no
Petição 870190059486, de 26/06/2019, pág. 12/89 / 34 domínio de frequência. Mais especificamente, denominados bancos de Filtro de Espelho de Quadratura (QMF) modulado exponencial complexo são empregados para dividir o eixo de frequência em várias bandas.
[0024] Em muitos modos este tipo de bancos de QMF pode ser comparado ao banco de Transformada de Fourier Discreta (DFT) Sobreposto Aditivo, ou sua contraparte eficiente a Transformada de Fourier Rápida (FFT). O banco de QMF aterram como também o banco de DFT compartilham as propriedades desejadas seguintes para manipulação de sinal: [0025] A representação de domínio de frequência é sobre-amostrada. Devido a esta propriedade, é possível aplicar manipulações, tal como por exemplo equalização (graduação de bandas individuais) sem introduzir distorção de 'aliazing'. Representações criticamente amostradas, tal como por exemplo a Transformada de Co-seno Discreta Modificada (MDCT) bem conhecida é por exemplo empregada em AAC, não obedecem a esta propriedade. Consequentemente, modificação variante em tempo e frequência dos coeficientes de MDCT antes de síntese resulta em 'aliazing' que por sua vez causa artefatos audíveis no sinal de saída.
[0026] A representação de domínio de frequência é de valor complexo. Em contraste com representações de valor real, representações de valor complexo permitem uma modificação simples da fase dos sinais.
[0027] Embora haja várias vantagens através de uma representação de valor real criticamente amostrada em termos de manipulação de sinal, uma desvantagem significante comparada a tal representação é a complexidade computacional. Uma parte principal da complexidade do decodificador de MPEG Envolvente é devido aos bancos de filtro de análise e síntese de QMF e ao processamento correspondente em sinais de valor complexo.
[0028] Por conseguinte, foi proposto executar parte do processamento no domínio de valor real para um denominado decodificador de Baixa
Potência (LP). Para esse fim, o banco de filtro modulado complexo foi
Petição 870190059486, de 26/06/2019, pág. 13/89 / 34 substituído por um banco de filtro modulado de co-seno de valor real seguido por uma extensão parcial ao domínio de valor complexo para as bandas de frequência mais baixas. Tal banco de filtro é ilustrado na Figura 6.
[0029] No modo regular de operação, o decodificador de MPEG Envolvente aplica processamento de valor real às amostras de domínio de sub-banda de valor complexo, ou no caso de LP, aplica estas a amostras de domínio de sub-banda de valor real. Porém, a característica de compatibilidade de matriz no decodificador envolve rotações de fase a fim de restabelecer a mixagem descendente estéreo original no domínio de frequência. Estes rotações de fase são realizadas por meio de processamento de valor complexo. Em outras palavras, a matriz de decodificação de compatibilidade de matriz H-1 é inerentemente de valor complexo a fim de introduzir as rotações de fase requeridas. Por conseguinte, em tais sistemas, a operação compatível envolvente de matriz não pode ser invertida na parte de valor real da representação de domínio de frequência de LP conduzindo à qualidade de decodificação reduzida. Consequentemente, uma decodificação de áudio melhorada seria vantajosa.
[0030] Por conseguinte, a Invenção busca preferivelmente mitigar, aliviar ou eliminar uma ou mais das desvantagens supracitadas isoladamente ou em qualquer combinação.
[0031] De acordo com um primeiro aspecto da invenção, é provido um decodificador de áudio compreendendo: meio para receber dados de entrada compreendendo um sinal de N canais correspondendo a um sinal mixado descendentemente de um sinal de áudio de M canais, M > N, tendo matrizes de codificação de sub-banda de valor complexo aplicadas em subbandas de frequência e dados de multicanais paramétricos associados com o sinal mixado descendentemente; meio para gerar sub-bandas de frequência para o sinal de N canais, pelo menos algumas das sub-bandas de frequência sendo sub-bandas de frequência de valor real; meio de determinação para
Petição 870190059486, de 26/06/2019, pág. 14/89 / 34 determinar matrizes de decodificação de sub-banda de valor real para compensar a aplicação das matrizes de codificação em resposta aos dados de multicanais paramétricos; meio para gerar dados de mixagem descendente correspondendo ao sinal mixado descendentemente por uma multiplicação de matriz das matrizes de decodificação de sub-banda de valor real e dados do sinal de N canais nas pelo menos algumas sub-bandas de frequência de valor real.
[0032] A invenção pode permitir decodificação melhorada e/ou facilitada. Em particular, a invenção pode permitir uma redução de complexidade significativa enquanto alcançando alta qualidade de áudio. A invenção pode por exemplo permitir o efeito de uma multiplicação de matriz de sub-banda de valor complexo ser invertida pelo menos parcialmente em um decodificador usando sub-bandas de frequência de valor real.
[0033] Como um exemplo específico, a invenção pode por exemplo permitir codificação Compatível de Matriz de MPEG ser invertida parcialmente em um decodificador envolvente de MPEG usando sub-bandas de frequência de valor real.
[0034] O decodificador pode incluir meio para gerar o sinal mixado descendentemente em resposta aos dados de mixagem descendente e pode ademais incluir meio para gerar o sinal de áudio de M canais em resposta aos dados de mixagem descendente e aos dados de multicanais paramétricos. A invenção pode em tais concretizações gerar um sinal áudio de multicanais preciso pelo menos parcialmente baseado em bandas de frequência de valor real.
[0035] Uma matriz de decodificação diferente pode ser determinada para cada sub-banda de frequência.
[0036] De acordo com uma característica opcional da invenção, o meio de determinação é arranjado para determinar matrizes inversas de subbanda de valor complexo das matrizes de codificação e determinar as matrizes
Petição 870190059486, de 26/06/2019, pág. 15/89 / 34 de decodificação em resposta às matrizes inversas.
[0037] Isto pode permitir uma implementação particularmente eficiente e/ou qualidade de decodificação melhorada.
[0038] De acordo com uma característica opcional da invenção, o meio de determinação é arranjado para determinar cada coeficiente de matriz de valor real das matrizes de decodificação em resposta a um valor absoluto de um coeficiente de matriz correspondente das matrizes inversas.
[0039] Isto pode permitir uma implementação particularmente eficiente e/ou qualidade de decodificação melhorada. Cada coeficiente de matriz de valor real das matrizes de decodificação pode ser determinado em resposta a um valor absoluto só do coeficiente de matriz correspondente das matrizes inversas sem consideração de qualquer outro coeficiente de matriz. Um coeficiente de matriz correspondente pode ser um coeficiente de matriz no mesmo local da matriz inversa para a mesma sub-banda de frequência.
[0040] De acordo com uma característica opcional da invenção, o meio de determinação é arranjado para determinar cada coeficiente de matriz de valor real substancialmente como um valor absoluto do coeficiente de matriz correspondente das matrizes inversas.
[0041] Isto pode permitir uma implementação particularmente eficiente e/ou qualidade de decodificação melhorada.
[0042] De acordo com uma característica opcional da invenção, o meio de determinação é arranjado para determinar as matrizes de decodificação em resposta a matrizes de transferência de sub-banda sendo uma multiplicação de matrizes de decodificação e matrizes de codificação correspondentes.
[0043] Isto pode permitir uma implementação particularmente eficiente e/ou qualidade de decodificação melhorada. As matrizes de decodificação e codificação correspondentes podem ser matrizes de codificação e decodificação para a mesma sub-banda de frequência. O meio
Petição 870190059486, de 26/06/2019, pág. 16/89 / 34 de determinação pode ser arranjado em particular para selecionar os valores de coeficiente das matrizes de decodificação tal que as matrizes de transferência tenham uma característica desejada.
[0044] De acordo com uma característica opcional da invenção, o meio de determinação é arranjado para determinar as matrizes de decodificação só em resposta a medidas de magnitude das matrizes de transferência.
[0045] Isto pode permitir uma implementação particularmente eficiente e/ou qualidade de decodificação melhorada. Em particular, o meio de determinação pode ser arranjado para ignorar medidas de fase ao determinar as matrizes de decodificação. Isto pode reduzir complexidade enquanto mantendo baixa degradação de qualidade de áudio perceptível.
[0046] De acordo com uma característica opcional da invenção, as matrizes de transferência de cada sub-banda são dadas por:
p = |
P11 P12 |
= g · h = |
g11 g12 |
|
Κ1 h12 |
|
_ p21 p22 _ |
|
_ g21 g22 _ |
|
_h21 h22 _ |
onde G é uma matriz de decodificação de sub-banda e H é uma matriz de codificação de sub-banda e o meio de determinação é arranjado para selecionar os coeficientes de matriz:
g11 g12 _ g21 g22 _ tal que uma medida de potência de p12 e p21 satisfaça um critério.
[0047] Isto pode permitir uma implementação particularmente eficiente e/ou qualidade de decodificação melhorada. A matriz de decodificação pode ser selecionada para resultar em uma medida de potência abaixo de um limiar (que pode ser determinado em resposta a constrangimentos ou outros parâmetros) ou pode por exemplo ser selecionada como a matriz de decodificação resultando na medida de potência mínima.
[0048] De acordo com uma característica opcional da invenção, a
Petição 870190059486, de 26/06/2019, pág. 17/89 / 34 medida de magnitude é determinada em resposta a:
|pí2|+| ph\ [0049] Isto pode permitir uma implementação particularmente eficiente e/ou qualidade de decodificação melhorada.
[0050] De acordo com uma característica opcional da invenção, o meio de determinação é ademais arranjado para selecionar os coeficientes de matriz sob o constrangimento de uma magnitude de p11 e p22 sendo substancialmente igual a um.
[0051] Isto pode permitir uma implementação particularmente eficiente e/ou qualidade de decodificação melhorada.
[0052] De acordo com uma característica opcional da invenção, o sinal mixado descendentemente e os dados de multicanais paramétrico são de acordo com um padrão envolvente de MPEG.
[0053] A invenção pode permitir uma decodificação de baixa complexidade particularmente eficiente e/ou qualidade de áudio melhorada para um sinal compatível envolvente de MPEG.
[0054] De acordo com uma característica opcional da invenção, a matriz de codificação é uma matriz de codificação de Compatibilidade Envolvente de Matriz de MPEG e o primeiro sinal de N canais é um sinal de Compatibilidade Envolvente de Matriz de MPEG.
[0055] A invenção pode permitir uma baixa complexidade particularmente eficiente e/ou qualidade de áudio melhorada e pode em particular permitir uma decodificação de baixa complexidade para compensar eficientemente operações de Compatibilidade Envolvente de Matriz de MPEG executadas em um codificador.
[0056] De acordo com outro aspecto da invenção, é provido um método de decodificação de áudio, o método compreendendo: receber dados de entrada compreendendo um sinal de N canais correspondendo a um sinal mixado descendentemente de um sinal de áudio de M canais, M > N, tendo
Petição 870190059486, de 26/06/2019, pág. 18/89 / 34 matrizes de codificação de sub-banda de valor complexo aplicadas em subbandas de frequência e dados de multicanais paramétricos associados com o sinal mixado descendentemente; gerar sub-bandas de frequência para o sinal de N canais, pelo menos algumas das sub-bandas de frequência sendo subbandas de frequência de valor real; determinar matrizes de decodificação de sub-banda de valor real para compensar a aplicação das matrizes de codificação em resposta aos dados de multicanais paramétricos; e gerar dados de mixagem descendente correspondendo ao sinal mixado descendentemente por uma multiplicação de matriz das matrizes de decodificação de sub-banda de valor real que e dados do sinal de N canais nas pelo menos algumas subbandas de frequência de valor real.
[0057] De acordo com outro aspecto da invenção, é provido um receptor para receber um sinal de N canais, o receptor compreendendo: meio para receber dados de entrada compreendendo um sinal de N canais correspondendo a um sinal mixado descendentemente de um sinal de áudio de M canais, M > N, tendo matrizes de codificação de sub-banda de valor complexo aplicadas em sub-bandas de frequência e dados de multicanais paramétricos associados com o sinal mixado descendentemente; meio para gerar sub-bandas de frequência para o sinal de N canais, pelo menos algumas das sub-bandas de frequência sendo sub-bandas de frequência de valor real; meio de determinação para determinar matrizes de decodificação de subbanda de valor real para compensar a aplicação das matrizes de codificação em resposta aos dados de multicanais paramétricos; meio para gerar dados de mixagem descendente correspondendo ao sinal mixado descendentemente por uma multiplicação de matriz das matrizes de decodificação de sub-banda de valor real e dados do sinal de N canais nas pelo menos algumas sub-bandas de frequência de valor real. De acordo com outro aspecto da invenção, é provido um sistema de transmissão para transmitir um sinal áudio, o sistema de transmissão compreendendo: um transmissor compreendendo: meio para
Petição 870190059486, de 26/06/2019, pág. 19/89 / 34 gerar um sinal mixado descendentemente de N canais de um sinal de áudio de M canais, M > N, meio para gerar dados de multicanais paramétricos associados com o sinal mixado descendentemente, meio para gerar um primeiro sinal de N canais aplicando matrizes de codificação de sub-banda de valor complexo ao sinal mixado descendentemente de N canais em subbandas de frequência, meio para gerar um segundo sinal de N canais compreendendo o primeiro sinal de N canais e os dados de multicanais paramétricos, e meio para transmitir o segundo sinal de N canais a um receptor; e o receptor compreendendo: meio para receber o segundo sinal de N canais, meio para gerar sub-bandas de frequência para o primeiro sinal de N canais, pelo menos algumas das sub-bandas de frequência sendo sub-bandas de frequência de valor real, meio de determinação para determinar matrizes de decodificação de sub-banda de valor real para compensar a aplicação das matrizes de codificação em resposta aos dados de multicanais paramétricos, e meio para gerar dados de mixagem descendente correspondendo ao sinal mixado descendentemente de N canais por uma multiplicação de matriz das matrizes de decodificação de sub-banda de valor real e dados do sinal de N canais nas pelo menos algumas sub-bandas de frequência de valor real.
[0058] O segundo sinal de N canais pode ter um canal associado adicional compreendendo os dados de multicanais paramétricos.
[0059] De acordo com outro aspecto da invenção, é provido um método para receber um sinal áudio de um fluxo de bit de áudio graduável, o método compreendendo: receber dados de entrada compreendendo um sinal de N canais correspondendo a um sinal mixado descendentemente de um sinal de áudio de M canais, M > N, tendo matrizes de codificação de sub-banda de valor complexo aplicadas em sub-bandas de frequência e dados de multicanais paramétricos associados com o sinal mixado descendentemente; gerar sub-bandas de frequência para o sinal de N canais, pelo menos algumas das sub-bandas de frequência sendo sub-bandas de frequência de valor real;
Petição 870190059486, de 26/06/2019, pág. 20/89 / 34 determinar matrizes de decodificação de sub-banda de valor real para compensar a aplicação das matrizes de codificação em resposta aos dados de multicanais paramétricos; e gerar dados de mixagem descendente correspondendo ao sinal mixado descendentemente por uma multiplicação de matriz das matrizes de decodificação de sub-banda de valor real e dados do sinal de N canais nas pelo menos algumas sub-bandas de frequência de valor real. De acordo com outro aspecto da invenção, é provido um método para transmitir e receber um sinal áudio, o método compreendendo: a um transmissor, executar as etapas de: gerar um sinal mixado descendentemente de N canais de um sinal de áudio de M canais, M > N, gerar dados de multicanais paramétricos associados com o sinal mixado descendentemente, gerar um primeiro sinal de N canais aplicando matrizes de codificação de subbanda de valor complexo ao sinal mixado descendentemente de N canais em sub-bandas de frequência, gerar um segundo sinal de N canais compreendendo o primeiro sinal de N canais e os dados de multicanais paramétricos, e transmitir o segundo sinal de N canais a um receptor; e no receptor, executar as etapas de: receber o segundo sinal de N canais; gerar sub-bandas de frequência para o primeiro sinal de N canais, pelo menos algumas das sub-bandas de frequência sendo sub-bandas de frequência de valor real; determinar matrizes de decodificação de sub-banda de valor real para compensar a aplicação das matrizes de codificação em resposta aos dados de multicanais paramétricos; gerar dados de mixagem descendente correspondendo ao sinal mixado descendentemente de N canais por uma multiplicação de matriz das matrizes de decodificação de sub-banda de valor real e dados do sinal de N canais nas pelo menos algumas sub-bandas de frequência de valor real.
[0060] Estes e outros aspectos, características e vantagens da invenção serão aparentes e elucidados com referência às concretizações descritas em seguida.
Petição 870190059486, de 26/06/2019, pág. 21/89 / 34 [0061] Concretizações da invenção serão descritas, por meio de exemplo somente, com referência aos desenhos, em que:
Figura 1 ilustra um exemplo de um codificador para codificar sinais de áudio de multicanais de acordo com a técnica anterior;
Figura 2 ilustra um exemplo de um decodificador para decodificar sinais de áudio de multicanais de acordo com a técnica anterior;
Figura 3 ilustra um exemplo de um sistema de codificação/decodificação envolvente de matriz de acordo com a técnica anterior;
Figura 4 ilustra um exemplo de um codificador para codificar sinais de áudio de multicanais de acordo com técnica anterior;
Figura 5 ilustra um exemplo de um decodificador para decodificar sinais de áudio de multicanais de acordo com a técnica anterior;
Figura 6 ilustra um exemplo de um banco de filtro para gerar sub-bandas de frequência de valor complexo e real;
Figura 7 ilustra um sistema de transmissão para comunicação de um sinal áudio de acordo com algumas concretizações da invenção;
Figura 8 ilustra um decodificador de acordo com algumas concretizações da invenção;
Figuras 9-14 ilustram características de desempenho para um decodificador de acordo com algumas concretizações da invenção; e
Figura 15 ilustra um método de decodificação de acordo com algumas concretizações da invenção.
[0062] A descrição seguinte se focaliza em concretizações da invenção aplicáveis a um decodificador para decodificar um sinal codificado envolvente de MPEG compreendendo uma codificação de Compatibilidade Envolvente de Matriz. Porém, será apreciado que a invenção não está limitada a esta aplicação, mas pode ser aplicada a muitos outros padrões de codificação.
Petição 870190059486, de 26/06/2019, pág. 22/89 / 34 [0063] Figura 7 ilustra um sistema de transmissão 700 para comunicação de um sinal áudio de acordo com algumas concretizações da invenção. O sistema de transmissão 700 inclui um transmissor 701, que está acoplado a um receptor 703 por uma rede 705, que pode ser especificamente a
Internet.
[0064] No exemplo específico, o transmissor 701 é um dispositivo gravador de sinal e o receptor 703 é um dispositivo de reprodução de sinal, mas será apreciado que em outras concretizações, o transmissor e o receptor podem ser usados em outras aplicações e para outros propósitos.
[0065] No exemplo específico onde uma função de gravação de sinal é suportada, o transmissor 701 inclui um digitalizador 707, que recebe um sinal de multicanais analógico, que é convertido a um sinal de multicanais de PCM digital (Modulado Codificado por Pulso) por amostragem e conversão analógica para digital.
[0066] O transmissor 701 está acoplado ao codificador 709 da Figura 1, que codifica o sinal de PCM de acordo com um algoritmo de codificação de MPEG Envolvente que inclui funcionalidade para codificação de Compatibilidade Envolvente de Matriz. O codificador 709 pode ser, por exemplo, o decodificador da técnica anterior da Figura 4. No exemplo, o codificador 709 gera especificamente um sinal mixado descendentemente estéreo Compatível Envolvente de Matriz de MPEG estéreo.
[0067] Assim, o codificador 709 gera um sinal dado por:
Lmtx |
= h |
L |
_ |
h11 |
h12 |
’ L |
_Rmtx _ |
|
R |
|
h21 |
h22 _ |
R |
onde L, R é que uma mixagem descendente estéreo envolvente de MPEG convencional e LMTX, RMTX é a mixagem descendente codificada compatível envolvente de matriz produzida pelo codificador 709.
[0068] Além disso, o sinal gerado pelo codificador 709 inclui dados paramétricos de multicanais gerados pela codificação envolvente de MPEG.
Petição 870190059486, de 26/06/2019, pág. 23/89 / 34
Além disso, hXy são coeficientes complexos determinados em resposta aos parâmetros de multicanais. Como será entendido prontamente pela pessoa qualificada na técnica, o processamento executado pelo codificador 709 é executado em sub-bandas de valor complexo e usando operações complexas.
[0069] O codificador 709 está acoplado a um transmissor de rede 711, que recebe o sinal codificado e conecta à rede 705. O transmissor de rede 711 pode transmitir o sinal codificado ao receptor 703 pela rede 705.
[0070] O receptor 703 inclui uma interface de rede 713, que conecta à rede 705 e que é arranjada para receber o sinal codificado do transmissor 701. [0071] A interface de rede 713 está acoplada a um decodificador 715. O decodificador 715 recebe o sinal codificado e o decodifica de acordo com um algoritmo de decodificação. No exemplo, o decodificador 715 regenera o sinal de multicanais original. Especificamente, o decodificador 715 primeiro gera uma mixagem descendente estéreo compensada correspondendo à mixagem descendente gerada pela codificação envolvente de MPEG antes das operações compatíveis envolventes de matriz de MPEG sendo executadas. Um sinal de multicanais decodificado é então gerado desta mixagem descendente e dos dados paramétricos de multicanais recebidos.
[0072] No exemplo específico, onde uma função de reprodução de sinal é suportada, o receptor 703 ademais inclui um reprodutor de sinal 717, que recebe o sinal de áudio decodificado de multicanais do decodificador 715 e apresenta isto ao usuário. Especificamente, o reprodutor de sinal 717 pode incluir um conversor digital para analógico, amplificadores e alto-falantes como requerido para produzir o sinal de áudio decodificado.
[0073] Figura 8 ilustra o decodificador 715 em mais detalhe.
[0074] O decodificador 715 inclui o receptor 801, que recebe o sinal gerado pelo codificador 709. Como previamente mencionado, o sinal é um sinal estéreo que corresponde a um sinal de mixagem descendente que foi processado pelos valores de amostra complexos em sub-bandas de frequência
Petição 870190059486, de 26/06/2019, pág. 24/89 / 34 de valor complexo sendo multiplicadas por uma matriz de codificação de valor complexo H. Além disso, o sinal recebido inclui dados paramétricos de multicanais que correspondem ao sinal de mixagem descendente.
Especificamente, o sinal recebido é um sinal codificado envolvente de MPEG com processamento de compatibilidade envolvente de matriz.
[0075] O receptor 801 além disso provê a decodificação de núcleo do sinal recebido para gerar o sinal de PCM misturado descendentemente.
[0076] O receptor 801 está acoplado a um processador de dados paramétrico 803, que extrai os dados paramétricos de multicanais do sinal recebido.
[0077] O receptor 801 está além disso acoplado a um banco de filtro de sub-banda 805, que transforma o sinal estéreo recebido ao domínio de frequência. Especificamente, o banco de filtro de sub-banda 805 gera uma pluralidade das sub-bandas de frequência. Pelo menos algumas destas subbandas de frequência são sub-bandas de frequência de valor real. O banco de filtro de sub-banda 805 pode especificamente corresponder à funcionalidade ilustrada na Figura 6. Assim, o banco de filtro de sub-banda 805 pode gerar K sub-bandas de valor complexo e M-K sub-bandas de valor real. As subbandas de valor real serão tipicamente as sub-bandas de frequência mais alta, tais como as sub-bandas acima de 2 kHz. O uso de sub-bandas de valor real facilita substancialmente a geração de sub-banda como também as operações executadas nas amostras nestas sub-bandas. Assim, no decodificador 715, MK sub-bandas são processadas como dados de valor real e operações em lugar de como dados de valor complexo e operações por esse meio provendo uma complexidade significativa e redução de custo.
[0078] O banco de filtro de sub-banda 805 está acoplado a um processador de compensação 807, que gera dados de mixagem descendente correspondendo ao sinal mixado descendentemente. Especificamente, o processador de compensação 807 compensado para a operação de
Petição 870190059486, de 26/06/2019, pág. 25/89 / 34 compatibilidade envolvente de matriz buscando inverter a multiplicação pela matriz de codificação H nas sub-bandas de frequência do codificador 709. Esta compensação é executada multiplicando os valores de dados das subbandas por uma matriz de decodificação de sub-banda G. Porém, em contraste ao processamento no codificador 709, a multiplicação de matriz nas sub-bandas de valor real do decodificador 715 é executada exclusivamente no domínio real. Assim, não só são os valores de amostra amostras de valor real, mas os coeficientes de matriz da matriz de decodificação G também são coeficientes de valor real.
[0079] O processador de compensação 807 está acoplado a um processador de matriz 809, que determina as matrizes de decodificação a serem aplicadas nas sub-bandas. Para as M sub-bandas de valor complexo, a matriz de decodificação G pode simplesmente ser determinada como o inverso da matriz de codificação H na mesma sub-banda. Porém, para as subbandas de valor real, o processador de matriz 809 determina coeficientes de matriz de valor real que podem prover uma compensação eficiente para a operação de matriz de codificação.
[0080] Assim, a saída do processador de compensação 807 corresponde à representação de sub-banda do sinal de mixagem descendente codificado envolvente de MPEG. Por conseguinte, o efeito das operações de compatibilidade envolvente de matriz pode ser reduzido substancialmente ou removido.
[0081] O processador de compensação 807 está acoplado a um banco de filtro de sub-banda de síntese 811, que gera um sinal de mixagem descendente decodificado envolvente de MPEG de PCM de domínio de tempo da representação de sub-banda. No exemplo específico, o banco de filtro de sub-banda de síntese 811 assim forma a contraparte do banco de filtro de sub-banda 805 ao converter o sinal de volta ao domínio de tempo.
[0082] O banco de filtro de sub-banda de síntese 811 é alimentado a
Petição 870190059486, de 26/06/2019, pág. 26/89 / 34 um decodificador de multicanais 813, que está além disso acoplado ao processador de dados paramétricos 803. O decodificador de multicanais 813 recebe o sinal de mixagem descendente de PCM de domínio de tempo e os dados paramétricos de multicanais e gera o sinal de multicanais original. [0083] No exemplo, o banco de filtro de sub-banda de síntese 811 transforma o sinal de sub-banda no qual as operações de matriz foram executadas ao domínio de tempo. O decodificador de multicanais 813 assim recebe um sinal codificado envolvente de MPEG comparável a um que teria sido recebido se nenhuma operação compatível envolvente de matriz tivesse sido aplicada no decodificador. Assim, o mesmo algoritmo de decodificação de multicanais de MPEG pode ser usado para sinais compatíveis envolventes de matriz e para sinais compatíveis envolventes de não matriz. Porém, em outras concretizações, o decodificador de multicanais 813 pode operar diretamente nas amostras de sub-banda seguindo compensação pelo processador de compensação 807. Em tais casos, o banco de filtro de subbanda de síntese 811 pode ser omitido ou alguma da funcionalidade do banco de filtro de sub-banda de síntese 811 pode ser integrada com o decodificador de multicanais 813.
[0084] Assim, a fim de reduzir complexidade, é frequentemente preferível ficar no domínio de sub-banda ao prover o sinal compensado ao decodificador de multicanais 813. Como tal, é possível evitar a complexidade do banco de filtro de sub-banda de síntese 811 e dos bancos de filtro de análise que fazem parte do decodificador de multicanais 813.
[0085] Realmente se possível, é preferido tipicamente não mover de um lado para outro entre o domínio de frequência e o domínio de tempo como isto é caro computacionalmente. Consequentemente, em alguns decodificadores de acordo com algumas concretizações da invenção, depois que os sinais foram convertidos ao domínio de sub-banda (frequência) (que por sua vez foram determinados decodificando o fluxo de bit de núcleo e
Petição 870190059486, de 26/06/2019, pág. 27/89 / 34 aplicando os bancos de filtro ao sinais de PCM resultantes), a inversão envolvente de matriz é aplicada no processador de compensação 807 (se aplicável, isto é, se sinalizado no fluxo de bit) e então os sinais de domínio de sub-banda resultantes são usados diretamente para reconstruir os sinais de multicanais (domínio de sub-banda). Finalmente, os bancos de filtro de síntese são aplicados para obter os sinais de multicanais de domínio de tempo. [0086] Assim, no sistema da Figura 7, o codificador 709 pode gerar um sinal compatível envolvente de matriz, que pode ser decodificado por decodificadores envolventes de matriz de legado tais como decodificadores Dolby ProLogic™. Embora isto requeira uma distorção do sinal de mixagem descendente codificado envolvente de MPEG original por uma operação de compatibilidade envolvente de matriz, esta operação pode ser removida efetivamente em um decodificador de multicanais de MPEG por esse meio permitindo uma representação precisa do multicanais original ser gerada usando os dados paramétricos.
[0087] Além disso, o decodificador 715 permite a compensação para a operação de compatibilidade envolvente de matriz ser executada em subbandas de frequência de valor real em lugar de requerer sub-bandas de frequência de valor complexo por esse meio reduzindo substancialmente a complexidade do decodificador 715 enquanto alcançando alta qualidade de áudio.
[0088] No seguinte, exemplos da determinação de coeficientes de matriz adequados para as matrizes de decodificação serão descritos.
[0089] O codificador 709 executa a operação de compatibilidade envolvente de matriz aplicando a matriz de codificação de valor complexo seguinte em cada sub-banda (será apreciado que cada sub-banda tem uma matriz de codificação diferente):
LMTX |
= h |
' L |
— |
h11 |
h12 |
~ L ~ |
_RMTX _ |
|
R |
|
_h21 |
h22 _ |
R |
Petição 870190059486, de 26/06/2019, pág. 28/89 / 34 onde L, R é a mixagem descendente estéreo convencional· e
Lmtx· Rmtx é a mixagem descendente codificada envolvente de matriz. A matriz de codificador H é dada por:
1 - + jwY h11 i-------------------7 · yJ1 — 2^1 + 2wi h _ 1 — W2 — jW2 h22 _ I----------------2 · y 1 — 2w2 + 2w2 h _--------------12 # - 2w + 2w;) · h21 — jw1
-^3(1 — 2W1 + 2w1) onde W1 e W2 dependem dos parâmetros espaciais gerados pela codificação envolvente de MPEG. Especificamente:
W1 w1t
V1—2wu+2wu W2 W2,t
Q1 — 2w2t + -'ζ onde W1,t e w2,t são os pesos não normalizados, que são definidos como:
w1t _
CLDt c · 10 20 c1,MTX 1U _CLD,
1+10 20
CLDr c · 10 20 _ c2,MTX lu W2,t _ CLDr
1+10'20 onde CLDl e CLDr representam a diferenças de nível de canal (expressas em dB) dos pares de canal esquerdo-dianteiro, esquerdoenvolvente e direito-dianteiro, direito-envolvente respectivamente. c^MTX e c2,MTX são os coeficientes de matriz que são uma função dos coeficientes de predição c1 e c2 usados para derivar os sinais intermediários esquerdo L, centro C e direito R dos sinais de mixagem descendente esquerdo LDMX e
Petição 870190059486, de 26/06/2019, pág. 29/89 / 34 Ldmx Rdmx direito Rdmx no decodificador como seguindo:
C + 2 c1 -1 1 - c1 C2 - 1 C2 + 2 1 - C2 .
c1,mtx e c^mtx são determinados como:
-1 - 2cx if -1 < cx <-0.5 Cx,MTX = j1/3 + 2cx/3 if - 0,5 < Cx < 1 em outro lugar com x = {0,1} respectivamente.
[0090] Alternativamente, o decodificador envolvente de MPEG suporta um modo onde os coeficientes c1 e c2 representam relações de potência de esquerda contra esquerda mais centro e direita contra direita mais centro respectivamente. Nesse caso, funções diferentes para c^mtx e c^mtx se aplicam.
[0091] Assim, para cada ladrilho de tempo/frequência, uma matriz de codificação de valor complexo H é aplicada a valores de amostra complexos. Se os sinais dianteiros fossem dominantes no sinal de entrada de multicanais original, os pesos w1 e w2 estariam perto de zero. Como resultado, a mixagem descendente envolvente de matriz estaria perto da mixagem descendente estéreo de entrada. Se os sinais envolventes (traseiros) fossem dominantes no sinal de entrada de multicanais original, os pesos w1 e w2 estariam perto de um. Como resultado, o sinal de mixagem descendente envolvente de matriz conteria uma versão altamente fora de fase da mixagem descendente estéreo original provida pelo codificador Envolvente de MPEG.
[0092] Uma vantagem principal de prover sinais estéreos compatíveis de matriz por meio de uma matriz 2x2 é o fato que estas matrizes podem ser invertidas. Como resultado, o decodificador Envolvente de MPEG ainda pode entregar a mesma qualidade de áudio de saída indiferente de se ou não uma mixagem descendente estéreo compatível de matriz foi empregada pelo codificador.
Petição 870190059486, de 26/06/2019, pág. 30/89 / 34 [0093] O processamento inverso no lado de decodificador em um decodificador Envolvente de MPEG, onde todas as sub-bandas de frequência são sub-bandas de valor complexo (por exemplo usando um banco de QMF modulado complexo) é então dado por:
’ L |
= H -1 |
Lmtx |
_ |
h
n11,D |
h
n12,D |
Lmtx |
R |
|
_Rmtx _ |
|
h
_ L21,D |
h
22,D _ |
_Rmtx _ |
com
|
h = — D N ’
h =
h D N ’ h = ~ h12
h12,D N ’
h =-^21
onde
N = hnh22 - h12h21. |
[0094] |
Porém, tal operação inversa requer que valores complexos |
sejam usados e, portanto, não podem ser aplicados no decodificador 715 da Figura 7 como isto usa (pelo menos parcialmente) sub-bandas de valor real. Por conseguinte, o processador de matriz 809 gera uma matriz de decodificação de valor real que pode ser aplicada para reduzir significativamente o efeito da matriz de codificação.
[0095] |
O impacto global das matrizes de codificação e decodificação |
em cada sub-banda pode ser representado pela matriz de transferência P dada como:
P11
P21
P12
P22 £11 g21 £12 h11 g22 _ _h21 h12 h22 onde H representa a matriz de codificador e G representa a matriz de decodificador.
[0096] Idealmente, G = H'1, tal que: P = H4.H = I, a matriz unitária.
Petição 870190059486, de 26/06/2019, pág. 31/89 / 34
Devido ao fato que os pesos hXy da matriz de codificador H são todos de valor complexo, a matriz não pode ser invertida no decodificador para as subbandas de valor real.
[0097] As sub-bandas de valor real estão tipicamente a frequências mais altas tais como as sub-bandas acima de 2 kHz. A estas frequências, as relações de fase são perceptivamente muito menos importantes e, portanto, o processador de matriz 809 determina coeficientes de matriz de decodificação que têm características de magnitude adequadas (potência) sem consideração das características de fase. Especificamente, o processador de matriz 809 pode determinar coeficientes de matriz de valor real que resultarão em uma baixa magnitude ou valor de potência dos termos de diafonia p12 e p21 sob a suposição ou constrangimento que |pn|~1 e |p22|~1.
[0098] Em algumas concretizações, o processador de matriz 809 pode determinar a matriz inversa de sub-banda de valor complexo H’1 das matrizes de codificação e pode então determinar a matriz de decodificação de valor real G dos coeficientes de matriz desta matriz. Especificamente, cada coeficiente de G pode ser determinado do coeficiente de H’1 que está no mesmo local. Por exemplo, um coeficiente de valor real pode ser determinado do valor de magnitude do coeficiente correspondente de H’1. Realmente, em algumas concretizações, o processador de matriz pode determinar os coeficientes de H’1 e subsequentemente determinar os coeficientes de G como o valor absoluto do coeficiente de matriz correspondente da matriz inversa H’1.
[0099] Assim, o processador de matriz 809 pode determinar:
g12 g22 _ g11 g21 como g11 = h11,D g12 h12,D W2
IM·^ 3 (1 - 2w2 + 2w2)
Petição 870190059486, de 26/06/2019, pág. 32/89 / 34 g21 ”21,D W1 |^^3 (1 - 2w1 + 2wf)
onde
N = hnh22 - h12h21.
[00100] Pode ser mostrado que esta solução satisfaz perfeitamente os constrangimentos mencionados acima (|p11| = |p22| = 1 e = |p12| = |p21| = 0) para os casos específicos de w1 = w2 = 0 e w1 = w2 = 1.
[00101] Figura 9 ilustra a magnitude de termo principal de matriz de transferência (10 log10|p11|2) para esta solução. Figura 10 ilustra o ângulo de fase de p11 e Figura 11 o termo de diafonia (10 log10|p21|2).
[00102] Especificamente, Figura 9 mostra o desvio em dB da magnitude do termo de matriz principal p11 relativo ao valor ideal de |p11| = 1 como uma função de w1 e w2. Como pode ser observado, o desvio máximo do caso ideal é menos de 1 dB. Figura 10 mostra o ângulo de p11 como uma função de w1 e w2. Como pode ser esperado da diferença com respeito ao caso de valor complexo ideal, diferenças de fase estão até 90 graus. Figura 11 mostra a magnitude do termo de matriz de diafonia p21 medido em dB como uma função de pesos w1 e w2. Deveria ser notado que os outros elementos de matriz de transferência podem ser obtidos permutando w1 e w2.
[00103] Em algumas concretizações, o processador de matriz 809 pode determinar a matriz de decodificação G para uma sub-banda em resposta à matriz de transferência de sub-banda P=G-H. Especificamente, o processador de matriz pode selecionar valores de coeficiente de G tal que uma dada característica seja alcançada para P.
[00104] Novamente, como os valores de fase para as sub-bandas de valor real tendem a ter baixa ponderação perceptiva, só as características de magnitude de P são consideradas pelo decodificador exemplar 715.
Desempenho de alta qualidade pode ser alcançado pelo processador de matriz
Petição 870190059486, de 26/06/2019, pág. 33/89 / 34
809 selecionando os coeficientes de matriz de decodificação tal que uma medida de potência de p12 e p21 satisfaça um critério - tal como por exemplo que a medida de potência seja minimizada ou que a medida de potência esteja abaixo de um dado critério. O processador de matriz 809 pode por exemplo pesquisar através de uma gama de possíveis coeficientes de valor real e selecionar os que resultam na medida de potência mais baixa para p12 e p21. Além disso, a avaliação pode estar sujeita a outros constrangimentos, tal como um constrangimento que p11 e p22 sejam substancialmente iguais a um (por exemplo entre 0,9 e 1,1).
[00105] Em algumas concretizações, o processador de matriz 809 pode executar um algoritmo matemático para determinar valores de coeficiente de valor real adequados para a abordagem de decodificação. Um exemplo específico de tal é descrito no seguinte, em que o algoritmo busca minimizar a diafonia global: |pn|2 + |p2^2 sob o constrangimento de |pn|2 = 1 e |p21|2 =1.
[00106] Este problema pode ser resolvido por uma ferramenta de análise matemática multi-variada padrão. Em particular, é adequado usar métodos de multiplicador Lagrangiano, que, para cada vetor de fila v de G, traduz em um problema de valor próprio de matriz da forma vA = λνΒ com um requisito de normalização q(v) = 1 dado por uma forma quadrática q. As matrizes A e B e as formas quadráticas q dependem das entradas da matriz complexa H.
[00107] Abaixo a solução para v = [gn g12] é dada. É trivial também resolver v = [g21 g22] permutando as variáveis w1 e w2 na solução abaixo. As matrizes de Lagrange A e B são definidas como:
¢2 q2 ¢2
Petição 870190059486, de 26/06/2019, pág. 34/89 / 34
onde q1 e q2 são definidos como:
W1 — 2W1 + 2w1 [00108] w2 =---------2------2 .
— 2 + 2
Os valores próprios são achados por:
det(A - λΒ) = 0, que resulta nas raízes de um polinômio quadrático:
—b + 4 b2 — 4ac
2a —b — 4b4 — 4ac
2a onde b = 5 41 42 — 1, q2 — 42 [00109] [00110] tal que como:
[00111] [00112]
Agora duas soluções de candidato podem ser determinadas:
(A - λ1,2Β)ν1,2 = 0
A solução final é determinada por v = ci.Vi, onde i é tanto 1 ou |p11|2 = 1 e com diafonia mínima. Primeiro ci é calculado (1 — 41)v21 + 41 ! h,1
Então, a diafonia |p12|2 para ambas as soluções é calculada:
ΙΡ12Γ = 42cf — Vi,2 I +(1 — 42 )(Ci )2
O índice i que produz a diafonia mínima dá v = ci.vi. Sem
Petição 870190059486, de 26/06/2019, pág. 35/89 / 34 prova adicional é declarado que independente das variáveis wi e W2, o índice i é sempre igual a 2.
[00113] |
Para perfeição, a solução completa para G em termos de |
equações analíticas é dada abaixo. As variáveis seguintes são definidas:
[00114] |
2
= W
1 - 2W1 + 2w2
2
= ™2
1 - 2 + 2
5 = q1 + q2,
p = q1q2
P 9 .
Então, a variável b é calculada como: |
[00115] |
b = 1 - 5p -yJ-11 p + (45 -14) p +1
Duas raízes ra e rp para ambas as filas da matriz G são |
calculadas como:
3b 2 (q1 - q2) if < q1 < 1;
q2 q2 if qi e{0,1}.
3b 2 ( q2 q2 ) if < q2 < 1;
if [00116] As soluções não graduadas vtemp,1 e vtemp,2 podem então ser determinadas como:
v temp,1,1 vtemp ,1,2 q2 - qa
V3 Vtemp,2,2 ^β.
’ Vtemp,2,1 q1 - q2re
Petição 870190059486, de 26/06/2019, pág. 36/89 / 34 [00117] [00118] [00119]
As constantes de normalização c são calculadas como:
z v C1 = hJQ - q1)vLp,1,1 + q1 í1 - \ C2 = 1N(1 - q2)v2emp,2,2 + <?2 í 1 - q 1
Finalmente, a matriz G é dado por:
c · V ν1 ’ temp ,1 cV c2 v temp,2
Figuras 12, 13 e 14 ilustram o desempenho para esta solução.
Figura 12 mostra o desvio em dB da magnitude do termo de matriz principal p11 ao valor ideal de |p11| = 1 como uma função de w1 e w2. Como pode ser observado, devido aos constrangimentos postos a esta solução, a magnitude é sempre idêntica ao valor ideal |p11 = 1.
[00120] Figura 13 mostra o ângulo de p11 como uma função de w1 e w2.
Deveria ser notado que devido aos constrangimentos postos pela solução toda real também aqui as diferenças de fase estão até 90 graus.
[00121] Figura 14 mostra a magnitude do termo de matriz de diafonia p21 medido em dB como uma função de pesos w1 e w2.
[00122] Como ilustrado pelas Figuras, a solução de fixar os coeficientes de matriz de decodificação aos valores absolutos dos coeficientes da matriz de codificação inversa só desvia +/- 1 dB da abordagem mais complicada de minimizar a diafonia, ambos em termos de ganho de termo principal e supressão de diafonia.
[00123] Figura 15 ilustra um método de decodificação de áudio de acordo com algumas concretizações da invenção.
[00124] No etapa 1501, um decodificador recebe dados de entrada compreendendo um sinal de N canais correspondendo a um sinal mixado descendentemente de um sinal de áudio de M canais, M > N, tendo matrizes de codificação de sub-banda de valor complexo aplicadas em sub-bandas de frequência e dados de multicanais paramétricos associados com o sinal
Petição 870190059486, de 26/06/2019, pág. 37/89 / 34 mixado descendentemente.
[00125] Etapa 1501 é seguida por etapa 1503, em que sub-bandas de frequência são geradas para o sinal de N canais. Pelo menos algumas das subbandas de frequência são sub-bandas de frequência de valor real.
[00126] Etapa 1503 é seguida por etapa 1505, em que matrizes de decodificação de sub-banda de valor real para compensar a aplicação das matrizes de codificação são determinadas em resposta aos dados de multicanais paramétricos.
[00127] Etapa 1505 é seguida por etapa 1507, em que dados de mixagem descendente correspondendo ao sinal mixado descendentemente são gerados por uma multiplicação de matriz das matrizes de decodificação de sub-banda de valor real e dados do sinal de N canais nas pelo menos algumas sub-bandas de frequência de valor real.
[00128] Será apreciado que a descrição anterior para clareza descreveu concretizações da invenção com referência a unidades e processadores funcionais diferentes. Porém, será aparente que qualquer distribuição adequada de funcionalidade entre unidades ou processadores funcionais diferentes pode ser usada sem detrair da invenção. Por exemplo, a funcionalidade ilustrada a ser executada por processadores ou controladores separados pode ser executada pelo mesmo processador ou controladores. Consequentemente, referências a unidades funcionais específicas são só para serem vistas como referências a meios adequados para prover a funcionalidade descrita em lugar de indicativo de uma estrutura ou organização lógica ou física rígida.
[00129] A invenção pode ser implementada em qualquer forma adequada compreendendo hardware, software, firmware ou qualquer combinação destes. A invenção pode opcionalmente ser implementada pelo menos parcialmente como software de computador correndo em um ou mais processadores de dados e/ou processadores de sinal digitais. Os elementos e
Petição 870190059486, de 26/06/2019, pág. 38/89 / 34 componentes de uma concretização da invenção podem ser implementados fisicamente, funcionalmente e logicamente de qualquer modo adequado. Realmente, a funcionalidade pode ser implementada em uma única unidade, em uma pluralidade de unidades ou como parte de outras unidades funcionais. Como tal, a invenção pode ser implementada em uma única unidade ou pode ser distribuída fisicamente e funcionalmente entre unidades e processadores diferentes.
[00130] Embora a presente invenção tenha sido descrita com relação a algumas concretizações, não é pretendida ser limitada à forma específica publicada aqui. Em lugar disso, a extensão da presente invenção só está limitada pelas reivindicações acompanhantes. Adicionalmente, embora uma característica possa parecer ser descrita com relação a concretizações particulares, alguém qualificado na técnica reconheceria que várias características das concretizações descritas podem ser combinadas de acordo com a invenção. Nas reivindicações, o termo compreendendo não exclui a presença de outros elementos ou etapas.
[00131] Além disso, embora listado individualmente, uma pluralidade de meios, elementos ou etapas de método podem ser implementadas por exemplo por uma única unidade ou processador. Adicionalmente, embora características individuais possam ser incluídas em reivindicações diferentes, estas podem ser combinadas vantajosamente, possivelmente e a inclusão em reivindicações diferentes não implica que uma combinação de características não seja possível e/ou vantajosa. Também a inclusão de uma característica em uma categoria de reivindicações não implica uma limitação a esta categoria, mas em lugar disso indica que a característica é igualmente aplicável a outras categorias de reivindicação como apropriado. Além disso, a ordem de características nas reivindicações não implica qualquer ordem específica na qual as características devem ser trabalhadas e em particular a ordem de etapas individuais em uma reivindicação de método não implica que as etapas
Petição 870190059486, de 26/06/2019, pág. 39/89 / 34 devem ser executadas nesta ordem. Em lugar disso, as etapas podem ser executadas em qualquer ordem adequada. Além disso, referências singulares não excluem uma pluralidade. Assim, referências a um, uma, primeiro, segundo, etc., não impedem uma pluralidade. Sinais de referência nas reivindicações são providos somente como um exemplo esclarecedor não deverão ser interpretados como limitando a extensão das reivindicações de qualquer forma.