BR122020018157B1 - Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio, método para codificar um sinal de áudio de n canais e sistema de codificação de áudio - Google Patents

Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio, método para codificar um sinal de áudio de n canais e sistema de codificação de áudio Download PDF

Info

Publication number
BR122020018157B1
BR122020018157B1 BR122020018157-5A BR122020018157A BR122020018157B1 BR 122020018157 B1 BR122020018157 B1 BR 122020018157B1 BR 122020018157 A BR122020018157 A BR 122020018157A BR 122020018157 B1 BR122020018157 B1 BR 122020018157B1
Authority
BR
Brazil
Prior art keywords
mix
signal
wet
matrix
dry
Prior art date
Application number
BR122020018157-5A
Other languages
English (en)
Inventor
Lars Villemoes
Heidi-Maria LEHTONEN
Heiko Purnhagen
Toni Hirvonen
Original Assignee
Dolby International Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International Ab filed Critical Dolby International Ab
Priority claimed from BR112016008817-4A external-priority patent/BR112016008817B1/pt
Publication of BR122020018157B1 publication Critical patent/BR122020018157B1/pt

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

Um sistema de codificação (400) codifica um sinal de áudio de N canais (X), em que N=3, como um sinal de um canal de mixagem para baixo (Y), juntamente com parâmetros de mixagem seca e molhada para cima (C,P). Em um sistema de decodificação (200), uma seção descorrelacionada (101) emite, com base no sinal de mixagem para baixo, um sinal descorrelacionado de (N-1) canais (Z); uma seção de mixagem seca para cima (102) mapeia o sinal de mixagem para baixo linearmente de acordo com coeficientes de mixagem seca para cima (C) determinados com base nos parâmetros de mixagem seca para cima; uma seção de mixagem molhada para cima (103) preenche uma matriz intermediária com base nos parâmetros de mixagem molhada para cima e sabendo que a matriz intermediária pertence a uma classe de matriz pré-definida, obtém os coeficientes de mixagem molhada para cima (P) multiplicando a matriz intermediária por uma matriz pré-definida, e mapeia o sinal descorrelacionado linearmente de acordo com os coeficientes de mixagem molhada pra cima; e uma seção de combinação (104) combina saídas a partir das seções de mixagem para cima para obter um sinal reconstruído (X A) correspondendo ao sinal a ser reconstruído.

Description

Referência cruzada para pedidos relacionados
[001] Este pedido reivindica o benefício de prioridade ao pedido provisório de patente dos Estados Unidos N.° 61/893.770 depositado em 21 de outubro de 2013; Pedido de Patente Provisório dos Estados Unidos N.° 61/974.544 depositado em 03 de abril de 2014; e Pedido de Patente Provisório dos Estados Unidos N.° 62/037.693 depositado em 15 de agosto de 2014 cada um dos quais é aqui incorporado por referência na sua totalidade.
Campo Técnico da Invenção
[002] A invenção aqui descrita refere-se geralmente a codificação e descodificação de sinais de áudio, e em particular para a reconstrução paramétrica de um sinal de áudio de canais múltiplos a partir de um sinal de mixagem para baixo (”downmix”)e os metadados associados.
Antecedentes da Invenção
[003] Sistemas de reprodução de áudio compostos por vários alto- falantes são frequentemente utilizados para reproduzir uma cena de áudio representada por um sinal áudio multicanal, em que os respectivos canais de sinal de áudio multiplos canais são reproduzidos nos respectivos alto-falantes. O sinal de áudio de múltiplos canais pode, por exemplo, ter sido gravado através de uma pluralidade de transdutores acústicos ou pode ter sido gerado pelo equipamento de autoria de áudio. Em muitas situações, há limitações de largura de banda para transmitir o sinal de áudio para o equipamento de reprodução e/ou espaço limitado para armazenar o sinal de áudio numa memória de computador ou num dispositivo de armazenamento portátil. Existem sistemas de codificação de áudio para codificação paramétrica de sinais de áudio, de modo a reduzir o tamanho da largura de banda ou de armazenamento necessário. Em um lado do codificador, estes sistemas tipicamente mixam para baixo o sinal de áudio de múltiplos canais num sinal de mixagem para baixo, que tipicamente é uma mixagem para baixo mono (um canal) ou mixagem para baixo estéreo (dois canais), e extrai informação lateral que descreve as propriedades dos canais por meio de parâmetros como diferenças de nível e de correlação cruzada. A mixagem para baixo e as informações laterais são então codificadas e enviadas para um lado do decodificador. No lado do decodificador, o sinal de áudio de múltiplos canais é reconstruído, isto é aproximado, a partir da mixagem para baixo sob o controle dos parâmetros da informação lateral.
[004] Tendo em vista a vasta gama de diferentes tipos de disposi tivos e sistemas disponíveis para a reprodução de conteúdo de áudio multicanal, incluindo um segmento emergente destinado a usuários finais em suas casas, há uma necessidade de formas novas e alternativas para codificar eficientemente o conteúdo de áudio multicanal, de modo a reduzir os requisitos de largura de banda e/ou o tamanho da memória necessária para o armazenamento, e/ou para facilitar a reconstrução do sinal de áudio de múltiplos canais em um lado do deco- dificador.
Breve Descrição dos Desenhos
[005] No que se segue, exemplos de modalidades serão descritos em maiores detalhes e com referência aos desenhos anexos, em que:
[006] A Fig. 1 é um diagrama de blocos generalizado de uma se ção de reconstrução paramétrica para reconstrução de um sinal de áudio multicanal com base num sinal mixagem para baixo de um único canal e parâmetros mixagem seca e molhada para cima associados, de acordo com um exemplo de modalidade;
[007] a Fig. 2 é um diagrama de blocos generalizado de um sis tema de decodificação de áudio compreendendo a seção de reconstrução paramétrica representada na Fig. 1, de acordo com um exemplo de modalidade;
[008] a Fig. 3 é um diagrama de blocos generalizado de uma seção de codificação paramétrica para codificação de um sinal de áudio de multicanal como um sinal mixagem para baixo de um único canal e metadados associados, de acordo com um exemplo de modalidade;
[009] a Fig. 4 é um diagrama de blocos generalizado de um sis tema de codificação de áudio compreendendo a seção de codificação paramétrica representada na Fig. 3, de acordo com um exemplo de mo-dalidade;
[0010] as Figuras 5-11 ilustram modos alternativos para representar um sinal de áudio do canal 11.1 por meio de canais de mixagem para baixo, de acordo com o exemplo de modalidades;
[0011] as Figuras 12-13 ilustram modos alternativos para represen tar um sinal de áudio do canal 13.1 por meio de canais de mixagem para baixo, de acordo com o exemplo de modalidades; e
[0012] as Figuras 14-16 ilustram formas alternativas para represen tar um sinal de áudio do canal 22.2 por meio de sinais de mixagem para baixo, de acordo com o exemplo de modalidades.
[0013] Todas as figuras são esquemáticas e geralmente mostram apenas as partes que são necessárias a fim de elucidar a invenção, enquanto que outras partes podem ser omitidas ou simplesmente sugeridas.
Descrição das modalidades exemplificativas
[0014] Tal como aqui utilizado, um sinal de áudio pode ser um sinal de áudio puro, uma parte de áudio de um sinal audiovisual sinal ou multimídia, ou qualquer um destes em combinação com metadados.
[0015] Tal como aqui utilizado, um canal é um sinal de áudio asso ciado a uma posição/orientação espacial predefinida/fixa ou uma posição espacial indefinida, tais como “esquerda” ou “direita”. I. Visão geral
[0016] De acordo com um primeiro aspecto, modalidades exempla res propõem sistemas de decodificação de áudio assim como os métodos e produtos de programa de computador para reconstruir um sinal de áudio. Os sistemas de decodificação, métodos propostos e produtos de programa de computador, de acordo com o primeiro aspecto, podem geralmente partilhar as mesmas características e vantagens.
[0017] De acordo com o exemplo de modalidades, é proporcionado um método para reconstruir um sinal de áudio de N canais, em que N > 3. O método compreende receber um sinal de mixagem para baixo de canal único, ou um canal de um sinal de mixagem para baixo de multi- canais transportando dados para a reconstrução de mais sinais de áudio, juntamente com os parâmetros mixagem seca e molhada para cima associados; computação de um primeiro sinal com uma pluralidade de (N)canais, referido como um sinal de mixagem seca para cima, como um mapeamento linear do sinal de mixagem para baixo, em que um conjunto de coeficientes de mixagem seca para cima é aplicado ao sinal de mixagem para baixo como parte da computação do sinal de mixagem seca para cima; gerando um sinal com (N -1) canais descorrelacio- nado com base no sinal de mixagem para baixo; computação de um sinal adicional com uma pluralidade de (N) canais, referido como um sinal de mixagem molhada para cima, como um mapeamento linear do sinal descorrelacionado, em que um conjunto de coeficientes mixagem molhada para cima é aplicado aos canais de sinal descorrelacionado como parte de computação do sinal de mixagem molhada para cima; e combinar os sinais de mixagem seca e molhada para cima para obter um sinal reconstruído multidimensional correspondente ao sinal de áudio de N canais a ser reconstruído. O método compreende ainda a determinação do conjunto de coeficientes de mixagem seca para cima com base nos parâmetros de mixagem seca para cima recebidos; preencher uma matriz intermediário que possui mais elementos do que o número de parâmetros recebidos de mixagem molhada para cima, com base nos parâmetros recebidos de mixagem molhada para cima e sabendo que a matriz intermediária pertence a uma classe de matriz pré-definida; e obter o conjunto de coeficientes de mixagem molhada para cima pela multiplicação da matriz intermediária por uma matriz pré-definida, em que o conjunto de coeficientes de mixagem molhada para cima corresponde à matriz resultante da multiplicação e inclui mais coeficientes do que o número de elementos na matriz intermediária.
[0018] Neste exemplo de modalidade, o número de coeficientes de mixagem molhada para cima utilizado para reconstruir o sinal de áudio de N canais é maior do que o número de parâmetros recebidos de mi- xagem molhada para cima. Ao explorar o conhecimento da matriz pré- definida e a classe de matriz pré-definida para obter os coeficientes de mixagem molhada para cima dos parâmetros de mixagem molhada para cima recebidos, a quantidade de informação necessária para permitir a reconstrução do sinal de áudio de N canais pode ser reduzida, permitindo uma redução da quantidade de metadados transmitidos juntamente com o sinal de mixagem para baixo a partir de um lado do codificador. Ao reduzir a quantidade de dados necessários para a reconstrução paramétrica, a largura de banda necessária para a transmissão de uma representação paramétrica do sinal de áudio de N canais, e/ou o tamanho da memória necessária para armazenar uma referida repre-sentação, podem ser reduzidos.
[0019] O sinal descorrelacionado do canal (N - 1) serve para au mentar a dimensionalidade do conteúdo do sinal de áudio do canal N reconstruído, como percebido por um ouvinte. Os canais do (N - 1) - sinal descorrelacionado do canal podem ter, pelo menos, aproximadamente o mesmo espectro que o sinal de mixagem de baixa de canal único, ou podem ter espectros correspondentes a versões redimensio- nadas/normalizadas do espectro do sinal de mixagem de baixa de canal único, e pode formar, em conjunto com o sinal de mixagem de baixa de canal único, N, pelo menos, aproximadamente canais mutuamente não correlacionados. A fim de proporcionar uma reconstrução fiel dos canais do N - sinal de áudio de canal, cada um dos canais do sinal descorrela- cionado tem de preferência propriedades tais que é percebido por um ouvinte como semelhante ao sinal de mixagem de baixa. Portanto, embora seja possível sintetizar sinais mutuamente não correlacionados com um determinado espectro de, por exemplo, ruído branco, os canais do sinal descorrelacionado são preferencialmente derivados pelo processamento do sinal de mixagem de baixa, por exemplo, incluindo a aplicação de respectivos filtros passa-tudo para o sinal de mixagem de baixa ou a recombinação de porções do sinal de mixagem de baixa, de modo a preservar a maioria das propriedades quanto possível, especialmente propriedades localmente estacionárias do sinal de mixagem de baixa, incluindo propriedades relativamente mais sutis, psico-acustica- mente condicionadas do sinal de mixagem de baixa, tal como o timbre.
[0020] Combinando os sinais de mixagem para cima molhada e seca pode incluir a adição de conteúdo de áudio a partir dos respectivos canais do sinal de mixagem para cima molhada para o conteúdo de áudio dos seus respectivos canais correspondentes do sinal de mixagem para cima seca, tal como aditivo de mistura em uma base por amostra ou por coeficiente de transformação.
[0021] A classe de matriz predefinida pode ser associada com as propriedades conhecidas de pelo menos alguns elementos de matriz, que são válidos para todas as matrizes na classe, tais como certas relações entre alguns dos elementos da matriz, ou alguns dos elementos da matriz sendo zero. O conhecimento destas propriedades permite preencher a matriz intermediária baseada em menos parâmetros de mixa- gem para cima molhada do que o número total de elementos de matriz na matriz intermediária. O lado do decodificador tem conhecimento de, pelo menos, as propriedades de, e as relações entre os elementos de que necessita para calcular todos os elementos da matriz, com base dos parâmetros menores de mixagem para cima molhada.
[0022] Pelo sinal de mixagem para cima seca sendo um mapea mento linear do sinal de mixagem de baixa entende-se que o sinal de mixagem para cima seca é obtido através da aplicação de uma primeira transformação linear ao sinal de mixagem de baixa. Esta primeira transformação leva um canal como entrada e fornece N canais como saída, e os coeficientes de mixagem para cima seca são coeficientes que definem as propriedades quantitativas desta primeira transformação linear.
[0023] Pelo sinal de mixagem para cima molhada sendo um mape amento linear do sinal descorrelacionado entende-se que o sinal de mi- xagem para cima molhada é obtido através da aplicação de uma segunda transformação linear ao sinal descorrelacionado. Esta segunda transformação leva N - 1 a canais como entrada e fornece N canais como saída, e os coeficientes de mixagem para cima molhada são coeficientes que definem as propriedades quantitativas desta segunda transformação linear.
[0024] Num exemplo de modalidade, receber os parâmetros de mi- xagem para cima molhada pode incluir receber parâmetros N(N - 1)/2 de mixagem para cima molhada. No presente exemplo de modalidade, preencher a matriz intermediária pode incluir a obtenção de valores para (N - 1)2 elementos de matriz de acordo com os N(N - 1)/2 parâmetros de mixagem para cima molhada recebidos e sabendo que a matriz in-termediária pertence à classe de matriz predefinida. Isto pode incluir a inserção dos valores dos parâmetros de mixagem para cima molhada imediatamente como elementos da matriz, ou processando os parâmetros de mixagem para cima molhada de uma maneira adequada para derivar valores para os elementos da matriz. No presente exemplo de modalidade, a matriz predefinida pode incluir N(N - 1) elementos, e o conjunto de coeficientes de mixagem para cima molhada pode incluir N(N - 1) coeficientes. Por exemplo, receber os parâmetros de mixa- gem para cima molhada pode incluir receber não mais do que N(N - 1)/2 parâmetros de mixagem para cima molhada de forma independente podem ser atribuídos e/ou o número de parâmetros de mixagem para cima molhada recebidos podem ser não mais do que metade do número de coeficientes de mixagem para cima molhada utilizados para reconstruir o sinal de áudio do canal N.
[0025] Deve ser entendido que omitindo uma contribuição de um canal do sinal descorrelacionado quando se forma um canal do sinal de mixagem para cima molhada como um mapeamento linear dos canais do sinal descorrelacionado corresponde à aplicação de um coeficiente com o valor zero para aquele canal, isto é, omitindo uma contribuição de um canal não afeta o número de coeficientes aplicados como parte do mapeamento linear.
[0026] Num exemplo de modalidade, preencher a matriz intermedi ária pode incluir empregar os parâmetros de mixagem para cima molhada recebidos como elementos da matriz intermediária. Uma vez que os parâmetros de mixagem para cima molhada recebidos são utilizados como elementos da matriz intermediária sem serem processados ainda mais, a complexidade dos cálculos necessários para preencher a matriz intermediária, e para obter os coeficientes de mixagem para cima pode ser reduzida, permitindo uma reconstrução computacionalmente mais eficiente do sinal de áudio do canal N.
[0027] Num exemplo de modalidade, receber os parâmetros de mi- xagem para cima seca pode incluir receber parâmetros (N - 1) de mi- xagem para cima seca. No presente exemplo de modalidade, o conjunto de coeficientes de mixagem para cima seca pode incluir N coeficientes, e o conjunto de coeficientes de mixagem para cima seca é determinado com base nos (N - 1) parâmetros de mixagem para cima seca recebidos e com base numa relação pré-definida entre os coeficientes no conjunto de coeficientes de mixagem para cima seca. Por exemplo, receber os parâmetros de mixagem para cima seca pode incluir receber não mais que (N - 1) parâmetros de mixagem para cima seca independentemente atribuíveis. Por exemplo, o sinal de mixagem de baixa pode ser obtido, de acordo com uma regra predefinida, como um mapeamento linear do sinal de áudio do canal N a ser reconstruído, e a relação pré- definida entre os coeficientes de mixagem para cima seca pode ser baseada na regra predefinida.
[0028] Num exemplo de modalidade, a matriz de classe predefinida pode ser uma das seguintes: matrizes inferiores ou superiores triangulares, em que as propriedades conhecidas de todas as matrizes na classe incluem elementos de matriz predefinidas sendo zero; matrizes simétricas, em que as propriedades conhecidas de todas as matrizes na classe incluem elementos de matriz pré-definidas (em ambos os lados da diagonal principal) são iguais; e os produtos de uma matriz ortogonal e uma matriz diagonal, em que as propriedades conhecidas de todas as matrizes na classe incluem as relações entre elementos de matriz pré- definidas conhecidas. Em outras palavras, a classe de matriz pré-definida pode ser a classe de matrizes triangulares, a classe de matrizes triangulares superiores, a classe de matrizes simétricas ou a classe de produtos de uma matriz ortogonal e uma matriz diagonal. Uma proprie- dade comum de cada uma das classes acima é que a sua dimensionalidade é inferior ao número total de elementos de matriz.
[0029] Num exemplo de modalidade, o sinal de mixagem de baixa pode ser obtido, de acordo com uma regra pré-definida, como um mapeamento linear do sinal de áudio do canal N a ser reconstruído. No presente exemplo de modalidade, a regra pré-definida pode definir uma operação de mixagem de baixa pré-definida, e a matriz pré-definida pode ser baseada em vetores abrangendo o espaço de núcleo da operação de mixagem de baixa pré-definida. Por exemplo, as linhas ou colunas da matriz pré-definida podem ser vetores que formam uma base, por exemplo uma base ortonormal, para o espaço do kernel da operação de mixagem de baixa pré-definida.
[0030] Num exemplo de modalidade, receber o sinal de mixagem de baixa de canal único, juntamente com parâmetros de mixagem para cima seca e molhada associados podem incluir receber um segmento de tempo ou ladrilho de tempo/frequência do sinal de mixagem de baixa juntamente com os parâmetros de mixagem para cima seca e molhada associados a esse segmento de tempo ou tile de tempo/frequência. No presente exemplo de modalidade, o sinal reconstruído multidimensional pode corresponder a um segmento de tempo ou ladrilho de tempo/fre- quência sinal de áudio do canal N a ser reconstruído. Em outras palavras, a reconstrução do sinal de áudio do canal N pode, em pelo menos alguns exemplos de modalidades ser realizado um segmento de tempo ou tile tempo/frequência de cada vez. Sistemas de codificação/decodifi- cação de áudio normalmente dividem o espaço tempo-frequência em ladrilhos de tempo/frequência, por exemplo, pela aplicação de bancos de filtros adequados para os sinais de áudio de entrada. Por um ladrilho tempo/frequência geralmente significa uma porção do espaço tempo- frequência que corresponde a um intervalo de tempo/segmento e uma sub-banda de frequência.
[0031] De acordo com o exemplo de modalidades, é proporcionado um sistema de decodificação de áudio compreendendo uma primeira seção de reconstrução paramétrica configurada para reconstruir um sinal de canal de áudio N com base num primeiro sinal de mixagem de baixa de um único canal e os parâmetros de mixagem para cima seca e molhada associadas, em que N > 3. A primeira seção de reconstrução paramétrica compreende uma primeira seção de descorrelação configurada para receber o primeiro sinal de mixagem de baixa e para a saída, com base nele, um primeiro sinal descorrelacionado de canal N - 1. A primeira seção de reconstrução paramétrica também compreende uma primeira seção de mixagem para cima seca configurada para: receber os parâmetros de mixagem para cima seca e o sinal de mixagem de baixa; determinar um primeiro conjunto de coeficientes de mixagem para cima seca com base nos parâmetros de mixagem para cima seca; e um primeiro sinal de saída de mixagem para cima seca calculado ma-peando o primeiro sinal de mixagem de baixa linearmente de acordo com o primeiro conjunto de coeficientes de mixagem para cima seca. Em outras palavras, os canais do primeiro sinal de mixagem para cima seca são obtidos multiplicando o sinal de mixagem de baixa de canal único pelos respectivos coeficientes, que podem ser os próprios coeficientes de mixagem para cima seca, ou que podem ser controláveis coeficientes através dos coeficientes de mixagem para cima seca. A primeira seção de reconstrução paramétrica compreende ainda uma primeira seção de mixagem para cima molhada configurada para: receber os parâmetros de mixagem para cima molhada e o primeiro sinal des- correlacionado; preencher uma primeira matriz intermediário tendo mais elementos do que o número de parâmetros de mixagem para cima molhada recebidos, com base nos parâmetros de mixagem para cima molhada recebidos e sabendo que a primeira matriz intermediária pertence a uma primeira classe de matriz pré-definida, isto é, por utilização de propriedades de certos elementos da matriz conhecidos para manter para todas as matrizes na classe de matriz pré-definida; obter um primeiro conjunto de coeficientes de mixagem para cima molhada pela multiplicação da primeira matriz intermediária por uma primeira matriz pré-definida, em que o primeiro conjunto de coeficientes de mixagem para cima molhada corresponde à matriz resultante da multiplicação e inclui mais coeficientes do que o número de elementos na primeira matriz intermediária; e um primeiro sinal de saída de mixagem para cima molhada calculado mapeando o primeiro sinal descorrelacionado linearmente de acordo com o primeiro conjunto de coeficientes de mixagem para cima molhada, isto é, através da formação de combinações lineares dos canais do sinal descorrelacionado empregando os coeficientes de mixagem para cima molhada. A primeira seção de reconstrução paramétrica também compreende uma primeira seção combinando configurada para receber o primeiro sinal de mixagem para cima seca e o primeiro sinal de mixagem para cima molhada e para combinar estes sinais para se obter um primeiro sinal reconstruído multidimensional cor-respondente ao sinal de áudio dimensional N para ser reconstruído.
[0032] Num exemplo de modalidade, o sistema de decodificação de áudio pode compreender ainda uma segunda seção de reconstrução paramétrica operável independentemente da primeira seção de reconstrução paramétrica e configurado para reconstruir um sinal de áudio do canal N2 com base num segundo sinal de mixagem de baixa de um único canal e associado a parâmetros de mixagem para cima seca e molhada, em que N2 > 2. Pode, por exemplo, afirmar que N2 = 2 ou que N2 > 3. No presente exemplo de modalidade, a segunda seção de reconstrução paramétrica pode compreender uma segunda seção de des- correlação, uma segunda seção de mixagem para cima seca, uma segunda seção de mixagem para cima molhada e uma segunda seção de combinação, e as seções da segunda seção de reconstrução paramétrica podem ser configuradas de forma análoga às seções da primeira seção de reconstrução paramétrica correspondente. No presente exemplo de modalidade, a segunda seção de mixagem para cima molhada pode ser configurada para utilizar uma segunda matriz intermediária pertencente a uma segunda classe de matriz pré-definida e uma segunda matriz pré-definida. A segunda classe de matriz pré-definida e a segunda matriz pré-definida pode ser diferente do que, ou igual a, a primeira classe de matriz pré-definida e a primeira matriz pré-definida, respectivamente.
[0033] Num exemplo de modalidade, o sistema de decodificação de áudio pode ser adaptado para reconstruir um sinal de áudio multicanal com base numa pluralidade de canais de mixagem de baixa e os parâmetros de mixagem para cima seca e molhada associados. No presente exemplo de modalidade, o sistema de decodificação de áudio pode compreender: uma pluralidade de seções de reconstrução, incluindo seções de reconstrução paramétricas operáveis independentemente para reconstruir os respectivos conjuntos de canais de sinais de áudio baseado em respectivos canais de mixagem de baixa e respectivos parâmetros de mixagem para cima seca e molhada associados; e uma seção de controle, configurada para receber a sinalização que indica um formato de codificação do sinal de áudio de multicanal que corresponde a uma partição dos canais do sinal de áudio de multicanal em conjuntos de canais representados pelos respectivos canais de mixagem de baixa e, para pelo menos alguns dos canais de mixagem de baixa, pelos respectivos parâmetros de mixagem para cima seca e molhada associados. Na presente modalidade exemplificativa, o formato de codificação pode ainda corresponder a um conjunto de matrizes de coeficientes pré- definidas para a obtenção de mixagem para cima molhada associada com pelo menos alguns dos seus respectivos conjuntos de canais com base nos respectivos parâmetros de mixagem para cima molhada. Op-cionalmente, o formato de codificação pode ainda corresponder a um conjunto de classes de matriz pré-definidas como indicando respectivas matrizes intermediárias para ser preenchidas com base nos respectivos conjuntos de parâmetros de mixagem para cima molhada.
[0034] No presente exemplo de modalidade, o sistema de decodifi- cação pode ser configurado para reconstruir o sinal de áudio de multicanal utilizando um primeiro subconjunto da pluralidade de seções de reconstrução, em resposta à sinalização recebida indicando um primeiro formato de codificação. No presente exemplo de modalidade, o sistema de decodificação pode ser configurado para reconstruir o sinal de áudio de multicanal, utilizando um segundo subconjunto da pluralidade de seções de reconstrução, em resposta à sinalização recebida indicando um segundo formato de codificação e, pelo menos, um do primeiro e segundo subconjuntos das seções de reconstrução pode compreender a primeira seção de reconstrução paramétrica.
[0035] Dependendo da composição do conteúdo de áudio do sinal de áudio multicanal, a largura de banda disponível para a transmissão a partir de um lado do codificador para um lado do decodificador, a qualidade de reprodução pretendida na forma percebida por um ouvinte e/ou a fidelidade necessária do sinal de áudio como reconstruída em um lado do decodificador, o formato de codificação mais adequado pode diferir entre diferentes aplicações e/ou períodos de tempo. Ao suportar múltiplos formatos de codificação para o sinal de áudio multicanal, o sistema de decodificação de áudio no presente exemplo de modalidade permite que um lado do codificador empregue um formato de codificação mais especificamente adequado para as circunstâncias atuais.
[0036] Num exemplo de modalidade, a pluralidade de seções de re construção pode incluir uma seção de reconstrução de canal único ope- rável para reconstruir, independentemente, um único canal de áudio baseado em um canal de mixagem de baixa, em que não mais do que um canal de áudio foi codificado. No presente exemplo de modalidade, pelo menos um do primeiro e segundo subconjuntos das seções de reconstrução pode compreender a seção de reconstrução de canal único. Alguns canais de o sinal de áudio de multicanal podem ser particularmente importantes para a impressão geral do sinal de áudio de multicanal, como percebida por um ouvinte. Ao empregar a seção de reconstrução de canal único para codificar, por exemplo, um tal canal separadamente no seu próprio canal de mixagem de baixa, enquanto outros canais são parametricamente codificados juntos em outros canais de mixagem de baixa, a fidelidade do sinal de áudio de multicanal como reconstruído pode ser aumentada. Em alguns exemplos de modalidades, o conteúdo de áudio de um canal do sinal de áudio de multicanal pode ser de um tipo diferente do que o conteúdo de áudio dos outros canais de sinal de áudio de multicanal, e a fidelidade do sinal de áudio de multicanal como reconstruído pode ser aumentada empregando um formato de codificação em que esse canal é codificado separadamente em um canal de mixagem de baixa por si só.
[0037] Num exemplo de modalidade, o primeiro formato de codifi cação pode corresponder a reconstrução do sinal de áudio de multicanal a partir de um menor número de canais de mixagem de baixa que o segundo formato de codificação. Ao empregar um menor número de canais de mixagem de baixa, a largura de banda necessária para transmissão a partir de um lado do codificador para um lado do decodificador pode ser reduzida. Ao empregar um maior número de canais de mixa- gem de baixa, a fidelidade e/ou a qualidade de áudio percebida do sinal de áudio de multicanal como reconstruída pode ser aumentada.
[0038] De acordo com um segundo aspecto, o exemplo de modali dades propõe sistemas de codificação de áudio assim como os métodos e produtos de programa de computador para codificação de um sinal de áudio multicanal. Os sistemas de codificação, métodos propostos e produtos de programa de computador, de acordo com o segundo aspecto, podem geralmente partilhar as mesmas características e vantagens. Além disso, as vantagens acima apresentadas para as características de sistemas de decodificação, métodos e produtos de programa de computador, de acordo com o primeiro aspecto, em geral, pode ser válido para as características correspondentes de sistemas de codificação, métodos e produtos de programa de computador de acordo com o segundo aspecto.
[0039] De acordo com o exemplo de modalidades, é proporcionado um método para a codificação de um sinal de áudio do canal □ como um sinal de mixagem de baixa de um único canal e os metadados adequados para reconstrução paramétrica do sinal de áudio a partir do sinal de mixagem de baixa e um sinal descorrelacionado do canal (N-1) determinado com base no sinal de mixagem de baixa, em que N > 3. O método compreende: receber o sinal de áudio; computar, de acordo com uma regra pré-definida, o sinal de mixagem de baixa de um único canal como um mapeamento linear do sinal de áudio; e determinar um conjunto de coeficientes de mixagem para cima seca, a fim de definir um mapeamento linear do sinal de mixagem de baixa que corresponde aproximadamente ao sinal de áudio, por exemplo, através de uma aproximação de erro quadrado médio mínimo sob o pressuposto de que ape-nas o sinal de mixagem de baixa está disponível para a reconstrução. O método também compreende determinar uma matriz intermediária com base numa diferença entre uma covariância do sinal de áudio como recebido e uma covariância do sinal de áudio como aproximada através do mapeamento linear do sinal de mixagem de baixa, em que a matriz intermediária quando multiplicada por uma matriz pré-definida corresponde a um conjunto de coeficientes de mixagem para cima molhada que definem um mapeamento linear do sinal descorrelacionado como parte de reconstrução paramétrica do sinal de áudio, e em que o conjunto de coeficientes de mixagem para cima molhada inclui mais coeficientes do que o número de elementos na matriz intermediária. O método compreende, ainda, a saída do sinal de mixagem de baixa juntamente com os parâmetros de mixagem para cima seca, a partir da qual o conjunto de coeficientes de mixagem para cima seca é derivável, e parâmetros de mixagem para cima molhada, em que a matriz intermediária tem mais elementos do que o número de parâmetros de mixagem para cima molhada de saída, e em que a matriz intermediária é exclusivamente definida pelos parâmetros de mixagem para cima molhada de saída, contanto que a matriz intermediária pertence a uma classe de matriz pré-definida.
[0040] Uma cópia de reconstrução paramétrica do sinal de áudio a um lado do decodificador inclui, como uma contribuição, um sinal de mixagem para cima seca formado pelo mapeamento linear do sinal de mixagem de baixa e, como mais uma contribuição, um sinal de mixagem para cima molhada formado pelo mapeamento linear do sinal descorre- lacionado. O conjunto de coeficientes de mixagem para cima seca define o mapeamento linear do sinal de mixagem de baixa e o conjunto de coeficientes de mixagem para cima molhada define o mapeamento linear dos sinais descorrelacionados. Ao emitir parâmetros de mixagem para cima molhada que são menos do que o número de coeficientes de mixagem para cima molhada, e a partir do qual os coeficientes de mixa- gem para cima molhada são deriváveis a partir da matriz pré-definida e a classe de matriz pré-definida, a quantidade de informação enviada para um lado do decodificador para permitir a reconstrução do sinal de áudio de canal N pode ser reduzida. Ao reduzir a quantidade de dados necessários para a reconstrução paramétrica, a largura de banda necessária para a transmissão de uma representação paramétrica do sinal de áudio do canal N, e/ou o tamanho da memória necessária para armazenar uma referida representação, podem ser reduzidos.
[0041] A matriz intermediária pode ser determinada com base na diferença entre a covariância do sinal de áudio como recebido e a cova- riância do sinal de áudio como aproximada através do mapeamento linear do sinal de mixagem de baixa, por exemplo, para uma covariância do sinal obtido pelo mapeamento linear do sinal descorrelacionado para completar a covariância do sinal de áudio como aproximada através do mapeamento linear do sinal de mixagem de baixa.
[0042] Num exemplo de modalidade, a determinação da matriz in termediária pode incluir determinar a matriz intermediária de tal modo que uma covariância do sinal obtida pelo mapeamento linear do sinal descorrelacionado, definida pelo conjunto de coeficientes de mixagem para cima molhada, aproxima, ou substancialmente coincide com, a diferença entre a covariância do sinal de áudio como recebido e a covari- ância do sinal de áudio como aproximada através do mapeamento linear do sinal de mixagem de baixa. Em outras palavras, a matriz intermediária pode ser determinada de tal modo que uma cópia de reconstrução do sinal de áudio, obtida como uma soma de um sinal de mixagem para cima seca formada pelo mapeamento linear do sinal de mixagem de baixa e o sinal de mixagem para cima molhada formada pela mapeamento linear do sinal descorrelacionado completamente, ou pelo menos aproximadamente, restaura a covariância do sinal de áudio como recebido.
[0043] Num exemplo de modalidade, a saída dos parâmetros de mi- xagem para cima molhada pode incluir a saída de não mais do que parâmetros de mixagem para cima molhada atribuídos de forma independente N(N - 1)/2. No presente exemplo de modalidade, a matriz intermediária pode ter (N - 1)2 elementos da matriz e pode ser definida unicamente pelos parâmetros de mixagem para cima molhada de saída, contanto que a matriz intermediária pertença à classe de matriz pré-definida. No presente exemplo de modalidade, o conjunto de coeficientes de mixagem para cima molhada pode incluir N(N - 1) coeficientes.
[0044] Num exemplo de modalidade, o conjunto de coeficientes de mixagem para cima seca pode incluir N coeficientes. No presente exemplo de modalidades, emitir os parâmetros de mixagem para cima seca pode incluir a saída não mais do que N -1 parâmetros de mixagem para cima seca, e o conjunto de coeficientes de mixagem para cima seca pode ser derivável a partir dos parâmetros N - 1 de mixagem para cima seca utilizando a regra pré-definida.
[0045] Num exemplo de modalidade, o conjunto determinado de co eficientes de mixagem para cima seca pode definir um mapeamento linear do sinal de mixagem de baixa correspondente ao mínimo quadrado médio do erro de aproximação do sinal de áudio, ou seja, entre o conjunto de mapeamentos lineares do sinal de mixagem de baixa, o conjunto determinado de coeficientes de mixagem para cima seca pode definir o mapeamento linear que melhor se aproxima do sinal de áudio em um sentido quadrado médio mínimo.
[0046] De acordo com o exemplo de modalidades, é proporcionado um sistema de codificação de áudio compreendendo uma seção de codificação paramétrica configurada para codificar um sinal de áudio do canal N como um sinal de mixagem de baixa de um único canal e os metadados adequados para reconstrução paramétrica do sinal de áudio a partir do sinal de mixagem de baixa e um sinal descorrelacionado de canal (N - 1) determinado com base no sinal de mixagem de baixa, em que N > 3. A seção de codificação paramétrica compreende: uma seção de mixagem de baixa configurada para receber o sinal de áudio e para calcular, de acordo com uma regra pré-definida, o sinal de mixa- gem de baixa de um único canal como um mapeamento linear do sinal de áudio; e uma primeira seção de análise configurada para determinar um conjunto de coeficientes de mixagem para cima seca, a fim de definir um mapeamento linear do sinal de mixagem de baixa que corresponde aproximadamente ao sinal de áudio. A seção de codificação paramétrica compreende ainda uma segunda seção de análise configurada para determinar uma matriz intermediária com base numa diferença entre um covariância do sinal de áudio como recebido e uma covariância do sinal de áudio como aproximada através do mapeamento linear do sinal de mixagem de baixa, em que a matriz intermediária quando multiplicada por uma matriz pré-definida corresponde a um conjunto de coeficientes de mixagem para cima molhada que define um mapeamento linear do sinal descorrelacionado como parte de reconstrução paramétrica do sinal de áudio, em que o conjunto de coeficientes de mixagem para cima molhada inclui mais coeficientes do que o número de elementos na matriz intermediária. A seção de codificação paramétrica é ainda configurada para enviar o sinal de mixagem de baixa juntamente com os parâ-metros de mixagem para cima seca, a partir do qual o conjunto de coeficientes de mixagem para cima seca é derivável, e parâmetros de mi- xagem para cima molhada, em que a matriz intermediária tem mais elementos do que o número de parâmetros de mixagem para cima molhada de saída, e em que a matriz intermediária é definida exclusivamente pelos parâmetros de mixagem para cima molhada de saída desde que a matriz intermediária pertença a uma classe de matriz pré-definida.
[0047] Num exemplo de modalidade, o sistema de codificação de áudio pode ser configurado para fornecer uma representação de um sinal de áudio multicanal na forma de uma pluralidade de canais de mixa- gem de baixa e os parâmetros de mixagem para cima seca e molhada associados. No presente exemplo de modalidade, o sistema de codificação de áudio pode compreender: uma pluralidade de seções de codificação, incluindo seções de codificação paramétricas operáveis para calcular independentemente respectivos canais de mixagem de baixa e respectivos parâmetros de mixagem para cima associados baseados em respectivos conjuntos de canais de sinal de áudio. No presente exemplo de modalidade, o sistema de codificação de áudio pode ainda compreender uma seção de controle configurada para determinar um formato de codificação para o sinal de áudio multicanal, que corresponde a uma partição dos canais do sinal de áudio de multicanal em conjuntos de canais sendo representados pelos respectivos canais de mixagem de baixa e, pelo menos, alguns dos canais de mixagem de baixa, por respectivos parâmetros de mixagem para cima seca e molhada associados. Na presente modalidade exemplificativa, o formato de codificação pode ainda corresponder a um conjunto de regras pré- definidas para calcular, pelo menos, alguns dos respectivos canais de mixagem de baixa. No presente exemplo de modalidade, o sistema de codificação de áudio pode ser configurado para codificar o sinal de áudio de multicanal utilizando um primeiro subconjunto da pluralidade de seções de codificação, em resposta ao formato de codificação determinado sendo um primeiro formato de codificação. No presente exemplo de modalidade, o sistema de codificação de áudio pode ser configurado para codificar o sinal de áudio de multicanal, utilizando um segundo subconjunto da pluralidade de seções de codificação, em resposta ao formato de codificação determinado sendo um segundo formato de codificação e, pelo menos, um do primeiro e segundo subconjuntos das seções de codificação pode compreender a primeira seção de codificação paramétrica. No presente exemplo de modalidade, a seção de controle pode por exemplo determinar o formato de codificação com base numa largura de banda disponível para a transmissão de uma versão codificada do sinal de áudio de multicanal para um lado do decodificador, baseado no conteúdo de áudio dos canais do sinal de áudio de multicanal e/ou com base em um sinal de entrada indicando um formato de codificação desejado.
[0048] Num exemplo de modalidade, a pluralidade de seções de co dificação pode incluir uma seção de codificação de canal único operável para codificar de forma independente não mais do que um único canal de áudio em um canal de mixagem de baixa, e, pelo menos, um do primeiro e segundo subconjuntos das seções de codificação podem compreender seção de codificação de canal único.
[0049] De acordo com o exemplo de modalidades, é proporcionado um produto de programa de computador que compreende um meio de leitura por computador com instruções para a realização de qualquer dos métodos do primeiro e segundo aspectos.
[0050] De acordo com o exemplo de modalidades, esta pode consi derar que N = 3 ou N = 4 em qualquer um dos métodos, sistemas de codificação, sistemas e produtos de programas de computador do primeiro e segundo aspectos da decodificação.
[0051] Outro exemplo de modalidades está definido nas reivindica ções dependentes. Deve ser notado que modalidades exemplificativas incluem todas as combinações de características, mesmo se mencionadas nas reivindicações mutuamente diferentes. II. Modalidades de exemplo
[0052] Em um lado do codificador, o qual será descrito com referên cia às Figs. 3 e 4, um sinal de mixagem de baixa de canal único □ é calculado como um mapeamento linear de um sinal de áudio do canal NX = [x1 ... XN]T de acordo com a
Figure img0001
onde dn,n — 1, ...,N, são coeficientes de mixagem de baixa representados por uma matriz de mixagem de baixa D. Num lado do decodificador, o qual será descrito com referência às Figs. 1 e 2, a reconstrução paramétrica do sinal de áudio do canal N X é realizada de acordo com
Figure img0002
onde cn, n = 1,..., N, são coeficientes de mixagem para cima seca representados por uma matriz secar matriz de mixagem para cima C, pn_k, n = 1, ...,N,k = 1, ...N - 1, são coeficientes de mixagem para cima molhada representados por uma matriz de mixagem para cima molhada , e zk, k = 1,..., N - 1 são os canais de um sinal descorrelacionado de canal (N - 1) Z gerado com base no sinal de mixagem de baixa Y. Se os canais de cada um dos sinais de áudio são representados como linhas, a matriz de covariância do sinal de áudio original pode ser expressa como R = XXT e a matriz de covariância do sinal de áudio como reconstruído X pode ser expressa como R = XXT. Deve ser notado que, se por exemplo os sinais de áudio são representados como linhas compreendendo coeficientes de transformada de valor complexo, a parte real de XX*, onde X* é a transposta conjugada complexa da matriz X, pode por exemplo ser considerado em vez de XXT.
[0053] A fim de proporcionar uma reconstrução fiel do sinal de áudio original X, pode ser vantajoso para a reconstrução dada pela equação (2) para restabelecer covariância completa, ou seja, pode ser vantajoso utilizar matrizes de mixagem para cima seca e molhada C e tal que R=R. (3)
[0054] Uma abordagem é para primeiro encontrar uma matriz de mixagem para cima seca C dando o melhor possível de mixagem para cima “seca” X 0=CY no sentido dos mínimos quadrados, resolvendo as equações normais CYY7 = XYT. (4)
[0055] Para X0=CY, com uma matriz C resolvendo a equação (4), afirma que
Figure img0003
[0056] Assumindo que os canais do sinal descorrelacionado são mutuamente não correlacionados, e todos têm a mesma energia ||Y||2 igual ao do sinal de mixagem de baixa de canal único , a covariância ausente definida positiva ΔR pode ser fatorada de acordo com a ΔR = PPT||Y||2. (6)
[0057] A covariância completa pode ser restabelecida de acordo com a equação (3), utilizando uma matriz de mixagem para cima seca resolvendo a equação (4) e uma matriz de mixagem para cima molhada resolvendo a equação (6). As equações (1) e (4) implicam que DCYYT = YYT , e, assim, que
Figure img0004
(7) para matrizes de mixagem de baixa não degeneradas D. As equações (5) e (7) implicam que D(0 - ) = DCY - Y = 0 e DΔR = 0. (8)
[0058] Assim, a covariância faltando ΔR tem classificação N - 1, e pode ser efetivamente fornecida, empregando um sinal descorrelacio- nado Z com N - 1 canais mutuamente não correlacionados. A equação (6) e (8) implica que DP = 0, de modo que as colunas da matriz de mi- xagem para cima molhada resolvendo a equação (6) podem ser construídas a partir de vetores que abrangem o espaço de kernel da matriz de mixagem de baixa D. Os cálculos para encontrar uma matriz de mi- xagem para cima molhada adequada pode, portanto, ser movida para aquele espaço de menor dimensão.
[0059] Deixar 𝑉 ser uma matriz de tamanho 𝑁(𝑁 − 1) contendo uma base ortonormal para o espaço do kernel da matriz de mixagem de baixa 𝐷, ou seja, um espaço linear de vetores 𝑣 com 𝐷𝑣 = 0. Exemplos de tais matrizes pré-definidas 𝑉 para 𝑁 = 2, 𝑁 = 3, e 𝑁 = 4, respectivamente, são
Figure img0005
[0060] Na base dada por V, a covariância em falta pode ser expressa como 𝑅𝑣 = 𝑉𝑇(Δ𝑅)𝑉. Para encontrar uma matriz de mixagem para cima molhada 𝑃 resolvendo a equação (6), portanto, pode-se primeiro encontrar uma matriz 𝐻 resolvendo 𝑅 𝑣 = 𝐻𝐻𝑇 e, em seguida, obter 𝑃 como 𝑃 = 𝑉𝐻/‖𝑌‖, onde ‖𝑌‖ é a raiz quadrada da energia do sinal de mixagem de baixa de canal único 𝑌. Outras matrizes adequadas de mixagem para cima 𝑃 podem ser obtidas na forma de 𝑃 = 𝑉𝐻𝑂/‖𝑌‖𝑂, onde 𝑂 é uma matriz ortogonal. Alternativamente, pode-se redimensionar a covariância faltando 𝑅 𝑣 pela energia ‖𝑌‖2 do sinal de mixagem de baixa de canal único 𝑌 e, em vez resolver a equação
Figure img0006
onde 𝐻 = 𝐻 𝑅‖𝑌‖, e obter 𝑃 como 𝑃 = 𝑉𝐻 𝑅. (11)
[0061] Quando as entradas de HR são quantizadas e a saída dese jada tem um canal silencioso, as propriedades da matriz pré-definida V como indicado acima podem ser inconvenientes. Como um exemplo, para N = 3, uma melhor escolha para a segunda matriz de (9) seria
Figure img0007
[0062] Felizmente, a exigência de que as colunas da matriz V são ortogonais aos pares pode ser descartada enquanto estas colunas são linearmente independentes. A solução desejada Rv para ΔR = VRvVT é então obtida por Rv = WT(ΔR)W com = V(VTV)-1, o pseudoinverso de V.
[0063] A matriz Rv é uma matriz semi-definida positiva de tamanho (N - 1)2 e existem várias abordagens para encontrar soluções para a equação (10), conduzindo às soluções dentro de respectivas classes de matriz de dimensão N(N - 1)/2, isto é, em que as matrizes são definidas de forma única por elementos de matriz N(N - 1)/2. As soluções podem ser obtidas, por exemplo, através do emprego de:
[0064] a. fatoração de Cholesky, levando a um menor um HR trian gular;
[0065] b. raiz quadrada positiva, levando a um HR simétrico positivo semi-definido; ou
[0066] c. polar, levando a HN da forma HR = OA, onde O é ortogonal e Δ é diagonal.
[0067] Além disso, existe versão normalizada das opções a) e b) em que HR pode ser expresso como HR = AH0, onde Δ é diagonal e H0 tem todos os elementos diagonais iguais a um. As alternativas a, b e c, acima, fornecem soluções HR em diferentes classes de matriz, isto é, matrizes triangulares, matrizes simétricas e produtos de matrizes diagonais e ortogonais. Se a classe de matriz para os quais HR pertence é conhecida a um lado do decodificador, isto é, se for conhecido que HR pertence a uma classe de matriz pré-definida, por exemplo, de acordo com quaisquer das alternativas acima a, b e c, HR pode ser preenchido com base em apenas N(N - 1)/2 dos seus elementos. Se também a matriz V é conhecida no lado do descodificador, por exemplo, se é sabido que V é uma das matrizes de dados em (9), a matriz de mixagem para cima molhada , necessária para a reconstrução de acordo com a equação (2), pode então ser obtida através da equação (11).
[0068] A Fig. 3 é um diagrama de blocos generalizado de uma se ção de codificação paramétrica 300 de acordo com um exemplo de modalidade. A seção de codificação paramétrica 300 está configurada para codificar um sinal de áudio do canal N X como um sinal de mixagem de baixa de canal único e os metadados adequados para reconstrução paramétrica do sinal de áudio X de acordo com a equação (2). A seção de codificação paramétrica 300 compreende uma seção de mixagem de baixa 301, que recebe o sinal de áudio e calcula, de acordo com uma regra pré-definida, o sinal de mixagem de baixa de canal único como um mapeamento linear do sinal de áudio . No presente exemplo de modalidade, a seção de mixagem de baixa 301 calcula o sinal de mixa- gem de baixa de acordo com a equação (1), em que a matriz de mi- xagem de baixa é pré-definida e corresponde à regra pré-definida. Uma primeira seção de análise 302 determina um conjunto de coeficientes de mixagem para cima seca, representado pela matriz de mixa- gem para cima seca , a fim de definir um mapeamento linear do sinal de mixagem de baixa aproximando o sinal de áudio .. Este mapeamento linear do sinal de mixagem de baixa é designado por na equação (2). No presente exemplo de modalidade, N coeficientes de mi- xagem para cima seca são determinados de acordo com a equação (4) de tal modo que o mapeamento linear do sinal de mixagem de baixa corresponde a uma aproximação quadrada média mínima do sinal de áudio . Uma segunda análise de seção 303 determina uma matriz intermediária HR com base numa diferença entre a matriz de co- variância do sinal de áudio tal como foi recebido e a matriz de covari- ância do sinal de áudio como aproximadas através do mapeamento linear do sinal de mixagem de baixa . No presente exemplo de modalidade, as matrizes de covariância são calculadas pela primeira e segunda seções de processamento 304, 305, respectivamente, e são então fornecidos à segunda seção de análise 303. No presente exemplo de modalidade, a matriz intermediária HR é determinada de acordo com a abordagem descrita acima para b resolvendo a equação (10), que conduz a uma matriz intermediária HR que é simétrica. Tal como indicado nas equações (1) e (11), a matriz intermediária HR, quando multi-plicado por uma matriz pré-definida V, define, através de um conjunto de parâmetros de mixagem para cima molhada , um mapeamento linear de um sinal descorrelacionado como parte de reconstrução paramétrica do sinal de áudio em um lado do decodificador. No presente exemplo de modalidade, a matriz intermediária V é a segunda matriz (9) para o caso N = 3, e a terceira matriz em (9) para o caso N = 4. A seção de codificação paramétrica 300 emite o sinal de mixagem de baixa Y juntamente com parâmetros de mixagem para cima seca C e parâmetros de mixagem para cima molhada í5. No presente exemplo de modalidade, N - 1 do N de coeficientes de mixagem para cima seca C são os parâmetros de mixagem para cima seca (J, e o coeficiente de mixagem para cima seca restante é derivável a partir dos parâmetros de mixagem para cima seca C via equação (7) se a matriz de mixagem de baixa pré-definida é conhecida. Uma vez que a matriz intermediária HR pertence à classe das matrizes simétricas, que é definida exclusivamente por N(N - 1)/2 dos seus elementos (N - 1)2. No presente exemplo de modalidade, N(N - 1)/2 dos elementos da matriz intermediária HR são, por conseguinte, parâmetros de mixagem para cima molhada í a partir do qual o restante da matriz intermediária HR é derivável sabendo que é simétrica.
[0069] A Fig. 4 é um diagrama de blocos generalizado de um sis tema de codificação de áudio 400 de acordo com uma modalidade exemplificativa, que compreende a seção de codificação paramétrica 300 descrita com referência à Fig. 3. No presente exemplo de modalidade, o conteúdo de áudio, por exemplo, registrado por um ou mais transdutores acústicos 401, ou gerado pelo equipamento de autoria de áudio 401, é fornecido sob a forma do sinal de canal de áudio N X. Um filtro de espelho de quadratura (QMF) de seção de análise 402 transforma o sinal de áudio X, segmento de tempo por segmento de tempo, em um domínio QMF para processamento pela seção de codificação paramétrica 300 do sinal de áudio X sob a forma de ladrilhos de tempo/frequência. O sinal de mixagem de baixa emitido pela seção de codificação paramétrica 300 é transformado de volta a partir do domínio QMF por uma seção de síntese QMF 403 e é transformado em um domínio de transformação de cosseno discreta modificada (MDCT) por uma seção de transformação 404. Seções de quantização 405 e 406 quantizam os parâmetros de mixagem para cima seca C e parâmetros de mixagem para cima molhada í5, respectivamente. Por exemplo, quantização uniforme com um tamanho de passo de 0,1 ou 0,2 (adimen- sional) pode ser empregada, seguido de codificação de entropia sob a forma de codificação de Huffman. Uma quantização grosseira com tamanho de passo de 0,2 pode, por exemplo ser empregada para poupar largura de banda de transmissão, e uma quantização mais fina com tamanho de passo de 0,1 pode, por exemplo, ser empregada para melhorar a fidelidade da reconstrução de um lado do decodificador. O sinal de mixagem de baixa transformado por MDCT e a seca quantificada de mixagem para cima parâmetros C e parâmetros de mixagem para cima molhada í5 são então combinados em um fluxo de bits B por um multi- plexador 407, para transmissão ao lado do decodificador. O sistema de codificação de áudio 400 pode também compreender um codificador principal (não mostrado na Fig. 4) configurado para codificar o sinal de mixagem de baixa usando um codec de áudio perceptual, tais como Dolby Digital ou MPEG AAC, antes de o sinal de mixagem de baixa ser fornecido ao multiplexador 407.
[0070] A Fig. 1 é um diagrama de blocos generalizado de uma se ção de reconstrução paramétrica 100, de acordo com uma modalidade exemplificativa, configurado para reconstruir o sinal de áudio do canal N X com base num sinal de mixagem de baixa de canal único Y e parâmetros de mixagem para cima seca C e parâmetros de mixagem para cima molhada í5 associados. A seção de reconstrução paramétrica 100 está adaptada para executar a reconstrução de acordo com a equação (2), isto é, utilizando parâmetros de mixagem para cima seca e parâmetros de mixagem para cima molhada . No entanto, em vez de receber os parâmetros de mixagem para cima seca e parâmetros de mi- xagem para cima molhada , parâmetros de mixagem para cima seca C e parâmetros de mixagem para cima molhada í5 são recebidos a partir do qual os parâmetros de mixagem para cima seca e parâmetros de mixagem para cima molhada í são deriváveis. Uma seção de descor- relação 101 recebe o sinal de mixagem de baixa e emite, com base nele, um sinal descorrelacionado do canal (N - 1) Z = [z1 — zN-1]T. No presente exemplo de modalidade, os canais de sinal de descorrelacio- nado Z são derivados pelo processamento do sinal de mixagem de baixa , incluindo a aplicação de respectivos filtros passa-tudo para o sinal de mixagem de baixa , de modo a proporcionar canais que não estão correlacionados com o sinal de mixagem de baixa , e com o conteúdo de áudio, que é espectralmente semelhante a e também percebido como semelhante ao di sinal de mixagem de baixa por um ouvinte. O sinal descorrelacionado do canal (N - 1) Z serve para aumentar a dimensionalidade da versão reconstruída X de sinal de áudio do canal N X, como percebido por um ouvinte. No presente exemplo de modalidade, os canais de sinal descorrelacionado Z têm pelo menos aproximadamente o mesmo espectro que o do sinal de mixagem de baixa de canal único Y e forma, juntamente com o sinal de mixagem de baixa de canal único Y, N, pelo menos, aproximadamente canais mutuamente não correlacionados. Uma seção de mixagem para cima seca 102 recebe parâmetros de mixagem para cima seca C e o sinal de mi- xagem de baixa Y. No presente exemplo de modalidade, parâmetros de mixagem para cima seca C coincidem com o primeiro N - 1 do N coeficientes de mixagem para cima seca C, e o coeficiente de mixagem para cima seca restante é determinado com base em uma relação pré-definida entre os coeficientes de mixagem para cima seca C dada pela equação (7). A seção de mixagem para cima seca 102 emite um sinal de mixagem para cima seca calculada mapeando o sinal de mixagem de baixa linearmente de acordo com o conjunto de coeficientes de mi- xagem para cima seca , e denotado por na equação (2). Uma seção de mixagem para cima molhada 103 recebe os parâmetros de mi- xagem para cima molhada P e o sinal descorrelacionado Z. No presente exemplo de modalidade, os parâmetros de mixagem para cima molhada P são N(N - 1)/2 elementos da matriz intermediária HR determinados no lado do codificador de acordo com a equação (10). No presente exemplo de modalidade, a seção de mixagem para cima molhada 103 preenche os restantes elementos da matriz intermediária HR sabendo que a matriz intermediária HR pertence a uma classe de matriz pré-definida, isto é, que é simétrica, e a exploração das relações correspondentes entre os elementos da matriz. A seção de mixagem para cima molhada 103, em seguida, obtém um conjunto de coeficientes de mixagem para cima molhada P empregando equação (11), ou seja, através da multiplicação da matriz intermediária HR pela matriz pré-definida V, isto é, a segunda matriz em (9) para o caso de N = 3, e a terceira matriz de (9) para o caso N = 4. Assim, os coeficientes de mixagem para cima molhada N(N - 1) P são derivados do N(N - 1)/2 recebido independentemente parâmetros atribuíveis de mixagem para cima molhada P. A seção de mixagem para cima molhada 103 emite um sinal de mixa- gem para cima molhada calculado pelo mapeamento do sinal descorre- lacionado Z linearmente de acordo com o conjunto de coeficientes de mixagem para cima molhada P, e denotado por PZ na equação (2). Uma seção combinando 104 recebe o sinal de mixagem para cima seca e o sinal de mixagem para cima molhada PZ e combina estes sinais para se obter um primeiro sinal reconstruído multidimensional X correspondente ao sinal de áudio do canal N X para ser reconstruído. No pre-sente exemplo de modalidade, a seção de combinação 104 obtém os respectivos canais do sinal reconstruído X, combinando o conteúdo de áudio dos seus respectivos canais de sinal de mixagem para cima seca CY com os respectivos canais de sinal de mixagem para cima molhada , de acordo com a equação (2).
[0071] A Fig. 2 é um diagrama de blocos generalizado de um sis tema de decodificação de áudio 200 de acordo com um exemplo de modalidade. O sistema de decodificação de áudio 200 compreende a seção de reconstrução paramétrica 100 descrita com referência à Fig. 1. Uma seção de recepção 201, por exemplo incluindo um desmultiplexa- dor, recebe o fluxo de bits B transmitido a partir do sistema de codificação de áudio 400 descrito com referência à Fig. 4 e extrai o sinal de mixagem de baixa Y e os de mixagem para cima parâmetros seca associados C e parâmetros de mixagem para cima molhada P a partir do fluxo de bits B. No caso de o sinal de mixagem de baixa Y é codificado no fluxo de bits B usando um codec de áudio perceptual como Dolby Digital ou MPEG AAC, o sistema de decodificação de áudio 200 pode compreender um decodificador de núcleo (não mostrado na Fig. 2) configurado para decodificar o sinal de mixagem de baixa Y quando extraída do fluxo de bits B. Uma seção transformação 202 transforma o sinal de mixagem de baixa Y através da realização de MDCT inversa e uma seção de análise QMF 203 transforma o sinal de mixagem de baixa Y em um domínio QMF para processamento pela seção de reconstrução paramétrica 100 do sinal de mixagem de baixa Y sob a forma de ladrilhos de tempo/frequência. Seções de dequantização 204 e 205 dequan- tizam os parâmetros de mixagem para cima seca C e parâmetros de mixagem para cima molhada P, por exemplo, a partir de um formato de entropia codificado, antes de fornecer-lhes a seção reconstrução paramétrica 100. Tal como descrito com referência à Fig. 4, quantização pode ter sido executada com um de dois diferentes tamanhos de passo, por exemplo 0,1 ou 0,2. O tamanho de passo real empregado pode ser pré-definido, ou pode ser sinalizado para o sistema de decodificação de áudio 200 a partir do lado do codificador, por exemplo através do fluxo de bits B. Em alguns exemplos de modalidades, os coeficientes de mixagem para cima seca C e os coeficientes de mixagem para cima molhada pode ser derivada a partir de parâmetros de mixagem para cima seca C e parâmetros de mixagem para cima molhada P , respectivamente, já nas respectivas seções de dequantização 204 e 205, os quais podem, opcionalmente, ser consideradas como fazendo parte da seção de mixagem para cima seca 102 e a seção de mixagem para cima mo-lhada 103, respectivamente. No presente exemplo de modalidade, o sinal de áudio reconstruído X emitido pela seção de reconstrução paramétrica 100 é transformado de volta a partir do domínio QMF por uma seção de síntese QMF 206 antes de ser fornecido como saída do sistema de decodificação de áudio 200 para reprodução num sistema de multi-falante 207.
[0072] As Figs. 5-11 ilustram modos alternativos para representar um sinal de áudio do canal 11.1 por meio de canais de mixagem de baixa, de acordo com o exemplo de modalidades. No presente exemplo de modalidade, o sinal de áudio do canal 11.1 compreende os canais: esquerdo (L), direito (R), centro (C), efeitos de baixa frequência (LFE), lado esquerdo (LS), lado direito (RS), o esquerdo traseiro (LB), direito traseiro (RB), superior dianteiro esquerdo (TFL), frontal direito superior (TFR), superior traseiro esquerdo (TBL) e superior traseiro direito (TBR), que são indicados nas Figuras 5-11 por letras maiúsculas. As formas alternativas para representar o sinal de áudio do canal 11.1 correspondem às partições alternativas dos canais em conjuntos de canais, cada conjunto sendo representado por um único sinal de mixagem de baixa, e, opcionalmente, por meio de parâmetros de mixagem para cima mo-lhada e seca associados. Codificação de cada um dos conjuntos de ca- nais no seu respectivo sinal de mixagem de baixa de canal único (metadados) pode ser realizada de forma independente e paralelamente. Da mesma forma, a reconstrução dos respectivos conjuntos de canais de seus respectivos sinais mixagem de baixa de canal único pode ser realizada de forma independente e em paralelo.
[0073] Deve ser entendido que, no exemplo de modalidades descri tas com referência às Figs. 5-11 (e também a seguir com referência às Figs. 13-16), nenhum dos canais reconstruídos pode incluir contribuições de mais do que um canal de mixagem de baixa e quaisquer sinais descorrelacionados derivados de sinal de mixagem de baixa único, isto é, as contribuições a partir de canais de mixagem de baixa múltiplos não são combinadas/misturadas durante a reconstrução paramétrica.
[0074] Na Fig. 5, o LS canais, TBL e LB formam um grupo 501 dos canais representados pelo canal de mixagem de baixa simples Is (e seus metadados associados). A seção de codificação paramétrica 300 descrita com referência à Fig. 3 pode ser empregada com N = 3 para representar os três canais de áudio LS, TBL e LB pelo canal de mixagem de baixa único Is e parâmetros de mixagem para cima seca e molhada associados. Dado que uma matriz pré-definida V e classe de matriz pré- definida de uma matriz intermediária HR, ambas associadas com a codificação executada na seção de codificação paramétrica 300, são conhecidas em um lado do decodificador, a seção de reconstrução paramétrica 100, descrita com referência à fig. 1, pode ser empregada para reconstruir os três canais LS, TBL e LB a partir sinal de mixagem de baixa ls e os parâmetros de mixagem para cima seca e molhada associados. Da mesma forma, os canais RS, TBR e RB formam um grupo 502 de canais representados pelo canal de mixagem de baixa único rs, e um outro exemplo da seção de codificação paramétrica 300 pode ser utilizada em paralelo com a primeira seção de codificação para representar os três canais RS, TBR e RB pelo canal de mixagem de baixa único rs e parâmetros de mixagem para cima seca e molhada associados. Além disso, dado que a matriz pré-definida V e uma classe matriz pré-definida para o qual uma matriz intermediária HR pertence, ambos associados com o segundo exemplo da seção de codificação paramétrica 300, são conhecidos a um lado do decodificador, um outro exemplo da seção de reconstrução paramétrica 100 pode ser utilizado em paralelo com a primeira seção de reconstrução paramétrica para reconstruir os três canais RS, TBR e RB a partir dos sinal de mixagem de baixa rs e os parâmetros de mixagem para cima seca e molhada associados. Outro grupo 503 de canais inclui apenas dois canais L e TFL representados por um canal de mixagem de baixa I. Codificação destes dois ca-nais para o canal de mixagem de baixa I e parâmetros de mixagem para cima molhada e seca associados podem ser realizados por seções de codificação e seção de reconstrução análogos aos descritos com referência às Figs. 3 e 1, respectivamente, mas para N = 2. Outro grupo 504 de canais compreende apenas um canal LFE único representado por um canal de mixagem de baixa lfe. Neste caso, nenhuma mixagem de baixa é necessária e o canal lfe de mixagem de baixa pode ser o próprio canal LFE, opcionalmente transformado num domínio MDCT e/ou codificado usando um codec de áudio perceptual.
[0075] O número total de canais de mixagem de baixa empregado nas Figs. 5-11 para representar o sinal de áudio canal 11.1 varia. Por exemplo, o exemplo ilustrado na Fig. 5 emprega 6 canais de mixagem de baixa enquanto o exemplo na Fig. 7 emprega 10 canais de mixagem de baixa. Diferentes configurações de mixagem de baixa podem ser adequadas para diferentes situações, por exemplo dependendo da largura de banda disponível para a transmissão dos sinais de mixagem de baixa e o parâmetro de mixagem para cima associado, e/ou requisitos sobre a forma fiel a reconstrução do sinal de áudio do canal 11.1 deve ser.
[0076] De acordo com o exemplo de modalidade, o sistema de co dificação de áudio 400 descrito com referência à Fig. 4 pode compreender uma pluralidade de seções de codificação paramétrica, incluindo a seção de codificação paramétrica 300 descrita com referência à Fig. 3. O sistema de codificação de áudio 400 pode incluir uma seção de controle (não mostrada na Fig. 4) configurada para determinar/selecionar um formato de codificação para o sinal de áudio canal 11.1, a partir de uma coleção para os formatos de codificação correspondentes às respectivas partições do sinal de áudio do canal 11.1 ilustrado nas Figs. 511. O formato de codificação corresponde ainda a um conjunto de regras pré-definidas (pelo menos alguns dos quais podem coincidir) para calcular os respectivos canais de mixagem de baixa, um conjunto de classes de matriz pré-definidas (pelo menos alguns dos quais podem coincidir) para matrizes intermediárias HR e um conjunto de matrizes pré-definidas V (pelo menos, algumas das quais podem coincidir) para a obtenção de coeficientes de mixagem para cima molhada associados com pelo menos alguns dos seus respectivos conjuntos de canais com base em parâmetros respectivos de mixagem para cima molhada associados. De acordo com o presente exemplo de modalidade, o sistema de codificação de áudio é configurado para codificar o sinal de áudio do canal 11.1 utilizando um subconjunto da pluralidade de seções que codifica apropriadas para o formato de codificação determinado. Se, por exemplo, o formato de codificação determinado corresponde à partição dos canais 11.1 ilustrados na Fig. 1, o sistema de codificação pode empregar 2 seções de codificação configuradas para representar os respectivos conjuntos de 3 canais pelos respectivos canais de mixagem de baixa individuais, 2 seções de codificação configuradas para representar os respectivos conjuntos de 2 canais pelos respectivos canais de mixagem de baixa individuais, e 2 seções de codificação configuradas para representar respectivo canal único como respectivos canais de mi- xagem de baixa individuais. Todos os sinais de mixagem de baixa e os parâmetros de mixagem para cima molhada e seca associados podem ser codificados no mesmo fluxo de bits B, para transmissão a um lado do decodificador. Deve-se notar que o formato compacto dos metadados que acompanha os canais de mixagem de baixa, isto é, os parâmetros de mixagem para cima molhada e os parâmetros de mixagem para cima molhada, podem ser utilizados por algumas das seções de codificação, enquanto que em, pelo menos, alguns exemplos de modalidades, outros formatos de metadados pode ser empregados. Por exemplo, algumas das seções de codificação podem emitir o número total dos coeficientes de mixagem para cima seca e molhada em vez dos parâmetros de mixagem para cima seca e molhada. Modalidades estão também previstas em que alguns canais são codificados para a reconstrução empregam menos de canais descorrelacionados N - 1 (ou mesmo nenhuma decorrelação como um todo), e onde os metadados para a reconstrução paramétrica podem, portanto, assumir uma forma diferente.
[0077] De acordo com o exemplo de modalidade, o sistema de de- codificação de áudio 200 descrito com referência à Fig. 2 pode compreender uma pluralidade correspondente de seções de reconstrução, incluindo a seção de reconstrução paramétrica 100 descrito com referência à Fig. 1, para reconstruir os respectivos conjuntos de canais de áudio do sinal de canal 11.1 representados pelos respectivos sinais de mixa- gem de baixa. O sistema de decodificação de áudio 200 pode incluir uma seção de controle (não mostrado na Fig. 2) configurado para receber a sinalização do lado do codificador, indicando o formato de codificação determinado, e o sistema de decodificação de áudio 200 pode empregar um subconjunto apropriado de entre a pluralidade de seções de reconstrução para reconstruir o sinal de áudio do canal 11.1 a partir dos sinais de mixagem de baixa recebidos e associados parâmetros de mixagem para cima seca e molhada.
[0078] As Figs. 12-13 ilustram modos alternativos para representar um sinal de áudio do canal 13.1 por meio de canais de mixagem de baixa, de acordo com o exemplo de modalidades. O sinal de áudio canal 13.1 inclui os canais: tela esquerda (LSCRN), amplo esquerdo (LW), tela direita (RSCRN), amplo direito (RW), centro (C), efeitos de baixa frequência (LFE), lado esquerdo (LS), lado direito (RS), traseiro esquerdo (LB), traseiro direito (RB), frontal superior esquerdo (TFL), frontal superior direito (TFR), superior traseiro esquerdo (TBL) e superior traseiro direito (TBR). Codificação dos respectivos grupos de canais como os respectivos canais de mixagem de baixa pode ser realizada pelas respectivas seções de codificação que operam independentemente em paralelo, tal como descrito acima com referência às Figs. 5-11. Da mesma forma, a reconstrução dos respectivos grupos de canais com base nos respectivos canais de mixagem de baixa e os parâmetros associados de mixagem para cima pode ser realizada por respectivas seções de reconstrução que operam independentemente em paralelo.
[0079] As Figs. 14-16 ilustram formas alternativas para representar um sinal de áudio do canal 22.2 por meio de sinais de mixagem de baixa, de acordo com o exemplo de modalidades. O sinal de áudio canal 22.2 inclui os canais: efeitos de baixa frequência 1 (LFE1), efeitos de baixa frequência 2 (LFE2), inferior central dianteiro (BFC), centro (C), centro frontal superior (TFC), amplo esquerdo (LW), frontal inferior esquerdo (BFL), esquerdo (L), frontal superior esquerdo (TFL), lateral superior esquerdo (TSL), traseiro superior esquerdo (TBL), lado esquerdo (LS), traseiro esquerdo (LB), superior central (TC), traseiro superior central (TBC), traseiro central (CB), inferior direito frontal (BFR), direito (R), amplo direito (RW), superior direito frontal (TFR), lateral superior direito (TSR), superior traseiro direito (TBR), lateral direito (RS), e traseiro direito (RB). A partição do sinal de áudio do canal 22.2 ilustrado na Fig.16 inclui um grupo 1601 de canais, incluindo quatro canais. A seção de codificação paramétrica 300 descrita com referência à Fig. 3, mas implementada com N = 4, pode ser empregada para codificar estes canais, como um sinal de mixagem de baixa e os parâmetros de mixagem para cima molhada e seca associados. Analogamente, a seção de reconstrução paramétrica 100 descrita com referência à Fig. 1, mas implementada com N = 4, pode ser empregada para reconstruir estes canais de mixagem de baixa e o sinal de parâmetros de mixagem para cima molhada e seca associados. III. Equivalentes, extensões alternativas e variado
[0080] Outras modalidades da presente invenção serão evidentes para um especialista na técnica após o estudo da descrição anterior. Embora a presente descrição e os desenhos descrevam modalidades e exemplos, a revelação não está limitada a estes exemplos específicos. Numerosas modificações e variações podem ser feitas sem se afastarem do escopo da presente divulgação, o qual é definido pelas reivindicações anexas. Quaisquer sinais de referência que aparecem nas reivindicações não devem ser entendidas como limitando o seu escopo.
[0081] Além disso, as variações das modalidades descritas podem ser compreendidas e efetuadas pelo especialista na técnica na realização prática da divulgação, a partir de um estudo dos desenhos, da descrição, e as reivindicações anexas. Nas reivindicações, a palavra “compreendendo” não exclui outros elementos ou passos, e o artigo indefinido “um” ou “uma” não exclui uma pluralidade. O mero fato de que determinadas medidas são recitadas nas reivindicoes dependentes mutuamente diferentes não indicam que uma combinação destas medidas não pode ser utilizada com vantagem.
[0082] Os dispositivos e métodos descritos acima neste documento podem ser implementados como software, firmware, hardware ou uma combinação dos mesmos. Numa implementação de hardware, a divisão de tarefas entre unidades funcionais referidas na descrição acima não corresponde necessariamente à divisão em unidades físicas; ao contrário, um componente físico pode ter funcionalidades múltiplas, e uma tarefa pode ser realizada por vários componentes físicos em cooperação. Certos componentes ou todos os componentes podem ser implementados como software executado por um processador de sinal digital ou um microprocessador, ou ser implementados como hardware ou como um circuito integrado de aplicação específica. Esse tipo de software pode ser distribuído em meios legíveis por computador, que pode incluir meios de armazenamento do computador (ou a mídia não transitória) e meios de comunicação (ou mídia transitória). Como é bem conhecido de um especialista na técnica, o termo meios de armazenamento de computador inclui meios de voláteis e não voláteis, removíveis e não removíveis implementados em qualquer método ou tecnologia para o armazenamento de informação, tais como instruções legíveis por computador, estruturas de dados, módulos de programas ou outros dados. Meios de armazenamento de computador incluem, mas não está limitado a, RAM, ROM, EEPROM, memória flash ou outra tecnologia de memória, CD-ROM, discos digitais versáteis (DVD) ou outro armazenamento em disco óptico, cassetes magnéticos, fita magnética, armazenamento em disco magnético ou outros dispositivos de armazenamento magnéticos, ou qualquer outro meio que possa ser utilizado para armazenar a informação desejada e que pode ser acessado por um computador. Além disso, é bem conhecido para o especialista na técnica que os meios de comunicação tipicamente incorporam instruções legíveis por computador, estruturas de da-dos, módulos de programas ou outros dados num sinal modulado de dados, tais como uma onda carreadora ou outro mecanismo de transporte e inclui qualquer meio de entrega de informação.

Claims (9)

1. Método para reconstruir um sinal de áudio de N canais (X), em que N > 3, o método caracterizado pelo fato de que compreende: Receber, por meio de um processador, um sinal de mixagem para baixo de canal único (), juntamente com parâmetros de mixagem para cima seca e molhada associados (C,P); calcular, por meio de um processador, um sinal de mixagem para cima seca como um mapeamento linear do sinal de mixagem para baixo, em que um conjunto de coeficientes de mixagem para cima seca (C) é aplicado ao sinal de mixagem para baixo; gerar, por meio de um processador, um (N - 1) sinal descor- relacionado () com base no sinal de mixagem para baixo; calcular, por meio de um processador, um sinal de mixagem para cima molhada como um mapeamento linear do sinal descorrelaci- onado, em que um conjunto de coeficientes de mixagem para cima molhada (P) é aplicado aos canais do sinal descorrelacionado; e combinar, por meio de um processador, os sinais de mixa- gem para cima seca e molhada para obter um sinal reconstruído multidimensional (X) correspondente ao sinal de áudio de N canais a ser reconstruído, em que o método ainda compreende: determinar, por meio de um processador, o conjunto de coeficientes de mixagem para cima seca com base nos parâmetros de mi- xagem para cima seca recebidos; preencher, por meio de um processador, uma matriz intermediária possuindo mais elementos do que o número de parâmetros de mixagem para cima molhada recebidos, com base nos parâmetros de mixagem para cima molhada recebidos e tendo conhecimento de que a matriz intermediária pertence a uma classe de matriz pré-definida; e obter, por meio de um processador, o conjunto de coeficientes de mixagem para cima molhada pela multiplicação da matriz intermediária por uma matriz pré-definida, em que o conjunto de coeficientes de mixagem para cima molhada corresponde à matriz resultante da multiplicação e inclui mais coeficientes do que o número de elementos na matriz intermediária.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que receber os parâmetros de mixagem para cima molhada inclui receber N(N - 1)/2 parâmetros de mixagem para cima molhada, em que preencher a matriz intermediária inclui obter valores para (N - 1)2 elementos de matriz com base nos N(N - 1)/2 parâmetros de mixagem para cima molhada recebidos e tendo conhecimento de que a matriz intermediária pertence à classe de matriz pré-definida, em que a matriz pré-definida inclui N(N - 1) elementos, e em que o conjunto de coeficientes de mixagem para cima molhada inclui N(N - 1) coeficien-tes,
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que preencher a matriz intermediária inclui empregar os parâmetros de mixagem para cima molhada recebidos como elementos na matriz intermediária.
4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que receber os parâmetros de mixagem para cima seca inclui receber (N - 1) parâmetros de mixagem para cima seca, em que o conjunto de coeficientes de mixagem para cima seca inclui N coeficientes, e em que o conjunto de coeficientes de mixagem para cima seca é determinado com base nos (N -1) parâmetros de mixagem para cima seca recebidos e com base em uma relação pré-definida entre os coeficientes no conjunto de coeficientes de mixagem para cima seca,
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a classe de matriz pré-definida é uma das seguintes: matrizes triangulares inferiores ou superiores, em que propriedades conhecidas de todas as matrizes em uma classe de matrizes triangulares inferiores ou superiores incluem elementos de matriz pré- definidos sendo zero; matrizes simétricas, em que propriedades conhecidas de todas as matrizes em uma classe matrizes simétricas incluem elementos de matriz pré-definidos sendo iguais; ou produtos de uma matriz ortogonal e uma matriz diagonal, em que propriedades conhecidas de todas as matrizes em uma classe de uma matriz ortogonal e uma matriz diagonal incluem relações conhecidas entre elementos de matriz pré-definidos.
6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o sinal de mixagem para baixo é obtido, de acordo com uma regra pré-definida, como um mapeamento linear do sinal de áudio de N canais a ser reconstruído, em que a regra pré-definida define uma operação de mixagem para baixo pré-definida, e em que a referida matriz pré-definida é baseada em vetores que abrangem um espaço de kernel da referida operação de mixagem para baixo pré-definida.
7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que receber o sinal de mixagem para baixo de canal único juntamente com parâmetros de mixagem para cima seca e molhada associados inclui receber um segmento de tempo ou ladrilho de tempo/fre- quência do sinal de mixagem para baixo juntamente com parâmetros de mixagem para cima seca e molhada associados, e em que o referido sinal reconstruído multidimensional corresponde a um segmento de tempo ou ladrilho tempo/frequência do sinal de áudio de N canais a ser reconstruído.
8. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que N = 3 ou N = 4.
9. Meio legível por computador não transitório, caracterizado pelo fato de que instruções nele armazenadas, quando executadas por um ou mais processadores, executa o método como definido na reivindicação 1.
BR122020018157-5A 2013-10-21 2014-10-21 Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio, método para codificar um sinal de áudio de n canais e sistema de codificação de áudio BR122020018157B1 (pt)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US201361893770P 2013-10-21 2013-10-21
US61/893,770 2013-10-21
US201461974544P 2014-04-03 2014-04-03
US61/974,544 2014-04-03
US201462037693P 2014-08-15 2014-08-15
US62/037,693 2014-08-15
BR112016008817-4A BR112016008817B1 (pt) 2013-10-21 2014-10-21 Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio, método para codificar um sinal de áudio de n canais e sistema de codificação de áudio
PCT/EP2014/072570 WO2015059153A1 (en) 2013-10-21 2014-10-21 Parametric reconstruction of audio signals

Publications (1)

Publication Number Publication Date
BR122020018157B1 true BR122020018157B1 (pt) 2022-03-29

Family

ID=80053658

Family Applications (3)

Application Number Title Priority Date Filing Date
BR122020018172-9A BR122020018172B1 (pt) 2013-10-21 2014-10-21 Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio e meio legível por computador não transitório
BR122020018157-5A BR122020018157B1 (pt) 2013-10-21 2014-10-21 Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio, método para codificar um sinal de áudio de n canais e sistema de codificação de áudio
BR122020018185-0A BR122020018185B1 (pt) 2013-10-21 2014-10-21 Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio e meio legível por computador não transitório

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BR122020018172-9A BR122020018172B1 (pt) 2013-10-21 2014-10-21 Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio e meio legível por computador não transitório

Family Applications After (1)

Application Number Title Priority Date Filing Date
BR122020018185-0A BR122020018185B1 (pt) 2013-10-21 2014-10-21 Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio e meio legível por computador não transitório

Country Status (1)

Country Link
BR (3) BR122020018172B1 (pt)

Also Published As

Publication number Publication date
BR122020018185B1 (pt) 2022-01-18
BR122020018172B1 (pt) 2022-01-18

Similar Documents

Publication Publication Date Title
BR112016008817B1 (pt) Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio, método para codificar um sinal de áudio de n canais e sistema de codificação de áudio
AU2015284004B2 (en) Reducing correlation between higher order ambisonic (hoa) background channels
PT2372701E (pt) Codificação aprimorada e representação de parâmetros de codificação de objeto de downmix multicanal
BRPI0709235B1 (pt) Decodificador de áudio, método de decodificação de áudio, receptor para receber um sinal de n canais, sistema de transmissão para transmitir um sinal de áudio, método para receber um sinal de áudio, método para transmitir e receber um sinal de áudio, mídia de armazenamento legível por computador, e, dispositivo de reprodução de áudio
BR112020015570A2 (pt) codificador de cena de áudio, decodificador de cena de áudio e métodos relacionados com uso de análise espacial de codificador/decodificador híbrido
US9959880B2 (en) Coding higher-order ambisonic coefficients during multiple transitions
CN107112020B (zh) 音频信号的参数化混合
BR112016008426B1 (pt) Método para reconstrução de uma pluralidade de sinais de áudio, sistema de decodificação de áudio, método para codificação de uma pluralidade de sinais de áudio, sistema de codificação de áudio, e mídia legível por computador
BR122020018157B1 (pt) Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio, método para codificar um sinal de áudio de n canais e sistema de codificação de áudio
BR112017007521B1 (pt) Método e sistema de decodificação de áudio e meio legível por computador
BR112017007153B1 (pt) Canais de sinalização para codificação escalonável de dados de áudio ambisonic de ordem superior
BR112016001141B1 (pt) Codificador de áudio, decodificador de áudio e métodos que usam sinais residuais codificados em conjunto

Legal Events

Date Code Title Description
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 21/10/2014, OBSERVADAS AS CONDICOES LEGAIS.

B25G Requested change of headquarter approved

Owner name: DOLBY INTERNATIONAL AB (IE)