BR112016029978B1 - Método para determinar para a compressão de uma representação de quadro de dados hoa um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais - Google Patents

Método para determinar para a compressão de uma representação de quadro de dados hoa um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais Download PDF

Info

Publication number
BR112016029978B1
BR112016029978B1 BR112016029978-7A BR112016029978A BR112016029978B1 BR 112016029978 B1 BR112016029978 B1 BR 112016029978B1 BR 112016029978 A BR112016029978 A BR 112016029978A BR 112016029978 B1 BR112016029978 B1 BR 112016029978B1
Authority
BR
Brazil
Prior art keywords
hoa
signals
data frame
representation
hoa data
Prior art date
Application number
BR112016029978-7A
Other languages
English (en)
Other versions
BR112016029978A2 (pt
Inventor
Sven Kordon
Alexander Krueger
Original Assignee
Dolby International Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP14306023.4A external-priority patent/EP2960903A1/en
Application filed by Dolby International Ab filed Critical Dolby International Ab
Priority to BR122022022357-5A priority Critical patent/BR122022022357B1/pt
Priority to BR122023009299-6A priority patent/BR122023009299B1/pt
Publication of BR112016029978A2 publication Critical patent/BR112016029978A2/pt
Publication of BR112016029978B1 publication Critical patent/BR112016029978B1/pt

Links

Abstract

MÉTODO E APARELHO PARA DETERMINAR PARA A COMPRESSÃO DE UMA REPRESENTAÇÃO DE QUADRO DE DADOS HOA UM NÚMERO INTEIRO MAIS BAIXO DE BITS REQUERIDOS PARA REPRESENTAR VALORES DE GANHO NÃO DIFERENCIAIS. Quando comprimindo uma representação de quadro de dados HOA, um controle de ganho (15, 151) é aplicado para cada sinal de canal antes deste ser perceptualmente codificado (16). Os valores de ganho são transferidos, em um modo diferencial, como informação lateral. No entanto, para iniciar a decodificação de tais valores de ganho absolutos de representação de quadro de dados HOA comprimidos em fluxo são requeridos, os quais devem ser codificados com um número mínimo de bits. Para determinar o referido número inteiro mais baixo (ße) de bits, a representação de quadro de dados HOA (C(k)) é renderizada no domínio espacial para sinais de alto-falante virtual estando em uma esfera unitária, seguido por normalização da representação de quadro de dados HOA (C(k)). Então, o número inteiro mais baixo de bits é definido para: (AA).

Description

CAMPO TÉCNICO
[001] A invenção refere-se a um método e a um aparelho para determinara a compressão de uma representação de HOA data frame de um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais associados com sinais de canal de uns específicos dos referidos quadros de dados HOA.
ANTECEDENTES
[002] Ambissônico de Ordem Elevada denotado HOA oferecem uma possibilidade para representar som de três dimensões. Outras técnicas são síntese de campo de onda (WFS) ou abordagens baseadas em canal como 22.2. Em contraste aos métodos baseados em canal, a representação HOA oferecem a vantagem de ser independente de um ajuste de alto-falante específico. No entanto, esta flexibilidade é ao custo de um processo de decodificação que é requerido para o playback da representação HOA em um ajuste de alto-falante particular. Comparado com a abordagem, em que o número de alto-falantes necessários é geralmente muito grande, HOA pode ainda ser renderizado para ajustes que consistem em apenas alguns alto-falantes. Outra vantagem de HOA é que a mesma representação pode ainda ser empregada sem qualquer modificação para renderização binaural para fones de ouvido.
[003] HOA é baseado na representação da densidade espacial de amplitudes de onda plana harmônica complexa por uma expansão de harmônica esférica (SH) truncada. Cada coeficiente de expansão é uma função da frequência angular, que pode ser equivalentemente representada por uma função de domínio de tempo. Assim, sem perda de generalidade, a representação completa de campo de som HOA realmente pode ser assumida para consistir em O funções de domínio de tempo, em que O denota o número de coeficientes de expansão. Estas funções de domínio de tempo serão equivalentemente referidas como sequências de coeficiente de HOA ou como canais HOA no seguinte.
[004] A resolução espacial da representação de HOA melhora com a ordem máxima de crescimento N da expansão. Infelizmente, o número de coeficientes de expansão O cresce de modo quadrática com a ordem N, em particular O = (N + 1)2. Por exemplo, representações HOA típicas usando ordem N = 4 requer O = 25 coeficientes HOA (expansão). A taxa de bit total para a transmissão de representação HOA, dada uma taxa de amostragem de canal único desejada fs e o número de bits Nb por amostra, é determinada por O.fs.Nb. Transmitir uma representação HOA da ordem N = 4 com uma taxa de amostragem de fs = 48kHz empregando Nb = 16 bits por amostra resulta em uma taxa de bit de 19,2 MBits/s, que é muito elevado para muitas aplicações práticas, por exemplo, streaming. Assim, a compressão de representações HOA é altamente desejável.
[005] Previamente, a compressão de representações de campo de som HOA foi proposta em EP 2665208 A1, EP 2743922 A1, EP 2800401 A1, cf. ISO/IEC JTC1/SC29/WG11, N14264, WD1-HOA Text of MPEG-H 3D Audio, Janeiro de 2014. Estas abordagens têm em comum que realizam uma análise de campo de som e decompõem a dada representação HOA em um componente direcional e um componente de ambiente residual. A representação final comprimida é por um lado assumida por consistir em um número de sinais quantizados, resultando a partir da codificação perceptual de sinais direcionais e baseados em vetores bem como sequências de coeficiente relevante do componente HOA de ambiente. Por outro lado, esta compreende informações laterais adicionais relacionadas com os sinais quantizados, cuja informação lateral é requerida para a reconstrução da representação HOA a partir de sua versão comprimida.
[006] Antes de serem passados ao codificador perceptual, estes sinais de tempo-domínio intermediários são requeridos para ter uma amplitude máxima dentro da faixa de valor [-1,1 [, que é um requisito que surge da implementação de codificadores perceptuais atualmente disponíveis. A fim de satisfazer este requisito quando comprimindo representações HOA, uma unidade de processamento de controle de ganho (ver EP 2824661 A1 e o documento acima mencionado ISO/IEC JTC1/SC29/WG11 N14264) é usada à frente dos codificadores perceptuais, que atenua suavemente ou amplifica os sinais de entrada. A modificação de sinal resultante é assumida como sendo invertível e sendo aplicado em quadros, em que em particular a alteração das amplitudes de sinal entre frames sucessivos deve ser assumida para ser uma potência de ‘2’. Para facilitar a inversão desta modificação de sinal no descompressor de HOA, correspondendo à normalização da informação lateral é incluída na informação lateral total. Esta normalização de informação lateral pode consistir em expoentes para a base ‘2’, cujos expoentes descrevem a alteração de amplitude relativa entre dois frames sucessivos. Estes expoentes são codificados usando um código de comprimento de corrida de acordo com o documento acima mencionado ISO/IEC JTC1/SC29/WG11 N14264, uma vez que alterações menores de amplitude entre frames sucessivos são mais prováveis do que as maiores.
SUMÁRIO DA INVENÇÃO
[007] Usando alterações de amplitude diferencialmente codificada para reconstruir as amplitudes de sinal original na descompressão de HOA é praticável, por exemplo, no caso de um arquivo unido ser descomprimido a partir do início até o fim sem quaisquer pulos temporais. No entanto, para facilitar o acesso aleatório, unidades de acesso independente devem estar presentes na representação codificada (que é tipicamente um fluxo de bits) a fim de permitir o início da descompressão a partir de uma posição desejada (ou pelo menos na vizinhança desta), independentemente da informação a partir de quadros anteriores. Tal unidade de acesso independente deve conter a alteração de amplitude absoluta total (ou seja, um valor de ganho não diferencial) causado pela unidade de processamento de controle de ganho a partir do primeiro quadro até um quadro atual. Assumindo que as alterações de amplitude entre dois quadros sucessivos são uma potência de ‘2’, isto é suficiente para ainda descrever a alteração de amplitude absoluta total por um expoente para base ‘2’. Para uma codificação deste expoente, é essencial conhecer os ganhos de potencial máximos dos sinais antes da aplicação da unidade de processamento de controle de ganho. No entanto, este conhecimento é altamente dependente da especificação de restrições na faixa de valor das representações HOA a serem comprimidas. Infelizmente, o documento de áudio MPEG-H 3D ISO/IEC JTC1/SC29/WG11 N14264 não apenas fornece uma descrição do formato para a representação HOA de entrada, sem configuração de quaisquer restrições nas faixas de valor.
[008] Um problema a ser resolvido pela invenção é fornecer um número inteiro mais baixo de bits necessário para representar os valores de ganho não diferencial. Este problema é resolvido pelo método divulgado na reivindicação 1. Um aparelho que utiliza este método é divulgado na reivindicação 2.
[009] Modalidades vantajosas adicionais da invenção são divulgadas nas reivindicações dependentes respectivas.
[010] A invenção estabelece uma inter-relação entre a faixa de valor da representação HOA de entrada e os ganhos máximos potenciais dos sinais antes da aplicação da unidade de processamento de controle de ganho dentro do compressor HOA.Baseado naquela inter-relação, a quantidade de bits necessária é determinada - para uma determinada especificação para a faixa de valor de uma representação HOA de entrada - para uma codificação eficiente dos expoentes para base ‘2’ para descrever dentro de uma unidade de acesso as alterações de amplitude absolutas totais (ou seja, um valor de ganho não diferencial) dos sinais modificados causados pela unidade de processamento de controle de ganho a partir do primeiro quadro até um quadro atual.
[011] Ainda, uma vez que a regra para a computação da quantidade de bits requerida para a codificação do expoente é fixada, a invenção usa um processamento para verificar se uma determinada representação satisfaz as restrições de faixa de valor requeridas de tal modo que esta possa ser comprimida corretamente.
[012] Em princípio, o método da invenção é adequado para determinada a compressão de uma representação de quadro de dados HOA um número inteiro mais baixo ße de bits requerido para representar valores de ganho não diferenciais para sinais de canal de uns específicos dos referidos quadros de dados HOA, em que cada sinal de canal em cada quadro compreende um grupo de valores de amostra e em que para cada sinal de canal de cada um dos referidos quadros de dados HOA um valor de ganho diferencial é atribuído e tal valor de ganho diferencial gera uma mudança de amplitudes dos valores da amostra de um sinal de canal em um quadro de dados HOA atual com relação aos valores da amostra daquele sinal de canal no quadro de dados HOA anterior, e em que tais sinais de canal adaptados de ganho são codificados em um codificador, e em que a referida representação de quadro de dados HOA foi renderizada em um domínio especial para O sinais virtuais de alto-falante wj(t), em que as posições dos alto-falantes virtuais estão situadas em uma esfera unitária e são visadas para serem distribuídos uniformemente naquela esfera unitária, a referida renderização sendo representara por uma matriz de multiplicação w(t) = (F)’1-c(t), em que w(t) é um vetor contendo todos os sinais de alto-falante virtuais, F é uma matriz de modo de posições de alto-falante virtual, e c(t) é um vetor das sequências de coeficiente de HOA correspondentes da referida representação de quadro de dados HOA, e em que a referida representação de quadro de dados HOA foi normalizada, referido método incluindo as etapas de: - formar referidos sinais de canal por uma ou mais das subetapas a), b), c) a partir da referida representação de quadro de dados HOA normalizados: a) para representar sinais de som predominantes nos referidos sinais de canal, multiplicar o referido vetor de sequências de coeficiente de HOA c(t) por uma matriz de mistura A, a norma Euclidiana da qual matriz de mistura A não é maior do que ‘1’, em que mistura da matriz A representa uma combinação linear de sequências de coeficiente da referida representação de quadro de dados HOA normalizada; b) para representar um componente ambiente cAMB(t) nos referidos sinais de canal, subtraindo os sinais de som predominantes a partir da referida representação de quadro de dados HOA normalizada, e selecionar pelo menos parte das sequências de coeficiente do referido componente ambiente cAMB(t), em que e transformando o componente ambiente mínimo resultanteem que é uma matriz de modo para referido componente ambiente mínimo CAMB.MIN(t); c) selecionar parte das referidas sequências de coeficiente HOA c(t), em que as sequências de coeficiente selecionadas se relacionam com as sequências de coeficiente do componente HOA ambiente a qual uma transformação espacial é aplicada, e a ordem mínima NMIN descrevendo o número das referidas sequências de coeficiente selecionadas é NMIN^ 9; - configurar referido número inteiro mais baixo ße de bits requerido para representar os referidos valores de ganho não diferenciais para referidos sinais de canal para em que é a ordem, NMAX é a ordem máxima de interesse, são direções dos referidos alto-falantes virtuais, O = (N + 1)2 é o número de sequências de coeficiente HOA, e K é uma proporção entre a norma Euclidiana quadrada |M|22 da referida matriz de modo e O.
[013] Em princípio, o aparelho da invenção é adequado para determinar a compressão de uma representação de quadro de dados HOA um número inteiro mais baixo ße de bits requerido para representar valores de ganho não diferenciais para sinais de canal de uns específicos dos referidos quadros de dados HOA, em que cada sinal de canal em cada quadro compreende um grupo de valores de amostra e em que para cada sinal de canal de cada um dos referidos quadros de dados HOA um valor de ganho diferencial é atribuído e tal valor de ganho diferencial gera uma mudança de amplitudes dos valores da amostra de um sinal de canal em um quadro de dados HOA atual com relação aos valores da amostra daquele sinal de canal no quadro de dados HOA anterior, e em que tais sinais de canal adaptados de ganho são codificados em um codificador, e em que a referida representação de quadro de dados HOA foi renderizada em um domínio especial para sinais de O alto-falantes virtuais wj(t), em que as posições dos alto-falantes virtuais estão situadas em uma esfera unitária e são visados para serem distribuídos uniformemente naquela esfera unitária, referida renderização sendo representada por um multiplicação de matriz w(t) =(^)-1 • c(t), em que w(t) é um vetor contendo todos os sinais de alto-falantes virtuais, F é uma matriz de modo de posições de alto-falante virtual, e c(t) é um vetor das correspondentes sequências de coeficiente HOA da referida representação de quadro de dados HOA, e em que a referida representação de quadro de dados HOA foi normalizada de tal modo que referido aparelho incluindo: - meios que formam referidos sinais de canal por uma ou mais das operações a), b), c) a partir da referida representação de quadro de dados HOA normalizados: a) para representar sinais de som predominantes nos referidos sinais de canal, multiplicar o referido vetor de sequências de coeficiente de HOA c(t) por matriz de mistura A, a norma Euclidiana da qual matriz de mistura A não é maior do que ‘1’, em que matriz de mistura A representa uma combinação linear de sequências de coeficiente da referida representação de quadro de dados HOA normalizados; b) para representar um componente ambiente cAMB(t) nos referidos sinais de canal, subtraindo os sinais de som predominantes a partir da referida representação de quadro de dados HOA normalizada, e selecionar pelo menos parte das sequências de coeficiente do referido componente ambiente CAMB(t), em que , e transformando o componente ambiente mínimo resultante em que FMIN é uma matriz de modo para o referido componente ambiente mínimo CAMB,MIN(1) c) selecionar parte das referidas sequências de coeficiente HOA c(t), em que as sequências de coeficiente selecionadas se relacionam com as sequências de coeficiente do componente HOA ambiente a qual uma transformação espacial é aplicada, e a ordem mínima NMIN descrevendo o número das referidas sequências de coeficiente selecionadas é NMIN< 9; - meio que define o referido número inteiro mais baixo ße de bits requerido para representar os referidos valores de ganho não diferenciais para referidos sinais de canal para em que é a ordem, NMAX é a ordem máxima de interesse, são direções dos referidos alto-falantes virtuais, é o número de sequências de coeficiente HOA, e K é uma proporção entre a norma Euclidiana quadrada |M|22 da referida matriz de modo e O.
BREVE DESCRIÇÃO DOS DESENHOS
[014] Modalidades exemplares da invenção são descritas com referência aos desenhos que acompanham, que mostram em: Fig. 1 compressor HOA; Fig. 2 descompressor HOA; Fig. 3 valores de escala K para direções virtuais para ordens HOA N = 1,...,29; Fig. 4 normas Euclidianas de matrizes de modo reverso ?-1 para direções virtuaispara ordens Fig. 5 Determinação de magnitude maximamente permitida ?dB de sinais de alto-falantes virtuais nas posições em que Fig. 6 Sistema de coordenadas esféricas.
DESCRIÇÃO DAS MODALIDADES
[015] Mesmo se não explicitamente descrito, as seguintes modalidades podem ser empregadas em qualquer combinação ou subcombinação.
[016] A seguir, o princípio de compressão e descompressão de HOA é apresentado para fornecer um contexto mais detalhado em que o problema mencionado acima ocorre. A base para esta apresentação é o processamento descrito no documento de áudio MPEG-H 3D ISO/IEC JTC1/SC29/WG11 N14264, ver ainda EP 2665208 A1, EP 2800401 A1 e EP 2743922 A1. Em N14264 o ‘componente direcional’ é estendido para um ‘componente de som predominante’. Como o componente direcional, o componente de som predominante é assumido para ser parcialmente representado por sinais direcionais, significando sinais monoaurais com uma correspondente direção a partir da qual são assumidos para impingir no ouvinte, junto com alguns parâmetros de predição para prever porções da representação original de HOA a partir dos sinais direcionais. Adicionalmente, supõe-se que o componente de som predominante seja representado pelos ‘sinais baseados em vetor’, significando sinais monoaurais com um vetor correspondente que define a distribuição direcional dos sinais baseados em vetor.
Compressão de HOA
[017] A arquitetura geral do compressor de HOA descrita em EP 2800401 A1 é ilustrada na Fig. 1. Tem uma parte de codificação HOA espacial descrita na Fig. 1A e uma parte de codificação perceptual e de fonte descrita na Fig. 1b. O codificador HOA espacial fornece uma primeira representação de HOA comprimido consistido em sinais I juntos com informação lateral descrevendo como criar uma representação HOA da mesma. Em codificadores de fonte perceptual e de informação lateral os sinais I são perceptualmente codificados e a informação lateral é submetida a codificação de fonte, antes de multiplexação das duas representações codificadas.
Codificação de HOA espacial
[018] Em uma primeira etapa, um quadro de k° atual C(k) da representação HOA original é inserida em uma etapa de processamento de direção e estimativa de vetor ou estágio 11, que é assumido para fornecer os conjuntos de tuplo .O conjunto de tuplo consiste em tuplos dos quais o primeiro elemento denota o índice de um sinal direcional e o segundo elemento JVTVFC denota a respectiva direção quantizada. O conjunto de tuplo consiste em tuplos dos quais o primeiro elemento indica o índice de um sinal baseado em vetor e o segundo elemento denota o vetor definindo a distribuição direcional do sinal, ou seja, como a HOA representação do sinal baseado em vetor é computada.
[019] Usando ambos conjuntos de tuplos quadro HOA inicial C(k) é decomposto em uma etapa de decomposição de HOA ou estágio 12 em um quadro XPS(k-1) de todo som predominante (ou seja, baseado em direcional e vetor) sinais e o quadro CAMB(k-1) do componente HOA ambiente. Notar que o atraso de um quadro que é devido a processamento de sobreposição-adição a fim de evitar os artefatos de bloqueio. Além disso, a etapa de decomposição HOA/estágio 12 é assumida para emitir alguns parâmetros de predição Z(k-1) descrevendo como prever as porções da representação HOA original, a fim de enriquecer o componente HOA de som predominante. Além disso, um vetor de designação alvo contendo informações sobre a designação de sinais de som predominantes, que foram determinados na etapa de processamento de decomposição HOA ou estágio 12, para os canais disponíveis I é assumido para serem fornecidos. Os canais afetados podem ser assumidos para serem ocupados, significando que não estão disponíveis para transportar quaisquer sequências de coeficientes do componente HOA ambiente no respectivo quadro de tempo.
[020] Na etapa de processamento de modificação de componente ambiente ou estágio 13 o quadro CAMB (k-1) do componente HOA ambiente é modificado de acordo com a informação fornecida pelo vetor de designação alvo . Em particular, é determinado que sequências de coeficiente do componente HOA ambiente sejam transmitidos nos canais I determinados, dependendo (entre outros aspectos) na informação (contida no vetor de designação alvo sobre quais canais são disponíveis e não já ocupados por sinais de som predominantes. Além disso, sequências de coeficiente fade-in e fade-out são realizadas se os índices das sequências de coeficiente escolhidas variam entre quadros sucessivos.
[021] Além disso, é assumido que as primeiras sequências de coeficientes OMIN do componente HOA ambiente CAMB (k-2) são sempre escolhidas para serem perceptualmente codificadas e transmitidas, em que OMIN = (NMIN+ 1)2 com NMIN < N sendo tipicamente uma ordem menor do que a representação HOA original. A fim de des-correlacionar estas sequências de coeficiente HOA, estas podem ser transformadas na etapa/estágio 13 para sinais direcionais (ou seja, funções de onda de plano gerais) impingindo a partir de algumas direções pré-definidas QMIM, d = 1,..., OMIN.
[022] Junto com o componente HOA ambiente modificado CM,A (k-1) um componente HOA ambiente temporalmente previsto CP,M,A (k-1) é computado na etapa/estágio 13 e é usado nas etapas de processamento de controle ou estágios 15, 151 a fim de permitir uma visualização razoável, em que a informação sobre a modificação do componente HOA ambiente é diretamente relacionado à designação de todos os tipos de possíveis de sinais para os canais disponíveis na etapa de designação de canal ou estágio 14.
[023] A informação final sobre a designação é assumida como estando contida no vetor de designação final A fim de computar este vetor na etapa/estágio 13, informações contidas no vetor de designação alvo são exploradas.
[024] A designação de canal na etapa/estágio 14 designa com a informação fornecida pelo vetor de designação os sinais apropriados contidos no quadro e aqueles contidos no quadro para os canais I disponíveis, gerando os quadros de sinal Ainda, sinais apropriados contidos no quadro e no quadro são ainda designados para os canais I disponíveis, gerando os quadros previstos
[025] Cada um dos quadros do sinal é finalmente I sinalizadores de exceção sinais em que o ganho de sinal é suavemente modificado de tal modo a conseguir uma faixa de valor que é adequada para as etapas de codificador perceptual ou estágios 16. Etapas/estágios 16 emitem correspondentes quadros de sinal codificados ,Os quadros de sinal previstos um tipo de visualização a gim de evitar alterações de ganho severas entre blocos sucessivos. Qs dados de informação lateral são codificados por fonte em etapa de codificador de fonte de informação lateral ou estágio 17, resultando em quadro de informação lateral codificada Em um multiplexador 18 os sinais codificados do quadro e os dados de informação lateral codificados para este quadro são combinados, resultando em quadro de saída
[026] Em um decodificador HOA espacial as modificações de ganho nas etapas /estágios 15, 151 são assumidas como sendo revertidas usando uma informação lateral de controle de ganho, consistindo em expoentes e os sinalizadores de exceção
Descompressão de HOA
[027] A arquitetura geral do descompressor de HQA descrita em EP 2800401 A1 é ilustrada na Fig. 2. Esta consiste em contrapartes dos componentes do compressor HQA, que são arranjados em ordem reversa e incluem uma parte perceptual e de decodificação de fonte descrita na Fig. 2A e uma parte de decodificação HQA espacial descrita na Fig. 2B.
[028] Na parte perceptual e decodificação de fonte (representando um decodificador perceptual e fonte de informação lateral) uma etapa de desmultiplexar ou estágio 21 recebe quadro de entrada a partir do fluxo de bit e fornece a representação codificada, dos sinais I e os dados de informação lateral codificados descrevendo como criar uma representação HOA dos mesmos. Os sinais sao perceptualmente decodificados em uma etapa de decodificador perceptual ou estágio 22, resultando em sinais decodificados OS dados j? informação lateral codificados são decodificados em uma etapa de decodificador de fonte de informação lateral ou JVfDIR(/c + 1), -AtvEcC^ 1) r estágio 23, resultando em conjuntos de dados expoentes sinalizadores de exceção parâmetros de predição e um vetor de designação Com relação à diferença entre e ver o documento acima mencionado MPEG N14264.
Decodificação de HOA espacial
[029] Na parte de decodificação HOA espacial, cada um dos sinais decodificados perceptualmente é inserido em uma etapa de processamento de controle de ganho reverso ou estágio 24, 241 junto com seu expoente de correção de ganho associado e sinalizador de exceção de correção de ganho A iª etapa de processamento de controle de ganho/estágio fornece um quadro de sinal corrigido de ganho
[030] Todos I os quadros de sinal corrigidos de ganho / o vetor de designação PAMB,ASSIGN 00 ? as etapas de tuplo a uma etapa de re-designação de canal ou estágio 25, veja a definição descrita acima dos conjuntos de tuplo . 0 vetor de designação consiste em componentes I que indicam para cada transmissão se esta contém uma sequência de coeficiente do componente HOA ambiente e quais estes contêm. Na etapa de re-designação de canal/estágio 25 os quadros de sinal corrigidos de ganho são redistribuídos para reconstruir o quadro <<DRA W-CODE>> de todos os sinais de som predominantes (ou seja, todos os sinais direcionais e baseados em vetor) no quadro de uma representação intermediária do componente HOA ambiente. Adicionalmente, o conjunto dos índices de sequências de coeficiente do componente HOA ambiente ativo no kº quadro, e os conjuntos de dados de índices de coeficiente do componente HOA ambiente, que foram habilitados, desabilitados e para permanecerem ativos no quadro, são fornecidos.
[031] Em uma etapa de síntese de som predominante ou estágio 26 a representação HOA do componente de som predominante é computada a partir do quadro de todos os sinais de som predominantes usando o conjunto tuplo de parâmetros de predição, o conjunto de tuplo e os conjuntos de dados
[032] Em uma etapa de síntese de ambiência ou estágio 27 o quadro de componente HOA ambiente é criado a partir do quadro a representação intermediária do componente HOA ambiente, usando o conjunto
[033] Finalmente em uma etapa de composição HOA ou estágio 28 o quadro de componente HOA ambiente e o quadro de componente HOA de som predominante são superpostos de modo a fornecer o quadro HOA decodificado
[034] Depois disso, o decodificador HOA espacial cria a partir dos sinais I e a informação lateral a representação HOA reconstruída.
[035] No caso de codificação lateral o componente HOA ambiente foi transformação para sinais direcionais, esta transformação é revertida em decodificador lateral na etapa/estágio 27.
[036] Os ganhos máximos potenciais dos sinais antes das etapas de processamento de controle de ganho/estágios 15, 151 dentro do compressor HOA são altamente dependentes da faixa de valor da representação HOA de entrada. Uma vez, na primeira faixa de valor significativa para a representação HOA de entrada é definida, seguida por concluindo nos ganhos máximos potenciais dos sinais antes de entrar nas etapas de processamento de controle de ganho/estágios.
Normalização da representação HOA de entrada
[037] Para usar o processamento inventivo uma normalização do sinal de (total) representação HOA de entrada deve ser realizada antes. Para a compressão de HOA um processamento em quadros é realizado, em que o k° quadro d^-^ da representação HOA de entrada original é definida com relação ao vetor c(t) das sequências de coeficiente HOA de tempo contínuo especificado na equação (54) na seção Básicos de Ambissônicos de Ordem Superior como em que k denota o índice de quadra, L o tamanho do quadro (em ITç indica o período de amostragem.
[038] Como mencionado em EP 2824661 A1, uma normalização significativa de uma representação HOA visualizada a partir de uma perspectiva prática não é alcançada pela imposição de restrições na faixa de valor das sequências de uma vez que estas funções de tempo-domínio não são os sinais que são atualmente tocados pelos alto-falantes após a renderização. Em vez disso, é mais conveniente considerar a ‘representação de domínio espacial equivalente’, que é obtida pela renderização da representação de HOA para sinais de alto-falantes O virtuaisAs respectivas posições de alto-falantes virtuais são assumidas para serem expressas por meio de um sistema de coordenadas esféricas, em que cada posição é assumida para estar sobre a esfera unitária e para ter um raio de ‘1’. Portanto, as posições podem ser equivalentemente expressas por direções dependentes de ordem em que denotam as inclinações e azimutes, respectivamente (ver ainda Fig. 6 e sua descrição para a definição do sistema de coordenadas esféricas). Estas direções devem ser distribuídas sobre a esfera unitária conforme possível, ver, por exemplo, J. Fliege, U. Maier, "A two-stage approach for computing cubature formulae for the sphere", Technical report, Fachbereich Mathematik, University of Dortmund, 1999. Números de nós são encontrados em http://www.mathematik.uni- dortmund.de/lsx/research/projects fliege/nodes/nodes.html para a computação das direções específicas. Estas posições são em geral dependentes do tipo de definição de ‘distribuição uniforme na esfera’, e portanto, não são desambíguas.
[039] A vantagem de definir sinais de alto-falantes virtuais sobre definir faixas de valores para sequências de coeficiente HOA é que a faixa de valor para o anterior pode ser justada intuitivamente par ao intervalo [-1,1 [ como o caso para sinais convencionais de alto-falantes assumindo representação PCM. Isto leva a um erro de quantização espacialmente uniformemente distribuída, de tal modo que vantajosamente a quantização é aplicada em um domínio que é relevante com relação à escuta real. Um aspecto importante neste contexto é que o número de bits por amostra pode ser escolhido como sendo tão baixo como este é tipicamente para sinais convencionais de alto-falantes, ou seja, 16, que aumenta a eficiência em comparação com a quantização direta de sequências de coeficiente HOA, em que geralmente um número maior de bits (por exemplo, 24 ou ainda 32) por amostra é requerido.
[040] Para descrever o processo de normalização no domínio especial em detalhes, todos os sinais de alto-falantes virtuais, são resumidos em um vetor como em que denota transposição. Denotar a matriz de modo com relação às direções virtuais por ?, que é definido por com O processo de renderização pode ser formulado como a matriz de multiplicação
[041] Usando estas definições, um requisito razoável nos sinais de altofalantes virtuais é: que significa que a magnitude de cada sinal de alto-falante virtual é requerida para estar dentro da faixa [-1,1 [. Um instante de tempo do tempo t é representado por um índice de amostra I e um período de amostra Ts dos valores de amostra dos referidos quadros de dados HOA.
[042] A potência total dos sinais de alto-falante consequentemente satisfaz a condição
[043] A renderização e a normalização da representação de quadro de dados HOA é realizada a jusante da entrada C(k) da Fig. 1A. Consequências para a faixa de valor de sinal antes do controle de ganho
[044] Assumindo que a normalização da representação HOA de entrada é realizada de acordo com a descrição na seção Normalização da representação HOA de entrada, a faixa de valor dos sinais que são entradas para a unidade de processamento de controle de ganho 15, 151 no compressor HOA, é considerado no seguinte. Estes sinais são criados pela designação para os canais I disponíveis de uma ou mais das sequências de coeficiente HOA, ou sinais Xps d, d — 1,..., D r de som predominantes e/ou sequências de coeficiente ara parte da qual uma transformação espacial é aplicada. Portanto, é necessário analisar a possível faixa de valor destes tipos de sinal diferentes mencionados sob a assunção de normalização na equação (6). Uma vez que todos os tipos de sinais são intermediariamente computados a partir das sequências de coeficiente HOA originais, um olhar sobre suas possíveis faixas de valores é tomado.
[045] O caso em que apenas uma ou mais sequências de coeficiente HOA são contidas nos canais I não é descrito na Fig. 1A e Fig. 2B, ou seja, em tal caso a decomposição HOA, modificação de componente ambiente e os correspondentes blocos de síntese não são requeridos.
[046] Consequências para a faixa de valor da representação HOA. A representação HOA de tempo contínuo é obtida a partir de sinais alto-falante virtuais que é a operação inversão àquela na equação (5).Portanto, a potência total de todas as sequências de coeficiente HOA é delimitada como a seguir: usando equações (8) e (7).
[047] Sob a assunção de normalização N3D das funções harmônicas esféricas, a norma euclidiana quadrada da matriz de modo pode ser escrita por em que denota a proporção entre a norma euclidiana quadrada da matriz de modo e o número 0 de sequências de coeficiente HOA. Esta proporção é dependente da ordem N de HOA específica e as direções específicas de alto-falante virtual , que podem ser expressas adicionando à proporção a respectiva lista de parâmetro como a seguir
[048] Fig. 3 mostra valores de K para direções virtuais de acordo com o artigo acima mencionado de Fliege et al. para ordens de HOA N = 1,...,29.
[049] Combinando todos os argumentos anteriores e considerações fornece um limite superior para a magnitude of sequências de coeficiente HOA como a seguir: em que a primeira desigualdade resulta diretamente a partir das definições de norma.
[050] É importante notar que a condição na equação (6) implica na condição na equação (11), mas o oposto não se mantém, ou seja, a equação (11) não implica equação (6).
[051] Outro importante aspecto é que sob a assunção de posições de alto- falante virtual quase uniformemente distribuída os vetores de coluna da matriz de modo F, que representa os vetores de modo com relação às posições de alto- falante virtual, são quase ortogonais a cada outra e têm uma Norma euclidiana de N + 1 cada. Esta propriedade significa que a transformação espacial praticamente preserva a Norma euclidiana exceto para uma constante multiplicativa, ou seja
[052] A norma verdadeira difere mais da aproximação na equação (12) quanto mais a assunção de ortogonalidade nos vetores de modo é violada.
[053] Consequências para a faixa de valor de sinais de som predominantes ambos os tipos de sinais de som predominantes (direcional e baseado em vetor) têm em comum que suas contribuições para a representação HOA é descrita por um único vetor com norma euclidiana de N+1 ou seja
[054] No caso do sinal direcional este vetor corresponde ao modo vetor com . relação a determinada direção de fonte do sinalou seja
[055] Este vetor descreve por meio de uma representação HOA um feixe. direcional na direção da fonte do sinal No caso de um sinal baseado em vetor, o vetor não é restrito para ser o modo vetor com relação a qualquer direção, e, portanto, pode descrever uma distribuição de direção mais geral do sinal baseado em vetor monaural.
[056] No seguinte é considerado o caso geral de D sinais de som predominantes que podem ser coletados no vetor de acordo com
[057] Estes sinais devem ser determinados baseados na matriz que é formada de todos os vetores representando a distribuição direcional dos sinais de som predominantes monaurais .
[058] Para uma extração significativa dos sinais de som predominantes ^(0 as seguintes restrições são formuladas:
[059] a) Cada sinal de som predominante é obtido como uma combinação linear das sequências de coeficiente da representação HOA original, ou seja em que denota a matriz de mistura.
[060] b) A matriz de mistura A deve ser escolhida de tal modo que sua norma euclidiana não exceda o valor de ‘1 ’, ou seja e de tal modo que a norma euclidiana quadrada (ou potência equivalentemente) do residual entre a representação HOA original e aquela dos sinais de som predominantes não é maior do que a norma quadrada (ou potência equivalentemente da representação HOA original, ou seja
[061] Ao inserir a equação (18) na equação (20) pode ser visto que a equação (20) é equivalente à restrição em que I denota a matriz de identidade.
[062] A partir das restrições na equação (18) e em (19) e a partir da compatibilidade das normas euclidianas de matriz e vetor, um limite superior para as magnitudes dos sinais de som predominantes é encontrada por usando equações (18), (19) e (11). Portanto, é garantido que os sinais de som predominantes permanecem na mesma faixa que as sequências de coeficiente HOA originais (comparar equação (11)), ou seja
Exemplo para escolha de matriz de mistura
[063] Um exemplo de como determinar a matriz de mistura satisfazendo a restrição (20) é obtido computando os sinais de som predominantes de modo que a Norma euclidiana do residual após extração seja minimizada, ou seja
[064] A solução para o problema de minimização na equação (26) é apresentada por em que indica o Moore-Penrose pseudo-inverso. Pela comparação de equação (27) com equação (18) ocorre que, neste caso, a matriz de mistura é igual ao Moore-Penrose pseudo-inverso da matriz V, ou seja
[065] Não obstante, matriz V deve ainda ser escolhida para satisfazer a restrição (19), ou seja
[066] No caso de apenas sinais direcionais, em que matriz V é a matriz de modo com relação às direções de sinal de fonte a restrição (28) pode ser satisfeita escolhendo as direções de sinal de fonte de tal modo que a distância de quaisquer duas direções vizinhas não seja muito pequena.
Consequências para a faixa de valor de sequências de coeficiente do componente HOA ambiente
[067] O componente HOA ambiente é computado pela subtração a partir da representação HOA original a representação HOA dos sinais de som predominantes, ou seja Se o vetor de sinais de som predominantes é determinado de acordo com o critério (20), pode ser concluído que
Faixa de valor de sequências de coeficiente espacialmente transformadas do componente HOA ambiente
[068] Em outro aspecto no processamento da compressão HOA proposta em EP 2743922 A1 e no documento MPEG acima mencionado N14264 é que a primeira do componente HOA ambiente são sempre escolhidas para serem designadas aos canais de transporte, em que ^MlN Í^MIN “G A/MIN — sendo tipicamente uma ordem menor do que a da representação HOA original. A fim de descorrelacionar estas sequências de coeficiente HOA, estas podem ser transformadas para sinais de alto- falante virtual impingindo a partir de algumas direções pré-definidas I^MINd/ = (em analogia ao conceito descrito na seção Normalização da representação HOA de entrada).
[069] Definir o vetor de todas as sequências de coeficiente do componente HOA ambiente com índice de ordem (e a matriz de modo com relação às direções virtuais por vetor de todos os sinais de alto-falante virtual (definido por) é obtido por
[070] Portanto, usando a compatibilidade da matriz Euclideana e normas de vetor,
[071] No documento acima mencionado MPEG N14264 as direções virtuais são escolhidas de acordo com o artigo acima mencionado Fliege et al.. As respectivas Normas euclidianas do inverso do modo de matrizes ão ilustradas na Fig. 4 para ordens Pode ser visto que
[072] No entanto, esta não se mantém em gerale m que os valores de são tipicamente muito maiores do que ‘1’. Não obstante, pelo menos para as amplitudes dos sinais de alto-falante virtual são limitadas por
[073] Ao restringir a representação HOA de entrada para satisfazer a condição (6), que requer as amplitudes dos sinais de alto-falante virtual criados a partir desta representação HOA não excede um valor de ‘1’, pode ser garantido que as amplitudes dos sinais antes do controle de ganho não irão exceder o valor (ver equações (25), (34) e (40)) sob as seguintes condições: a) O vetor de todos os sinais de som predominantes ^(0 é computado de acordo com a equação/restrições (18, (19) e (20); b) A ordem mínima MIN' que determina o número ^MIN das primeiras sequências de coeficiente do componente HOA ambiente ao qual a transformação espacial é aplicada, deve ser menor do que ‘9’, se as posições de alto-falante virtual são aquelas definidas no artigo acima mencionado Fliege et al. são usadas. Pode ser ainda concluído que as amplitudes dos sinais antes do controle de ganho não irão exceder o valor para qualquer ordem N até uma ordem máxima de interesse, ou seja em que
[074] Em particular, pode ser concluído a partir da Fig. 3 que se as direções de alto-falante virtual para a transformação espacial inicial são assumidas como sendo escolhidas de acordo com a distribuição no artigo de Fliege et al., e se adicionalmente a ordem máxima de interesse é assumida como sendo ^MAX 29 (como, por exemplo, no documento MPEG N14264), então as amplitudes dos sinais antes do controle de ganho não excedem o valor 1,50, uma vez que V^MAX < 1-5 neste caso especial. Ou seja, pode ser selecionado.
[075] é dependente da ordem máxima de interesse e as direções de alto-falante virtual que podem ser expressos por
[076] Portanto, o ganho mínimo aplicado pelo controle de ganho para garantir que os sinais antes da codificação perceptual estão dentro do intervalo [-1,1] 2eMIN é determinado por em que
[077] No caso de amplitudes dos sinais antes do controle de ganho serem muito pequenas, é proposto no documento MPEG N14264 que é possível 2eMAX em que é transmitido como informação lateral dentro da representação HOA codificada.
[078] Assim, cada expoente para base ‘2’, descrevendo dentro de uma unidade de acesso para a alteração de amplitude absoluta total de uma unidade de processamento de controle de ganho modificado a partir do primeiro até um quadro ?MAx] • Consequentemente, o número (inteiro menor) ße de bits requerido para codificar este é dado por
[079] No caso de amplitudes dos sinais antes do controle de ganho não serem muito pequenos, a equação (42) pode ser simplificada:
[080] Este número de bits ße pode ser calculado na entrada das etapas de controle de ganho/estágios 15,..., 151.
[081] Usando este número ße de bits para o expoente garante que todas as alterações de amplitude absolutas possíveis causadas pelas unidades de processamento de controle de ganho do compressor HOA 15, 151 possam ser capturadas, permitindo o início da descompressão em alguns pontos de entrada predefinidos dentro da representação comprimida.
[082] Quando iniciando a descompressão da representação HOA comprimida no descompressor de HOA, os valores de ganho não diferenciais representando as alterações amplitude absolutas totais designadas para a informação lateral para alguns quadros de dados e recebidos a partir do p demultiplexador 21 da corrente de dados recebida são usadas nas etapas de controle de ganho inverso ou estágios 24,..., 241 para aplicar um controle de ganho correto, em um modo inverso para o processamento que foi realizado em etapas de controle de ganho/estágios 15,...,151.
Outras Modalidades
[083] Quando implementando um sistema particular de compressão/descompressão HOA como descrito nas seções de HOA, codificação de HOA espacial, descompressão de HOA e decodificação de HOA espacial, a quantidade ße de bits para a codificação do expoente deve ser ajustada de acordo com a equação (42) em dependência em um fator de escala XMAXDES /¦ que por si só é dependente de uma ordem máxima desejada ^MAX.DES de representações HOA a serem comprimidas e determinadas direções de alto-falante virtual
[084] Por exemplo, quando assumindo ^MAX.DES =29 e escolhendo as direções de alto-falante virtual de acordo com o artigo de Fliege et al., uma escolha razoável seriaNaquela situação a compressão correta é garantida para representações de ordem N com que são normalizadas de acordo com a seção Normalização da representação HOA de entrada usando as mesmas direções de alto-falante virtual • No entanto, esta garantia não pode ser dada no caso de uma representação HOA que é ainda (por razões de eficiência) equivalentemente representada por sinais de alto-falante virtual no formato PCM, mas onde as direções, J ’ J ' dos alto-falantes virtuais devem ser escolhidas para serem diferentes das direções do alto-falante virtual assumido no estágio do desenho do sistema.
[085] Devido a esta escolha diferente de posições de alto-falante virtual, mesmo embora as amplitudes destes sinais alto-falante virtual estejam dentro do intervalo [1,1 [, este não pode ser garantido mais do que as amplitudes dos sinais antes do controle de ganho não irão exceder o valorE, portanto, não pode ser garantido que esta representação HOA tem a normalização apropriada para a compressão de acordo com o processamento descrito no documento MPEG N14264.
[086] Nesta situação é vantajoso ter um sistema que fornece, com base o conhecimento das posições de alto-falante virtual, a amplitude maximamente permitida dos sinais de alto-falante virtual a fim de garantir a respectiva representação HOA para se apropriada para a compressão de acordo com o processamento descrito no documento MPEG N14264. Na Fig. 5 referido um sistema é ilustrado. É tomado como entrada de posições de alto-falante virtualem que com e fornece como saída a amplitude maximamente permitida (medida em decibéis) dos sinais de alto-falante virtual. Na etapa ou estágio 51 a matriz de modo F com relação às posições de alto-falante virtual é computado de acordo com a equação (3). Em uma etapa seguinte ou estágio 52 a Norma euclidiana da matriz de modo é computada. Em uma terceira etapa ou estágio 53 a amplitude Y é computada como o mínimo de ‘1’ e o quociente entre o produto da raiz quadrada do número de posições de alto-falante virtual e ^MAX,DES e a Norma euclidiana da matriz de modo, ou seja
[087] O valor em decibéis é obtido
[088] Para explanação: a partir das derivações acima, pode ser visto que se a magnitude das sequências de coeficiente HOA não excede um valor odos os sinais antes das unidades de processamento de controle de ganho 15, 151 não irão, por conseguinte, exceder este valor, que é o requisito para uma compressão HOA apropriada.
[089] A partir da equação (9) é demonstrada que a magnitude das sequências de coeficiente HOA é limitada por
[090] Consequentemente, se é ajustado de acordo com a equação (43) e os sinais de alto-falante virtual em formato PCM satisfazem esta segue a partir da equação (7) que e que o requisito (45) é satisfeito. Ou seja, o valor de magnitude máximo de ‘1’ na equação (6) é substituído por valor de magnitude máximo na equação (47).
Básicos de ambissônicos de ordem superior
[091] Ambissônicos de ordem superior (HOA) é baseado na descrição de um campo de som dentro de uma área compacta de interesse, que é assumida como sendo livre de fontes de som. Naquele caso o comportamento espaço-temporal da P (t, x) pressão de som no tempo t e posição x dentro da área de interesse é fisicamente totalmente determinado pela equação de onda homogênea. No seguinte um sistema de coordenada esférica como mostrado na Fig. 6 é assumido. No sistema de coordenadas usado os pontos do eixo x para a posição frontal, os pontos de eixo y para a esquerda, e os pontos do eixo z para o topo. Uma posição no espaço é representado por um raio r>0 (ou seja, a distância para a origem de coordenada), um ângulo de inclinação medido a partir de eixo polar z e um ângulo azimute medido no sentido anti-horário no plano x- y a partir do eixo x. Ainda, denota a transposição.
[092] Então, pode ser mostrado a partir do livro "Fourier Acoustics" que a transformada de Fourier da pressão de som com relação ao tempo denotado por ?•«(•), ou seja com ? denotando frequência angular e i indicando a unidade imaginária, pode ser expandida na série de harmônicas esféricas de acordo com em que denota a velocidade do som e k denota o número de onda angular, que é relacionado com a frequência angular ? por Ainda denota as funções de Bessel esféricas de primeiro tipo e denota as harmônicas esféricas valoradas de ordem n e grau m, que são definidas na seção Definição de harmônicas esféricas valoradas reais. Os coeficientes de expansão apenas dependem do número de onda angular k. Notar que foi implicitamente assumido que a pressão de som é espacialmente limitada pela banda. Assim, a série é truncada com relação ao índice de ordem n em um limite superior N, que é chamada a ordem da representação HOA.
[093] Se o campo de som é representado por uma superposição de um número infinito de ondas planas harmônicas de diferentes frequências angulares ? chegando a partir de todas as possíveis direções especificadas pelo ângulo tuplo pode ser mostrado (ver B. Rafaely, "Plane-wave decomposition of the sound field on a sphere by spherical convolution", J. Acoust. Soc. Am., vol.4 (116), pages 2149-2157, October 2004) que a função de amplitude complexa de onda plana respectiva pode ser expressa pela seguinte expansão harmônica esférica em que os coeficientes de expansão estão relacionados com os coeficientes de expansão por
[094] Assumindo os coeficientes individuais para serem as funções da frequência angular , a aplicação da transformada de Fourier inversa (denotadas por ) fornece funções de domínio de tempo para cada ordem n e grau m. estas funções de domínio de tempo são referenciadas como sequências de coeficiente HOA de tempo contínuo aqui, que podem ser coletadas em um vetor único c(t) por
[095] O índice de posição de uma sequência de coeficiente HOA dentro do vetor c(t) é dado por O número geral de elementos no vetor c(t) é dado por
[096] O formato final de ambissônica fornece a versão amostrada de c(t) usando uma frequência de amostragem fs com em que denota o período de amostragem. Os elementos de são referenciados como sequências de coeficiente HOA de tempo discreto, que podem ser mostrado como sempre serem real-valorados. Esta propriedade também mantém as versões de tempo contínuo.
Definição de harmônica esférica valorada real
[097] A harmônica esférica real-valorada(assumindo normalização SN3D de acordo com J. Daniel, "Representation de champs acoustiques, application a la transmission et a la reproduction de scenes sonores complexes dans un contexte multimedia", PhD thesis, Universite Paris, 6, 2001, chapter 3.1) são dadas por
[098] As funções de Legendre associadas são definidas como como a polinomial de Legendre e, diferente em E.G. Williams, "Fourier Acoustics", vol.93 of Applied Mathematical Sciences, Academic Press, 1999, sem o fim de fase Condon-Shortley
[099] O processamento inventivo pode ser realizado por um único processador ou circuito eletrônico, ou por vários processadores ou circuitos eletrônicos operando em paralelo e/ou operando em diferentes partes do processamento inventivo.
[0100] As instruções para operar o processador ou os processadores podem ser armazenadas em uma ou mais memórias.

Claims (7)

1. Método para determinar para a compressão de uma representação de quadro de dados HOA (C(k)) um número inteiro mais baixo ße de bits para descrever representações de valores de ganho não diferenciais correspondentes a mudanças de amplitude como um expoente de dois (2e) para sinais de canal dos quadros de dados HOA, CARACTERIZADO pelo fato de que cada sinal de canal em cada quadro compreende um grupo de valores de amostra e em que para cada sinal de canal (y 1 (k - 2), ,yI(k - 2)) de cada um dos quadros de dados HOA um valor de ganho diferencial é assumido, em que o valor de ganho diferencial causa uma alteração de amplitudes (15, 151) dos primeiros valores de amostra de um sinal de canal em um quadro de dados HOA atual ((k- 2)) com relação aos segundos valores de amostra de um sinal de canal em um quadro de dados HOA anterior ((k- 3)), e em que sinais de canal de ganho adaptado resultantes sejam codificados em um codificador (16), e em que a representação de quadro de dados HOA é renderizada em um domínio espacial para O sinais de alto-falante virtual w/t) , em que as posições dos alto-falantes virtuais estão em uma esfera unitária e são visados para serem distribuídos uniformemente naquela esfera unitária, a referida renderização sendo representada por uma matriz de multiplicação• c(t) , em que w(t) é um vetor contendo todos os sinais de alto-falante virtual, F é uma matriz de modo de posições de alto-falante virtual, e c(t) é um vetor das correspondentes sequências de coeficiente HOA da representação de quadro de dados HOA, e em que a referida representação de quadro de dados HOA (C(k)) é normalizada de modo que , o método incluindo: formar sinais de canal por: a) para representar sinais de som predominantes (x(t)) nos sinais de canal, multiplicar um vetor de sequências de coeficiente HOA c(t) por uma matriz de mistura A, em que a matriz de mistura A representa uma combinação linear de sequências de coeficiente de uma representação de quadro de dados HOA normalizada; b) para representar um componente ambiente cAMB(t) nos sinais de canal, subtrair os sinais de som predominantes a partir da representação de quadro de dados HOA normalizada, e transformar um componente ambiente mínimo resultante uma matriz de modo para o referido componente ambiente mínimo cAMB,MIN(t); c) selecionar parte das sequências de coeficiente HOA c(t) que se referem às sequências de coeficiente do componente HOA ambiente ao qual uma transformação espacial é aplicada; determinar o número inteiro ße de bits com base em em que N § a ordem, NMAX é uma ordem máxima de interesse, Os são direções dos referidos alto-falantes virtuais, O = (N + 1)2 é o número de sequências de coeficiente HOA, e K é uma proporção entre a norma Euclidiana quadrada da referida matriz de modo e O.
2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que, além do componente ambiente mínimo transformado, sequências de coeficiente ambiente não transformadas do componente ambiente cAMB(t) são contidas no referido sinal de canal.
3. Método, de acordo com a reivindicação 1 ou 2, CARACTERIZADO pelo fato de que as representações de valores de ganho não diferenciais (2e) associados com referidos sinais de canal de quadros específicos dentre os referidos quadros de dados HOA são transferidos como informação lateral, em que cada um destes é representado por ße bits.
4. Método, de acordo com a reivindicação 1 ou 2, CARACTERIZADO pelo fato de que referido número inteiro ße de bits é definido para, em que 6MAX > 0 serve para aumentar o número de bits ße baseado em uma determinação de que as amplitudes dos valores de amostra de um sinal de canal antes de controle de ganho (15, 151) são menores que um valor de limiar.
5. Método, de acordo com a reivindicação 1 ou 2, CARACTERIZADO pelo fato de que
6. Método, de acordo a reivindicação 1 ou 2, CARACTERIZADO pelo fato de que a referida matriz de mistura A é determinada de modo a minimizar a norma Euclidiana do residual entre a representação HOA original e aquela dos sinais de som predominantes, tomando o Moore-Penrose pseudo-inverso de uma matriz de modo formada de todos os vetores representando distribuição direcional de sinais de som predominantes monoaurais.
7. Método, de acordo com a reivindicação 1 ou 2, CARACTERIZADO pelo fato de que, com base na determinação de que as posições dos O sinais de alto- falante virtual não combinam com aquelas assumidas para a computação de ße, incluindo: computar (51) a matriz de modo F com base nas posições de alto-falante virtual não combinantes; computar (52) a norma Euclidiana ||F||2 da matriz de modo; computar (53) um valor de amplitude maximamente permitido que substitui uma amplitude máxima permitida na referida normalização, 1)2 é o número de sequências de coeficiente HOA, K é uma proporção entre a norma Euclidiana quadrada da referida matriz de modo e O, e em que NMAXiDES é a ordem de interesse e são, para cada ordem, as direções dos alto-falantes virtuais que foram assumidos para a implementação da referida compressão da representação de quadro de dados HOA (C(k)), de modo que ße é escolhido por para codificar os expoentes (e) para base ‘2’ dos referidos valores de ganho não diferenciais.
BR112016029978-7A 2014-06-27 2015-06-22 Método para determinar para a compressão de uma representação de quadro de dados hoa um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais BR112016029978B1 (pt)

Priority Applications (2)

Application Number Priority Date Filing Date Title
BR122022022357-5A BR122022022357B1 (pt) 2014-06-27 2015-06-22 Método e aparelho para determinar para a compressão de uma representação de quadro de dados hoa
BR122023009299-6A BR122023009299B1 (pt) 2014-06-27 2015-06-22 Método e aparelho para determinar para a compressão de uma representação de quadro de dados hoa um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14306023.4A EP2960903A1 (en) 2014-06-27 2014-06-27 Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
EP14306023.4 2014-06-27
PCT/EP2015/063912 WO2015197512A1 (en) 2014-06-27 2015-06-22 Method and apparatus for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values

Publications (2)

Publication Number Publication Date
BR112016029978A2 BR112016029978A2 (pt) 2017-08-22
BR112016029978B1 true BR112016029978B1 (pt) 2023-08-01

Family

ID=

Similar Documents

Publication Publication Date Title
US10580426B2 (en) Method for decoding a higher order ambisonics (HOA) representation of a sound or soundfield
JP7423585B2 (ja) Hoaデータ・フレーム表現のデータ・フレームの個々のもののチャネル信号に関連付けられた非差分的な利得値を含む符号化されたhoaデータ・フレーム表現
US11322165B2 (en) Methods and apparatus for determining for decoding a compressed hoa sound representation
EP3161821B1 (en) Method for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values
BR112016029978B1 (pt) Método para determinar para a compressão de uma representação de quadro de dados hoa um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais
BR122022022350B1 (pt) Aparelho para determinar para a compressão de uma representação de quadro de dados hoa
BR122018012705B1 (pt) Método e aparelho de decodificar uma representação de som ambissônico de ordem mais alta (hoa) comprimida
TW202418268A (zh) 用於將聲音或聲場的高階保真立體音響(hoa)表示予以解碼的方法及裝置