BR122023009299B1 - Método e aparelho para determinar para a compressão de uma representação de quadro de dados hoa um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais - Google Patents

Método e aparelho para determinar para a compressão de uma representação de quadro de dados hoa um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais Download PDF

Info

Publication number
BR122023009299B1
BR122023009299B1 BR122023009299-6A BR122023009299A BR122023009299B1 BR 122023009299 B1 BR122023009299 B1 BR 122023009299B1 BR 122023009299 A BR122023009299 A BR 122023009299A BR 122023009299 B1 BR122023009299 B1 BR 122023009299B1
Authority
BR
Brazil
Prior art keywords
hoa
representation
sound
compressed
signals
Prior art date
Application number
BR122023009299-6A
Other languages
English (en)
Inventor
Sven Kordon
Alexander Krueger
Original Assignee
Dolby International Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=51178839&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BR122023009299(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby International Ab filed Critical Dolby International Ab
Priority claimed from BR112016029978-7A external-priority patent/BR112016029978B1/pt
Publication of BR122023009299B1 publication Critical patent/BR122023009299B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

quando comprimindo uma representação de quadro de dados hoa, um controle de ganho (15, 151) é aplicado para cada sinal de canal antes deste ser perceptualmente codificado (16). os valores de ganho são transferidos, em um modo diferencial, como informação lateral. no entanto, para iniciar a decodificação de tais valores de ganho absolutos de representação de quadro de dados hoa comprimidos em fluxo são requeridos, os quais devem ser codificados com um número mínimo de bits. para determinar o referido número inteiro mais baixo (ße) de bits, a representação de quadro de dados hoa (c(k)) é renderizada no domínio espacial para sinais de alto-falante virtual estando em uma esfera unitária, seguido por normalização da representação de quadro de dados hoa (c(k)). então, o número inteiro mais baixo de bits é definido para: (aa).

Description

Dividido do BR112016029978-7, depositado em 22 de junho de 2015. CAMPO TÉCNICO
[001] A invenção refere-se a um método e a um aparelho para determinara a compressão de uma representação de HOA data frame de um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais associados com sinais de canal de uns específicos dos referidos quadros de dados HOA.
ANTECEDENTES
[002] Ambissônico de Ordem Elevada denotado HOA oferecem uma possibilidade para representar som de três dimensões. Outras técnicas são síntese de campo de onda (WFS) ou abordagens baseadas em canal como 22.2. Em contraste aos métodos baseados em canal, a representação HOA oferecem a vantagem de ser independente de um ajuste de alto-falante específico. No entanto, esta flexibilidade é ao custo de um processo de decodificação que é requerido para o playback da representação HOA em um ajuste de alto-falante particular. Comparado com a abordagem, em que o número de alto-falantes necessários é geralmente muito grande, HOA pode ainda ser renderizado para ajustes que consistem em apenas alguns alto-falantes. Outra vantagem de HOA é que a mesma representação pode ainda ser empregada sem qualquer modificação para renderização binaural para fones de ouvido.
[003] HOA é baseado na representação da densidade espacial de amplitudes de onda plana harmônica complexa por uma expansão de harmônica esférica (SH) truncada. Cada coeficiente de expansão é uma função da frequência angular, que pode ser equivalentemente representada por uma função de domínio de tempo. Assim, sem perda de generalidade, a representação completa de campo de som HOA realmente pode ser assumida para consistir em O funções de domínio de tempo, em que O denota o número de coeficientes de expansão. Estas funções de domínio de tempo serão equivalentemente referidas como sequências de coeficiente de HOA ou como canais HOA no seguinte.
[004] A resolução espacial da representação de HOA melhora com a ordem máxima de crescimento N da expansão. Infelizmente, o número de coeficientes de expansão O cresce de modo quadrática com a ordem N, em particular O = (N + 1)2. Por exemplo, representações HOA típicas usando ordem N = 4 requer O = 25 coeficientes HOA (expansão). A taxa de bit total para a transmissão de representação HOA, dada uma taxa de amostragem de canal único desejada fs e o número de bits Nb por amostra, é determinada por O.fs.Nb. Transmitir uma representação HOA da ordem N = 4 com uma taxa de amostragem de fs = 48kHz empregando Nb = 16 bits por amostra resulta em uma taxa de bit de 19,2 MBits/s, que é muito elevado para muitas aplicações práticas, por exemplo, streaming. Assim, a compressão de representações HOA é altamente desejável.
[005] Previamente, a compressão de representações de campo de som HOA foi proposta em EP 2665208 A1, EP 2743922 A1, EP 2800401 A1, cf. ISO/IEC JTC1/SC29/WG11, N14264, WD1-HOA Text of MPEG-H 3D Audio, Janeiro de 2014. Estas abordagens têm em comum que realizam uma análise de campo de som e decompõem a dada representação HOA em um componente direcional e um componente de ambiente residual. A representação final comprimida é por um lado assumida por consistir em um número de sinais quantizados, resultando a partir da codificação perceptual de sinais direcionais e baseados em vetores bem como sequências de coeficiente relevante do componente HOA de ambiente. Por outro lado, esta compreende informações laterais adicionais relacionadas com os sinais quantizados, cuja informação lateral é requerida para a reconstrução da representação HOA a partir de sua versão comprimida.
[006] Antes de serem passados ao codificador perceptual, estes sinais de tempo-domínio intermediários são requeridos para ter uma amplitude máxima dentro da faixa de valor [-1,1[, que é um requisito que surge da implementação de codificadores perceptuais atualmente disponíveis. A fim de satisfazer este requisito quando comprimindo representações HOA, uma unidade de processamento de controle de ganho (ver EP 2824661 A1 e o documento acima mencionado ISO/IEC JTC1/SC29/WG11 N14264) é usada à frente dos codificadores perceptuais, que atenua suavemente ou amplifica os sinais de entrada. A modificação de sinal resultante é assumida como sendo invertível e sendo aplicado em quadros, em que em particular a alteração das amplitudes de sinal entre frames sucessivos deve ser assumida para ser uma potência de ‘2’. Para facilitar a inversão desta modificação de sinal no descompressor de HOA, correspondendo à normalização da informação lateral é incluída na informação lateral total. Esta normalização de informação lateral pode consistir em expoentes para a base ‘2’, cujos expoentes descrevem a alteração de amplitude relativa entre dois frames sucessivos. Estes expoentes são codificados usando um código de comprimento de corrida de acordo com o documento acima mencionado ISO/IEC JTC1/SC29/WG11 N14264, uma vez que alterações menores de amplitude entre frames sucessivos são mais prováveis do que as maiores.
SUMÁRIO DA INVENÇÃO
[007] Usando alterações de amplitude diferencialmente codificada para reconstruir as amplitudes de sinal original na descompressão de HOA é praticável, por exemplo, no caso de um arquivo unido ser descomprimido a partir do início até o fim sem quaisquer pulos temporais. No entanto, para facilitar o acesso aleatório, unidades de acesso independente devem estar presentes na representação codificada (que é tipicamente um fluxo de bits) a fim de permitir o início da descompressão a partir de uma posição desejada (ou pelo menos na vizinhança desta), independentemente da informação a partir de quadros anteriores. Tal unidade de acesso independente deve conter a alteração de amplitude absoluta total (ou seja, um valor de ganho não diferencial) causado pela unidade de processamento de controle de ganho a partir do primeiro quadro até um quadro atual. Assumindo que as alterações de amplitude entre dois quadros sucessivos são uma potência de ‘2’, isto é suficiente para ainda descrever a alteração de amplitude absoluta total por um expoente para base ‘2’. Para uma codificação deste expoente, é essencial conhecer os ganhos de potencial máximos dos sinais antes da aplicação da unidade de processamento de controle de ganho. No entanto, este conhecimento é altamente dependente da especificação de restrições na faixa de valor das representações HOA a serem comprimidas. Infelizmente, o documento de áudio MPEG-H 3D ISO/IEC JTC1/SC29/WG11 N14264 não apenas fornece uma descrição do formato para a representação HOA de entrada, sem configuração de quaisquer restrições nas faixas de valor.
[008] Um problema a ser resolvido pela invenção é fornecer um número inteiro mais baixo de bits necessário para representar os valores de ganho não diferencial. Este problema é resolvido pelo método divulgado na reivindicação 1. Um aparelho que utiliza este método é divulgado na reivindicação 2.
[009] Modalidades vantajosas adicionais da invenção são divulgadas nas reivindicações dependentes respectivas.
[010] A invenção estabelece uma inter-relação entre a faixa de valor da representação HOA de entrada e os ganhos máximos potenciais dos sinais antes da aplicação da unidade de processamento de controle de ganho dentro do compressor HOA.Baseado naquela inter-relação, a quantidade de bits necessária é determinada - para uma determinada especificação para a faixa de valor de uma representação HOA de entrada - para uma codificação eficiente dos expoentes para base ‘2’ para descrever dentro de uma unidade de acesso as alterações de amplitude absolutas totais (ou seja, um valor de ganho não diferencial) dos sinais modificados causados pela unidade de processamento de controle de ganho a partir do primeiro quadro até um quadro atual.
[011] Ainda, uma vez que a regra para a computação da quantidade de bits requerida para a codificação do expoente é fixada, a invenção usa um processamento para verificar se uma determinada representação satisfaz as restrições de faixa de valor requeridas de tal modo que esta possa ser comprimida corretamente.
[012] Em princípio, o método da invenção é adequado para determinada a compressão de uma representação de quadro de dados HOA um número inteiro mais baixo βe de bits requerido para representar valores de ganho não diferenciais para sinais de canal de uns específicos dos referidos quadros de dados HOA, em que cada sinal de canal em cada quadro compreende um grupo de valores de amostra e em que para cada sinal de canal de cada um dos referidos quadros de dados HOA um valor de ganho diferencial é atribuído e tal valor de ganho diferencial gera uma mudança de amplitudes dos valores da amostra de um sinal de canal em um quadro de dados HOA atual com relação aos valores da amostra daquele sinal de canal no quadro de dados HOA anterior, e em que tais sinais de canal adaptados de ganho são codificados em um codificador, e em que a referida representação de quadro de dados HOA foi renderizada em um domínio especial para O sinais virtuais de alto-falante wj(t), em que as posições dos alto-falantes virtuais estão situadas em uma esfera unitária e são visadas para serem distribuídos uniformemente naquela esfera unitária, a referida renderização sendo representara por uma matriz de multiplicação w (t) = (Ψ)-1-c(t), em que w(t) é um vetor contendo todos os sinais de alto-falante virtuais, Φ é uma matriz de modo de posições de alto-falante virtual, e c(t) é um vetor das sequências de coeficiente de HOA correspondentes da referida representação de quadro de dados HOA, e em queareferidarepresentação de quadro de dados HOA foi normalizada de tal modo que referido método incluindo as etapas de: - formar referidos sinais de canal por uma ou mais das subetapas a), b), c) a partir da referida representação de quadro de dados HOA normalizados: a) para representar sinais de som predominantes nos referidos sinais de canal, multiplicar o referido vetor de sequências de coeficiente de HOA c(t) por uma matriz de mistura A, a norma Euclidiana da qual matriz de mistura A não é maior do que ‘1’, em que mistura da matriz A representa uma combinação linear de sequências de coeficiente da referida representação de quadro de dados HOA normalizada; b) para representar um componente ambiente cAMB(t) nos referidos sinais de canal, subtraindo os sinais de som predominantes a partir da referida representação de quadro de dados HOA normalizada, e selecionar pelo menos parte das sequências de coeficiente do referido componente ambiente CAMB(t), em que , e transformandoocomponente ambientemínimo resultante . , em que e M1N é uma matriz de modo para referido componente ambiente mínimo CAMB.MiN(t); c) selecionar parte das referidas sequências de coeficiente HOA c(t), em que as sequências de coeficiente selecionadas se relacionam com as sequências de coeficiente do componente HOA ambiente a qual uma transformação espacial é aplicada, e a ordem mínima NMiN descrevendo o número das referidas sequências de coeficiente selecionadas é NMIN^ 9; - configurar referido número inteiro mais baixo βe de bits requerido para representarosreferidosvaloresdeganho não diferenciais para referidos sinais de βe = íiog2(íiog2(VKMAx-o)] + 1)1 canal para em que é a ordem, NMAX é a ordem máxima de interesse, são direções dos referidos alto-falantes virtuais, O = (N + 1)2 é o número de sequências de coeficiente HOA, e K é uma proporção entre a norma Euclidiana quadrada |M|22 da referida matriz de modo e O.
[013] Em princípio, o aparelho da invenção é adequado para determinar a compressão de uma representação de quadro de dados HOA um número inteiro mais baixo βe de bits requerido para representar valores de ganho não diferenciais para sinais de canal de uns específicos dos referidos quadros de dados HOA, em que cada sinal de canal em cada quadro compreende um grupo de valores de amostra e em que para cada sinal de canal de cada um dos referidos quadros de dados HOA um valor de ganho diferencial é atribuído e tal valor de ganho diferencial gera uma mudança de amplitudes dos valores da amostra de um sinal de canal em um quadro de dados HOA atual com relação aos valores da amostra daquele sinal de canal no quadro de dados HOA anterior, e em que tais sinais de canal adaptados de ganho são codificados em um codificador, e em que a referida representação de quadro de dados HOA foi renderizada em um domínio especial para sinais de O alto-falantes virtuais wj(t), em que as posições dos alto-falantes virtuais estão situadas em uma esfera unitária e são visados para serem distribuídos uniformemente naquela esfera unitária, referida renderização sendo representada por um multiplicação de matriz w(t) =(Φ)’1 ’ c(t), em que w(t) é um vetor contendo todos os sinais de alto-falantes virtuais, Φ é uma matriz de modo de posições de alto-falante virtual, e c(t) é um vetor das correspondentes sequências de coeficiente HOA da referida representação de quadro de dados HOA, e em que a referida representação de quadro de dados HOA foi normalizada de tal modo que referido aparelho incluindo: - meios que formam referidos sinais de canal por uma ou mais das operações a), b), c) a partir da referida representação de quadro de dados HOA normalizados: a) para representar sinais de som predominantes nos referidos sinais de canal, multiplicar o referido vetor de sequências de coeficiente de HOA c(t) por matriz de mistura A, a norma Euclidiana da qual matriz de mistura A não é maior do que ‘1’, em que matriz de mistura A representa uma combinação linear de sequências de coeficiente da referida representação de quadro de dados HOA normalizados; b) para representar um componente ambiente cAMB(t) nos referidos sinais de canal, subtraindo os sinais de som predominantes a partir da referida representação de quadro de dados HOA normalizada, e selecionar pelo menos parte das sequências de coeficiente do referido componente ambiente CAMB(t), em que , e transformando o componente ambiente mínimo resultante cAMB,MIN(t) computando , em que e ψMIN é uma matriz de modo para o referido componente ambiente mínimo CAMB,MIN(1) c) selecionar parte das referidas sequências de coeficiente HOA c(t), em que as sequências de coeficiente selecionadas se relacionam com as sequências de coeficiente do componente HOA ambiente a qual uma transformação espacial é aplicada, e a ordem mínima NMIN descrevendo o número das referidas sequências de coeficiente selecionadas é NMIN< 9; - meio que define o referido número inteiro mais baixo βe de bits requerido para representar os referidos valores de ganho não diferenciais para referidos sinais de canal para em que é a ordem, NMAX é a ordem máxima de interesse, são direções dos referidos alto-falantes virtuais, é o número de sequências de coeficiente HOA, e K é uma proporção entre a norma Euclidiana quadrada da referida matriz de modo e O.
BREVE DESCRIÇÃO DOS DESENHOS
[014] Modalidades exemplares da invenção são descritas com referência aos desenhos que acompanham, que mostram em: Fig. 1 compressor HOA; Fig. 2 descompressor HOA; Fig. 3 valores de escala K para direções virtuais para ordens HOA N = 1,...,29; Fig. 4 normas Euclidianas de matrizes de modo reverso Φ’1 para direções virtuais para ordens HOA Fig. 5 Determinação de magnitudemaximamente permitida YdB de sinais de alto-falantes virtuais nas posições , em que O = (N + 1)2; e Fig. 6 Sistema de coordenadas esféricas.
DESCRIÇÃO DAS MODALIDADES
[015] Mesmo se não explicitamente descrito, as seguintes modalidades podem ser empregadas em qualquer combinação ou subcombinação.
[016] A seguir, o princípio de compressão e descompressão de HOA é apresentado para fornecer um contexto mais detalhado em que o problema mencionado acima ocorre. A base para esta apresentação é o processamento descrito no documento de áudio MPEG-H 3D ISO/IEC JTC1/SC29/WG11 N14264, ver ainda EP 2665208 A1, EP 2800401 A1 e EP 2743922 A1. Em N14264 o ‘componente direcional’ é estendido para um ‘componente de som predominante’. Como o componente direcional, o componente de som predominante é assumido para ser parcialmente representado por sinais direcionais, significando sinais monoaurais com uma correspondente direção a partir da qual são assumidos para impingir no ouvinte, junto com alguns parâmetros de predição para prever porções da representação original de HOA a partir dos sinais direcionais. Adicionalmente, supõe-se que o componente de som predominante seja representado pelos ‘sinais baseados em vetor’, significando sinais monoaurais com um vetor correspondente que define a distribuição direcional dos sinais baseados em vetor.
Compressão de HOA
[017] A arquitetura geral do compressor de HOA descrita em EP 2800401 A1 é ilustrada na Fig. 1. Tem uma parte de codificação HOA espacial descrita na Fig. 1A e uma parte de codificação perceptual e de fonte descrita na Fig. 1b. O codificador HOA espacial fornece uma primeira representação de HOA comprimido consistido em sinais I juntos com informação lateral descrevendo como criar uma representação HOA da mesma. Em codificadores de fonte perceptual e de informação lateral os sinais I são perceptualmente codificados e a informação lateral é submetida a codificação de fonte, antes de multiplexação das duas representações codificadas.
Codificação de HOA espacial
[018] Em uma primeira etapa, um quadro de k° atual C(k) da representação HOA original é inserida em uma etapa de processamento de direção e estimativade vetorouestágio 11, que é assumido para fornecer os conjuntos de tuplo e O conjunto de tuplo consiste em tuplos dos quais o primeiro elemento denota o índice de um sinal direcional eosegundoelemento denota a respectiva direção quantizada. O conjunto de tuplo consiste em tuplos dos quais o primeiro elemento indica o índice de um sinal baseado em vetor e o segundo elemento denota o vetor definindo a distribuição direcional do sinal, ou seja, como a HOA representação do sinal baseado em vetor é computada.
[019] Usando ambos conjuntos de tuplos e o quadro HOA inicial C(k) é decomposto em uma etapa de decomposição de HOA ou estágio 12 em um quadro XPS(k-1) de todo som predominante (ou seja, baseado em direcional e vetor) sinais e o quadro CAMB(k-1) do componente HOA ambiente. Notar que o atraso de um quadro que é devido a processamento de sobreposição-adição a fim de evitar os artefatos de bloqueio. Além disso, a etapa de decomposição HOA/estágio 12 é assumida para emitir alguns parâmetros de predição ζ (k-1) descrevendo como prever as porções da representação HOA original, a fim de enriquecer o componente HOA de som predominante. Além disso, um vetor de designação alvo contendo informações sobre a designação de sinais de som predominantes, que foram determinados na etapa de processamento de decomposição HOA ou estágio 12, para os canais disponíveis I é assumido para serem fornecidos. Os canais afetados podem ser assumidos para serem ocupados, significando que não estão disponíveis para transportar quaisquer sequências de coeficientes do componente HOA ambiente no respectivo quadro de tempo.
[020] Na etapa de processamento de modificação de componente ambiente ou estágio 13 o quadro CAMB (k-1) do componente HOA ambiente émodificadode acordo com a informação fornecida pelo vetor de designação alvo. Em particular, é determinado que sequências de coeficiente do componente HOA ambiente sejam transmitidos nos canais I determinados, dependendo (entre outros aspectos) na informação (contida no vetor de designação alvo sobre quais canais são disponíveis e não já ocupados por sinais de som predominantes. Além disso, sequências de coeficiente fade-in e fade-out são realizadas se os índices das sequências de coeficiente escolhidas variam entre quadros sucessivos.
[021] Além disso, é assumido que as primeiras sequências de coeficientes OMIN do componente HOA ambiente CAMB (k-2) são sempre escolhidas para serem perceptualmente codificadas e transmitidas, em que OMIN = (NMIN + 1)2 com NMIN ^ N sendo tipicamente uma ordem menor do que a representação HOA original. A fim de des-correlacionar estas sequências de coeficiente HOA, estas podem ser transformadas na etapa/estágio 13 para sinais direcionais (ou seja, funções de onda de plano gerais) impingindo a partir de algumas direções pré-definidas QiwiN.d, d = 1,..., OMiN.
[022] Junto com o componente HOA ambiente modificado CM,A (k-1) um componente HOA ambiente temporalmente previsto CP,M,A (k-1) é computado na etapa/estágio 13 e é usado nas etapas de processamento de controle ou estágios 15, 151 a fim de permitir uma visualização razoável, em que a informação sobre a modificação do componente HOA ambiente é diretamente relacionado à designação de todos os tipos de possíveis de sinais para os canais disponíveis na etapa de designação de canal ou estágio 14.
[023] A informação final sobreadesignação é assumida como estando contida no vetor de designação final A fim de computarestevetorna etapa/estágio 13, informações contidas no vetor de designação alvo são exploradas.
[024] A designação de canalnaetapa/estágio 14 designa com a informação fornecida pelo vetor de designação os sinais apropriados contidos no quadro e aqueles contidos no quadro para os canais I disponíveis, gerando os quadros desinal Ainda, sinais apropriados contidos no quadro e no quadro são ainda designados para os canais I disponíveis, gerando os quadros previstos
[025] Cada um dos quadros do sinal é finalmente processado pelo controle de ganho 15, 151 resultando em expoentes e sinalizadores de exceção e nos sinais ,em que o ganho de sinal é suavemente modificado de tal modo a conseguir uma faixa de valor que é adequada para as etapas de codificador perceptual ou estágios 16. Etapas/estágios 16 emitem correspondentes quadrosdesinalcodificados Os quadros de sinal previstos um tipo de visualização a gim de evitar alterações de ganho severas entre blocos sucessivos. Os dados de informação lateral e são codificados por fonte em etapa de codificador de fonte de informação lateral ou estágio 17, resultando em quadro de informação lateral codificada Em um multiplexador 18 os sinais codificados do quadro e os dados de informação lateral codificados para este quadro são combinados, resultando em quadro de saída
[026] Em um decodificador HOA espacial as modificações de ganho nas etapas /estágios 15, 151 são assumidas como sendo revertidas usando uma sinalizadores de exceção e os sinalizadores de exceção
Descompressão de HOA
[027] A arquitetura geral do descompressor de HOA descrita em EP 2800401 A1 é ilustrada na Fig. 2. Esta consiste em contrapartes dos componentes do compressor HOA, que são arranjados em ordem reversa e incluem uma parte perceptual e de decodificação de fonte descrita na Fig. 2A e uma parte de decodificação HOA espacial descrita na Fig. 2B.
[028] Na parte perceptual e decodificação de fonte (representando um decodificador perceptual e fonte de informação lateral) uma etapa de desmultiplexar ou estágio 21 recebe quadro de entrada a partir do fluxo de bit e fornece a representação codificada dos sinais I e os dados de informação lateral codificados descrevendo como criar uma representação HOA dos mesmos. Os sinais são perceptualmente decodificados em uma etapa de decodificador perceptual ou estágio 22, resultando em sinais decodificados Os dados de informação lateral codificados são decodificados em uma etapa de decodificador de fonte de informação lateral ou estágio 23, resultando em conjuntos de dados expoentes sinalizadores de exceção parâmetros de predição e um vetor de designação Com relação à diferença entre e ver o documento acima mencionado MPEG N14264.
Decodificação de HOA espacial
[029] Na parte de decodificação HOA espacial, cada um dos sinais decodificados perceptualmente e inserido em uma etapa de processamento de controle de ganho reverso ou estágio 24, 241 junto com seu expoente de correção de ganho associado e sinalizador de exceção de correção de ganho A ia etapa de processamento de controle de ganho/estágio fornece um quadro de sinal corrigido de ganho
[030] Todos I os quadros de sinal corrigidos de ganho /, sao alimentados junto com o vetor de designação e as etapas de tuplo a uma etapa de re-designação de canal ou estágio25, vejaadefinição descrita acima dos conjuntos de tuplo . O vetor de designação consiste em componentes I que indicam para cada transmissão se esta contém uma sequência de coeficiente do componente HOA ambiente e quais estes contêm. Na etapa de re-designação de canal/estágio 25 os quadros de sinal corrigidos de ganho são redistribuídos para reconstruir o quadro de todos os sinais de som predominantes (ou seja, todos os sinais direcionais e baseados em vetor) no quadro de uma representação intermediária do componente HOA ambiente. Adicionalmente, o conjunto dos índices de sequências de coeficiente do componente HOA ambiente ativo no kº quadro, e os conjuntos de dados e de índices de coeficiente do componente HOA ambiente, que foram habilitados, desabilitados e para permanecerem ativos no o quadro, são fornecidos.
[031] Em uma etapa de síntese de som predominante ou estágio 26 a representação HOA do componente de som predominante é computada a partir do quadro de todos os sinais de som predominantes usando o conjunto tuplo o conjunto de parâmetros de predição, o conjunto de tuplo e os conjuntos de dados
[032] Em uma etapa de síntese de ambiência ou estágio 27 o quadro de componente HOA ambiente é criado a partir do quadro da representação intermediária do componente HOA ambiente, usando o conjunto de índices de sequências de coeficiente do componente HOA ambiente que estão ativos no kº quadro. O atrase de um quadro é introduzido devido à sincronização com o componente HOA de som predominante.
[033] Finalmente em uma etapa de composigao HOA ou estagio 28 o quadro de componente HOA ambientee o quadro de de componente HOA de som predominante sao superpostos de modo a fornecer o quadro HOA decodificado
[034] Depois disso, o decodificador HOA espacial cria a partir dos sinais I e a informagao lateral a representagao HOA reconstrufda.
[035] No caso de codificagao lateral o componente HOA ambiente foi transformagao para sinais direcionais, esta transformagao e revertida em decodificador lateral na etapa/estagio 27.
[036] Os ganhos maximos potenciais dos sinais antes das etapas de processamento de controle de ganho/estagios 15, 151 dentro do compressor HOA sao altamente dependentes da faixa de valor da representagao HOA de entrada. Uma vez, na primeira faixa de valor significativa para a representagao HOA de entrada e definida, seguida por concluindo nos ganhos maximos potenciais dos sinais antes de entrar nas etapas de processamento de controle de ganho/estagios.
Normalizagao da representagao HOA de entrada
[037] Para usar o processamento inventivo uma normalizagao do sinal de (total) representagao HOA de entrada deve ser realizada antes. Para a compressao de HOA urn processamento em quadros e realizado, em que o k° quadro C(k) representagao HOA de entrada original e definida com relagao ao vetor c(t) das sequencias de coeficiente HOA de tempo contfnuo especificado na equagao (54) na segao Basicos de Ambissonicos de Ordem Superior como em que k denota o fndice de quadra, L o tamanho do quadro (em amostras), O = (N + 1 )2 o numero de sequencias de coeficiente HOA e Ts indica o perfodo de amostragem.
[038] Como mencionado em EP 2824661 A1, uma normalizagao significativa de uma representagao HOA visualizada a partir de uma perspectiva pratica nao e alcangada pela imposigao de restrigoes na faixa de valor das sequencias de coeficiente HOA individuals uma vez que estas fungoes de tempo-domfnio nao sao os sinais que sao atualmente tocados pelos alto-falantes apos a renderizagao. Em vez disso, e mais conveniente considerar a ‘representagao de dormnio espacial equivalente’, que e obtida pela renderizagao da representagao deHOA para sinais de alto-falantes 0 virtuais As respectivas posigoes de alto-falantes virtuais sao assumidas para serem expressas por meio de urn sistema de coordenadas esfericas, em que cada posigao e assumida para estar sobre a esfera unitaria e para ter urn raio de ‘1’. Portanto, as posigoes podem ser equivalentemente expressas por diregoes dependentes de ordem em quedenotam as inclinagoes e azimutes, respectivamente (ver ainda Fig. 6 e sua descrigao para a definigao do sistema de coordenadas esfericas). Estas diregoes devem ser distribufdas sobre a esfera unitaria conforme possfvel, ver, por exemplo, J. Fliege, U. Maier, MA two-stage approach for computing cubature formulae for the sphere", Technical report, Fachbereich Mathematik, University of Dortmund, 1999. Numeros de nos sao encontrados em http://www.mathematik.uni- dortmund.de/lsx/research/projects fliege/nodes/nodes.html para a computagao das diregoes especfficas. Estas posigoes sao em geral dependentes do tipo de definigao de ‘distribuigao uniforme na esfera’, e portanto, nao sao desambfguas.
[039] A vantagem de definir sinais de alto-falantes virtuais sobre definir faixas de valores para sequencias de coeficiente HOA e que a faixa de valor para o anterior pode ser justada intuitivamente par ao intervalo [-1,1 [ como o caso para sinais convencionais de alto-falantes assumindo representagao PCM. Isto leva a urn erro de quantizagao espacialmente uniformemente distribuida, de tal modo que vantajosamente a quantizagao e aplicada em um domfnio que e relevante com relagao a escuta real. Um aspecto importante neste contexto e que o numero de bits por amostra pode ser escolhido como sendo tao baixo como este e tipicamente para sinais convencionais de alto-falantes, ou seja, 16, que aumenta a eficiencia em comparagao com a quantizagao direta de sequencias de coeficiente HOA, em que geralmente um numero maior de bits (por exemplo, 24 ou ainda 32) por amostra e requerido.
[040] Para descrever o processo de normalizagao no domfnio especial em detalhes, todos os sinais de alto-falantes virtuais, sao resum idos em um vetor comoem quedenota transposição. Denotar a matriz de modo com relação às direções virtuaispor Ψ, que é definido poro processo de renderização pode ser formulado como a matriz de multiplicação
[041] Usando estas definigoes, um requisito razoavel nos sinais de alto- falantes virtuais e: que significa que a magnitude de cada sinal de alto-falante virtual e requerida para estar dentro da faixa [-1,1[. Um instante de tempo do tempo t e representado por um fndice de amostra I e um perfodo de amostra TS dos valores de amostra dos referidos quadros de dados HOA.
[042] A potencia total dos sinais de alto-falante consequentemente satisfaz a condigao
[043] A renderizagao e a normalizagao da representagao de quadro de dados HOA e realizada a jusante da entrada C(k) da Fig. 1 A.
Consequencias para a faixa de valor de sinal antes do controle de ganho
[044] Assumindo que a normalizagao da representagao HOA de entrada e realizada de acordo com a descrigao na segao Normalizagao da representagao HOA de entrada, a faixa de valor dos sinais que sao entradas para a unidade de processamento de controle de ganho 15, 151 no compressor HOA, e considerado no seguinte. Estes sinais sao criados pela designagao para os canais I disponfveis de uma ou mais das sequencias de coeficiente HOA, ou sinais de som predominantese/ou sequências de coeficiente particular do componente HOA ambiente para parte da qual uma transformagao espacial e aplicada. Portanto, e necessario analisar a possfvel faixa de valor destes tipos de sinal diferentes mencionados sob a assungao de normalizagao na equagao (6). Uma vez que todos os tipos de sinais sao intermediariamente computados a partir das sequencias de coeficiente HOA originais, urn olhar sobre suas possfveis faixas de valores e tornado.
[045] 0 caso em que apenas uma ou mais sequencias de coeficiente HOA sao contidas nos canais I nao e descrito na Fig. 1A e Fig. 2B, ou seja, em tal caso a decomposigao HOA, modificagao de componente ambiente e os correspondentes blocos de sfntese nao sao requeridos.
[046] Consequencias para a faixa de valor da representagao HOA. A representagao HOA de tempo contfnuo e obtida a partir de sinais alto-falante virtuais que e a operagao inversao aquela na equagao (5).Portanto, a potencia total de todas as sequencias de coeficiente HOA e delimitada como a seguir: usando equações (8) e (7).
[047] Sob a assungao de normalizagao N3D das fungoes harmonicas esfericas, a norma euclidiana quadrada da matriz de modo pode ser escrita por denota a proporgao entre a norma euclidiana quadrada da matriz de modo e o numero 0 de sequencias de coeficiente HOA. Esta proporgao e dependente da ordem N de HOA especffica e as diregoes especfficas de alto-falante virtual que podem ser expressas adicionando a proporgao a respective lista de parametro como a seguir
[048] Fig. 3 mostra valores de K para direções virtuais de acordo com o artigo acima mencionado de Fliege et al. para ordens de HOA N = 1 29.
[049] Combinando todos os argumentos anteriores e consideragoes fornece um limite superior para a magnitude of sequencias de coeficiente HOA como a seguir: em que a primeira desigualdade resulta diretamente a partir das definigoes de norma.
[050] E importante notar que a condigao na equagao (6) implica na condigao na equagao (11), mas o oposto nao se mantem, ou seja, a equagao (11) nao implica equagao (6).
[051] Outro importante aspecto e que sob a assungao de posigoes de alto- falante virtual quase uniformemente distribufda os vetores de coluna da matriz de modo Ψ que representa os vetores de modo com relagao as posigoes de alto- falante virtual, sao quase ortogonais a cada outra e tem uma Norma euclidiana de N + 1 cada. Esta propriedade significa que a transformagao espacial praticamente preserva a Norma euclidiana exceto para uma constante multiplicativa, ou seja
[052] A norma verdadeira difere mais da aproximagao na equagao (12) quanto mais a assungao de ortogonalidade nos vetores de modo e violada.
[053] Consequencias para a faixa de valor de sinais de som predominates ambos os tipos de sinais de som predominantes (direcional e baseado em vetor) tem em comum que suas contribuigoes para a representagao HOA e descrita por urn único vetorcom norma euclidiana deou seja
[054] No caso do sinal direcional este vetor corresponde ao modo vetor com relação a determinada direção de fonte do sinalou seja
[055] Este vetor descreve por meio de uma representação HOA um feixe direcional na direção da fonte do sinalNo caso de um sinal baseado em vetor, o vetornão é restrito para ser o modo vetor com relação a qualquer direção, e, portanto, pode descrever uma distribuição de direção mais geral do sinal baseado em vetor monaural.
[056] No seguinte é considerado o caso geral de D sinais de som predominantesque podem ser coletados no vetor x(t) de acordo com
[057] Estes sinais devem ser determinados baseados na matrizque é formada de todos os vetoresrepresentando a distribuição direcional dos sinais de som predominantes monaurais
[058] Para uma extragao significativa dos sinais de som predominantes x(t) as seguintes restrigoes sao formuladas:
[059] a) Cada sinal de som predominante e obtido como uma combinagao linear das sequencias de coeficiente da representagao HOA original, ou sejaem quedenota a matriz de mistura.
[060] b) A matriz de mistura A deve ser escolhida de tal modo que sua norma euclidiana nao exceda o valor de ‘1’, ou seja e de tal modo que a norma euclidiana quadrada (ou potencia equivalentemente) do residual entre a representagao HOA original e aquela dos sinais de som predominantes nao e maior do que a norma quadrada (ou potencia equivalentemente) da representagao HOA original, ou seja
[061] Ao inserir a equagao (18) na equagao (20) pode ser visto que a equagao (20) e equivalente a restrigaoem que I denota a matriz de identidade.
[062] A partir das restrigoes na equagao (18) e em (19) e a partir da compatibilidade das normas euclidianas de matriz e vetor, um limite superior para as magnitudes dos sinais de som predominantes e encontrada por usando equagoes (18), (19) e (11). Portanto, e garantido que os sinais de som predominantes permanecem na mesma faixa que as sequencias de coeficiente HOA originais (comparar equagao (11)), ou seja
Exemplo para escolha de matriz de mistura
[063] Um exemplo de como determinar a matriz de mistura satisfazendo a restrigao (20) e obtido computando os sinais de som predominantes de modo que a Norma euclidiana do residual apos extragao seja minimizada, ou seja
[064] A solugao para o problema de minimizagao na equagao (26) e apresentada por em que indica o Moore-Penrose pseudo-inverso. Pela comparagao de equagao (27) com equagao (18) ocorre que, neste caso, a matriz de mistura e igual ao Moore-Penrose pseudo-inverso da matriz V, ou seja
[065] Nao obstante, matriz V deve ainda ser escolhida para satisfazer a restrigao (19), ou seja
[066] No caso de apenas sinais direcionais, em que matriz V e a matriz de modo com relagao as diregoes de sinal de fonte a restrigao (28) pode ser satisfeita escolhendo as diregoes de sinal de fonte de tal modo que a distancia de quaisquer duas diregoes vizinhas nao seja muito pequena.
Consequencias para a faixa de valor de sequencias de coeficiente do componente HOA ambiente
[067] O componente HOA ambiente e computado pela subtragao a partir da representagao HOA original a representagao HOA dos sinais de som predominantes, ou sejaSe o vetor de sinais de som predominantes x(t) é determinado de acordo com o critério (20), pode ser concluído que
Faixa de valor de sequencias de coeficiente espacialmente transformadas do componente HOA ambiente
[068] Em outro aspecto no processamento da compressao HOA proposta em EP 2743922 A1 e no documento MPEG acima mencionado N14264 e que a primeira das sequências de coeficiente 0MIN do componente HOA ambiente são sempre escolhidas para serem designadas aos canais de transporte, em quesendo tipicamente uma ordem menor do que a da representação HOA original. A fim de descorrelacionar estas sequências de coeficiente HOA, estas podem ser transformadas para sinais de altofalante virtual impingindo a partir de algumas direções pré-definidas(em analogia ao conceito descrito na seção Normalização da representação HOA de entrada).
[069] Definir o vetor de todas as sequencias de coeficiente do component HOA ambiente com indice de ordem(e a matriz de modo com relação às direções virtuaiso vetor de todos os sinais de alto-falante virtual (definido por)é obtido por
[070] Portanto, usando a compatibilidade da matriz Euclideana e normas de vetor,
[071] No documento acima mencionado MPEG N14264 as direções virtuaissão escolhidas de acordo com o artigo acima mencionado Fliege et al.. As respectivas Normas euclidianas do inverso do modo de matrizessão ilustradas na Fig. 4 para ordensPode ser visto que
[072] No entanto, esta nao se mantem em geralem que os valores desão tipicamente muito maiores do que ‘1’. Não obstante, pelo menos paraas amplitudes dos sinais de alto-falante virtual são limitadas por
[073] Ao restringir a representagao HOA de entrada para satisfazer a condigao (6), que requer as amplitudes dos sinais de alto-falante virtual criados a partir desta representação HOA não excede um valor de ‘1’, pode ser garantido que as amplitudes dos sinais antes do controle de ganho não irão exceder o valor(ver equações (25), (34) e (40)) sob as seguintes condições: a) O vetor de todos os sinais de som predominantes x(t) é computado de acordo com a equação/restrições (18), (19) e (20); b) A ordem minima NMIN, que determina o número OMIN das primeiras sequências de coeficiente do componente HOA ambiente ao qual a transformação espacial é aplicada, deve ser menor do que ‘9’, se as posições de alto-falante virtual são aquelas definidas no artigo acima mencionado Fliege et al. são usadas. Pode ser ainda concluído que as amplitudes dos sinais antes do controle de ganho não irão exceder o valorpara qualquer ordem N até uma ordem maximade interesse, ou seja em que
[074] Em particular, pode ser conclufdo a partir da Fig. 3 que se as diregoes de alto-falante virtualpara a transformagao espacial inicial sao assumidas como sendo escolhidas de acordo com a distribuigao no artigo de Fliege et al., e se adicionalmente a ordem maxima de interesse e assumida como sendo (como, por exemplo, no documento MPEG N14264), então as amplitudes dos sinais antes do controle de ganho não excedem o valor 1,50, uma vez queneste caso especial. Ou seja,pode ser selecionado.
[075]é dependente da ordem máxima de interessee as direções de alto-falante virtualque podem ser expressos por
[076] Portanto, o ganho mfnimo aplicado pelo controle de ganho para garantir que os sinais antes da codificagao perceptual estao dentro do intervalo [-1,1] é determinado porem que
[077] No caso de amplitudes dos sinais antes do controle de ganho serem muito pequenas, e proposto no documento MPEG N14264 que e possfvel suavemente amplificar as mesmas com um fator de atéem queé transmitido como informação lateral dentro da representação HOA codificada.
[078] Assim, cada expoente para base ‘2’, descrevendo dentro de uma unidade de acesso para a alteragao de amplitude absoluta total de uma unidade de processamento de controle de ganho modificado a partir do primeiro ate urn quadro atual, pode assumir um valor inteiro dentro do intervalConsequentemente, o número (inteiro menor) βe de bits requerido para codificar este é dado por
[079] No caso de amplitudes dos sinais antes do controle de ganho nao serem muito pequenos, a equagao (42) pode ser simplificada:
[080] Este numero de bits βe pode ser calculado na entrada das etapas de controle de ganho/estagios 15,..., 151.
[081] Usando este numero PE de bits para o expoente garante que todas as alteragoes de amplitude absolutas possfveis causadas pelas unidades de processamento de controle de ganho do compressor HOA 15, 151 possam ser capturadas, permitindo o infcio da descompressao em alguns pontos de entrada predefinidos dentro da representagao comprimida.
[082] Quando iniciando a descompressao da representagao HOA comprimida no descompressor de HOA, os valores de ganho nao diferenciais representando as alteragoes amplitude absolutas totais designadas para a informagao lateral para alguns quadras de dados e recebidos a partir do demultiplexador 21 da corrente de dados recebidasao usadas nas etapas de controle de ganho inverso ou estagios 24,..., 241 para aplicar um controle de ganho correto, em um modo inverso para o processamento que foi realizado em etapas de controle de ganho/estagios 15 151.
Outras Modalidades
[083] Quando implementando um sistema particular de compressao/descompressao HOA como descrito nas segoes de HOA, codificagao de HOA espacial, descompressao de HOA e decodificagao de HOA espacial, a quantidade (3e de bits para a codificagao do expoente deve ser ajustada de acordo com a equagao (42) em dependencia em um fator de escala que por si so e dependente de uma ordem maxima desejada de representagoes HOA a serem comprimidas e determinadas diregoes de alto-falante virtual
[084] Por exemplo, quando assumindo e escolhendo as diregoes de alto-falante virtual de acordo com o artigo de Fliege et al., uma escolha razoável seriaNaquela situação a compressão correta é garantida para representações de ordem N comque são normalizadas de acordo com a seção Normalização da representação HOA de entrada usando as mesmas direções de alto-falante virtual No entanto, esta garantia não pode ser dada no caso de uma representação HOA que é ainda (por razões de eficiência) equivalentemente representada por sinais de alto-falante virtual no formato PCM, mas onde as direções,dos alto-falantes virtuais devem ser escolhidas para serem diferentes das direções do alto-falante virtual assumido no estágio do desenho do sistema.
[085] Devido a esta escolha diferente de posigoes de alto-falante virtual, mesmo embora as amplitudes destes sinais alto-falante virtual estejam dentro do intervalo [1,1 [, este nao pode ser garantido mais do que as amplitudes dos sinais antes do controle de ganho nao irao exceder o valor E, portanto,nao pode ser garantido que esta representagao HOA tem a normalizagao apropriada para a compressao de acordo com o processamento descrito no documento MPEG N14264.
[086] Nesta situação é vantajoso ter um sistema que fornece, com base o conhecimento das posições de alto-falante virtual, a amplitude maximamente permitida dos sinais de alto-falante virtual a fim de garantir a respectiva representação HOA para se apropriada para a compressão de acordo com o processamento descrito no documento MPEG N14264. Na Fig. 5 referido um sistema é ilustrado. É tomado como entrada de posições de alto-falante virtuale fornece como saída a amplitude maximamente permitida (medida em decibéis) dos sinais de alto-falante virtual. Na etapa ou estágio 51 a matriz de modo Ψ com relação às posições de alto-falante virtual é computado de acordo com a equação (3). Em uma etapa seguinte ou estágio 52 a Norma euclidianada matriz de modo é computada. Em uma terceira etapa ou estágio 53 a amplitudeé computada como o mínimo de ‘1’ e o quociente entre o produto da raiz quadrada do número de posições de alto-falante virtual ee a Norma euclidiana da matriz de modo, ou seja
[087] 0 valor em decibeis e obtido
[088] Para explanagao: a partir das derivagoes acima, pode ser visto que se a magnitude das sequencias de coeficiente HOA nao excede um valorou seja se todos os sinais antes das unidades de processamento de controle de ganho 15, 151 nao irao, por conseguinte, exceder este valor, que e o requisito para uma compressao HOA apropriada.
[089] A partir da equagao (9) e demonstrada que a magnitude das sequencias de coeficiente HOA e limitada por
[090] Consequentemente, se e ajustado de acordo com a equagao (43) e os sinais de alto-falante virtual em formato PCM satisfazemesta segue a partir da equação (7) que e que o requisito (45) e satisfeito. Ou seja, o valor de magnitude maximo de T na equagao (6) e substitufdo por valor de magnitude maximo na equagao (47).
Basicos de ambissonicos de ordem superior
[091] Ambissonicos de ordem superior (HOA) e baseado na descrigao de um campo de som dentro de uma area compacta de interesse, que e assumida como sendo livre de fontes de som. Naquele caso o comportamento espago-temporal da pressao de som no tempo t e posigao x dentro da area de interesse e fisicamente totalmente determinado pela equagao de onda homogenea. No seguinte um sistema de coordenada esferica como mostrado na Fig. 6 e assumido. No sistema de coordenadas usado os pontos do eixo x para a posição frontal, os pontos de eixo y para a esquerda, e os pontos do eixo z para o topo. Uma posição no espaçoé representado por um raio(ou seja, a distância para a origem de coordenada), um ângulo de inclinaçãomedido a partir de eixo polar z e um ângulo azimutemedido no sentido anti-horário no plano x- y a partir do eixo x. Ainda,denota a transposição.
[092] Entao, pode ser mostrado a partir do livro "Fourier Acoustics” que a transformada de Fourier da pressao de som com relagao ao tempo denotado porou sejacom ω denotando frequência angular e i indicando a unidade imaginária, pode ser expandida na série de harmônicas esféricas de acordo comem que Cs enota a velocidade do som e k denota o número de onda angular, que é relacionado com a frequência angular ω pordenota as funções de Bessel esféricas de primeiro tipo edenota as harmônicas esféricas valoradas de ordem n e grau m, que são definidas na seção Definição de harmônicas esféricas valoradas reais. Os coeficientes de expansãoapenas dependem do número de onda angular k. Notar que foi implicitamente assumido que a pressão de som é espacialmente limitada pela banda. Assim, a série é truncada com relação ao índice de ordem n em um limite superior N, que é chamada a ordem da representação HOA.
[093] Se o campo de som e representado por uma superposigao de um numero infinito de ondas planas harmonicas de diferentes frequencias angulares ω chegando a partir de todas as possfveis diregoes especificadas pelo angulo tuplopode ser mostrado (ver B. Rafaely, "Plane-wave decomposition of the sound field on a sphere by spherical convolution", J. Acoust. Soc. Am., vol.4 (116), pages 2149-2157, October 2004) que a função de amplitude complexa de onda plana respectivepode ser expressa pela seguinte expansão harmônica esféricaem que os coeficientes de expansãoestão relacionados com os coeficientes de expansãopor
[094] Assumindo os coeficientes individuals' para serem as funções da frequência angular ω, a aplicação da transformada de Fourier inversa (denotadas por) fornece funções de domínio de tempo para cada ordem n e grau m. estas fungoes de dominio de tempo sao referenciadas como sequencias de coeficiente HOA de tempo contfnuo aqui, que podem ser coletadas em um vetor unico c(t) por
[095] 0 fndice de posigao de uma sequencia de coeficiente HOAdentro do vetor c(t) é dado porO número geral de elementos no vetor c(t) é dado por
[096] O formato final de ambissonica fornece a versao amostrada de c(t) usando uma frequencia de amostragem fs comem quedenota o período de amostragem. Os elementos de são referenciados como sequências de coeficiente HOA de tempo discreto, que podem ser mostrado como sempre serem real-valorados. Esta propriedade também mantém as versões de tempo contínuo
Definiiçao de harmonica esferica valorada
[097] A harmonica esferica real-valorada(assumindo normalizagao SN3D de acordo com J. Daniel, "Representation de champs acoustiques, application a la transmission et a la reproduction de scenes sonores complexes dans un contexte multimedia", PhD thesis, Universite Paris, 6, 2001, chapter 3.1) são dadas porcom
[098] As fungoes de Legendre associadassão definidas comocomo a polinomial de Legendree, diferente em E.G. Williams, "Fourier Acoustics", vol.93 of Applied Mathematical Sciences, Academic Press, 1999, sem o fim de fase Condon-Shortley
[099] O processamento inventivo pode ser realizado por um unico processador ou circuito eletronico, ou por varios processadores ou circuitos eletronicos operando em paralelo e/ou operando em diferentes partes do processamento inventivo.
[0100] As instrugoes para operar o processador ou os processadores podem ser armazenadas em uma ou mais memorias.

Claims (4)

1. Metodo de decodificar uma representagao de som Ambissonico de Ordem Mais Alta (HOA) comprimida de um som ou campo de som, o metodo CARACTERIZADO por compreender: receber um fluxo de bits que contem a representagao de som HOA comprimida; e decodificar a representagao de HOA comprimida com base em um numero inteiro mais baixo βe, em que o numero inteiro mais baixo βe e determinado com base em ( , em que em que N e uma ordem da representagao de som HOA comprimida, em que NMAX e uma ordem de interesse maxima da representagao de som HOA comprimida, em que sao diregoes dos auto-falantes virtuais para renderizagao da representagao de som HOA comprimida, em que , e em que K e uma proporgao de uma norma Euclidiana quadrada de uma matriz de modo de posigoes de alto-falante virtual e O, em que pelo menos um valor de ganho nao diferencial (2e) associado com a representagao de som HOA e transferido como informagao lateral em um fluxo de bits, e em que o ganho nao diferencial e representado por βe bits.
2. Meio de armazenamento legfvel por computador nao-transitorio, CARACTERIZADO pelo fato de que contem instrugoes que quando executadas por um processador, executam um metodo conforme definido na reivindicagao 1.
3. Aparelho para decodificar uma representagao de som Ambissonico de Ordem Mais Alta (HOA) comprimida de um som ou campo de som, o aparelho CARACTERIZADO por compreender: um recebedor para receber um fluxo de bits que contem a representagao de som HOA comprimida, e um decodificador para decodificar a representagao de som HOA comprimida com base em um numero inteiro mais baixo βe, em que o numero inteiro mais baixo βe e determinado com base em em que em que N e a ordem da representagao de som HOA comprimida, em que NMAX e uma ordem de interesse maxima da representagao de som HOA comprimida, em que sao diregoes dos auto-falantes virtuais para renderizagao da representagao de som HOA comprimida, em que , e em que K e uma proporgao de uma norma Euclidiana quadrada 2 de uma matriz de modo de posigoes de alto-falante virtual e O, em que pelo menos um valor de ganho nao diferencial (2e) associado com a representagao de som HOA e transferido como informagao lateral em um fluxo de bits, e em que o ganho nao diferencial e representado por βe bits.
4. Metodo de decodificar uma representagao de som Ambissonico de Ordem Mais Alta (HOA) comprimida de um som ou campo de som, o metodo CARACTERIZADO por compreender: receber um fluxo de bits que contem a representagao de som HOA comprimida e decodificar a representagao HOA comprimida para determinar sinais perceptualmente decodificados pelo menos um expoente de corregao de ganho associado e pelo menos um sinalizador de excegao de corregao de ganho ; determinar quadras de sinal corrigidos por ganho com base no processamento de controle de ganho inverso dos sinais perceptualmente decodificados o expoente de corregao de ganho associado e o sinalizador de excegao de corregao de ganho redistribuir os quadras de sinal corrigidos por ganho a fjm (je determinar um quadra de sinais de som predominantes x(t)e um quadra de componentes HOA de ambiente intermediary.
BR122023009299-6A 2014-06-27 2015-06-22 Método e aparelho para determinar para a compressão de uma representação de quadro de dados hoa um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais BR122023009299B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP14306023.4 2014-06-27
EP14306023.4A EP2960903A1 (en) 2014-06-27 2014-06-27 Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
PCT/EP2015/063912 WO2015197512A1 (en) 2014-06-27 2015-06-22 Method and apparatus for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values
BR112016029978-7A BR112016029978B1 (pt) 2014-06-27 2015-06-22 Método para determinar para a compressão de uma representação de quadro de dados hoa um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais

Publications (1)

Publication Number Publication Date
BR122023009299B1 true BR122023009299B1 (pt) 2023-12-26

Family

ID=51178839

Family Applications (2)

Application Number Title Priority Date Filing Date
BR122023009299-6A BR122023009299B1 (pt) 2014-06-27 2015-06-22 Método e aparelho para determinar para a compressão de uma representação de quadro de dados hoa um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais
BR122022022357-5A BR122022022357B1 (pt) 2014-06-27 2015-06-22 Método e aparelho para determinar para a compressão de uma representação de quadro de dados hoa

Family Applications After (1)

Application Number Title Priority Date Filing Date
BR122022022357-5A BR122022022357B1 (pt) 2014-06-27 2015-06-22 Método e aparelho para determinar para a compressão de uma representação de quadro de dados hoa

Country Status (9)

Country Link
US (4) US10236003B2 (pt)
EP (3) EP2960903A1 (pt)
JP (3) JP6567571B2 (pt)
KR (3) KR102568636B1 (pt)
CN (4) CN112908349A (pt)
BR (2) BR122023009299B1 (pt)
RU (1) RU2725602C9 (pt)
TW (3) TWI689916B (pt)
WO (1) WO2015197512A1 (pt)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113793618A (zh) * 2014-06-27 2021-12-14 杜比国际公司 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法
CN112216292A (zh) 2014-06-27 2021-01-12 杜比国际公司 声音或声场的压缩hoa声音表示的解码方法和装置
EP2960903A1 (en) * 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
DE102016104665A1 (de) * 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
WO2019035622A1 (ko) * 2017-08-17 2019-02-21 가우디오디오랩 주식회사 앰비소닉 신호를 사용하는 오디오 신호 처리 방법 및 장치
IL289261B1 (en) * 2019-07-02 2024-03-01 Dolby Int Ab Methods, devices and systems for displaying, encoding and interpreting discontinuous directional data

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5757927A (en) 1992-03-02 1998-05-26 Trifield Productions Ltd. Surround sound apparatus
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
SE522453C2 (sv) 2000-02-28 2004-02-10 Scania Cv Ab Sätt och anordning för styrning av ett mekaniskt tillsatsaggregat i ett motorfordon
CN1677492A (zh) 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
CN101124740B (zh) 2005-02-23 2012-05-30 艾利森电话股份有限公司 多声道音频信号编码和解码的方法和装置和音频传送系统
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US7848280B2 (en) * 2007-06-15 2010-12-07 Telefonaktiebolaget L M Ericsson (Publ) Tunnel overhead reduction
WO2009001874A1 (ja) 2007-06-27 2008-12-31 Nec Corporation オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム
US9100768B2 (en) 2010-03-26 2015-08-04 Thomson Licensing Method and device for decoding an audio soundfield representation for audio playback
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
EP2541547A1 (en) 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
EP2637427A1 (en) * 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9161149B2 (en) * 2012-05-24 2015-10-13 Qualcomm Incorporated Three-dimensional sound compression and over-the-air transmission during a call
EP2688066A1 (en) 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
EP2743922A1 (en) * 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US20140358565A1 (en) * 2013-05-29 2014-12-04 Qualcomm Incorporated Compression of decomposed representations of a sound field
EP2824661A1 (en) 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
DE102013223201B3 (de) * 2013-11-14 2015-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
US10412522B2 (en) * 2014-03-21 2019-09-10 Qualcomm Incorporated Inserting audio channels into descriptions of soundfields
EP2960903A1 (en) * 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
KR20240050436A (ko) * 2014-06-27 2024-04-18 돌비 인터네셔널 에이비 Hoa 데이터 프레임 표현의 압축을 위해 비차분 이득 값들을 표현하는 데 필요하게 되는 비트들의 최저 정수 개수를 결정하는 장치
CN112216292A (zh) * 2014-06-27 2021-01-12 杜比国际公司 声音或声场的压缩hoa声音表示的解码方法和装置
CN113793618A (zh) * 2014-06-27 2021-12-14 杜比国际公司 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法

Also Published As

Publication number Publication date
JP2021103337A (ja) 2021-07-15
US10872612B2 (en) 2020-12-22
KR102568636B1 (ko) 2023-08-22
RU2020115874A (ru) 2020-06-18
JP2019185065A (ja) 2019-10-24
TWI749471B (zh) 2021-12-11
BR112016029978A2 (pt) 2017-08-22
EP2960903A1 (en) 2015-12-30
KR20170023017A (ko) 2017-03-02
CN112908348A (zh) 2021-06-04
JP2017523456A (ja) 2017-08-17
KR20230124763A (ko) 2023-08-25
US11875803B2 (en) 2024-01-16
KR102428370B1 (ko) 2022-08-02
JP6567571B2 (ja) 2019-08-28
TWI820530B (zh) 2023-11-01
RU2725602C9 (ru) 2020-08-28
RU2016151121A (ru) 2018-06-26
TW201603000A (zh) 2016-01-16
CN112951254A (zh) 2021-06-11
EP3809409A1 (en) 2021-04-21
CN112908349A (zh) 2021-06-04
US10236003B2 (en) 2019-03-19
RU2725602C2 (ru) 2020-07-02
US20190214027A1 (en) 2019-07-11
US20170133020A1 (en) 2017-05-11
US20210193156A1 (en) 2021-06-24
EP3161820A1 (en) 2017-05-03
BR122018012705A2 (pt) 2017-08-22
CN106471580B (zh) 2021-03-05
EP3161820B1 (en) 2020-11-18
TW202105364A (zh) 2021-02-01
US11322165B2 (en) 2022-05-03
TWI689916B (zh) 2020-04-01
US20220270620A1 (en) 2022-08-25
WO2015197512A1 (en) 2015-12-30
JP6869296B2 (ja) 2021-05-12
RU2016151121A3 (pt) 2019-02-07
CN112908348B (zh) 2022-07-15
TW202238566A (zh) 2022-10-01
KR20220110615A (ko) 2022-08-08
BR122018012705A8 (pt) 2022-09-13
CN106471580A (zh) 2017-03-01
BR122022022357B1 (pt) 2024-01-16

Similar Documents

Publication Publication Date Title
US10580426B2 (en) Method for decoding a higher order ambisonics (HOA) representation of a sound or soundfield
JP7423585B2 (ja) Hoaデータ・フレーム表現のデータ・フレームの個々のもののチャネル信号に関連付けられた非差分的な利得値を含む符号化されたhoaデータ・フレーム表現
BR122023009299B1 (pt) Método e aparelho para determinar para a compressão de uma representação de quadro de dados hoa um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais
EP3161821B1 (en) Method for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values
BR122018012705B1 (pt) Método e aparelho de decodificar uma representação de som ambissônico de ordem mais alta (hoa) comprimida
BR112016029978B1 (pt) Método para determinar para a compressão de uma representação de quadro de dados hoa um número inteiro mais baixo de bits requeridos para representar valores de ganho não diferenciais
BR122022022350B1 (pt) Aparelho para determinar para a compressão de uma representação de quadro de dados hoa
TW202418268A (zh) 用於將聲音或聲場的高階保真立體音響(hoa)表示予以解碼的方法及裝置
TW202420294A (zh) 用於解碼聲音或聲場的高階保真立體音響(hoa)表示的方法

Legal Events

Date Code Title Description
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 22/06/2015, OBSERVADAS AS CONDICOES LEGAIS