BR112012024528B1 - método e dispositivo para decodificar uma representação para campo de som de áudio para reprodução de áudio e meio legível por computador - Google Patents

método e dispositivo para decodificar uma representação para campo de som de áudio para reprodução de áudio e meio legível por computador Download PDF

Info

Publication number
BR112012024528B1
BR112012024528B1 BR112012024528-7A BR112012024528A BR112012024528B1 BR 112012024528 B1 BR112012024528 B1 BR 112012024528B1 BR 112012024528 A BR112012024528 A BR 112012024528A BR 112012024528 B1 BR112012024528 B1 BR 112012024528B1
Authority
BR
Brazil
Prior art keywords
decoding
matrix
sound field
representation
speakers
Prior art date
Application number
BR112012024528-7A
Other languages
English (en)
Other versions
BR112012024528A2 (pt
BR112012024528A8 (pt
Inventor
Johann-Markus Batke
Florian Keiler
Johannes Boehm
Original Assignee
Dolby International Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International Ab filed Critical Dolby International Ab
Priority to BR122020001822-4A priority Critical patent/BR122020001822B1/pt
Publication of BR112012024528A2 publication Critical patent/BR112012024528A2/pt
Publication of BR112012024528A8 publication Critical patent/BR112012024528A8/pt
Publication of BR112012024528B1 publication Critical patent/BR112012024528B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Abstract

MÉTODO E DISPOSITIVO PARA DECODIFICAR UMA REPRESENTAÇÃO PARA CAMPO DE SOM DE ÁUDIO PARA REPRODUÇÃO DE ÁUDIO. A presente invenção se refere a sinais de campo de som tais como, por exemplo, Ambisonics que portam a representação de um campo de som desejado. O formato Ambisonics é baseado em decomposição harmônica esférica do campo de som, e Ambisonics de Ordem Mais Elevada (HOA) usa harmônicas esféricas de pelo menos segunda ordem. Entretanto, a configuração comumente usada dos altos-falantes são irregulares e levam a problemas na configuração do decodificador. Um método aprimorado para decodificar uma representação do decodificador. Um método aprimorado para decodificar uma representação para campo de som de áudio para reprodução de áudio compreende calcular (110) a função de ação panorâmica (W) usando um método geométrico baseado nas posições da pluralidade de alto-falantes e uma pluralidade de direções de fonte, calcular (120) a matriz de modo (equivalente) a partir das posições de alto-falante, calcular (130) a matriz de modo pseudo-inversa (equivalente+) e decodificar (140) a representação para campo de som de áudio. A decodificação é baseada na matriz de decodificação (D) que é obtida a partir da função de ação panorâmica (W) e na matriz de modo pseudo- inversa (...).

Description

Campo da invenção
[0001] A presente invenção se refere a um método e um dispositivo para decodificar uma representação para campo de som de áudio, e em particular uma representação de áudio Ambisonics formatada, para reprodução de áudio.
Antecedentes
[0002] A presente seção pretende introduzir ao leitor os diversos aspectos da técnica, que podem estar relacionados aos diversos aspectos da presente invenção que são descritos e/ou reivindicados abaixo. Acredita-se que a presente discussão seja útil em proporcionar ao leitor com informação de antecedentes para facilitar um melhor entendimento dos diversos aspectos da presente invenção. Assim, deve ser entendido que as referidas determinações devem ser lidas na luz, e não como admissões da técnica anterior, a não ser que uma fonte seja expressamente mencionada.
[0003] A localização precisa é um objetivo chave para qualquer sistema espacial de reprodução de áudio. Os referidos sistemas de reprodução são altamente aplicáveis para sistemas de conferencia, jogos, ou outros ambientes virtuais que se beneficiam do som 3D. Cenas de som em 3D podem ser sintetizadas ou capturadas como um campo de som natural. Sinais de campo de som tais como, por exemplo, Ambisonics portam uma representação de um campo de som desejado. O formato Ambisonics é baseado em decomposição harmônica esférica do campo de som. Embora o formato Ambisonics básico ou formato-B usem harmônicas esféricas de ordem zero e uma, a assim chamada Ambisonics de Ordem Mais Elevada (HOA) usa também harmônicas esféricas adicionais de pelo menos segunda ordem. Um processo de decodificação é necessário para obter os sinais individuais de alto-falante. Para sintetizar cenas de áudio, funções de ação panorâmica que se referem ao arranjo espacial de alto-falante, são necessárias para se obter uma localização espacial da determinada fonte de som. Se um campo de som natural tiver que ser registrado, estruturas de microfones são necessárias para capturar a informação espacial. A abordagem conhecida Ambisonics é uma ferramenta bem adequada para realizar isto. Sinais formatados Ambisonics portam uma representação do campo de som desejado. Um processo de decodificação é necessário para se obter os sinais individuais de alto-falante a partir dos referidos sinais formatados Ambisonics. Uma vez também neste caso as funções de ação panorâmica podem ser derivadas a partir das funções de decodificação, as funções de ação panorâmica são o item chave para descrever a tarefa de localização espacial. O arranjo espacial de alto- falantes é referido aqui como a configuração do alto-falante.
[0004] Configurações dos alto-falantes comumente usadas são as configurações de estéreo, que empregam dois alto-falantes, a configuração surround padrão usando cinco alto-falantes, e extensões da configuração surround usando mais do que cinco alto-falantes. As referidas configurações são bem conhecidas. Entretanto, as mesmas são restritas a duas dimensões (2D), por exemplo, sem informação de altura é reproduzida.
[0005] A configuração dos alto-falantes para reprodução tridimensional (3D) é descrita, por exemplo, em "Wide listening area with exceptional spatial sound quality of a 22.2 multichannel sound system", K. Hamasaki, T. Nishiguchi, R. Okumaura, e Y. Nakayama in Audio Engineering Society Preprints, Vienna, Austria, Maio de 2007, que é uma proposta para a TV de ultra alta definição NHK com formato 22.2, ou o arranjo 2+2+2 de Dabringhaus (mdg-musikproduktion dabringhaus und grimm, www.mdg.de) e uma configuração 10.2 em "Sound for Film and Television", T. Holman em 2nd ed. Boston: Focal Press, 2002. Um dos poucos sistemas conhecidos que se referem a estratégias de reprodução espacial e ação panorâmica é a abordagem de Ação Panorâmica de Amplitude com Base em Vetor (VBAP) em "Virtual sound source positioning using vector base amplitude panning", Journal of Audio Engineering Society, vol. 45, no. 6, pp. 456466, Junho de 1997, aqui Pulkki. VBAP (Vector Based Amplitude Panning) que foi usada por Pulkki para reproduzir sons acústicos virtuais com uma configuração arbitrária do alto-falante. Para se dispor uma fonte virtual em um plano 2D, um par de alto-falantes é necessário, enquanto que em um caso de 3D um grupo de três alto- falantes são necessários. Para cada fonte virtual, um sinal monofônico com diferentes ganhos (dependente da posição da fonte virtual) é alimentado para os alto-falantes selecionados a partir da configuração completa. Os sinais de alto-falante para todas as fontes virtuais são então somados. A VBAP aplica uma abordagem geométrica para calcular os ganhos dos sinais de alto-falante para a ação panorâmica entre os alto-falantes.
[0006] Uma configuração 3D exemplificativa do exemplo de alto- falante considerado e recém-proposta aqui tem 16 alto-falantes, que são posicionados como mostrado na figura 2. O posicionamento foi escolhido em virtude de considerações práticas, tendo quatro colunas com três alto-falantes cada e alto-falantes adicionais entre as referidas colunas. Em mais detalhes, oito dos alto-falantes são igualmente distribuídos em um círculo em torno da cabeça do ouvinte, encerrando ângulos de 45 graus. Quatro alto-falantes adicionais são localizados na parte de topo e na parte de fundo, encerrando ângulos de azimute de 90 graus. Com relação a Ambisonics, a referida configuração é irregular e ocasiona problemas na configuração do decodificador, como mencionado em "An ambisonics format for flexible reproduction layouts", por H. Pomberger e F. Zotter em Proceedings of the 1st Ambisonics Symposium, Graz, Austria, Julho de 2009.
[0007] Decodificação convencional de Ambisonics, como descrito em "Three-dimensional surround sound systems based on spherical harmonics" por M. Poletti em J. Audio Eng. Soc, vol. 53, no. 11, pp. 1004 - 1025, Novembro de 2005, emprega o processo de correspondência de modo comumente conhecido. Os modos são descritos pelos vetores de modo que contêm valores das harmônicas esféricas para uma direção distinta de incidência. A combinação de todas as direções dadas pelos alto-falantes individuais leva à matriz de modo da configuração do alto-falante, de modo que a matriz de modo representa as posições de alto-falante. Para reproduzir o modo de um sinal de fonte distinta, os modos dos alto-falantes são pesados em tal modo que os modos superpostos dos alto-falantes individuais se somam ao modo desejado. Para obter os pesos necessários, uma representação de matriz inversa da matriz de modo de alto-falante precisa ser calculada. Em termos de decodificação de sinal, os pesos formam o sinal de direcionamento dos alto-falantes, e a matriz inversa de modo de alto-falante é referida como "matriz de decodificação", que é aplicada para decodificar uma representação de sinal formatado de Ambisonics. Em particular, para muitas configurações dos alto- falantes, por exemplo, a configuração mostrada na figura 2, é difícil de obter o inverso da matriz de modo.
[0008] Como mencionado acima, a configuração comumente usada dos alto-falantes é restrita a 2D, isto é, nenhuma informação de altura é reproduzida. Decodificar uma representação de campo de som para uma configuração do alto-falante com distribuição espacial matematicamente não regular leva à problemas de localização e coloração com as técnicas comumente conhecidas. Para decodificar um sinal Ambisonics, a matriz de decodificação (isto é, uma matriz de coeficientes de decodificação) é usada. Na decodificação convencional de sinais Ambisonics, e particularmente sinais HOA, pelo menos dois problemas ocorrem. Primeiro, para corrigir a decodificação é necessário se conhecer as direções de fonte de sinal para obter a matriz de decodificação. Segundo, o mapeamento a uma configuração existente do alto-falante é sistematicamente errada em virtude do problema matemático a seguir: uma decodificação matematicamente correta resultará em não só em amplitudes alto-falante positivas, mas também em algumas negativas. Entretanto, as referidas são erroneamente reproduzidas como sinais positivos, assim conduzindo aos problemas acima mencionados.
Sumário da Invenção
[0009] A presente invenção descreve um método para decodificar uma representação de um campo de som para as distribuições espaciais não regulares com propriedades de localização e coloração altamente aprimoradas. Isto representa outro modo de se obter uma matriz de decodificação para os dados de campo de som, por exemplo, em formato Ambisonics, e emprega um processo em um modo de estimativa de sistema. Considerando um conjunto de possíveis direções de incidência, as funções de ação panorâmica relacionadas aos alto-falantes desejados são calculadas. As funções de ação panorâmica são tomadas como resultado de um processo de decodificação Ambisonics. O necessário sinal de entrada é uma matriz de modo de todas as direções consideradas. Portanto, como mostrado abaixo, a matriz de decodificação é obtida por multiplicar a matriz de ponderação por uma versão inversa da matriz de modo dos sinais de entrada.
[00010] Com relação ao segundo problema mencionado acima, foi observado que é também possível se obter a matriz de decodificação a partir do inverso da assim chamada matriz de modo, o que representa as posições de alto-falante, e funções de ponderação dependente de posição ("funções de ação panorâmica") W. um aspecto da presente invenção é que as referidas funções de ação panorâmica W podem ser derivadas usando a diferente método do que o comumente usado. Vantajosamente, um simples método geométrico é usado. O referido método não requer nenhum conhecimento de qualquer direção de fonte de sinal, assim solucionando o primeiro problema mencionado acima. O referido método é conhecido como "Ação Panorâmica de Amplitude com Base em Vetor" (VBAP). De acordo com a presente invenção, VBAP é usado para calcular as necessárias funções de ação panorâmica, que são então usadas para calcular a matriz de decodificação Ambisonics. Outro problema ocorre em que o inverso da matriz de modo (que representa a configuração do alto-falante) é necessário. Entretanto, o inverso exato é difícil de obter, que também leva a uma errada reprodução de áudio. Assim, um aspecto adicional é que para obter a matriz de decodificação uma pseudo matriz de modo inversa é calculada, que é muito mais fácil de obter.
[00011] A presente invenção usa uma abordagem de duas etapas. A primeira etapa é uma derivação das funções de ação panorâmica que são dependentes da configuração do alto-falante usada para reprodução. Na segunda etapa, uma matriz de decodificação Ambisonics é computada a partir das referidas funções de ação panorâmica para todos os alto-falantes.
[00012] Uma vantagem da presente invenção é que nenhuma descrição paramétrica das fontes de som é necessária; em vez disso, uma descrição de campo de som tal como Ambisonics pode ser usada.
[00013] De acordo com a presente invenção, um método para decodificar uma representação para campo de som de áudio para reprodução de áudio compreende etapas de etapas de calcular, para cada de uma da pluralidade de alto-falantes, a função de ação panorâmica usando um método geométrico baseado nas posições dos alto-falantes e na pluralidade de direções de fonte, calcular a matriz de modo a partir das direções de fonte, calcular a matriz de modo pseudo-inversa da matriz de modo, e decodificar a representação para campo de som de áudio, em que a decodificação é baseada em uma matriz de decodificação que é obtida a partir pelo menos da função de ação panorâmica e da matriz de modo pseudo-inversa.
[00014] De acordo com outro aspecto, um dispositivo para decodificar uma representação para campo de som de áudio para reprodução de áudio compreende primeiros meios de cálculo para calcular, para cada uma da pluralidade de alto-falantes, a função de ação panorâmica usando um método geométrico baseado nas posições dos alto-falantes e na pluralidade de direções de fonte, segundos meios de cálculo para calcular a matriz de modo a partir das direções de fonte, terceiros meios de cálculo para calcular a matriz de modo pseudo-inversa da matriz de modo, e meios de decodificação para decodificar a representação de campo de som, em que a decodificação é baseada na matriz de decodificação e os meios de decodificação usam pelo menos a função de ação panorâmica e a matriz de modo pseudo-inversa para obter a matriz de decodificação. Os primeiro, segundo e terceiro meios de cálculo podem ser um único processador ou dois ou mais processadores separados.
[00015] De acordo com ainda outro aspecto, um meio capaz de ser lido por computador tem armazenado no mesmo instruções executáveis para fazer com que um computador implemente um método para decodificar uma representação para campo de som de áudio para reprodução de áudio compreende etapas de calcular, para cada uma da pluralidade de alto-falantes, a função de ação panorâmica usando um método geométrico baseado nas posições dos alto-falantes e na pluralidade de direções de fonte, calcular a matriz de modo a partir das direções de fonte, calcular a pseudo-inversa da matriz de modo, e decodificar a representação para campo de som de áudio, em que a decodificação é baseada na matriz de decodificação que é obtida a partir de pelo menos a função de ação panorâmica e a matriz de modo pseudo-inversa.
[00016] Modalidades vantajosas da presente invenção são descritas nas concretizações, na descrição a seguir e nas figuras.
Breve Descrição dos Desenhos
[00017] Modalidades exemplificativas da presente invenção são descritas com referência aos desenhos anexos, que mostram: A figura 1 é um gráfico de fluxo do método; A figura 2 é uma configuração em 3D exemplificativa com 16 alto-falantes; A figura 3 é um padrão de feixes resultante da decodi- ficação usando modo de correspondência não regularizado; A figura 4 é um padrão de feixes resultante da decodi- ficação usando uma matriz de modo regularizado; A figura 5 é um padrão de feixes resultante da decodi- ficação usando a matriz de decodificação derivada a partir de VBAP; A figura 6 é um resultado de um teste de escuta; e A figura 7 é um diagrama de bloco de um dispositivo.
Descrição detalhada da presente invenção
[00018] Como mostrado na figura1, um método para decodificar uma representação para campo de som de áudio SFc para reprodução de áudio compreende etapas de calcular 110, para cada uma da pluralidade de alto-falantes, a função de ação panorâmica W usando um método geométrico baseado nas posições 102 dos alto-falantes (L é o número de alto-falantes) e a pluralidade de direções de fonte 103 (S é o número de direções de fonte), calcular 120 a matriz de modo Ξa partir das direções de fonte e uma determinada ordem N da representação de campo de som, calcular 130 a matriz de modo pseudo-inversa Ξ+ da matriz de modo Ξ, e decodificar 135, 140 a representação para campo de som de áudio SFC. Em que os dados de som decodificados AUdec são obtidos. A decodificação é baseada na matriz de decodificação D que é obtida 135 a partir de pelo menos a função de ação panorâmica W e a matriz de modo pseudo-inversa Ξ+. Em uma modalidade, a matriz de modo pseudo-inversa é obtida de acordo com Ξ+ = ΞH [ΞΞH]-1 . A ordem N da representação de campo de som pode ser pré-definida, ou a mesma pode ser extraída 105 a partir do sinal de entrada SFC.
[00019] Como mostrado na figura 7, um dispositivo para decodificar uma representação para campo de som de áudio para reprodução de áudio compreende primeiros meios de cálculo 210 para calcular, para cada uma da pluralidade de alto-falantes, a função de ação panorâmica W usando um método geométrico baseado nas posições 102 dos alto-falantes e a pluralidade de direções de fonte 103, segundos meios de cálculo 220 para calcular a matriz de modo Ξ a partir das direções de fonte, terceiros meios de cálculo 230 para calcular a matriz de modo pseudo-inversa Ξ+ da matriz de modo Ξ , e meios de decodificação 240 para decodificar a representação de campo de som. A decodificação é baseada na matriz de decodificação D, que é obtida a partir pelo menos da função de ação panorâmica W e da matriz de modo pseudo-inversa Ξ+ pela matriz de decodificação calcular meios 235 (por exemplo, um multiplicador). Os meios de decodificação 240 usam a matriz de decodificação D para obter um sinal de áudio decodificado AUdec- Os primeiro, segundo e terceiro meios de cálculo 220, 230, 240 podem ser um único processador, ou dois ou mais processadores separados. A ordem N da representação de campo de som pode ser predefinida, ou a mesma pode ser obtida pelos meios 205 para extrair a ordem a partir do sinal de entrada SFC.
[00020] Uma configuração 3D particularmente útil do alto-falante tem 16 alto-falantes. Como mostrado na figura2, há quatro colunas com três alto-falantes cada, e alto-falantes adicionais entre as referidas colunas. Oito dos alto-falantes são igualmente distribuídos em um círculo em torno da cabeça do ouvinte, encerrando ângulos de 45 graus. Quatro alto-falantes adicionais são localizados na parte de cima e na parte de baixo, encerrando ângulos de azimute de 90 graus. Com relação a Ambisonics, a referida configuração é irregular e em geral leva a problemas na configuração do decodificador.
[00021] No a seguir, a Ação Panorâmica de Amplitude com Base em Vetor (VBAP) é descrita em detalhes. Em uma modalidade, VBAP é usada aqui para dispor fontes acústicas virtuais com uma configuração arbitrária do alto-falante onde a mesma distância dos alto-falantes a partir da posição de escuta é assumida. VBAP usa três alto-falantes para dispor a fonte virtual no espaço 3D. Para cada fonte virtual, um sinal monofônico com diferentes ganhos é alimentado aos alto-falantes a ser usado. Os ganhos para os diferentes alto-falantes são dependentes da posição da fonte virtual. VBAP é a abordagem geométrica para calcular os ganhos dos sinais de alto-falante para a ação panorâmica entre os alto-falantes. No caso de 3D, três alto- falantes arranjados em um triângulo constrói uma base de vetor. Cada base de vetor é identificada pelos números do alto-falante k, m, n e os vetores de posição do alto-falante lk, lm, ln dados em coordenadas cartesianas normalizadas ao comprimento de unidade. A base de vetor para os alto-falantes k, m, n é definida por
Figure img0001
[00022] A direção desejada Ω = (θ, Φ) da fonte virtual tem que ser dada como um ângulo de azimute Φ e ângulo de inclinação Θ. O vetor de posição de comprimento de unidade p(Ω) da fonte virtual em coordenadas cartesianas é portanto definido por
Figure img0002
A posição da fonte virtual pode ser representada com a base de vetor e os fatores de ganho g(Ω) = ( ~gk, ~gm, ~gn)T por
Figure img0003
Ao inverter a base da matriz de vetor os fatores de ganho necessários podem ser computados por
Figure img0004
[00023] A base de vetor a ser usada é determinada de acordo com o documento de Pulkki: Primeiro os ganhos são calculados de acordo com Pulkki para todos as bases de vetores. Então para cada base de vetor o mínimo sobre os fatores de ganho é avaliado por ~gmin = min {~gk, ~gm, ~gn}. Finalmente a base de vetor onde ~gmin tem o valor mais alto é usada. Os fatores de ganho resultantes não devem ser negativos. Dependendo da acústica do ambiente de escura os fatores de ganho podem ser normalizados para preservação de energia.
[00024] No a seguir, o formato Ambisonics é descrito, que é um formato de campo de som exemplificativo. A representação Ambisonics é uma descrição do método de campo de som empregando uma aproximação matemática do campo de som em um local. Ao se usar o sistema de coordenada esférica, a pressão no ponto r = (r, θ, Φ) no espaço é descrita por meios da transformada esférica de Fourier
Figure img0005
onde k é o número de onda. Normalmente n vai a uma ordem finita M. Os coeficientes Amn(k) da série descreve o campo de som (assumindo fontes fora da região de validade), jn(kr) é a função esférica de Bessel de primeiro tipo e Ymn (θ, Φ) denota as harmônicas esféricas. Coeficientes Amn (k) são observados como coeficientes Ambisonics no presente contexto. As harmônicas esféricas Ym n (θ, Φ) dependem apenas da inclinação e ângulos de azimute e descrevem uma função na esfera de unidade.
[00025] Por razões de simplicidade com frequência ondas planas são assumidas para reprodução do campo de som. Os coeficientes Ambisonics descrevendo uma onda plana como uma fonte acústica a partir da direção Q5 são
Figure img0006
[00026] A dependência das mesmas no número de onda k diminui para uma pura dependência direcional neste caso especial. Para uma ordem M limitada os coeficientes formam um vetor A que pode ser arranjado como
Figure img0007
mantendo O = (M + 1 )2 elementos. O mesmo arranjo é usado para os coeficientes de harmônicas esféricas produzindo um vetor
Figure img0008
[00027] O sobrescrito H denota a transposição conjugada complexa.
[00028] Para calcular os sinais de alto-falante a partir de umarepresentação Ambisonics de um campo de som, a correspondência de modo é uma abordagem comumente usada. A ideia básica é de expressar uma determinada descrição Ambisonics de campo de som A(Ω5) por uma soma pesada das descrições dos campos de som dos alto-falantes A(Ω|)
Figure img0009
onde Ω| denote as direções dos alto-falantes, W| são pesos, e L é o número de alto-falantes. Para derivar funções de ação panorâmica a partir da equação (8), assumimos uma direção de incidência conhecida Ω5. Se a fonte e os campos de som dos alto- falantes são ambos em ondas planas, o fator 4πin (vide equação (6)) pode ser reduzido e a equação (8) depende apenas dos conjugados complexos dos vetores das harmônicas esféricas, também referidos como "modos". Usando a notação de matriz, isto é escrito como
Figure img0010
onde Ψ é a matriz de modo da configuração do alto-falante
Figure img0011
com O x L elementos. Para se obter o vetor de ponderação desejado w, diversas estratégias para realizar isto são conhecidas. Se M = 3 é escolhido, Ψ é quadrado e pode ser invertido. Em virtude da configuração irregular do alto-falante a matriz é entretanto mal escalada. Em tal caso, com frequência a matriz pseudo-inversa é escolhida e
Figure img0012
[00029] Produz uma matriz de decodificação D L x O. Finalmente se pode escrever
Figure img0013
onde os pesos W (Ωs) são a solução de energia mínima para a equação (9). As consequências a partir do uso da pseudo- inversa são descritas abaixo.
[00030] O a seguir descreve a ligação entre as funções de ação panorâmica e a matriz de decodificação Ambisonics. Iniciando com Ambisonics, as funções de ação panorâmica para os alto-falantes individuais podem ser calculada usando a equação (12). Considerando
Figure img0014
ser a matriz de modo das direções de sinal de entrada S (Ω3), por exemplo uma grade esférica com um ângulo de inclinação que percorre em etapas de um grau a partir de 1 ...180° e um ângulo de azimute a partir de 1 ...360° respectivamente. A referida matriz de modo tem O x S elementos. Usando a equação (12), a matriz resultante W tem L x S elementos, a fileira I mantém os pesos de ação panorâmica S para o respectivo alto-falante:
Figure img0015
[00031] Como um exemplo representativo, a função de ação panorâmica de um único alto-falante 2 é mostrada como padrão de feixes na figura3. A matriz de decodificação D da ordem M = 3 no referido exemplo. Como pode ser visto, os valores da função de ação panorâmica não se referem de modo algum ao posicionamento físico do alto-falante. Isto é em virtude do posicionamento matemático irregular dos alto-falantes, que não é suficiente como um esquema de amostragem espacial para a ordem escolhida. A matriz de decodificação é, portanto, referida como uma matriz de modo não regularizado. Este problema pode ser superado pela regularização da matriz de modo de alto-falante Ψ na equação (11). Esta solução funciona em função da resolução espacial da matriz de decodificação, o que por sua vez pode ser expressa como uma ordem Ambisonics inferior. A figura 4 mostra um padrão exemplificativo de feixes resultantes da decodificação usando a matriz de modo regularizado, e particularmente usando a média de autovalores da matriz de modo para regularização. Comparado com a figura 3, a direção do alto- falante endereçado é agora claramente reconhecida.
[00032] Como delineado na introdução, outro modo de se obter a matriz de decodificação D para a reprodução de sinais Ambisonics é possível quando as funções de ação panorâmica já são conhecidas. As funções de ação panorâmica W são vistas como sinal desejado definido em um conjunto de direções de fonte virtual Ω, e a matriz de modo Ξ das referidas direções serve como o sinal de entrada. Então a matriz de decodificação pode ser calculada usando
Figure img0016
onde ΞH [Ξ ΞH]-1 ou simplesmente Ξ+ é a pseudo-inversa da matriz de modo Ξ. Na nova abordagem, tomamos as funções de ação panorâmica em W a partir de VBAP e calculamos uma matriz de decodificação Ambisonics a partir da referida.
[00033] As funções de ação panorâmica para W são tomados como valores de ganho g(Q) calculada usando a equação (4), onde Q é escolhido de acordo com a equação (13). A matriz de decodificação resultante usando a equação (15) é uma matriz de decodificação Ambisonics que facilita as funções VBAP de ação panorâmica. Um exemplo é ilustrado na figura5, que mostra um padrão de feixes resultante da decodificação usando a matriz de decodificação derivada a partir de VBAP. Vantajosamente, os lobos laterais SL são significativamente menores do que os lobos laterais SLreg do resultado da correspondência de modo regularizado da figura 4. Ademais, o padrão de feixes derivado de VBAP para os alto-falantes individuais segue a geometria da configuração do alto-falante na medida em que as funções de ação panorâmica VBAP dependem da base de vetor da direção endereçada. Como uma consequência, a nova abordagem de acordo com a presente invenção produz melhores resultados por todas as direções da configuração do alto-falante.
[00034] As direções de fonte 103 podem ser relativamente livremente definidas. Uma condição para o número de direções de fonte S é que ela deve ser pelo menos (N+1)2. Assim, tendo uma determinada ordem N do sinal do campo de som SFC é possível se definir S de acordo com S > (N+1)2, e distribuir as direções S de fonte uniformemente sobre a esfera de unidade. Como mencionado acima, o resultado pode ser uma grade esférica com um ângulo de inclinação θ percorrendo em etapas constantes de x (por exemplo, x = 1 ...5 ou x = 10, 20 etc.) graus a partir de 1 ...180° e um ângulo de azimute Φ a partir de 1 ...360° respectivamente, em que cada direção de fonte Ω = (θ, Φ) pode ser dada pelo ângulo de azimute Φ e ângulo de inclinação θ.
[00035] O efeito vantajoso foi confirmado em um teste de escuta. Para a avaliação da localização de uma única fonte, a fonte virtual é comparada contra uma fonte real como uma referência. Para a fonte real, um alto-falante na posição desejada é usado. Os métodos de reprodução usados são VBAP, decodificação de correspondência de modo Ambisonics, e a decodificação recém proposta usando as funções de ação panorâmica VBAP de acordo com a presente invenção. Para os últimos dois métodos, para cada posição testada e cada sinal de entrada testado, um sinal Ambisonics de terceira ordem é gerado. O referido sinal Ambisonics sintético é então decodificado usando as matrizes de decodificação de correspondência. Os sinais de teste usados são ruído rosa de banda larga e um sinal de fala de homem. As posições testadas são dispostas na região frontal com as direções
Figure img0017
[00036] O teste de escuta foi conduzido em um ambiente acústico com um tempo de reverberação média de aproximadamente 0.2 s. Nove pessoas participaram do teste de escuta. Os indivíduos de teste foram solicitados para classificar o desempenho da reprodução espacial de todos os métodos de reprodução comparados ao de referência. Um único valor de classificação tem que ser encontrado para representar a localização da fonte virtual e as alterações de timbre. A figura 5 mostra os resultados do teste de escuta.
[00037] Como os resultados mostram, a decodificação de correspondência do modo Ambisonics não regularizado é classificado como perceptivamente ruim do que os outros métodos sendo testados. Este resultado corresponde à figura 3. O método de correspondência do modo Ambisonics serve como âncora neste teste de escuta. Outra vantagem é que os intervalos de confidencia para o ruído de sinal são maiores para VBAP do que para os outro métodos. Os valores médios mostram os valores mais altos para a decodificação Ambisonics usando funções de ação panorâmica VBAP. Assim, embora a resolução espacial seja reduzida - em virtude da ordem Ambisonics usada - o referido método mostra vantagens em relação à abordagem paramétrica VBAP. Em comparação à VBAP, não só a decodificação Ambisonics com robusta mas também as funções de ação panorâmica VBAP tem a vantagem de não só três alto-falantes serem usados para tornar a fonte virtual. Em VBAP um único alto-falante pode ser dominante se a posição da fonte virtual estiver próxima de lima das posições fixas dos alto-falantes. A maioria dos indivíduos reportou menos alterações de timbre para VBAP acionada por Ambisonics do que para a VBAP aplicada diretamente. O problema de alterações de timbre para VBAP já é conhecido a partir de Pulkki.
[00038] Em oposição à VBAP, o método recém proposto usa mais do que três alto-falantes para a reprodução de uma fonte virtual, mas surpreendentemente produz menos coloração.
[00039] Concluindo, um novo modo de se obter uma matriz de decodificação Ambisonics a partir das funções de ação panorâmica VBAP é descrito. Para uma diferente configuração dos alto-falantes, a referida abordagem é vantajosa em comparação às matrizes da abordagem do modo de correspondência. As propriedades e as consequências das referidas matrizes de decodificação são discutidas acima. Em suma, a decodificação Ambisonics recém proposta com funções de ação panorâmica VBAP evita os problemas típicos de todas as abordagens e correspondência conhecidas. Um teste de escuta mostrou que a decodificação Ambisonics VBAP-derivada pode produzir uma qualidade de reprodução espacial melhor do que o uso direto de VBAP pode produzir. O método proposto requer apenas a descrição de campo de som enquanto VBAP requer a descrição paramétrica das fontes virtuais a serem renderizadas.
[00040] Embora tenha sido mostrado, descrito, e apontado características novas e fundamentais da presente invenção como aplicada à modalidade preferida da mesma, será entendido que diversas omissões e substituições e mudanças nos aparelhos e método descrito, na forma e detalhes dos dispositivos descritos, e em sua operação, podem ser realizadas por aqueles versados na técnica sem se desviar a partir do espírito da presente invenção. É expressamente pretendido que todas as combinações dos referidos elementos que realizam substancialmente a mesma função substancialmente da mesma maneira para alcançar os mesmos resultados estão inseridos no âmbito da presente invenção. Substituições dos elementos a partir de uma modalidade descrita para outra estão também amplamente pretendidas e contempladas. Será entendido que modificações dos detalhes podem ser realizadas sem se desviar a partir do âmbito da presente invenção. Cada característica descrita na descrição e (onde apropriado) as concretizações e os desenhos podem ser proporcionados independentemente ou em qualquer combinação apropriada. As características podem, onde apropriado, ser implementadas em hardware, software, ou em uma combinação dos dois.
[00041] Os numerais de referência que aparecem nas concretizações são apenas por ilustração e não devem limitar o âmbito das concretizações.

Claims (12)

1. Método para decodificar uma representação para campo de som de áudio para reprodução de áudio, caracterizado pelo fato de que compreende as etapas de: - calcular (110), para cada um dentre uma pluralidade de alto-falantes, uma função de ação panorâmica (W) usando um método geométrico baseado nas posições dos alto-falantes e na pluralidade de direções de fonte; - calcular (120) uma matriz de modo (Ξ N) a partir das direções de fonte; - calcular (130) uma matriz de modo pseudo-inversa (Ξ +) da matriz de modo (Ξ.); e - decodificar (140) a representação para campo de som de áudio, em que a decodificação é baseada em uma matriz de decodificação (D) que é obtida a partir de pelo menos a função de ação panorâmica (W) e a matriz de modo pseudo-inversa (Ξ +).
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o método geométrico usado na etapa de calcular a função de ação panorâmica é Ação Panorâmica de Amplitude com Base em Vetor (VBAP).
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a matriz de modo pseudo-inversa (Ξ +) é obtida de acordo com Ξ H [Ξ ΞH]-1 , em que Ξ é a matriz de modo da pluralidade de direções de fonte.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que a matriz de decodificação (DN) é obtida (135) de acordo com D =W Ξ H [Ξ ΞH]-1 = W Ξ+, em que W é o conjunto de funções de ação panorâmica para cada alto-falante.
5. Dispositivo para decodificar uma representação para campo de som de áudio para reprodução de áudio, caracterizadopelo fato de que compreendendo: - primeiros meios de cálculo (210) para calcular, para cada um dentre uma pluralidade de alto-falantes, uma função de ação panorâmica (W) usando um método geométrico baseado nas posições dos alto-falantes e na pluralidade de direções de fonte; - segundos meios de cálculo (220) para calcular uma matriz de modo (Ξ) a partir das direções de fonte; - terceiros meios de cálculo (230) para calcular uma matriz de modo pseudo-inversa (Ξ +) da matriz de modo (Ξ); e - meios de decodificação (240) para decodificar a representação de campo de som, em que a decodificação é baseada em uma matriz de decodificação (D) e os meios de decodificação usam pelo menos a função de ação panorâmica (W) e a matriz de modo pseudo-inversa (Ξ +) para obter a matriz de decodificação (D).
6. Dispositivo, de acordo com a reivindicação 5, carac-terizado pelo fato de que o dispositivo para decodificar adicionalmente compreende meios (235) para calcular a matriz de decodificação (D) a partir da função de ação panorâmica (W) e a matriz de modo pseudo-inversa (Ξ +).
7. Dispositivo, de acordo com a reivindicação 5 ou 6, carac-terizado pelo fato de que o método geométrico usado na etapa de calcular a função de ação panorâmica é Ação Panorâmica de Amplitude com Base em Vetor (VBAP).
8. Dispositivo, de acordo com qualquer uma das reivindi-cações 5 a 7, caracterizado pelo fato de que a matriz de modo pseudo-inversa Ξ + é obtida de acordo com Ξ+ = ΞH [Ξ ΞH]-1, em que Ξ é a matriz de modo da pluralidade de direções de fonte.
9. Dispositivo, de acordo com a reivindicação 8, caracte-rizado pelo fato de que a matriz de decodificação (DN) é obtida em meios (245) para calcular a matriz de decodificação, de acordo com D=W ΞH [Ξ ΞH]-1 = W Ξ+, em que W é o conjunto de funções de ação panorâmica para cada alto-falante.
10. Meio legível por computador tendo armazenado no mesmo um método a ser implementado por um computador para decodificar uma representação para campo de som de áudio para reprodução de áudio, o método caracterizado pelo fato de que compreende as etapas de: - calcular (110), para cada um dentre uma pluralidade de alto-falantes, uma função de ação panorâmica (W) usando um método geométrico baseado nas posições dos alto-falantes e na pluralidade de direções de fonte; - calcular (120) uma matriz de modo (Ξ) a partir das direções de fonte; - calcular (130) uma matriz de modo pseudo-inversa (Ξ+) da matriz de modo (Ξ); e - decodificar (140) a representação para campo de som de áudio, em que a decodificação é baseada em uma matriz de decodificação (D) que é obtida a partir de pelo menos uma função de ação panorâmica (W) e a matriz de modo pseudo-inversa (Ξ+).
11. Meio legível por computador, de acordo com a reivin-dicação 10, caracterizado pelo fato de que o método geométrico usado na etapa de calcular a função de ação panorâmica é Ação Panorâmica de Amplitude com Base em Vetor (VBAP).
12. Meio legível por computador, de acordo com a reivin-dicação 10 ou 11, caracterizado pelo fato de que a matriz de modo pseudo-inversa Ξ+ é obtida de acordo com Ξ+ = ΞH [Ξ ΞH]-1 , em que Ξ é a matriz de modo da pluralidade de direções de fonte.
BR112012024528-7A 2010-03-26 2011-03-25 método e dispositivo para decodificar uma representação para campo de som de áudio para reprodução de áudio e meio legível por computador BR112012024528B1 (pt)

Priority Applications (1)

Application Number Priority Date Filing Date Title
BR122020001822-4A BR122020001822B1 (pt) 2010-03-26 2011-03-25 Método e dispositivo para decodificar uma representação para campo de som de áudio para reprodução de áudio e meio legível por computador

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP10305316.1 2010-03-26
EP10305316 2010-03-26
PCT/EP2011/054644 WO2011117399A1 (en) 2010-03-26 2011-03-25 Method and device for decoding an audio soundfield representation for audio playback

Publications (3)

Publication Number Publication Date
BR112012024528A2 BR112012024528A2 (pt) 2016-09-06
BR112012024528A8 BR112012024528A8 (pt) 2017-12-05
BR112012024528B1 true BR112012024528B1 (pt) 2021-05-11

Family

ID=43989831

Family Applications (2)

Application Number Title Priority Date Filing Date
BR122020001822-4A BR122020001822B1 (pt) 2010-03-26 2011-03-25 Método e dispositivo para decodificar uma representação para campo de som de áudio para reprodução de áudio e meio legível por computador
BR112012024528-7A BR112012024528B1 (pt) 2010-03-26 2011-03-25 método e dispositivo para decodificar uma representação para campo de som de áudio para reprodução de áudio e meio legível por computador

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BR122020001822-4A BR122020001822B1 (pt) 2010-03-26 2011-03-25 Método e dispositivo para decodificar uma representação para campo de som de áudio para reprodução de áudio e meio legível por computador

Country Status (12)

Country Link
US (9) US9100768B2 (pt)
EP (1) EP2553947B1 (pt)
JP (8) JP5559415B2 (pt)
KR (9) KR101755531B1 (pt)
CN (1) CN102823277B (pt)
AU (1) AU2011231565B2 (pt)
BR (2) BR122020001822B1 (pt)
ES (1) ES2472456T3 (pt)
HK (1) HK1174763A1 (pt)
PL (1) PL2553947T3 (pt)
PT (1) PT2553947E (pt)
WO (1) WO2011117399A1 (pt)

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101755531B1 (ko) 2010-03-26 2017-07-07 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
EP2541547A1 (en) 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
MX337790B (es) 2011-07-01 2016-03-18 Dolby Lab Licensing Corp Sistema y herramientas para autoria y representacion mejorada de audio tridimensional.
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
EP2637427A1 (en) * 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
EP2645748A1 (en) * 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9219460B2 (en) 2014-03-17 2015-12-22 Sonos, Inc. Audio settings based on environment
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
EP4284026A3 (en) 2012-07-16 2024-02-21 Dolby International AB Method and device for rendering an audio soundfield representation
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
US9479886B2 (en) 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
EP2738962A1 (en) * 2012-11-29 2014-06-04 Thomson Licensing Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field
EP2946468B1 (en) * 2013-01-16 2016-12-21 Thomson Licensing Method for measuring hoa loudness level and device for measuring hoa loudness level
US9736609B2 (en) 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
EP2765791A1 (en) * 2013-02-08 2014-08-13 Thomson Licensing Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field
US9756444B2 (en) 2013-03-28 2017-09-05 Dolby Laboratories Licensing Corporation Rendering audio using speakers organized as a mesh of arbitrary N-gons
RU2769677C2 (ru) * 2013-04-26 2022-04-04 Сони Корпорейшн Способ и устройство обработки звука
EP2991383B1 (en) * 2013-04-26 2021-01-27 Sony Corporation Audio processing device and audio processing system
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9495968B2 (en) * 2013-05-29 2016-11-15 Qualcomm Incorporated Identifying sources from which higher order ambisonic audio data is generated
BR112015030103B1 (pt) * 2013-05-29 2021-12-28 Qualcomm Incorporated Compressão de representações decomposta de campo sonoro
EP3923279B1 (en) * 2013-06-05 2023-12-27 Dolby International AB Apparatus for decoding audio signals and method for decoding audio signals
EP2824661A1 (en) * 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
EP2866475A1 (en) * 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups
EP2879408A1 (en) * 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
CN111179951B (zh) * 2014-01-08 2024-03-01 杜比国际公司 包括编码hoa表示的位流的解码方法和装置、以及介质
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
KR102201726B1 (ko) * 2014-03-21 2021-01-12 돌비 인터네셔널 에이비 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치
EP2922057A1 (en) 2014-03-21 2015-09-23 Thomson Licensing Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
US10412522B2 (en) * 2014-03-21 2019-09-10 Qualcomm Incorporated Inserting audio channels into descriptions of soundfields
JP6374980B2 (ja) 2014-03-26 2018-08-15 パナソニック株式会社 サラウンドオーディオ信号処理のための装置及び方法
CN106465027B (zh) * 2014-05-13 2019-06-04 弗劳恩霍夫应用研究促进协会 用于边缘衰落幅度平移的装置和方法
US9847087B2 (en) * 2014-05-16 2017-12-19 Qualcomm Incorporated Higher order ambisonics signal compression
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) * 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
CN110415712B (zh) * 2014-06-27 2023-12-12 杜比国际公司 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法
EP2960903A1 (en) 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
US9910634B2 (en) * 2014-09-09 2018-03-06 Sonos, Inc. Microphone calibration
US9952825B2 (en) 2014-09-09 2018-04-24 Sonos, Inc. Audio processing algorithms
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US10140996B2 (en) 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
EP3073488A1 (en) 2015-03-24 2016-09-28 Thomson Licensing Method and apparatus for embedding and regaining watermarks in an ambisonics representation of a sound field
US9693165B2 (en) 2015-09-17 2017-06-27 Sonos, Inc. Validation of audio calibration using multi-dimensional motion check
EP3351015B1 (en) 2015-09-17 2019-04-17 Sonos, Inc. Facilitating calibration of an audio playback device
US10070094B2 (en) * 2015-10-14 2018-09-04 Qualcomm Incorporated Screen related adaptation of higher order ambisonic (HOA) content
CN105392102B (zh) * 2015-11-30 2017-07-25 武汉大学 用于非球面扬声器阵列的三维音频信号生成方法及系统
US10412531B2 (en) 2016-01-08 2019-09-10 Sony Corporation Audio processing apparatus, method, and program
EP3402223B1 (en) 2016-01-08 2020-10-07 Sony Corporation Audio processing device and method, and program
CN108476365B (zh) 2016-01-08 2021-02-05 索尼公司 音频处理装置和方法以及存储介质
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
US11106423B2 (en) 2016-01-25 2021-08-31 Sonos, Inc. Evaluating calibration of a playback device
US10003899B2 (en) 2016-01-25 2018-06-19 Sonos, Inc. Calibration with particular locations
US9864574B2 (en) 2016-04-01 2018-01-09 Sonos, Inc. Playback device calibration based on representation spectral characteristics
US9860662B2 (en) 2016-04-01 2018-01-02 Sonos, Inc. Updating playback device configuration information based on calibration data
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
US9794710B1 (en) 2016-07-15 2017-10-17 Sonos, Inc. Spatial audio correction
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
US11012803B2 (en) 2017-01-27 2021-05-18 Auro Technologies Nv Processing method and system for panning audio objects
US10861467B2 (en) 2017-03-01 2020-12-08 Dolby Laboratories Licensing Corporation Audio processing in adaptive intermediate spatial format
US10972859B2 (en) 2017-04-13 2021-04-06 Sony Corporation Signal processing apparatus and method as well as program
CN107147975B (zh) * 2017-04-26 2019-05-14 北京大学 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法
US11277705B2 (en) 2017-05-15 2022-03-15 Dolby Laboratories Licensing Corporation Methods, systems and apparatus for conversion of spatial audio format(s) to speaker signals
US10405126B2 (en) * 2017-06-30 2019-09-03 Qualcomm Incorporated Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems
US10674301B2 (en) * 2017-08-25 2020-06-02 Google Llc Fast and memory efficient encoding of sound objects using spherical harmonic symmetries
US10264386B1 (en) * 2018-02-09 2019-04-16 Google Llc Directional emphasis in ambisonics
US11206484B2 (en) 2018-08-28 2021-12-21 Sonos, Inc. Passive speaker authentication
US10299061B1 (en) 2018-08-28 2019-05-21 Sonos, Inc. Playback device calibration
US20200402523A1 (en) * 2019-06-24 2020-12-24 Qualcomm Incorporated Psychoacoustic audio coding of ambisonic audio data
US10734965B1 (en) 2019-08-12 2020-08-04 Sonos, Inc. Audio calibration of a portable playback device
CN112530445A (zh) * 2020-11-23 2021-03-19 雷欧尼斯(北京)信息技术有限公司 高阶Ambisonic音频的编解码方法及芯片
US11743670B2 (en) 2020-12-18 2023-08-29 Qualcomm Incorporated Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4095049A (en) * 1976-03-15 1978-06-13 National Research Development Corporation Non-rotationally-symmetric surround-sound encoding system
CA2406926A1 (en) * 2000-04-19 2001-11-01 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions
JP2002218655A (ja) 2001-01-16 2002-08-02 Nippon Telegr & Teleph Corp <Ntt> 空港における給電システム
FR2847376B1 (fr) 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
US7558393B2 (en) * 2003-03-18 2009-07-07 Miller Iii Robert E System and method for compatible 2D/3D (full sphere with height) surround sound reproduction
EP1737267B1 (en) 2005-06-23 2007-11-14 AKG Acoustics GmbH Modelling of a microphone
JP4928177B2 (ja) * 2006-07-05 2012-05-09 日本放送協会 音像形成装置
DE102006053919A1 (de) 2006-10-11 2008-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer Anzahl von Lautsprechersignalen für ein Lautsprecher-Array, das einen Wiedergaberaum definiert
US8290167B2 (en) 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US20080232601A1 (en) 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
EP2094032A1 (en) * 2008-02-19 2009-08-26 Deutsche Thomson OHG Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same
JP4922211B2 (ja) * 2008-03-07 2012-04-25 日本放送協会 音響信号変換装置、その方法及びそのプログラム
PL2154677T3 (pl) 2008-08-13 2013-12-31 Fraunhofer Ges Forschung Urządzenie do wyznaczania konwertowanego przestrzennego sygnału audio
WO2011012455A1 (en) 2009-07-30 2011-02-03 Oce-Technologies B.V. Automatic table location in documents
KR101755531B1 (ko) * 2010-03-26 2017-07-07 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
EP2879408A1 (en) * 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
JP6589838B2 (ja) 2016-11-30 2019-10-16 カシオ計算機株式会社 動画像編集装置及び動画像編集方法

Also Published As

Publication number Publication date
JP6336558B2 (ja) 2018-06-06
EP2553947A1 (en) 2013-02-06
AU2011231565B2 (en) 2014-08-28
US20200273470A1 (en) 2020-08-27
US20220189492A1 (en) 2022-06-16
US10037762B2 (en) 2018-07-31
US9100768B2 (en) 2015-08-04
KR102294460B1 (ko) 2021-08-27
CN102823277B (zh) 2015-07-15
KR101795015B1 (ko) 2017-11-07
KR20190022914A (ko) 2019-03-06
JP6067773B2 (ja) 2017-01-25
KR20170084335A (ko) 2017-07-19
PT2553947E (pt) 2014-06-24
CN102823277A (zh) 2012-12-12
US10629211B2 (en) 2020-04-21
US20190139555A1 (en) 2019-05-09
JP2014161122A (ja) 2014-09-04
US20190341062A1 (en) 2019-11-07
KR20240009530A (ko) 2024-01-22
KR20180094144A (ko) 2018-08-22
JP5739041B2 (ja) 2015-06-24
JP2021184611A (ja) 2021-12-02
KR20210107165A (ko) 2021-08-31
EP2553947B1 (en) 2014-05-07
AU2011231565A1 (en) 2012-08-23
KR101953279B1 (ko) 2019-02-28
JP2023052781A (ja) 2023-04-12
US9767813B2 (en) 2017-09-19
US20150294672A1 (en) 2015-10-15
US10522159B2 (en) 2019-12-31
KR20200033997A (ko) 2020-03-30
BR112012024528A2 (pt) 2016-09-06
US20170025127A1 (en) 2017-01-26
ES2472456T3 (es) 2014-07-01
BR112012024528A8 (pt) 2017-12-05
US20180308498A1 (en) 2018-10-25
KR102018824B1 (ko) 2019-09-05
JP2018137818A (ja) 2018-08-30
KR101755531B1 (ko) 2017-07-07
BR122020001822B1 (pt) 2021-05-04
JP2013524564A (ja) 2013-06-17
JP2020039148A (ja) 2020-03-12
JP2017085620A (ja) 2017-05-18
JP5559415B2 (ja) 2014-07-23
WO2011117399A1 (en) 2011-09-29
JP6918896B2 (ja) 2021-08-11
PL2553947T3 (pl) 2014-08-29
KR20170125138A (ko) 2017-11-13
US9460726B2 (en) 2016-10-04
US11948583B2 (en) 2024-04-02
JP6615936B2 (ja) 2019-12-04
US20170372709A1 (en) 2017-12-28
US11217258B2 (en) 2022-01-04
KR102093390B1 (ko) 2020-03-25
US10134405B2 (en) 2018-11-20
US20130010971A1 (en) 2013-01-10
JP7220749B2 (ja) 2023-02-10
JP2015159598A (ja) 2015-09-03
HK1174763A1 (en) 2013-06-14
KR102622947B1 (ko) 2024-01-10
KR20190104450A (ko) 2019-09-09
KR101890229B1 (ko) 2018-08-21
KR20130031823A (ko) 2013-03-29

Similar Documents

Publication Publication Date Title
BR112012024528B1 (pt) método e dispositivo para decodificar uma representação para campo de som de áudio para reprodução de áudio e meio legível por computador
AU2024200911A1 (en) Method and device for decoding an audio soundfield representation
AU2018201133B2 (en) Method and device for decoding an audio soundfield representation for audio playback

Legal Events

Date Code Title Description
B25A Requested transfer of rights approved

Owner name: DOLBY INTERNATIONAL AB (NL)

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 11/05/2021, OBSERVADAS AS CONDICOES LEGAIS.

B25G Requested change of headquarter approved

Owner name: DOLBY INTERNATIONAL AB (IE)