BR122020017399B1 - Método e dispositivo para renderizar uma representação de campo sonoro ambisonics de ordem superior para reprodução de áudio, dispositivo para decodificação e meio legível por computador - Google Patents

Método e dispositivo para renderizar uma representação de campo sonoro ambisonics de ordem superior para reprodução de áudio, dispositivo para decodificação e meio legível por computador Download PDF

Info

Publication number
BR122020017399B1
BR122020017399B1 BR122020017399-8A BR122020017399A BR122020017399B1 BR 122020017399 B1 BR122020017399 B1 BR 122020017399B1 BR 122020017399 A BR122020017399 A BR 122020017399A BR 122020017399 B1 BR122020017399 B1 BR 122020017399B1
Authority
BR
Brazil
Prior art keywords
matrix
decoding
decoding matrix
rendering
smoothing
Prior art date
Application number
BR122020017399-8A
Other languages
English (en)
Inventor
Johannes Boehm
Florian Keiler
Original Assignee
Dolby International Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International Ab filed Critical Dolby International Ab
Publication of BR122020017399B1 publication Critical patent/BR122020017399B1/pt

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

A invenção revela a renderização de sinais de campo sonoro, tal como Ambisonics de Ordem Superior (HOA), para configurações de alto-falantes arbitrárias, em que a renderização resulta em propriedades de localização altamente aperfeiçoadas e tem a característica de preservar energia. Isso é obtido por um novo tipo de matriz de decodificação para dados de campo sonoro, e uma nova forma de obter a matriz de decodificação. Em um método para renderizar uma representação de campo sonoro de áudio para configurações espaciais de alto-falantes arbitrárias, a matriz de decodificação (D) para a renderização para uma dada disposição de alto-falantes alvo é obtida pelas etapas de obter um número (L) de alto-falantes, suas posições (I), as posições (II) de uma grade de modelagem esférica e uma ordem HOA (N), gerar (141) uma matriz mista (G) a partir das posições (II) da grade de modelagem e das posições (I) dos alto-falantes, gerar (142) uma matriz de modo (III) a partir das posições (II) da grade de modelagem esférica e da ordem HOA, calcular (143) uma primeira matriz de decodificação (IV) a partir da matriz mista (G) e da matriz de modo (III), e suavizar e escalonar (144, 145) a primeira matriz de decodificação (...).

Description

Dividido do BR112015001128-4 depositado em 16 de julho de 2013 CAMPO DA INVENÇÃO
[001] A presente invenção refere-se a um método e a um disposi tivo para renderização de uma representação de campo sonoro de áudio, e em particular, a uma representação de áudio no formato Ambisonics, para reprodução de áudio.
ANTECEDENTES DA INVENÇÃO
[002] A localização precisa é uma meta crucial para qualquer sistema de reprodução de áudio espacial. Tais sistemas de reprodução são altamente aplicáveis para sistemas de conferência, jogos ou outros ambientes virtuais que se beneficiam do som 3D. As cenas sonoras em 3D podem ser sintetizadas ou capturadas como um campo sonoro natural. Os sinais de campo sonoro, como por exemplo, Ambisonics, carregam uma representação de um campo sonoro desejado. O formato Ambisonics se baseia da decomposição harmônica esférica do campo sonoro. Embora o formato Ambisonics básico ou o formato B utilize harmônicos esféricos de ordem zero e um, o chamado Ambisonics de Ordem Superior (HOA) também utiliza harmônicos esféricos adicionais pelo menos de 2a ordem. Um processo de decodificação ou renderização é necessário para obter os sinais de alto-falante individuais a partir de tais sinais no formato Ambisonics. A disposição espacial dos alto-falantes é chamada de configuração de alto-falantes na pre-sente invenção. No entanto, embora as abordagens de renderização conhecidas sejam apropriadas somente para configurações de alto- falantes regulares, as configurações de alto-falantes arbitrárias são muito mais comuns. Se tais abordagens de renderização forem aplicadas a configurações de alto-falantes arbitrárias, a diretividade do som é deteriorada.
SUMÁRIO DA INVENÇÃO
[003] A presente invenção descreve um método para renderi-zar/decodificar uma representação de campo sonoro de áudio tanto para distribuições espaciais de alto-falantes regulares como não- regulares, em que o renderização/decodificação oferece propriedades de localização altamente aperfeiçoadas e tem a característica de preservar energia. Em particular, a invenção oferece uma nova maneira de obter a matriz de decodificação para dados de campo sonoro, por exemplo, no formato HOA. Uma vez que o formato HOA descreve um campo sonoro, que não está diretamente relacionado às posições dos alto-falantes, e uma vez que os sinais de alto-falantes a serem obtidos estão necessariamente em um formato de áudio baseado em canal, a decodificação dos sinais HOA sempre está intimamente relacionada ao renderização do sinal de áudio. Portanto, a presente invenção refere-se tanto à decodificação quanto ao renderização de formatos de áudio relacionados ao campo sonoro.
[004] Uma vantagem da presente invenção é a obtenção da de-codificação com preservação de energia com excelentes propriedades direcionais. O termo “preservação de energia” significa que a energia dentro do sinal diretivo HOA é preservada após a decodificação, fazendo com que, por exemplo, uma varredura espacial direcional de amplitude constante seja percebida com intensidade de som constante. O termo “propriedades direcionais satisfatórias” refere-se à diretivi- dade dos alto-falantes caracterizada por um lóbulo principal diretivo e pequenos lóbulos laterais, em que a diretividade é aumentada se comparado ao renderização/decodificação convencional.
[005] A invenção revela o renderização de sinais de campo sono ro, tal como Ambisonics de Ordem Superior (HOA), para configurações de alto-falantes arbitrárias, em que o renderização resulta em propriedades de localização altamente aperfeiçoadas e tem a característica de preservar energia. Isso é obtido por um novo tipo de matriz de de- codificação para dados de campo sonoro, e uma nova forma de obter a matriz de decodificação. Em um método para renderizar uma representação de campo sonoro de áudio para configurações espaciais de alto-falantes arbitrárias, a matriz de decodificação para o renderização para uma dada disposição de alto-falantes alvos é obtida pelas etapas de obter um número de alto-falantes e suas posições, as posições de uma grade de modelagem esférica e uma ordem HOA, gerar uma matriz mista a partir das posições da grade de modelagem e das posições dos alto-falantes, gerar uma matriz de modo a partir das posições da grade de modelagem esférica e da ordem HOA, calcular uma primeira matriz de decodificação a partir da matriz mista e da matriz de modo, e suavizar e escalonar a primeira matriz de decodificação com coeficientes de suavização e escalonamento para obter uma matriz de decodifi- cação com preservação de energia. Em uma concretização, a invenção refere-se a um método para decodificar e/ou renderizar uma representação de campo sonoro de áudio para reprodução de áudio de acordo com a reivindicação 1. Em outra concretização, a invenção refere-se a um dispositivo para decodificar e/ou renderizar uma representação de campo sonoro de áudio para reprodução de áudio de acordo com a reivindicação 9. Em ainda outra concretização, a invenção refere-se a um meio legível por computador tendo nele armazenadas instruções executáveis que fazem um computador executar um método para decodificar e/ou renderizar uma representação de campo sonoro de áudio para reprodução de áudio de acordo com a reivindicação 15.
[006] Geralmente, a invenção usa a seguinte abordagem. Primei- ro, são derivadas funções de posicionamento panorâmico (panning) que são dependentes de uma configuração de alto-falantes que é usada para reprodução. Em segundo lugar, uma matriz de decodificação (por exemplo, matriz de decodificação Ambisonics) é calculada a partir dessas funções de posicionamento panorâmico (ou uma matriz mista obtida a partir das funções de posicionamento panorâmico) para todos os alto-falantes da configuração de alto-falantes. Em uma terceira etapa, a matriz de decodificação é gerada e processada para passar a preservar energia. Finalmente, a matriz de decodificação é filtrada de modo a suavizar o lóbulo principal de posicionamento panorâmico do alto-falante e suprimir os lóbulos laterais. A matriz de decodificação filtrada é usada para renderizar o sinal de áudio para a dada configuração de alto-falante. Os lóbulos laterais são um efeito colateral do renderização e proporcionam sinais de áudio em direções indesejadas. Uma vez que o renderização é otimizado para a dada configuração de alto-falantes, os lóbulos laterais são perturbadores. Uma das vantagens da presente invenção é que os lóbulos laterais são minimizadas, fazendo com que a diretividade dos sinais de alto-falante seja aprimorada. De acordo com uma concretização da invenção, um método para renderizar/decodificar uma representação de campo sonoro de áudio para reprodução de áudio compreende etapas de armazenar em buffer amostras temporais HOA recebidas b(t), em que blocos de M amostras e um índice de tempo μ são formados, filtrar os coeficientes B(μ) para obter coeficientes filtrados por frequência , renderizar os coeficientes filtrados por frequência para um domínio espacial usando uma matriz de decodificação D, em que um sinal espacial W(μ) é obtido. Em uma concretização, etapas adicionais compreendem retardar as amostras temporais w(t) individualmente para cada um dos L canais nas linhas de retardo, em que L sinais digitais são obtidos, e converter de Digital para Analógico (D/A) e amplificar os L sinais digitais, em que L sinais de alto-falante analógicos são obtidos. A matriz de decodifica- ção D para a etapa de renderização, isto é, para renderização para uma dada disposição de alto-falantes, é obtida pelas etapas de obter um número de alto-falantes alvos e as posições dos alto-falantes, determinar as posições de uma grade de modelagem esférica e uma ordem HOA, gerar uma matriz mista a partir das posições de uma grade de modelagem esférica e das posições dos alto-falantes, gerar uma matriz de modo a partir da grade de modelagem esférica e da ordem HOA, calcular uma primeira matriz de decodificação a partir da matriz mista G e da matriz de modo
Figure img0001
, e suavizar e escalonar a primeira matriz de decodificação com coeficientes de suavização e escalonamento, em que a matriz de decodificação é obtida.
[007] De acordo com outro aspecto, um dispositivo para decodificar uma representação de campo sonoro de áudio para reprodução de áudio compreende uma unidade de processamento de renderização tendo uma unidade de cálculo de matriz de decodificação para obter a matriz de decodificação D, a unidade de cálculo de matriz de decodifi- cação compreendendo meios para obter um número L de alto-falantes alvo e meios para obter as posições
Figure img0002
dos alto-falantes, meios para determinar as posições de uma grade de modelagem esférica
Figure img0003
e meios para obter uma ordem N HOA, e uma primeira unidade de pro-cessamento para gerar uma matriz mista G a partir das posições da grade de modelagem esférica
Figure img0004
e as posições dos alto-falantes, uma segunda unidade de processamento para gerar uma matriz de modo
Figure img0005
a partir da grade de modelagem esférica
Figure img0006
e a ordem N HOA, uma terceira unidade de processamento para realizar uma de-composição de valor singular compacto do produto da matriz de modo
Figure img0007
com a matriz mista transposta hermitiana G de acordo com
Figure img0008
, onde U, V são derivados de matrizes unitárias e S é uma matriz diagonal com elementos de valor singular, meios de cálculo para calcular uma primeira matriz de decodificação a partir das matrizes U, V de acordo com
Figure img0009
, em que $ é ou uma matriz de identidade ou uma matriz diagonal derivada da dita matriz diagonal com elementos de valor singular, e uma unidade de suavização e escalonamento para suavizar e escalonar a primeira matriz de deco- dificação com coeficientes de suavização A, em que a matriz de decodificação D é obtida.
[008] De acordo com ainda outro aspecto, um meio legível por computador tem nele armazenadas instruções executáveis que, quando executadas em um computador, fazem com que o computador execute um método para decodificar uma representação de campo sonoro de áudio para reprodução de áudio conforme revelado acima.
[009] Objetivos, aspectos e vantagens adicionais da invenção se tornarão aparentes a partir de uma consideração da descrição seguinte e das reivindicações anexas quando tomadas em conexão com os desenhos acompanhantes.
BREVE DESCRIÇÃO DOS DESENHOS
[010] Descrevem-se concretizações ilustrativas da invenção com referência aos desenhos em anexo, nos quais:
[011] A Fig. 1 é um fluxograma de um método de acordo com uma concretização da invenção;
[012] A Fig. 2 é um fluxograma de um método para construção da matriz mista G;
[013] A Fig. 3 é um diagrama de blocos de um renderizador;
[014] A Fig. 4 é um fluxograma de etapas esquemáticas de um processo de geração de matriz de decodificação;
[015] A Fig. 5 é um diagrama de blocos de uma unidade de gera ção de matriz de decodificação;
[016] A Fig. 6 é uma configuração de 16 alto-falantes ilustrativa, onde os alto-falantes são ilustrados como nós conectados;
[017] A Fig. 7 mostra a configuração de 16 alto-falantes ilustrativa em vista natural, onde os nós são ilustrados como alto-falantes;
[018] A Fig. 8 é um diagrama de energia ilustrando a razão Ê/E sendo constante para característica de preservação de energia perfeita para uma matriz de decodificação obtida com a técnica anterior [14], com N=3;
[019] A Fig. 9 é um diagrama de pressão sonora para uma matriz de decodificação projetada de acordo com a técnica anterior [14] com N=3, onde o feixe de posicionamento panorâmico do alto-falante central tem lóbulos laterais fortes;
[020] A Fig. 10 é um diagrama de energia ilustrando a razão Ê/E tendo flutuações maiores do que 4 dB para uma matriz de decodifica- ção obtida com a técnica anterior [2], com N=3;
[021] A Fig. 11 é um diagrama de pressão sonora para uma ma triz de decodificação projetada de acordo com a técnica anterior [2] com N=3, onde o feixe de posicionamento panorâmico do alto-falante central tem lóbulos laterais pequenos;
[022] A Fig. 12 é um diagrama de energia ilustrando a razão Ê/E tendo flutuações menores do que 1 dB conforme obtido por um método ou aparelho de acordo com a invenção, onde os movimentos espaciais com amplitude constante são percebidos com intensidade de som igual;
[023] A Fig. 13 é um diagrama de pressão sonora para uma ma triz de decodificação projetada com o método de acordo com a invenção, em que o alto-falante central tem um feixe de posicionamento panorâmico com lóbulos laterais pequenos.
DESCRIÇÃO DETALHADA DA INVENÇÃO
[024] Em geral, a invenção refere-se à renderização (isto é, de- codificação) de sinais de áudio formatado de campo sonoro, tais como sinais de áudio Ambisonics de Ordem Superior (HOA) para alto- falantes, em que os alto-falantes estão em posições simétricas ou assimétricas, regulares ou não-regulares. Os sinais de áudio podem ser adequados para alimentar mais alto-falantes do que o disponível, por exemplo, o número de coeficientes HOS pode ser maior do que o número de alto-falantes. A invenção proporciona matrizes de decodifica- ção com preservação de energia para decodificadores com excelentes propriedades direcionais, isto é, os lóbulos de diretividade de alto- falante geralmente compreendem um lóbulo principal diretivo mais forte e lóbulos laterais menores do que os lóbulos de diretividade de alto- falante obtidos com matrizes de decodificação convencionais. A preservação de energia significa que a energia dentro do sinal diretivo HOA é preservada após a decodificação, fazendo com que, por exemplo, uma varredura espacial direcional de amplitude constante seja percebida com intensidade de som constante.
[025] A Fig. 1 mostra um fluxograma de um método de acordo com uma concretização da invenção. Nesta concretização, o método para renderizar (isto é, decodificar) uma representação de campo sonoro de áudio HOA para reprodução de áudio usa uma matriz de de- codificação que é gerada como se segue: primeiro, um número L de alto-falantes alvo, as posições
Figure img0010
dos alto-falantes, uma grade de modelagem esférica
Figure img0011
e uma ordem N (por exemplo, ordem HOA) são determinados 11. A partir das posições
Figure img0012
dos alto-falantes e da grade de modelagem esférica
Figure img0013
uma matriz mista G é gerada 12, e a partir da grade de modelagem esférica
Figure img0014
e da ordem HOA N, uma matriz de modo
Figure img0015
é gerada 13. Uma primeira matriz de decodificação é é calculada 14 a partir da matriz mista G e da matriz de modo
Figure img0016
. A primeira matriz de decodificação & é suavizada 15 com coeficientes de suavização , em que uma matriz de decodificação suavizada &, e a matriz de decodificação suavizada & é escalonada 16 com um fator de escalonamento obtido a partir da matriz de decodificação suavizada &, em que a matriz de decodificação D é obtida. Em uma concretização, a suavização 15 e o escalonamento 16 são realizados em uma única etapa. Em uma concretização, os coeficientes de suaviza- ção são obtidos por um de dois métodos diferentes, dependendo do número de alto-falantes L e do número de canais de coeficiente HOA .) . Se o número de alto-falantes L estiver abaixo do número de canais de coeficiente HOA O3D, um novo método para obter os coeficientes de suavização é usado.
[026] Em uma concretização, uma pluralidade de matrizes de de- codificação correspondendo a uma pluralidade de diferentes disposições de alto-falante são geradas e armazenadas para uso posterior. As diferentes disposições de alto-falantes podem diferir por pelo menos um dentre o número de alto-falantes, uma posição de um ou mais alto-falantes e uma ordem N de um sinal de áudio de entrada. Então, quando da inicialização do sistema de renderização, uma matriz de decodificação de correlação é determinada, recuperada a partir do armazenamento de acordo com as necessidades atuais, e usada para decodificação.
[027] Em uma concretização, a matriz de decodificação D é obtida realizando uma decomposição de valor singular compacto do produto da matriz de modo
Figure img0017
com a matriz mista transposta Hermitiana GH de acordo com
Figure img0018
, e calculando uma primeira matriz de decodificação D a partir das matrizes U, V de acordo com
Figure img0019
são derivados de matrizes Unitárias, e S é uma matriz diagonal com elementos de valor singular da dita decomposição de valor singular compacto do produto da matriz de modo com a matriz mista transposta Hermitiana GH. As matrizes de decodificação obtidas de acordo com a presente concretização são geralmente numericamente mais estáveis do que as matrizes de decodificação obtidas com uma concretização alternativa descrita abaixo. O transposto Hermitiano de uma matriz é o complexo conjugado transposto da matriz.
[028] Na concretização alternativa, a matriz de decodificação D é obtida realizando uma decomposição de valor singular compacto do produto da matriz de modo transposta Hermitiana
Figure img0020
com a matriz mista G de acordo com
Figure img0021
em que uma primeira matriz de decodificação é derivada por
Figure img0022
[029] Em uma concretização, uma decomposição de valor singu lar compacto é realizada na matriz de modo
Figure img0023
e na matriz mista G de acordo com
Figure img0024
onde uma primeira matriz de decodifi cação é derivada por
Figure img0025
, onde 5 é uma matriz de decomposição de valor singular compacto truncada que é derivada da matriz de decomposição de valor singular S pela substituição de todos os valores singulares maiores ou iguais a um limiar thr por uns, e substituindo os elementos que são menores do que o limiar thr por zeros. O limiar thr depende dos valores reais da matriz de decomposição de valor singular e pode ser, a título de exemplo, da ordem de 0,06 * S1 (o elemento máximo de S). Em uma concretização, uma decomposição de valor singular compacto é realizada na matriz de modo
Figure img0026
e na matriz mista G de acordo com ,
Figure img0027
onde uma primeira matriz de decodificação é derivada por
Figure img0028
O e o limiar thr são como descrito acima para a concretização anterior. O limiar thr é geralmente derivado do maior valor singular.
[030] Em uma concretização, dois métodos diferentes para calcu lar os coeficientes de suavização são usados, dependendo da ordem HOA N e do número de alto-falantes alvo L: se houver menos altoficientes de suavização e escalonamento -c correspondem a um conjunto convencional de coeficientes max rE que são derivados dos zeros dos polinômios de Legendre de ordem N + 1; senão, se houver alto- O3.-; - (N +1.) < L, os coeficientes de ■ s são construídos a partir dos elementos '?C de uma janela Kaiser com comprimento=(2N+1) e largura=2N de acordo com
Figure img0029
com um fator de escalonamento cf. Os elementos usados da janela de Kaiser começam com o (N+1)-ésimo elemento, que é usado apenas uma vez, e continuam com elementos subsequentes que são usados repetidamente: o (N+2)-ésimo é usado três vezes, etc.
[031] Em uma concretização, o fator de escalonamento é obtido a partir da matriz de decodificação suavizada. Em particular, em uma concretização, ele é obtido de acordo com
Figure img0030
[032] A seguir, um sistema de renderização completo é descrito. O foco principal da invenção é a fase de inicialização do renderizador, onde uma matriz de decodificação D é gerada como descrito acima. Aqui, o foco principal é uma tecnologia para derivar a uma ou mais matrizes de decodificação, por exemplo, para um dicionário de códigos. Para gerar uma matriz de decodificação, sabe-se quantos alto- falantes alvo estão disponíveis, e onde eles estão localizados (isto é, suas posições).
[033] A Fig. 2 mostra um fluxograma de um método para constru ção da matriz mista G, de acordo com uma concretização da invenção. Nesta concretização, uma matriz mista inicial somente com zeros é criada 21, e para cada fonte virtual s com uma direção angular
Figure img0031
e raio rs, as seguintes etapas são realizadas. Primeiro, três alto-falantes ^L' são determinados 22, os quais circundam a posição
Figure img0032
, em que raios unitários são assumidos, e uma matriz -
Figure img0033
é construída 23, com
Figure img0034
. A matriz R convertida 24 em coordenadas cartesianas, de acordo com LE sphericaljD-CartesianW. Então, uma posição de fonte virtual construída 25 de acordo com
Figure img0035
e um ganho g é cac^o 26 de acordo com 0
Figure img0036
O ganho é normalizado 27 de acordo com
Figure img0037
e os elementos cor respondentes de G são substituídos pelos ganhos normalizados:
Figure img0038
A seção a seguir oferece uma breve introdução ao Ambisonics de ordem Superior (HoA) e define os sinais a serem processados, isto é, renderizados para alto-falantes.
[034] o Ambisonics de ordem Superior (HoA) se baseia na des crição de um campo sonoro dentro de uma área de interesse compac- ta, a qual se supõe ser livre de fontes sonoras. Neste caso, o compor- tamento espaço-temporal da pressão sonora ’P(C *) no tempo t e na posição
Figure img0039
dentro da área de interesse (em coordenadas esféricas: inclinação θ, azimute Φ) é fisicamente determinada inteira- mente pela equação de onda homogênea. Pode-se mostrar que a transformada de Fourier da pressão sonora em relação ao tempo, isto é,
Figure img0040
sonde w indica a frequência angular (e corresponde a
Figure img0041
, pode ser expandida para a série de Harmônicos Esféricos (SHs) de acordo com [13]:
Figure img0042
[035] Na Eq. (2), Cs indica a velocidade do som
Figure img0043
e o nú mero de onda angular. Além disso, ./••A') indica as funções de Bessel esféricas do primeiro tipo e a ordem n e Esféricos (SH) da ordem n e grau m. As informações completas sobre o campo sonoro estão na verdade contidas dentro dos coeficientes de campo sonoro
[036] Deve-se observar que os SHs são funções de valor com plexo em geral. No entanto, por uma combinação linear apropriada dos mesmos, é possível obter funções de valor real e realizar a expansão com respeito a essas funções.
[037] Relacionado à descrição de campo sonoro de pressão na eq. (2), um campo de origem pode ser definido como: co n
Figure img0044
[038] com o campo de origem ou densidade de amplitude [12]
Figure img0045
) dependendo do número de onda angular e da direção an- gular
Figure img0046
Um campo de origem pode consistir de fontes dis- cretas/contínuas de campo afastado/de campo próximo [1]. Os coefici- pm entes de campo de origem estão relacionados aos coeficiente de
Figure img0047
[039] em que ’■'■>■■ é a função de Hankel esférica do segundo tipo e rs é a distância de origem a partir da origem. Os sinais no domínio HOA podem ser representados no domínio da frequência ou no domínio do tempo como a transformada de Fourier invertida do campo de origem ou dos coeficientes de campo sonoro. A descrição a seguir assumirá o uso de uma representação no domínio do tempo dos coeficientes de campo de origem: coeficientes:
Figure img0048
[040] de um número finito: A série infinita na eq.(3) é truncada em n = N. O truncamento corresponde a uma limitação de largura de banda espacial. O número de coeficientes (ou canais HOA) é dado por:
Figure img0049
[041] ou por
Figure img0050
somente para descrições 2D. Os coeficientes ^?í' compreendem a informação de Áudio de uma amostra de tempo t para reprodução posterior pelos alto-falantes. Eles podem ser armazenados ou transmitidos, e, assim são sujeito à compressão de taxa de dados. Uma única amostra de tempo t dos coeficientes pode ser representada pelo vetor b(t) com elementos O3D:
Figure img0051
e um bloco de amostras de tempo M pela matriz
Figure img0052
Figure img0053
[042] Duas representações dimensionais dos campos sonoros podem ser derivadas por uma expansão com harmônicos circulares. Este é um caso especial da descrição geral apresentada acima usando uma inclinação fixa de
Figure img0054
- ponderação diferentes dos coeficientes e um conjunto reduzido para coeficientes O2D (m = ± n). Assim todas as considerações a seguir também se aplicam a representações 2D; o termo “esfera”, então, precisa ser substituído pelo termo “círculo”.
[043] Em uma concretização, os metadados são enviados junto com os dados de coeficiente, permitindo uma identificação não- ambígua dos dados de coeficiente. Toda a informação necessária para derivar o vetor de coeficiente de amostra de tempo b(t) é fornecida, seja através dos metadados transmitidos ou por causa de um dado contexto. Além do mais, nota-se que pelo menos uma da ordem HOA N ou O3D, e em uma concretização, adicionalmente um sinalizador especial junto com rs para indicar um registro de campo próximo são conhecidos no decodificador. A seguir, descreve-se uma renderização de um sinal HOA para os alto-falantes. Esta seção mostra o princípio básico da decodificação e algumas propriedades matemáticas. A decodi- ficação básica assume, primeiramente, sinais de alto-falante de onda plana e, em segundo lugar, que a distância dos alto-falantes para a origem pode ser negligenciada. Uma amostra de tempo dos coeficientes HOA dos coeficientes HOA b renderizados para L alto-falantes que estão localizados em direções esféricas
Figure img0055
com l = 1, ..., L pode ser descrita por [10]:
Figure img0056
onde
Figure img0057
representa uma amostra de tempo dos sinais de alto- falante L e a matriz de decodificação
Figure img0058
. Uma matriz de de- codificação pode ser derivada por
Figure img0059
onde Φ o é o pseudo inverso da matriz de modo lP. A matriz de modo é é definida como
Figure img0060
com
Figure img0061
consistindo dos Harmônicos Esféricos das direções de alto-falante
Figure img0062
, onde H indica o complexo conjugado transposto (também conhecido como Hermitiano).
[044] A seguir, um pseudo inverso de uma matriz por Decompo sição de Valor Singular (SVD) é descrito. Uma maneira universal de derivar um pseudo inverso consiste em primeiro calcular a SVD com-pacta:
Figure img0063
em que
Figure img0064
são derivados das matrizes de rota ção e
Figure img0065
é uma matriz diagonal dos valo res singulares na ordem descendente com K > 0 e K < min(O3D, L). O pseudo inverso é determinado por
Figure img0066
onde
Figure img0067
. para matrizes mal condicionadas com valores muito pequenos de Sk, os valores inversos correspondentes 1 são substituídos por zero. Isso é chamado de Decomposição de Valor Singular Truncado. Geralmente, um limiar de detecção com respeito ao maior valor singular S1 é selecionado para identificar os valores inversos correspondentes a serem substituídos por zero.
[045] A seguir, a propriedade de preservação de energia é descri ta. A energia do sinal no domínio HOA é dada por
Figure img0068
e a energia correspondente no domínio espacial por
Figure img0069
[046] A razão £ > para uma matriz decodificadora com preservação de energia é (substancialmente) constante. Isso só pode ser alcançado se
Figure img0070
com a matriz de identidade I e a constante . £ !■< Isso requer que D tenha um número de condição de norma-2 cond(D) = 1. Isso, novamente, exige que a SVD (Decomposição de Valor Singular) de D produza valores singulares idênticos:
Figure img0071
[047] Geralmente, o design do renderizador com preservação de energia é conhecido na técnica. Um design de matriz decodificadora com preservação de energia para é proposto em [14] por
Figure img0072
onde 5 da eq. (13) é forçado a ser = , e assim, pode ser descar tado na eq. (16). O produto
Figure img0073
e a razão Ê /E se tornam um. Um benefício desse método de design é a preservação de energia que garante uma impressão sonora espacial homogênea em que os movimentos espaciais não possuem flutuações no volume percebido. Uma desvantagem desse design é a perda na precisão de diretividade e os fortes lóbulos laterais do feixe de alto-falante pra posições de alto-falante irregulares e assimétricas (vide as Figs. 8-9). A presente invenção é capaz de superar essa desvantagem.
[048] Além disso, um design de renderizador para alto-falantes posicionados de forma não-regular é conhecido na técnica. Em [2], um método de design de decodificador para L > O 3D e L < O3D é descrito, o qual permite renderização com alta precisão em diretividade reproduzida. Uma desvantagem desse método de design é que os renderiza- dores derivados não tem propriedade de preservação de energia (vide as Figs. 10-11).
[049] A convolução esférica pode ser usada para suavização es pacial. Este é um processo de filtragem espacial, ou um janelamento no domínio de coeficiente (convolução). Seu objetivo é minimizar os lóbulos laterais, os chamados lóbulos de posicionamento panorâmico. •’ é dado pelo produto ponderado do coeficien te HOA original e pelo coeficiente zonal [5]:
Figure img0074
[050] Isso é equivalente a uma convolução esquerda em S2 no domínio espacial [5]. Convenientemente, isso é usado em [5] para suavizar as propriedades diretivas dos sinais de alto-falante antes da renderização / decodificação por ponderação dos coeficientes HOA B por:
Figure img0075
com o vetor
Figure img0076
contendo coeficientes de ponderação geralmente de valor real e um fator constante df. A ideia da suavização consiste em atenuar os coeficientes HOA com um índice de ordem crescente n. Um exemplo bem- conhecido de suavização dos coeficientes de ponderação & são os chamados max rv, max rE e coeficientes em fase [4]. O primeiro oferece o feixe de amplitude padrão (^v'ab = (1, 1,...., 1 j1, um vetor de comprimento O3D somente com uns), O segundo proporciona energia angular uniformemente distribuída e em fase possui supressão total de lóbulo lateral.
[051] A seguir, detalhes adicionais e concretizações da solução revelada são descritos. Primeiro, descreve-se uma arquitetura de ren- derizador em termos de sua inicialização, comportamento de inicialização e processamento.
[052] Toda vez que a configuração de alto-falantes, isto é, o nú mero de alto-falantes ou posição de qualquer alto-falante em relação à posição de escuta é alterada, o renderizador precisa realizar um processo de inicialização para determinar um conjunto de matrizes de de- codificação para qualquer ordem HOA N que os sinais de entrada HOA suportados possuírem. Além disso, os retardos de alto-falantes individuais dl para as linhas de retardo e os ganhos de alto-falante gl são determinados a partir da distância entre um alto-falante e uma posição de escuta. Este processo é descrito abaixo. Em uma concretização, as matrizes de decodificação derivadas são armazenadas dentro de um dicionário de códigos. Toda vez que as características de entrada de áudio HOA se alteram, uma unidade de controle de renderi- zador determina as características atualmente válidas e seleciona uma matriz de decodificação de correlação a partir do dicionário de códigos. A chave do dicionário de códigos pode ser a ordem HOA N, ou, de maneira equivalente, O3D (vide a eq. (6)).
[053] As etapas esquemáticas de processamento de dados para renderização são explicadas com referência à Fig. 3, que mostra um diagrama de blocos de blocos de processamento do renderizador. Estas são um primeiro armazenamento temporário 31, uma unidade de Filtragem de Domínio de Frequência 32, uma unidade de processamento de renderização 33, um segundo armazenamento temporário 34, uma unidade de retardo 35 para L canais, e um conversor digital- analógico e um amplificador 36.
[054] As amostras temporais HOA com índice de tempo t e ca nais de coeficiente HOA b(t) são primeiro armazenadas no primeiro armazenamento temporário 31 para formar blocos de M amostras com índice de bloco μ. Os coeficientes de B(μ) são filtrados por frequência na unidade de Filtragem no Domínio de Frequência 32 para obter blocos filtrados por frequência ^(/'). Esta tecnologia é conhecida (vide [3]) para compensar a distância das fontes de alto-falantes esféricas e permitir a manipulação dos registros de campo próximo. Os sinais de bloco filtrados por frequência são renderizados para o domínio espacial na unidade de processamento de renderização 33 por:
Figure img0077
com
Figure img0078
representando um sinal espacial nos L canais com blocos de M amostras temporais. O sinal é armazenado tempora riamente no segundo armazenamento temporário 34 e serializado para formar amostras temporais únicas com índice de tempo t em L canais, chamado de w(t) na Fig. 3. Este é um sinal serial que é alimentado para L linhas de retardo digitais na unidade de retardo 35. As linhas de retardo compensam diferentes distâncias de posição de escuta para o alto-falante individual l com um retardo de dl amostras. Em princípio, cada linha de retardo é uma FIFO (memória primeiro a entrar, primeiro a sair). Então, os sinais compensados por retardo 355 são convertidos de digital para analógico e amplificados no conversor e amplificador digital-analógico 36, que fornece sinais 365 que podem ser alimentados para L alto-falantes. A compensação de ganho de alto-falante pode ser considerada antes da conversão digital-analógico ou adaptando a amplificação de canal de alto-falante no domínio analógico. A inicialização do renderizador funciona como se segue.
[055] Primeiro, o número e a posição dos alto-falantes precisam ser conhecidos. A primeira etapa da inicialização consiste em tornar disponível o novo número de alto-falante L e as posições relacionadas
Figure img0079
, onde ri é a distância de uma posição de escuta para um alto-falante l, e onde
Figure img0080
são os ângulos esféricos relacionados. Vários métodos podem er aplicados, por exemplo, entrada manual das posições dos alto- falantes ou inicialização automática usando um sinal de teste. A entra da manual das posições de alto-falantes pode ser feita usando uma interface adequada, como um dispositivo móvel conectado ou uma interface do usuário integrada com o dispositivo para seleção de conjuntos de posição predefinidos. A inicialização automática pode ser feita usando um arranjo de microfones e sinais de teste de alto-falante dedicados com uma unidade de avaliação para derivar . A distância máxima rmax é determinada por
Figure img0081
a distância mínima m por
Figure img0082
As L distâncias r e rmax são transmitidas para a linha de retardo e compensação de ganho 35. O número de amostras de retardo para cada canal de alto-falante dl é determinado por
Figure img0083
com a taxa de amostragem fs, a velocidade do som c (c — 343 m/s a uma temperatura de 20o celsius) e [x + 0.5] indicando o arredondamento para o próximo número inteiro. Para compensar os ganhos de alto-falante para ri diferente, os ganhos de alto-falante são deter minados por
Figure img0084
ou são derivados usando uma medição acús tica.
[056] O cálculo das matrizes de decodificação, por exemplo, para o dicionário de códigos, funciona da seguinte maneira. As etapas es-quemáticas de um método para gerar a matriz de decodificação, em uma concretização, são ilustradas na Fig. 4. A Fig. 5 mostra, em uma concretização, blocos de processamento de um dispositivo correspondente para gerar a matriz de decodificação. As entradas são as dire- ções de alto-falante -^L, uma grade de modelagem esférica e a ordem HOA N.
[057] As direções de alto-falante
Figure img0085
podem ser expressas como ângulos esféricos
Figure img0086
, e a grade de modelagem esférica
Figure img0087
pelos ângulos esféricos
Figure img0088
O número de direções é selecionado para ser maior do que o número de alto-falantes (S > L) e maior do que o número de coeficientes HOA 0 ()s3.). As direções da grade devem amostrar a esfera unitária de forma bastante regular. Grades adequadas são dis-cutidas em [6], [9], e podem ser encontradas em [7], [8]. A grade é selecionada uma vez. Como exemplo, uma grade S = 234 de [6] é su-ficiente para matrizes de decodificação de até ordem HOA N = 9. Outras grades podem ser usadas para ordens HOA diferentes. A ordem HOA N é selecionada incrementa para preencher o dicionário de códigos de N = 1, ..., Nmax, com Nmax como a ordem HOA máxima do conteúdo de entrada HOA suportado.
[058] As direções de alto-falante e a grade de modelagem esférica são informadas para um bloco Construir Matriz Mista 41, que gera uma matriz mista G das mesmas. A grade de modelagem esférica e a ordem HOA N são informadas para um bloco Construir Matriz de Modo 42, que gera uma matriz de modo da mesma. A matriz mista G e a matriz de modo são transmitidas para um bloco Construir de Matriz de Decodificação 43, que gera uma matriz de de- codificação das mesmas. A matriz de decodificação é transmitida para um bloco de Matriz de Decodificação Suave 44, que suaviza e escalona a matriz de decodificação. Detalhes adicionais são apresentados abaixo. A saída do bloco de Matriz de Decodificação Suave 44 é a matriz de decodificação D, que é armazenada no dicionário de códigos com a chave relacionada N (ou, alternativamente, O3D). No bloco Construir de Matriz de Modo 42, a grade de modelagem esférica ^•l> é usada para construir uma matriz de modo análoga à eq. (11):
Figure img0089
Nota- se que o a matriz de modo é chamada de 3 em [2].
[059] No bloco Construir de Matriz Mista 41, uma matriz mista G é criada com
Figure img0090
Nota-se que a matriz mista G é chamada de W em [2]. Uma l-ésima fileira da matriz mista G consiste de ganhos mista D para misturar S fontes virtuais a partir das direções a para o alto- falante. Em uma concretização, o Posicionamento Panorâmico de Amplitude de Base de Vetor (VBAP) [11] é usado para derivar esses ganhos mista, como também em [2]. O algoritmo para derivar G é resumido a seguir. 1 Criar G com valores zero (isto e, inicializa G) 2 para cada s = 1...S 3 { 4 Encontrar 3 alto-falantes G que circundem a posição
Figure img0091
5 1.OTI', assumindo raios unitários e a matriz de construção
Figure img0092
com coi II 5 Calcula Lt = spherical_to_cartesian (R) em coordenadas Cartesiana. 6 Construir posição de fonte virtual
Figure img0093
7 Calcular
Figure img0094
8 Normalizar ganhos:
Figure img0095
9 Preencher elementos relacionados Gl,s de G com elementos de g:
Figure img0096
10 }
[060] No bloco Construir de Matriz de Decodificação 43, a de composição de valor singular compacto do produto de matriz da matriz de modo e da matriz mista composta é calculada. Este é um importante aspecto da presente invenção, que pode ser realizado de diversas maneiras. Em uma concretização, a decomposição de valor singular compacta S do produto de matriz da matriz de modo Φ e da matriz mista transposta G+ é calculada de acordo com:
Figure img0097
[061] Em uma concretização alternativa, a decomposição de va lor singular compacta S do produto de matriz da matriz de modo e da matriz mista pseudo-inversa G+ é calculada de acordo com:
Figure img0098
onde G* é o pseudo-inverso da matriz mista G.
[062] Em uma concretização, uma matriz diagonal onde
Figure img0099
é criada, em que o primeiro elemento diagonal é o elemento diagonal inverso ^, e os elementos diagonais seguintes são definidos em um valor de um (\- = 0 se ‘% , onde a é um valor limite, ou são definidos como um valor de zero C^.í ()) se ^V A . Verificou-se que um valor limite adequado gira em torno de 0,06. Pequenos desvios, por exemplo, dentro de uma faixa de ± 0,01 ou uma faixa de ± 10% são aceitáveis. A matriz de decodificação é então calculada como se segue:
Figure img0100
[063] No bloco de Matriz de Decodificação Suave 44, a matriz de decodificação é suavizada. Em vez de aplicar coeficientes de suaviza- ção aos coeficientes HOA antes da decodificação, como conhecido na técnica anterior, eles podem ser combinados diretamente com a matriz de decodificação. Isso economiza uma etapa de processamento, ou bloco de processamento, respectivamente.
Figure img0101
[064] De modo a obter propriedades de preservação de energia satisfatórias também para decodificadores para conteúdo HOA com mais coeficientes do que alto-falantes (isto é, O3D > L), os coeficientes de suavização aplicados são selecionados dependendo da ordem HOA N (O3D = (N + 1)2):
[065] Para L > O3D, corresponde aos coeficientes max rE deri vados dos zeros dos polinômios de Legendre de ordem N + 1, como & em [4]. Para L < O3D, os coeficientes de 'Fc construídos a partir de uma janela Kaiser como se segue: X = KaiserWindow(len, width) (22) com len = 2N + 1, width = 2N, onde é um vetor com 2N + 1 ele mentos de valor real. Os elementos são criados pela fórmula de janela de Kaiser
Figure img0102
[066] Onde I0() indica a função de Bessel Modificada de ordem zero do primeiro tipo. O vetor A é construído a partir dos elementos de:
Figure img0103
onde todo elemento । obtém 2n + 1 repetições para o índice de ordem HOA n = 0..N, e Cf é um fator de escalonamento constante para manter volume igual entre diferentes programas de ordem HOA. Isto é, os elementos usados da janela de Kaiser começam com o (N+1)-ésimo elemento, que é usado apenas uma vez, e continuam com elementos subsequentes que são usados repetidamente: o (N+2)-ésimo é usado três vezes, etc.
[067] Em uma concretização, a matriz de decodificação suaviza da é escalonada. Em uma concretização, o escalonamento é realizado no bloco de Matriz de Decodificação Suave 44, como mostra a Fig. 4 a). Em uma concretização diferente, o escalonamento é realizado como uma etapa separada em um bloco de Matriz de Escala 45, como mostra a Fig. 4 b).
[068] Em uma concretização, o fator de escalonamento constante é obtido a partir da matriz de decodificação. Em particular, ele pode ser obtido de acordo com a chamada norma de Frobenius da matriz de decodificação:
Figure img0104
onde dl,q é é um elemento de matriz na linha l e na coluna q da matriz D (após a suavização). A matriz normalizada é & = cr D
[069] A Fig. 5 mostra, de acordo com um aspecto da invenção, um dispositivo para decodificar uma representação de campo sonoro de áudio para reprodução de áudio. Ele compreende uma unidade de processamento de renderização 33 tendo uma unidade de cálculo de matriz de decodificação 140 para obter a matriz de decodificação D, a unidade de cálculo de matriz de decodificação 140 compreendendo meios 1x para obter um número L de alto-falantes alvo e meios para obter as posições dos alto-falantes, meios 1y para determinar as posições de uma grade de modelagem esférica e meios 1z para obter uma ordem N HOA, e uma primeira unidade de processamento 141 para gerar uma matriz mista G a partir das posições da grade de modelagem esférica e as posições dos alto-falantes, uma segunda unidade de processamento 142 para gerar uma matriz de modo Φ a partir da grade de modelagem esférica e a ordem N HOA, uma terceira unidade de processamento 143 para realizar uma decomposi- ção de valor singular compacto do produto da matriz de modo com a matriz mista transposta hermitiana G de acordo com
Figure img0105
onde U, V são derivados de matrizes unitárias e S é uma matriz diagonal com elementos de valor singular, meios de cálcu-lo 144 para calcular uma primeira matriz de decodificação D a partir das matrizes U, V de acordo com
Figure img0106
, e uma unidade de sua-vização e escalonamento 145 para suavizar e escalonar a primeira matriz de decodificação D com coeficientes de suavização '^, em que a matriz de decodificação D é obtida. Em uma concretização, a unidade de suavização e escalonamento 145 como uma unidade de suavi- zação 1451 para suavizar a primeira matriz de decodificação D, em que uma matriz de decodificação suavizada D é obtida, e uma unidade de escalonamento 1452 para escalonar a matriz de decodificação suavizada D, em que a matriz de decodificação D é obtida.
[070] A Fig. 6 mostra posições de alto-falante em uma configura ção de 16 alto-falantes ilustrativa em um diagrama esquemático de nós, em que os alto-falantes são ilustrados como nós conectados. As conexões de primeiro plano são ilustradas como linhas sólidas, as conexões de fundo como linhas tracejadas. A Fig. 7 mostra a mesma configuração de alto-falante com 16 alto-falantes em uma vista reduzida.
[071] A seguir, descrevem-se resultados de exemplo obtidos com a configuração de alto-falante nas Figs. 5 e 6. A distribuição de energia do sinal de som, e em particular, a razão Ê / E é ilustrada em dB na 2a esfera (todas as direções de teste). Como um exemplo para um feixe de posicionamento panorâmico de alto-falantes, o feixe de alto-falante central (alto-falante 7 na Fig. 6) é ilustrado. Por exemplo, uma matriz decodificadora que é designada como em [14], com N=3, produz uma razão Ê / E como mostra a Fig. 8. Ela proporciona características de preservação de energia quase perfeitas, uma vez que a razão Ê / E é quase constante: as diferenças entre as áreas escuras (correspondendo a volumes inferiores) e as áreas claras (correspondendo a volumes superiores) são menores do que 0,01 dB. No entanto, como mostra a Fig. 9, o feixe de posicionamento panorâmico correspondente do alto- falante central tem fortes lóbulos laterais. Isso perturba a percepção espacial, especialmente para ouvintes fora do centro.
[072] Por outro lado, uma matriz decodificadora que é designada como em [2], com N=3, produz uma razão Ê / E como mostra a Fig. 9. Na escala usada na Fig. 10, as áreas escuras correspondem a volumes inferiores de até -2 dB e as áreas claras a volumes superiores de até +2dB. Assim, a razão Ê / E mostra flutuações maiores do que 4dB, o que é desvantajoso, uma vez que desvios espaciais, por exemplo, da posição de alto-falante do topo para o centro com amplitude constante não pode ser percebida com volume igual. No entanto, como mostra a Fig. 11, o feixe de posicionamento panorâmico correspondente do alto-falante central tem lóbulos laterais muito pequenos, o que é benéfico para posições de escuta fora do centro.
[073] A Fig. 12 mostra a distribuição de energia de um sinal sono ro que é obtido com uma matriz decodificadora de acordo com a presente invenção, a título de exemplo, para N=3 para fácil comparação. A escala (ilustrada no lado direito da Fig. 12) da razão Ê / E varia de 3,15 - 3,45 dB. Assim, flutuações na razão são menores do que 0,31 dB, e a distribuição de energia no campo sonoro é muito uniforme. Consequentemente, quaisquer desvios espaciais com amplitude constante são percebidos com volume igual. O feixe de posicionamento panorâmico do alto-falante central tem lóbulos laterais muito pequenos, como mostra a Fig. 13. Isso é benéfico para posições de escuta fora do centro, onde os lóbulos laterais podem ser audíveis, e, portanto, seriam perturbadores. Assim, a presente invenção oferece vantagens combinadas que podem ser obtidas com a técnica anterior em [14] e [2], sem sofrer suas respectivas desvantagens.
[074] Nota-se que, sempre que um alto-falante é mencionado aqui, pretende-se designar um dispositivo de emissão sonora, tal como um alto-falante O fluxograma e/ou diagramas de bloco nas figuras ilustram a configuração, operação e funcionalidade de possíveis implementações dos sistemas, métodos e produtos de programa de computador de acordo com várias concretizações da presente invenção. Sob esse aspecto, cada bloco no fluxograma ou diagramas de bloco pode representar um módulo, segmento ou parte de código, que compreende uma ou mais instruções executáveis para implementar as funções lógicas especificadas. Deve-se notar ainda que, em algumas implementações alternativas, as funções observadas no bloco podem ocorrer fora da ordem observada nas figuras. Por exemplo, dois blocos apresentados em sucessão podem, de fato, ser executados de forma substancialmente simultânea, ou os blocos podem ser executados na ordem inversa, ou os blocos podem ser executados em uma ordem alternativa, dependendo da funcionalidade envolvida. Também será observado que cada bloco dos diagramas de bloco e/ou ilustração de fluxograma, e combinações dos blocos nos diagramas de bloco e/ou ilustração de fluxograma, podem ser implementados por sistemas ba-seados em hardware de propósito especial que desempenham as funções ou atos especificados, ou combinações de hardware de propósito especial e instruções de computador. Embora não descritas explicitamente, as presentes concretizações podem ser empregadas em qualquer combinação ou subcombinação.
[075] Além disso, como será apreciado pelos versados na técni ca, os aspectos dos presentes princípios podem ser incorporados como um sistema, método ou meio legível por computador. Por conseguinte, os aspectos dos presentes princípios podem assumir a forma de uma concretização inteiramente em hardware, uma concretização inteiramente em software (incluindo firmware, software residente, mi- crocódigo, e assim por diante), ou uma concretização combinando aspectos de software e hardware, todos os quais podem ser chamados de forma geral aqui de “circuito”, “módulo” ou “sistema”. Além do mais, os aspectos dos presentes princípios podem assumir a forma de um meio de armazenamento legível por computador. Qualquer combinação de um ou mais meios de armazenamento legíveis por computador pode ser utilizada. Um meio de armazenamento legível por computador, como usado aqui, é considerado um meio de armazenamento não-temporário, dada a capacidade intrínseca de armazenar as informações no mesmo, bem como a capacidade intrínseca de proporcionar recuperação das informações a partir do mesmo.
[076] Além disso, será apreciado pelos versados na técnica que os diagramas de blocos apresentados neste documento representam visualizações conceituais dos componentes do sistema e/ou do sistema de circuitos ilustrativo incorporando os princípios da invenção. De maneira semelhante, será apreciado que quaisquer fluxogramas, diagramas de fluxo de dados, diagramas de transição de estados, pseudocódigos, entre outros, representam vários processos que podem ser substancialmente representados em meios de armazenamento legíveis por computador e, portanto, executados por um computador ou processador, quer tal computador ou processador seja ilustrado explicitamente ou não. Referências citadas [1] T.D. Abhayapala. Generalized framework for spherical microphone arrays: Spatial and frequency decomposition. In Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), (accepted) Vol. X, pp. , April 2008, Las Vegas, USA. [2] Johann-Markus Batke, Florian Keiler, and Johannes Boehm. Method and device for decoding an audio soundfield representation for audio playback. International Patent Application WO2011/117399 (PD100011). [3] Jérôme Daniel, Rozenn Nicol, and Sebastien Moreau. Further investigations of high order ambisonics and wavefield synthesis for holophonic sound imaging. In AES Convention Paper 5788 Presented at the 114th Convention, March 2003. Paper 4795 presented at the 1 14th Convention. [4] Jérôme Daniel. Représentation de champs acoustiques, application a la transmission et a la reproduction de scenes sonores complexes dans un contexte multimedia. PhD thesis, Universite Paris 6, 2001. [5] James R. Driscoll and Dennis M. Healy Jr. Computing Fourier transforms and convolutions on the 2-sphere. Advances in Applied Mathematics, 15:202-250, 1994. [6] Jorg Fliege. Integration nodes for the sphere. http://www.personal.soton.ac.uk/jf1w07/nodes/nodes.html, Online, accessed 2012-06-01. [7] Jorg Fliege and Ulrike Maier. A two-stage approach for computing cubature formulae for the sphere. Technical Report, Fachbereich Mathematik, Universitat Dortmund, 1999. [8] R. H. Hardin and N. J. A. Sloane. Webpage: Spherical designs, spherical t-designs. http://www2.research.att.com/~njas/sphdesigns/. [9] R. H. Hardin and N. J. A. Sloane. Mclaren's improved snub cube and other new spherical designs in three dimensions. Discrete and Computational Geometry, 15:429-441, 1996. [10] M. A. Poletti. Three-dimensional surround sound systems based on spherical harmonics. J. Audio Eng. Soc, 53(11):1004-1025, November 2005. [11] Ville Pulkki. Spatial Sound Generation and Perception by Amplitude Panning Techniques. PhD thesis, Helsinki University of Technology, 2001 . [12] Boaz Rafaely. Plane-wave decomposition of the sound field on a sphere by spherical convolution. J. Acoust. Soc. Am., 4(1 16):2149- 2157, October 2004. [13] Earl G. Williams. Fourier Acoustics, volume 93 of Applied Mathematical Sciences. Academic Press, 1999. [14] F. Zotter, H. Pomberger, and M. Noisternig. Energy-preserving ambisonic decoding. Acta Acustica united with Acustica, 98(1):37-47, January/February 2012.

Claims (17)

1. Método para renderizar uma representação de campo sonoro Ambisonics de Ordem Superior para reprodução de áudio, caracterizado por compreender as etapas de - filtrar (32) os coeficientes B(μ) para obter coeficientes filtrados por frequência ^CO; - renderizar (33) os coeficientes filtrados por frequência ^00 para um domínio espacial usando uma matriz de decodificação D, em que um sinal espacial W(μ) é obtido; - armazenar temporariamente e serializar (34) o sinal espacial W(μ), em que amostras temporais w(t) para L canais são obtidas; - retardar (35) as amostras temporais w(t) individualmente para cada um dos L canais nas linhas de retardo, em que L sinais digitais (355) são obtidos; e - converter de digital para analógico e amplificar (36) os L sinais digitais (355), em que L sinais de alto-falante analógicos (365) são obtidos, em que a matriz de decodificação (D) da etapa de render- ização (33) é adequada para renderização para uma dada disposição de alto-falantes alvo e é obtida pelas etapas de - obter (11) um número (L) de alto-falantes alvo e posições ^-.) dos alto-falantes; - determinar (12) as posições de uma grade de modelagem esférica ^:) relacionadas à ordem HOA (N) de acordo com as amostras temporais HOA b(t) recebidas; - gerar (41) uma matriz mista (G) a partir das posições da grade de modelagem esférica ^:) e das posições dos alto-falantes (-0; - gerar (42) uma matriz de modo (^) a partir da grade de modelagem esférica ^:) e da ordem HOA (N); - realizar (43) uma decomposição de valor singular compacto do produto da matriz de modo (£) com a matriz mista transposta Hermitiana (G) de acordo com
Figure img0107
, onde U, V são derivados de matrizes Unitárias e Sé uma matriz diagonal com elementos de valor singular, e calcular uma primeira matriz de decodificação (â) a partir das matrizes U, V de acordo com â = (7, ue em que s é uma matriz de decomposição de valor singular compacto truncada que é ou uma matriz de identidade ou uma matriz diagonal modificada, a matriz diagonal modificada sendo derivada da referida matriz diagonal com elementos de valor singular pela substituição de elementos de valor singular maiores ou iguais a um limiar por uns, e pela substituição de elementos de valor singular que são menores do que o limiar por zeros; e - suavizar e escalonar (44, 45) a primeira matriz de decodi- ficação (â) com coeficientes de suavização (* ), em que a matriz de decodificação (D) é obtida, em que a referida suavização usa um primeiro método de suavização se L > O3D, e um segundo método de suavização diferente se L < O3D, com O3D = (N + 1)2, e em que uma matriz de decodificação suavizada (ã) é obtida, a qual é então escalonada.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que, no segundo método de suavização, os coeficientes de ponderação * são construídos a partir dos elementos de uma janela de Kaiser de acordo com
Figure img0108
onde cada elemento . é repetido 2-. -1 vezes para um índice de ordem HOA ■ = ■ e é um fator de escalonamento constante.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a janela de Kaiser é obtida de acordo com
Figure img0109
onde éé um vetor com ee -1 elementos de valor real criados pela fórmula de janela de Kaiser
Figure img0110
, onde ’.3Í) indica a função de Bessel Modificada de ordem zero do primeiro tipo.
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que o limiar depende dos valores reais da matriz diagonal com elementos de valor singular.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que o limiar depende de um elemento máximo S1 da matriz diagonal com elementos de valor singular.
6. Método, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que a primeira matriz de decodifica- ção (â) é suavizada (44) para obter uma matriz de decodificação suavizada (à), e o escalonamento (45) é realizado com um fator de escalonamento constante cf que é obtido a partir da norma de Frobenius da matriz de decodificação suavizada (ã) de acordo com ,
Figure img0111
onde é um elemento de matriz na linha l e coluna q da matriz de decodificação suavizada (^).
7. Método, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que a primeira matriz de decodifica- ção (â) é suavizada para obter uma matriz de decodificação suavizada (ã), e o escalonamento é realizado com um fator de escalonamento constante cf que é recebido com o sinal de entrada HOA ou recuperado de um armazenamento.
8. Método, de acordo com qualquer uma das reivindicações 2 a 7, caracterizado pelo fato de que, no primeiro método de suaviza- ção, os coeficientes de ponderação s são derivados dos zeros dos po- linômios de Legendre de ordem - -1 de acordo com
Figure img0112
com coeficientes de pondera ção de valor real e um fator constante -.
9. Método, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que as linhas de retardo compensam diferentes distâncias de alto-falante.
10. Dispositivo para renderizar uma representação de campo sonoro Ambisonics de Ordem Superior para reprodução de áudio, caracterizado por compreender - uma unidade de filtragem de domínio por frequência (32) para filtrar os coeficientes B(μ) para obter coeficientes filtrados por frequência -uO; - uma unidade de processamento de renderização (33) para renderizar os coeficientes filtrados por frequência ^C 0 para um domínio espacial usando uma matriz de decodificação (D); e - um segundo armazenamento temporário e serializador (34) para armazenar temporariamente e serializar (34) o sinal espacial W(μ), em que amostras temporais w(t) para L canais são obtidas; - uma unidade de retardo (35) contendo linhas de retardo para retardar as amostras temporais w(t) individualmente para cada um dos L canais; e - um conversor D/A e amplificador (36) para converter e amplificar os L sinais digitais, em que L sinais de alto-falante analógicos são obtidos, em que a unidade de processamento de renderização (33) tem uma unidade de cálculo de matriz de decodificação para obter a matriz de decodificação (D), a unidade de cálculo de matriz de decodi- ficação compreendendo - meios para obter um número (L) de alto-falantes alvo e meios para obter as posições ^-.) dos alto-falantes; - meios para determinar posições uma grade de modelagem esférica (-•) e meios para obter uma ordem HOA (N); e - uma primeira unidade de processamento (141) para gerar uma matriz mista (G) a partir das posições da grade de modelagem esférica ^:) e das posições dos alto-falantes; - uma segunda unidade de processamento (142) para gerar uma matriz de modo (S') a partir da grade de modelagem esférica ('~>) e da ordem HOA (N); - uma terceira unidade de processamento (143) para realizar uma decomposição de valor singular compacto do produto da matriz de modo ($) com a matriz mista transposta Hermitiana (G) de acordo com
Figure img0113
, onde U, V são derivados de matrizes Unitárias e S é uma matriz diagonal com elementos de valor singular, - meios de cálculo (144) para calcular uma primeira matriz de decodificação (â) a partir das matrizes , de acordo com 5 = [7 s , em que 5 é uma matriz de decomposição de valor singular compacto truncado que é ou uma matriz de identidade ou uma matriz diagonal modificada, a matriz diagonal modificada sendo derivada da referida matriz diagonal com elementos de valor singular pela substituição de elementos de valor singular maiores ou iguais a um limiar por uns e pela substituição de elementos de valor singular que são menores do que o limiar por zeros; e - uma unidade de suavização e escalonamento (145) para suavizar e escalonar a primeira matriz de decodificação (â) com coeficientes de suavização (* ), em que a matriz de decodificação (â) é obtida em que a unidade de processamento de renderização (33) compreende meios para aplicar a matriz de decodificação (D) à representação de campo sonoro HOA, em que um sinal de áudio decodificado é obtido.
11. Dispositivo para decodificação, de acordo com a reivindicação 10, caracterizado pelo fato de que a unidade de processamento de renderização (33) compreende meios de armazenamento para armazenar a matriz de decodificação para uso posterior.
12. Dispositivo para decodificação, de acordo com qualquer uma das reivindicações 10 a 11, caracterizado pelo fato de que a referida unidade de suavização e escalonamento (145) opera de acordo com um primeiro método de suavização se L > O3D, e um segundo método de suavização diferente se L < O3D, com O3D = (N + 1)2, e em que uma matriz de decodificação suavizada (£), a qual é então escalonada para obter uma matriz de decodificação escalonada e suavizada (D).
13. Dispositivo para decodificação, de acordo com a reivindicação 12, caracterizado pelo fato de que, no segundo método de suavização, os coeficientes de ponderação são construídos a partir dos elementos de uma janela de Kaiser de acordo com
Figure img0114
, onde cada element . é repetido 2•: -1 vezes para um índice de ordem HOA e é um fator de escalonamento constante.
14. Dispositivo para decodificação, de acordo com qualquer uma das reivindicações 10 a 13, caracterizado pelo fato de que o limiar depende dos valores reais da matriz diagonal com elementos de valor singular.
15. Dispositivo para decodificação, de acordo com a reivindicação 14, caracterizado pelo fato de que o limiar depende de um elemento máximo S1 da matriz diagonal com elementos de valor singular.
16. Dispositivo para decodificação, de acordo com qualquer uma das reivindicações 10 a 15, caracterizado pelo fato de que a primeira matriz de decodificação (â) é suavizada em uma unidade de suavização (144) para obter uma matriz de decodificação suavizada (à), e o escalonamento é realizado em um escalonador (145) com um fator de escalonamento constante cf que é obtido a partir da norma de Frobenius da matriz de decodificação suavizada (ã) de acordo com
Figure img0115
, onde . é um elemento de matriz na linha | e co luna q da matriz de decodificação suavizada (^).
17. Meio legível por computador tendo nele armazenadas instruções executáveis para fazer um computador realizar um método para decodificar uma representação de campo sonoro de áudio para reprodução de áudio, o método sendo caracterizado por compreender as etapas de - filtrar (32) os coeficientes B(μ) para obter coeficientes filtrados por frequência -00; - renderizar (33) os coeficientes filtrados por frequência -00 para um domínio espacial usando uma matriz de decodificação D, em que um sinal espacial W(μ) é obtido; - armazenar temporariamente e serializar (34) o sinal espacial W(μ), em que amostras temporais w(t) para L canais são obtidas; - retardar (35) as amostras temporais w(t) individualmente para cada um dos L canais nas linhas de retardo, em que L sinais digitais (355) são obtidos; e - converter de digital para analógico e amplificar (36) os L sinais digitais (355), em que L sinais de alto-falante analógicos (365) são obtidos, em que a matriz de decodificação (D) da etapa de render- ização (33) é adequada para renderização para uma dada disposição de alto-falantes alvo e é obtida pelas etapas de - obter (11) um número (L) de alto-falantes alvo e posições (-1) dos alto-falantes; - determinar as posições de uma grade de modelagem esférica ^:) relacionadas à ordem HOA (N) de acordo com as amostras temporais HOA b(t) recebidas; - gerar uma matriz mista (G) a partir das posições da grade de modelagem esférica ^:) e das posições dos alto-falantes (-_); - gerar uma matriz de modo (S') a partir da grade de modelagem esférica (-•) e da ordem HOA (N); - realizar uma decomposição de valor singular compacto do produto da matriz de modo (£) com a matriz mista transposta Hermiti- ana (G) de acordo com
Figure img0116
, onde U, V são derivados de matrizes Unitárias e S é uma matriz diagonal com elementos de valor singular; - calcular uma primeira matriz de decodificação (â) a partir das matrizes u de acordo com 5 = rí , em que 5 é uma matriz de decomposição de valor singular compacto truncado que é ou uma matriz de identidade ou uma matriz diagonal modificada, a matriz diagonal modificada sendo derivada da referida matriz diagonal com elementos de valor singular pela substituição de elementos de valor singular maiores ou iguais a um limiar por uns, e pela substituição de elementos de valor singular que são menores do que o limiar por ze- ros; e - suavizar e escalonar a primeira matriz de decodificação (5) com coeficientes de suavização (* ), em que a matriz de decodifi- cação (D) é obtida.
BR122020017399-8A 2012-07-16 2013-07-16 Método e dispositivo para renderizar uma representação de campo sonoro ambisonics de ordem superior para reprodução de áudio, dispositivo para decodificação e meio legível por computador BR122020017399B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP12305862 2012-07-16
EP12305862.0 2012-07-16
BR112015001128-4A BR112015001128B1 (pt) 2012-07-16 2013-07-16 Método e dispositivo para renderização de uma representação de um som ou campo sonoro e meio legível por computador
PCT/EP2013/065034 WO2014012945A1 (en) 2012-07-16 2013-07-16 Method and device for rendering an audio soundfield representation for audio playback

Publications (1)

Publication Number Publication Date
BR122020017399B1 true BR122020017399B1 (pt) 2022-05-03

Family

ID=48793263

Family Applications (3)

Application Number Title Priority Date Filing Date
BR122020017399-8A BR122020017399B1 (pt) 2012-07-16 2013-07-16 Método e dispositivo para renderizar uma representação de campo sonoro ambisonics de ordem superior para reprodução de áudio, dispositivo para decodificação e meio legível por computador
BR122020017389-0A BR122020017389B1 (pt) 2012-07-16 2013-07-16 Método e dispositivo para renderização de uma representação de campo sonoro de áudio para reprodução de áudio e meio legível por computador
BR112015001128-4A BR112015001128B1 (pt) 2012-07-16 2013-07-16 Método e dispositivo para renderização de uma representação de um som ou campo sonoro e meio legível por computador

Family Applications After (2)

Application Number Title Priority Date Filing Date
BR122020017389-0A BR122020017389B1 (pt) 2012-07-16 2013-07-16 Método e dispositivo para renderização de uma representação de campo sonoro de áudio para reprodução de áudio e meio legível por computador
BR112015001128-4A BR112015001128B1 (pt) 2012-07-16 2013-07-16 Método e dispositivo para renderização de uma representação de um som ou campo sonoro e meio legível por computador

Country Status (9)

Country Link
US (9) US9712938B2 (pt)
EP (4) EP2873253B1 (pt)
JP (7) JP6230602B2 (pt)
KR (4) KR102079680B1 (pt)
CN (6) CN106658342B (pt)
AU (5) AU2013292057B2 (pt)
BR (3) BR122020017399B1 (pt)
HK (1) HK1210562A1 (pt)
WO (1) WO2014012945A1 (pt)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
US9479886B2 (en) 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
US9736609B2 (en) 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
US9609452B2 (en) 2013-02-08 2017-03-28 Qualcomm Incorporated Obtaining sparseness information for higher order ambisonic audio renderers
US9883310B2 (en) 2013-02-08 2018-01-30 Qualcomm Incorporated Obtaining symmetry information for higher order ambisonic audio renderers
US10178489B2 (en) * 2013-02-08 2019-01-08 Qualcomm Incorporated Signaling audio rendering information in a bitstream
US9495968B2 (en) 2013-05-29 2016-11-15 Qualcomm Incorporated Identifying sources from which higher order ambisonic audio data is generated
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
EP2866475A1 (en) 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups
EP2879408A1 (en) * 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
EP2892250A1 (en) 2014-01-07 2015-07-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a plurality of audio channels
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
CN109087653B (zh) * 2014-03-24 2023-09-15 杜比国际公司 对高阶高保真立体声信号应用动态范围压缩的方法和设备
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
WO2015184316A1 (en) * 2014-05-30 2015-12-03 Qualcomm Incoprporated Obtaining symmetry information for higher order ambisonic audio renderers
CN110827839B (zh) * 2014-05-30 2023-09-19 高通股份有限公司 用于渲染高阶立体混响系数的装置和方法
EP4354432A3 (en) * 2014-06-27 2024-06-26 Dolby International AB Apparatus for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values
US9536531B2 (en) 2014-08-01 2017-01-03 Qualcomm Incorporated Editing of higher-order ambisonic audio data
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
EP3254454B1 (en) * 2015-02-03 2020-12-30 Dolby Laboratories Licensing Corporation Conference searching and playback of search results
WO2016210174A1 (en) 2015-06-25 2016-12-29 Dolby Laboratories Licensing Corporation Audio panning transformation system and method
US10468037B2 (en) 2015-07-30 2019-11-05 Dolby Laboratories Licensing Corporation Method and apparatus for generating from an HOA signal representation a mezzanine HOA signal representation
US9961467B2 (en) * 2015-10-08 2018-05-01 Qualcomm Incorporated Conversion from channel-based audio to HOA
US10249312B2 (en) 2015-10-08 2019-04-02 Qualcomm Incorporated Quantization of spatial vectors
US10070094B2 (en) * 2015-10-14 2018-09-04 Qualcomm Incorporated Screen related adaptation of higher order ambisonic (HOA) content
FR3052951B1 (fr) * 2016-06-20 2020-02-28 Arkamys Procede et systeme pour l'optimisation du rendu sonore de basses frequences d'un signal audio
CN110771181B (zh) 2017-05-15 2021-09-28 杜比实验室特许公司 用于将空间音频格式转换为扬声器信号的方法、系统和设备
US10182303B1 (en) * 2017-07-12 2019-01-15 Google Llc Ambisonics sound field navigation using directional decomposition and path distance estimation
US10015618B1 (en) * 2017-08-01 2018-07-03 Google Llc Incoherent idempotent ambisonics rendering
CN107820166B (zh) * 2017-11-01 2020-01-07 江汉大学 一种声音对象的动态渲染方法
US10264386B1 (en) * 2018-02-09 2019-04-16 Google Llc Directional emphasis in ambisonics
US11798569B2 (en) 2018-10-02 2023-10-24 Qualcomm Incorporated Flexible rendering of audio data
US20220272454A1 (en) * 2019-07-30 2022-08-25 Dolby Laboratories Licensing Corporation Managing playback of multiple streams of audio over multiple speakers
WO2023275218A2 (en) * 2021-06-30 2023-01-05 Telefonaktiebolaget Lm Ericsson (Publ) Adjustment of reverberation level
CN116582803B (zh) * 2023-06-01 2023-10-20 广州市声讯电子科技股份有限公司 扬声器阵列的自适应控制方法、系统、存储介质及终端

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5889867A (en) * 1996-09-18 1999-03-30 Bauck; Jerald L. Stereophonic Reformatter
US6645261B2 (en) 2000-03-06 2003-11-11 Cargill, Inc. Triacylglycerol-based alternative to paraffin wax
US7949141B2 (en) * 2003-11-12 2011-05-24 Dolby Laboratories Licensing Corporation Processing audio signals with head related transfer function filters and a reverberator
CN1677493A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
EP2094032A1 (en) 2008-02-19 2009-08-26 Deutsche Thomson OHG Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same
EP2486561B1 (en) * 2009-10-07 2016-03-30 The University Of Sydney Reconstruction of a recorded sound field
TWI444989B (zh) * 2010-01-22 2014-07-11 Dolby Lab Licensing Corp 針對改良多通道上混使用多通道解相關之技術
US9100768B2 (en) 2010-03-26 2015-08-04 Thomson Licensing Method and device for decoding an audio soundfield representation for audio playback
NZ587483A (en) * 2010-08-20 2012-12-21 Ind Res Ltd Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions
US9271081B2 (en) * 2010-08-27 2016-02-23 Sonicemotion Ag Method and device for enhanced sound field reproduction of spatially encoded audio input signals
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
EP2451196A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three

Also Published As

Publication number Publication date
EP2873253B1 (en) 2019-11-13
HK1210562A1 (en) 2016-04-22
JP6696011B2 (ja) 2020-05-20
EP4013072B1 (en) 2023-10-11
CN104584588B (zh) 2017-03-29
KR20200019778A (ko) 2020-02-24
CN107071686B (zh) 2020-02-14
JP2015528248A (ja) 2015-09-24
JP2018038055A (ja) 2018-03-08
JP7119189B2 (ja) 2022-08-16
JP2024009944A (ja) 2024-01-23
US10939220B2 (en) 2021-03-02
CN107071687B (zh) 2020-02-14
CN106658343B (zh) 2018-10-19
KR20230154111A (ko) 2023-11-07
KR102479737B1 (ko) 2022-12-21
EP3629605A1 (en) 2020-04-01
US10595145B2 (en) 2020-03-17
WO2014012945A1 (en) 2014-01-23
US9712938B2 (en) 2017-07-18
EP4284026A2 (en) 2023-11-29
US20230080860A1 (en) 2023-03-16
US20190349700A1 (en) 2019-11-14
CN107071685B (zh) 2020-02-14
KR20230003380A (ko) 2023-01-05
AU2017203820B2 (en) 2018-12-20
EP3629605B1 (en) 2022-03-02
US10306393B2 (en) 2019-05-28
US11743669B2 (en) 2023-08-29
AU2017203820A1 (en) 2017-06-22
BR112015001128B1 (pt) 2021-09-08
US11451920B2 (en) 2022-09-20
US20180367934A1 (en) 2018-12-20
BR112015001128A2 (pt) 2017-06-27
KR102201034B1 (ko) 2021-01-11
EP2873253A1 (en) 2015-05-20
BR112015001128A8 (pt) 2017-12-05
CN107071686A (zh) 2017-08-18
EP4013072A1 (en) 2022-06-15
AU2021203484A1 (en) 2021-06-24
US20200252737A1 (en) 2020-08-06
JP6230602B2 (ja) 2017-11-15
JP2021185704A (ja) 2021-12-09
KR102079680B1 (ko) 2020-02-20
AU2023203838A1 (en) 2023-07-13
CN106658342A (zh) 2017-05-10
KR102597573B1 (ko) 2023-11-02
AU2013292057A1 (en) 2015-03-05
AU2019201900B2 (en) 2021-03-04
CN104584588A (zh) 2015-04-29
US9961470B2 (en) 2018-05-01
US20210258708A1 (en) 2021-08-19
JP2022153613A (ja) 2022-10-12
EP4284026A3 (en) 2024-02-21
US20180206051A1 (en) 2018-07-19
US20240040327A1 (en) 2024-02-01
KR20210005321A (ko) 2021-01-13
AU2019201900A1 (en) 2019-04-11
US20170289725A1 (en) 2017-10-05
CN107071685A (zh) 2017-08-18
CN106658343A (zh) 2017-05-10
JP2019092181A (ja) 2019-06-13
JP7368563B2 (ja) 2023-10-24
US10075799B2 (en) 2018-09-11
AU2021203484B2 (en) 2023-04-20
CN106658342B (zh) 2020-02-14
US20150163615A1 (en) 2015-06-11
AU2013292057B2 (en) 2017-04-13
JP2020129811A (ja) 2020-08-27
BR122020017389B1 (pt) 2022-05-03
JP6934979B2 (ja) 2021-09-15
KR20150036056A (ko) 2015-04-07
JP6472499B2 (ja) 2019-02-20
CN107071687A (zh) 2017-08-18

Similar Documents

Publication Publication Date Title
US11743669B2 (en) Method and device for decoding a higher-order ambisonics (HOA) representation of an audio soundfield

Legal Events

Date Code Title Description
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 16/07/2013, OBSERVADAS AS CONDICOES LEGAIS.

B25G Requested change of headquarter approved

Owner name: DOLBY INTERNATIONAL AB (IE)