BRPI0316718B1 - Processo de tratamento de dados sonoros e dispositivo de aquisição sonora, aplicando esse processo - Google Patents

Processo de tratamento de dados sonoros e dispositivo de aquisição sonora, aplicando esse processo Download PDF

Info

Publication number
BRPI0316718B1
BRPI0316718B1 BRPI0316718-6A BR0316718A BRPI0316718B1 BR PI0316718 B1 BRPI0316718 B1 BR PI0316718B1 BR 0316718 A BR0316718 A BR 0316718A BR PI0316718 B1 BRPI0316718 B1 BR PI0316718B1
Authority
BR
Brazil
Prior art keywords
sound
distance
restitution
components
point
Prior art date
Application number
BRPI0316718-6A
Other languages
English (en)
Other versions
BR0316718A (pt
Inventor
Daniel Jérôme
Original Assignee
France Telecom
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=32187712&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI0316718(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by France Telecom filed Critical France Telecom
Publication of BR0316718A publication Critical patent/BR0316718A/pt
Publication of BRPI0316718B1 publication Critical patent/BRPI0316718B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0091Means for obtaining special acoustic effects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

"processo de tratamento de dados sonoros e dispositivo de aquisição sonora, aplicando esse processo". a presente invenção refere-se ao tratamento de dados sonoros. de acordo com a invenção: a) codificam-se os sinais representativos de um som que se propaga no espaço tridimensional e proveniente de uma fonte situada em uma primeira distância (p) de um ponto de referência, para se obter uma representação do som por componentes expressos em uma base de harmônicos esféricos, de origem correspondente a esse ponto de referência, b) e se aplica a essas componentes uma compensação de um efeito de campo próximo por uma filtragem que é função de uma segunda distância (r) que define, para uma restituição do som, uma distância entre um ponto de restituição (hp) e um ponto (p) de percepção auditiva no qual se coloca geralmente um ouvinte.

Description

[0001] A presente invenção refere-se ao tratamento de dados so noros.
[0002] Técnicas relativas à propagação de uma onda sonora no espaço tridimensional, implicando notadamente uma simulação e/ou uma restituição sonora(s) especializada(s), aplicam processos de tratamento do sinal áudio aplicados à simulação de fenômenos acústicos e psicoacústicos. Esses processos de tratamento prevêem um revestimento espacial do campo acústico, sua transmissão e sua reprodução espacializada sobre um conjunto de alto-falantes ou sobre fones de ouvido de um aparelho estereofônico.
[0003] Dentre as técnicas de sua espacialidade, distinguem-se du as categorias de tratamentos complementares uma da outra, mas que são geralmente utilizadas ambas, no meio de um mesmo sistema.
[0004] Por um lado, uma primeira categoria de tratamentos refere- se aos processos de síntese de efeito de sala, ou mais geralmente de efeitos ambientais. A partir de uma descrição de uma ou várias fontes sonoras (sinal emitido, posição, orientação, diretividade, ou outra) e baseando-se em um modelo de efeito de sala (implicando uma geometria de sala, ou ainda uma percepção acústica desejada), calcula-se e descreve-se um conjunto de fenômenos acústicos elementares (ondas diretas, refletidas ou difratadas), ou ainda um fenômeno acústico macroscópico (campo reverberado e difuso), permitindo traduzir o efeito espacial ao nível de um ouvido situado em um ponto escolhido de percepção auditiva, no espaço tridimensional. Calcula-se então um conjunto de sinais associados tipicamente às reflexões (fontes “secundárias”, ativas por reemissão de uma onda principal recebida, tendo um atributo de posição espacial) e/ou associados a uma reverberação tar- dia (sinais descorrelatos para um campo difuso).
[0005] Por outro lado, uma segunda categoria de processos refe re-se ao expresso posicional ou direcional de fontes sonoras. Esses processos são aplicados a sinais determinados por um processo da primeira categoria descrita antes (implicando fontes primárias e secundárias) em função da descrição espacial (posição da fonte) que lhe é associada. Em particular, esses processos de acordo com essa segunda categoria permitem obter sinais a serem difundidos através de alto-falantes ou fones de ouvido, para finalmente dar a um ouvinte a impressão auditiva de fontes sonoras instaladas em posições respectivas predeterminadas, em torno do ouvinte. Os processos, de acordo com essa segunda categoria são qualificados de “criadores de imagens sonoras tridimensionais” devido à repartição no espaço tridimensional da prova da posição das fontes por um ouvinte. Processos, de acordo com a segunda categoria, comportam geralmente uma primeira etapa de codificação espacial das ocorrências acústicas elementares que produz uma representação do campo sonoro no espaço tridimensional. Em uma segunda etapa, essa representação é transmitida ou armazenada para um uso diferido. Em uma terceira etapa, de decodifi- cação, os sinais decodificados são liberados através de alto-falantes ou fones de ouvido de um dispositivo de restituição.
[0006] A presente invenção se inscreve antes de tudo na segunda categoria pré-citada. Ela refere-se, em particular, à codificação espacial de fontes sonoras e uma especificação da representação sonora tridimensional dessas fontes. Ela se aplica tanto a uma codificação de fontes sonoras "virtuais" (aplicações nas quais fontes sonoras são simuladas, tais como jogos, uma conferência espacializada, ou outras), quanto uma codificação "acústica" de um campo sonoro natural, quando de uma tomada de som por uma ou várias redes tridimensionais de microfones.
[0007] Dentre as técnicas consideráveis de espacialização do som, o alcance "ambissônico" é preferido. A codificação ambissônica, que será descrita em detalhes depois, consiste em representar sinais relativos a uma ou várias ondas sonoras em uma base de harmônicos esféricos (em coordenadas esféricas, implicando notadamente um ângulo de elevação e um ângulo azimutal, caracterizando uma direção do(s) som(ns). As componentes que representam esses sinais e expressas nessa base de harmônicos esféricos são também função, para as ondas emitidas em campo próximo, de uma distância entre a fonte sonora que emite esse campo e um ponto correspondente à origem da base dos harmônicos esféricos. Mais particularmente, essa dependência da distância se expressa em função da freqüência sonora, conforme será visto depois.
[0008] Essa abordagem ambissônica oferece um grande número de funcionalidades possíveis, notadamente em termos de simulação de fontes virtuais, e, de maneira geral, apresenta as seguintes vantagens: - ela traduz, de forma racional, a realidade dos fenômenos acústicos e fornece um retorno auditivo espacial realista, convincente e imersivo; - a representação dos fenômenos acústicos é escalável: ela oferece uma resolução espacial que pode ser adaptada a diferentes situações. Com efeito, essa representação pode ser transmitida e explorada em função de dificuldades de vazão, quando da transmissão dos sinais codificados e/ou de limitações do dispositivo de restituição; - a representação ambissônica é flexível e é possível simular uma rotação do campo sonoro, ou ainda, na restituição, adaptar a decodificação dos sinais ambissônicos a qualquer dispositivo de restituição, de geometrias diversas.
[0009] Na abordagem ambissônica conhecida, a codificação das fontes virtuais é essencialmente direcional. As funções de codificação chegam a calcular ganhos que dependem da incidência da onda sonora expressa pelas funções harmônicas esféricas que dependem do ângulo de elevação e do ângulo azimutal em coordenadas esféricas. Em particular, na decodificação, supõe-se que os alto-falantes, na restituição, estejam distantes. Resulta daí uma distorção (ou um arquea- mento) da forma dos frontes de onda reconstruídos. Com efeito, conforme indicado antes, as componentes do sinal sonoro na base das harmônicas esféricas, para um campo próximo, dependem, de fato, também da distância da fonte e da freqüência sonora. Mais precisamente, essas componentes podem se expressar matematicamente sob a forma de um polinômio cuja variável é inversamente proporcional à distância pré-citada e à freqüência sonora. Assim, as componentes ambissônicas, no sentido de sua expressão teórica, são divergentes nas baixas freqüências e, em particular, tendem para o infinito, quando a freqüência sonora diminui para zero, quando representam um som em campo próximo emitido por uma fonte localizada a uma distância finita. Esse fenômeno matemático é conhecido, no domínio da representação ambissônica, já para a ordem 1, pelo termo bass boost, notadamente por: - M.A. Gerzon, "General Metatheory of Auditory Localisation", preprint 3306 of the 92nd AES Convention, 1992, page 52.
[00010] Esse fenômeno torna-se particularmente crítico por ordens de harmônicas esféricas elevadas implicando polinômios de potência elevada. Conhece-se por:
[00011] SONTACCHI e HOLDRICH, "Further Investigations on 3D Sound Fields using Distance Coding" (Proceedings of the COST G-6 Conference on Digital Audio Effects (DAFX-01), Limerick, Irlanda, 6-8 de dezembro 2001),
[00012] Uma técnica para considerar um arqueamento dos frontes de ondas no meio de uma representação próxima de uma representação ambissônica, cujo princípio consiste em: - aplicar uma codificação (de ordem elevada) aos sinais provenientes de uma tomada de som virtual (simulada), de tipo WFS (para "Wave Field Synthesis"); e - reconstruir o campo acústico sobre uma zona a partir de seus valores sobre uma fronteira de zona, baseando-se assim no princípio de HUYGENS-FRESNEL. Todavia, a técnica apresentada nesse documento, embora promissora pelo fato de utilizar uma representação ambissônica com uma ordem elevada, apresenta um certo número de problemas; - os recursos informáticos necessários para o cálculo de todas as superfícies que permitem aplicar o princípio de HUYGENS- FRESNEL, assim como os tempos de cálculo necessários, são excessivos; - artefatos de tratamento ditos de "aliasing spatial" aparecem por causa da distância entre os microfones, pelo menos de escolher uma rede microfones virtuais comprimida no espaço, o que torna pesados os tratamentos; - essa técnica dificilmente é transponível a um caso real de captadores a dispor em rede, em presença de uma fonte real, na aquisição; - na restituição, a representação sonora tridimensional é implicitamente sujeita a um raio captado do dispositivo de restituição, pois a decodificação ambissônica deve ser feita, no caso, sobre uma rede de alto-falantes de mesmas dimensões que a rede de microfones inicial, esse documento não propondo nenhum meio de adaptar a codificação ou a decodificação a outros tamanhos de dispositivos de restituição.
[00013] Sobretudo, esse documento apresenta uma rede horizontal de captadores, o que supõe os fenômenos acústicos, considerados, no caso, só se propagam em direções horizontais, o que exclui qualquer outra direção de propagação e que, portanto, não representa a realidade física de um campo acústico ordinário.
[00014] De forma mais geral, as técnicas atuais não permitem tratar de forma satisfatória qualquer tipo de fontes sonoras, notadamente em campo próximo, mas antes de tudo fontes sonoras distantes (ondas planas), o que corresponde a uma situação restritiva e artificial em numerosas aplicações.
[00015] Um objetivo da presente invenção é de fornecer um processo para tratar, por codificação, transmissão e restituição, um tipo qualquer de campo sonoro, em particular o efeito de uma fonte sonora em campo próximo.
[00016] Um outro objetivo da presente invenção é de fornecer um processo, que permite a codificação de fontes virtuais, não somente em direção, mas também em distância, e de definir uma decodificação adaptável a um dispositivo de restituição qualquer.
[00017] Um outro objetivo da presente invenção é de fornecer um processo de tratamento robusto para sons de quaisquer freqüências sonoras (aí incluídas as baixas freqüências) notadamente para a tomada de som de campos acústicos naturais com o auxílio de redes tridimensionais de microfones.
[00018] Para isso, a presente invenção propõe um processo de tratamento de dados sonoros, no qual: a) se codificam sinais representativos de pelo menos um som que se propaga no espaço tridimensional e proveniente de uma fonte situada em uma primeira distância de um ponto de referência, para se obter uma representação do som por componentes expressas em uma base de harmônicas esféricas, de origem correspondente a esse ponto de referência; e b) se aplicam a essas componentes uma compensação de um efeito de campo próximo por uma filtragem que é função de uma segunda distância que define sensivelmente, para uma restituição do som por um dispositivo de restituição, uma distância entre um ponto de restituição e um ponto de percepção auditiva.
[00019] Em um primeiro modo de realização, essa fonte estando distante do ponto de referência, - são obtidas componentes de ordens sucessivas m para a representação do som nessa base de harmônicas esféricas; e - é aplicado um filtro, cujos coeficientes, aplicados, cada um, a uma componente de ordem m, são expressos analiticamente sob a forma do inverso de um polinômio de potência m, cuja variável é inversamente proporcional à freqüência sonora e a essa segunda distância, para compensar um efeito de campo próximo ao nível do dispositivo de restituição.
[00020] Em um segundo modo de realização, essa fonte sendo uma fonte virtual prevista nessa primeira distância, - são obtidas componentes de ordens sucessivas m para a representação do som nessa base de harmônicos esféricos; e - é aplicado um filtro global cujos coeficientes, aplicados cada um a uma componente de ordem m, se expressam analiticamente sob a forma de uma fração, da qual: - o numerador é um polinômio de potência m, cuja variável é inversamente proporcional à freqüência sonora e a essa primeira distância, para simular um efeito de campo próximo da fonte virtual; e - o denominador é um polinômio de potência m, cuja variável é inversamente proporcional à freqüência sonora e a essa segunda distância, para compensar o efeito de campo próximo da fonte virtual nas baixas freqüências sonoras.
[00021] Preferencialmente, transmite-se ao dispositivo de restituição os dados codificados e filtrados nas etapas a) e b) com um parâmetro representativo dessa segunda distância.
[00022] Em complemento ou como variante, o dispositivo de restituição, que comporta meios de leitura de um suporte memória, memoriza-se sobre um suporte memória destinado a ser lido pelo dispositivo de restituição os dados codificados e filtrados nas etapas a) e b) com um parâmetro representativo dessa segunda distância.
[00023] Vantajosamente, previamente a uma restituição sonora por um dispositivo de restituição que comporta uma pluralidade de alto- falantes dispostos a uma terceira distância desse ponto de percepção auditiva, aplica-se aos dados codificados e filtrados um filtro de adaptação, cujos coeficientes são função dessas segunda e terceira distâncias.
[00024] Em uma realização particular, os coeficientes desse filtro de adaptação, aplicados, cada um, a uma componente de ordem m, se expressam analiticamente sob a forma de uma fração, da qual: - o numerador é um polinômio de potência m, cuja variável é inversamente proporcional à freqüência sonora e a essa segunda distância; -e o denominador é um polinômio de potência m, cuja variável é inversamente proporcional à freqüência sonora e a essa terceira distância.
[00025] Vantajosamente, para a aplicação da etapa b), são previstos: - para componentes de ordem m par, filtros audiométricos sob a forma de uma cascata de células de ordem dois; e - para componentes de ordem m ímpar, filtros audiométri- cos sob a forma de uma cascata de células de ordem dois e uma célula suplementar de ordem um.
[00026] Nessa realização, os coeficientes de um filtro audiométrico, para uma componente de ordem m, são definidos a partir dos valores numéricos das raízes desses polinômios de potência m.
[00027] Em uma realização particular, os polinômios pré-citados são polinômios de Bessel.
[00028] Para a aquisição dos sinais sonoros, prevê-se vantajosamente um microfone que comporta uma rede de transdutores acústicos ajustados sensivelmente sobre a superfície de uma esfera cujo centro corresponde sensivelmente a esse ponto de referência, para serem obtidos esses sinais representativos de pelo menos um som que se propaga no espaço tridimensional.
[00029] Nessa realização, aplica-se na etapa b) um filtro global para, por um lado, compensar um efeito de campo próximo em função dessa segunda distância e, por outro lado, equalizar os sinais provenientes dos transdutores para compensar uma ponderação de diretivi- dade desses transdutores.
[00030] Preferencialmente, prevê-se um número de transdutores função de um número total escolhido de componentes para representar o som nessa base de harmônicas esféricas.
[00031] De acordo com uma característica vantajosa, escolhe-se na etapa a) um número total de componentes na base das harmônicas esféricas para se obter, na restituição, uma região do espaço em torno do ponto de percepção na qual a restituição do som é fiel e cuja dimensões são crescentes como número total de componentes.
[00032] Preferencialmente, prevê-se, além disso, um dispositivo de restituição que comporta um número de alto-falantes pelo menos igual a esse número total de componentes.
[00033] Como variante, no âmbito de uma restituição com síntese binaural ou transaural: - prevê-se um dispositivo de restituição que comporta pelo menos um primeiro e um segundo alto-falante dispostos a uma distân- cia escolhida de um ouvinte; - obtém-se, para esse ouvinte, uma informação de alcance esperado da posição no espaço de fontes sonoras localizadas a uma distância de referência predeterminada do ouvinte para a aplicação de uma técnica dita de "síntese binaural" ou "transaural"; e - aplica-se a compensação da etapa b) com essa distância de referência sensivelmente como segunda distância.
[00034] Em uma variante na qual se introduz uma adaptação ao dispositivo de restituição com dois fones de ouvido: - prevê-se um dispositivo de restituição que comporta pelo menos um primeiro e um segundo alto-falante dispostos a uma distância escolhida de um ouvinte; - obtém-se, para esse ouvinte, uma informação de alcance da posição no espaço de fontes sonoras localizadas a uma distância de referência predeterminado do ouvinte; e - previamente a uma restituição sonora pelo dispositivo de restituição, se aplica aos dados codificados e filtrados nas etapas a) e b) um filtro de adaptação, cujos coeficientes são função da segunda distância e sensivelmente da distância de referência.
[00035] Em particular, no âmbito de uma restituição com síntese binaural: - o dispositivo de restituição comporta um envoltório com dois fones de ouvido para as respectivas orelhas do ouvinte; e, - preferencialmente, separadamente para cada ouvinte, se aplicam a codificação e a filtragem das etapas a) e b) para sinais respectivos destinados a alimentar cada fone de ouvido, com, como primeira distância, respectivamente uma distância que separa cada orelha de uma posição de uma fonte a restituir no espaço de restituição.
[00036] Preferencialmente, enforma-se, nas etapas a) e b), um sistema matricial que comporta pelo menos: - uma matriz que comporta essas componentes na base das harmônicas esféricas; e - uma matriz diagonal cujos coeficientes correspondem a coeficientes de filtragem da etapa b); e multiplicam-se essas matrizes para se obter uma matriz resultado de componentes compensadas.
[00037] De preferência, à restituição: - o dispositivo de restituição comporta uma pluralidade de alto-falantes dispostos sensivelmente a uma mesma distância do ponto de percepção auditiva; e - para decodificar esses dados codificados e filtrados nas etapas a) e b) e formar sinais adaptados para alimentar esses alto- falantes: . forma-se um sistema matricial que comporta essa matriz de decodificação predeterminada, própria ao dispositivo de restituição; e . obtém-se uma matriz que comporta coeficientes representativos dos sinais de alimentação dos alto-falantes por multiplicação da matriz resultado por essa matriz de decodificação.
[00038] A presente invenção visa também um dispositivo de aquisição sonora, que comporta um microfone munido de uma rede de transdutores acústicos dispostos sensivelmente sobre a superfície de uma esfera. De acordo com a invenção, o dispositivo comporta, além disso, uma unidade de tratamento ajustada para: - receber sinais que emanam, cada um, de um transdutor; - aplicar a esses sinais uma codificação para obter uma re-presentação do som por componentes expressas em uma base de harmônicas esféricas, de origem correspondente ao centro dessa esfera; e - aplicar a essas componentes uma filtragem que é função, por um lado, de uma distância correspondente ao raio da esfera e, por outro lado, de uma distância de referência.
[00039] Preferencialmente, a filtragem feita pela unidade de tratamento consiste, por um lado, em equalizar, em função do raio da esfera, os sinais provenientes dos transdutores para compensar uma ponderação de diretividade desses transdutores e, por outro lado, em compensar um efeito de campo próximo em função dessa distância de referência.
[00040] Outras vantagens e características da invenção aparecerão com a leitura da descrição detalhada a seguir e com o exame das figuras que a acompanham, nas quais: - a Figura 1 ilustra esquematicamente um sistema de aquisição e criação, por simulação de fontes virtuais, de sinais sonoros, com codificação, transmissão, decodificação e restituição por um dispositivo de restituição espacializada; - a Figura 2 representa mais precisamente uma codificação de sinais definidos ao mesmo tempo em intensidade e em relação à posição de uma fonte, do qual são oriundos; - a Figura 3 ilustra os parâmetros em jogo na representação ambissônica, em coordenadas esféricas; - a Figura 4 ilustra uma representação por uma métrica tri-dimensional em uma marcação de coordenadas esféricas, de harmônicas esféricas de diferentes ordens; - a Figura 5 representa um diagrama das variações do módulo de funções radiais e jm(kr), que são funções de Bessel esféricas, para valores de ordem m sucessivas, essas funções radiais intervindo na representação ambissônica de um campo de pressão acústica; - a Figura 6 representa a amplificação devido ao efeito de campo próximo para diferentes ordens sucessivas m, em particular nas baixas freqüências; - a Figura 7 representa esquematicamente um dispositivo de restituição que comporta uma pluralidade de alto-falantes HPi, com o ponto (marcado P) de percepção auditiva pré-citado, a primeira distância pré-citada (marcada p) e a segunda distância pré-citada (marcada R); - a Figura 8 representa esquematicamente os parâmetros colocados em jogo na codificação ambissônica, com uma codificação direcional, assim como uma codificação de distância, de acordo com a invenção; - a Figura 9 representa espectros de energia dos filtros de compensação e de campo próximo simulados para uma primeira distância de uma fonte virtual p = 1 m e uma pré-compensação de alto- falantes situados a uma segunda distância R = 1,5 m; - a Figura 10 representa espectros de energia dos filtros de compensação e de campo próximo simulados para uma primeira distância da fonte virtual p = 3 m e uma pré-compensação de alto-falantes situados a uma segunda distância R = 1,5 m; - a Figura 11A representa uma reconstrução do campo próximo com compensação, no sentido da presente invenção, para uma onda esférica no plano horizontal; - a Figura 11B, a ser comparada com a Figura 11A, representa o fronte de onda inicial, proveniente de uma fonte S; - a Figura 12 representa esquematicamente um módulo de filtragem para adaptar as componentes ambissônicas recebidas e pré- compensadas na codificação para uma distância de referência R como segunda distância, a um dispositivo de restituição que comporta uma pluralidade de alto-falantes dispostos a uma terceira distância R2 de um ponto de percepção auditiva; - a Figura 13A representa esquematicamente a disposição de uma fonte sonora M, à restituição, para um ouvinte que utiliza um dispositivo de restituição que aplica uma síntese binaural, com uma fonte que emite em campo próximo; - a Figura 13B representa esquematicamente as etapas de codificação e de decodificação com efeito de campo próximo no âmbito de síntese binaural da Figura 13A, à qual é combinada uma codifi- cação/decodificação ambissônica; - a Figura 14 representa esquematicamente o tratamento dos sinais provenientes de um microfone que comporta uma pluralidade de captadores de pressão ajustados sobre uma esfera, a título ilustrativo, por codificação ambissônica, equalização e compensação de campo próximo no sentido da invenção.
[00041] Faz-se referência inicialmente à Figura 1 que representa a título indicativo um sistema global de espacialização sonora. Um módulo 1a de simulação de uma cena virtual define um objeto sonoro como uma fonte virtual de um sinal, por exemplo monofônico, de posição escolhida no espaço tridimensional e que define uma direção do som. Podem ser previstas, além disso, especificações da geometria de uma sala virtual, para simular uma reverberação do som. Um módulo de tratamento 11 aplica uma gestão de uma ou várias dessa(s) fon- te(s) em relação a um ouvinte (definição de uma posição virtual das fontes em relação a esse ouvinte). Ele utiliza um processador de efeito de sala para simular reverberações ou outros, aplicando retardos e/ou filtragens usuais. Os sinais assim construídos são transmitidos a um módulo 2a de codificação espacial das contribuições elementares das fontes.
[00042] Paralelamente, uma tomada de som natural pode ser feita no âmbito de um registro sonoro por um ou vários microfone(s) dispos- to(s) de forma escolhida em relação às fontes reais (módulo 1b). Os sinais captados pelos microfones são codificados por um módulo 2b. Os sinais adquiridos e codificados podem ser transformados segundo um formato de representação intermediária (módulo 3b), antes de serem mixados pelo módulo 3 aos sinais gerados pelo módulo 1a e codificados pelo módulo 2a (proveniente das fontes virtuais). Os sinais mi- xados são em seguida transmitidos, ou ainda memorizados sobre um suporte, com vistas a uma restituição posterior (seta TR). São em seguida aplicados a um módulo de decodificação 5, com vistas à restituição sobre um dispositivo de restituição 6 que comporta alto-falantes. Se for o caso, a etapa de decodificação 5 pode ser precedida de uma etapa de manipulação do campo sonoro, por exemplo por rotação, graças a um módulo de tratamento 4 previsto a montante do módulo de decodificação 5.
[00043] O dispositivo de restituição pode se apresentar sob a forma de uma multiplicidade de alto-falantes, dispostos, por exemplo, na superfície de uma esfera em uma configuração tridimensional (perifônico) para assegurar, na restituição, notadamente um alcance de uma direção do som no espaço tridimensional. Para isso, um ouvinte se coloca geralmente no centro da esfera formada pela rede de alto-falantes, esse centro correspondendo ao ponto de percepção auditiva citado antes. Como variante, os alto-falantes do dispositivo de restituição podem ser dispostos em um plano (configuração panorâmica bidimensional), os alto-falantes sendo dispostos em particular sobre um círculo e o ouvinte colocando-se habitualmente no centro desse círculo. Em uma outra variante, o dispositivo de restituição pode se apresentar sob a forma de um dispositivo de tipo surround (5.1). Enfim, em uma variante vantajosa, o dispositivo de restituição pode se apresentar sob a forma de um envoltório com dois fones de ouvido para uma síntese binaural do som restituído, que permite ao ouvinte alcançar uma direção das fontes no espaço tridimensional, conforme será visto depois de forma detalhada. Esse dispositivo de restituição com dois alto- falantes, para um alcance no espaço tridimensional, pode se apresen- tar também sob a forma de um dispositivo de restituição transaural, com dois alto-falantes dispostos a uma distância escolhida de um ouvinte.
[00044] Refere-se então à Figura 2, para descrever uma codificação espacial e uma decodificação para uma restituição sonora tridimensional, de fontes sonoras elementares. Transmite-se a um módulo de codificação espacial 2 o sinal proveniente de uma fonte 1 a N, assim como sua posição (real ou virtual). Sua posição pode ser também definida em termos de incidência (direção da fonte vista do ouvinte) que em termos de distância entre essa fonte e um ouvinte. A pluralidade dos sinais assim codificados permite obter uma representação multicanal de um campo sonoro global. Os sinais codificados são transmitidos (seta TR) a um dispositivo de restituição sonora 6, para uma restituição sonora no espaço tridimensional, conforme indicado acima com referência à Figura 1.
[00045] Refere-se então à Figura 3 para descrever a seguir a representação ambissônica por harmônicas esféricas no espaço tridimensional, de um campo acústico. Considera-se uma zona em torno de uma origem O (esfera de raio R) isenta de fonte acústica. Adota-se um sistema de coordenadas esféricas no qual cada vetor ? desde a origem O a um ponto da esfera é descrito por um azimute θr, uma elevação δr e um raio r (correspondente à distância na origem O).
[00046] O campo de pressão p no interior dessa esfera (r < R na qual R é o raio da esfera) pode se escrever no domínio freqüencial como uma série cujos termos são os produtos ponderados de funções angulares (θ, δ) de função radial jm(kr) que dependem assim de um termo de propagação na qual k = 2 πf/c, na qual f é a freqüência sonora e c é a velocidade do som no meio de propagação.
[00047] O campo de pressão se expressa então por:
Figure img0001
[00048] O conjunto dos fatores de ponderação , que são implicitamente função da freqüência, descrevem assim o campo de pressão na zona considerada. Por essa razão, esses fatores são denominados “componentes harmônicas esféricas” e representam uma expressão freqüencial do som (ou do campo de pressão) na base das harmônicas esféricas .
[00049] As funções angulares são denominadas harmônicas esféri
Figure img0002
na qual Pmn(sinδ) são funções de Legendre de grau m e de ordem n; δp, q é o símbolo de Kronecker (igual a 1, caso p = q e 0, senão).
[00050] As harmônicas esféricas formam uma base ortonormada na qual os produtos escalares entre componentes harmônicas e, de forma geral, entre duas funções F e G, são respectivamente definidas por:
Figure img0003
[00051] As harmônicas esféricas são funções reais limitadas, conforme representado na Figura 4, em função da ordem m e índices n e a. As partes escuras e claras correspondem respectivamente aos valo- res positivos e negativos das funções harmônicas esféricas. Quanto mais a ordem m for elevada, mais a freqüência angular (e, portanto, a discriminação entre funções) será elevada. As funções radiais jm(Kr) são funções de Bessel esféricas, cujo módulo é ilustrado para alguns valores da ordem m na Figura 5.
[00052] Pode-se dar uma interpretação da representação ambissô- nica por uma base de harmônicas esféricas conforme a seguir. As componentes ambissônicas de mesma ordem m expressam finalmente "derivadas" ou "momentos" de ordem m do campo de pressão nas proximidade da origem O (centro da esfera representada na Figura 3).
[00053] Em particular, B°° =w descreve a grandeza escalar da R+1 = x R 1 = Y R+1 = 7 pressão, enquanto que 11 s 11 ' 10 são ligados aos gradientes de pressão (ou ainda à velocidade particular) à origem O. Essas quatro primeiras componentes W, X, Y e Z são obtidas, quando de uma tomada de som natural com o auxílio de microfones omnidire- tivos (para a componente W de ordem 0) e bidiretivos (para as três outras componentes seguintes). Utilizando-se um maior número de transdutores acústicos, um tratamento apropriado, notadamente por equalização, permite obter mais componentes ambissônicas (ordens m mais elevadas superiores a 1).
[00054] Considerando-se componentes suplementares de ordem mais elevada (superior a 1), portanto aumentando a resolução angular da descrição ambissônica, acede-se a uma aproximação do campo de pressão sobre uma próxima mais larga em relação ao comprimento de onda da onda sonora, em torno da origem O. Compreender-se-á que existe uma relação estreita entre a resolução angular (ordem das har-mônicas esféricas) e o abaulamento radial (raio r) que pode ser repre-sentada. Em resumo, quando se afasta espacialmente do ponto de origem O da Figura 3, mais o número de componentes ambissônicas será elevado (ordem M elevada) e melhor é a representação do som pelo conjunto dessas componentes ambissônicas. Compreender-se-á também que a representação ambissônica do som é, todavia, menos satisfatória à medida que se afasta da origem O. Esse efeito se torna crítico, em particular para freqüências sonoras elevadas (de comprimento de onda curta). Portanto, tem-se interesse em obter um número de componentes ambissônicas que seja o maior possível, o que permite criar uma região do espaço em torno do ponto de percepção, na qual a restituição do som é fiel e cujas dimensões são crescentes como número total das componentes.
[00055] Descreve-se a seguir uma aplicação a sistema de codifica- ção/transmissão/restituição de um som espacializado.
[00056] Na prática, um sistema ambissônico considera um subconjunto de componentes harmônicas esféricas, conforme descrito antes. Fala-se de um sistema de ordem M, quando este considera componentes ambissônicas de índice m < M. Quando se trata de uma restituição por um dispositivo de restituição com alto-falantes, compreender-se-á que, se esses alto-falantes forem dispostos em um plano horizontal, só as harmônicas de índice m = n serão exploradas. Ao contrário, quando o dispositivo de restituição comporta alto-falantes dispostos sobre a superfície de uma esfera ("perifonia"), pode-se em princípio explorar tantas harmônicas, quantos forem os alto-falantes.
[00057] Designa-se pela referência S o sinal de pressão portado por uma onda plana e captado no ponto O correspondente ao centro da esfera da Figura 3 (origem da base em coordenadas esféricas). A inci- dência da onda é descrita pelo azimute θ e a elevação δ. A expressão das componentes do campo associado a essa onda plana é dada pela relação:
Figure img0004
[00058] Para codificar (simular) uma fonte em campo próximo a pÍP/i:) uma distância p da origem O, aplica-se um filtro - para "arquear" a forma dos frontes de onda, considerando-se que um campo próximo emite, em primeira aproximação, uma onda esférica. As componentes codificadas do campo se tornam:
Figure img0005
e a expressão do filtro pré-citado £ - é dada pela relação:
Figure img0006
na qual π = 2πf é a pulsação da onda, f sendo a freqüência do som.
[00059] Essas duas últimas relações [A4] e [A5] mostram finalmente que, tanto para uma fonte virtual (simulada), quanto para uma fonte real em campo próximo, as componentes do som na representação ambissônica são expressas matematicamente (em particular analiticamente) sob a forma de um polinômio, no caso de Bessel, de potência m e cuja variável (c/2j®p) é inversamente proporcional à freqüência sonora.
[00060] Assim, compreender-se-á que: - no caso de uma onda plana, a codificação produz sinais que só diferem do sinal de origem de um ganho real, finito, o que corresponde a uma codificação puramente direcional (relação [A3]); - no caso de uma onda esférica (fonte em campo próximo), o filtro sup tpj^i plementar (®) codifica a informação de distância, introduzindo, na expressão das componentes ambissônicas, relações de amplitudes complexas que dependem da freqüência, conforme expresso na relação [A5].
[00061] De ser observado que esse filtro suplementar é de tipo “in-tegrador”, com um efeito de amplificação crescente e divergente (não- limitado), à medida que as freqüências sonoras decrescem em direção a zero. A Figura 6 mostra, para cada ordem m, um aumento do ganho em baixas freqüências (no caso a primeira distância p = 1m). Trata-se, portanto, de filtros instáveis e divergentes, quando se busca aplicá-los a quaisquer sinais áudio. Essa divergência será tanto mais crítica para as ordens m de valor elevado.
[00062] Compreender-se-á, em particular, a partir das relações [A3], [A4] e [A5], que a modelização de uma fonte virtual em campo próximo apresenta componentes ambissônicas divergentes em baixas freqüên- cias, de forma particularmente crítica para ordem m elevadas, conforme representado na Figura 6. Essa divergência, nas baixas freqüên- cias, corresponde ao fenômeno de "bass boos" enunciado antes. Ele se manifesta também em aquisição sonora, para fontes reais.
[00063] Por essa razão notadamente, a abordagem ambissônica, em particular para ordens m elevadas, não conheceu, no estado da técnica, uma aplicação concreta (além da teórica) no tratamento do som.
[00064] Compreende-se, em particular, que uma compensação do campo próximo é necessária para respeitar, na restituição, a forma dos frontes de ondas codificados na representação ambissônica. Com referência à Figura 7, um dispositivo de restituição comporta uma pluralidade de alto-falantes HPi, dispostos a uma mesma distância R, no exemplo descrito, de um ponto de percepção auditiva P. Nessa Figura 7: - cada ponto em que se situa um alto-falante HPi corresponde a um ponto de restituição enunciado antes; - o ponto P é o ponto de percepção auditiva enunciado antes; - esses pontos são separados da segunda distância R enunciada antes, enquanto que na Figura 3 descrita antes - o ponto O corresponde ao ponto de referência, enunciada antes, que forma a origem da base dos harmônicos esféricos, - o ponto M corresponde à posição de uma fonte (real ou virtual) situada na primeira distância p, enunciada antes, do ponto de referência O.
[00065] De acordo com a invenção, introduz-se uma pré- compressão do campo próximo no estágio mesmo da codificação, es- 1 ptü/c) C \ sa compensação colocando em jogo filtros da forma analítica
Figure img0007
e que se aplicam às componentes ambissônicos pré-citadas.
[00066] De acordo com uma das vantagens que oferece a invenção, a amplificação
Figure img0008
, cujo efeito aparece na Figura 6 é compensada pela atenuação do filtro aplicado desde a codificação 1
Figure img0009
. Em particular, os coeficientes desse filtro de compensação 1
Figure img0010
são crescentes com a freqüência do som e, em particular, tendem para zero, pelas baixas freqüências. Vantajosamente, essa pré-compressão, feita desde a codificação, assegura que os dados transmitidos não são divergentes para as baixas freqüências.
[00067] Para indicar a significação física da distância R que intervém no filtro de compensação, considera-se, a título ilustrativo, uma onda plana real, inicial, na aquisição dos sinais sonoros. Para simular um efeito de campo próximo dessa fonte distante, aplica-se o primeiro filtro da relação [A5], conforme indicado na relação [A4]. A distância p representa então uma distância entre uma fonte virtual próxima M e o ponto O que representa a origem da base esférica da Figura 3. Aplica- se assim um primeiro filtro de simulação de campo próximo para simular a presença de uma fonte virtual à distância p descrita antes. Todavia, por um lado, conforme indicado antes, os termos do coeficiente desse filtro divergente nas baixas freqüências (figura 6) e, por outro lado, a distância p pré-citada não representará forçosamente a distância entre os alto-falantes de um dispositivo de restituição e um ponto P de percepção (figura 7). De acordo com a invenção, aplica-se uma pré-compensação, na codificação, colocando em jogo um filtro de tipo 1
Figure img0011
, conforme indicado antes, o que permite, por um lado, transmitir sinais limites, e, por outro lado, escolher a distância R, desde a codi-ficação, para a restituição do som a partir dos alto-falantes HPi, tal como representado na Figura 7. Em particular, compreender-se-á que caso se tenha simulado, na aquisição, uma fonte virtual colocada à distância p da origem O, na restituição (figura 7), um ouvinte colocado no ponto P de percepção auditiva (a uma distância R dos alto-falantes HPi) ressentirá, na audição, a presença de uma fonte sonora S, colocada à distância p do ponto de percepção P e que corresponde à fonte virtual simulada, quando da aquisição.
[00068] Assim, a pré-compensação do campo próximo dos alto- falantes (colocados na distância R), no estágio da codificação, pode ser combinada a um efeito de campo próximo simulado de uma fonte virtual colocada a uma distância p. Na codificação, coloca-se finalmente em jogo um filtro total resultante, por um lado, da simulação do campo próximo, e, por outro lado, da compensação do campo próximo, os coeficientes desse filtro podendo ser expressos analiticamente pela relação:
Figure img0012
[00069] O filtro total dado pela relação [A11] é estável e constitui a parte "codificação de distância" na codificação ambissônica espacial, de acordo com a invenção, tal como representado na Figura 8. Os coeficientes desses filtros correspondem a funções de transferência monótonas da freqüência, que tendem para o valor 1 em altas fre- qüências e para o valor (R/p)m em baixas freqüências. Com referência yNFC(p!c,Ric}( x à Figura 9, os espectros de energia dos filtros
Figure img0013
' tradu zem a amplificação das componentes codificadas, devido ao efeito de campo da fonte virtual (colocada no caso a uma distância p = 1 m), com uma pré-compressão do campo dos alto-falantes (colocados a uma distância R = 1,5 m). A amplificação em decibéis é, portanto, positiva, quando p < R (caso da Figura 9) e negativa quando p > R (caso da Figura 10 na qual p = 3 m e R = 1,5 m). Em um dispositivo de restituição espacializada, a distância R entre um ponto de percepção auditiva e os alto-falantes HPi é efetivamente da ordem de um ou alguns metros.
[00070] Com referência de novo na Figura 8, compreender-se-á que, além dos parâmetros de direção θ e δ habituais, transmitir-se-á uma informação sobre as distâncias que intervêm na codificação. Assim, as funções angulares correspondentes às harmônicas esféricas ™ são conservadas para a codificação direcional.
[00071] Todavia, no sentido da presente invenção, são previstos, além disso, filtros totais (compensação de campo próximo e, se for o MHrC(p/c,Bíc) caso, simulação de um campo próximo) (w) que são aplica dos às componentes ambissônicas, em função de suas ordem m, para realizar a codificação da distância, conforme representado na Figura 8. Um modo de realização desses filtros no domínio audiométrico será descrito em detalhes depois.
[00072] Observar-se-á, em particular , que esses filtros podem ser aplicados desde mesmo a codificação de distância (R) e antes mesmo da codificação de direção (θ, δ). Compreender-se-á assim que as etapas a) e b) antes podem ser reunidas em uma mesma etapa global, ou mesmo ser invertidas (com uma codificação de distância e filtragem de compensação, seguidas de uma codificação de direção). O processo, de acordo com a invenção, não se limita, portanto, à aplicação sucessiva no tempo das etapas a) e b).
[00073] A Figura 11A representa uma visualização (vista de topo) de uma reconstrução de um campo próximo com compensação, de uma onda esférica, no plano horizontal (com os mesmos parâmetros de distância que aqueles da Figura 9), para um sistema de ordem total M = 15 e uma restituição sobre 32 alto-falantes. Na Figura 11B, representou-se a propagação da onda sonora inicial a partir de uma fonte em campo próximo situada a uma distância p de um ponto do espaço de aquisição que corresponde, no espaço de restituição, ao ponto P da Figura 7 de percepção auditiva. Observa-se na Figura 11A que os auditores (simbolizados por cabeças esquematizadas) podem localizar a fonte virtual em um mesmo local geográfico situado na distância p do ponto de percepção P na Figura 11B.
[00074] Verifica-se assim como a forma do fronte de onda codificado é respeitada após decodificação e restituição. Todavia, constatam- se sensivelmente interferências à direita do ponto P, tal como representado na Figura 11A que são devido ao fato do número de alto- falantes (portanto de componentes ambissônicas consideradas) não ser suficiente para restituir perfeitamente o fronte de ondas em jogo sobre toda a superfície delimitada pelos alto-falantes. No que se segue, descreve-se, a título de exemplo, a obtenção de um filtro audionumérico para a particularmente do processo no sentido da invenção.
[00075] Conforme indicado antes, caso se procure simular um efeito de campo próximo, compensado desde a codificação, aplica-se às componentes ambissônicas do som um filtro da forma:
Figure img0014
[00076] Da expressão da simulação de um campo próximo dado pela relação [A5]. Aparece que, para fontes distantes (p = «), a relação [A11] se torna simplesmente:
Figure img0015
[00077] Aparece, portanto, desta última relação [A12] que o caso no qual a fonte a simular emite em campo distante (fonte distante) é apenas um caso particular da expressão geral do filtro formulada na relação [A11].
[00078] No domínio dos tratamentos audionuméricos, um processo vantajoso para definir um filtro numérico a partir da expressão analítica desse filtro no domínio analógico de tempo contínuo consiste em uma "transformada bilinear".
[00079] Expressa-se inicialmente a relação [A5] sob a forma de uma transformada de Laplace, o que corresponde à:
Figure img0016
na qual T = p/c (c sendo a velocidade acústica no meio, tipicamente 340 m/s no ar).
[00080] A transformada bilinear consiste em apresentar, para uma freqüência de amostragem fs, a relação [A11] sob a forma:
Figure img0017
se m for ímpar e
Figure img0018
se m for par, na qual z é definido por
Figure img0019
em relação à rela- ção [A13] precedente, e com:
Figure img0020
na qual a = 4 fs R/c para x = a e a = 4f r/c para x = b Xm,q são as q raízes sucessivas do polinômio de Bessel:
Figure img0021
e são expressas na Tabela 1 a seguir, para diferentes ordens m, sob as formas respectivas de sua parte real, seu módulo (separados por uma vírgula) e seu valor (real), quando m é ímpar. Tabela 1: valores Re[Xm,q], I Xm,ql (e Re[Xm,m], quando m é ímpar) de um polinômio de Bessel calculadas com o auxílio do soft de cálculo MA-TLAB©.
Figure img0022
Figure img0023
[00081] Implementam-se assim os filtros numéricos, a partir dos valores da Tabela 1, prevendo-se cascatas de células de ordem 2 (para m par), e uma célula suplementar (para m ímpar), a partir das relações [A14] dadas antes.
[00082] Fabricam-se assim filtros numéricos sob uma forma de res- posta impulsional infinita, facilmente parametrável, conforme mostrado antes. Deve ser observado que uma implementação sob uma forma de resposta impulsional finita pode ser considerada e consiste em calcular o espectro complexo da função de transferência a partir da fórmula analítica, depois em deduzir daí uma resposta impulsional finita por transformada de Fourier inversa. Aplica-se em seguida uma operação de convolução para a filtragem.
[00083] Assim, introduzindo-se essa pré-compensação do campo próximo à codificação, define-se uma representação ambissônica modificada (figura 8), adotando como representação transmissível dos sinais expressos no domínio freqüencial, sob a forma:
Figure img0024
[00084] Conforme indicado antes, R é uma distância de referência à qual é associado um efeito de campo próximo compensado e c é a velocidade do som (tipicamente 340 m/s no ar). Esse representação am- bissônica modificada possui as mesmas propriedades de escalabilida- de (esquematicamente representada por dados transmitidos “envolvidos”, próximo da seta TR da Figura 1) e obedece às mesmas transformações de rotação do campo (módulo 4 da Figura 1) que a representação ambissônica habitual.
[00085] Indicam-se a seguir as operações a serem feitas para a de- codificação dos sinais ambissônicos recebidos.
[00086] Indica-se inicialmente que a operação de decodificação é adaptável a um dispositivo de restituição qualquer, de raio R2, diferente da distância de referência R antes. Para isso, aplicam-se filtros de tipo „nrc(p/c,nic) (®), tais como descritos mais acima, mas com parâmetros de distância R e R2, ao invés de p e R. Em particular, deve-se notar que só o parâmetro R/c deve ser memorizado (e/ou transmitir) entre a codi-ficação e a decodificação.
[00087] Com referência à Figura 12, o módulo de filtragem que é aí representado é previsto, por exemplo, em uma unidade de tratamento de um dispositivo de restituição. As componentes ambissônicas recebidas foram pré-compensadas na codificação para uma distância de referência R1 como segunda distância. Todavia, o dispositivo de restituição comporta uma pluralidade de alto-falantes dispostos a uma terceira distância R2 de um ponto de percepção auditiva P, essa terceira distância R2 sendo diferente da segunda distância pré-citada R1. O módulo de filtragem da Figura 12, sob a forma HNFC(Ri/c,R2/c) (Φ), adapta então, na recepção dos dados, a pré-compensação à distância R1 para uma restituição à distância R2. Naturalmente, conforme indicado antes, o dispositivo de restituição recebe também o parâmetro R1/c.
[00088] Deve ser observado que a invenção permite, além disso, mixar várias representações ambissônicos de campos sonoros (fontes reais e/ou virtuais), cujas distâncias de referência R são diferentes (se for o caso, com distâncias de referência infinitas e correspondentes a fontes distantes). Preferencialmente, filtrar-se-á uma pré-compensação de todas essas fontes a uma distância de referência a menor, antes de misturar os sinais ambissônicos, o que permite à restituição obter uma definição correta do relevo sonoro.
[00089] No âmbito de um tratamento dito de focalização sonora com, na restituição, um efeito de enriquecimento sonoro para uma direção escolhida do espaço (à maneira de um projetor luminoso que ilumina em uma direção escolhida em óptica), implicando um tratamento matricial de focalização sonora (com ponderação das componentes ambissônicas), aplica-se vantajosamente da codificação de distância com pré-compensação de campo próximo de forma combinada ao tratamento de focalização.
[00090] No que se segue, descreve-se um processo de decodifica- ção ambissônica, com compensação do campo próximo dos alto- falantes, à restituição.
[00091] Para reconstruir um campo acústico codificado, segundo o formalismo ambissônico, a partir das componentes e utilizando alto-falantes de um dispositivo de restituição que prevê um local ideal de um ouvinte que corresponde ao ponto de restituição P da Figura 7, a onda emitida por cada alto-falante é definida por um tratamento prévio de "recodificação" do campo ambissônico no centro do dispositivo de restituição, como a seguir.
[00092] Nesse contexto de "recodificação", considera-se em uma primeira etapa e para simplificação que as fontes emitem em campo distante.
[00093] Com referência de novo à Figura 7, a onda emitida por um alto-falante de índice i e de incidência (θi e δi) é alimentado por um sinal Si. Esse alto-falante participa da reconstrução da componente B'mn, por sua contribuição Si-Y “n (θi,δi).
[00094] O vetor ci dos coeficientes de codificação associados aos alto-falantes de índice i se expressa pela relação:
Figure img0025
[00095] O vetor S dos sinais que emanam do conjunto dos N alto- falantes é dado pela expressão:
Figure img0026
[00096] A matriz de codificação desses N alto-falantes (que corresponde finalmente a uma matriz de "recodificação") se expressa pela relação:
Figure img0027
na qual cada termo c1 representa um vetor, segundo a relação [B1] antes.
[00097] Antes, a reconstrução do campo ambissônico B’ é definida pela relação:
Figure img0028
[00098] A relação [B4] define assim uma operação de recodificação, prévia à restituição. Finalmente, a decodificação, como tal, consiste em comparar os sinais ambissônicos originais e recebidos pelo dispositivo de restituição, sob a forma:
Figure img0029
nos sinais recodificados B, para definir a relação geral: B’ = B [B6]
[00099] Trata-se, em particular, de determinar os coeficientes de uma matriz de decodificação D, que verifica a relação: S = D.B [B7]
[000100] De preferência, o número de alto-falantes é superior ou igual ao número de componentes ambissônicos a decodificar e a matriz de decodificação D se expressa, em função da matriz de recodifi- cação C, sob a forma: D = CT . (C.CT)-1 na qual a anotação CT corresponde à transposta da matriz C.
[000101] Deve ser observado que a definição de decodificação, veri-ficando critérios diferentes por faixas de freqüências é possível, o que permite oferecer uma restituição otimizada em função das condições de escuta, notadamente no que se refere à dificuldade de posicionamento no centro O da esfera da Figura 3, quando da restituição. Para isso, prevê-se vantajosamente uma filtragem simples, em equalização freqüencial por patamares, a cada componente ambissônica.
[000102] Todavia, para se obter uma reconstrução de uma onda ori-ginalmente codificada, é preciso corrigir a hipótese de campo distante para os alto-falantes, isto é, expressar o efeito de seu campo próximo na matriz de recodificação C antes e inverter esse novo sistema para definir o decodificador. Para isso, supondo-se uma concentricidade dos alto-falantes (dispostos a uma mesma distância R do ponto P da Figura 7), todos alto-falantes têm um mesmo efeito de campo próximo F(R/c) (®), sobre cada componente ambissônica do tipo B'mn . Introduzindo-se os termos de campo próximo sob a forma de uma matriz diagonal, a relação [B4] antes se torna:
Figure img0030
[000103] A relação [B7] antes se torna:
Figure img0031
[000104] Assim, a operação de impressão com matriz é precedida por uma operação de filtragem que compensa o campo próximo sobre cada componente B°n, e que pode ser utilizada sob a forma numérica, conforme descritos antes, com referência à relação [A14].
[000105] Reter-se-á que, na prática, a matriz C de recodificação é própria ao dispositivo de restituição. Seus coeficientes podem ser determinados inicialmente por parametração e caracterização sonora do dispositivo de restituição reagindo a uma excitação predeterminada. A matriz de decodificação D é, ela também, própria ao dispositivo de restituição. Seus coeficientes podem ser determinados pela relação [B8]. Retomando-se a anotação precedente na qual B é a matriz das componentes ambissônicas pré-compensadas, estas podem ser transmitidas ao dispositivo de restituição sob a foram matricial B com:
Figure img0032
[000106] O dispositivo de restituição decodifica em seguida os dados recebidos sob a forma matricial B (vetor coluna das componentes transmitidas), aplicando-se a matriz de decodificação D às componentes ambissônicas pré-compensadas, para formar os sinais Si destinados a alimentar os alto-falantes HPi, com:
Figure img0033
[000107] Com referência de novo à Figura 12, caso uma operação de decodificação deve ser adaptada a um dispositivo de restituição de raio R2 diferentes da distância de referência R1, um módulo de adaptação prévia à decodificação propriamente dita e descrito antes permite filtrar cada componente ambissônica ~ "n, para adaptá-lo a um dispositivo de restituição de raio R2. A operação de decodificação propriamente dita é feita em seguida, conforme descrito antes, com referência à relação [B11].
[000108] A seguir é descrita uma aplicação da invenção à síntese binaural.
[000109] Refere-se à Figura 13A na qual um ouvinte que dispõe de um envoltório com dois fones de ouvidos de um dispositivo de síntese binaural é representado. As duas orelhas do ouvinte são dispostas em pontos respectivos OL (orelha esquerda) e OR (orelha direita) do espaço. O centro da cabeça do ouvinte é disposto no ponto O e o raio da cabeça do ouvinte é de valor a. Uma fonte sonoro deve ser percebido auditivamente em um ponto M do espaço, situado a uma distância r do centro da cabeça do ouvinte (e respectivamente a distâncias rR da orelha direita e rL da orelha esquerda). Por outro lado, a direção da fonte localizada no ponto M é definida pelos vetores r, r R, e r L. De forma geral, a síntese binaural se define como a seguir.
[000110] Cada ouvinte tem uma forma de orelha que lhe é própria. A percepção de um som no espaço por esse ouvinte se faz por aprendizagem, a partir do nasci-mento, em função da forma das orelhas (notadamente a forma dos pavilhões e as dimensões da cabeça) própria a esse ouvinte. A percepção de um som no espaço se manifesta entre outros pelo fato do som chega a uma orelha, antes da outra orelha, o que se traduz por um retardo T entre os sinais a emitir por cada fone do dispositivo de restituição que aplica a síntese binaural.
[000111] O dispositivo de restituição é parametrado inicialmente, para um mesmo ouvinte, varrendo uma fonte sonora em torno de sua cabeça, a uma mesma distância R do centro de sua cabeça. Compreender-se-á assim como essa distância R pode ser considerada como uma distância entre um “ponto de restituição” conforme enunciado antes e um ponto de percepção auditiva (no caso o centro O da cabeça do ouvinte).
[000112] No que se segue, o índice L é associado ao sinal a restituir pelo fone de ouvido colocado à orelha esquerda e o índice R é associado ao sinal a restituir pelo fone de ouvido colado na orelha direita. Referindo-se à Figura 13B, aplica-se ao sinal inicial S um retardo para cada via destinada a produzir um sinal para um fone de ouvido distinto. Esses retardos TL e TR são função de um retardo máximo TMAX que cor-responde no caso à relação a/c na qual a, conforme indicado anterior-mente, corresponde ao raio da cabeça do ouvinte e c à velocidade do som. Em particular, esses retardos são definidos em função da diferença de distância do ponto O (centro da cabeça) ao ponto M (posição da fonte cujo som deve ser restituído, na Figura 13A) e de cada orelha nesse ponto M. Vantajosamente, aplicam-se, além disso, ganhos respectivos gL e gR, a cada via, que são função de uma relação das distância s do ponto O ao ponto M e de cada orelha ao ponto M. Módulos respectivos aplicados a cada via 2L e 2R codificam os sinais de cada via, em uma representação ambissônica, com pré-compensação de campo próximo NFC (para “Near Field Compensation”) no sentido da presente invenção. Compreender-se-á assim como, pela aplicação do processo no sentido da presente invenção, podem se definir os sinais provenientes da fonte M, não somente por sua direção (ângulos azimutais 0L e 0R e ângulos de elevação ÔL e ÔR ), mas também em função da distância que separa cada orelha rL e rR da fonte M. Os sinais assim codificados são transmitidos ao dispositivo de restituição que comporta módulos de decodificação ambissônico, para cada via, 5L e 5R. Assim, aplica-se uma codificação/decodificação ambissônico, com compensação de campo próximo, para cada via (fone de ouvido esquerdo, fome de ouvido direito) na restituição com síntese binaural (no caso de tipo “B-FORMAT”), sob a forma desdobrada. A compensação de campo próximo é feita, para cada via, com como primeira distância p uma distância rL e rR entre cada orelha e após M da fonte sonora a restituir.
[000113] Descreve-se a seguir uma aplicação da compensação no sentido da invenção, ao contexto da aquisição sonora em representação ambissônica.
[000114] Faz-se referência na Figura 14 na qual um microfone 141 comporta uma pluralidade de cápsulas transdutoras, capazes de captar pressões acústicas e restituir sinais elétricos S1, ..., SN. As cápsulas CAPi são dispostas sobre uma esfera de raio r predeterminado (no caso, uma esfera rígida, tal como uma bola de ping-pong por exemplo). As cápsulas são espaçadas de um passo regular sobre a esfera. Na prática, escolhe-se o número N de cápsulas em função da ordem M desejada para a representação ambissônica.
[000115] Indica-se a seguir, no contexto de um microfone que comporta cápsulas dispostas sobre uma esfera rígida, como compensar o efeito de campo próximo, desde o revestimento no contexto ambissô- nico. Mostrar-se-á, assim como a pré-compensação do campo próximo pode se aplicar não somente para a simulação de fonte virtual, conforme indicado antes, mas também à aquisição e, de forma mais geral, combinando-se a pré-compensação de campo próximo a quaisquer tipos de tratamentos implicando uma representação ambissônica.
[000116] Em presença de uma esfera rígida (capaz de introduzir uma difração das ondas sonoras recebidas), a relação [A1] dada antes se torna:
Figure img0034
[000117] As derivadas das funções de Hankel esféricas h-m obedecem à lei de recorrência:
Figure img0035
[000118] Deduzem-se as componentes ambissônicas B°n do campo inicial a partir do campo de pressão na superfície da esfera, utilizando operações de projeção e equalização dadas pela relação:
Figure img0036
[000119] Nessa expressão, EQm é um filtro equalizador que compensa uma ponderação Wm que é ligada à diretividade das cápsulas e que inclui, além disso, a difração pela esfera rígida.
[000120] A expressão desse filtro EQm é dada pela relação a seguir:
Figure img0037
[000121] Os coeficientes desse filtro de equalização não são estáveis e consegue-se um ganho infinito em freqüências muito baixas. Além disso, convém notar que as componentes harmônicas esféricas, elas mesmas, não são de amplitude finita, quando o campo sonoro não é limitado a uma propagação de ondas planas, isto é, provenientes de fontes distantes, conforme se viu anteriormente.
[000122] Por outro lado, caso, antes de tudo prever cápsulas encaixadas em uma esfera sólida, se prevejam cápsulas de tipo cardióides, com uma diretividade em campo distante dada pela expressão:
Figure img0038
[000123] Considerando-se essas cápsulas montadas sobre um suporte "transparente acusticamente", o termo de ponderação a compensar se torna:
Figure img0039
[000124] Aparece ainda que os coeficientes de um filtro de equaliza- ção correspondente ao inverso analítico dessa ponderação dada pela relação [C6] são divergentes para as mais baixas freqüências.
[000125] De forma geral, indica-se que para qualquer tipo de diretivi- dade de captadores, o ganho do filtro EQm para compensar a ponderação Wm ligada à diretividade dos captadores é infinito para as baixas freqüên- cias sonoras. Com referência à Figura 14, aplica-se vantajosamente uma pré-compensação de campo próxima na expressão mesmo do filtro de equalização EQm, dada pela relação:
Figure img0040
[000126] Assim, os sinais S1 a SN são recuperados do microfone 141. Se for o caso, aplica-se uma pré-equalização desses sinais por um módulo de tratamento 142. O módulo 143 permite expressar esses sinais no contexto ambissônico, sob forma matricial. O módulo 144 aplica o filtro da relação [C7] às componentes ambissônicas expressas em função do raio r da esfera do microfone 141. A compensação de campo próximo é feita para uma distância de referência R como segunda distância. Os sinais codificados e assim filtrados pelo módulo 144 podem ser transmitidos, se for o caso, como parâmetro representativo da distância de referência R/c.
[000127] Assim, aparece nos diferentes modos de realização ligados respectivamente à criação de uma fonte virtual em campo próximo, à aquisição de sinais sonoros provenientes de fontes reais, ou mesmo à restituição (para compensar um efeito de campo próximo dos alto- falantes), que a compensação de campo próximo ao sentido da presente invenção pode se aplicar a quaisquer tipos de tratamentos, fazendo intervir uma representação ambissônica. Essa compensação de campo próximo permite aplicar a representação ambissônica a uma multiplicidade de contextos sonoros nos quais a direção de uma fonte e vantajosamente sua distância devem ser consideradas. Além disso, a possibilidade da representação de fenômenos sonoros de quaisquer tipos (campos próximos ou distantes) no contexto ambissônico é as-segurada por essa pré-compressão, devido à limitação a valores reais finitos das componentes ambissônicas.
[000128] Naturalmente, a presente invenção não se limita à forma de realização descrita antes a título de exemplo; ela se estende a outras variantes.
[000129] Assim, compreender-se-á que a pré-compensação de campo próximo pode ser integrada, à codificação, tanto para uma fonte próxima, quanto para uma fonte distante. Nesse último caso (fonte distante e recepção de ondas planas), a distância p expressa antes será considerada como infinita, sem modificar, de forma substancial, a ex-pressão dos filtros Hm dado antes. Assim, o tratamento que utiliza pro-cessadores de efeito de sala que fornecem, em geral, sinais descorre- latos utilizáveis para modelizar o campo difuso tardio (reverberação tardia) pode ser combinado a uma pré-compensação de campo próximo. Pode-se considerar que esses sinais são de mesma energia e cor-respondem a uma parte de campo difuso correspondente à componente omnidiretiva W=B +J (Figura 4). Pode-se então construir as diversas componentes harmônicas esféricas (com uma ordem M escolhida), aplicando uma correção de ganho para cada componente ambissônica e aplica-se uma compensação de campo próximo dos alto-falantes (com uma distância de referência R que separa os alto-falantes do ponto de percepção auditiva conforme representado na Figura 7).
[000130] Naturalmente, o princípio de codificação no sentido da presente invenção é generalizável modelos de radiação diferentes das fontes monopolares (reais ou virtuais) e/ou dos alto-falantes. Com efeito, qualquer forma de radiação (notadamente uma fonte aferida no espaço) pode ser expressa por integração de uma distribuição contínua de fontes elementares pontuais.
[000131] Além disso, no contexto da restituição, é possível adaptar a compensação de campo próximo a qualquer contexto de restituição. Para isso, pode ser previsto calcular funções de transferência (recodi- ficação das componentes harmônicas esféricas de campo próximo para cada alto-falante, considerando-se uma propagação real na sala na qual o som é restituído), assim como uma inversão dessa recodifica- ção para redefinir a decodificação.
[000132] Descreveu-se antes um processo de decodificação no qual se aplicava um sistema matricial fazendo intervir as componentes am- bissônicas. Em uma variante, ele pode ser previsto um tratamento ge-neralizado por transformadas de Fourier rápidas (circular ou esférica) para limitar os tempos de cálculo e os recursos informáticos (em termos de memória) necessários ao tratamento de decodificação.
[000133] Conforme indicado antes com referência às figuras 9 e 10, constata-se que a escolha de uma distância de referência R em relação à distância p da fonte em campo próximo introduz uma diferença de ganho para diferentes valores da freqüência sonora. Indica-se que o processo de codificação com pré-compensação pode ser acoplado a uma compressão audionumérica, permitindo quantificar e ajustar o ganho para cada subfaixa freqüencial.
[000134] Vantajosamente, a presente invenção se aplica a quaisquer tipo de sistemas de espacialização sonora, notadamente para aplicações de tipo "realidade virtual" (navegação em cenas virtuais no espaço tridimensional, jogos com espacialização sonora tridimensional, conversações de tipo "chat" sonorizadas sobre a rede Internet), a soni- ficações de interfaces, a softs de edição áudio para registrar, mixar e restituir música, mas também à aquisição, a partir de uso de microfones tridimensionais, para a tomada de som musical ou cinematográfica, ou ainda para a transmissão de ambiente sonoro sobre Internet, por exemplo para "WebCam" sonorizadas.

Claims (22)

1. Processo de tratamento de dados sonoros, caracterizado pelo fato de que: a) se codificam sinais representativos de pelo menos um som que se propaga no espaço tridimensional e proveniente de uma fonte situada a uma primeira distância (p) de um ponto de referência (O), para se obter uma representação do som por componentes (Bmn°) expressas em uma base de harmônicos esféricos, de origem correspondente a esse ponto de referência (O); b) e se aplica a essas componentes (Bmn°) uma compensação de um efeito de campo próximo por uma filtragem que é função de uma segunda distância (R) que define sensivelmente, para uma restituição do som por um dispositivo de restituição, uma distância entre um ponto de restituição (HPi) e um ponto (P) de percepção auditiva.
2. Processo, de acordo com a reivindicação 1, caracterizado pelo fato de que essa fonte estando longe do ponto de referência (O), - são obtidas componentes de ordens sucessivas m para representação do som nessa base de harmônicos esféricos; e - se aplica um filtro (1/Fm), cujos coeficientes, aplicados, cada um, a uma componente de ordem m, se expressam analiticamente sob a forma do inverso de um polímero de potência m, cuja variável é inversamente proporcional à freqüência sonora e a essa distância (R), para compensar um efeito de campo próximo ao nível do dispositivo de restituição.
3. Processo, de acordo com a reivindicação 1, caracterizado pelo fato de que essa fonte sendo uma fonte virtual prevista nessa primeira distância (p), - são obtidas componentes de ordens sucessivas m para a representação do som nessa base de harmônicos esféricos; e - se aplica um filtro global (Hm), cujos coeficientes, aplicados, cada um, a uma componente de ordem m, se expressam analiticamente sob a forma de uma fração, da qual: . o numerador é um polinômio de potência m, cuja variável é inversamente proporcional à freqüência sonora e a essa primeira dis-tância (p), para simular um efeito de campo próximo da fonte virtual; e . o denominador é um polinômio de potência m, cuja variável é inversamente proporcional à freqüência sonora e a essa segunda distância (R), para compensar o efeito do campo próximo da fonte virtual nas baixas freqüências sonoras.
4. Processo, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que se transmite ao dispositivo de restituição os dados codificados e filtrados nas etapas a) e b) com um parâmetro representativo dessa segunda distância (R/c).
5. Processo, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que o dispositivo de restituição, que comporta meios de leitura de um suporte memória, se memoriza sobre um suporte memória destinado a ser lido pelo dispositivo de restituição os dados codificados e filtrados nas etapas a) e b) com um parâmetro representativo dessa segunda distância (R/c).
6. Processo, de acordo com qualquer uma das reivindicações 4 e 5, caracterizado pelo fato de que, previamente a uma restituição sonora, por um dispositivo de restituição, que comporta uma pluralidade de alto-falantes dispostos a uma terceira distância (R2) desse ponto de percepção auditiva (P), se aplica aos dados codificados e filtrados um filtro de adaptação (Hm(R1/c, R2/c)), cujos coeficientes são função dessas segunda (R1) e terceira distâncias (R2).
7. Processo, de acordo com a reivindicação 6, caracterizado pelo fato de que os coeficientes desse filtro de adaptação (Hm(R1/c, R2/c)), aplicados, cada um, a uma componente de ordem m, se expres- sam analiticamente sob a forma de uma fração, da qual: - o numerador é um polinômio de potência m, cuja variável é inversamente proporcional à freqüência sonora e a essa segunda distância (R), - e o denominador é um polinômio de potência m, cuja variável é inversamente proporcional à freqüência sonora e a essa terceira distância (R2).
8. Processo, de acordo com qualquer uma das reivindicações 2, 3 e 7, caracterizado pelo fato de que, para a aplicação da etapa b), são previstos: - para componentes de ordem m par, filtros audionuméricos sob a forma de uma cascata de células de ordem dois; e - para componentes de ordem m ímpar, filtros audionuméri- cos sob a forma de uma cascata de células de ordem dois e uma célula suplementar de ordem um.
9. Processo, de acordo com a reivindicação 8, caracterizado pelo fato de que os coeficientes de um filtro audionumérico, para um componente de ordem m, são definidos a partir dos valores numéricos das raízes desses polinômios de potência m.
10. Processo, de acordo com qualquer uma das reivindica-ções 2, 3, 7, 8 e 9, caracterizado pelo fato de que esses polinômios são polinômios de Bessel.
11. Processo, de acordo com qualquer uma das reivindica-ções 1, 2 e 4 a 10, caracterizado pelo fato de que se prevê um microfone que comporta uma rede de transdutores acústicos dispostos sen-sivelmente sobre a superfície de uma esfera, cujo centro corresponde sensivelmente ao ponto de referência (O), para serem obtidos esses sinais representativos de pelo menos um som que se propaga no espaço tridimensional.
12. Processo, de acordo com a reivindicação 11, caracteri- zado pelo fato de que se aplica à etapa b) um filtro global para, por um lado, compensar um efeito de campo próximo em função dessa segunda distância (R) e, por outro lado, equalizar os sinais oriundos dos transdutores para compensar uma ponderação de diretividade desses transdutores.
13. Processo, de acordo com qualquer uma das reivindica-ções 11 e 12, caracterizado pelo fato de que se prevê um número de transdutores função de um número total escolhido de componentes para representar o som nessa base de harmônicos esféricos.
14. Processo, de acordo com qualquer uma das reivindica-ções precedentes, caracterizado pelo fato de que se escolhe na etapa a) um número total de componentes na base dos harmônicos esféricos para se obter, na restituição, uma região do espaço em torno do ponto de percepção (P) na qual a restituição do som é fiel e cujas dimensões são crescentes com o número total de componentes.
15. Processo, de acordo com a reivindicação 14, caracteri-zado pelo fato de que se prevê um dispositivo de restituição que comporta um número de alto-falantes pelo menos igual a esse número total de componentes.
16. Processo, de acordo com qualquer uma das reivindica-ções 1 a 5, e 13, caracterizado pelo fato de que: - se prevê um dispositivo de restituição que comporta pelo menos um primeiro e um segundo alto-falantes dispostos em uma dis-tância escolhida de um ouvinte; - se obtém, para esse ouvinte, uma informação de prova da posição no espaço de fontes sonoras localizadas a uma distância de referência predeterminada (R) do ouvinte; e - se aplica a compensação da etapa b) com essa distância de referência sensivelmente como segunda distância.
17. Processo, de acordo com qualquer uma das reivindica- ções 1 a 3, e 8 a 13, consideradas em combinação com uma das rei-vindicações 4 e 5, caracterizado pelo fato de que: - se prevê um dispositivo de restituição que comporta pelo menos um primeiro alto-falante e um segundo alto-falante dispostos a uma distância escolhida de um ouvinte; - se obtém, para esse ouvinte, uma informação de prova da posição no espaço de fontes sonoras localizadas a uma distância de referência predeterminada (R2) do ouvinte; e - previamente a uma restituição sonora pelo dispositivo de restituição, se aplica aos dados codificados e filtrados nas etapas a) e b) um filtro de adaptação (Hm(R/c, R2/c)), cujos coeficientes são função da segunda distância (R) e sensivelmente da distância de referência (R2).
18. Processo, de acordo com qualquer uma das reivindica-ções 16 e 17, caracterizado pelo fato de que: - o dispositivo de restituição comporta um envoltório com dois fones para os ouvidos respectivos do ouvinte; e - separadamente, para cada ouvido, se aplica a codificação e a filtragem das etapas a) e b) para sinais respectivos destinados a alimentar cada fone, com, como primeira distância (p), respectivamente uma distância (rR, rL) que separa cada ouvido de uma posição (M) de uma fonte a restituir.
19. Processo, de acordo com qualquer uma das reivindica-ções precedentes, caracterizado pelo fato de que se enforma, nas etapas a) e b), um sistema matricial, comportando pelo menos: - uma matriz (B) que comporta essas componentes na base dos harmônicos esféricos; e - uma matriz diagonal (Diag(1/Fm)), cujos coeficientes cor-respondem a coeficientes de filtragem da etapa b); - e se multiplicam essas matrizes para se obter uma matriz resultado de componentes compensadas (£)
20. Processo, de acordo com a reivindicação 19, caracteri-zado pelo fato de que: - o dispositivo de restituição comporta uma pluralidade de alto-falantes dispostos sensivelmente a uma mesma distância (R) do ponto de percepção auditiva (P); e - para decodificar esses dados codificados e filtrados nas etapas a) e b), e formar sinais adaptados para alimentar esses alto- falantes: . se forma um sistema matricial que comporta essa matriz resultado (£) e uma matriz de decodificação (D) predeterminada, própria ao dispositivo de restituição; e . se obtém uma matriz (S) que comporta coeficientes repre-sentativos dos sinais de alimentação dos alto-falantes por multiplicação da matriz das componentes compensadas (£) por essa matriz de decodificação (D).
21. Dispositivo de aquisição sonora, comportando um mi-crofone munido de uma rede de transdutores acústicos dispostos sen-sivelmente sobre a superfície de uma esfera, caracterizado pelo fato de comportar além disso uma unidade de tratamento disposta para: - receber sinais que emanam, cada um, de um transdutor, - aplicar a esses sinais uma codificação para se obter uma representação do som por componentes (Bmn°) expressas em uma base de harmônicos esféricos, de origem correspondente ao centro dessa esfera (O); - e aplicar a essas componentes (Bmn°) uma filtragem que é função, por um lado, de uma distância correspondente ao raio da esfera (r) e, por outro lado, de uma distância de referência (R).
22. Dispositivo, de acordo com a reivindicação 21, caracte-rizado pelo fato de essa filtragem consistir, por um lado, em equalizar, em função do raio da esfera, os sinais provenientes dos transdutores para compensar uma ponderação de diretividade desses transdutores e, por outro lado, em compensar um efeito de campo próximo, em função de uma distância de referência escolhida (R), definindo sensivelmente, para uma restituição do som, uma distância entre um ponto de restituição (HPi) e um ponto (P) de percepção auditiva.
BRPI0316718-6A 2002-11-19 2003-11-13 Processo de tratamento de dados sonoros e dispositivo de aquisição sonora, aplicando esse processo BRPI0316718B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0214444 2002-11-19
FR0214444A FR2847376B1 (fr) 2002-11-19 2002-11-19 Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
PCT/FR2003/003367 WO2004049299A1 (fr) 2002-11-19 2003-11-13 Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede

Publications (2)

Publication Number Publication Date
BR0316718A BR0316718A (pt) 2005-10-18
BRPI0316718B1 true BRPI0316718B1 (pt) 2021-11-23

Family

ID=32187712

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0316718-6A BRPI0316718B1 (pt) 2002-11-19 2003-11-13 Processo de tratamento de dados sonoros e dispositivo de aquisição sonora, aplicando esse processo

Country Status (13)

Country Link
US (1) US7706543B2 (pt)
EP (1) EP1563485B1 (pt)
JP (1) JP4343845B2 (pt)
KR (1) KR100964353B1 (pt)
CN (1) CN1735922B (pt)
AT (1) ATE322065T1 (pt)
AU (1) AU2003290190A1 (pt)
BR (1) BRPI0316718B1 (pt)
DE (1) DE60304358T2 (pt)
ES (1) ES2261994T3 (pt)
FR (1) FR2847376B1 (pt)
WO (1) WO2004049299A1 (pt)
ZA (1) ZA200503969B (pt)

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10328335B4 (de) * 2003-06-24 2005-07-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Wellenfeldsyntesevorrichtung und Verfahren zum Treiben eines Arrays von Lautsprechern
US20050271216A1 (en) * 2004-06-04 2005-12-08 Khosrow Lashkari Method and apparatus for loudspeaker equalization
EP1938661B1 (en) * 2005-09-13 2014-04-02 Dts Llc System and method for audio processing
WO2007104877A1 (fr) * 2006-03-13 2007-09-20 France Telecom Synthese et spatialisation sonores conjointes
FR2899424A1 (fr) * 2006-03-28 2007-10-05 France Telecom Procede de synthese binaurale prenant en compte un effet de salle
US8180067B2 (en) * 2006-04-28 2012-05-15 Harman International Industries, Incorporated System for selectively extracting components of an audio input signal
US7876903B2 (en) * 2006-07-07 2011-01-25 Harris Corporation Method and apparatus for creating a multi-dimensional communication space for use in a binaural audio system
US8036767B2 (en) 2006-09-20 2011-10-11 Harman International Industries, Incorporated System for extracting and changing the reverberant content of an audio input signal
ES2359752T3 (es) * 2006-09-25 2011-05-26 Dolby Laboratories Licensing Corporation Resolución espacial mejorada del campo sonoro para sistemas de reproducción de audio multicanal mediante derivación de señales con términos angulares de orden superior.
DE102006053919A1 (de) * 2006-10-11 2008-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer Anzahl von Lautsprechersignalen für ein Lautsprecher-Array, das einen Wiedergaberaum definiert
JP2008118559A (ja) * 2006-11-07 2008-05-22 Advanced Telecommunication Research Institute International 3次元音場再生装置
JP4873316B2 (ja) * 2007-03-09 2012-02-08 株式会社国際電気通信基礎技術研究所 音響空間共有装置
EP2094032A1 (en) * 2008-02-19 2009-08-26 Deutsche Thomson OHG Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same
US20110002469A1 (en) * 2008-03-03 2011-01-06 Nokia Corporation Apparatus for Capturing and Rendering a Plurality of Audio Channels
EP2154910A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for merging spatial audio streams
ES2425814T3 (es) 2008-08-13 2013-10-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato para determinar una señal de audio espacial convertida
GB0815362D0 (en) 2008-08-22 2008-10-01 Queen Mary & Westfield College Music collection navigation
US8819554B2 (en) * 2008-12-23 2014-08-26 At&T Intellectual Property I, L.P. System and method for playing media
EP2205007B1 (en) 2008-12-30 2019-01-09 Dolby International AB Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
GB2478834B (en) 2009-02-04 2012-03-07 Richard Furse Sound system
CN102318373B (zh) * 2009-03-26 2014-09-10 松下电器产业株式会社 解码装置、编解码装置及解码方法
CN102687536B (zh) * 2009-10-05 2017-03-08 哈曼国际工业有限公司 用于音频信号的空间提取的系统
KR20240009530A (ko) * 2010-03-26 2024-01-22 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
JP5672741B2 (ja) * 2010-03-31 2015-02-18 ソニー株式会社 信号処理装置および方法、並びにプログラム
US20110317522A1 (en) * 2010-06-28 2011-12-29 Microsoft Corporation Sound source localization based on reflections and room estimation
US9456289B2 (en) 2010-11-19 2016-09-27 Nokia Technologies Oy Converting multi-microphone captured signals to shifted signals useful for binaural signal processing and use thereof
US9313599B2 (en) 2010-11-19 2016-04-12 Nokia Technologies Oy Apparatus and method for multi-channel signal playback
US9055371B2 (en) 2010-11-19 2015-06-09 Nokia Technologies Oy Controllable playback system offering hierarchical playback options
EP2541547A1 (en) * 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
WO2013068402A1 (en) * 2011-11-10 2013-05-16 Sonicemotion Ag Method for practical implementations of sound field reproduction based on surface integrals in three dimensions
KR101282673B1 (ko) 2011-12-09 2013-07-05 현대자동차주식회사 음원 위치 추정 방법
US8996296B2 (en) * 2011-12-15 2015-03-31 Qualcomm Incorporated Navigational soundscaping
KR102068186B1 (ko) 2012-02-29 2020-02-11 어플라이드 머티어리얼스, 인코포레이티드 로드 록 구성의 저감 및 스트립 프로세스 챔버
EP2645748A1 (en) 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
WO2013150341A1 (en) 2012-04-05 2013-10-10 Nokia Corporation Flexible spatial audio capture apparatus
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
US9479886B2 (en) 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
US9761229B2 (en) * 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
CN107454511B (zh) 2012-08-31 2024-04-05 杜比实验室特许公司 用于使声音从观看屏幕或显示表面反射的扬声器
US9838824B2 (en) 2012-12-27 2017-12-05 Avaya Inc. Social media processing with three-dimensional audio
US9892743B2 (en) 2012-12-27 2018-02-13 Avaya Inc. Security surveillance via three-dimensional audio space presentation
US9301069B2 (en) * 2012-12-27 2016-03-29 Avaya Inc. Immersive 3D sound space for searching audio
US10203839B2 (en) * 2012-12-27 2019-02-12 Avaya Inc. Three-dimensional generalized space
US9736609B2 (en) 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
US9959875B2 (en) * 2013-03-01 2018-05-01 Qualcomm Incorporated Specifying spherical harmonic and/or higher order ambisonics coefficients in bitstreams
US10635383B2 (en) 2013-04-04 2020-04-28 Nokia Technologies Oy Visual audio processing apparatus
EP2997573A4 (en) 2013-05-17 2017-01-18 Nokia Technologies OY Spatial object oriented audio apparatus
US9420393B2 (en) * 2013-05-29 2016-08-16 Qualcomm Incorporated Binaural rendering of spherical harmonic coefficients
US20140358565A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Compression of decomposed representations of a sound field
EP2824661A1 (en) * 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
DE102013013378A1 (de) * 2013-08-10 2015-02-12 Advanced Acoustic Sf Gmbh Aufteilung virtueller Schallquellen
US9807538B2 (en) 2013-10-07 2017-10-31 Dolby Laboratories Licensing Corporation Spatial audio processing system and method
EP2866475A1 (en) * 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
EP2930958A1 (en) * 2014-04-07 2015-10-14 Harman Becker Automotive Systems GmbH Sound wave field generation
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
JP6388551B2 (ja) * 2015-02-27 2018-09-12 アルパイン株式会社 複数領域音場再現システムおよび方法
DE102015008000A1 (de) * 2015-06-24 2016-12-29 Saalakustik.De Gmbh Verfahren zur Schallwiedergabe in Reflexionsumgebungen, insbesondere in Hörräumen
EP3402221B1 (en) * 2016-01-08 2020-04-08 Sony Corporation Audio processing device and method, and program
CN108476365B (zh) * 2016-01-08 2021-02-05 索尼公司 音频处理装置和方法以及存储介质
EP3402223B1 (en) 2016-01-08 2020-10-07 Sony Corporation Audio processing device and method, and program
EP4376444A2 (en) 2016-08-01 2024-05-29 Magic Leap, Inc. Mixed reality system with spatialized audio
US11032663B2 (en) * 2016-09-29 2021-06-08 The Trustees Of Princeton University System and method for virtual navigation of sound fields through interpolation of signals from an array of microphone assemblies
US20180124540A1 (en) * 2016-10-31 2018-05-03 Google Llc Projection-based audio coding
FR3060830A1 (fr) * 2016-12-21 2018-06-22 Orange Traitement en sous-bandes d'un contenu ambisonique reel pour un decodage perfectionne
US10182303B1 (en) * 2017-07-12 2019-01-15 Google Llc Ambisonics sound field navigation using directional decomposition and path distance estimation
US10764684B1 (en) * 2017-09-29 2020-09-01 Katherine A. Franco Binaural audio using an arbitrarily shaped microphone array
US10721559B2 (en) 2018-02-09 2020-07-21 Dolby Laboratories Licensing Corporation Methods, apparatus and systems for audio sound field capture
US11875089B2 (en) * 2018-03-02 2024-01-16 Sonitor Technologies As Acoustic positioning transmitter and receiver system and method
US10771913B2 (en) 2018-05-11 2020-09-08 Dts, Inc. Determining sound locations in multi-channel audio
CN110740404B (zh) * 2019-09-27 2020-12-25 广州励丰文化科技股份有限公司 一种音频相关性的处理方法及音频处理装置
CN110740416B (zh) * 2019-09-27 2021-04-06 广州励丰文化科技股份有限公司 一种音频信号处理方法及装置
EP4085660A4 (en) 2019-12-30 2024-05-22 Comhear Inc. METHOD FOR PROVIDING A SPATIAL SOUND FIELD
CN111537058B (zh) * 2020-04-16 2022-04-29 哈尔滨工程大学 一种基于Helmholtz方程最小二乘法的声场分离方法
US11743670B2 (en) 2020-12-18 2023-08-29 Qualcomm Incorporated Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications
CN113791385A (zh) * 2021-09-15 2021-12-14 张维翔 一种三维定位方法及系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53114201U (pt) * 1977-02-18 1978-09-11
US4731848A (en) * 1984-10-22 1988-03-15 Northwestern University Spatial reverberator
JP2569872B2 (ja) * 1990-03-02 1997-01-08 ヤマハ株式会社 音場制御装置
JP3578783B2 (ja) * 1993-09-24 2004-10-20 ヤマハ株式会社 電子楽器の音像定位装置
US5745584A (en) * 1993-12-14 1998-04-28 Taylor Group Of Companies, Inc. Sound bubble structures for sound reproducing arrays
GB9726338D0 (en) * 1997-12-13 1998-02-11 Central Research Lab Ltd A method of processing an audio signal
US7231054B1 (en) * 1999-09-24 2007-06-12 Creative Technology Ltd Method and apparatus for three-dimensional audio display
US7340062B2 (en) * 2000-03-14 2008-03-04 Revit Lawrence J Sound reproduction method and apparatus for assessing real-world performance of hearing and hearing aids
CA2406926A1 (en) * 2000-04-19 2001-11-01 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions

Also Published As

Publication number Publication date
BR0316718A (pt) 2005-10-18
US7706543B2 (en) 2010-04-27
US20060045275A1 (en) 2006-03-02
FR2847376B1 (fr) 2005-02-04
JP2006506918A (ja) 2006-02-23
FR2847376A1 (fr) 2004-05-21
ATE322065T1 (de) 2006-04-15
EP1563485B1 (fr) 2006-03-29
EP1563485A1 (fr) 2005-08-17
AU2003290190A1 (en) 2004-06-18
DE60304358D1 (de) 2006-05-18
KR100964353B1 (ko) 2010-06-17
CN1735922B (zh) 2010-05-12
ES2261994T3 (es) 2006-11-16
KR20050083928A (ko) 2005-08-26
CN1735922A (zh) 2006-02-15
DE60304358T2 (de) 2006-12-07
JP4343845B2 (ja) 2009-10-14
WO2004049299A1 (fr) 2004-06-10
ZA200503969B (en) 2006-09-27

Similar Documents

Publication Publication Date Title
BRPI0316718B1 (pt) Processo de tratamento de dados sonoros e dispositivo de aquisição sonora, aplicando esse processo
US11184727B2 (en) Audio signal processing method and device
US9215544B2 (en) Optimization of binaural sound spatialization based on multichannel encoding
Noisternig et al. Reconstructing sound source directivity in virtual acoustic environments
Mehra et al. Source and listener directivity for interactive wave-based sound propagation
JP2017522771A (ja) ルーム最適化された伝達関数の決定および使用
US20050069143A1 (en) Filtering for spatial audio rendering
Sakamoto et al. Sound-space recording and binaural presentation system based on a 252-channel microphone array
WO2022108494A1 (en) Improved modeling and/or determination of binaural room impulse responses for audio applications
Pelzer et al. Auralization of a virtual orchestra using directivities of measured symphonic instruments
Pulkki et al. Spatial effects
Otani et al. Binaural Ambisonics: Its optimization and applications for auralization
Ifergan et al. On the selection of the number of beamformers in beamforming-based binaural reproduction
CN113314129B (zh) 一种适应环境的声场重放空间解码方法
Guthrie Stage acoustics for musicians: A multidimensional approach using 3D ambisonic technology
US20210127222A1 (en) Method for acoustically rendering the size of a sound source
Vorländer Virtual acoustics: opportunities and limits of spatial sound reproduction
Yagunova et al. Ambisonics and Sonic Simulation in Virtual Reality
Paulo et al. Perceptual Comparative Tests Between the Multichannel 3D Capturing Systems Artificial Ears and the Ambisonic Concept
JP7493411B2 (ja) バイノーラル再生装置およびプログラム
US11304021B2 (en) Deferred audio rendering
Ahrens et al. Authentic auralization of acoustic spaces based on spherical microphone array recordings
Vorländer et al. 3D Sound Reproduction
Zotkin et al. Efficient conversion of XY surround sound content to binaural head-tracked form for HRTF-enabled playback
Forster Auralization in room acoustics

Legal Events

Date Code Title Description
B08L Patent application lapsed because of non payment of annual fee [chapter 8.12 patent gazette]

Free format text: REFERENTE AO NAO RECOLHIMENTO DAS 9A E 10A ANUIDADES.

B08I Publication cancelled [chapter 8.9 patent gazette]

Free format text: ANULADA A PUBLICACAO CODIGO 8.12 NA RPI NO 2257 DE 08/04/2014 POR TER SIDO INDEVIDA.

B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE AS 9A, 10A, 11A, 12A, 13A, 14A, 15A E 16A ANUIDADES.

B08G Application fees: restoration [chapter 8.7 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 13/11/2003, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.

B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: REFERENTE A 19A ANUIDADE.

B24D Patent annual fee: restoration after fee payment