FR2858512A1 - Procede et dispositif de traitement de donnees sonores en contexte ambiophonique - Google Patents

Procede et dispositif de traitement de donnees sonores en contexte ambiophonique Download PDF

Info

Publication number
FR2858512A1
FR2858512A1 FR0309388A FR0309388A FR2858512A1 FR 2858512 A1 FR2858512 A1 FR 2858512A1 FR 0309388 A FR0309388 A FR 0309388A FR 0309388 A FR0309388 A FR 0309388A FR 2858512 A1 FR2858512 A1 FR 2858512A1
Authority
FR
France
Prior art keywords
components
matrix
signals
ambiophonic
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR0309388A
Other languages
English (en)
Inventor
Jerome Daniel
Sebastien Moreau
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Priority to FR0309388A priority Critical patent/FR2858512A1/fr
Priority to PCT/FR2004/002009 priority patent/WO2005015954A2/fr
Publication of FR2858512A1 publication Critical patent/FR2858512A1/fr
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

La présente invention concerne le traitement de signaux captés pour obtenir des composantes ambiophoniques. Cette opération (1), dite de matriçage, est effectuée en appliquant une matrice à ces signaux captés qui est corrigée pour préserver une orthonormalité entre les harmoniques ambiophoniques et, de là, minimiser un effet de repliement de composantes ambiophoniques sur des composantes en cours d'estimation.

Description

Procédé et dispositif de traitement de données sonores en contexte
ambiophonique
La présente invention concerne le traitement de données sonores en contexte 5 ambiophonique, notamment dans le cadre d'une prise de son spatialisée à partir d'un microphone 3D.
On estime des composantes spatiales de champ acoustique réel à partir de signaux captés par un nombre limité de capteurs sonores, tels que des capsules piézoélectriques agencées selon une antenne microphonique. Pour une représentation tridimensionnelle du champ acoustique, cette antenne peut se présenter sous la forme d'un microphone 3D dont les capsules sont réparties sensiblement sur une sphère. Ci-après, on assimile ces composantes spatiales du champ à des composantes dites "composantes harmoniques sphériques". Toutefois, on indique qu'une distribution des capteurs de l'antenne microphonique, autre qu'une distribution sphérique, peut aussi être envisagée.
En règle générale, plus le nombre de capteurs prévus dans le microphone est 20 élevé et plus l'ordre des composantes spatiales obtenues peut être élevé.
L"'ordre" d'une composante spatiale se rattache à la fréquence angulaire avec laquelle elle "scrute" le champ sonore. Ainsi, la considération d'ordres élevés offre une résolution spatiale accrue du champ représenté. De manière générale encore, le nombre de capteurs à prévoir est toujours supérieur ou 25 égal au nombre total de composantes spatiales qu'il est possible de déterminer.
On définit par les termes "encodage ambiophonique" I'étape consistant à obtenir ces composantes spatiales du champ. Cet encodage permet ainsi de 30 transmettre une représentation du champ sonore sous forme de signaux dits "ambiophoniques" (traduction du mot anglais "ambisonic"), éventuellement codés en compression par ailleurs, puis d'en faire, moyennant une opération de décodage ambiophonique sur les signaux transmis, une diffusion sur hautparleurs ou sur casque afin de reproduire les impressions auditives spatiales qui auraient été éprouvées à la place de l'antenne microphonique.
L'encodage ambiophonique est utilisé notamment en prise de son directive, pour l'extraction d'informations spatiales et l'analyse d'une scène sonore, ou encore pour une manipulation du champ sonore.
On connaît notamment par le document: "A Highly Scalable Spherical Microphone Array Based on an Orthonormal Decomposition of the Sound Field"', Jens Meyer- Gary Elko, Vol. Il-pp. 17811784 in Proc. ICASSP 2002, une méthode d'estimation exacte des composantes ambiophoniques si l'on 15 dispose d'une mesure du champ acoustique sur toute la surface d'une sphère, et partant d'un modèle a priori de description du champ, en utilisant par exemple l'expression mathématique de la pression en surface d'une sphère rigide, ou encore les directivités de type cardioïde pour des capteurs placés sur un support acoustiquement transparent.
Toutefois, en pratique, on ne dispose de mesures qu'en un nombre limité de points, puisque la distribution de capteurs ne peut être que discrète et finie. En conséquence, I'estimation est sujette à des artefacts dits "aliasing spatial". Il s'agit d'une erreur irréductible qui apparaît comme un défaut de consistance 25 de l'information spatiale captée lorsque la longueur d'onde n'est plus assez grande devant l'espacement entre les capsules, donc pour des fréquences supérieures à une fréquence dite "d'aliasing" qui dépend notamment du nombre de capteurs et du rayon du microphone s'il est de géométrie sphérique.
Par ailleurs, il n'existe pas de distribution géométrique discrète tridimensionnelle dans le placement des capsules à la surface de la sphère qui puisse satisfaire certaines propriétés, notamment l'orthonormalité des harmoniques sphériques, sur laquelle se base l'approche théorique évoquée 5 dans le document cité ci-avant, en particulier pour l'estimation de composantes spatiales d'ordres élevés.
En effet, le procédé d'estimation à partir d'un nombre fini de signaux,, dans ce document, est basé sur un calcul théorique exploitant la connaissance du champ acoustique à la surface d'une sphère (distribution continuede points de mesure), acoustiquement transparente ou bien solide. Ce calcul consiste, pour l'estimation d'une composante spatiale donnée, en une "projection" du champ sonore mesuré sur la fonction harmonique sphérique associée. A cet effet, le calcul exploite implicitement les propriétés d'orthonormalité des harmoniques 15 sphériques. En fait, la distribution discrète et finie de capteurs, pour une géométrie quelconque, ne permet pas de préserver strictement l'orthonormalité des harmoniques sphériques entre elles, au moins à partir de l'ordre 2 ou 3. En conséquence, la méthode de projection n'assure pas la bonne séparation des composantes spatiales. Certaines composantes 20 estimées sont ainsi "polluées" par d'autres composantes présentes dans le champ.
La présente invention vient améliorer la situation.
Elle propose à cet effet un procédé de traitement de données sonores en contexte ambiophonique, dans lequel a) on obtient N signaux émanant de capteurs sonores, b) on forme une base d'harmoniques ambiophoniques comportant un nombre total de KM composantes sous la forme d'une matrice de base comportant N 30 colonnes et KM lignes, où KM est inférieur ou égal à N, et c) on applique un traitement de matriçage aux N signaux pour obtenir des composantes ambiophoniques des N signaux, exprimées dans ladite base des harmoniques.
Selon une définition générale de l'invention, à l'étape c), on applique auxdits N signaux une matrice corrigée vérifiant sensiblement la condition: D.YMt = 1, où - D est la matrice corrigée, - YMt est la transposée de la matrice représentant ladite base des harmoniques ambiophoniques, et - I est la matrice identité.
On s'efforce ainsi, dès le traitement de matriçage, à respecter la condition d'orthonormalité entre les harmoniques ambiophoniques constituant la base précitée. On comprendra ainsi que le terme "corrigée" qualifiant la matrice D vise notamment cette compensation du défaut d'orthonormalité au sens de l'invention.
Toutefois, comme indiqué ci-avant, le nombre N de signaux captés est 20 généralement supérieur au nombre total KM de composantes ambiophoniques qu'il est possible d'obtenir. Déterminer les coefficients de la matrice corrigée D reviendrait donc à résoudre un système de N inconnues avec, au plus, KM équations.
Dans une première approche, on cherche à minimiser une influence des composantes d'ordres m' inférieurs à un ordre courant m dans l'estimation des composantes ambiophoniques d'ordre m.
En effet, on indique que l'étape de matriçage précitée est souvent suivie d'une 30 égalisation spectrale pour compenser une directivité intrinsèque de chaque capteur dans la capture du champ. Typiquement, I'amplification due à cette égalisation est prépondérante pour les ordres élevés par rapport aux ordres plus faibles, en particulier dans les basses fréquences. Le phénomène d'aliasing précité est d'autant plus gênant que les autres composantes "polluantes" sont d'ordres plus bas par rapport aux composantes à estimer car 5 lI'erreur induite par les premières composantes d'ordres faibles est alors d'autant plus amplifiée sur les composantes d'ordres plus élevés, en particulier en basses fréquences.
Dans un mode de réalisation selon la première approche, les coefficients d.7 de la matrice corrigée D sont obtenus par vérification d'un système de Km équations à N inconnues d<,[i] (1<i<N), de type:
N
d } o.Yn,,n = Idm'.[i].ymn [i] = 1 i=1
N
d. = d,[].y,,,[] = 0O pour (m m ou n n ') i=1 avec m'<m<M, Km =(m+1)2, et où: - du,, sont les coefficients de la matrice corrigée D = d,,, l, et Y,,,, sont les coefficients de la transposée de la matrice de base yM[.. . Y,.
YM = 1Y} l On indique que les indices m, n et c sont définis comme suit: m est l'ordre de la composante, 20 - n est compris entre 0 et m, - et cy vaut -1 ou 1, sauf pour l'ordre m=0.
Ainsi, le nombre total Km de composantes jusqu'à l'ordre m est donné par la relation Km = (m+1)2.
Toujours dans cette première approche, on peut exprimer alors la matrice corrigée D comme la matrice pseudo-inverse de la transposée de la matrice de base YM. La matrice corrigée D est déterminée alors avantageusement par la relation D = pinv(YMt) = (YM.YM')-.YM Si l'on choisit d'obtenir un ordre maximum Mmic des composantes ambiophoniques, tel que Mm,,c < E(-N)1 (où E(x) signifie la partie entière de x), la matrice corrigée D s'exprime avantageusement par la 10 relation D = (Y.Ym).YM ' Où - YM,,c est une matrice représentant la base des harmoniques d'ordre maximum choisi Mmic, et - YM est une matrice représentant la base des harmoniques d'ordre maximum M qu'il est possible d'atteindre avec N signaux et défini par M = E(./N)- 1. 15 Dans une seconde approche, comme le nombre N de signaux est généralement tel que N>(M+1)2, où M est l'ordre maximum qu'il est possible d'atteindre avec lesdits N signaux, il subsiste N-KM degrés de liberté pour estimer les coefficients d,,,, de la matrice corrigée D (avec KM=(M+1)2). 20 Selon cette seconde approche, préférentiellement complémentaire de la première approche, on cherche à minimiser une influence potentielle de composantes d'ordres supérieurs à M dans l'estimation des KM composantes ambiophoniques.
En effet, comme indiqué ci-avant, lorsque la longueur d'onde n'est plus assez grande devant l'espacement entre les capsules, donc pour des fréquences supérieures à la fréquence d'aliasing, I'estimation des composantes ambiophoniques n'est plus fiable. En d'autres termes, I'estimation des composantes ambiophoniques, de manière générale, n'est valable que dans un domaine de basses fréquences inférieures à cette fréquence d'aliasing.
Plus particulièrement, on verra plus loin que cette fréquence d'aliasing diminue lorsque l'ordre m d'une composante ambiophonique augmente. Ainsi, plus 5 l'ordre m d'une composante estimée est élevé et plus la bande de fréquences, dans laquelle son estimation est valide, est réduite.
On comprendra ainsi que chercher à minimiser la "pollution" des composantes d'ordre M par des composantes d'ordres M' supérieurs à l'ordre M permet 10 d'élargir la bande de fréquences où l'estimation des composantes d'ordre M est valide, au-delà des fréquences d'aliasing liées aux ordres M'.
Dans un mode de réalisation selon cette seconde approche, I'estimation des coefficients d,,, de la matrice corrigée D s'effectue alors par minimisation 15 d'une expression de type: "2 M<r'_<M' 0_<n'_<n', r'=+l où M' correspond à un ordre supérieur à l'ordre maximum M. Préférentiellement, on estime les coefficients d'n de la matrice 20 corrigée D par une minimisation d'une expression de type: ,L]MM = " | M <n'<Mf' O<n'<m',< '=_+1 faisant intervenir un facteur de pondération ym, m' pour donner une importance moins forte aux composantes d'ordres m' supérieurs aux ordres m des composantes déjà estimées.
Dans un mode de réalisation particulièrement avantageux selon cette seconde approche, ladite minimisation est effectuée par calcul au sens des moindres carrés et consiste à résoudre N-KM équations du type: ilM'M'I] -0, avec/= 1,2, ..., (N-KM), ad , [il] où d,.E[i,] sont N-KM inconnues parmi N inconnues.
Les N-KM coefficients ainsi déterminés sont réinjectés dans la relation 5 générale D.YMt= I ci-avant, et l'on obtient ainsi une expression D' de la matrice corrigée, bien adaptée pour les hautes fréquences.
Préférentiellement, on prévoit alors à l'étape c) deux opérations de matriçage différenciées en: cl) une première bande de basses fréquences des composantes ambiophoniques, où l'on applique une matrice corrigée D donnée par une relation du type: D = pinv(YM') = (YM.YM')-'.YM,' c2) une seconde bande de hautes fréquences des composantes ambiophoniques, où l'on applique une matrice corrigée D' dont les coefficients 15 sont obtenus par minimisation d'une expression du type ]MM']:E Z |,,',, dni M<n '<M'O<n'<m',ny'=+l Les opérations cl) et c2) sont ensuite suivies d'une sommation des deux matriçages voie par voie.
Ainsi, on prévoit préférentiellement de filtrer les Km composantes ambiophoniques, en aval de modules de matriçage, en conservant: - les composantes basses fréquences, lorsque ces composantes ambiophoniques sont obtenues par un matriçage utilisant la matrice D selon la première approche, et - les composantes hautes fréquences, lorsque ces composantes ambiophoniques sont obtenues par un matriçage utilisant la matrice D' selon la seconde approche.
En variante, on peut filtrer plutôt les N signaux initiaux: - avec des filtres passe-bas, puis appliquer ces signaux filtrés à un matriçage utilisant la matrice D corrigée selon la première approche, et - avec des filtres passe-haut, puis appliquer ces signaux filtrés à un matriçage utilisant la matrice D' corrigée selon la seconde approche, et sommer enfin les composantes ambiophoniques résultant une à une des deux matriçages.
Toutefois, il est plus avantageux de filtrer les composantes ambiophoniques en aval des matriçages, puisqu'il n'y a à prévoir que 2xKm filtres dans ce cas, alors qu'un filtrage des N signaux en amont des matriçages nécessiterait 2xN filtres, soit 2x(N-Km) filtres supplémentaires (avec N>Km).
On indique en outre, de façon plus générale, que la matrice D' corrigée selon 15 la seconde approche permet aussi d'obtenir, à elle seule, une évaluation satisfaisante des composantes ambiophoniques sur toute le spectre de fréquences. Ainsi, dans une variante simple des étapes cl) et c2) ci-avant de deux matriçages séparés, un unique matriçage utilisant cette matrice D' est aussi envisagé.
De façon générale, on comprendra que l'application du procédé au sens de l'invention permet d'améliorer la qualité du traitement des signaux sonores par encodage ambiophonique et, de là, augmenter les performances à la restitution. En outre, les capteurs du microphone étant généralement de 25 positions spatiales respectives globalement prédéterminées, on peut former, à l'étape b), la base d'harmoniques ambiophoniques par échantillonnage spatial en fonction d'une estimation grossière des positions des capteurs.
Avantageusement, I'application de la matrice corrigée D, à l'étape c), permet de compenser sensiblement des erreurs de positions des capteurs.
On indique qu'à cet effet, une mesure d'étalonnage d'un champ acoustique de répartition spatiale bien connue peut être mise en oeuvre.
La présente invention vise aussi un dispositif pour encoder des signaux sonores en composantes ambiophoniques, comportant au moins: - une entrée propre à recevoir N signaux émanant de capteurs sonores montés sur une antenne microphonique, et - un module de matriçage appliquant auxdits N signaux au moins une matrice de base, représentative d'une base d'harmoniques ambiophoniques, pour obtenir des composantes ambiophoniques estimées des N. signaux et exprimées dans ladite base.
Dans le dispositif au sens de l'invention, ladite matrice de base comporte des coefficients de gains ajustés pour minimiser préférentiellement au moins une influence de composantes d'ordres m' inférieurs à un ordre courant m d'une composante estimée, dans des basses fréquences, inférieures à une fréquence limite.
Comme indiqué ci-avant, le matriçage unique à partir de la matrice corrigée D' 20 selon la seconde approche permet à lui seul d'obtenir une évaluation satisfaisante des composantes ambiophoniques. On comprendra ainsi que les coefficients de cette matrice de base D' sont avantageusement de gains ajustés pour minimiser aussi une influence de composantes d'ordres M' supérieurs à un ordre maximum M des composantes estimées, dans des 25 hautes fréquences, supérieures à la fréquence limite précitée.
En variante, le module de matriçage est agencé pour appliquer en outre une seconde matrice de base comportant des coefficients calculés pour minimiser au moins une influence de composantes d'ordres M' supérieurs à un ordre 30 maximum M des composantes estimées, dans des hautes fréquences, supérieures à ladite fréquence limite.
Préférentiellement, le module de matriçage comporte un sous-module de séparation desdits N signaux en au moins deux bandes de fréquences, respectivement inférieures à ladite fréquence limite et supérieures à ladite 5 fréquence limite, pour appliquer deux traitements respectifs de matriçage pour les signaux basses fréquences et pour les signaux hautes fréquences, ainsi qu'un sous-module de sommation voie par voie pour sommer les composantes ambiophoniques obtenues dans les deux gammes de fréquences.
Dans une variante plus avantageuse car utilisant seulement 2xKm filtres au lieu de 2xN filtres, le module de matriçage comporte un sous-module de filtrage desdites Km composantes ambiophoniques en au moins deux bandes de fréquences, respectivement inférieures à ladite fréquence limite et supérieures à ladite fréquence limite, ainsi qu'un sous-module de sommation 15 voie par voie pour sommer les composantes ambiophoniques filtrées dans les deux gammes de fréquences.
D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée ci-après, et des dessins annexés sur lesquels: - la figure 1 est un schéma général illustrant le traitement de signaux microphoniques, en aval d'un microphone tridimensionnel, ici de géométrie sphérique, - la figure 2 représente les courbes d'égalisation appliquée aux composantes issues du module de matriçage 1 de la figure 1, - les figures 3a à 3d montrent une simulation de l'erreur relative mnjlBmnU moyenne (traits continus) et sa variance (en traits interrompus) , en valeur absolue et en fonction de la fréquence, de l'estimation des composantes ambiophoniques par le procédé classique de "projection" simple, respectivement pour un ordre maximum égal à 1, pour un ordre maximum égal 30 à 2, pour un ordre maximum égal à 3 et pour un ordre maximum égal à 4, pour un dispositif à 32 capsules et pour un ensemble de 200 incidences aléatoires, - la figure 4 représente une carte du résidu de "non orthonormalité" pour des composantes ambiophoniques jusqu'à l'ordre 6 inclus et pour les 32 positions illustrées sur la figure 1, - les figures 5a à 5d montrent la simulation de l'erreur relative cmn"/Bmn7 s moyenne (traits continus) et sa variance (en traits interrompus), en valeur absolue et en fonction de la fréquence, de l'estimation des composantes ambiophoniques par le procédé au sens de l'invention, respectivement pour un ordre maximum égal à 1, pour un ordre maximum égal à 2, pour un ordre maximum égal à 3 et pour un ordre maximum égal à 4, pour un même dispositif à 32 capsules et pour un ensemble de 200 incidences aléatoires, . - la figure 6 illustre une représentation par une métrique tridimensionnelle dans un repère de coordonnées sphériques, d'harmoniques sphériques Yn de différents ordres, - la figure 7 représente en détail le module de matriçage 1 de la figure 1, dans 15 une réalisation particulière de l'invention, - la figure 8 représente en détail le module de matriçage 1 de la figure 1, dans une réalisation avantageuse de l'invention,variante de la réalisation de la figure - et la figure 9 représente en détail le module de matriçage 1 de la figure 1, 20 utilisant trois modules de matriçage dans une réalisation encore plus avantageuse.
On se réfère tout d'abord à la figure 1, sur laquelle un dispositif de traitement des signaux microphoniques reçoit N signaux issus d'une antenne 25 microphonique 3. Les N signaux individuels dits "primaires" sont captés par autant de capsules microphoniques CM. Dans l'exemple représenté, ces capteurs sont incrustés à la surface d'une sphère S, par exemple supposée rigide. Ainsi, dans le cas d'une distribution sphérique de l'antenne microphonique, chaque capteur occupe sensiblement le sommet d'un polyèdre régulier circonscrit dans la sphère. Le polyèdre représenté sur la figure 1 comporte 32 sommets et le microphone 3D, autant de capteurs.
Pour un tétraèdre, on prévoit 4 capteurs. Pour un cube, on prévoit 6 capteurs. 5 Pour un octaèdre, on prévoit 8 capteurs. Pour un dodécaèdre, on prévoit 12 capteurs, etc. On remarque donc qu'en géométrie sphérique, le nombre de capteurs ne peut varier que par quanta. Si l'on choisit d'obtenir un nombre total KM de composantes ambiophoniques, on doit prévoir par excès un nombre supérieur N de capteurs. C'est la raison pour laquelle le nombre N de signaux 10 captés est généralement supérieur au nombre total KM de composantes ambiophoniques qu'il est possible d'obtenir. De façon plus générale, le nombre N de capsules microphoniques est en fait supérieur au nombre KM de composantes harmoniques sphériques acquises et/ou retenues après traitement.
Le microphone 3 dit alors "ambiophonique", basé ici sur une distribution sphérique de capsules microphoniques élémentaires, a pour vocation de produire un "encodage acoustique" de champs acoustiques 3D naturels, basé sur leur décomposition en harmoniques sphériques.
On rappelle ci-après les principes habituels pour encoder un champ acoustique en harmoniques sphériques 3D, qui s'appuient sur une projection du champ capté à la surface d'une sphère. On considère à cet effet un champ acoustique, en l'absence de la sphère microphonique (donc en champ libre), 25 défini par la série de Fourier-Bessel: p(?) = Zj j,,, (kr) ZBY,,m(tU,.), (.1) m=O O_<n<mn.cy=+l où les fonctions harmoniques sphériques Y", définissent une base orthonormée au sens du produit scalaire qu'on appelle '"projection" par la suite, avec une expression générale du type: (FI|G>4 = f-fF(û)G(i)dn(û) , qui se traduit par: Ix) 4z ô ,ô ( Gmn4 4, =4r fln aa.5 bj est le symbole de Kronecker qui vaut 1 si i=j et 0 sinon.
Les harmoniques sphériques Ymn sont des fonctions réelles bornées, comme représenté sur la figure 6, en fonction de l'ordre m et des indices n et a. On indique que n est compris entre 0 et m et que a vaut +1 ou -1, sauf pour l'ordre 0. Ainsi, le nombre Km de composante pour un ordre courant m vaut: Km= (m+ 1)2 Sur la figure 6, les parties sombres et claires correspondent respectivement aux valeurs positives et négatives des fonctions harmoniques sphériques. Plus l'ordre m est élevé et plus la fréquence angulaire (et donc la discrimination entre fonctions) est élevée.
Le module 1 de matriçage de la figure 1, appliqué aux N signaux microphoniques élémentaires, fournit alors des composantes "brutes" B,n gh(,/,) du champ acoustique capté.
On décrit ci-après l'étape d'égalisation spectrale de ces composantes brutes, qui suit donc l'opération de matriçage des N signaux captés.
La décomposition donnée par l'expression ( .1) et ses propriétés d'orthonormalité suggèrent qu'en fixant r=a (où a est le rayon du microphone 25 3D) et en réalisant une projection définie par le produit scalaire ci-dessus des termes de la série sur chaque harmonique sphérique Y., on obtient la composante ambiophonique correspondante brute B,,u, à un facteur j J, ,(ka) près.
On peut appliquer un principe similaire aux cas de capteurs possédant éventuellement une directivité intrinsèque (par exemple des capsules cardioldes), et/ou par les propriétés acoustiques de leur support (par exemple 5 une sphère rigide ou encore acoustiquement transparente supportant les capsules).
On décrit ci-après l'influence d'une directivité intrinsèque dans la capture du champ, en particulier dans le cas de capsules encastrées dans une sphère 10 solide. On indique ensuite comment compenser, à partir de filtres égaliseurs, une telle directivité.
Une sphère microphonique solide, de rayon a, centrée à l'origine O, induit un champ diffracté, et le champ de pression à sa surface (et dans la direction iJ) 15 vaut: PR (S)= Wm (ka) Z BmnYnvn (ui nm=0 O0S<,,.,=+, ( .2) où les coefficients de pondération des harmoniques sphériques W,, (ka) = 2 (ka)j-+ traduisent la directivité intrinsèque des capteurs.
(k)h-(a,,, + Ces coefficients sont fonction de la fréquence. Dans le cas de capteurs à 20 directivité cardioïde G(O)=a+(1-a)cos(O) (directivité en champ lointain), montés sur une structure acoustiquement transparente et orientés radialement vers l'extérieur, on indique que le terme de pondération serait à remplacer par: W,?(ka)= jn'(aj,,(ka)-j(l-a)j,.'(ka)), où a dépend en pratique de la fréquence (les capsules tendent à devenir omnidirectives (a =1), en basses 25 fréquences).
Compte tenu des propriétés présumées d'orthonormalité de la base, on déduit généralement les composantes ambiophoniques Bc, du champ initial à partir du champ de pression en surface de la sphère, moyennant des opérations de projection et d'égalisation, exprimées ainsi: B = EQ (PR oYù)4, o le filtre égaliseur B'm=Q (pR Y', 4z ' EQ, (.3). W.
compense la pondération W,. exprimée ci-avant.
En pratique, ces filtres égaliseurs ne sont pas stables pour m1>l. Leur amplification tend vers l'infini en très basses fréquences. En outre, la stricte description mathématique ( .1) ne peut donner lieu à une représentation stable, car le cas de champs acoustiques ordinaires impliquerait des signaux BUJuin éventuellement d'amplitude infinie.
Avantageusement, on incorpore une pré-compensation de champ proche (notamment celui des haut-parleurs utilisés au stade de la restitution), et l'on cherche donc à estimer des composantes: jNFC(R/) _(IC AU_ (R Rc) c) = i) Bn<,, Où les filtres F(R/c)(o) traduisent l'effet d'un champ proche (pour une distance R dite de référence) sur les composantes harmoniques sphériques.
En se référant encore à la figure 1, le module 2 d'égalisation de chacune des composantes BU,- ,r g(r/c) permet d'obtenir des composantes BUNFC(R/c) égalisées (EQ,?id) et compensées en champ proche (r/c->R/c). c est la vitesse acoustique. La distance r correspondrait alors à une distance des capsules par rapport à l'origine O et la distance R correspondrait à la distance 25 dite de "référence" entre la position de haut-parleurs de restitution et la position d'un auditeur.
Des précisions sur cette compensation de champ proche et, de manière plus générale, sur I'encodage ambiophonique sont données dans la demande française non encore publiée FR-0214444.
crNFC(R/c) On indique simplement ici que, pour obtenir les composantes BNFC(Rc) conformes à une transmission de données encodées en contexte ambiophonique, on applique un banc de filtres égaliseurs avec précompensation de champ proche sur les composantes ambiophoniques brutes N rough(r/c) EQ FC(R/C)() EQ() (.3bis) EQm4Fc(R/) (c o) F(R/)( On indique toutefois que la pré-compensation de champ proche peut être appliquée directement sur les composantes brutes, sans prévoir nécessairement d'égalisation, en particulier si la directivité intrinsèque des capteurs ne nécessite pas une telle égalisation.
Comme les K composantes ambiophoniques, obtenues après égalisation et compensation en champ proche, sont bornées et non divergentes, on peut les stocker dans une mémoire du dispositif de traitement tel que représenté sur la 20 figure 1, ou encore les transmettre via un réseau de communication, à partir du module 5, de stockage MEM et/ou communication COM, représenté sur la figure 1.
On se réfère à la figure 2 pour décrire ci-après l'effet d'un défaut 25 d'orthonormalité et, de là, I'effet de l'aliasing spatial sur des composantes ambiophoniques égalisées et pré-compensées en champ proche.
Dans le cas d'une sphère rigide, les filtres d'égalisation sont notés EQmrgid(alcRlc)(a , et se basent sur les filtres EQ., définis par l'équation (.3). La figure 2 illustre ce cas d'une sphère rigide, ainsi que celui de capteurs cardioïdes parfaits (a=1/2), jusqu'à l'ordre m=4. Plus précisément, la figure 1 représente les courbes d'égalisation de composantes issues du matriçage, en fonction de leur ordre m, pour a=5cm (rayon du microphone) et R=1,5m 5 (distance de référence des hautparleurs). Le cas de la sphère rigide est représenté par des traits interrompus et celui de capteurs cardioldes palrfaits par des traits continus.
De façon générale, on remarque que plus l'ordre d'une composante augmente 10 et plus l'égalisation pré-compensée applique un gain important à cette composante. Ce phénomène est accru dans un domaine de basses fréquences, jusqu'à plus de 1 kHz.
On comprendra ainsi qu'une erreur due à l'aliasing spectral et qui se traduit par 15 une "pollution" des composantes d'ordres faibles sur une composante d'ordre plus élevé sera amplifiée pour cette composante d'ordre élevé, en particulier dans les basses fréquences.
Le cas d'un microphone "cardioide parfait' est plus favorable (l'écart entre les courbes d'amplification m=4 et m=1 étant plus réduit que pour un microphone 20 sphérique) puisqu'il possède déjà une directivité d'ordre 1. Dès lors, il ne requiert qu'une égalisation finie en très basse fréquence jusqu'à l'ordre 1.
Toutefois, une cardioicité parfaite ne se rencontre pas en pratique, en particulier pour les basses fréquences.
Dans ce qui suit, on évalue l'effet de l'aliasing sur l'estimation des composantes ambiophoniques basée sur une projection classique. A cet effet, on évalue plus précisément une erreur entre les composantes Bn, telles qu'obtenues par le calcul classique et les composantes B,1 qui auraient été obtenues si les conditions d'orthonormalité étaient respectées.
Comme indiqué ci-avant, en pratique, on ne dispose que d'un nombre fini de capteurs et, de ce fait, on doit "échantillonner" spatialement la mesure du champ à la surface de la sphère. Habituellement, on considère que 5 l'échantillonnage spatial de la base harmonique sphérique par l'ensemble des directions i7 des N capsules préserve l'orthonormalité de la base échantillonnée et tronquée à l'ordre maximum M. Si l'on décrit l'échantillonnage directionnel des fonctions harmoniques par les io vecteurs yT,, = [Y,. . (û1) Y(2) Y(N)], alors ces vecteurs tels que m<M constituent une base orthonormée au sens du produit scalaire: 1 Tr {Y Y'N = Nyy Y, ce qui se traduit par: Y.,. Y'n., )N = ,,,nnC pour tous met m' < M. On estime les composantes ambiophoniques du champ à partir du vecteur des signaux captés p, pour une projection "discrète", par: B/,, = EQn(P YYn>N (.4) L'empilement des vecteurs Y.1, compose une matrice Y = [. . Y-, qui définit l'échantillonnage de la base harmonique sphérique. Cette matrice est susceptible de correspondre à une matrice de "ré- encodage" dans le contexte 20 de la restitution.
Le vecteur colonne B = .. B," est défini comme suit. L'application de la relation ( .4) s'exprime alors de façon plus synthétique par: 1:Diag([EQo... EQ, ...-]).D.p, avec D =-y (.5)
N
On définit ainsi une opération de matriçage dite "Down-Matrixing" dans la littérature anglo-saxonne à partir de la matrice -Y qu'applique un module de
N
matriçage classique.
Les filtres d'égalisation mis en batterie en aval du module de matriçage sont les filtres d'égalisation EQ. qui interviennent comme éléments diagonaux de la matrice Diag([EQ0... EQm...]) Ainsi, I'estimation ( .5) s'accompagne d'une erreur, du fait que l'Orthogonalité 10 n'est pas réellement assurée entre les composantes y"a tels que m<M et les Y.,,, tels que m5M. Cette erreur vaut: m. = Bnm-B - = EQ.m(')Wm( ) Z,(R"c) (. ) B.n'(yn Ymn) (.6) m'>M _O<n'<m ',to'=+1 Elle traduit l'effet d'aliasing spatial correspondant au repliement (à la "pollution") du spectre harmonique sphérique, et ici à un repliement des composantes B,',, d'ordre supérieur à l'ordre M sur celle estimée B/.,,. Le degré de repliement potentiel de la composante B',. est indiqué par le coefficient de repliement (Y. Y,.'>'N' Le repliement n'est nul que si l'échantillonnage préserve l'orthogonalité des deux harmoniques sphériques.
Comme indiqué ci-avant en référence à la figure 2, I'erreur due au repliement est d'autant amplifiée que l'ordre m', supérieur à m, est élevé et que la fréquence est basse (voir le cas réaliste d'une sphère rigide en traits interrompus). Ce phénomène devient moins significatif à partir des fréquences 25 élevées (ou quand le rayon a diminue) puisque les gains en égalisation deviennent voisins pour tous les ordres m.
En outre, le fort niveau d'égalisation en basses fréquences, notamment pour les composantes d'ordres plus élevés, s'accompagne d'une amplification du bruit interne des capteurs. Si les N signaux captés incluent des bruits de même énergie Ip12 et décorrélés entre eux, ces bruits se retrouvent dans les 5 composantes estimées avec le niveau -!EQ,, (o)2 p2. L'amplification du bruit
N
suit donc les courbes de la figure 1, mais rabaissées d'un gain -10. log1o(N) dB (soit -15dB pour N=32). Cette amplification est d'autant plus forte que le rayon du microphone est petit.
Sur la figure 3a, on a représenté en trait plein l'erreur relative 6L/B.
notamment pour l'ordre m=1. On voit qu'au-delà de la fréquence de 16 kHz, dans l'exemple représenté, cette erreur dépasse la valeur seuil de 1. Ainsi, l'estimation de la composante d'ordre m=1 devient complètement inconsistante pour des fréquences supérieures à 16 kHz. Cette fréquence de 16 kHz 15 correspond à la fréquence d'aliasing fA pour l'ordre m=1.
Plus généralement, les simulations des figures 3a à 3d montrent des anomalies très fortes pour les composantes d'ordre élevé 3 ou 4. L'évolution de l'erreur pour les composantes d'ordres 1 à 4 (de la figure 3a à la figure 3d) 20 est très nette. L'estimation devient complètement inconsistante si l'erreur atteint la valeur 1. Ces figures illustrent clairement l'apparition de l'aliasing spatial inhérent, signalé ainsi par les courbes d'erreur qui passent la valeur critique de 1.
En particulier, ces simulations ont montré que les composantes d'un ordre m courant sont polluées aussi bien par les composantes d'ordres plus élevés que par les composantes d'ordres inférieurs, déjà estimées, comme on le verra en référence à la figure 4. Ce repliement des composantes d'ordres inférieurs est particulièrement gênant dans les basses fréquences, avec l'effet de l'amplification due à l'égalisation.
La figure 4 représente de façon synthétique la carte du résidu de "non 5 orthonormalité" (c'est-à-dire la matrice absfINY.Y -IK)) pour les composantes jusqu'à l'ordre 6 inclus et pour les 32 positions illustrées sur la figure 1. Les rectangles délimités par les indices (m-1, m) en abscisse, et (m'-1, m') en ordonnées signalent le repliement de composantes d'ordre m' sur des composantes d'ordre m. Ces rectangles sont de ton d'autant plus foncé 10 que le repliement potentiel est important.
Ainsi, le module de matriçage tel qu'il est défini dans l'état de la technique antérieure n'est pas bien adapté. Notamment, il ne permet pas une estimation satisfaisante des composantes d'ordres supérieurs à l'ordre 2 ou 3, à cause 15 d'un défaut d'orthonormalité, et ce, même pour un domaine de très basses fréquences et pour une géométrie quelconque du réseau de capteurs.
La présente invention propose une estimation optimale des composantes sonores spatiales pour réduire les effets négatifs de l'aliasing spatial.
A cet effet, le matriçage décrit ci-avant est amélioré, préférentiellement en affinant d'abord l'estimation des composantes spatiales du champ dans le domaine des basses fréquences, en dessous de la fréquence d'aliasing, puis en cherchant à minimiser le repliement potentiel d'ordres supérieurs à l'ordre 25 maximum fixé.
En d'autres mots, on cherche alors à éliminer les termes de repliement potentiel venant des composantes d'ordres m' inférieurs ou égaux à l'ordre m de chaque composante estimée, et, le cas échéant d'ordre(s) supérieur(s), tant 30 que le nombre total de ces composantes n'excède pas le nombre N de signaux captés. Ainsi, I'estimation des composantes est exempte d'erreur au moins dans un domaine basses fréquences, comme on le verra ci-après.
On indique ci-après un calcul permettant d'abord de minimiser l'effet de lI'aliasing dans les basses fréquences.
Dans le cas d'une simple distribution sphérique, la matrice de correction D, définie dans la relation (.5) ci-avant, s'exprime sous la forme: D= [d; ] et YM =jYo] où les éléments d'indices (m,n,o-) sont classés suivant la règle suivante: - m croissant (jusqu'à l'ordre maximum M); -n croissant de 0 à m; - o'=+1 puis -1 (sauf pour n=0).
La matrice D est composée des vecteurs-lignes d7,1, qui étaient fixés d'emblée à Yn IN dans la relation ( .5) de l'art antérieur. Dans le domaine des basses fréquences (en dessous de la fréquence d'aliasing spatial), I'erreur d'estimation se présente maintenant sous la forme: g., = B,,- t = B,7,- EQ,,, (f). Wm, (f) (d,,'Y,,)'B" ( .7) ",.20 -< '<' B=' =-+ l On reconnaît ici le terme de repliement potentiel sous la forme dn,, ym, . Pour éliminer le repliement le plus nuisible qui induit une erreur amplifiée dans les basses et moyennes fréquences, on élimine d'abord le repliement des composantes d'ordre m' inférieur ou égal à l'ordre m des composantes estimées. Ce repliement est le terme d'erreur le plus important à éliminer en 25 priorité. Autrement dit, les N éléments d,,,[i] du vecteur d ,l sont des variables qui doivent satisfaire le système à Km =(m+1)2 équations suivant:
N
d...Ym. = dm'y [i].Ym [i] = 1 (.8)
N
dun,Y:nt "d.[i].ym,[i[ = O pour (m m ou n n') i=1 avec m'<m.
Il convient de remarquer toutefois que l'on ne peut éliminer le repliement de 5 composantes d'ordres supérieurs que si le nombre de composantes bien "contrôlées" reste inférieur ou égal au nombre N de signaux captés. Par exemple, pour un microphone d'ordre 4 (25 composantes) avec 32 capteurs, on peut éliminer le repliement de 7 composantes supplémentaires Bn, d'ordre 5, que l'on peut choisir en fonction des incidences principales du champ capté. 10 Il est cependant préférable, a priori, d'assurer un traitement homogène au sein d'un même ordre. Ainsi, on élimine préférentiellement le repliement de composantes jusqu'à l'ordre maximum M tel que KM=(M+1)2 <N, et ce, pour l'estimation de composantes d'ordre m<M. Dans ce cas, le système à résoudre s'exprime ainsi D.YM =IK, (.9) Oë IKM est la matrice identité de rang KM.
En l'absence d'autre critère d'optimisation, on définit alors une première matrice corrigée D comme la pseudo-inverse: D = pinv(Y)= Y, (Y" - Y, )1 ( .10) Bien entendu, il est possible que la configuration des capsules sur le microphone soit telle que l'ordre maximum Mmic qui peut être réellement atteint soit inférieur à l'ordre maximum théorique M. Ainsi, si les composantes 25 estimées sont d'ordre maximal Mmic<M, la matrice corrigée D est calculée dans un premier temps comme une sous- matrice du système ( .10), à savoir: D = YM,"C (YYM)Les figures 5a à 5d montrent la simulation de l'erreur relative Cmn'/Bmn7 moyenne (traits continus) et sa variance (en traits interrompus), en valeur 5 absolue et en fonction de la fréquence, dans l'estimation des composantes ambiophoniques par le procédé au sens de l'invention, respectivement pour un ordre maximum de 1 à 4, pour un dispositif à 32 capsules et pour un ensemble de 200 incidences aléatoires. Ces figures 5a à 5d sont à comparer respectivement avec les figures 3a à 3d décrites ci-avant. On constate en 10 particulier sur la figure 3d que la notion de "fréquence d'aliasing" n'a plus réellement de sens, puisque l'erreur relative est supérieure à la valeur critique 1, dans les basses fréquences, pour tous les ordres jusqu'à M=4. Si l'on avait choisi de se limiter à l'obtention de composantes jusqu'à l'ordre Mmj=3, on comprend que l'effet de l'aliasing induit par les composantes d'ordre supérieur M=4 sur l'ordre choisi Mmijc=3 polluerait notablement l'estimation des composantes d'ordre maximum Mmic=3.
Ainsi, dans une réalisation préférée, on minimise globalement le repliement potentiel venant d'ordres M' encore plus élevés que l'ordre maximum M 20 évoqué ci-dessus, dans une étape ultérieure. De façon générale, on indique que cette étape ultérieure a pour effet d'étendre le domaine d'estimation valide à des fréquences plus élevées.
En général le nombre total KM de composantes tel que défini ci-avant par: 25 KM = (M+1)2 est inférieur au nombre de signaux acquis N. La relation ( .9) ci-dessus laisse donc (N-KM) degrés de liberté (N inconnues pour KM équations), qu'il est possible d'exploiter pour minimiser "globalement' le repliement des composantes d'ordre(s) supérieur(s) à M. Il s'agit de 30 minimiser en fait le terme p défini par: P]MM'] = LYm m E da..y.,,., ( .11) M <m ' 0<n_<m' ,n=+l avec contrainte de vérifier la relation (.9). Le facteur de pondération m m permet de donner une importance moins forte au traitement des ordres m' plus 5 élevés par exemple, et en fonction de l'ordre m des composantes estimées.
D'après la relation (.9) il possible d'exprimer, pour chaque composante à estimer, les N inconnues d',[i] en fonction de (N-KM) variables d',[i], choisies parmi les N inconnues. Le terme p de la relation (.11) s'exprime alors aussi en fonction de ces (N-KM) variables, et c'est sous cette forme que la 10 contrainte (.9) s'exprime. Ainsi, la minimisation du repliement se fait en posant: D']MMI =0 pour 1=1, ..., (N-KM) .12) 5d.,, [j,] La relation (.11) ramène alors à un système linéaire à (N-KM) équations et 15 autant d'inconnues qui peut revêtir l'expression habituelle d'une optimisation au sens des moindres carrés, comme on le verra ci-après. La résolution de l'équation (.12) puis de l'équation (.9) se fait simplement selon des techniques classiques d'inversion de matrice ou de système linéaire.
Dans un premier temps, on applique une décomposition matricielle classique dite "QR", qui fournit: YM.E = Q.R, où: -Q est une matrice carrée unitaire telle que Q.QT=IK, -R est une matrice triangulaire supérieure et - E est une matrice de permutation (E.ET=IN), dont les éléments non-nuls sont 25 égaux à 1, et qui opère un classement des valeurs propres dans un ordre favorable.
On pose ensuite: R=RK.A où RK est la sous-matrice carrée composée des K premières colonnes de R, et A est définie par: A=inv(RK).R Cette matrice A a pour sous-matrice carrée gauche la matrice identité IK. 5 L'introduction de cette matrice A=[IK A'], (d'éléments a/) permet d'exprimer KM inconnues en fonction de (N-KM) autres. Le système (.9) se reformule donc ainsi: A.E.D = RKQ = C d'où l'on déduit: [premières K colonnes de (D.E)]T = C AD', où D'= [dernières (N - K) colonnes de (D.E)]T, (. 13) soit encore:
N
d',,[e, ]=Cik - Y a nej] (d.14) nino mi, [ei j=K+I pour 1<i_<Koù kest un indice associé à (mn ) de sorte que l'on peut exprimer les termes de ( .1 1) ainsi: K N K dn.Ym,,1 = cE.y,,,, [e1]+ Y d,, [ej]. yZa.[eYm -,[e1] (. 15) ni ni y, .,[ej]. jj-Z i=1 j=K+I i=l d'où Ad [y], - y, ,,[eu]-ua j.ym, ,,[e] , (.16) ad.,,,[e] j=K+I. i1 Les termes (.16) s'expriment sous la forme matricielle: Y 1M,M] = [dernières (N - K)colonnes de(YJ,MI].E)-premières K colonnes de(YjM,M,].E) A'] qui est une matrice à (KM- KM) lignes et (N- KM) colonnes.
De là, les termes de la relation ( .15) s'écrivent dans l'ensemble: [premières K colonnes de 0YMM].E)IC + Y']MM].D' Finalement, le système d'équations ( .12)( .11), qui fait intervenir les termes ôff or.Y'1 t2 r t[ 3dm'Y'" ) -=2. 2 ("'Y" " .(am..y), décrits ci-dessus sous forme matricielle, ôd.,. [ej] 23ad', [ee] y; tc s'écrit sous la forme synthétique (avec d'abord ymm=l): Y']MM'] 4.premières K colonnes de (YIM,M.].E)1C + Y']MM,]. D') = O, (.17) 5 Les (N- KM) inconnues du sous-problème de minimisation se déduisent ainsi: D'= -(Y]MM,]t.YWM,m]).Y.Mm,]t.[premières K colonnes de (YIMM,].E)C (.18) Finalement, on obtient alors les KM inconnues restantes en appliquant la relation (.13).
On notera que si l'on choisit des facteurs de pondération Ymm variables suivant m ou m', il faut considérer chaque ordre m séparément, substituer à Y']M,tM] la matrice Fm.Y']M,M], avec: Ogin,M +I2M+3 | Fm = |gm,n'I2nm'+ l, g.,..' = ai, | g.7,M'I 2M,'t] et appliquer la relation (.18) aux sous-matrices de D' et C respectivement composées de leurs colonnes correspondant à l'ordre m.
Ce calcul peut être mené rapidement en utilisant un programme informatique adéquat tel que MATLAB .
La seconde matrice corrigée D', ainsi obtenue, est appliquée avantageusement à la partie "hautes fréquences" des N signaux reçus, tandis que la première matrice corrigée D, obtenue par une relation du type de la relation (.10), est préférentiellement appliquée à la partie "basses fréquences" des N signaux reçus. Ainsi, pour la partie "hautes fréquences" des signaux reçus où l'aliasing spatial affecte les composantes spatiales estimées, on effectue avantageusement une correction du matriçage pour obtenir une 5 estimation valide des composantes dans un domaine de fréquences jusqu'à la fréquence d'aliasing des composantes d'ordres M' supérieurs à l'ordre maximum M. Sur les figures 5a à 5d, on remarque systématiquement que le seuil critique de 1 n'est dépassé que pour les hautes fréquences (d'aliasing) et pour les composantes d'ordres élevés.
En se référant à la figure 7, le module de matriçage 1 d'un dispositif de traitement de signaux sonores, selon une réalisation préférée de la présente invention, comporte une entrée (flèche E) par laquelle il reçoit N signaux directement du microphone sphérique 3 de la figure 1, ou, optionnellement, 15 d'un module intermédiaire 4 qui sera décrit plus loin (représenté à cet effet en traits pointillés). Le module de matriçage 1 comporte un sous-module 11 de séparation des N signaux reçus en au moins deux bandes de fréquences, respectivement inférieures à une fréquence limite fL décrite ci-après, et supérieures à cette fréquence limite fL.
On explique ci-après la raison du choix de scinder en basses fréquences et hautes fréquences les N signaux à traiter et/ou les composantes obtenues par le matriçage utilisant D, d'une part, et par le matriçage utilisant D', d'autre part.
Bien que les matrices D et D' offrent, théoriquement, la même qualité 25 d'estimation dans le domaine basse fréquence, il a été constaté mathématiquement que la première matrice D met en jeu une moindre moyenne quadratique de ses coefficients. Le premier matriçage utilisant D limite alors l'introduction du bruit de mesure (des capsules) dans les composantes estimées. Il apparaît alors avantageux d'appliquer la matrice D 30 sur une bande de basses fréquences et la matrice D' sur une bande de moyennes et/ou hautes fréquences, complémentaires.
On décrit ci-après comment prédéterminer la "fréquence limite" fL précitée, séparant ces deux bandes hautes et basses fréquences. Elles sont avantageusement définies séparément pour chaque composante estimée. 5 Plus particulièrement, le choix d'appliquer la matrice D plutôt que la matrice D' dans une bande de basses fréquences est motivé par le fait que le bruit de mesure introduit dans l'estimation est particulièrement amplifié en basses fréquences, et ce, d'autant plus, et sur une bande plus large, que l'ordre m des composantes estimées est élevé. Ainsi, la fréquence limite fL "de séparation" 10 croît en principe avec l'ordre m. Ces fréquences de séparation fL sont, le cas échant, différentes et en général inférieures aux fréquences d'aliasing fA associées aux ordres m courants.
Dans un mode de réalisation préféré, le traitement pour obtenir chaque 15 composante ambiophonique est donc différencié en deux bandes de fréquences. Les N signaux provenant du réseau microphonique sont traités en parallèle par deux matrices D et D', produisant chacune un jeu de K composantes ambiophoniques. On considère alors que les signaux résultant du matriçage D sont "de meilleure qualité" dans un domaine de basses 20 fréquences que ceux résultants de D', alors que ceux résultant de D' sont "de meilleure qualité" dans un domaine de hautes fréquences. On considère également que la fréquence à partir de laquelle un matriçage devient plus favorable que l'autre pour l'estimation peut varier suivant la composante estimée.
En pratique, on peut utiliser un banc de filtres passe-bas 111 et un banc de filtres passe-haut 112. Le module de matriçage proprement dit, portant la référence 12 sur la figure 7, est scindé en deux sous-modules 121 et 122 qui appliquent respectivement les matrices corrigées D et D' calculées comme 30 décrit ci-avant, aux parties basses fréquences et hautes fréquences des N signaux captés. A la sortie de chaque sous-module 121 et 122, on obtient alors K composantes. Ces 2K composantes sont enfin appliquées à un sousmodule 13 de sommation voie par voie pour sommer ainsi les composantes ambiophoniques obtenues dans les deux gammes de fréquences. Finalement, les K composantes obtenues en sortie du module de matriçage 1 sont des 5 composantes brutes que l'on applique avantageusement ensuite au module d'égalisation 2 de la figure 1, avec pré-compensation de champ proche, tel que décrit ci-avant.
Ainsi, on prévoit préférentiellement une opération de matriçage différenciée selon deux bandes de fréquences, en séparant préalablement les signaux à traiter suivant ces deux bandes, puis de sommer les résultats des deux matriçages voie par voie. Ce mode d'implémentation est avantageusement mis en oeuvre en l'absence de contrainte de temps réel, par exemple lors d'un enregistrement dédié à une écoute différée. Dans une variante plus 15 économique, on n'utilise qu'une seule matrice choisie comme étant optimale pour le domaine des basses fréquences, si par exemple le besoin de transmission temps réel l'impose. Plutôt que de prévoir des filtres passe-haut et passe-bas, on indique qu'un algorithme de calcul inspiré d'une transformée de Fourier rapide peut aussi être utilisé pour prévoir des traitements adaptés 20 notamment à la géométrie du microphone et/ou pour la définition de la matrice corrigée D. On se réfère maintenant à la figure 8 pour décrire une réalisation plus avantageuse que celle représentée sur la figure 7 et selon laquelle les filtres 25 passe-haut 111B et passe-bas 112B du module de filtrage 11B sont ici situés en aval du module de matriçage 12 suivant les deux matrices D (sous-module 121) et D' (sous-module 122). Plus particulièrement, le sous-module des filtres passe-haut 111 B suit directement le sous-module de matriçage 121 utilisant la matrice D, et le sous-module des filtres passe-bas 112B suit directement le 30 sous-module de matriçage 122 utilisant la matrice D'. Les signaux matricés et filtrés respectivement dans les hautes fréquences et dans les basses fréquences sont ensuite sommés voie par voie par le module 13. On obtient finalement K composantes ambiophoniques pour N signaux sonores initiaux.
On comprendra ainsi que, par rapport au mode de réalisation de la figure 7, on réalise une économie de 2x(N-K) filtres.
Toutefois, on rappelle que la seconde matrice corrigée D' permet d'éliminer en outre, aussi bien que la matrice D, le repliement de toute composante d'ordre m' inférieur ou égal à l'ordre m de chaque composante estimée. De ce fait et de la même manière qu'avec la matrice D, la seconde matrice D' a pour propriété d'éviter l'apparition des erreurs d'estimation en basses, fréquences, en plus de diminuer les erreurs d'estimation jusqu'à la fréquence dite "d'aliasing" fA propre à chaque composante. Elle pourrait donc en principe être avantageusement appliquée sur une bande basse et moyenne fréquence allant au moins jusqu'à la fréquence d'aliasing, cette dernière dépendant de la composante estimée.
Au-delà de cette fréquence, I'information spatiale accessible via les signaux captés n'est plus suffisamment consistante, ce qui se traduit par une erreur relative en général supérieure à la valeur critique de 1, quelle que soit la 20 matrice utilisée pour le traitement. En particulier, I'incohérence statistique des relations de phase entre les signaux captés ne permet plus de contrôler la directivité "effective" des composantes reconstituées, et donc de reconstituer leur directivité théorique (comme indiqué ci-avant en référence à la figure 6). Il peut être alors préférable d'appliquer dans cette bande haute fréquence un 25 troisième matriçage D" qui limite les efforts inutiles de reconstitution de directivité, et par la même occasion, qui limite des effets d'interférence inappropriés entre les signaux à traiter. Ce mode de réalisation avantageux est décrit plus loin en référence à la figure 9. On indique que cette troisième matrice D" peut être définie suivant la méthode classique dite "de projection", 30 décrite ci-avant en référence à l'art antérieur.
Dans le mode de réalisation de la figure 9 où l'on combine le matriçage D' et un matriçage supplémentaire D", la fréquence de séparation entre les "moyennes" fréquences et les "hautes" fréquences correspond préférentiellement à la "fréquence d'aliasing spatial' associée à un ordre 5 courant d'une composante et repérée approximativement (pour une composante pour chaque ordre) sur les figures 5a à 5d. Ces fréquences peuvent être déterminées d'après des valeurs statistiques issues de simulations, avec grand nombre de tirages, ou encore par calcul.
Ainsi on comprendra que le traitement au sens de l'invention est extensible à plus de deux bandes de fréquences (et autant de matrices opérant en parallèle). Dans le cas de trois matrices D, D', D" représenté sur la figure 9, les résultats de ces trois matriçages D, D', D" peuvent être mixés après avoir été séparés en trois bandes respectivement basses (jusqu'à la fréquence limite fL), moyennes (entre la fréquence limite fL et la fréquence d'aliasing fA) et hautes fréquences (au-delà de la fréquence d'aliasing fA).
En se référant alors à la figure 9, on applique les trois matrices D, D' et D" de traitement en parallèle (sous-modules respectifs 121,122 et 123 du module de 20 matriçage 12), puis on filtre les signaux résultants suivants trois bandes de fréquences (sous-modules de filtrage respectifs 111C, 112C et 113C), que l'on somme ensuite en mixant en particulier les signaux correspondant à la même composante ambiophonique (module de sommation 13). Les filtres LP (pour "Low-Pass") sont des filtres passebas 111C jusqu'à la fréquence limite fL 25 dépendant éventuellement de l'ordre de la composante traitée. Les filtres BP (pour "Band-Pass") sont des filtres passe-bande 112C entre la fréquence limite fL et la fréquence d'aliasing fA. Les filtres HP (pour "High-Pass") sont des filtres passe-haut 113C à partir de la fréquence d'aliasing fA. On rappelle que, pour l'ensemble des filtres, les fréquences fL et fA dépendent préférentiellement de 30 la composante traitée.
Ainsi, l'élimination ou la minimisation du repliement potentiel jusqu'à un certain ordre, typiquement fonction du nombre de capteurs, est obtenue par la mise en oeuvre de l'invention. Toutefois, le repliement potentiel non éliminé, venant de composantes d'ordres plus élevés, se manifeste de façon effective à partir 5 d'une certaine fréquence "d'aliasing" (d'autant plus basse que l'ordre estimé est élevé). Au-delà des fréquences d'aliasingprécitées, I'erreur d'estimation n'est, de toutes façons, plus contrôlable puisque, de fait, la longueur d'onde devient inférieure à l'espacement entre capteurs. Ce que propose finalement la présente invention est de limiter les effets de l'aliasing, sans bien entendu pouvoir supprimer pour autant l'aliasing lui-même.
C'est la raison pour laquelle la troisième matrice D" du sous-module de matriçage 123 relié, sur la figure 9, au sous-module de filtrage 113C passehaut, peut être construite simplement en utilisant la méthode classique "par projection" de l'art antérieur.
Toutefois, on indique ci-après des étapes de traitement supplémentaires pour apporter une amélioration de l'estimation des composantes ambiophoniques dans les hautes fréquences.
La partie hautes-fréquences des signaux captés subit, lorsque ces signaux sont sommés, en particulier au matriçage, un "filtrage en peigne", avec pour conséquence possible un effet gênant de coloration sonore subjective. Plus particulièrement, ce phénomène vient de la sommation (lors du matriçage 25 dans le cas présent) de signaux corrélés mais dont les relations de phase varient périodiquement en fonction de la fréquence (notamment parce qu'ils sont retardés les uns par rapport aux autres), créant des effets de résonance puis de creux en des fréquences régulièrement espacées dans le spectre sonore. Pour réduire cet effet et, de là, I'effet subjectif de coloration qui en 30 résulte généralement, un moyen consiste à appliquer des filtres décorrélateurs (décorrélés entre eux) sur la partie hautes-fréquences des signaux captés, donc en amont du module de matriçage. Des méthodes pour la définition de tels filtres sont présentées par exemple dans: - Gary S. Kendall, "The Decorrelation of Audio Signals and its Impact on Spatial Imagery", Computer Music Journal 19:4, pp. 71-87, 1995.
Lorsque cette option est choisie, la décorrélation partielle préalable des signaux est assurée par une batterie de filtres décorrélateurs placée en amont du matriçage (dans le module 4 de la figure 1). Avantageusement, on peut donc mener une décorrélation sur la partie hautes-fréquences des signaux captés. Elle consiste à insérer une batterie de filtres décorrélateurs (décorrélés entre eux, pour la partie hautes-fréquences) dans le module optionnel 4, en amont du module de matriçage 1 représenté sur la figure 1.
Par ailleurs, on remarque que les courbes d'égalisation de la figure 2 deviennent croissantes pour des fréquences supérieures à environ 1 kHz. Ce 15 phénomène est lié à la compensation de la directivité propre de la capture du champ et non plus vraiment aux directivités propres des capteurs. Surtout, on remarque que le rapport entre les courbes d'égalisation des différents ordres devient proche de 1 (amplification relative de moins de 1dB). Or, dans le domaine des hautes fréquences audelà des fréquences d'aliasing, 20 lI'inconsistance indiquée ci-avant dans l'estimation des composantes ambiophoniques peut induire un effet négatif, audible à la restitution.
On applique préférentiellement ici une correction de gain à apporter pour toutes les composantes ambiophoniques dans le domaine des hautes 25 fréquences. Cette correction consiste à aplanir la pente (d'environ 6dB/octave) de l'égalisation originale, pour toutes les composantes. On ajuste ainsi à un même niveau d'égalisation toutes les composantes pour tous les ordres, suivant un critère de préservation globale de l'énergie.
Cette correction de gain est combinée avantageusement à une compensation de la réponse en fréquence des capsules (en dehors de toute considération spatiale). A cet effet, on indique que, dans le cas où la variété des caractéristiques individuelles (réponses en fréquence) des capsules l'impose, une correction peut être introduite par application de filtres égaliseurs (préégalisation individuelle) au niveau du module optionnel 4 de la figure 1, sur 5 chaque signal avant matriçage. En variante, si une simple correction de gain suffit, cette correction peut être directement intégrée dans la matrice appliquée par le module de matriçage 1.
Ainsi, le dispositif de traitement des N signaux sonores, d'un système de prise 10 de son d'un champ acoustique 3D tel que représenté sur la figure 2, de type dit "ambiophonique modifié avec pré-compensation de champ proche", comporte en aval du microphone 3: - optionnellement, le module 4 qui applique une égalisation individuelle des N signaux initiaux et/ou une décorrélation des N signaux à partir d'un banc de filtres approprié, - le module de matriçage 1 qui applique au moins une matrice corrigée D pour l'estimation des composantes ambiophoniques dans les basses fréquences et, optionnellement, une seconde matrice corrigée D' pour de plus hautes fréquences, - optionnellement, le module d'égalisation 2 pour compenser une directivité intrinsèque des capteurs, avec préférentiellement une précompensation de champ proche, et - optionnellement, le module 5 de stockage MEM et/ou de communication COM pour mémoriser et/ou transmettre les K composantes ambiophoniques 25 traitées, via un réseau distant.
En pratique, les filtres d'égalisation du module 2 peuvent être implémentés sous forme FIR (pour "finite impulse response") par transformée de Fourier inverse des réponses en fréquences calculées d'après les formules 30 analytiques du type ( .3) ou ( .3bis) ci-avant. En variante, une implémentation des filtres sous forme IIR ("infinite impulse response") serait normalement plus économique.
On indique surtout que, dans le module de matriçage 1 au sens de l'invention, 5 lI'estimation de chaque composante spatiale met en jeu non seulement l'échantillonnage spatial de la fonction harmonique sphérique associée (en particulier ses valeurs dans les directions des capsules), mais aussi l'échantillonnage spatial des autres fonctions harmoniques. De façon avantageuse, la matrice qu'applique le module de matriçage 1 permet d'assurer sensiblement une orthonormalité entre les fonctions harmoniques et, de là, de minimiser, voire d'annuler, les termes de repliement potentiel évoqués ci-avant.

Claims (20)

Revendications
1. Procédé de traitement de données sonores en contexte ambiophonique, dans lequel: a) on obtient N signaux émanant de capteurs sonores, b) on forme une base d'harmoniques ambiophoniques comportant un nombre total de KM composantes sous la forme d'une matrice de base (YM) comportant N colonnes et KM lignes, où KM est inférieur ou égal à N, et c) on applique un traitement de matriçage (1) aux N signaux pour obtenir des 10 composantes ambiophoniques des N signaux, exprimées dans ladite base des harmoniques, caractérisé en ce que, à l'étape c), on applique auxdits N signaux une matrice corrigée (D) vérifiant sensiblement la condition: D. YMt = 1, où - D est la matrice corrigée, - YMtest la transposée de la matrice représentant ladite base des harmoniques ambiophoniques, et - I est la matrice identité.
2. Procédé selon la revendication 1, caractérisé en ce que les coefficients de,, de la matrice corrigée D sont obtenus par vérification d'un système de Km équations à N inconnues de,'[i] (1<i<N), de type:
N
d., Y,. = L dv,, [i] *lY. [i] = 1 i=1
N
dY u' n = "d'y[i].y,,,, [i] 0O pour (m m' ou n n') a ]=1 avec m'<m<M, Km =(m+1)2, et où: 25- don sont les coefficients de la matrice corrigée D = d",, ]et - Ym,i, sont les coefficients de la transposée de la matrice de base Ymt=[L Y.. l 1 de manière à minimiser une influence des composantes d'ordres m' inférieurs à un ordre courant m dans l'estimation des composantes ambiophoniques d'ordre m.
3. Procédé selon l'une des revendications 1 et 2, caractérisé en ce que la matrice corrigée D correspond à la matrice pseudo-inverse de la transposée de la matrice de base (YM) et s'exprime par la relation: 10 D =pinv(YM') = (YMSYM) .YM
4. Procédé selon l'une des revendications 1 et 2, dans lequel on choisit d'obtenir un ordre maximum Mmic des composantes ambiophoniques, tel que M. ic < E(N)-1, où E(x) signifie la partie entière de x, caractérisé en ce que la matrice corrigée D s'exprime par la relation D = (YM.YM) .YM,,C, Où - YM est une matrice représentant la base des harmoniques d'ordre maximum choisi Mmic, et - YM est une matrice représentant la base des harmoniques d'ordre maximum 20 M qu'il est possible d'atteindre avec N signaux et défini par M = E(/N) - 1.
5. Procédé selon l'une des revendications précédentes, dans lequel le nombre N de signaux est tel que N>(M+1)2, où M est l'ordre maximum qu'il est possible d'atteindre avec lesdits N signaux, laissant N-KM degrés de liberté 25 dans l'estimation des coefficients d7, de la matrice corrigée D, caractérisé en ce que les coefficients d,,,U de la matrice corrigée D sont estimés par minimisation d'une expression de type: /S]M,M'] = d".m" M<'_M' O_<n'_<m','=]+d 'Y' 2 où M' correspond à un ordre supérieur à l'ordre maximum M, de manière à minimiser une influence potentielle de composantes d'ordres supérieurs à M dans l'estimation des KM composantes ambiophoniques.
6. Procédé selon la revendication 5, caractérisé en ce que les coefficients d7, de la matrice corrigée D sont estimés par minimisation d'une expression de type: u]M,M'] y 7m..,, dmn '' | M<m'<j]i' O<n'<+ m'Ycm=+', faisant intervenir un facteur de pondération 7m,m pour donner une importance moins forte aux composantes d'ordres m' supérieurs aux ordres m des composantes déjà estimées.
7. Procédé selon l'une des revendications 5 et 6, caractérisé en ce que ladite minimisation est effectuée par calcul au sens des moindres carrés et consiste à résoudre N-KM équations du type: d,1#m'] = 0, avec / = 1, 2, ..., (N-KM), aDd,, [ il] où dn[i;] sont N-KM inconnues parmi N inconnues.
8. Procédé selon l'une des revendications 5 à 7, prises en combinaison avec l'une des revendications 2 à 4, caractérisé en ce que l'étape c) comporte deux opérations de matriçage différenciées en: cl) une première bande de basses fréquences des composantes ambiophoniques, où l'on applique une matrice corrigée D donnée par une 25 relation du type: D = pinv(YM') = (YM.YM) '.YM, c2) une seconde bande de hautes fréquences des composantes ambiophoniques, où l'on applique une matrice corrigée D' dont les coefficients sont calculés par minimisation d'une expression du type = d,,' Y 'n'| M<m'_M' O<n'<nz', &'=+l et en ce que les opérations cl) et c2) sont suivies d'une sommation des deux matriçages voie par voie.
9. Procédé selon l'une des revendications précédentes, caractérisé en ce qu'il comporte en outre l'étape suivante: d) égaliser (EQm) les composantes ambiophoniques obtenues à l'étape c) pour compenser une pondération (Wm) des harmoniques ambiophoniques liée à 10 une directivité intrinsèque des capteurs sonores.
10. Procédé selon l'une des revendications précédentes, caractérisé en ce qu'il comporte en outre l'étape suivante: e) compenser un effet de champ proche (1/Fm(R/C)) sur les composantes ambiophoniques obtenues à l'étape c).
11. Procédé selon la revendication 10, prise en combinaison avec la revendication 9, caractérisé en ce que l'on applique un banc de filtres égaliseurs avec pré-compensation de champ proche (EQm(co)/Fm(/c)(co)) sur 20 les composantes ambiophoniques obtenues à l'étape c).
12. Procédé selon l'une des revendications précédentes, caractérisé en ce qu'il comporte en outre l'étape suivante: al) préalablement à l'étape c), appliquer auxdits N signaux un banc de filtres 25 décorrélateurs dans les hautes fréquences avec introduction d'un déphasage sensiblement aléatoire entre les N signaux pour limiter un effet de coloration dû à un filtrage en peigne résultant de l'étape de matriçage c).
13. Dispositif pour encoder des signaux sonores en composantes 30 ambiophoniques, comportant au moins: - une entrée (E) propre à recevoir N signaux émanant de capteurs sonores, et - un module de matriçage (1) appliquant auxdits N signaux au moins une matrice de base, représentative d'une base d'harmoniques ambiophoniques, pour obtenir Km composantes ambiophoniques estimées des N signaux et exprimées dans ladite base, caractérisé en ce que ladite matrice de base comporte' des coefficients de gains ajustés pour minimiser au moins une influence de composantes d'ordres m' inférieurs à un ordre courant m d'une composante estimée, dans des basses fréquences, inférieures à une fréquence limite (fL).
14. Dispositif selon la revendication 13, caractérisé en ce que les coefficients de ladite matrice de base (D') sont de gains ajustés en outre pour minimiser une influence de composantes d'ordres M' supérieurs à un ordre maximum M des composantes estimées, dans des hautes fréquences, supérieures à ladite fréquence limite (fL).
15. Dispositif selon la revendication 13, caractérisé en ce que ledit module de matriçage (1) est agencé pour appliquer en outre une seconde matrice de base comportant des coefficients calculés pour minimiser au moins 20 une influence de composantes d'ordres M' supérieurs à un ordre maximum M des composantes estimées, dans des hautes fréquences, supérieures à ladite fréquence limite (fL).
16. Dispositif selon la revendication 15, caractérisé en ce que le 25 module de matriçage (1) comporte un sous-module (11) de séparation desdits N signaux en au moins deux bandes de fréquences, respectivement inférieures à ladite fréquence limite et supérieures à ladite fréquence limite, pour appliquer deux traitements respectifs de matriçage (121,122) pour les signaux basses fréquences et pour les signaux hautes fréquences, ainsi qu'un 30 sous-module (13) de sommation voie par voie pour sommer les composantes ambiophoniques obtenues dans les deux gammes de fréquences.
17. Dispositif selon la revendication 15, caractérisé en ce que le module de matriçage (1) comporte un sous-module (11B) de filtrage desdites Km composantes ambiophoniques en au moins deux bandes de fréquences, 5 respectivement inférieures à ladite fréquence limite et supérieures à ladite fréquence limite, ainsi qu'un sous-module (13B) de sommation voie par voie pour sommer les composantes ambiophoniques filtrées dans les deux gammes de fréquences.
18. Dispositif selon l'une des revendications 13 à 17, caractérisé en ce qu'il comporte, en amont du module de matriçage, un banc de filtres décorrélateurs (4) dans les hautes fréquences, à appliquer auxdits N signaux pour introduire un déphasage sensiblement aléatoire entre les N signaux et limiter un effet de coloration dû à un filtrage en peigne résultant du matriçage.
19. Dispositif selon l'une des revendications 13 à 18, caractérisé en ce qu'il comporte, en aval du module de matriçage (1), un module d'égalisation (2) des composantes ambiophoniques pour compenser une pondération (Wm) des harmoniques ambiophoniques liée à une directivité des capteurs sonores.
20. Dispositif selon l'une des revendications 13 à 19, caractérisé en ce qu'il comporte, en aval du module de matriçage (1), un module de filtrage (2) pour compenser un effet de champ proche dans l'estimation desdites composantes ambiophoniques, le dispositif comportant en outre des moyens 25 de stockage des composantes ainsi compensées et/ou des moyens de transmission des composantes ainsi compensées via un réseau de communication.
FR0309388A 2003-07-30 2003-07-30 Procede et dispositif de traitement de donnees sonores en contexte ambiophonique Pending FR2858512A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
FR0309388A FR2858512A1 (fr) 2003-07-30 2003-07-30 Procede et dispositif de traitement de donnees sonores en contexte ambiophonique
PCT/FR2004/002009 WO2005015954A2 (fr) 2003-07-30 2004-07-27 Procede et dispositif de traitement de donnees sonores en contexte ambiophonique

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0309388A FR2858512A1 (fr) 2003-07-30 2003-07-30 Procede et dispositif de traitement de donnees sonores en contexte ambiophonique

Publications (1)

Publication Number Publication Date
FR2858512A1 true FR2858512A1 (fr) 2005-02-04

Family

ID=34043677

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0309388A Pending FR2858512A1 (fr) 2003-07-30 2003-07-30 Procede et dispositif de traitement de donnees sonores en contexte ambiophonique

Country Status (2)

Country Link
FR (1) FR2858512A1 (fr)
WO (1) WO2005015954A2 (fr)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9736608B2 (en) 2013-11-28 2017-08-15 Dolby International Ab Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
WO2017157803A1 (fr) * 2016-03-15 2017-09-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Appareil, procédé, ou programme d'ordinateur pour générer une description de champ sonore
RU2741763C2 (ru) * 2014-07-02 2021-01-28 Квэлкомм Инкорпорейтед Уменьшение корреляции между фоновыми каналами амбиофонии высшего порядка (ноа)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006053919A1 (de) 2006-10-11 2008-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer Anzahl von Lautsprechersignalen für ein Lautsprecher-Array, das einen Wiedergaberaum definiert
ATE524029T1 (de) 2008-10-30 2011-09-15 Deutsche Telekom Ag Wiedergabe eines schallfeldes in einem zielbeschallungsbereich
EP2469892A1 (fr) 2010-09-15 2012-06-27 Deutsche Telekom AG Reproduction d'un champ sonore dans une zone de sonorisation ciblée
FR3050601B1 (fr) * 2016-04-26 2018-06-22 Arkamys Procede et systeme de diffusion d'un signal audio a 360°
FR3074584A1 (fr) 2017-12-05 2019-06-07 Orange Traitement de donnees d'une sequence video pour un zoom sur un locuteur detecte dans la sequence

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5757927A (en) * 1992-03-02 1998-05-26 Trifield Productions Ltd. Surround sound apparatus
EP0966179A2 (fr) * 1998-06-20 1999-12-22 Central Research Laboratories Limited Méthode de synthétisation d'un signal acoustique

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030147539A1 (en) * 2002-01-11 2003-08-07 Mh Acoustics, Llc, A Delaware Corporation Audio system based on at least second-order eigenbeams

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5757927A (en) * 1992-03-02 1998-05-26 Trifield Productions Ltd. Surround sound apparatus
EP0966179A2 (fr) * 1998-06-20 1999-12-22 Central Research Laboratories Limited Méthode de synthétisation d'un signal acoustique

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GERZON M A: "AMBISONICS IN MULTICHANNEL BROADCASTING AND VIDEO", JOURNAL OF THE AUDIO ENGINEERING SOCIETY, AUDIO ENGINEERING SOCIETY. NEW YORK, US, vol. 33, no. 11, November 1985 (1985-11-01), pages 859 - 871, XP000794618, ISSN: 0004-7554 *
MEYER J ET AL: "A highly scalable spherical microphone array based on an orthonormal decomposition of the soundfield", 2002 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING. PROCEEDINGS (CAT. NO.02CH37334), PROCEEDINGS OF INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (CASSP'02), ORLANDO, FL, USA, 13-17 MAY 2002, 2002, 2002, Piscataway, NJ, USA, IEEE, USA, pages II - 1781-4 vol.2, XP002285176, ISBN: 0-7803-7402-9 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9736608B2 (en) 2013-11-28 2017-08-15 Dolby International Ab Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
RU2741763C2 (ru) * 2014-07-02 2021-01-28 Квэлкомм Инкорпорейтед Уменьшение корреляции между фоновыми каналами амбиофонии высшего порядка (ноа)
WO2017157803A1 (fr) * 2016-03-15 2017-09-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Appareil, procédé, ou programme d'ordinateur pour générer une description de champ sonore
CN108886649A (zh) * 2016-03-15 2018-11-23 弗劳恩霍夫应用研究促进协会 用于生成声场描述的装置、方法或计算机程序
EP3579577A1 (fr) * 2016-03-15 2019-12-11 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Appareil, procédé ou programme informatique permettant de générer une description de champ sonore
US10524072B2 (en) 2016-03-15 2019-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating a sound field description
US10694306B2 (en) 2016-03-15 2020-06-23 Fraunhofer-Gesellschaft Zur Förderung Der Angenwandten Forschung E.V. Apparatus, method or computer program for generating a sound field description
CN108886649B (zh) * 2016-03-15 2020-11-10 弗劳恩霍夫应用研究促进协会 用于生成声场描述的装置、方法或计算机程序
US11272305B2 (en) 2016-03-15 2022-03-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Apparatus, method or computer program for generating a sound field description

Also Published As

Publication number Publication date
WO2005015954A3 (fr) 2008-07-24
WO2005015954A2 (fr) 2005-02-17

Similar Documents

Publication Publication Date Title
EP1992198B1 (fr) Optimisation d&#39;une spatialisation sonore binaurale a partir d&#39;un encodage multicanal
EP2258119B1 (fr) Procede et dispositif pour la determination de fonctions de transfert de type hrtf
EP1836876A2 (fr) Procédé et dispositif d&#39;individualisation de hrtfs par modélisation
EP1886535B1 (fr) Procede pour produire une pluralite de signaux temporels
EP0531242B1 (fr) Procédé de filtrage adapté d&#39;un signal transformé en sous-bandes, et dispositif de filtrage correspondant
FR2995754A1 (fr) Calibration optimisee d&#39;un systeme de restitution sonore multi haut-parleurs
EP1606974A1 (fr) Procede pour traiter un signal electrique de son
FR2742619A1 (fr) Procede d&#39;egalisation multicapteur permettant une reception multicapteur en presence d&#39;interferences et de multitrajets de propagation, et recepteur pour sa mise en oeuvre
EP1586220B1 (fr) Procede et dispositif de pilotage d&#39;un ensemble de restitution a partir d&#39;un signal multicanal
EP1546916A2 (fr) Procede et systeme de traitement d&#39;une representation d&#39;un champ acoustique
WO2003073791A2 (fr) Procédé et dispositif de pilotage d&#39;un ensemble de restitution d&#39;un champ acoustique
FR2858512A1 (fr) Procede et dispositif de traitement de donnees sonores en contexte ambiophonique
EP2656344B1 (fr) Filtrage perfectionne dans le domaine transforme
EP3025514B1 (fr) Spatialisation sonore avec effet de salle
EP3559947A1 (fr) Traitement en sous-bandes d&#39;un contenu ambisonique réel pour un décodage perfectionné
EP0884926A1 (fr) Procédé et dispositif de traitement optimisé d&#39;un signal perturbateur lors d&#39;une prise de son
CH622919A5 (fr)
EP0585434B1 (fr) Procede et dispositif de filtrage pour la reduction des preechos d&#39;un signal audio-numerique
FR3112017A1 (fr) Equipement électronique comprenant un simulateur de distorsion
FR3003114A1 (fr) Procede et systeme de test d&#39;un appareil audio
FR3069693B1 (fr) Procede et systeme de traitement d&#39;un signal audio incluant un encodage au format ambisonique
FR2943867A1 (fr) Traitement d&#39;egalisation de composantes spatiales d&#39;un signal audio 3d
WO2005096268A2 (fr) Procede de traitement de donnees sonores, en particulier en contexte ambiophonique
WO2009081002A1 (fr) Traitement d&#39;un flux audio 3d en fonction d&#39;un niveau de presence de composantes spatiales
FR2840759A1 (fr) Procede de sonorisation