WO2023110549A1 - Procédé d'estimation d'une pluralité de signaux représentatifs du champ sonore en un point, dispositif électronique et programme d'ordinateur associés - Google Patents

Procédé d'estimation d'une pluralité de signaux représentatifs du champ sonore en un point, dispositif électronique et programme d'ordinateur associés Download PDF

Info

Publication number
WO2023110549A1
WO2023110549A1 PCT/EP2022/084651 EP2022084651W WO2023110549A1 WO 2023110549 A1 WO2023110549 A1 WO 2023110549A1 EP 2022084651 W EP2022084651 W EP 2022084651W WO 2023110549 A1 WO2023110549 A1 WO 2023110549A1
Authority
WO
WIPO (PCT)
Prior art keywords
point
signals
points
concerned
sound field
Prior art date
Application number
PCT/EP2022/084651
Other languages
English (en)
Inventor
Nicolas Epain
Original Assignee
Fondation B-Com
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fondation B-Com filed Critical Fondation B-Com
Publication of WO2023110549A1 publication Critical patent/WO2023110549A1/fr

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Definitions

  • the present invention relates to the technical field of acoustics. It relates more particularly to a method for estimating a plurality of signals representative of the sound field at a point, as well as an electronic device and an associated computer program.
  • the sound field at the interpolation point is determined by means of a linear combination of the encoded sound fields, with weighting of each encoded sound field by an estimated weighting factor in particular on the basis of an estimated power of the field sound at the interpolation position.
  • the present invention proposes a method for estimating a first plurality of signals representative of the sound field at a first point on the basis of a second plurality of signals representative of the sound field at a second point and a set of quantities respectively associated with a set of points and each indicative of a sound activity at the point concerned, in which the estimation of at least one signal of the first plurality comprises a step of combining values respectively associated with the points of the together, each determined as a function of the signals of the second plurality and of the quantity associated with the point concerned, and weighted by a weight depending on a first distance between the first point and the point concerned.
  • first distances distances between the first point and each point of the set of points
  • the weight also depends on a second distance between the second point and the point concerned;
  • the weight is determined by means of a decreasing function as a function of the first distance and/or increasing as a function of the second distance;
  • the weight may be equal to the second distance divided by the first distance
  • the estimation of said at least one signal of the first plurality is carried out further on the basis of a third plurality of signals representative of the sound field at a third point;
  • the estimation of said at least one signal of the first plurality comprises a step of combining other values respectively associated with the points of the set, each determined as a function of the signals of the third plurality and of the quantity associated with the point concerned, and weighted by another weight depending on a third distance between the third point and the point concerned, and/or the distance between the first point and the point concerned;
  • said at least one signal of the first plurality is estimated by weighted sum of the result of said combination of said values and of the result of said combination of said other values, the weights respectively associated with the result of said combination of said values and with the result of said combination of said other values in said weighted sum depending on the respective positions of the first point, the second point and the third point;
  • the value associated with a given point of the set of points is determined on the basis of a product of the quantity associated with the given point and a raw value depending on the signals of the second plurality and factors defining a function of transfer representing the acoustic propagation from the given point to the second point; - each factor is the value taken by a spherical harmonic function for the direction of the given point relative to the second point, divided by the distance between the given point and the second point;
  • the estimation of the signals of the first plurality comprises a multiplication of a matrix by a vector having as elements the said values associated respectively with the points of the set and weighted, each column of the matrix comprising a plurality of elements defining a function transfer representing the acoustic propagation from a point included in the set of points and associated with the column concerned, and up to the first point;
  • an element of a column of the matrix is the value taken by a spherical harmonic function for the direction of the point associated with this column relative to the first point, divided by the distance between the point associated with this column and the first point;
  • the signals of the second plurality are signals measured by an acoustic antenna positioned at the second point;
  • the signals of the third plurality are signals measured by an acoustic antenna positioned at the third point;
  • the number of signals of the first plurality is equal to the number of signals of the second plurality and/or the number of signals of the third plurality;
  • the signals of the first plurality and/or the signals of the second plurality are ambisonic signals
  • the point set includes at least 100 points
  • the quantity associated with a point is a value of a quantity representative of the sound energy at this point
  • the quantity associated with a point is indicative of the presence (or of a probability of presence) of a sound source at this point.
  • the present invention also relates to an electronic device designed to estimate a first plurality of signals representative of the sound field at a first point on the basis of a second plurality of signals representative of the sound field at a second point and a set of quantities respectively associated to a set of points and each indicative of a sound activity at the point concerned, comprising a transformation unit adapted to combine values respectively associated with the points of the set, each determined according to the signals of the second plurality and the quantity associated with the point concerned, and weighted by a weight depending on a first distance between the first point and the point concerned.
  • the invention also proposes a computer program comprising instructions executable by a processor and designed to implement a method as mentioned above when these instructions are executed by the processor.
  • the invention finally proposes a non-transitory recording medium, possibly removable, readable by such a processor and storing such a computer program.
  • FIG. 2 is a functional representation of an example of an electronic device according to the invention.
  • FIG. 3 shows, in functional form, a processing unit of the electronic device of Figure 2;
  • FIG. 4 shows the main steps of an example of a method for estimating the signals representative of the sound field in accordance with the invention.
  • FIG. 1 represents a possible context of use of the invention in which a plurality of acoustic antennae (here M acoustic antennae) A 1 , A m , A M are present in a space E.
  • M acoustic antennae here M acoustic antennae
  • FIG. 1 represents a possible context of use of the invention in which a plurality of acoustic antennae (here M acoustic antennae) A 1 , A m , A M are present in a space E.
  • M acoustic antennae here M acoustic antennae
  • the invention aims to estimate signals representative of the sound field at a point U in space E on the basis of signals representative of the sound field at another point in space E, here on the basis signals measured by at least one acoustic antenna A m .
  • the signals representative of the sound field at the level of the other point (or other points) of the space E could be recorded signals.
  • the invention therefore has, for example, an advantage for the broadcasting of immersive and interactive audiovisual content, which allows (virtual) navigation of the user in the space E and which therefore requires the estimation of signals representative of the sound field at the current position of the user (which thus corresponds to point U mentioned above).
  • N U the number of signals which are thus estimated to represent the sound field at point U
  • r (U) the vector defining the position of point U (i.e. for example the vector formed of the coordinates of point U in an orthonormal frame of space E).
  • Each acoustic antenna (in English: “microphone array”) A m comprises several acoustic sensors S j each able to perform a measurement of a sound field present at the level of the acoustic sensor S j concerned.
  • each antenna A m comprises exactly K acoustic sensors (with K greater than or equal to 2, preferably K greater than or equal to 4), for example 32 acoustic sensors.
  • K acoustic sensors
  • certain acoustic antennae could comprise more than K acoustic sensors.
  • Each acoustic antenna A m produces a plurality of signals (precisely N m signals) representative of the sound field at the level of the antenna A m concerned.
  • N m signals the vector (of dimension N m ) formed of the signals produced by the antenna A m :
  • r (m) the vector defining the position of the antenna A m (i.e. for example the vector formed of the coordinates of the point where the antenna A is located m in the aforementioned orthonormal frame).
  • the values contained in a vector s (m) relate to a given time interval and a given frequency range. Each acoustic antenna A m can therefore produce, at each time interval studied, several such vectors respectively associated with several frequency ranges.
  • each antenna A m can also communicate with a processing unit P (for example by means of a wireless link or, as a variant, a wired link) in order to allow exchanges of data between this antenna A m and the processing unit P.
  • a processing unit P for example by means of a wireless link or, as a variant, a wired link
  • the processing unit P is designed to estimate signals representative of the sound field at point U on the basis of the signals measured by the acoustic antennas A 1 , A m , A M ; the processing unit P is therefore an example of an electronic device according to the invention.
  • FIG. 2 is a functional representation of an example of an electronic device according to the invention.
  • the processing unit P can be made in accordance with figure 2.
  • this electronic device for example the processing unit P
  • the processing unit P comprises a processor (not shown) and a non-volatile memory (not shown) which stores computer program instructions executable by the processor and designed to implement at least part of the method described below with reference to Figure 4 when these instructions are executed by the processor.
  • the electronic device of FIG. 2 comprises transformation units 10 1 , 10 2 , 10 m , 10 M , gain application units 20 1 , 20 2 , 20 m , 20 M , and a summation unit 30.
  • Each transformation unit 10 receives as input the signals s (m) measured by a particular acoustic antenna A m in order to process these signals s (m) as explained below.
  • the number (denoted here M) of transformation units 10 1 , 10 2 , 10 m , 10 M is therefore equal to the number of acoustic antennas A 1 , A m , A M .
  • each transformation unit 10 m uses a set of quantities respectively indicative of a sound activity at a set of points in space E; these quantities can thus form, for example, a mesh of the region of space E where the user is likely to evolve.
  • These quantities indicative of sound activity are, for example, values of a quantity representative of sound energy, such as acoustic powers, and can be determined in accordance with the process described in patent application WO 2021/130132.
  • these quantities indicative of a sound activity could be probabilities of the presence of a sound source at the point associated with the quantity concerned.
  • each 10 m transformation unit is designed to determine, for each point of the set of points (forming here a mesh as indicated above), a value as a function of the received signals s ( m) and the quantity associated with the point concerned, to weight each value thus determined by a weight depending on the distance between the estimation point U and the point concerned, and to combine (here by summation) the weighted values obtained for the different points of the point set.
  • Each transformation unit 10 m thus produces transformed signals, represented below in the form of a vector t (m) of transformed signals, each transformed signal t n (m) corresponding to a combination of the aforementioned weighted values as explained in more detail below.
  • the number of transformed signals produced by each transformation unit 10 m is equal to the number N U of signals estimated at point U.
  • the dimension of each vector t (m) of transformed signals is equal to the number N U of signals estimated at point U.
  • each 10 m transformation unit The transformed signals produced by each 10 m transformation unit are applied to the input of a corresponding 20 m gain application unit.
  • Each gain application unit 20 m applies a gain g m to the signals t (m) received at the input or, in other words, weights these signals t (m) with a weight g m .
  • the outputs of the gain application units 20 1 , 20 2 , 20 m , 20 M are applied to the input of the summing unit 30.
  • the summing unit 30 produces the estimated signals sought, namely the signals representative of the sound field at point U. We denote below s (U) the vector (of dimension N U ) formed of these estimated signals.
  • the gain application units 20 1 , 20 2 , 20 m , 20 M and the summation unit 30 therefore make it possible to obtain signals estimated as follows:
  • FIG. 3 represents, in functional form, an example of possible construction for each of the transformation units 10 1 , 10 2 , 10 m , 10 M .
  • An embodiment that can be envisaged for the transformation unit 10 m is described below by way of example.
  • FIG. 3 can in practice be implemented due to the execution, by the aforementioned processor of the electronic device of FIG. 2, of computer program instructions stored in the aforementioned non-volatile memory.
  • the transformation unit of figure 3 comprises an analysis module 50, a decomposition module 60, a weighting module 70 and a recomposition module 80.
  • the analysis module 50 is designed to produce the quantities respectively indicative of a sound activity for the aforementioned set of points.
  • a set comprising N p points and we note e 1 , ..., e i , ..., e NP the quantities respectively associated with the different points.
  • the number Np of points in the set of points is for example greater than (or equal to) 100.
  • these quantities e i can be values of a quantity representative of the sound energy, for example acoustic powers.
  • the analysis module 50 can in practice produce the quantities e 1 ,..., e i ,..., e NP on the basis of the signals measured by the different antennas A 1 , A m , A M , for example in accordance to the technique described in patent application WO 2021/130132.
  • Each antenna A m can in this case comprise its own processing unit as described in this patent application.
  • the quantities produced by the analysis module 50 are valid for all the transformation units 10 1 , 10 2 , 10 m , 10 M ; the electronic device of FIG. 2 can therefore comprise in practice a single analysis module 50 common to all the transformation units 10 1 , 10 2 , 10 m , 10 M .
  • the set of quantities e 1 , ..., e i , ..., e NP forms a map of the quantity representative of the sound energy (for example the acoustic power) over a part of the space E (comprising the points of the point set).
  • the quantities produced by the analysis module 50 can be probabilities of presence of a sound source respectively relating to the N p points of the set of points.
  • the decomposition module 60 receives as input the signals s (m) measured by the antenna A m associated with the transformation unit 10 m described here and produces as output values V i (m) respectively associated with the points of the dot set.
  • V (m) the vector (of dimension N p ) whose components are the values V i (m) associated with the points of the set of points.
  • the decomposition module 60 determines each value V i (m) as a function of the signals s (m) received at the input and of the quantity e i (produced by the analysis module 50) relating to the point associated with this value V i ( m) .
  • the associated value V i (m) can be obtained by linear combination of the signals s 1 (m) , ... , S Nm (m) received at input ( signals measured by the antenna A m ), then multiplication by the quantity ei associated with the point concerned.
  • the decomposition module 60 determines for example the values V i (m) forming the vector V (m) by (matrix) multiplication of the vector s (m) (formed by the signals received at the input) by a matrix D (m) ( of dimension N p x N m ) which depends on the quantities e 1 , ..., e i , ..., e NP .
  • An example of possible construction for this matrix D (m) is given later.
  • the weighting module 70 receives as input the values V i (m) respectively associated with the (N p ) points of the set of points (here in the form of the vector V (m) ) and produces as output weighted values, forming the components of a vector P (m) and also associated with the different points of the set of points.
  • the weighted value P i (m) associated with this point is for example obtained by multiplying the value V i (m) associated with this point by a weight W i (m) ; in the example described here, this weight W i (m) depends on the distance between point U (estimate point) and the point concerned, and/or on the distance between the point concerned and the position of the antenna A m associated with the 10 m transformation unit described here.
  • This weight W i (m) is for example defined as follows:
  • r i is a vector defining the position of the point concerned of the set of points (that is to say whose components define the coordinates of the point concerned in the orthonormal reference already mentioned).
  • the weight W i (m) associated with a point of the set of points is therefore decreasing as a function of the distance separating this point and the estimation point U (first distance) and/or increasing as a function of the distance separating this point and the antenna A m associated with the 10 m transformation unit described here (second distance).
  • the weight W i (m) is equal to the second distance divided by the first distance.
  • the recomposition module 80 receives as input the weighted values P i (m) , here within the vector P (m) , and produces as output the transformed signals t n (m) forming the vector t (m) (of dimension N U ) already mentioned.
  • Each transformed signal t n (m) is for example obtained by linear combination of the weighted values P i (m) .
  • the recomposition module 80 determines the vector t (m) by (matrix) multiplication of the vector P (m) by a matrix R (of dimensions N U ⁇ N p ).
  • a matrix R of dimensions N U ⁇ N p .
  • This method begins with a step E2 during which the acoustic sensors of the various antennas A 1 , A 2 , ... , A m , ..., A M perform measurements (for example over a time interval of predetermined duration ) so that each antenna A m produces (after processing the measurements made) a set of N m signals representative of the sound field at the level of the antenna A m concerned, these signals being as previously denoted in vector form s (m) .
  • each antenna A m can produce (by Fourier transformation over the aforementioned time interval) several sets of N m signals associated respectively with several frequency ranges.
  • N m signals associated respectively with several frequency ranges.
  • identical processing can, if necessary, be applied for the other sets of N m signals associated with other frequency ranges).
  • the method of FIG. 4 continues with a step E4 during which the electronic device (here precisely the analysis module 50) determines the quantities e 1 , ... , e i , ... , e NP respectively indicative of a sound activity at a point of the set of N p points already mentioned.
  • these quantities e 1 , ... , e i , ... , e NP indicative of sound activity are for example values of a quantity representative of sound energy, such as acoustic powers, and can be determined according to the process described in patent application WO 2021/130132.
  • these quantities can be probabilities of the presence of a sound source at the points concerned.
  • the method of FIG. 4 then comprises a step E6 of selecting a plurality of antennas used to estimate the signals representative of the sound field at point U.
  • the electronic device selects for example four antennas defining a tetrahedron whose volume contains the point U.
  • the electronic device selects three antennas defining a triangle whose surface contains the point U.
  • the method then continues taking into account only the signals s (m) associated with the selected antennas.
  • the selection step E6 is however optional. In particular, such a selection is not implemented when the number of antennas is limited, for example when the number M of antennas is less than or equal to 3 in the case of a three-dimensional space E.
  • the method of FIG. 4 then comprises a step E8 of determining the transformed signals t (m) .
  • These transformed signals t (m) are determined, for each antenna A m , by combining the values P i (m) respectively associated with the points of the set of points, each determined as a function of the signals s (m) representative of the sound field from the antenna A m concerned, and weighted by the weight W i (m) associated (for this antenna A m ) at the point concerned.
  • ⁇ (m) is the adjoint matrix of A (m) .
  • E is a diagonal matrix of dimensions N p x N p whose diagonal contains the quantities e 1 , ... , e i , ... , e NP indicative of a sound activity respectively associated with the different points of the set of points, in other words:
  • is a regularization matrix that models the presence of a diffuse component of the sound field.
  • the transfer functions from the position point r i to the point where the antenna A m is located can be expressed (which regardless of the frequency considered) as follows:
  • the method of FIG. 4 then ends with a step E10 of mixing the transformed signals t (1) , t (2) , t (m) , t (M) , for example by weighted summation of these different transformed signals t ( 1) , t (2) , t (m) , t (M) , in order to obtain the estimated signals s (U) .
  • weights g 1 , g 2 , g m , g M respectively associated with the transformed signals t (1) , t (2) , t (m) , t (M) in this weighted sum depend for example on the positions of the point of estimation and of the various antennas A 1 , A 2 , A m , as explained below.
  • the estimated signals sought s (U) (signals representative of the sound field at point U) are for example calculated as follows: [Math.7]
  • the weights g m are for example determined as a function of the relative position of the estimation point U and of each of the antennas A m selected.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

Dans un procédé d'estimation d'une première pluralité de signaux (s(u) ) représentatifs du champ sonore en un premier point (U) sur la base d'une seconde pluralité de signaux (s(m) ) représentatifs du champ sonore en un second point (Am) et d'un ensemble de quantités (e1,.. eNp) respectivement associées à un ensemble de points et indicatives chacune d'une activité sonore au point concerné, l'estimation d'au moins un signal de la première pluralité comprend une étape de combinaison de valeurs (V i (m)) respectivement associées aux points de l'ensemble, déterminées chacune en fonction des signaux (s(m) ) de la seconde pluralité et de la quantité (ei) associée au point concerné, et pondérées par un poids (wi (m)) dépendant d'une première distance entre le premier point et le point concerné. Un dispositif électronique et un programme d'ordinateur associés sont également proposés.

Description

Procédé d’estimation d’une pluralité de signaux représentatifs du champ sonore en un point, dispositif électronique et programme d’ordinateur associés
Domaine technique de l'invention
La présente invention concerne le domaine technique de l’acoustique. Elle concerne plus particulièrement un procédé d’estimation d’une pluralité de signaux représentatifs du champ sonore en un point, ainsi qu’un dispositif électronique et un programme d’ordinateur associés.
Etat de la technique
On connaît de la demande de brevet publiée sous la référence WO 2020/120 772 un procédé d’interpolation d’un champ sonore capté par une pluralité de microphones délivrant chacun un champ sonore encodé.
Selon ce procédé, le champ sonore au point d’interpolation est déterminé au moyen d’une combinaison linéaire des champs sonores encodés, avec pondération de chaque champ sonore encodé par un facteur de pondération estimé notamment sur la base d’une puissance estimée du champ sonore à la position d’interpolation.
Présentation de l'invention
Dans ce contexte, la présente invention propose un procédé d’estimation d’une première pluralité de signaux représentatifs du champ sonore en un premier point sur la base d’une seconde pluralité de signaux représentatifs du champ sonore en un second point et d’un ensemble de quantités respectivement associées à un ensemble de points et indicatives chacune d’une activité sonore au point concerné, dans lequel l’estimation d’au moins un signal de la première pluralité comprend une étape de combinaison de valeurs respectivement associées aux points de l’ensemble, déterminées chacune en fonction des signaux de la seconde pluralité et de la quantité associée au point concerné, et pondérées par un poids dépendant d’une première distance entre le premier point et le point concerné.
Le passage par des valeurs associées respectivement aux points d’un ensemble de points et l’utilisation d’une cartographie de l’activité sonore sur cet ensemble de points (cartographie formée par les quantités respectivement indicatives d’une activité sonore pour cet ensemble de points) permettent d’obtenir une estimation particulièrement précise des signaux de la première pluralité.
La prise en compte desdites premières distances (distances entre le premier point et chaque point de l’ensemble de points) permet par ailleurs de tenir compte des signaux associés respectivement aux points de l’ensemble d’une manière adaptée au point où les signaux de la première pluralité sont estimés (premier point).
D’autres caractéristiques non limitatives et avantageuses du procédé d’estimation conforme à l’invention, prises individuellement ou selon toutes les combinaisons techniquement possibles, sont les suivantes :
- pour chaque point dudit ensemble de points, le poids dépend en outre d’une seconde distance entre le second point et le point concerné ;
- pour chaque point dudit ensemble de points, le poids est déterminé au moyen d’une fonction décroissante en fonction de la première distance et/ou croissante en fonction de la seconde distance ;
- pour chaque point dudit ensemble de points, le poids peut être égal à la seconde distance divisée par la première distance ;
- l’estimation dudit au moins un signal de la première pluralité est réalisée sur la base en outre d’une troisième pluralité de signaux représentatifs du champ sonore en un troisième point ;
- l’estimation dudit au moins un signal de la première pluralité comprend une étape de combinaison d’autres valeurs respectivement associées aux points de l’ensemble, déterminées chacune en fonction des signaux de la troisième pluralité et de la quantité associée au point concerné, et pondérées par un autre poids dépendant d’une troisième distance entre le troisième point et le point concerné, et/ou de la distance entre le premier point et le point concerné ;
- ledit au moins un signal de la première pluralité est estimé par somme pondérée du résultat de ladite combinaison desdites valeurs et du résultat de ladite combinaison desdites autres valeurs, les poids respectivement associés au résultat de ladite combinaison desdites valeurs et au résultat de ladite combinaison desdites autres valeurs dans ladite somme pondérée dépendant des positions respectives du premier point, du second point et du troisième point ;
- la valeur associée à un point donné de l’ensemble de points est déterminée sur la base d’un produit de la quantité associée au point donné et d’une valeur brute dépendant des signaux de la seconde pluralité et de facteurs définissant une fonction de transfert représentant la propagation acoustique à partir du point donné jusqu’au second point ; - chaque facteur est la valeur prise par une fonction harmonique sphérique pour la direction du point donné relativement au second point, divisée par la distance entre le point donné et le second point ;
- l’estimation des signaux de la première pluralité comprend une multiplication d’une matrice par un vecteur ayant pour éléments lesdites valeurs associés respectivement aux points de l’ensemble et pondérées, chaque colonne de la matrice comprenant une pluralité d’éléments définissant une fonction de transfert représentant la propagation acoustique à partir d’un point compris dans l’ensemble de points et associé à la colonne concernée, et jusqu’au premier point ;
- un élément d’une colonne de la matrice est la valeur prise par une fonction harmonique sphérique pour la direction du point associé à cette colonne relativement au premier point, divisée par la distance entre le point associé à cette colonne et le premier point ;
- les signaux de la seconde pluralité sont des signaux mesurés par une antenne acoustique positionnée au second point ;
- les signaux de la troisième pluralité sont des signaux mesurés par une antenne acoustique positionnée au troisième point ;
- les signaux de la seconde pluralité et/ou les signaux de la troisième pluralité sont des signaux enregistrés ;
- le nombre de signaux de la première pluralité est égal au nombre de signaux de la seconde pluralité et/ou au nombre de signaux de la troisième pluralité ;
- les signaux de la première pluralité et/ou les signaux de la seconde pluralité sont des signaux ambisoniques ;
- l’ensemble de points comprend au moins 100 points ;
- la quantité associée à un point est une valeur d’une grandeur représentative de l’énergie sonore en ce point ;
- la quantité associée à un point à la puissance sonore en ce point ;
- la quantité associée à un point est indicative de la présence (ou d’une probabilité de présence) d’une source sonore en ce point.
La présente invention concerne encore un dispositif électronique conçu pour estimer une première pluralité de signaux représentatifs du champ sonore en un premier point sur la base d’une seconde pluralité de signaux représentatifs du champ sonore en un second point et d’un ensemble de quantités respectivement associées à un ensemble de points et indicatives chacune d’une activité sonore au point concerné, comprenant une unité de transformation conçue pour combiner des valeurs respectivement associées aux points de l’ensemble, déterminées chacune en fonction des signaux de la seconde pluralité et de la quantité associée au point concerné, et pondérées par un poids dépendant d’une première distance entre le premier point et le point concerné.
L’invention propose également un programme d’ordinateur comprenant des instructions exécutables par un processeur et conçues pour mettre en œuvre un procédé tel que mentionné ci-dessus lorsque ces instructions sont exécutées par le processeur.
L’invention propose enfin un support d’enregistrement non-transitoire, éventuellement amovible, lisible par un tel processeur et mémorisant un tel programme d’ordinateur.
Bien entendu, les différentes caractéristiques, variantes et formes de réalisation de l'invention peuvent être associées les unes avec les autres selon diverses combinaisons dans la mesure où elles ne sont pas incompatibles ou exclusives les unes des autres.
Description détaillée de l'invention
De plus, diverses autres caractéristiques de l'invention ressortent de la description annexée effectuée en référence aux dessins qui illustrent des formes, non limitatives, de réalisation de l'invention et où :
- la figure 1 représente schématiquement un contexte possible d’utilisation de l’invention ;
- la figure 2 est une représentation fonctionnelle d’un exemple de dispositif électronique conforme à l’invention ;
- la figure 3 représente, sous forme fonctionnelle, une unité de transformation du dispositif électronique de la figure 2 ; et
- la figure 4 représente les étapes principales d’un exemple de procédé d’estimation des signaux représentatifs du champ sonore conforme à l’invention.
La figure 1 représente un contexte possible d’utilisation de l’invention dans lequel une pluralité d’antennes acoustiques (ici M antennes acoustiques) A1, Am, AM sont présentes dans un espace E. On décrit ici le cas d’un espace E tridimensionnel, mais l’invention s’applique également lorsque les points et les signaux sont définis dans un espace bidimensionnel (ces points et ces signaux pouvant alors former par exemple une représentation d’une situation réelle dans un plan).
Comme expliqué dans la suite, l’invention vise à estimer des signaux représentatifs du champ sonore en un point U de l’espace E sur la base de signaux représentatifs du champ sonore en un autre point de l’espace E, ici sur la base des signaux mesurés par au moins une antenne acoustique Am. Selon une variante envisageable, les signaux représentatifs du champ sonore au niveau de l’autre point (ou d’autres points) de l’espace E pourraient être des signaux enregistrés.
L’invention présente donc par exemple un intérêt pour la diffusion de contenus audiovisuels immersifs et interactifs, qui permettent une navigation (virtuelle) de l’utilisateur dans l’espace E et qui nécessitent donc l’estimation de signaux représentatifs du champ sonore à la position courante de l’utilisateur (qui correspond ainsi au point U susmentionné).
On note dans la suite NU le nombre des signaux qui sont ainsi estimés pour représenter le champ sonore au point U et r(U) le vecteur définissant la position du point U (c’est-à-dire par exemple le vecteur formé des coordonnées du point U dans un repère orthonormé de l’espace E).
Chaque antenne acoustique (en anglais : "microphone array") Am comprend plusieurs capteurs acoustiques Sj aptes chacun à effectuer une mesure d’un champ sonore présent au niveau du capteur acoustique Sj concerné.
Dans l’exemple décrit ici, chaque antenne Am comprend exactement K capteurs acoustiques (avec K supérieur ou égal à 2, de préférence K supérieur ou égal à 4), par exemple 32 capteurs acoustiques. En variante toutefois, certaines antennes acoustiques pourraient comprendre plus de K capteurs acoustiques.
Chaque antenne acoustique Am produit une pluralité de signaux (précisément Nm signaux) représentatifs du champ sonore au niveau de l’antenne Am concernée. On note dans la suite s(m) le vecteur (de dimension Nm) formé des signaux produits par l’antenne Am :
[Math. 1 ]
Figure imgf000007_0001
T est l’opérateur transposé, et on note r(m) le vecteur définissant la position de l’antenne Am (c’est-à-dire par exemple le vecteur formé des coordonnées du point où est située l’antenne Am dans le repère orthonormé susmentionné). En pratique, les valeurs contenues dans un vecteur s(m) sont relatives à un intervalle de temps donné et à une plage de fréquence donnée. Chaque antenne acoustique Am peut donc produire, à chaque intervalle de temps étudié, plusieurs tels vecteurs respectivement associés à plusieurs plages de fréquence. On détaille dans la suite les traitements effectués à partir du vecteur s(m), c’est-à-dire pour une plage de fréquences donnée ; des traitements du même type peuvent être en pratique appliqués aux autres vecteurs éventuellement produits (à chaque intervalle de temps) pour d’autres plages de fréquence par les différentes antennes.
Les signaux s(m) sont par exemple des signaux ambisoniques d’ordre L. On a dans ce cas Nm = (L+1 )2.
Dans l’exemple de contexte de la figure 1 , chaque antenne Am peut par ailleurs communiquer avec une unité de traitement P (par exemple au moyen d’une liaison sans fil ou, en variante, d’une liaison filaire) afin de permettre des échanges de données entre cette antenne Am et l’unité de traitement P.
Comme expliqué dans la suite, l’unité de traitement P est conçue pour estimer des signaux représentatifs du champ sonore au point U sur la base des signaux mesurés par les antennes acoustiques A1 , Am, AM ; l’unité de traitement P est donc un exemple de dispositif électronique conforme à l’invention.
La figure 2 est une représentation fonctionnelle d’un exemple de dispositif électronique conforme à l’invention. L’unité de traitement P peut être réalisée conformément à la figure 2.
Dans l’exemple décrit ici, ce dispositif électronique (par exemple l’unité de traitement P) comprend un processeur (non représenté) et une mémoire non-volatile (non représentée) qui mémorise des instructions de programme d’ordinateur exécutables par le processeur et conçues pour mettre en œuvre une partie au moins du procédé décrit ci-dessous en référence à la figure 4 lorsque ces instructions sont exécutées par le processeur.
Dans cet exemple, les différentes parties fonctionnelles du dispositif électronique décrites ci-dessous et représentées sur la figure 2 sont mises en œuvre du fait de l’exécution de certaines de ces instructions de programme d’ordinateur par le processeur. Toutefois, en variante, ces parties fonctionnelles pourraient être mises en œuvre sous une autre forme, par exemple par utilisation de circuits en logique câblée ou de circuits intégrés à application spécifique.
Le dispositif électronique de la figure 2 comprend des unités de transformation 101 , 102, 10m, 10M, des unités d’application de gain 201 , 202, 20m, 20M, et une unité de sommation 30.
Chaque unité de transformation 10, reçoit en entrée les signaux s(m) mesurés par une antenne acoustique Am particulière afin de traiter ces signaux s(m) comme expliqué ci-dessous. Le nombre (noté ici M) des unités de transformation 101 , 102, 10m, 10M est donc égal au nombre des antennes acoustiques A1 , Am, AM.
Comme expliqué plus en détail dans la suite, chaque unité de transformation 10m utilise un ensemble de quantités respectivement indicatives d’une activité sonore en un ensemble de points de l’espace E ; ces quantités peuvent ainsi former par exemple un maillage de la région de l’espace E où est susceptible d’évoluer l’utilisateur.
Ces quantités indicatives d’une activité sonore sont par exemple des valeurs d’une grandeur représentative de l’énergie sonore, telle que des puissances acoustiques, et peuvent être déterminées conformément au processus décrit dans la demande de brevet WO 2021/130 132. En variante, ces quantités indicatives d’une activité sonore pourraient être des probabilités de présence d’une source sonore au point associé à la quantité concernée. On pourra se référer à ce sujet à l’article “Joint speaker localization and array calibration using expectation-maximization" , de Y. Dorfan, O. Schwartz and S. Gannot, in J. AUDIO SPEECH MUSIC PROC. 2020, 9 (2020).
Conformément à ce qui est présenté plus loin, chaque unité de transformation 10m est conçue pour déterminer, pour chaque point de l’ensemble de points (formant ici un maillage comme indiqué ci-dessus), une valeur en fonction des signaux reçus s(m) et de la quantité associée au point concerné, pour pondérer chaque valeur ainsi déterminée par un poids dépendant de la distance entre le point d’estimation U et le point concerné, et pour combiner (ici par sommation) les valeurs pondérées obtenues pour les différents points de l’ensemble de points.
Chaque unité de transformation 10m produit ainsi des signaux transformés, représentés dans la suite sous forme d’un vecteur t(m) de signaux transformés, chaque signal transformé tn (m) correspondant à une combinaison des valeurs pondérées susmentionnées comme cela est expliqué plus en détail dans la suite.
Dans l’exemple décrit ici, le nombre de signaux transformés produits par chaque unité de transformation 10m est égal au nombre NU de signaux estimés au point U. Autrement dit, la dimension de chaque vecteur t(m) de signaux transformés est égale au nombre NU de signaux estimés au point U.
Les signaux transformés produits par chaque unité de transformation 10m sont appliqués en entrée d’une unité d’application de gain 20m correspondante. Chaque unité d’application de gain 20m applique un gain gm aux signaux t(m) reçus en entrée ou, autrement dit, pondère ces signaux t(m) avec un poids gm.
Les sorties des unités d’application de gain 201, 202, 20m, 20M (à savoir les signaux transformés pondérés) sont appliquées en entrée de l’unité de sommation 30. L’unité de sommation 30 produit en sortie les signaux estimés recherchés, à savoir les signaux représentatifs du champ sonore au point U. On note dans la suite s(U) le vecteur (de dimension NU) formé de ces signaux estimés.
Les unités d’application de gain 201, 202, 20m, 20M et l’unité de sommation 30 permettent donc d’obtenir des signaux estimés comme suit :
[Math. 2]
Figure imgf000010_0001
La figure 3 représente, sous forme fonctionnelle, un exemple de constitution possible pour chacune des unités de transformation 101, 102, 10m, 10M. On décrit ci- dessous à titre d’exemple un mode de réalisation envisageable pour l’unité de transformation 10m.
Chaque élément de la figure 3 peut en pratique être mis en œuvre du fait de l’exécution, par le processeur susmentionné du dispositif électronique de la figure 2, d’instructions de programme d’ordinateur mémorisées dans la mémoire non-volatile susmentionnée.
L’unité de transformation de la figure 3 comprend un module d’analyse 50, un module de décomposition 60, un module de pondération 70 et un module de recomposition 80.
Le module d’analyse 50 est conçu pour produire les quantités respectivement indicatives d’une activité sonore pour l’ensemble de points précité. Dans l’exemple décrit ici, on considère un ensemble comprenant Np points et on note e1, ..., ei, ..., eNP les quantités respectivement associées aux différents points. En pratique, le nombre Np de points dans l’ensemble de points est par exemple supérieur (ou égal) à 100.
Comme déjà indiqué, ces quantités ei peuvent être des valeurs d’une grandeur représentative de l’énergie sonore, par exemple des puissances acoustiques.
Le module d’analyse 50 peut en pratique produire les quantités e1, ..., ei, ..., eNP sur la base des signaux mesurés par les différentes antennes A1 , Am, AM, par exemple conformément à la technique décrite dans la demande de brevet WO 2021/130 132. Chaque antenne Am peut dans ce cas comprendre une unité de traitement propre comme décrit dans cette demande de brevet.
On remarque que les quantités produites par le module d’analyse 50 sont valables pour toutes les unités de transformation 101, 102, 10m, 10M ; le dispositif électronique de la figure 2 peut donc comprendre en pratique un unique module d’analyse 50 commun à l’ensemble des unités de transformation 101, 102, 10m, 10M.
L’ensemble des quantités e1, ..., ei, ..., eNP forme une cartographie de la grandeur représentative de l’énergie sonore (par exemple la puissance acoustique) sur une partie de l’espace E (comprenant les points de l’ensemble de points).
En variante, les quantités produites par le module d’analyse 50 peuvent être des probabilités de présence d’une source sonore respectivement relatives aux Np points de l’ensemble de points.
Le module de décomposition 60 reçoit en entrée les signaux s(m) mesurés par l’antenne Am associée à l’unité de transformation 10m décrite ici et produit en sortie des valeurs Vi (m) respectivement associées aux points de l’ensemble de point. On note dans la suite V(m) le vecteur (de dimension Np) dont les composantes sont les valeurs Vi (m) associées aux points de l’ensemble de points.
Le module de décomposition 60 détermine chaque valeur Vi (m) en fonction des signaux s(m) reçus en entrée et de la quantité ei (produite par le module d’analyse 50) relative au point associé à cette valeur Vi (m).
Comme expliqué plus loin, pour chaque point de l’ensemble de points, la valeur Vi (m) associée peut être obtenue par combinaison linéaire des signaux s1 (m), ... , SNm (m) reçus en entrée (signaux mesurés par l’antenne Am), puis multiplication par la quantité ei associée au point concerné. Le module de décomposition 60 détermine par exemple les valeurs Vi (m) formant le vecteur V(m) par multiplication (matricielle) du vecteur s(m) (formés par les signaux reçus en entrée) par une matrice D(m) (de dimension Np x Nm) qui dépend des quantités e1, ..., ei, ..., eNP. Un exemple de construction possible pour cette matrice D(m) est donné plus loin.
Le module de pondération 70 reçoit en entrée les valeurs Vi (m) respectivement associées aux (Np) points de l’ensemble de points (ici sous la forme du vecteur V(m)) et produit en sortie des valeurs pondérées, formant les composantes d’un vecteur P(m) et également associées aux différents points de l’ensemble de points.
Pour chaque point de l’ensemble de points, la valeur pondérée Pi (m) associée à ce point est par exemple obtenue par multiplication de la valeur Vi (m) associée à ce point par un poids Wi (m) ; dans l’exemple décrit ici, ce poids Wi (m) dépend de la distance entre le point U (point d’estimation) et le point concerné, et/ou de la distance entre le point concerné et la position de l’antenne Am associée à l’unité de transformation 10m décrite ici.
Ce poids Wi (m) est par exemple défini comme suit :
[Math. 3]
Figure imgf000012_0001
où ri est un vecteur définissant la position du point concerné de l’ensemble de points (c’est-à-dire dont les composantes définissent les coordonnées du point concerné dans le repère orthonormé déjà mentionné).
Le poids Wi (m) associé à un point de l’ensemble de points est donc décroissant en fonction de la distance séparant ce point et le point d’estimation U (première distance) et/ou croissant en fonction de la distance séparant ce point et l’antenne Am associée à l’unité de transformation 10m décrite ici (seconde distance). Ici, comme indiqué ci-dessus, le poids Wi (m) est égal à la seconde distance divisée par la première distance.
Pour chaque point de l’ensemble de points, on a alors : Pi (m) = Wi (m) . Vi (m)
Dans l’exemple décrit ici, le module de pondération 70 détermine le vecteur P(m) à partir du vecteur V(m) par multiplication (matricielle) par une matrice diagonale W(m) dont les éléments diagonaux sont les poids respectivement associés aux points de l’ensemble de points : W(m) = diag(W1 (m), W2 (m), ... , WNP (m)) Le module de recomposition 80 reçoit en entrée les valeurs pondérées Pi (m), ici au sein du vecteur P(m), et produit en sortie les signaux transformés tn (m) formant le vecteur t(m) (de dimension NU) déjà mentionné.
Chaque signal transformé tn(m) est par exemple obtenu par combinaison linéaire des valeurs pondérées Pi (m).
En pratique, le module de recomposition 80 détermine ici le vecteur t(m) par multiplication (matricielle) du vecteur P(m) par une matrice R (de dimensions NU x Np). Un exemple de construction de cette matrice R est donné plus loin.
On décrit à présent en référence à la figure 4 un exemple de procédé d’estimation des signaux représentatifs du champ sonore au point U.
Ce procédé débute par une étape E2 au cours de laquelle les capteurs acoustiques des différentes antennes A1, A2, ... , Am, ..., AM effectuent des mesures (par exemple sur un intervalle de temps de durée prédéterminée) de sorte que chaque antenne Am produise (après traitement des mesures effectuées) un ensemble de Nm signaux représentatifs du champ sonore au niveau de l’antenne Am concernée, ces signaux étant comme précédemment notés sous forme vectorielle s(m).
En pratique, chaque antenne Am peut produire (par transformation de Fourier sur l’intervalle de temps précité) plusieurs ensembles de Nm signaux associés respectivement à plusieurs plages de fréquence. Toutefois, pour simplifier l’exposé, on ne mentionne comme déjà indiqué dans la présente description qu’un seul ensemble de Nm signaux pour chaque antenne Am (un traitement identique pouvant le cas échéant être appliqué pour les autres ensembles de Nm signaux associés à d’autres plages de fréquence).
Le procédé de la figure 4 se poursuit par une étape E4 au cours de laquelle le dispositif électronique (ici précisément le module d’analyse 50) détermine les quantités e1 , ... , ei, ... , eNP respectivement indicatives d’une activité sonore en un point de l’ensemble de Np points déjà mentionné.
Comme déjà indiqué, ces quantités e1 , ... , ei, ... , eNP indicatives d’une activité sonore sont par exemple des valeurs d’une grandeur représentative de l’énergie sonore, telle que des puissances acoustiques, et peuvent être déterminées conformément au processus décrit dans la demande de brevet WO 2021/130 132.
En variante, ces quantités peuvent être des probabilités de présence d’une source sonore aux points concernés. Le procédé de la figure 4 comprend alors une étape E6 de sélection d’une pluralité d’antennes utilisées pour estimer les signaux représentatifs du champ sonore au point U.
Dans le cas d’un espace E tridimensionnel, le dispositif électronique sélectionne par exemple quatre antennes définissant un tétraèdre dont le volume contient le point U.
Dans la variante où l’espace considéré est bidimensionnel, le dispositif électronique sélectionne trois antennes définissant un triangle dont la surface contient le point U.
Le procédé se poursuit alors en ne tenant compte que des signaux s(m) associés aux antennes sélectionnées.
L’étape de sélection E6 est toutefois facultative. En particulier, une telle sélection n’est pas mise en œuvre lorsque le nombre d’antennes est limité, par exemple lorsque le nombre M d’antennes est inférieur ou égal à 3 dans le cas d’une espace E tridimensionnel.
Le procédé de la figure 4 comprend alors une étape E8 de détermination des signaux transformés t(m).
Ces signaux transformés t(m) sont déterminés, pour chaque antenne Am, par combinaison des valeurs Pi (m) respectivement associées aux points de l’ensemble de points, déterminées chacune en fonction des signaux s(m) représentatifs du champ sonore issus de l’antenne Am concernée, et pondérées par le poids Wi (m) associé (pour cette antenne Am) au point concerné.
Cette étape E8 est ici réalisée en effectuant, pour chaque antenne Am, une multiplication matricielle par une matrice T(m) : t(m) = T(m) .s(m) avec T(m) = R.W(m).D(m) la matrice T(m) étant donc de dimensions NU x Nm, où W(m) est la matrice diagonale définie plus haut, où R est la matrice (déjà mentionnée) de dimensions NU x Np dont les Np colonnes sont des vecteurs ρi définissant chacun une fonction de transfert représentant la propagation acoustique en champ libre (sans réverbération) à partir d’un point compris dans l’ensemble de points et jusqu’au point d’estimation U (les Np vecteurs ρi étant respectivement associés aux Np points de l’ensemble de points), où D(m) est la matrice (déjà mentionnée) de dimensions Np x Nm définie par exemple comme suit :
[Math. 4]
Figure imgf000015_0001
avec A(m) une matrice de dimensions Nm x Np dont les Np colonnes sont des vecteurs ai (m) définissant chacun une fonction de transfert représentant la propagation acoustique en champ libre (sans réverbération) à partir d’un point compris dans l’ensemble de points et jusqu’au point où est située l’antenne concernée Am,
Ā(m) est la matrice adjointe de A(m),
E est une matrice diagonale de dimensions Np x Np dont la diagonale contient les quantités e1 , ... , ei, ... , eNP indicatives d’une activité sonore respectivement associées aux différents points de l’ensemble de points, autrement dit :
E = diag( e1 , ... , ei, ... , eNP ), et
∑ est une matrice de régularisation qui modélise la présence d’une composante diffuse du champ sonore.
Dans le cas où les signaux s(m) sont des signaux ambisoniques (d’ordre L) comme décrit ici, les fonctions de transfert du point de position ri au point où est située l’antenne Am peuvent s’exprimer (quelle que soit la fréquence considérée) comme suit :
[Math. 5]
Figure imgf000015_0002
où Yl k est la fonction harmonique sphérique d’ordre I et de degré k, et où Ωi (m) est la direction dans laquelle se trouve le point concerné de l’ensemble de points (de coordonnées ri ) par rapport au point où est situé l’antenne Am concernée.
De même, pour obtenir des signaux transformés t(m) au format ambisonique d’ordre L’, les fonctions de transfert du point de position ri au point d’estimation U peuvent s’exprimer (quelle que soit la fréquence considérée) :
[Math. 6]
Figure imgf000015_0003
où Yl k est comme ci-dessus la fonction harmonique sphérique d’ordre I et de degré k, et où Φ i est la direction dans laquelle se trouve le point concerné de l’ensemble de points (de coordonnées ri) par rapport au point d’estimation U. On remarque que l’ordre L’ précité est lié à la dimension NU du vecteur des signaux estimés s(U) par la relation : NU = (L’+1)2. En pratique, on peut avoir L = L’ et ainsi NU = Nm , par exemple pour toutes les antennes Am, c’est-à-dire que le nombre de signaux estimés s(U) peut être égal au nombre des signaux s(m) représentatifs du champ sonore issus de chaque antenne Am. Dans le cas de signaux ambisoniques utilisant la normalisation N3D, la matrice de régularisation Σ peut s’écrire comme suit : Σ = σ.I, où I est la matrice identité et σ un facteur de régularisation (réel et strictement positif). Le procédé de la figure 4 se termine alors par une étape E10 de mélange des signaux transformés t(1), t(2), t(m), t(M), par exemple par sommation pondérée de ces différents signaux transformés t(1), t(2), t(m), t(M), afin d’obtenir les signaux estimés s(U). Les poids g1, g2, gm, gM respectivement associés aux signaux transformés t(1), t(2), t(m), t(M) dans cette somme pondérée dépendent par exemple des positions du point d’estimation et des différentes antennes A1, A2, Am, comme expliqué ci-dessous. Comme déjà indiqué, les signaux estimés recherchés s(U) (signaux représentatifs du champ sonore au point U) sont par exemple calculés comme suit : [Math.7]
Figure imgf000016_0001
Dans le cas où l’espace E considéré est tridimensionnel et où l’étape de sélection E6 a été mise en œuvre pour sélectionner les antennes Am dont les positions forment un tétraèdre dont le volume comprend le point d’estimation U (seuls les signaux transformés t(m) associés aux antennes Am sélectionnées étant alors utilisés dans la somme pondérée), les poids gm sont par exemple déterminés en fonction de la position relative du point d’estimation U et de chacune des antennes Am sélectionnées. Si on note r(1), r(2), r(3), r(4) les vecteurs de coordonnées (tridimensionnelles) des positions respectives des 4 antennes A1, A2, A3, A4 formant le tétraèdre susmentionné, on peut utiliser les poids définis comme suit :
Figure imgf000016_0002
g4 = 1 ‒ (g1 + g2 + g3) où T est la matrice 3x3 donnée par : T = [(r(1) ‒ r(4)), (r(2) ‒ r(4)), (r(3) ‒ r(4))]. Dans le cas où l’espace E considéré est bidimensionnel et où l’étape de sélection E6 a été mise en œuvre pour sélectionner les antennes Am dont les positions forment un triangle M1M2M3 dont la surface comprend le point d’estimation U (seuls les signaux transformés t(m) associés aux antennes Am sélectionnées étant alors utilisés dans la somme pondérée), les poids g1, g2, g3 affectés respectivement aux signaux transformés associés aux antennes sélectionnées (situées respectivement au niveau des points M1, M2, M3) peuvent être déterminés comme suit : [Math.8]
Figure imgf000017_0001
[Math.9] ^^ = (^^ (^^
Figure imgf000017_0002
[Math.10] g1 = 1 − g2 − g3 où (xU, yU), (x1, y1), (x2, y2), (x3, y3) sont respectivement les coordonnées du point d’estimation U et des points M1, M2, M3 dans un repère orthonormé de l’espace bidimensionnel. Bien entendu, diverses autres modifications peuvent être apportées à l’invention dans le cadre des revendications annexées.

Claims

Revendications
1. Procédé d’estimation d’une première pluralité de signaux (s(U)) représentatifs du champ sonore en un premier point (U) sur la base d’une seconde pluralité de signaux (s(m)) représentatifs du champ sonore en un second point (Am) et d’un ensemble de quantités (e1, ei, eNP) respectivement associées à un ensemble de points et indicatives chacune d’une activité sonore au point concerné, dans lequel l’estimation d’au moins un signal de la première pluralité comprend une étape (E8) de combinaison de valeurs respectivement associées aux points de l’ensemble, déterminées chacune en fonction des signaux (s(m)) de la seconde pluralité et de la quantité ( ei) associée au point concerné, et pondérées par un poids dépendant d’une première distance entre le premier point (U) et le point concerné.
2. Procédé selon la revendication 1 , dans lequel, pour chaque point dudit ensemble de points, le poids dépend en outre d’une seconde distance entre le second point (Am) et le point concerné.
3. Procédé selon la revendication 1 ou 2, dans lequel l’estimation dudit au moins un signal de la première pluralité est réalisée sur la base en outre d’une troisième pluralité de signaux (s(M)) représentatifs du champ sonore en un troisième point (AM) et comprend une étape de combinaison d’autres valeurs respectivement associées aux points de l’ensemble, déterminées chacune en fonction des signaux (s(M)) de la troisième pluralité et de la quantité ( ei) associée au point concerné, et pondérées par un autre poids dépendant d’une troisième distance entre le troisième point (AM) et le point concerné.
4. Procédé selon la revendication 3, dans lequel ledit au moins un signal de la première pluralité est estimé par somme pondérée du résultat de ladite combinaison desdites valeurs et du résultat de ladite combinaison desdites autres valeurs, les poids respectivement associés au résultat de ladite combinaison desdites valeurs et au résultat de ladite combinaison desdites autres valeurs dans ladite somme pondérée dépendant des positions respectives du premier point, du second point et du troisième point.
5. Procédé selon l’une des revendications 1 à 4, dans lequel la valeur associée à un point donné de l’ensemble de points est déterminée sur la base d’un produit de la quantité (ei) associée au point donné et d’une valeur brute dépendant des signaux (s(m)) de la seconde pluralité et de facteurs définissant une fonction de transfert représentant la propagation acoustique à partir du point donné jusqu’au second point (Am).
6. Procédé selon la revendication 5, dans lequel chaque facteur est la valeur prise par une fonction harmonique sphérique pour la direction du point donné relativement au second point (Am), divisée par la distance entre le point donné et le second point (Am).
7. Procédé selon l’une des revendications 1 à 6, dans lequel l’estimation des signaux (s(U)) de la première pluralité comprend une multiplication d’une matrice (R) par un vecteur (P(m)) ayant pour éléments lesdites valeurs associés respectivement aux points de l’ensemble et pondérées, chaque colonne de la matrice (R) comprenant une pluralité d’éléments définissant une fonction de transfert représentant la propagation acoustique à partir d’un point compris dans l’ensemble de points et associé à la colonne concernée, et jusqu’au premier point (U).
8. Procédé selon la revendication 7, dans lequel un élément d’une colonne de la matrice (R) est la valeur prise par une fonction harmonique sphérique pour la direction du point associé à cette colonne relativement au premier point (U), divisée par la distance entre le point associé à cette colonne et le premier point (U).
9. Procédé selon l’une des revendications 1 à 8, dans lequel les signaux (s(m)) de la seconde pluralité sont des signaux mesurés par une antenne acoustique (Am) positionnée au second point.
10. Dispositif électronique conçu pour estimer une première pluralité de signaux (s(U)) représentatifs du champ sonore en un premier point (U) sur la base d’une seconde pluralité de signaux (s(m)) représentatifs du champ sonore en un second point (Am) et d’un ensemble de quantités (e1, ei, eNP ) respectivement associées à un ensemble de points et indicatives chacune d’une activité sonore au point concerné, comprenant une unité de transformation (101 ; 102 ; 10m ; 10M) conçue pour combiner des valeurs respectivement associées aux points de l’ensemble, déterminées chacune en fonction des signaux (s(m)) de la seconde pluralité et de la quantité (ei) associée au point concerné, et pondérées par un poids dépendant d’une première distance entre le premier point (U) et le point concerné.
11 . Programme d’ordinateur comprenant des instructions exécutables par un processeur et conçues pour mettre en œuvre un procédé selon l’une des revendications 1 à 9 lorsque ces instructions sont exécutées par le processeur.
PCT/EP2022/084651 2021-12-16 2022-12-06 Procédé d'estimation d'une pluralité de signaux représentatifs du champ sonore en un point, dispositif électronique et programme d'ordinateur associés WO2023110549A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FRFR2113709 2021-12-16
FR2113709A FR3131164B1 (fr) 2021-12-16 2021-12-16 Procédé d’estimation d’une pluralité de signaux représentatifs du champ sonore en un point, dispositif électronique et programme d’ordinateur associés

Publications (1)

Publication Number Publication Date
WO2023110549A1 true WO2023110549A1 (fr) 2023-06-22

Family

ID=80595530

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2022/084651 WO2023110549A1 (fr) 2021-12-16 2022-12-06 Procédé d'estimation d'une pluralité de signaux représentatifs du champ sonore en un point, dispositif électronique et programme d'ordinateur associés

Country Status (2)

Country Link
FR (1) FR3131164B1 (fr)
WO (1) WO2023110549A1 (fr)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190373392A1 (en) * 2017-07-12 2019-12-05 Google Llc Ambisonics sound field navigation using directional decomposition and path distance estimation
WO2020120772A1 (fr) 2018-12-14 2020-06-18 Fondation B-Com Procédé d'interpolation d'un champ sonore, produit programme d'ordinateur et dispositif correspondants
WO2021130132A1 (fr) 2019-12-27 2021-07-01 Fondation B-Com Procédé et système d'estimation d'une grandeur représentative de l'énergie sonore

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190373392A1 (en) * 2017-07-12 2019-12-05 Google Llc Ambisonics sound field navigation using directional decomposition and path distance estimation
WO2020120772A1 (fr) 2018-12-14 2020-06-18 Fondation B-Com Procédé d'interpolation d'un champ sonore, produit programme d'ordinateur et dispositif correspondants
WO2021130132A1 (fr) 2019-12-27 2021-07-01 Fondation B-Com Procédé et système d'estimation d'une grandeur représentative de l'énergie sonore

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KENTGENS MAXIMILIAN ET AL: "Translation of a Higher Order Ambisonics Sound Scene Based on Parametric Decomposition", ICASSP 2020 - 2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), IEEE, 4 May 2020 (2020-05-04), pages 151 - 155, XP033794035, DOI: 10.1109/ICASSP40776.2020.9054414 *
TYLKA JOSEPH ET AL: "Performance of Linear Extrapolation Methods for Virtual Sound Field Navigation", vol. 68, no. 3, 1 March 2020 (2020-03-01), US, pages 138 - 156, XP055909731, ISSN: 1549-4950, Retrieved from the Internet <URL:https://www.aes.org/tmpFiles/elib/20220406/20725.pdf> DOI: 10.17743/jaes.2019.0054 *
Y. DORFANO. SCHWARTZS. GANNOT: "Joint speaker localization and array calibration using expectation-maximization", J. AUDIO SPEECH MUSIC PROC, vol. 9, 2020

Also Published As

Publication number Publication date
FR3131164A1 (fr) 2023-06-23
FR3131164B1 (fr) 2023-12-22

Similar Documents

Publication Publication Date Title
Antonello et al. Room impulse response interpolation using a sparse spatio-temporal representation of the sound field
EP1546916B1 (fr) Procede et systeme de traitement d&#39;une representation d&#39;un champ acoustique
EP2898707B1 (fr) Calibration optimisee d&#39;un systeme de restitution sonore multi haut-parleurs
EP1992198B1 (fr) Optimisation d&#39;une spatialisation sonore binaurale a partir d&#39;un encodage multicanal
EP2258119B1 (fr) Procede et dispositif pour la determination de fonctions de transfert de type hrtf
RU2569346C2 (ru) Устройство и способ генерирования выходного сигнала с применением блока разложения сигнала
EP3414919B1 (fr) Sonde de microphone, procédé, système et produit-programme d&#39;ordinateur pour le traitement de signaux audio
EP1479266B1 (fr) Procede et dispositif de pilotage d&#39;un ensemble de restitution d&#39;un champ acoustique
EP3348079A1 (fr) Procédé et système d&#39;élaboration d&#39;une fonction de transfert relative à la tête adaptée à un individu
EP1586220B1 (fr) Procede et dispositif de pilotage d&#39;un ensemble de restitution a partir d&#39;un signal multicanal
EP1502475B1 (fr) Procede et systeme de representation d un champ acoustique
EP3895446B1 (fr) Procede d&#39;interpolation d&#39;un champ sonore, produit programme d&#39;ordinateur et dispositif correspondants.
WO2023110549A1 (fr) Procédé d&#39;estimation d&#39;une pluralité de signaux représentatifs du champ sonore en un point, dispositif électronique et programme d&#39;ordinateur associés
Viste Binaural localization and separation techniques
CN108535694A (zh) 活动说话者的位置估计
WO2021074502A1 (fr) Localisation perfectionnee d&#39;une source acoustique
EP4081769A1 (fr) Procédé et système d&#39;estimation d&#39;une grandeur représentative de l&#39;énergie sonore
EP4248231A1 (fr) Localisation perfectionnée d&#39;une source acoustique
EP3384688B1 (fr) Décompositions successives de filtres audio
EP1605440B1 (fr) Procédé de séparation de signaux sources à partir d&#39;un signal issu du mélange
EP3934282A1 (fr) Procédé de conversion d&#39;un premier ensemble de signaux représentatifs d&#39;un champ sonore en un second ensemble de signaux et dispositif électronique associé
EP3155609B1 (fr) Analyse frequentielle par démodulation de phase d&#39;un signal acoustique
FR2782228A1 (fr) Dispositif de simulation sonore et procede pour realiser un tel dispositif
WO2010000966A1 (fr) Procédé de simulation d&#39;un circuit électronique comportant au moins une partie analogique avec une densité spectrale de puissance
FR3072820A1 (fr) Procede de modelisation et de simulation en temps reel de sources acoustiques dans un environnement par decomposition en sources elementaires

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22830774

Country of ref document: EP

Kind code of ref document: A1