FR3112016A1

FR3112016A1 - Procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux et dispositif électronique associé

Info

Publication number: FR3112016A1
Application number: FR2006878A
Authority: FR
Inventors: Nicolas Epain; François SALMON
Original assignee: Fondation B Com
Current assignee: Fondation B Com
Priority date: 2020-06-30
Filing date: 2020-06-30
Publication date: 2021-12-31
Anticipated expiration: 2040-06-30
Also published as: EP3934282A1; US20210407524A1; FR3112016B1

Abstract

Un procédé de conversion comprend les étapes suivantes : - pour chacun des signaux (b E(t)) d’un premier ensemble, détermination de valeurs (α(f)) respectivement associées à des bandes de fréquence; - pour chaque bande de fréquence, conversion des valeurs (α(f)) associées à la bande de fréquence concernée, en au moins une valeur représentative d’une source sonore virtuelle orientée dans la direction de l’espace associée à une donnée mémorisée pour la bande de fréquence concernée ; - pour chaque bande de fréquence, détermination, sur la base d’une valeur représentative précitée, d’une pluralité de valeurs (λ(f)) associées respectivement aux différents signaux (b S(t)) du second ensemble ; - construction de chaque signal (b S(t)) d’un second ensemble sur la base des valeurs associées (λ(f)) à ce signal du second ensemble. Figure pour l’abrégé : figure 1

Description

Procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux et dispositif électronique associé

Domaine technique de l'invention

La présente invention concerne le domaine technique du traitement des signaux représentatifs d’un champ sonore.

Elle concerne notamment un procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux et un dispositif électronique associé.

Etat de la technique

Il a déjà été proposé de convertir un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux, par exemple pour permettre la restitution du champ sonore en appliquant les signaux du second ensemble à un système de reproduction (casque audio ou haut-parleurs).

Les signaux du premier ensemble ont parfois dans cette situation un format qui n’est pas directement utilisable par le système de reproduction. Il s’agit typiquement d’un format orienté-scène, tel qu’un format HOA (pour "High- Order Ambisonic s").

Une solution de ce type est proposée dans l’article "COMPASS : Coding and Multidirectional Parametrization of Ambisonic Sound Scenes”, de A. Politis, S. Tervo et V. PulkkiinProceedings of the 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), avril 2018.

Comme d’autres solutions d’ailleurs mentionnées dans cet article, cette solution repose sur l’estimation d’au moins une direction dominante par bande de fréquence au moyen d’une analyse des signaux du premier ensemble.

Cette analyse a toutefois un coût calculatoire important et nécessite donc un temps de traitement non négligeable.

Présentation de l'invention

Dans ce contexte, la présente invention propose un procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore dans un espace en un second ensemble de signaux au moyen d’un dispositif électronique, caractérisé en ce que le dispositif électronique mémorise, pour chaque bande de fréquence temporelle d’une pluralité de bandes de fréquence temporelle du champ sonore, au moins une donnée associée à une direction particulière de l’espace, l’ensemble de ces directions particulières de l’espace associées à une donnée pour au moins une bande de fréquence temporelle formant un maillage de l’ensemble des directions de l’espace, et en ce que le procédé comprend les étapes suivantes :

- pour chacun des signaux du premier ensemble, détermination de valeurs respectivement associées auxdites bandes de fréquence temporelle ;

- pour chaque bande de fréquence temporelle, conversion des valeurs associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux du premier ensemble, en au moins une valeur représentative d’une source sonore virtuelle orientée dans la direction de l’espace associée à la donnée mémorisée pour la bande de fréquence temporelle concernée ;

- pour chaque bande de fréquence temporelle, détermination, sur la base de ladite au moins une valeur représentative d’une source sonore virtuelle et obtenue à l’étape de conversion pour la bande de fréquence temporelle concernée, d’une pluralité de valeurs associées respectivement aux différents signaux du second ensemble ;

- construction de chaque signal du second ensemble sur la base des valeurs associées à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.

L’utilisation de directions prédéfinies, pour lesquelles des données associées sont mémorisées dans le dispositif électronique, évite les traitements d’analyse utilisés dans les solutions antérieures.

Ces directions forment toutefois un maillage de l’ensemble des directions possibles et des ondes présentes dans le champ sonore seront donc représentées dans les signaux construits (signaux du second ensemble), quelle que soit leur direction dominante.

Le dispositif électronique mémorise par exemple, pour chaque bande de fréquence temporelle, des données associées à un nombre de directions particulières de l’espace égal au nombre de signaux dans le premier ensemble de signaux, ce qui permet d’obtenir un traitement optimal.

On peut prévoir qu’à l’étape de conversion relative à une bande de fréquence temporelle donnée, les valeurs associées à la bande de fréquence temporelle donnée et déterminées pour les différents signaux du premier ensemble soient converties en une pluralité de valeurs représentatives de sources sonores virtuelles orientées respectivement dans les directions de l’espace associées aux données mémorisées pour la bande de fréquence temporelle donnée. Ainsi, pour chaque bande de fréquence temporelle, les signaux d’entrée sont convertis en une représentation en ondes planes selon les différentes directions associées à la bande de fréquence concernée.

Les directions particulières associées aux données mémorisées pour une bande de fréquence temporelle donnée sont par exemple réparties (éventuellement de manière régulière) parmi l’ensemble des directions de l’espace.

Le nombre de signaux dans le second ensemble est par exemple strictement supérieur au nombre de signaux dans le premier ensemble. La conversion permet dans ce cas une augmentation artificielle de la résolution spatiale de la scène sonore représentée.

On peut prévoir par ailleurs que deux directions associées à deux données mémorisées respectivement pour deux bandes de fréquences adjacentes soient voisines au sein du maillage. Cela évite d’effectuer des traitements très différents pour des bandes de fréquence voisines, ce qui pourrait créer des artefacts indésirables.

L’ensemble desdites directions particulières peut comprendre au moins 50 directions particulières, par exemple entre 50 et 5000 directions particulières.

Les valeurs respectivement associées auxdites bandes de fréquence temporelle peuvent être déterminées par transformation temps-fréquence sur la base des signaux du premier ensemble. Chaque signal du second ensemble peut quant à lui être construit par transformation fréquence-temps sur la base des valeurs associées à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.

Comme décrit dans la suite, pour chaque bande de fréquence temporelle, l’étape de conversion peut être réalisée en pratique par multiplication matricielle d’un vecteur comprenant les valeurs associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux du premier ensemble. La matrice utilisée pour cette multiplication matricielle en ce qui concerne une bande de fréquence temporelle donnée peut comprendre les données mémorisées pour cette bande de fréquence temporelle donnée et associées aux différentes directions particulières attribuées à cette bande de fréquence temporelle donnée.

Par ailleurs, pour chaque bande de fréquence temporelle, l’étape de détermination d’une pluralité de valeurs associées respectivement aux différents signaux du second ensemble peut être réalisée par multiplication matricielle d’un vecteur comprenant ladite au moins une valeur représentative d’une source sonore virtuelle et obtenue à l’étape de conversion pour la bande de fréquence temporelle concernée. On peut ainsi passer d’une représentation en ondes planes (au moyen des valeurs représentatives de sources sonores) à une représentation correspondant aux signaux du second ensemble (signaux de sortie).

Le procédé peut comprendre par ailleurs des étapes préalables de définition d’une pluralité de directions de l’espace par un processus d’optimisation, d’attribution des directions de l’espace de la pluralité auxdites bandes de fréquence temporelle, et de mémorisation, pour chaque bande de fréquence temporelle, de ladite au moins une donnée associée à la direction de l’espace attribuée à la bande de fréquence concernée.

L’invention propose en outre un dispositif électronique de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore dans un espace en un second ensemble de signaux, caractérisé en ce que le dispositif électronique comprend :

- une unité de mémorisation conçue pour mémoriser, pour chaque bande de fréquence temporelle d’une pluralité de bandes de fréquence temporelle du champ sonore, au moins une donnée associée à une direction particulière de l’espace, de sorte que l’ensemble de ces directions particulières de l’espace associées à une donnée pour au moins une bande de fréquence temporelle forme un maillage de l’ensemble des directions de l’espace ;

- un module de transformation conçu pour déterminer, pour chacun des signaux du premier ensemble, des valeurs respectivement associées auxdites bandes de fréquence temporelle ;

- un module de décodage conçu pour convertir, pour chaque bande de fréquence temporelle, les valeurs associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux du premier ensemble, en au moins une valeur représentative d’une source sonore virtuelle orientée dans la direction de l’espace associée à la donnée mémorisée pour la bande de fréquence temporelle concernée ;

- un module d’encodage conçu pour déterminer, pour chaque bande de fréquence temporelle, une pluralité de valeurs associées respectivement aux différents signaux du second ensemble, sur la base de ladite au moins une valeur représentative d’une source sonore virtuelle et obtenue par le module de décodage pour la bande de fréquence temporelle concernée ;

- un module de construction conçu pour construire chaque signal du second ensemble sur la base des valeurs associées à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.

Bien entendu, les différentes caractéristiques, variantes et formes de réalisation de l'invention peuvent être associées les unes avec les autres selon diverses combinaisons dans la mesure où elles ne sont pas incompatibles ou exclusives les unes des autres.

Description détaillée de l'invention

De plus, diverses autres caractéristiques de l'invention ressortent de la description annexée effectuée en référence aux dessins qui illustrent des formes, non limitatives, de réalisation de l'invention et où :

est une représentation fonctionnelle d’un dispositif électronique de conversion conforme à l’invention ;

représente l’ensemble des directions de l’espace pour lesquelles une donnée est mémorisée au sein du dispositif électronique ;

est un logigramme montrant des étapes d’un procédé de conversion conforme à l’invention ;

est un logigramme montrant des étapes d’un procédé de définition et d’attribution de directions particulières de l’espace à différentes bandes de fréquence temporelle ; et

représente schématiquement une application possible de l’invention.

La représente un dispositif électronique 2 de conversion d’un premier ensemble de signaux (ou signaux d’entrée) représentatifs d’un champ sonore dans un espace en un second ensemble de signaux (ou signaux de sortie). L’espace concerné est l’espace de propagation des ondes sonores ; cet espace est ici tridimensionnel. En variante toutefois, cet espace pourrait être bidimensionnel (par exemple dans le cas d’une représentation bidimensionnelle d’un système tridimensionnel).

La représente le dispositif électronique 2 sous forme de blocs fonctionnels (formant chacun un module ou une unité tel(lle) que décrit(e) ci-dessous). En pratique, chacun de ces blocs fonctionnels peut être réalisé par la coopération d’éléments logiciels, tels que des instructions de programme d’ordinateur exécutables par un processeur du dispositif électronique, et d’éléments matériels, par exemple ce même processeur et une mémoire du dispositif électronique 2. Cette mémoire peut d’ailleurs mémoriser les instructions de programme d’ordinateur susmentionnée.

Les signaux d’entrée (ou signaux du premier ensemble) sont par exemple des signaux ambisoniques d’ordre L. Le premier ensemble comprend dans ce cas (L+1)² signaux. On décrit ici à titre illustratif le cas de signaux d’entrée ambisoniques d’ordre 1 (c’est-à-dire L = 1) ; le premier ensemble comprend alors 4 signaux.

On décrit dans la suite le traitement effectué par le dispositif électronique 2 sur un intervalle de temps donné, ce traitement pouvant être répété pour des intervalles de temps ultérieurs. Pour la suite des explications, on noteb _E (t) le vecteur formé des valeurs prises respectivement par les différents signaux du premier ensemble à différents instants t de l’intervalle de temps considéré. (Dans le cas de signaux d’entrée ambisoniques d’ordre L, chaque vecteurb _E (t) est donc de dimension (L+1)², ici de dimension 4.) Le nombre d’instants successifs t auxquels les signauxb _E (t) sont considérés est par exemple compris entre 100 et 1000 pour chaque intervalle de temps. Les valeurs prises par les différents signaux (et ainsi les différents éléments des vecteursb _E (t)) sont par exemple des valeurs complexes ; en variante, ces valeurs pourraient être des valeurs réelles.

On considère par ailleurs dans la suite une pluralité de bandes de fréquence temporelle du champ sonore. (On utilise l’appellation "fréquence temporelle" dans la présente description pour bien préciser qu’il ne s’agit pas de fréquences spatiales, notion également utilisée dans le présent domaine technique.) Dans l’exemple décrit ici, ces bandes de fréquence temporelle sont disjointes deux à deux et couvrent (réunies) le spectre des fréquences audibles. La pluralité de bandes de fréquence temporelle comprend par exemple entre 100 et 1000 bandes de fréquence temporelle, ici 256 bandes de fréquence temporelle. Chaque bande de fréquence temporelle a par exemple une largeur comprise entre 10 Hz et 500 Hz.

Le dispositif électronique 2 comprend une unité de mémorisation 4 conçue pour mémoriser, pour chaque bande de fréquence temporelle de cette pluralité de bandes de fréquence temporelle, au moins une donnée associée à une direction particulière Ω_jde l’espace.

Dans l’exemple décrit ici, l’unité de mémorisation 4 mémorise, pour chaque bande de fréquence temporelle, des données associées à un nombre de directions particulières Ω_jde l’espace égal au nombre de signaux dans le premier ensemble de signaux (signaux d’entrée), soit (L+1)² dans le cas de signaux d’entrée ambisoniques d’ordre L. On note dans la suite Ω₁(f), Ω₂(f), …, Ω_(L+1)²(f) les directions ainsi associées à une bande de fréquence temporelle donnée.

La donnée associée à une direction particulière Ω_jde l’espace peut être une donnée définissant cette direction particulière de l’espace, par exemple au moyen d’un angle d’azimut et/ou d’un angle d’élévation.

La donnée associée à une direction particulière Ω_jde l’espace peut également être une donnée permettant d’effectuer un calcul lié à cette direction particulière Ω_j. Dans l’exemple décrit ici, on associe par exemple à une direction particulière Ω_k(f) plusieurs coefficients D_k,i(f) (formant une ligne d’une matriceD(f)) permettant respectivement d’obtenir la contribution des différents signaux d’entrées à une onde plane dans la direction particulière Ω_k(f), comme expliqué plus loin.

On a représenté sur la l’ensemble des directions particulières Ωj de l’espace associées à une donnée mémorisée dans l’unité de mémorisation 4 dans l’exemple décrit ici.

Chaque direction particulière Ω_jest ici définie par un angle d’azimut θ (en abscisse sur la ) et un angle d’élévation ε (en ordonnée sur la ).

L’ensemble des directions particulières Ω_jde l’espace associées à une donnée mémorisée pour au moins une bande de fréquence temporelle forme un maillage de l’ensemble des directions de l’espace. L’ensemble des directions particulières Ω_jcomprend par exemple plus de 50 directions particulières.

Comme visible sur la , ce maillage n’est pas un maillage régulier dans l’exemple décrit. Il pourrait toutefois en variante s’agir d’un maillage régulier (par exemple avec un pas constant en azimut et un pas constant en élévation).

Selon une possibilité de mise en œuvre, pour toute plage de valeurs d’azimut de largeur 60° et pour toute plage de valeurs d’élévation de largeur 30°, l’ensemble des directions particulières Ω_jcomprend au moins 5 directions particulières Ω_jdéfinies par un azimut θ inclus dans cette plage de valeurs d’azimut et une élévation ε incluse dans cette plage de valeurs d’élévation.

Selon une autre possibilité de mise en œuvre (éventuellement compatible avec la précédente), pour toute plage de valeurs d’élévation de largeur 30° et pour toute direction particulière Ω_jde l’ensemble définie par une élévation ε comprise dans cette plage de valeurs d’élévation et par un azimut θ donné, l’ensemble des directions particulières comprend au moins une autre direction particulière Ω_j _’définie par une élévation ε’ incluse dans cette plage de valeurs d’élévation et par un azimut θ’ qui diffère de moins de 30° de l’azimut θ donné.

Selon une autre possibilité de mise en œuvre (éventuellement compatible avec les précédentes), pour toute plage de valeurs d’azimut de largeur 60° et pour toute direction particulière Ω_jde l’ensemble définie par un azimut θ compris dans cette plage de valeurs d’azimut et par une élévation ε donnée, l’ensemble des directions particulières comprend au moins une autre direction particulière Ω_j _’définie par un azimut θ’ inclus dans cette plage de valeurs d’azimut et par une élévation ε’ qui diffère de moins de 30° de l’élévation ε donnée.

On décrit plus loin en référence à la un procédé de définition et d’attribution de ces directions particulières Ωj de l’espace aux différentes bandes de fréquence temporelle.

Le dispositif électronique 2 comprend un module de réception 6 conçu pour recevoir des données représentatives des signaux d’entrée (signaux du premier ensemble), ici les vecteursb _E (t) respectivement associés aux instants successifs de l’intervalle de temps considéré. Ce module de réception 6 peut être un module de communication apte à recevoir les données représentatives des signaux d’entrée en provenance d’un autre dispositif électronique. En variante, le module de réception 6 peut être un module de lecture des données représentatives des signaux d’entrée dans une mémoire (telle que la mémoire déjà mentionnée du dispositif électronique 2).

Le dispositif électronique 2 comprend un module de configuration 8 conçu pour configurer les autres modules, en fonction notamment des signaux d’entréeb _E (t) (en particulier en fonction du format des signaux d’entréeb _E (t)).

Pour ce faire, le dispositif électronique 2 peut comprendre un module de détection 10 conçu pour analyser les signaux d’entréeb _E (t) et pour communiquer au module de configuration une information I indicative du format des signaux d’entréeb _E (t). Cette information I est par exemple le nombre de signaux composant les signaux d’entréeb _E (t).

En variante, les données représentatives des signaux d’entréeb _E (t) (reçues par le module de réception 6) peuvent comprendre des métadonnées M indicatives du format des signaux d’entréeb _E (t). On peut prévoir dans ce cas que le module de réception 6 transmette ces métadonnées M au module de configuration 8, comme représenté en pointillés sur la .

Le fonctionnement du module de configuration 8 est décrit en détail plus loin en référence à la .

Le dispositif électronique 2 comprend par ailleurs un module de transformation 12 conçu pour déterminer, pour chacun des signaux d’entrées (signaux du premier ensemble), des valeurs respectivement associées aux différentes bandes de fréquence temporelle.

En notant β_i(t) les valeurs prises au cours du temps (sur l’intervalle considéré) par chaque signal d’entrée (de sorte queb _E (t) = [β₁(t), β₂(t), …, β_(L+1)²(t)]^T), le module de transformation 12 détermine ainsi, sur la base des valeurs β_i(t) relatives à un signal d’entrée donné (désigné par l’indice i), des valeurs α_i(f) respectivement associées aux différentes bandes de fréquence et représentatives de ce même signal d’entrée dans le domaine fréquentiel.

Pour un signal donné du premier ensemble, les valeurs α_i(f) respectivement associées aux différentes bandes de fréquence temporelle sont par exemple déterminées par transformation temps-fréquence (telle qu’une transformation de Fourier à court terme) sur la base des valeurs β_i(t) prises au cours du temps (sur l’intervalle de temps considéré) par ce signal du premier ensemble.

Pour chaque bande de fréquence, on note dans la suiteα(f) le vecteur formé des valeurs α_i(f) respectivement associées aux différents signaux d’entrée pour la bande de fréquence concernée :α(f) = [α₁(f), α₂(f), …, α_(L+1)²(f)]^T.

Le dispositif électronique 2 comprend un module de décodage 14 conçu pour convertir, pour chaque bande de fréquence temporelle, les valeurs α₁(f), α₂(f), α_(L+1)²(f) associées à la bande de fréquence temporelle concernée et déterminées respectivement pour les différents signaux du premier ensemble, en des valeurs δ₁(f), δ₂(f), δ_(L+1)²(f) représentatives chacune d’une source sonore virtuelle orientée dans l’une des directions Ω₁(f), Ω₂(f), …, Ω_(L+1)²(f) de l’espace associées aux données mémorisées pour la bande de fréquence temporelle concernée.

On note dans la suiteδ(f) le vecteur formé (pour une bande de fréquence temporelle) par ces valeurs δ₁(f), δ₂(f), δ_(L+1)²(f) représentatives des sources sonores virtuelles orientées dans les directions Ω₁(f), Ω₂(f), …, Ω_(L+1)²(f) de l’espace :

δ(f) = [δ₁(f), δ₂(f), …, δ_(L+1)²(f)]^T.

Le module de décodage 14 effectue par exemple, pour chaque bande de fréquence temporelle, la conversion précitée par multiplication matricielle du vecteurα(f), qui comprend comme déjà indiqué les valeurs α₁(f), α₂(f), α_(L+1)²(f) associées à la bande de fréquence temporelle concernée et déterminées respectivement pour les différents signaux du premier ensemble.

Pour ce faire, le module de décodage 14 utilise par exemple une pluralité de matricesD(f) respectivement associées aux différentes bandes de fréquence temporelle et, pour chaque bande de fréquence temporelle, multiplie le vecteurα(f) susmentionné par la matriceD(f) concernée afin d’obtenir les valeurs δ₁(f), δ₂(f), δ_(L+1)²(f) représentatives respectivement des sources sonores virtuelles orientées dans les directions de l’espace associées à la bande de fréquence temporelle concernée :

δ(f) =D(f)α(f).

Les matricesD(f) sont telles que les valeurs α₁(f), α₂(f), α_(L+1)²(f) d’une part et les valeurs δ₁(f), δ₂(f), …, δ_(L+1)²(f) d’autre part représentent le même champ sonore, mais dans deux représentations différentes, ici une représentation ambisonique pour les valeurs α₁(f), α₂(f), α_(L+1)²(f) et une représentation en ondes planes orientées selon les directions particulières de l’espace associées à la bande de fréquence concernée pour les valeurs δ₁(f), δ₂(f), …, δ_(L+1)²(f). En ce sens, on peut dire dans ce cas que chaque matriceD(f) permet, pour une bande de fréquence temporelle, le passage d’une représentation ambisonique à une représentation en ondes planes.

Chaque matriceD(f) est donc formée d’éléments D_k _, _iqui représentent chacun le coefficient à affecter à une valeur α_i(f) (obtenu pour un signal d’entrée β_i(t)) pour déterminer sa contribution à l’onde plane émise par la source sonore virtuelle orientée selon la direction Ω_k(f). En effet, le produit matriciel ci-dessus signifie que l’on a :

δ_k(f) = Σ_iD_k,i.α_i(f).

Dans l’exemple décrit ici où l’unité de mémorisation 4 mémorise, pour chaque bande de fréquence temporelle, des données associées à un nombre de directions particulières Ω_jde l’espace égal au nombre de signaux dans le premier ensemble de signaux (signaux d’entrée), chaque matriceD(f) est une matrice carrée, de dimension égale au nombre de signaux dans le premier ensemble, ici (L+1)².

Dans le cas où les signaux d’entrées sont ambisoniques, on notea _E (Ω_j) le vecteur dont les coefficients expriment la fonction de transfert entre une onde plane se propageant depuis la direction Ω_jet les différents signaux ambisoniques d’ordre L :

a _E (Ω_j) = [Y₀ ⁰(Ω_j), Y₁ ^-1(Ω_j)…, Y_l ^m(Ω_j), …, Y_L ^L(Ω_j)]^T,

où Y_l ^m(.) est la fonction harmonique sphérique d’ordre l et de degré m.

Pour chaque bande de fréquence temporelle, la matriceD(f) peut alors être dans ce cas définie par :

D(f) = pinv( [a _E (Ω₁(f)),a _E (Ω₂(f)), ...,a _E (Ω_(L+1)²(f))] ),

où pinv(.) représente la pseudo-inverse de Moore-Penrose.

Dans le cas où la matriceD(f) est carrée comme indiqué ci-dessus, on peut donc écrire :

D(f) = [a _E (Ω₁(f)),a _E (Ω₂(f)), ...,a _E (Ω_(L+1)²(f))]^-1.

Comme visible sur la , le module de décodage 14 peut comprendre en pratique une pluralité d’unités de conversion 16 conçues chacune pour effectuer la conversion susmentionnée pour une bande de fréquence temporelle donnée, c’est-à-dire ici pour effectuer la multiplication d’un vecteur α(f) reçu du module de transformation 12 par la matrice D(f) associée à cette bande de fréquence.

Le dispositif électronique 2 comprend un module d’encodage 18 conçu pour déterminer, pour chaque bande de fréquence temporelle, une pluralité de valeurs λ₁(f), λ₂(f), …, λ_N(f) associées respectivement aux différents signaux du second ensemble (signaux de sortie), sur la base des valeurs δ₁(f), δ₂(f), …, δ_(L+1)²(f) représentatives des sources sonores virtuelles et obtenues par la conversion susmentionnée pour la bande de fréquence temporelle concernée.

Comme indiqué ci-dessus, on note N le nombre de signaux du second ensemble.

Par exemple, lorsque les signaux de sortie sont des signaux ambisoniques d’ordre L’, on a : N = (L’+1)².

Dans l’exemple décrit ici, le nombre N de signaux dans le second ensemble est strictement supérieur au nombre de signaux (ici égal à (L+1)²) dans le premier ensemble. C’est notamment le cas lorsque le traitement effectué par le dispositif électronique, décrit ci-dessous en référence à la , vise à augmenter artificiellement la résolution spatiale des scènes sonores (fonctionnalité à laquelle on se réfère parfois par le terme anglais "upscaling").

Par exemple, lorsque les signaux d’entrée et les signaux de sortie sont des signaux ambisoniques, l’ordre L’ des signaux de sortie est strictement supérieur à l’ordre L des signaux d’entrée.

Dans l’exemple décrit ici, le module d’encodage 18 détermine, pour chaque bande de fréquence temporelle, la pluralité de valeurs λ₁(f), λ₂(f), …, λ_N(f) associées respectivement aux différents signaux du second ensemble par multiplication matricielle (au moyen d’une matriceE(f)) du vecteurδ(f) comprenant les valeurs δ₁(f), δ₂(f), …, δ_(L+1)²(f) représentative des sources sonores virtuelles et obtenues à l’étape de conversion pour la bande de fréquence temporelle concernée.

Une telle matriceE(f) a donc ici un nombre de colonnes égal au nombre de signaux dans le premier ensemble (ici (L+1)²) et un nombre de lignes égal au nombre N de signaux dans le second ensemble.

Dans le cas où les signaux de sortie sont des signaux ambisoniques, le module d’encodage 18 utilise, pour chaque bande de fréquence, une matriceE(f) permettant le passage d’une représentation en ondes planes à une représentation ambisonique, ici d’ordre L’ :

E(f) = [a _S (Ω₁(f)),a _S (Ω₂(f)), ...,a _S (Ω_(L+1)²(f))]

aveca _S (Ω_j) = [Y₀ ⁰(Ω_j), Y₁ ^-1(Ω_j)…, Y_l ^m(Ω_j), …, Y_L _’ ^L ^’(Ω_j)]^T,

où comme déjà indiqué Y_l ^m(.) est la fonction harmonique sphérique d’ordre l et de degré m.

En notantλ(f) = [λ₁(f), λ₂(f), …, λ_N(f)]^T, on a ainsi :λ(f) =E(f)δ(f).

Comme visible sur la , le module d’encodage 18 peut comprendre en pratique une pluralité d’unités de traitement 20 conçues chacune pour effectuer la transformation qui vient d’être décrite pour une bande de fréquence temporelle donnée, c’est-à-dire ici pour effectuer la multiplication d’un vecteur δ(f) reçu du module de décodage 14 (précisément ici : reçu d’une unité de conversion 16) par la matrice E(f) associée à cette bande de fréquence.

Le dispositif électronique 2 comprend enfin un module de construction 22 conçu pour construire chaque signal σ_i(t) du second ensemble sur la base des valeurs λ_i(f) associées à ce signal σ_i(t) du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.

Le module de construction 22 construit par exemple chaque signal σ_i(t) du second ensemble par transformation fréquence-temps (telle qu’une transformation de Fourier à court terme inverse) sur la base des valeurs λ_i(f) associées à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.

On obtient ainsi N signaux de sortie (signaux du second ensemble), précisément ici, pour chaque signal de sortie, un ensemble de valeurs σ_i(t) formant ce signal de sortie pour les différents instants t (successifs) de l’intervalle de temps considéré. On peut noter sous forme vectorielle les valeurs des différents signaux de sortie pour chaque instant t :b _S (t) = [σ₁(t), σ₂(t), …, σ_N(t)]^T.

La représente sous forme de logigramme un procédé de conversion conforme à l’invention. Ce procédé est par exemple mis en œuvre par le dispositif électronique de la , comme décrit dans la suite.

Le procédé de la débute par une étape E2 de détermination du format des signaux d’entrée bE(t), reçus ici par le module de réception 6. Cette étape E2 est par exemple mise en œuvre par le module de détection 10. En variante, comme déjà indiqué, cette étape E2 pourrait être mise en œuvre par le module de configuration 8 par lecture de métadonnées M indicatives du format des signaux d’entrée bE(t).

Cette étape E2 permet ici de déterminer le nombre de signaux présents dans le premier ensemble de signaux.

Le procédé de la comprend alors une étape E4 de configuration du module de décodage 14 et/ou du module d’encodage 18 en fonction du format déterminé à l’étape E2. Cette étape de configuration E4 est ici mise en œuvre par le module de configuration 8.

Cette étape E2 peut comprendre en outre la configuration (ici par le module de configuration 8) d’autres éléments du dispositif électronique 2, comme le module de transformation 12 et/ou le module de construction 22. Par exemple, le module de configuration 8 configure le module de transformation 12 et/ou le module de construction 22 en fonction du nombre de bandes de fréquence temporelle à utiliser (ce nombre pouvant être mémorisé dans une mémoire du dispositif électronique 2 et/ou entré par un utilisateur via une interface utilisateur – non représentée – du dispositif électronique 2).

Par exemple, au cours de l’étape de configuration E4, le module de configuration 8 détermine (en fonction du format déterminé à l’étape E2) les matricesD(f) à utiliser, et configure les unités de conversion 16 respectivement au moyen de ces matricesD(f).

Le module de configuration 8 détermine par exemple les matricesD(f) à utiliser en fonction du nombre de signaux présents dans le premier ensemble de signaux.

Selon une première possibilité, en fonction du nombre de signaux dans le premier ensemble de signaux (i.e.du nombre de signaux d’entrée), le module de configuration 8 lit un ensemble de matricesD(f) mémorisé (par exemple dans la mémoire du dispositif électronique 2) en association avec ce nombre de signaux dans le premier ensemble de signaux. En variante, le module de configuration 8 pourrait émettre ce nombre de signaux dans le premier ensemble de signaux à destination d’un serveur distant et recevoir en réponse l’ensemble de matricesD(f) associé.

Selon une autre possibilité (par exemple mise en œuvre la première fois où le nombre de signaux d’entrée déterminé à l’étape E2 est rencontré), le module de configuration 8 effectue un procédé tel que celui décrit ci-dessous à la pour définir une pluralité de directions Ωj de l’espace, attribuer ces directions Ωj de l’espace aux bandes de fréquence temporelle, et construire, pour chaque bande de fréquence temporelle, la matrice D(f) en utilisant les directions Ω1(f), Ω2(f), …, Ω(L+1)²(f) de l’espace attribuées à la bande de fréquence temporelle concernée (la construction de la matrice D(f) en utilisant différentes directions Ω1(f), Ω2(f), …, Ω(L+1)²(f) de l’espace étant déjà présentée plus haut). Les matrices D(f) ainsi construites peuvent être mémorisées (par exemple dans la mémoire du dispositif électronique 2) pour utilisation ultérieure (conformément à la première possibilité indiquée ci-dessus).

De même, au cours de l’étape de configuration E4, le module de configuration 8 peut déterminer les matricesE(f) à utiliser (par exemple en fonction du format des signaux de sortie, ici du nombre de signaux de sortie, qui peut être mémorisé et/ou entré par un utilisateur au moyen de l’interface utilisateur du dispositif électronique 2), et configure les unités de traitement 20 respectivement au moyen de ces matricesE(f).

Le module de configuration 8 détermine par exemple les matricesE(f) à utiliser en fonction du nombre de signaux présents dans le second ensemble de signaux (signaux de sortie).

Selon une première possibilité, en fonction du nombre de signaux dans le second ensemble de signaux (i.e.du nombre de signaux d’entrée), le module de configuration 8 lit un ensemble de matricesE(f) mémorisé (par exemple dans la mémoire du dispositif électronique 2) en association avec ce nombre de signaux dans le second ensemble de signaux. En variante, le module de configuration 8 pourrait émettre ce nombre de signaux dans le second ensemble de signaux à destination d’un serveur distant et recevoir en réponse l’ensemble de matricesE(f) associé.

Selon une autre possibilité (par exemple mise en œuvre la première fois où le nombre de signaux de sortie choisi est rencontré), le module de configuration 8 effectue un procédé tel que celui décrit ci-dessous à la pour définir une pluralité de directions Ωj de l’espace, attribuer ces directions Ωj de l’espace aux bandes de fréquence temporelle, et construire, pour chaque bande de fréquence temporelle, la matrice E(f) en utilisant les directions Ω1(f), Ω2(f), …, Ω(L+1)²(f) de l’espace attribuées à la bande de fréquence temporelle concernée (la construction de la matrice E(f) en utilisant différentes directions Ω1(f), Ω2(f), …, Ω(L+1)²(f) de l’espace étant déjà présentée plus haut). Les matrices E(f) ainsi construites peuvent être mémorisées (par exemple dans la mémoire du dispositif électronique 2) pour utilisation ultérieure (conformément à la première possibilité indiquée ci-dessus).

Le procédé de la prévoit alors, pour chacun des signaux βi(t) du premier ensemble (signaux d’entrée), une étape E6 de détermination de valeurs αi(f) respectivement associées aux différentes bandes de fréquence temporelle. Dans l’exemple décrit, ces différentes valeurs αi(f) respectivement associées aux différentes bandes de fréquence temporelle représente le signal βi(t) concerné dans le domaine fréquentiel.

Cette étape de détermination E6 est ici réalisée par le module de transformation 12.

Comme déjà indiqué, les valeurs α_i(f) respectivement associées auxdites bandes de fréquence temporelle peuvent être déterminées par transformation temps-fréquence sur la base des signaux β_i(t) du premier ensemble.

Le procédé de la comprend ensuite, pour chaque bande de fréquence temporelle, une étape de conversion E8 des valeurs αi(f) associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux β1(t), β2(t), …, β(L+1)²(t) du premier ensemble, en des valeurs δ1(f), δ2(f), δ(L+1)²(f) représentatives de sources sonores virtuelles orientées respectivement dans les différentes directions de l’espace Ω1(f), Ω2(f), …, Ω(L+1)²(f) associées (par exemple attribuées) à la bande de fréquence temporelle concernée.

Cette étape de conversion E8 est ici mise en œuvre par le module de décodage 8, par exemple comme déjà indiqué en effectuant les produits matricielsD(f)α(f) pour obtenir les différents vecteursδ(f) = [δ₁(f), δ₂(f), …, δ_(L+1)²(f)]^T.

Précisément, pour chaque bande de fréquence temporelle, l’une des unités de conversion 16 effectue un produits matricielD(f)α(f) pour obtenir un vecteurδ(f) formées des valeurs δ₁(f), δ₂(f), δ_(L+1)²(f) représentatives de sources sonores virtuelles orientées respectivement dans les différentes directions de l’espace Ω₁(f), Ω₂(f), …, Ω_(L+1)²(f) pour la bande de fréquence temporelle concernée.

Le procédé de la comprend ensuite une étape E10 de détermination, pour chaque bande de fréquence temporelle, sur la base des valeurs δ1(f), δ2(f), δ(L+1)²(f) représentatives des sources sonores virtuelles et obtenues à l’étape de conversion E8 pour la bande de fréquence temporelle concernée, d’une pluralité de valeurs λ1(f), λ2(f), …, λN(f) associées respectivement aux signaux du second ensemble (c’est-à-dire aux N signaux de sortie).

L’étape E10 est ici mise en œuvre par le module d’encodage 18, par exemple comme déjà indiqué en effectuant les produits matricielsE(f)δ(f) pour obtenir les différents vecteursλ(f) = [λ₁(f), λ₂(f), …, λ_N(f)]^T.

Précisément, pour chaque bande de fréquence temporelle, l’une des unités de traitement 20 effectue un produits matricielE(f)δ(f) pour obtenir un vecteurλ(f) formé de valeurs λ₁(f), λ₂(f), …, λ_N(f) respectivement associées aux signaux σ₁(t), σ₂(t), …, σ_N(t) du second ensemble.

Dans l’exemple décrit ici, les différentes valeurs λ_i(f) obtenues pour les différentes bandes de fréquence temporelle et associées à un même signal σ_i(t) du second ensemble forment une représentation de ce signal σ_i(t) du second ensemble dans le domaine fréquentiel.

Le procédé de la comprend alors une étape E12 de construction de chaque signal σi(t) du second ensemble sur la base des valeurs λi(f) associées à ce signal σi(t) du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.

L’étape E12 est ici mise en œuvre par le module de construction 22.

Comme déjà indiqué, chaque signal σ_i(t) du second ensemble peut être construit par transformation fréquence-temps sur la base des valeurs λ_i(f) associées à ce signal σ_i(t) du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.

La présente un procédé de définition et d’attribution des directions particulières Ωj de l’espace à différentes bandes de fréquence temporelle.

Ce procédé débute par une étape E20 de définition d’une pluralité de directions de l’espace par un processus d’optimisation, ici un processus d’optimisation dit "problème de Thomson".

La pluralité des directions de l’espace ainsi obtenue forme un maillage de l’ensemble des directions de l’espace, comme déjà indiqué.

On décrit ce processus d’optimisation dans le cas de signaux d’entrée ambisoniques d’ordre 1 : on utilise dans ce cas comme déjà indiqué 4 directions particulières Ω_jpour chaque bande de fréquence temporelle.

Si on note F le nombre de bandes de fréquence temporelle utilisé (comme déjà indiqué, F est par exemple compris entre 100 et 1000, ici F = 256), on prévoit ici F groupes de 4 directions particulières Ω_j(le nombre de directions particulières par groupe étant égal au nombre de signaux d’entrée, ici 4 signaux d’entrée pour des signaux ambisonique d’ordre L=1 comme déjà indiqué).

Dans chaque groupe, les directions particulières sont réparties dans l’espace et forment donc dans l’exemple décrit ici un tétraèdre (par exemple un tétraèdre régulier).

On peut définir des rotations qui permettent chacune de passer d’un tétraèdre défini pour un groupe de directions particulières à un autre tétraèdre, défini pour un autre groupe de directions particulières.

On modélise chacune des 4F directions particulières Ω_jcomme une particule chargée localisée à la surface d’une sphère, et se déplaçant de façon solidaire aux autres directions appartenant au même groupe, c’est-à-dire au même tétraèdre. Deux particules chargées exercent l’une sur l’autre une force de répulsion semblable à l’interaction électrostatique.

On définit alors une fonction coût correspondant à l’énergie potentielle totale du système ainsi modélisé.

Par itérations successives, on modifie les rotations susmentionnées de manière à atteindre un minimum d’énergie potentielle (problème de Thomson). Puisque l’énergie potentielle est d’autant plus grande que les particules sont proches les unes des autres, cette optimisation conduit à une distribution optimale des directions sur la sphère.

On dispose ainsi de F tétraèdres disposés de manière à fournir un échantillonnage régulier (et donc un maillage) de l’ensemble des directions possibles de l’espace.

Le procédé de la comprend alors une étape E22 d’attribution des directions particulières de l’espace obtenues à l’étape E20 aux F bandes de fréquence temporelle.

Pour ce faire, on peut attribuer aléatoirement un quelconque des tétraèdres (c’est-à-dire un des groupes de directions particulières) à la première bande de fréquence temporelle (les bandes de fréquence temporelle étant par exemple ordonnées par fréquence centrale croissante).

Le tétraèdre attribué à la seconde bande de fréquence temporelle est celui qui correspond à la plus petite rotation par rapport au tétraèdre attribué à la première bande de fréquence temporelle. Les autres tétraèdres sont ainsi attribués successivement aux différentes bandes de fréquence temporelle de façon à ce que la distance angulaire entre deux groupes de directions successifs soit aussi petite que possible.

Deux directions particulières attribuées à deux bandes de fréquences adjacentes sont ainsi voisines au sein du maillage, ce qui permet d’éviter des sauts dans les traitements effectués pour deux bandes de fréquence voisines.

Un groupe de directions particulières Ω1(f), Ω2(f), …, Ω(L+1)²(f) (correspondant à un tétraèdre particulier dans l’exemple décrit ici) étant attribué à chaque bande de fréquence temporelle, le procédé de la comprend une étape E24 de construction et de mémorisation, pour chaque bande de fréquence temporelle, de données associées aux directions particulières Ω1(f), Ω2(f), …, Ω(L+1)²(f) de l’espace attribuées à la bande de fréquence concernée.

Dans l’exemple décrit ici, pour chaque bande de fréquence temporelle, l’étape E24 comprend la construction et la mémorisation de la matriceD(f) et/ou de la matriceE(f) comme indiqué plus haut, sur la base des directions particulières Ω₁(f), Ω₂(f), …, Ω_(L+1)²(f) attribuées à la bande de fréquence concernée.

L’invention qui vient d’être décrite peut être appliquée dans différentes situations où l’on souhaite convertir un premier ensemble de signaux ayant un premier format en un second ensemble de signaux ayant un second format.

Par exemple, lorsque l’on souhaite reproduire des signaux ambisoniques d’ordre L relativement faible (par exemple d’ordre L=1) au moyen d’un nombre important de haut-parleurs (par exemple au moyen de 10 haut-parleurs ou plus), il est souhaitable de convertir les signaux ambisoniques d’ordre L en signaux ambisoniques d’ordre L’ strictement supérieur à L et de reproduire sur les haut-parleurs les signaux convertis afin d’éviter la production d’artefacts désagréables à l’oreille.

Selon un autre exemple représenté schématiquement sur la , on souhaite parfois combiner des signaux ambisoniques bE(t) d’ordre L et des signaux ambisoniques b’(t) d’ordre L’ strictement supérieur à L. Ceci est notamment intéressant lorsque les signaux ambisoniques b’(t) représentent (de manière détaillée) un son en propagation directe entre une source sonore et l’utilisateur, tandis que les signaux ambisoniques bE(t) représentent des sons arrivant à l’utilisateur après réflexion et/ou réverbération. L’utilisation de signaux ambisoniques bE(t) d’ordre faible permet un allégement des traitements effectués sur ces signaux (par exemple pour produire ces signaux).

En vue par exemple de la reproduction des sons ainsi représentés, on peut dans ce cas convertir les signaux ambisoniques bE(t) d’ordre L en signaux ambisoniques bS(t) d’ordre L’ grâce au dispositif électronique 2 et/ou au procédé de la , puis combiner les signaux ambisoniques bS(t) et les signaux ambisoniques b’(t) au moyen d’un dispositif de mixage 5 (ces deux signaux ambisoniques étant de même ordre L’) afin d’obtenir un signal combiné b’’(t) (également ambisonique d’ordre L’).

Par ailleurs, bien que les exemples présentés ci-dessus utilisent des signaux d’entrée et des signaux de sortie ambisoniques, il est possible en variante d’utiliser des signaux d’entrée ou des signaux de sortie d’un autre type, par exemple des signaux multicanaux.

On considère dans ce cas les différents signaux, correspondant chacun à une position de haut-parleur donnée, comme un format orienté-scène dans lequel la base de fonctions de l’espace utilisée est constituée de fonctions dites de « panning ». Une fonction de panning exprime les gains appliqués aux différents haut-parleurs pour donner l’impression à un auditeur qu’une source sonore se trouve une direction donnée. La méthode VBAP (pour "Vector Base Amplitude Panning"), par exemple, permet de calculer des fonctions de panning pour un ensemble de haut-parleurs donné. On pourra par exemple se référer à ce sujet à l’article "Virtual Sound Source Positioning Using Vector Base Amplitude Panning", de V. Pulkki,inJournal of the Audio Engineering Society, 45(6), pp. 456-466, juin 1997.

Les matricesD(f) etE(f) mentionnées plus haut peuvent dans ce cas être construites en concaténant les vecteurs constitués des gains de panning pour les différentes directions Ω_jd’ondes planes.

Claims

Procédé de conversion d’un premier ensemble de signaux (b _E (t)) représentatifs d’un champ sonore dans un espace en un second ensemble de signaux (b _S (t)) au moyen d’un dispositif électronique (2),
caractérisé en ce que le dispositif électronique (2) mémorise, pour chaque bande de fréquence temporelle d’une pluralité de bandes de fréquence temporelle du champ sonore, au moins une donnée associée à une direction particulière (Ω_j) de l’espace, l’ensemble de ces directions particulières (Ω_j) de l’espace associées à une donnée pour au moins une bande de fréquence temporelle formant un maillage de l’ensemble des directions de l’espace, et en ce que le procédé comprend les étapes suivantes :
- pour chacun des signaux (b _E (t)) du premier ensemble, détermination (E6) de valeurs (α(f)) respectivement associées auxdites bandes de fréquence temporelle ;
- pour chaque bande de fréquence temporelle, conversion (E8) des valeurs (α(f)) associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux du premier ensemble, en au moins une valeur représentative d’une source sonore virtuelle orientée dans la direction (Ω_j) de l’espace associée à la donnée mémorisée pour la bande de fréquence temporelle concernée ;
- pour chaque bande de fréquence temporelle, détermination (E10), sur la base de ladite au moins une valeur représentative d’une source sonore virtuelle et obtenue à l’étape de conversion (E8) pour la bande de fréquence temporelle concernée, d’une pluralité de valeurs (λ(f)) associées respectivement aux différents signaux (b _S (t)) du second ensemble ;
- construction de chaque signal (b _S (t)) du second ensemble sur la base des valeurs associées (λ(f)) à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.
Procédé de conversion selon la revendication 1, dans lequel le dispositif électronique mémorise, pour chaque bande de fréquence temporelle, des données associées à un nombre de directions particulières de l’espace égal au nombre de signaux (b _E (t)) dans le premier ensemble de signaux.
Procédé selon la revendication 2, dans lequel, à l’étape de conversion (E8) relative à une bande de fréquence temporelle donnée, les valeurs (α(f)) associées à la bande de fréquence temporelle donnée et déterminées pour les différents signaux du premier ensemble sont converties en une pluralité de valeurs (δ(f)) représentatives de sources sonores virtuelles orientées respectivement dans les directions (Ω_j) de l’espace associées aux données mémorisées pour la bande de fréquence temporelle donnée.
Procédé selon la revendication 2 ou 3, dans lequel les directions particulières associées aux données mémorisées pour une bande de fréquence temporelle donnée sont réparties parmi l’ensemble des directions de l’espace.
Procédé selon l’une des revendications 1 à 4, dans lequel le nombre de signaux dans le second ensemble est strictement supérieur au nombre de signaux dans le premier ensemble.
Procédé selon l’une des revendications 1 à 5, dans lequel deux directions associées à deux données mémorisées respectivement pour deux bandes de fréquences adjacentes sont voisines au sein du maillage.
Procédé selon l’une des revendications 1 à 6, dans lequel l’ensemble desdites directions particulières comprend au moins 50 directions particulières.
Procédé selon l’une des revendications 1 à 7, dans lequel les valeurs (α(f)) respectivement associées auxdites bandes de fréquence temporelle sont déterminées par transformation temps-fréquence sur la base des signaux (b _E (t)) du premier ensemble.
Procédé selon l’une des revendications 1 à 8, dans lequel chaque signal (b _S (t)) du second ensemble est construit par transformation fréquence-temps sur la base des valeurs (λ(f)) associées à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.
Procédé selon l’une des revendications 1 à 9, dans lequel, pour chaque bande de fréquence temporelle, l’étape de conversion (E8) est réalisée par multiplication matricielle d’un vecteur (α(f)) comprenant les valeurs associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux (b _E (t)) du premier ensemble.
Procédé selon l’une des revendications 1 à 10, dans lequel, pour chaque bande de fréquence temporelle, l’étape de détermination (E10) d’une pluralité de valeurs (λ(f)) associées respectivement aux différents signaux (b _S (t)) du second ensemble est réalisée par multiplication matricielle d’un vecteur (δ(f)) comprenant ladite au moins une valeur représentative d’une source sonore virtuelle et obtenue à l’étape de conversion (E8) pour la bande de fréquence temporelle concernée.
Procédé selon l’une des revendications 1 à 11, comprenant des étapes préalables de définition (E20) d’une pluralité de directions de l’espace par un processus d’optimisation, d’attribution (E22) des directions de l’espace de la pluralité auxdites bandes de fréquence temporelle, et de mémorisation (E24), pour chaque bande de fréquence temporelle, de ladite au moins une donnée associée à la direction de l’espace attribuée à la bande de fréquence concernée.
Dispositif électronique (2) de conversion d’un premier ensemble de signaux (b _E (t)) représentatifs d’un champ sonore dans un espace en un second ensemble de signaux (b _S (t)),
caractérisé en ce que le dispositif électronique comprend :
- une unité de mémorisation (4) conçue pour mémoriser, pour chaque bande de fréquence temporelle d’une pluralité de bandes de fréquence temporelle du champ sonore, au moins une donnée associée à une direction particulière (Ω_j) de l’espace, de sorte que l’ensemble de ces directions particulières (Ω_j) de l’espace associées à une donnée pour au moins une bande de fréquence temporelle forme un maillage de l’ensemble des directions de l’espace ;
- un module de transformation (12) conçu pour déterminer, pour chacun des signaux (b _E (t)) du premier ensemble, des valeurs (α(f)) respectivement associées auxdites bandes de fréquence temporelle ;
- un module de décodage (14) conçu pour convertir, pour chaque bande de fréquence temporelle, les valeurs (α(f)) associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux (b _E (t)) du premier ensemble, en au moins une valeur représentative d’une source sonore virtuelle orientée dans la direction de l’espace associée à la donnée mémorisée pour la bande de fréquence temporelle concernée ;
- un module d’encodage (18) conçu pour déterminer, pour chaque bande de fréquence temporelle, une pluralité de valeurs (λ(f)) associées respectivement aux différents signaux (b _S (t)) du second ensemble, sur la base de ladite au moins une valeur représentative d’une source sonore virtuelle et obtenue par le module de décodage pour la bande de fréquence temporelle concernée ;
- un module de construction (20) conçu pour construire chaque signal (b _S (t)) du second ensemble sur la base des valeurs associées (λ(f)) à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.