FR3112016A1 - Procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux et dispositif électronique associé - Google Patents

Procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux et dispositif électronique associé Download PDF

Info

Publication number
FR3112016A1
FR3112016A1 FR2006878A FR2006878A FR3112016A1 FR 3112016 A1 FR3112016 A1 FR 3112016A1 FR 2006878 A FR2006878 A FR 2006878A FR 2006878 A FR2006878 A FR 2006878A FR 3112016 A1 FR3112016 A1 FR 3112016A1
Authority
FR
France
Prior art keywords
signals
frequency band
values
temporal frequency
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR2006878A
Other languages
English (en)
Other versions
FR3112016B1 (fr
Inventor
Nicolas Epain
François SALMON
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fondation B Com
Original Assignee
Fondation B Com
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fondation B Com filed Critical Fondation B Com
Priority to FR2006878A priority Critical patent/FR3112016B1/fr
Priority to EP21181285.4A priority patent/EP3934282A1/fr
Priority to US17/362,704 priority patent/US20210407524A1/en
Publication of FR3112016A1 publication Critical patent/FR3112016A1/fr
Application granted granted Critical
Publication of FR3112016B1 publication Critical patent/FR3112016B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)

Abstract

Un procédé de conversion comprend les étapes suivantes : - pour chacun des signaux (b E(t)) d’un premier ensemble, détermination de valeurs (α(f)) respectivement associées à des bandes de fréquence; - pour chaque bande de fréquence, conversion des valeurs (α(f)) associées à la bande de fréquence concernée, en au moins une valeur représentative d’une source sonore virtuelle orientée dans la direction de l’espace associée à une donnée mémorisée pour la bande de fréquence concernée ; - pour chaque bande de fréquence, détermination, sur la base d’une valeur représentative précitée, d’une pluralité de valeurs (λ(f)) associées respectivement aux différents signaux (b S(t)) du second ensemble ; - construction de chaque signal (b S(t)) d’un second ensemble sur la base des valeurs associées (λ(f)) à ce signal du second ensemble. Figure pour l’abrégé : figure 1

Description

Procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux et dispositif électronique associé
Domaine technique de l'invention
La présente invention concerne le domaine technique du traitement des signaux représentatifs d’un champ sonore.
Elle concerne notamment un procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux et un dispositif électronique associé.
Etat de la technique
Il a déjà été proposé de convertir un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux, par exemple pour permettre la restitution du champ sonore en appliquant les signaux du second ensemble à un système de reproduction (casque audio ou haut-parleurs).
Les signaux du premier ensemble ont parfois dans cette situation un format qui n’est pas directement utilisable par le système de reproduction. Il s’agit typiquement d’un format orienté-scène, tel qu’un format HOA (pour "High- Order Ambisonic s").
Une solution de ce type est proposée dans l’article "COMPASS : Coding and Multidirectional Parametrization of Ambisonic Sound Scenes”, de A. Politis, S. Tervo et V. PulkkiinProceedings of the 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), avril 2018.
Comme d’autres solutions d’ailleurs mentionnées dans cet article, cette solution repose sur l’estimation d’au moins une direction dominante par bande de fréquence au moyen d’une analyse des signaux du premier ensemble.
Cette analyse a toutefois un coût calculatoire important et nécessite donc un temps de traitement non négligeable.
Présentation de l'invention
Dans ce contexte, la présente invention propose un procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore dans un espace en un second ensemble de signaux au moyen d’un dispositif électronique, caractérisé en ce que le dispositif électronique mémorise, pour chaque bande de fréquence temporelle d’une pluralité de bandes de fréquence temporelle du champ sonore, au moins une donnée associée à une direction particulière de l’espace, l’ensemble de ces directions particulières de l’espace associées à une donnée pour au moins une bande de fréquence temporelle formant un maillage de l’ensemble des directions de l’espace, et en ce que le procédé comprend les étapes suivantes :
- pour chacun des signaux du premier ensemble, détermination de valeurs respectivement associées auxdites bandes de fréquence temporelle ;
- pour chaque bande de fréquence temporelle, conversion des valeurs associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux du premier ensemble, en au moins une valeur représentative d’une source sonore virtuelle orientée dans la direction de l’espace associée à la donnée mémorisée pour la bande de fréquence temporelle concernée ;
- pour chaque bande de fréquence temporelle, détermination, sur la base de ladite au moins une valeur représentative d’une source sonore virtuelle et obtenue à l’étape de conversion pour la bande de fréquence temporelle concernée, d’une pluralité de valeurs associées respectivement aux différents signaux du second ensemble ;
- construction de chaque signal du second ensemble sur la base des valeurs associées à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.
L’utilisation de directions prédéfinies, pour lesquelles des données associées sont mémorisées dans le dispositif électronique, évite les traitements d’analyse utilisés dans les solutions antérieures.
Ces directions forment toutefois un maillage de l’ensemble des directions possibles et des ondes présentes dans le champ sonore seront donc représentées dans les signaux construits (signaux du second ensemble), quelle que soit leur direction dominante.
Le dispositif électronique mémorise par exemple, pour chaque bande de fréquence temporelle, des données associées à un nombre de directions particulières de l’espace égal au nombre de signaux dans le premier ensemble de signaux, ce qui permet d’obtenir un traitement optimal.
On peut prévoir qu’à l’étape de conversion relative à une bande de fréquence temporelle donnée, les valeurs associées à la bande de fréquence temporelle donnée et déterminées pour les différents signaux du premier ensemble soient converties en une pluralité de valeurs représentatives de sources sonores virtuelles orientées respectivement dans les directions de l’espace associées aux données mémorisées pour la bande de fréquence temporelle donnée. Ainsi, pour chaque bande de fréquence temporelle, les signaux d’entrée sont convertis en une représentation en ondes planes selon les différentes directions associées à la bande de fréquence concernée.
Les directions particulières associées aux données mémorisées pour une bande de fréquence temporelle donnée sont par exemple réparties (éventuellement de manière régulière) parmi l’ensemble des directions de l’espace.
Le nombre de signaux dans le second ensemble est par exemple strictement supérieur au nombre de signaux dans le premier ensemble. La conversion permet dans ce cas une augmentation artificielle de la résolution spatiale de la scène sonore représentée.
On peut prévoir par ailleurs que deux directions associées à deux données mémorisées respectivement pour deux bandes de fréquences adjacentes soient voisines au sein du maillage. Cela évite d’effectuer des traitements très différents pour des bandes de fréquence voisines, ce qui pourrait créer des artefacts indésirables.
L’ensemble desdites directions particulières peut comprendre au moins 50 directions particulières, par exemple entre 50 et 5000 directions particulières.
Les valeurs respectivement associées auxdites bandes de fréquence temporelle peuvent être déterminées par transformation temps-fréquence sur la base des signaux du premier ensemble. Chaque signal du second ensemble peut quant à lui être construit par transformation fréquence-temps sur la base des valeurs associées à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.
Comme décrit dans la suite, pour chaque bande de fréquence temporelle, l’étape de conversion peut être réalisée en pratique par multiplication matricielle d’un vecteur comprenant les valeurs associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux du premier ensemble. La matrice utilisée pour cette multiplication matricielle en ce qui concerne une bande de fréquence temporelle donnée peut comprendre les données mémorisées pour cette bande de fréquence temporelle donnée et associées aux différentes directions particulières attribuées à cette bande de fréquence temporelle donnée.
Par ailleurs, pour chaque bande de fréquence temporelle, l’étape de détermination d’une pluralité de valeurs associées respectivement aux différents signaux du second ensemble peut être réalisée par multiplication matricielle d’un vecteur comprenant ladite au moins une valeur représentative d’une source sonore virtuelle et obtenue à l’étape de conversion pour la bande de fréquence temporelle concernée. On peut ainsi passer d’une représentation en ondes planes (au moyen des valeurs représentatives de sources sonores) à une représentation correspondant aux signaux du second ensemble (signaux de sortie).
Le procédé peut comprendre par ailleurs des étapes préalables de définition d’une pluralité de directions de l’espace par un processus d’optimisation, d’attribution des directions de l’espace de la pluralité auxdites bandes de fréquence temporelle, et de mémorisation, pour chaque bande de fréquence temporelle, de ladite au moins une donnée associée à la direction de l’espace attribuée à la bande de fréquence concernée.
L’invention propose en outre un dispositif électronique de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore dans un espace en un second ensemble de signaux, caractérisé en ce que le dispositif électronique comprend :
- une unité de mémorisation conçue pour mémoriser, pour chaque bande de fréquence temporelle d’une pluralité de bandes de fréquence temporelle du champ sonore, au moins une donnée associée à une direction particulière de l’espace, de sorte que l’ensemble de ces directions particulières de l’espace associées à une donnée pour au moins une bande de fréquence temporelle forme un maillage de l’ensemble des directions de l’espace ;
- un module de transformation conçu pour déterminer, pour chacun des signaux du premier ensemble, des valeurs respectivement associées auxdites bandes de fréquence temporelle ;
- un module de décodage conçu pour convertir, pour chaque bande de fréquence temporelle, les valeurs associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux du premier ensemble, en au moins une valeur représentative d’une source sonore virtuelle orientée dans la direction de l’espace associée à la donnée mémorisée pour la bande de fréquence temporelle concernée ;
- un module d’encodage conçu pour déterminer, pour chaque bande de fréquence temporelle, une pluralité de valeurs associées respectivement aux différents signaux du second ensemble, sur la base de ladite au moins une valeur représentative d’une source sonore virtuelle et obtenue par le module de décodage pour la bande de fréquence temporelle concernée ;
- un module de construction conçu pour construire chaque signal du second ensemble sur la base des valeurs associées à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.
Bien entendu, les différentes caractéristiques, variantes et formes de réalisation de l'invention peuvent être associées les unes avec les autres selon diverses combinaisons dans la mesure où elles ne sont pas incompatibles ou exclusives les unes des autres.
Description détaillée de l'invention
De plus, diverses autres caractéristiques de l'invention ressortent de la description annexée effectuée en référence aux dessins qui illustrent des formes, non limitatives, de réalisation de l'invention et où :
est une représentation fonctionnelle d’un dispositif électronique de conversion conforme à l’invention ;
représente l’ensemble des directions de l’espace pour lesquelles une donnée est mémorisée au sein du dispositif électronique ;
est un logigramme montrant des étapes d’un procédé de conversion conforme à l’invention ;
est un logigramme montrant des étapes d’un procédé de définition et d’attribution de directions particulières de l’espace à différentes bandes de fréquence temporelle ; et
représente schématiquement une application possible de l’invention.
La représente un dispositif électronique 2 de conversion d’un premier ensemble de signaux (ou signaux d’entrée) représentatifs d’un champ sonore dans un espace en un second ensemble de signaux (ou signaux de sortie). L’espace concerné est l’espace de propagation des ondes sonores ; cet espace est ici tridimensionnel. En variante toutefois, cet espace pourrait être bidimensionnel (par exemple dans le cas d’une représentation bidimensionnelle d’un système tridimensionnel).
La représente le dispositif électronique 2 sous forme de blocs fonctionnels (formant chacun un module ou une unité tel(lle) que décrit(e) ci-dessous). En pratique, chacun de ces blocs fonctionnels peut être réalisé par la coopération d’éléments logiciels, tels que des instructions de programme d’ordinateur exécutables par un processeur du dispositif électronique, et d’éléments matériels, par exemple ce même processeur et une mémoire du dispositif électronique 2. Cette mémoire peut d’ailleurs mémoriser les instructions de programme d’ordinateur susmentionnée.
Les signaux d’entrée (ou signaux du premier ensemble) sont par exemple des signaux ambisoniques d’ordre L. Le premier ensemble comprend dans ce cas (L+1)² signaux. On décrit ici à titre illustratif le cas de signaux d’entrée ambisoniques d’ordre 1 (c’est-à-dire L = 1) ; le premier ensemble comprend alors 4 signaux.
On décrit dans la suite le traitement effectué par le dispositif électronique 2 sur un intervalle de temps donné, ce traitement pouvant être répété pour des intervalles de temps ultérieurs. Pour la suite des explications, on noteb E (t) le vecteur formé des valeurs prises respectivement par les différents signaux du premier ensemble à différents instants t de l’intervalle de temps considéré. (Dans le cas de signaux d’entrée ambisoniques d’ordre L, chaque vecteurb E (t) est donc de dimension (L+1)², ici de dimension 4.) Le nombre d’instants successifs t auxquels les signauxb E (t) sont considérés est par exemple compris entre 100 et 1000 pour chaque intervalle de temps. Les valeurs prises par les différents signaux (et ainsi les différents éléments des vecteursb E (t)) sont par exemple des valeurs complexes ; en variante, ces valeurs pourraient être des valeurs réelles.
On considère par ailleurs dans la suite une pluralité de bandes de fréquence temporelle du champ sonore. (On utilise l’appellation "fréquence temporelle" dans la présente description pour bien préciser qu’il ne s’agit pas de fréquences spatiales, notion également utilisée dans le présent domaine technique.) Dans l’exemple décrit ici, ces bandes de fréquence temporelle sont disjointes deux à deux et couvrent (réunies) le spectre des fréquences audibles. La pluralité de bandes de fréquence temporelle comprend par exemple entre 100 et 1000 bandes de fréquence temporelle, ici 256 bandes de fréquence temporelle. Chaque bande de fréquence temporelle a par exemple une largeur comprise entre 10 Hz et 500 Hz.
Le dispositif électronique 2 comprend une unité de mémorisation 4 conçue pour mémoriser, pour chaque bande de fréquence temporelle de cette pluralité de bandes de fréquence temporelle, au moins une donnée associée à une direction particulière Ωjde l’espace.
Dans l’exemple décrit ici, l’unité de mémorisation 4 mémorise, pour chaque bande de fréquence temporelle, des données associées à un nombre de directions particulières Ωjde l’espace égal au nombre de signaux dans le premier ensemble de signaux (signaux d’entrée), soit (L+1)² dans le cas de signaux d’entrée ambisoniques d’ordre L. On note dans la suite Ω1(f), Ω2(f), …, Ω(L+1)²(f) les directions ainsi associées à une bande de fréquence temporelle donnée.
La donnée associée à une direction particulière Ωjde l’espace peut être une donnée définissant cette direction particulière de l’espace, par exemple au moyen d’un angle d’azimut et/ou d’un angle d’élévation.
La donnée associée à une direction particulière Ωjde l’espace peut également être une donnée permettant d’effectuer un calcul lié à cette direction particulière Ωj. Dans l’exemple décrit ici, on associe par exemple à une direction particulière Ωk(f) plusieurs coefficients Dk,i(f) (formant une ligne d’une matriceD(f)) permettant respectivement d’obtenir la contribution des différents signaux d’entrées à une onde plane dans la direction particulière Ωk(f), comme expliqué plus loin.
On a représenté sur la l’ensemble des directions particulières Ωj de l’espace associées à une donnée mémorisée dans l’unité de mémorisation 4 dans l’exemple décrit ici.
Chaque direction particulière Ωjest ici définie par un angle d’azimut θ (en abscisse sur la ) et un angle d’élévation ε (en ordonnée sur la ).
L’ensemble des directions particulières Ωjde l’espace associées à une donnée mémorisée pour au moins une bande de fréquence temporelle forme un maillage de l’ensemble des directions de l’espace. L’ensemble des directions particulières Ωjcomprend par exemple plus de 50 directions particulières.
Comme visible sur la , ce maillage n’est pas un maillage régulier dans l’exemple décrit. Il pourrait toutefois en variante s’agir d’un maillage régulier (par exemple avec un pas constant en azimut et un pas constant en élévation).
Selon une possibilité de mise en œuvre, pour toute plage de valeurs d’azimut de largeur 60° et pour toute plage de valeurs d’élévation de largeur 30°, l’ensemble des directions particulières Ωjcomprend au moins 5 directions particulières Ωjdéfinies par un azimut θ inclus dans cette plage de valeurs d’azimut et une élévation ε incluse dans cette plage de valeurs d’élévation.
Selon une autre possibilité de mise en œuvre (éventuellement compatible avec la précédente), pour toute plage de valeurs d’élévation de largeur 30° et pour toute direction particulière Ωjde l’ensemble définie par une élévation ε comprise dans cette plage de valeurs d’élévation et par un azimut θ donné, l’ensemble des directions particulières comprend au moins une autre direction particulière Ωj définie par une élévation ε’ incluse dans cette plage de valeurs d’élévation et par un azimut θ’ qui diffère de moins de 30° de l’azimut θ donné.
Selon une autre possibilité de mise en œuvre (éventuellement compatible avec les précédentes), pour toute plage de valeurs d’azimut de largeur 60° et pour toute direction particulière Ωjde l’ensemble définie par un azimut θ compris dans cette plage de valeurs d’azimut et par une élévation ε donnée, l’ensemble des directions particulières comprend au moins une autre direction particulière Ωj définie par un azimut θ’ inclus dans cette plage de valeurs d’azimut et par une élévation ε’ qui diffère de moins de 30° de l’élévation ε donnée.
On décrit plus loin en référence à la un procédé de définition et d’attribution de ces directions particulières Ωj de l’espace aux différentes bandes de fréquence temporelle.
Le dispositif électronique 2 comprend un module de réception 6 conçu pour recevoir des données représentatives des signaux d’entrée (signaux du premier ensemble), ici les vecteursb E (t) respectivement associés aux instants successifs de l’intervalle de temps considéré. Ce module de réception 6 peut être un module de communication apte à recevoir les données représentatives des signaux d’entrée en provenance d’un autre dispositif électronique. En variante, le module de réception 6 peut être un module de lecture des données représentatives des signaux d’entrée dans une mémoire (telle que la mémoire déjà mentionnée du dispositif électronique 2).
Le dispositif électronique 2 comprend un module de configuration 8 conçu pour configurer les autres modules, en fonction notamment des signaux d’entréeb E (t) (en particulier en fonction du format des signaux d’entréeb E (t)).
Pour ce faire, le dispositif électronique 2 peut comprendre un module de détection 10 conçu pour analyser les signaux d’entréeb E (t) et pour communiquer au module de configuration une information I indicative du format des signaux d’entréeb E (t). Cette information I est par exemple le nombre de signaux composant les signaux d’entréeb E (t).
En variante, les données représentatives des signaux d’entréeb E (t) (reçues par le module de réception 6) peuvent comprendre des métadonnées M indicatives du format des signaux d’entréeb E (t). On peut prévoir dans ce cas que le module de réception 6 transmette ces métadonnées M au module de configuration 8, comme représenté en pointillés sur la .
Le fonctionnement du module de configuration 8 est décrit en détail plus loin en référence à la .
Le dispositif électronique 2 comprend par ailleurs un module de transformation 12 conçu pour déterminer, pour chacun des signaux d’entrées (signaux du premier ensemble), des valeurs respectivement associées aux différentes bandes de fréquence temporelle.
En notant βi(t) les valeurs prises au cours du temps (sur l’intervalle considéré) par chaque signal d’entrée (de sorte queb E (t) = [β1(t), β2(t), …, β(L+1)²(t)]T), le module de transformation 12 détermine ainsi, sur la base des valeurs βi(t) relatives à un signal d’entrée donné (désigné par l’indice i), des valeurs αi(f) respectivement associées aux différentes bandes de fréquence et représentatives de ce même signal d’entrée dans le domaine fréquentiel.
Pour un signal donné du premier ensemble, les valeurs αi(f) respectivement associées aux différentes bandes de fréquence temporelle sont par exemple déterminées par transformation temps-fréquence (telle qu’une transformation de Fourier à court terme) sur la base des valeurs βi(t) prises au cours du temps (sur l’intervalle de temps considéré) par ce signal du premier ensemble.
Pour chaque bande de fréquence, on note dans la suiteα(f) le vecteur formé des valeurs αi(f) respectivement associées aux différents signaux d’entrée pour la bande de fréquence concernée :α(f) = [α1(f), α2(f), …, α(L+1)²(f)]T.
Le dispositif électronique 2 comprend un module de décodage 14 conçu pour convertir, pour chaque bande de fréquence temporelle, les valeurs α1(f), α2(f), α(L+1)²(f) associées à la bande de fréquence temporelle concernée et déterminées respectivement pour les différents signaux du premier ensemble, en des valeurs δ1(f), δ2(f), δ(L+1)²(f) représentatives chacune d’une source sonore virtuelle orientée dans l’une des directions Ω1(f), Ω2(f), …, Ω(L+1)²(f) de l’espace associées aux données mémorisées pour la bande de fréquence temporelle concernée.
On note dans la suiteδ(f) le vecteur formé (pour une bande de fréquence temporelle) par ces valeurs δ1(f), δ2(f), δ(L+1)²(f) représentatives des sources sonores virtuelles orientées dans les directions Ω1(f), Ω2(f), …, Ω(L+1)²(f) de l’espace :
δ(f) = [δ1(f), δ2(f), …, δ(L+1)²(f)]T.
Le module de décodage 14 effectue par exemple, pour chaque bande de fréquence temporelle, la conversion précitée par multiplication matricielle du vecteurα(f), qui comprend comme déjà indiqué les valeurs α1(f), α2(f), α(L+1)²(f) associées à la bande de fréquence temporelle concernée et déterminées respectivement pour les différents signaux du premier ensemble.
Pour ce faire, le module de décodage 14 utilise par exemple une pluralité de matricesD(f) respectivement associées aux différentes bandes de fréquence temporelle et, pour chaque bande de fréquence temporelle, multiplie le vecteurα(f) susmentionné par la matriceD(f) concernée afin d’obtenir les valeurs δ1(f), δ2(f), δ(L+1)²(f) représentatives respectivement des sources sonores virtuelles orientées dans les directions de l’espace associées à la bande de fréquence temporelle concernée :
δ(f) =D(f)α(f).
Les matricesD(f) sont telles que les valeurs α1(f), α2(f), α(L+1)²(f) d’une part et les valeurs δ1(f), δ2(f), …, δ(L+1)²(f) d’autre part représentent le même champ sonore, mais dans deux représentations différentes, ici une représentation ambisonique pour les valeurs α1(f), α2(f), α(L+1)²(f) et une représentation en ondes planes orientées selon les directions particulières de l’espace associées à la bande de fréquence concernée pour les valeurs δ1(f), δ2(f), …, δ(L+1)²(f). En ce sens, on peut dire dans ce cas que chaque matriceD(f) permet, pour une bande de fréquence temporelle, le passage d’une représentation ambisonique à une représentation en ondes planes.
Chaque matriceD(f) est donc formée d’éléments Dk , iqui représentent chacun le coefficient à affecter à une valeur αi(f) (obtenu pour un signal d’entrée βi(t)) pour déterminer sa contribution à l’onde plane émise par la source sonore virtuelle orientée selon la direction Ωk(f). En effet, le produit matriciel ci-dessus signifie que l’on a :
δk(f) = ΣiDk,ii(f).
Dans l’exemple décrit ici où l’unité de mémorisation 4 mémorise, pour chaque bande de fréquence temporelle, des données associées à un nombre de directions particulières Ωjde l’espace égal au nombre de signaux dans le premier ensemble de signaux (signaux d’entrée), chaque matriceD(f) est une matrice carrée, de dimension égale au nombre de signaux dans le premier ensemble, ici (L+1)².
Dans le cas où les signaux d’entrées sont ambisoniques, on notea E j) le vecteur dont les coefficients expriment la fonction de transfert entre une onde plane se propageant depuis la direction Ωjet les différents signaux ambisoniques d’ordre L :
a E j) = [Y0 0j), Y1 -1j)…, Yl mj), …, YL Lj)]T,
où Yl m(.) est la fonction harmonique sphérique d’ordre l et de degré m.
Pour chaque bande de fréquence temporelle, la matriceD(f) peut alors être dans ce cas définie par :
D(f) = pinv( [a E 1(f)),a E 2(f)), ...,a E (L+1)²(f))] ),
où pinv(.) représente la pseudo-inverse de Moore-Penrose.
Dans le cas où la matriceD(f) est carrée comme indiqué ci-dessus, on peut donc écrire :
D(f) = [a E 1(f)),a E 2(f)), ...,a E (L+1)²(f))]-1.
Comme visible sur la , le module de décodage 14 peut comprendre en pratique une pluralité d’unités de conversion 16 conçues chacune pour effectuer la conversion susmentionnée pour une bande de fréquence temporelle donnée, c’est-à-dire ici pour effectuer la multiplication d’un vecteur α(f) reçu du module de transformation 12 par la matrice D(f) associée à cette bande de fréquence.
Le dispositif électronique 2 comprend un module d’encodage 18 conçu pour déterminer, pour chaque bande de fréquence temporelle, une pluralité de valeurs λ1(f), λ2(f), …, λN(f) associées respectivement aux différents signaux du second ensemble (signaux de sortie), sur la base des valeurs δ1(f), δ2(f), …, δ(L+1)²(f) représentatives des sources sonores virtuelles et obtenues par la conversion susmentionnée pour la bande de fréquence temporelle concernée.
Comme indiqué ci-dessus, on note N le nombre de signaux du second ensemble.
Par exemple, lorsque les signaux de sortie sont des signaux ambisoniques d’ordre L’, on a : N = (L’+1)².
Dans l’exemple décrit ici, le nombre N de signaux dans le second ensemble est strictement supérieur au nombre de signaux (ici égal à (L+1)²) dans le premier ensemble. C’est notamment le cas lorsque le traitement effectué par le dispositif électronique, décrit ci-dessous en référence à la , vise à augmenter artificiellement la résolution spatiale des scènes sonores (fonctionnalité à laquelle on se réfère parfois par le terme anglais "upscaling").
Par exemple, lorsque les signaux d’entrée et les signaux de sortie sont des signaux ambisoniques, l’ordre L’ des signaux de sortie est strictement supérieur à l’ordre L des signaux d’entrée.
Dans l’exemple décrit ici, le module d’encodage 18 détermine, pour chaque bande de fréquence temporelle, la pluralité de valeurs λ1(f), λ2(f), …, λN(f) associées respectivement aux différents signaux du second ensemble par multiplication matricielle (au moyen d’une matriceE(f)) du vecteurδ(f) comprenant les valeurs δ1(f), δ2(f), …, δ(L+1)²(f) représentative des sources sonores virtuelles et obtenues à l’étape de conversion pour la bande de fréquence temporelle concernée.
Une telle matriceE(f) a donc ici un nombre de colonnes égal au nombre de signaux dans le premier ensemble (ici (L+1)²) et un nombre de lignes égal au nombre N de signaux dans le second ensemble.
Dans le cas où les signaux de sortie sont des signaux ambisoniques, le module d’encodage 18 utilise, pour chaque bande de fréquence, une matriceE(f) permettant le passage d’une représentation en ondes planes à une représentation ambisonique, ici d’ordre L’ :
E(f) = [a S 1(f)),a S 2(f)), ...,a S (L+1)²(f))]
aveca S j) = [Y0 0j), Y1 -1j)…, Yl mj), …, YL L j)]T,
où comme déjà indiqué Yl m(.) est la fonction harmonique sphérique d’ordre l et de degré m.
En notantλ(f) = [λ1(f), λ2(f), …, λN(f)]T, on a ainsi :λ(f) =E(f)δ(f).
Comme visible sur la , le module d’encodage 18 peut comprendre en pratique une pluralité d’unités de traitement 20 conçues chacune pour effectuer la transformation qui vient d’être décrite pour une bande de fréquence temporelle donnée, c’est-à-dire ici pour effectuer la multiplication d’un vecteur δ(f) reçu du module de décodage 14 (précisément ici : reçu d’une unité de conversion 16) par la matrice E(f) associée à cette bande de fréquence.
Le dispositif électronique 2 comprend enfin un module de construction 22 conçu pour construire chaque signal σi(t) du second ensemble sur la base des valeurs λi(f) associées à ce signal σi(t) du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.
Le module de construction 22 construit par exemple chaque signal σi(t) du second ensemble par transformation fréquence-temps (telle qu’une transformation de Fourier à court terme inverse) sur la base des valeurs λi(f) associées à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.
On obtient ainsi N signaux de sortie (signaux du second ensemble), précisément ici, pour chaque signal de sortie, un ensemble de valeurs σi(t) formant ce signal de sortie pour les différents instants t (successifs) de l’intervalle de temps considéré. On peut noter sous forme vectorielle les valeurs des différents signaux de sortie pour chaque instant t :b S (t) = [σ1(t), σ2(t), …, σN(t)]T.
La représente sous forme de logigramme un procédé de conversion conforme à l’invention. Ce procédé est par exemple mis en œuvre par le dispositif électronique de la , comme décrit dans la suite.
Le procédé de la débute par une étape E2 de détermination du format des signaux d’entrée bE(t), reçus ici par le module de réception 6. Cette étape E2 est par exemple mise en œuvre par le module de détection 10. En variante, comme déjà indiqué, cette étape E2 pourrait être mise en œuvre par le module de configuration 8 par lecture de métadonnées M indicatives du format des signaux d’entrée bE(t).
Cette étape E2 permet ici de déterminer le nombre de signaux présents dans le premier ensemble de signaux.
Le procédé de la comprend alors une étape E4 de configuration du module de décodage 14 et/ou du module d’encodage 18 en fonction du format déterminé à l’étape E2. Cette étape de configuration E4 est ici mise en œuvre par le module de configuration 8.
Cette étape E2 peut comprendre en outre la configuration (ici par le module de configuration 8) d’autres éléments du dispositif électronique 2, comme le module de transformation 12 et/ou le module de construction 22. Par exemple, le module de configuration 8 configure le module de transformation 12 et/ou le module de construction 22 en fonction du nombre de bandes de fréquence temporelle à utiliser (ce nombre pouvant être mémorisé dans une mémoire du dispositif électronique 2 et/ou entré par un utilisateur via une interface utilisateur – non représentée – du dispositif électronique 2).
Par exemple, au cours de l’étape de configuration E4, le module de configuration 8 détermine (en fonction du format déterminé à l’étape E2) les matricesD(f) à utiliser, et configure les unités de conversion 16 respectivement au moyen de ces matricesD(f).
Le module de configuration 8 détermine par exemple les matricesD(f) à utiliser en fonction du nombre de signaux présents dans le premier ensemble de signaux.
Selon une première possibilité, en fonction du nombre de signaux dans le premier ensemble de signaux (i.e.du nombre de signaux d’entrée), le module de configuration 8 lit un ensemble de matricesD(f) mémorisé (par exemple dans la mémoire du dispositif électronique 2) en association avec ce nombre de signaux dans le premier ensemble de signaux. En variante, le module de configuration 8 pourrait émettre ce nombre de signaux dans le premier ensemble de signaux à destination d’un serveur distant et recevoir en réponse l’ensemble de matricesD(f) associé.
Selon une autre possibilité (par exemple mise en œuvre la première fois où le nombre de signaux d’entrée déterminé à l’étape E2 est rencontré), le module de configuration 8 effectue un procédé tel que celui décrit ci-dessous à la pour définir une pluralité de directions Ωj de l’espace, attribuer ces directions Ωj de l’espace aux bandes de fréquence temporelle, et construire, pour chaque bande de fréquence temporelle, la matrice D(f) en utilisant les directions Ω1(f), Ω2(f), …, Ω(L+1)²(f) de l’espace attribuées à la bande de fréquence temporelle concernée (la construction de la matrice D(f) en utilisant différentes directions Ω1(f), Ω2(f), …, Ω(L+1)²(f) de l’espace étant déjà présentée plus haut). Les matrices D(f) ainsi construites peuvent être mémorisées (par exemple dans la mémoire du dispositif électronique 2) pour utilisation ultérieure (conformément à la première possibilité indiquée ci-dessus).
De même, au cours de l’étape de configuration E4, le module de configuration 8 peut déterminer les matricesE(f) à utiliser (par exemple en fonction du format des signaux de sortie, ici du nombre de signaux de sortie, qui peut être mémorisé et/ou entré par un utilisateur au moyen de l’interface utilisateur du dispositif électronique 2), et configure les unités de traitement 20 respectivement au moyen de ces matricesE(f).
Le module de configuration 8 détermine par exemple les matricesE(f) à utiliser en fonction du nombre de signaux présents dans le second ensemble de signaux (signaux de sortie).
Selon une première possibilité, en fonction du nombre de signaux dans le second ensemble de signaux (i.e.du nombre de signaux d’entrée), le module de configuration 8 lit un ensemble de matricesE(f) mémorisé (par exemple dans la mémoire du dispositif électronique 2) en association avec ce nombre de signaux dans le second ensemble de signaux. En variante, le module de configuration 8 pourrait émettre ce nombre de signaux dans le second ensemble de signaux à destination d’un serveur distant et recevoir en réponse l’ensemble de matricesE(f) associé.
Selon une autre possibilité (par exemple mise en œuvre la première fois où le nombre de signaux de sortie choisi est rencontré), le module de configuration 8 effectue un procédé tel que celui décrit ci-dessous à la pour définir une pluralité de directions Ωj de l’espace, attribuer ces directions Ωj de l’espace aux bandes de fréquence temporelle, et construire, pour chaque bande de fréquence temporelle, la matrice E(f) en utilisant les directions Ω1(f), Ω2(f), …, Ω(L+1)²(f) de l’espace attribuées à la bande de fréquence temporelle concernée (la construction de la matrice E(f) en utilisant différentes directions Ω1(f), Ω2(f), …, Ω(L+1)²(f) de l’espace étant déjà présentée plus haut). Les matrices E(f) ainsi construites peuvent être mémorisées (par exemple dans la mémoire du dispositif électronique 2) pour utilisation ultérieure (conformément à la première possibilité indiquée ci-dessus).
Le procédé de la prévoit alors, pour chacun des signaux βi(t) du premier ensemble (signaux d’entrée), une étape E6 de détermination de valeurs αi(f) respectivement associées aux différentes bandes de fréquence temporelle. Dans l’exemple décrit, ces différentes valeurs αi(f) respectivement associées aux différentes bandes de fréquence temporelle représente le signal βi(t) concerné dans le domaine fréquentiel.
Cette étape de détermination E6 est ici réalisée par le module de transformation 12.
Comme déjà indiqué, les valeurs αi(f) respectivement associées auxdites bandes de fréquence temporelle peuvent être déterminées par transformation temps-fréquence sur la base des signaux βi(t) du premier ensemble.
Le procédé de la comprend ensuite, pour chaque bande de fréquence temporelle, une étape de conversion E8 des valeurs αi(f) associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux β1(t), β2(t), …, β(L+1)²(t) du premier ensemble, en des valeurs δ1(f), δ2(f), δ(L+1)²(f) représentatives de sources sonores virtuelles orientées respectivement dans les différentes directions de l’espace Ω1(f), Ω2(f), …, Ω(L+1)²(f) associées (par exemple attribuées) à la bande de fréquence temporelle concernée.
Cette étape de conversion E8 est ici mise en œuvre par le module de décodage 8, par exemple comme déjà indiqué en effectuant les produits matricielsD(f)α(f) pour obtenir les différents vecteursδ(f) = [δ1(f), δ2(f), …, δ(L+1)²(f)]T.
Précisément, pour chaque bande de fréquence temporelle, l’une des unités de conversion 16 effectue un produits matricielD(f)α(f) pour obtenir un vecteurδ(f) formées des valeurs δ1(f), δ2(f), δ(L+1)²(f) représentatives de sources sonores virtuelles orientées respectivement dans les différentes directions de l’espace Ω1(f), Ω2(f), …, Ω(L+1)²(f) pour la bande de fréquence temporelle concernée.
Le procédé de la comprend ensuite une étape E10 de détermination, pour chaque bande de fréquence temporelle, sur la base des valeurs δ1(f), δ2(f), δ(L+1)²(f) représentatives des sources sonores virtuelles et obtenues à l’étape de conversion E8 pour la bande de fréquence temporelle concernée, d’une pluralité de valeurs λ1(f), λ2(f), …, λN(f) associées respectivement aux signaux du second ensemble (c’est-à-dire aux N signaux de sortie).
L’étape E10 est ici mise en œuvre par le module d’encodage 18, par exemple comme déjà indiqué en effectuant les produits matricielsE(f)δ(f) pour obtenir les différents vecteursλ(f) = [λ1(f), λ2(f), …, λN(f)]T.
Précisément, pour chaque bande de fréquence temporelle, l’une des unités de traitement 20 effectue un produits matricielE(f)δ(f) pour obtenir un vecteurλ(f) formé de valeurs λ1(f), λ2(f), …, λN(f) respectivement associées aux signaux σ1(t), σ2(t), …, σN(t) du second ensemble.
Dans l’exemple décrit ici, les différentes valeurs λi(f) obtenues pour les différentes bandes de fréquence temporelle et associées à un même signal σi(t) du second ensemble forment une représentation de ce signal σi(t) du second ensemble dans le domaine fréquentiel.
Le procédé de la comprend alors une étape E12 de construction de chaque signal σi(t) du second ensemble sur la base des valeurs λi(f) associées à ce signal σi(t) du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.
L’étape E12 est ici mise en œuvre par le module de construction 22.
Comme déjà indiqué, chaque signal σi(t) du second ensemble peut être construit par transformation fréquence-temps sur la base des valeurs λi(f) associées à ce signal σi(t) du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.
La présente un procédé de définition et d’attribution des directions particulières Ωj de l’espace à différentes bandes de fréquence temporelle.
Ce procédé débute par une étape E20 de définition d’une pluralité de directions de l’espace par un processus d’optimisation, ici un processus d’optimisation dit "problème de Thomson".
La pluralité des directions de l’espace ainsi obtenue forme un maillage de l’ensemble des directions de l’espace, comme déjà indiqué.
On décrit ce processus d’optimisation dans le cas de signaux d’entrée ambisoniques d’ordre 1 : on utilise dans ce cas comme déjà indiqué 4 directions particulières Ωjpour chaque bande de fréquence temporelle.
Si on note F le nombre de bandes de fréquence temporelle utilisé (comme déjà indiqué, F est par exemple compris entre 100 et 1000, ici F = 256), on prévoit ici F groupes de 4 directions particulières Ωj(le nombre de directions particulières par groupe étant égal au nombre de signaux d’entrée, ici 4 signaux d’entrée pour des signaux ambisonique d’ordre L=1 comme déjà indiqué).
Dans chaque groupe, les directions particulières sont réparties dans l’espace et forment donc dans l’exemple décrit ici un tétraèdre (par exemple un tétraèdre régulier).
On peut définir des rotations qui permettent chacune de passer d’un tétraèdre défini pour un groupe de directions particulières à un autre tétraèdre, défini pour un autre groupe de directions particulières.
On modélise chacune des 4F directions particulières Ωjcomme une particule chargée localisée à la surface d’une sphère, et se déplaçant de façon solidaire aux autres directions appartenant au même groupe, c’est-à-dire au même tétraèdre. Deux particules chargées exercent l’une sur l’autre une force de répulsion semblable à l’interaction électrostatique.
On définit alors une fonction coût correspondant à l’énergie potentielle totale du système ainsi modélisé.
Par itérations successives, on modifie les rotations susmentionnées de manière à atteindre un minimum d’énergie potentielle (problème de Thomson). Puisque l’énergie potentielle est d’autant plus grande que les particules sont proches les unes des autres, cette optimisation conduit à une distribution optimale des directions sur la sphère.
On dispose ainsi de F tétraèdres disposés de manière à fournir un échantillonnage régulier (et donc un maillage) de l’ensemble des directions possibles de l’espace.
Le procédé de la comprend alors une étape E22 d’attribution des directions particulières de l’espace obtenues à l’étape E20 aux F bandes de fréquence temporelle.
Pour ce faire, on peut attribuer aléatoirement un quelconque des tétraèdres (c’est-à-dire un des groupes de directions particulières) à la première bande de fréquence temporelle (les bandes de fréquence temporelle étant par exemple ordonnées par fréquence centrale croissante).
Le tétraèdre attribué à la seconde bande de fréquence temporelle est celui qui correspond à la plus petite rotation par rapport au tétraèdre attribué à la première bande de fréquence temporelle. Les autres tétraèdres sont ainsi attribués successivement aux différentes bandes de fréquence temporelle de façon à ce que la distance angulaire entre deux groupes de directions successifs soit aussi petite que possible.
Deux directions particulières attribuées à deux bandes de fréquences adjacentes sont ainsi voisines au sein du maillage, ce qui permet d’éviter des sauts dans les traitements effectués pour deux bandes de fréquence voisines.
Un groupe de directions particulières Ω1(f), Ω2(f), …, Ω(L+1)²(f) (correspondant à un tétraèdre particulier dans l’exemple décrit ici) étant attribué à chaque bande de fréquence temporelle, le procédé de la comprend une étape E24 de construction et de mémorisation, pour chaque bande de fréquence temporelle, de données associées aux directions particulières Ω1(f), Ω2(f), …, Ω(L+1)²(f) de l’espace attribuées à la bande de fréquence concernée.
Dans l’exemple décrit ici, pour chaque bande de fréquence temporelle, l’étape E24 comprend la construction et la mémorisation de la matriceD(f) et/ou de la matriceE(f) comme indiqué plus haut, sur la base des directions particulières Ω1(f), Ω2(f), …, Ω(L+1)²(f) attribuées à la bande de fréquence concernée.
L’invention qui vient d’être décrite peut être appliquée dans différentes situations où l’on souhaite convertir un premier ensemble de signaux ayant un premier format en un second ensemble de signaux ayant un second format.
Par exemple, lorsque l’on souhaite reproduire des signaux ambisoniques d’ordre L relativement faible (par exemple d’ordre L=1) au moyen d’un nombre important de haut-parleurs (par exemple au moyen de 10 haut-parleurs ou plus), il est souhaitable de convertir les signaux ambisoniques d’ordre L en signaux ambisoniques d’ordre L’ strictement supérieur à L et de reproduire sur les haut-parleurs les signaux convertis afin d’éviter la production d’artefacts désagréables à l’oreille.
Selon un autre exemple représenté schématiquement sur la , on souhaite parfois combiner des signaux ambisoniques bE(t) d’ordre L et des signaux ambisoniques b’(t) d’ordre L’ strictement supérieur à L. Ceci est notamment intéressant lorsque les signaux ambisoniques b’(t) représentent (de manière détaillée) un son en propagation directe entre une source sonore et l’utilisateur, tandis que les signaux ambisoniques bE(t) représentent des sons arrivant à l’utilisateur après réflexion et/ou réverbération. L’utilisation de signaux ambisoniques bE(t) d’ordre faible permet un allégement des traitements effectués sur ces signaux (par exemple pour produire ces signaux).
En vue par exemple de la reproduction des sons ainsi représentés, on peut dans ce cas convertir les signaux ambisoniques bE(t) d’ordre L en signaux ambisoniques bS(t) d’ordre L’ grâce au dispositif électronique 2 et/ou au procédé de la , puis combiner les signaux ambisoniques bS(t) et les signaux ambisoniques b’(t) au moyen d’un dispositif de mixage 5 (ces deux signaux ambisoniques étant de même ordre L’) afin d’obtenir un signal combiné b’’(t) (également ambisonique d’ordre L’).
Par ailleurs, bien que les exemples présentés ci-dessus utilisent des signaux d’entrée et des signaux de sortie ambisoniques, il est possible en variante d’utiliser des signaux d’entrée ou des signaux de sortie d’un autre type, par exemple des signaux multicanaux.
On considère dans ce cas les différents signaux, correspondant chacun à une position de haut-parleur donnée, comme un format orienté-scène dans lequel la base de fonctions de l’espace utilisée est constituée de fonctions dites de « panning ». Une fonction de panning exprime les gains appliqués aux différents haut-parleurs pour donner l’impression à un auditeur qu’une source sonore se trouve une direction donnée. La méthode VBAP (pour "Vector Base Amplitude Panning"), par exemple, permet de calculer des fonctions de panning pour un ensemble de haut-parleurs donné. On pourra par exemple se référer à ce sujet à l’article "Virtual Sound Source Positioning Using Vector Base Amplitude Panning", de V. Pulkki,inJournal of the Audio Engineering Society, 45(6), pp. 456-466, juin 1997.
Les matricesD(f) etE(f) mentionnées plus haut peuvent dans ce cas être construites en concaténant les vecteurs constitués des gains de panning pour les différentes directions Ωjd’ondes planes.

Claims (13)

  1. Procédé de conversion d’un premier ensemble de signaux (b E (t)) représentatifs d’un champ sonore dans un espace en un second ensemble de signaux (b S (t)) au moyen d’un dispositif électronique (2),
    caractérisé en ce que le dispositif électronique (2) mémorise, pour chaque bande de fréquence temporelle d’une pluralité de bandes de fréquence temporelle du champ sonore, au moins une donnée associée à une direction particulière (Ωj) de l’espace, l’ensemble de ces directions particulières (Ωj) de l’espace associées à une donnée pour au moins une bande de fréquence temporelle formant un maillage de l’ensemble des directions de l’espace, et en ce que le procédé comprend les étapes suivantes :
    - pour chacun des signaux (b E (t)) du premier ensemble, détermination (E6) de valeurs (α(f)) respectivement associées auxdites bandes de fréquence temporelle ;
    - pour chaque bande de fréquence temporelle, conversion (E8) des valeurs (α(f)) associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux du premier ensemble, en au moins une valeur représentative d’une source sonore virtuelle orientée dans la direction (Ωj) de l’espace associée à la donnée mémorisée pour la bande de fréquence temporelle concernée ;
    - pour chaque bande de fréquence temporelle, détermination (E10), sur la base de ladite au moins une valeur représentative d’une source sonore virtuelle et obtenue à l’étape de conversion (E8) pour la bande de fréquence temporelle concernée, d’une pluralité de valeurs (λ(f)) associées respectivement aux différents signaux (b S (t)) du second ensemble ;
    - construction de chaque signal (b S (t)) du second ensemble sur la base des valeurs associées (λ(f)) à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.
  2. Procédé de conversion selon la revendication 1, dans lequel le dispositif électronique mémorise, pour chaque bande de fréquence temporelle, des données associées à un nombre de directions particulières de l’espace égal au nombre de signaux (b E (t)) dans le premier ensemble de signaux.
  3. Procédé selon la revendication 2, dans lequel, à l’étape de conversion (E8) relative à une bande de fréquence temporelle donnée, les valeurs (α(f)) associées à la bande de fréquence temporelle donnée et déterminées pour les différents signaux du premier ensemble sont converties en une pluralité de valeurs (δ(f)) représentatives de sources sonores virtuelles orientées respectivement dans les directions (Ωj) de l’espace associées aux données mémorisées pour la bande de fréquence temporelle donnée.
  4. Procédé selon la revendication 2 ou 3, dans lequel les directions particulières associées aux données mémorisées pour une bande de fréquence temporelle donnée sont réparties parmi l’ensemble des directions de l’espace.
  5. Procédé selon l’une des revendications 1 à 4, dans lequel le nombre de signaux dans le second ensemble est strictement supérieur au nombre de signaux dans le premier ensemble.
  6. Procédé selon l’une des revendications 1 à 5, dans lequel deux directions associées à deux données mémorisées respectivement pour deux bandes de fréquences adjacentes sont voisines au sein du maillage.
  7. Procédé selon l’une des revendications 1 à 6, dans lequel l’ensemble desdites directions particulières comprend au moins 50 directions particulières.
  8. Procédé selon l’une des revendications 1 à 7, dans lequel les valeurs (α(f)) respectivement associées auxdites bandes de fréquence temporelle sont déterminées par transformation temps-fréquence sur la base des signaux (b E (t)) du premier ensemble.
  9. Procédé selon l’une des revendications 1 à 8, dans lequel chaque signal (b S (t)) du second ensemble est construit par transformation fréquence-temps sur la base des valeurs (λ(f)) associées à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.
  10. Procédé selon l’une des revendications 1 à 9, dans lequel, pour chaque bande de fréquence temporelle, l’étape de conversion (E8) est réalisée par multiplication matricielle d’un vecteur (α(f)) comprenant les valeurs associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux (b E (t)) du premier ensemble.
  11. Procédé selon l’une des revendications 1 à 10, dans lequel, pour chaque bande de fréquence temporelle, l’étape de détermination (E10) d’une pluralité de valeurs (λ(f)) associées respectivement aux différents signaux (b S (t)) du second ensemble est réalisée par multiplication matricielle d’un vecteur (δ(f)) comprenant ladite au moins une valeur représentative d’une source sonore virtuelle et obtenue à l’étape de conversion (E8) pour la bande de fréquence temporelle concernée.
  12. Procédé selon l’une des revendications 1 à 11, comprenant des étapes préalables de définition (E20) d’une pluralité de directions de l’espace par un processus d’optimisation, d’attribution (E22) des directions de l’espace de la pluralité auxdites bandes de fréquence temporelle, et de mémorisation (E24), pour chaque bande de fréquence temporelle, de ladite au moins une donnée associée à la direction de l’espace attribuée à la bande de fréquence concernée.
  13. Dispositif électronique (2) de conversion d’un premier ensemble de signaux (b E (t)) représentatifs d’un champ sonore dans un espace en un second ensemble de signaux (b S (t)),
    caractérisé en ce que le dispositif électronique comprend :
    - une unité de mémorisation (4) conçue pour mémoriser, pour chaque bande de fréquence temporelle d’une pluralité de bandes de fréquence temporelle du champ sonore, au moins une donnée associée à une direction particulière (Ωj) de l’espace, de sorte que l’ensemble de ces directions particulières (Ωj) de l’espace associées à une donnée pour au moins une bande de fréquence temporelle forme un maillage de l’ensemble des directions de l’espace ;
    - un module de transformation (12) conçu pour déterminer, pour chacun des signaux (b E (t)) du premier ensemble, des valeurs (α(f)) respectivement associées auxdites bandes de fréquence temporelle ;
    - un module de décodage (14) conçu pour convertir, pour chaque bande de fréquence temporelle, les valeurs (α(f)) associées à la bande de fréquence temporelle concernée et déterminées pour les différents signaux (b E (t)) du premier ensemble, en au moins une valeur représentative d’une source sonore virtuelle orientée dans la direction de l’espace associée à la donnée mémorisée pour la bande de fréquence temporelle concernée ;
    - un module d’encodage (18) conçu pour déterminer, pour chaque bande de fréquence temporelle, une pluralité de valeurs (λ(f)) associées respectivement aux différents signaux (b S (t)) du second ensemble, sur la base de ladite au moins une valeur représentative d’une source sonore virtuelle et obtenue par le module de décodage pour la bande de fréquence temporelle concernée ;
    - un module de construction (20) conçu pour construire chaque signal (b S (t)) du second ensemble sur la base des valeurs associées (λ(f)) à ce signal du second ensemble et obtenues respectivement pour les différentes bandes de fréquence temporelle.
FR2006878A 2020-06-30 2020-06-30 Procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux et dispositif électronique associé Active FR3112016B1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
FR2006878A FR3112016B1 (fr) 2020-06-30 2020-06-30 Procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux et dispositif électronique associé
EP21181285.4A EP3934282A1 (fr) 2020-06-30 2021-06-23 Procédé de conversion d'un premier ensemble de signaux représentatifs d'un champ sonore en un second ensemble de signaux et dispositif électronique associé
US17/362,704 US20210407524A1 (en) 2020-06-30 2021-06-29 Method for converting a first set of signals representative of a sound field into a second set of signals and associated electronic device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR2006878 2020-06-30
FR2006878A FR3112016B1 (fr) 2020-06-30 2020-06-30 Procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux et dispositif électronique associé

Publications (2)

Publication Number Publication Date
FR3112016A1 true FR3112016A1 (fr) 2021-12-31
FR3112016B1 FR3112016B1 (fr) 2023-04-14

Family

ID=73038106

Family Applications (1)

Application Number Title Priority Date Filing Date
FR2006878A Active FR3112016B1 (fr) 2020-06-30 2020-06-30 Procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux et dispositif électronique associé

Country Status (3)

Country Link
US (1) US20210407524A1 (fr)
EP (1) EP3934282A1 (fr)
FR (1) FR3112016B1 (fr)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992012607A1 (fr) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Codeur/decodeur pour champs sonores a dimensions multiples
EP2824662A1 (fr) * 2013-06-14 2015-01-14 Nokia Corporation Traitement audio
FR3060830A1 (fr) * 2016-12-21 2018-06-22 Orange Traitement en sous-bandes d'un contenu ambisonique reel pour un decodage perfectionne
US20180182402A1 (en) * 2014-07-02 2018-06-28 Dolby International Ab Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a hoa signal representation

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220159402A1 (en) * 2019-03-28 2022-05-19 Sony Group Corporation Signal processing device and method, and program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992012607A1 (fr) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Codeur/decodeur pour champs sonores a dimensions multiples
EP2824662A1 (fr) * 2013-06-14 2015-01-14 Nokia Corporation Traitement audio
US20180182402A1 (en) * 2014-07-02 2018-06-28 Dolby International Ab Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a hoa signal representation
FR3060830A1 (fr) * 2016-12-21 2018-06-22 Orange Traitement en sous-bandes d'un contenu ambisonique reel pour un decodage perfectionne

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A. POLITISS. TERVOV. PULKKI: "COMPASS : Coding and Multidirectional Parametrization of Ambisonic Sound Scenes", PROCEEDINGS OF THE 2018 IEEE INTERNATIONAL CONFÉRENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP, April 2018 (2018-04-01)
V. PULKKI: "Virtual Sound Source Positioning Using Vector Base Amplitude Panning", JOURNAL OF THE AUDIO ENGINEERING SOCIETY, vol. 45, no. 6, June 1997 (1997-06-01), pages 456 - 466, XP002719359

Also Published As

Publication number Publication date
EP3934282A1 (fr) 2022-01-05
US20210407524A1 (en) 2021-12-30
FR3112016B1 (fr) 2023-04-14

Similar Documents

Publication Publication Date Title
EP2898707B1 (fr) Calibration optimisee d'un systeme de restitution sonore multi haut-parleurs
EP1836876B1 (fr) Procédé et dispositif d'individualisation de hrtfs par modélisation
EP1992198B1 (fr) Optimisation d'une spatialisation sonore binaurale a partir d'un encodage multicanal
EP2374123B1 (fr) Codage perfectionne de signaux audionumeriques multicanaux
EP2374124B1 (fr) Codage perfectionne de signaux audionumériques multicanaux
EP1946612B1 (fr) Individualisation de hrtfs utilisant une modelisation par elements finis couplee a un modele correctif
EP2539892B1 (fr) Compression de flux audio multicanal
EP3807669B1 (fr) Localisation de sources sonores dans un environnement acoustique donné
EP2901718B1 (fr) Procede et systeme de restitution d'un signal audio
FR2899424A1 (fr) Procede de synthese binaurale prenant en compte un effet de salle
EP1586220B1 (fr) Procede et dispositif de pilotage d'un ensemble de restitution a partir d'un signal multicanal
EP1479266A2 (fr) Procede et dispositif de pilotage d'un ensemble de restitution d'un champ acoustique
EP1502475B1 (fr) Procede et systeme de representation d un champ acoustique
FR2858403A1 (fr) Systeme et procede de determination d'une representation d'un champ acoustique
WO2018050292A1 (fr) Dispositif et procede de captation et traitement d'un champ acoustique tridimensionnel
FR3112016A1 (fr) Procédé de conversion d’un premier ensemble de signaux représentatifs d’un champ sonore en un second ensemble de signaux et dispositif électronique associé
EP4248231A1 (fr) Localisation perfectionnée d'une source acoustique
EP4081769A1 (fr) Procédé et système d'estimation d'une grandeur représentative de l'énergie sonore
EP3384688B1 (fr) Décompositions successives de filtres audio
EP4042418B1 (fr) Détermination de corrections à appliquer a un signal audio multicanal, codage et décodage associés
JP2023122018A (ja) 信号処理装置、信号処理プログラム及び信号処理方法
FR3112015A1 (fr) Codage optimisé d’une information représentative d’une image spatiale d’un signal audio multicanal
FR3072820A1 (fr) Procede de modelisation et de simulation en temps reel de sources acoustiques dans un environnement par decomposition en sources elementaires
WO2012085453A1 (fr) Traitement de donnees sonores pour une separation de sources
FR2994754A1 (fr) Procede d'interpolation pour synthese numerique de signaux analogiques et circuit integre pour l'implementation dudit procede

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20211231

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4