FR3069693B1 - Procede et systeme de traitement d'un signal audio incluant un encodage au format ambisonique - Google Patents

Procede et systeme de traitement d'un signal audio incluant un encodage au format ambisonique Download PDF

Info

Publication number
FR3069693B1
FR3069693B1 FR1757191A FR1757191A FR3069693B1 FR 3069693 B1 FR3069693 B1 FR 3069693B1 FR 1757191 A FR1757191 A FR 1757191A FR 1757191 A FR1757191 A FR 1757191A FR 3069693 B1 FR3069693 B1 FR 3069693B1
Authority
FR
France
Prior art keywords
sound signal
microphones
signals
sound
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
FR1757191A
Other languages
English (en)
Other versions
FR3069693A1 (fr
Inventor
Frederic Amadu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Arkamys SA
Original Assignee
Arkamys SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Arkamys SA filed Critical Arkamys SA
Priority to FR1757191A priority Critical patent/FR3069693B1/fr
Priority to PCT/EP2018/069402 priority patent/WO2019020437A1/fr
Priority to US16/634,193 priority patent/US11432092B2/en
Priority to DE112018003843.2T priority patent/DE112018003843T5/de
Publication of FR3069693A1 publication Critical patent/FR3069693A1/fr
Application granted granted Critical
Publication of FR3069693B1 publication Critical patent/FR3069693B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)

Abstract

La présente invention se rapporte à un procédé (100) de traitement du signal sonore comportant les étapes suivantes : - captation (110) synchrone d'un signal sonore d'entrée Sentrée à l'aide d'au moins deux microphones omnidirectionnels ; - encodage (120) dudit signal sonore d'entrée Sentrée en un format de données D de son de type ambisonique d'ordre R, R étant un entier naturel supérieur ou égal à un, ladite étape d'encodage comprenant une sous-étape d'optimisation de directivité réalisée à l'aide de filtres de type filtre à Réponse Impulsionnelle Finie RIF ; Selon l'invention, chacun des signaux captés par les microphones est filtré au cours de la sous-étape d'optimisation de directivité par un filtre RIF puis soustrait à une version non filtrée de chacun des autres signaux pour obtenir N signaux améliorés. La présente invention se rapporte également à un système de traitement du signal sonore.

Description

PROCEDE ET SYSTEME DE TRAITEMENT D’UN SIGNAL AUDIO INCLUANT UN ENCODAGE AU FORMAT AMBISONIQUE
DOMAINE DE L’INVENTION 5
La présente invention appartient au domaine du traitement du signal sonore.
Plus particulièrement, la présente invention appartient au domaine l’enregistrement d’un signal audio à 360°. 10
ETAT DE L’ART 15 On connaît dans l’état de la technique des procédés et des systèmes permettant de diffuser des signaux vidéo à 360°. Il existe un besoin dans l’état de la technique de pouvoir associer des signaux audio à ces signaux vidéo à 360°.
Jusqu’à maintenant, l’audio 3D était réservé aux professionnels du son et aux chercheurs. Cette technologie a pour objectif de capturer le maximum 20 d’informations spatiales lors de l’enregistrement pour les restituer ensuite à l’auditeur et lui donner une sensation d’immersion dans la scène sonore.
Dans le domaine de la vidéo, l’intérêt est croissant pour les vidéos filmées à 360° et reproduites via un casque de réalité virtudle pour une immersion complète dans l’image : l’utilisateur peut tourner la tête et explorer la scène visuelle tout 25 autour de lui. Pour obtenir la même fidélité dans le domaine du son, la solution la plus compacte est l’utilisation d’un réseau de microphones, comme par exemple i tigenmiKe ae mn acoustics, le bounaneia ae i ôl uroaucts, et le i etraiviic ae Core Sound. La forme polyhédrique des réseaux de microphones permet d’utiliser des formules simples pour convertir les signaux des microphones en un format ambisonique. Le format ambisonique est un ensemble de canaux audio résulta nt 5 d’un encodage directionnel du champ acoustique, il contient toutes les informations nécessaires à la reconstruction spatiale du champ sonore. Equipés de quatre à trente-deux microphones, ces produits sont onéreux et donc réservés à des utilisations professionnelles.
De récentes recherches se sont orientées sur un encodage en format 10 ambisonique sur la base d’un nombre réduit de microphones omnidirectionnels. L’usage d’un nombre réduit de ce type de microphones permet de réduire les coûts. A titre d’exemple, la publication A triple microphonie array for surround Sound recording, Rilin CHEN ET AL. divulgue un réseau composé de deux 15 microphones omnidirectionnels dont les diagrammes de directivité sont virtuellement modifiés par application d’un retard à l’un des signaux captés par les microphones. Les signaux résultant sont ensuite combinés pour obtenir le signal sonore au format ambisonique.
Un inconvénient du procédé décrit dans cet art antérieur est que le réseau 20 de microphones est placé en champ libre. Dans la pratique, lorsqu’un obstacle est placé entre les deux microphones, des phénomènes de diffraction entraînent des atténuations et des déphasages de l’onde incidente différenciés suivant les fréquences. En conséquence, l’application d’un retard au signal reçu par l’un des microphones ne permettra pas une restitution fidèle du signal sonore reçu car le 25 retard appliqué sera le même à toutes les fréquences.
EXPOSE DE L’INVENTION 30 L’invention vise à remédier aux inconvénients de l’art antérieur en proposant un procédé de traitement du signal sonore permettant de réaliser un encodage au signai sonore au îormat amoisomque sur la oase ae signaux captes par au moins deux microphones omnidirectionnels. L’invention concerne un procédé de traitement du signal sonore comportant 5 les étapes suivantes : captation synchrone d’un signal sonore d’entrée Sentrée à l’aide de N microphones omnidirectionnels, N étant un entier naturel supérieur ou égal à deux ; encodage dudit signal sonore d’entrée Sentrée en un format de 10 données D de son de type ambisonique d’ordre R, R étant un entier naturel supérieur ou égal à un, ladite étape d’encodage comprenant une sous-étape d’optimisation de directivité réalisée à l’aide de filtres de type filtre à Réponse Impulsionnelle Finie RIF et ladite étape d’encodage comprenant une sous-étape de création d’un signal sonore de sortie Ssortie au format ambisonique à partir de 15 signaux améliorés issus de la sous-étape d’optimisation de directivité ; restitution du signal sonore de sortie SSOrtie à l’aide d’un traitement numérique desdites données D de son ;
Selon l’invention, au cours de la sous-étape d’optimisation de directivité, il est soustrait à chacun des signaux captés par les microphones les signaux captés 20 par les N-1 autres microphones filtrés chacun par un filtre RIF, pour obtenir N signaux améliorés.
Dans un mode de mise en oeuvre, les N microphones omnidirectionnels sont intégrés à un dispositif. 25
Dans un mode de mise en oeuvre, le filtre RIF appliqué au cours de la sous-étape d’optimisation de directivité à chaque signal capté est égal au rapport de la transformée en Z de la réponse impulsionnelle du microphone associé au signal objet de la soustraction sur la transformée en Z de la réponse impulsionnelle du 30 microphone associé au signal à filtrer puis soustraire, pour un angle d’incidence associé à une direction à supprimer. uans un moae ae mise en œuvre, lesaits micropnones sont disposes selon un cercle sur un plan, espacés suivant un angle égal à 360°/N.
Dans un mode de mise en œuvre, le procédé met en œuvre quatre 5 microphones espacés suivant un angle de 90° à l’hoirzontal.
Dans un mode de mise en œuvre, le dispositif est un smartphone et le procédé met en œuvre deux microphones placés chacun sur un bord latéral dudit smartphone. 10
Dans un mode de mise en œuvre, au moins un filtre à Réponse Impulsionnelle Infinie RII est appliqué à chacun des signaux améliorés lors de la sous-étape d’optimisation de directivité afin de corriger les artéfacts produits par les opérations de filtrage à l’aide de filtres RIF. 15
Dans un mode de mise en œuvre, l’au moins un filtre RII est un filtre de type «peak», dont une fréquence centrale fc, un facteur de qualité Q et un gain Gjb en décibels sont paramétrables pour compenser les artéfacts. 20 Dans un mode de mise en œuvre, l’ordre R du format de type ambisonique est égal à un.
Dans un mode de mise en œuvre, la création du signal de sortie au format ambisonique est réalisée par opérations algébriques réalisées sur les signaux 25 améliorés issus de la sous-étape d’optimisation de directivité pour créer les différents canaux dudit format ambisonique. L’invention concerne également un système de traitement du signal sonore pour la mise en œuvre du procédé selon l’invention. Le système selon l’invention 30 comporte des moyens pour : capter de manière synchrone un signal sonore d’entrée Sentrée à l’aide de N microphones, N étant un entier naturel supérieur ou égal à deux ; encoaer leair signai sonore a entree en un îormat ae aonnees u ae son de type ambisonique d’ordre R, R étant un entier naturel supérieur ou égal à un ; restituer un signal sonore de sortie à l’aide d’un traitement numérique 5 desdites données D de son ;
Selon l’invention, le système de traitement du signal sonore comporte des moyens comprenant des filtres à Réponse Impulsionnelle Finie pour filtrer chacun des signaux captés par les microphones et les soustraire à chacun des autres signaux originaux non filtrés pour obtenir N signaux améliorés. 10
BREVE DESCRIPTION DES FIGURES 15 L’invention sera mieux comprise à la lecture de la description qui suit et à l’examen des figures qui l’accompagnent. Celles-ci ne sont présentées qu’à titre indicatif et nullement limitatif de l’invention. 20 La figure 1 représente les différentes étapes du procédé selon l’invention.
La figure 2 représente un smartphone équipé de deux microphones captant une onde acoustique.
La figure 3 représente un schéma de principe des sous-étapes d’optimisation de la directivité des microphones et de création du format 25 ambisonique.
La figure 4 représente un schéma de principe de détermination des filtres à Réponse Impulsionnelle Infinie utilisés lors de la sous-étape d’optimisation de la directivité.
La figure 5 représente un dispositif comportant deux paires de 30 microphones, les deux directions portant les deux paires de microphones étant orthogonales.
La îigure b représente un scnema ae principe a optimisation au canal Gauche dans le mode de mise en oeuvre de la figure 5 comprenant quatre microphones.
La figure 7 représente un schéma de principe de création du format 5 ambisonique dans le mode de mise en oeuvre de la figure 5.
La figure 8 représente deux paires de microphones captant une onde acoustique, les deux directions portant les deux paires de microphones formant un angle strictement inférieur à 90°. 10
DESCRIPTION DETAILLEE
En référence à la figure 1, la présente invention se rapporte à un 15 procédé 100 de traitement d’un signal sonore comportant les étapes suivantes : captation 110 synchrone d’un signal sonore d’entrée Sentrée à l’aide de N microphones, N étant un entier naturel supérieur ou égal à deux ; encodage 120 dudit signal sonore d’entrée Sentrée en un format de données D de son de type ambisonique d’ordre R, R étant un entier naturel 20 supérieur ou égal à un ; restitution 130 d’un signal sonore de sortie Ssortie à l’aide d’un traitement numérique desdites données D de son.
Dans l’exemple de réalisation détaillé ci-après, la captation 110 est réalisée 25 avec un nombre N de microphones égal à deux, et l’ordre R est égal à 1 (le format ambisonique est alors appelé « B-format »). Les canaux du B-format seront notés dans la suite de la description (W ; X ; Y ; Z) selon les conventions usuelles, ces canaux représentant respectivement : la composante sonore omnidirectionnelle (W) ; 30 - la composante sonore Avant - Arrière (X) ; la composante sonore Gauche - Droite (Y) ; la composante sonore Haut - Bas (Z).
La captation ι ιυ consiste en un enregistrement au signai sonore bentrée- tn référence à la figure 2, deux microphones omnidirectionnels Mi, M2, disposés en périphérie d’un dispositif 1, captent une onde acoustique 2 d’incidence Θ par rapport à une droite portée par lesdits microphones. 5 Dans le mode de mise en oeuvre illustré, le dispositif 1 est un smartphone.
Il est considéré ici que les deux microphones Mi ; M2 sont disposés selon la dimension Y. Les raisonnements qui suivent pourraient être menés de manière équivalente en considérant que les deux microphones sont disposés selon la dimension X (Avant - Arrière) ou la dimension Z (Haut - Bas) et ce choix n’est pas 10 limitatif de l’invention. A l’issue de l’étape de captation 110, on obtient deux signaux numériques échantillonnés. On note yg le signal associé au « canal Gauche » et enregistré par le microphone Mi et yc le signal associé au « canal Droit » et enregistré par le microphone M2, lesdits signaux yg, yj constituant le signal d’entrée Sentrée- 15 s - —
Jentree ~ \ydJ
Tel qu’illustré sur la figure 2, le microphone Mi capte en premier l’onde acoustique 2 provenant de la gauche. Le microphone M2 la capte avec un retard par rapport au microphone ΜΊ. Le retard est imputable notamment à : 20 - une distance d entre les deux microphones ; la présence d’un obstacle, ici le dispositif 1, engendrant notamment des phénomènes de réflexion et de diffraction.
Lorsque l’onde acoustique 2 présente plusieurs fréquences, le retard avec lequel le microphone M2 capte ladite onde acoustique dépend de la fréquence, 25 notamment du fait de la présence du dispositif 1 entre les microphones occasionnant un phénomène de diffraction.
De la même manière, chaque fréquence de l’onde acoustique est atténuée de manière différente, en raison de la présence du dispositif 1 d’une part, et d’autre part en fonction des caractéristiques de directivité des microphones M1; M2 30 dépendant de la fréquence.
Par ailleurs, les microphones étant tous deux omnidirectionnels, ils restituent tous deux l’ensemble de l’espace sonore.
Par la suite, on cherche à différencier les microphones Mi et M2 en modifiant virtuellement leur directivité par traitement sur les signaux numériques enregistrés, de manière à pouvoir combiner les signaux modifiés pour créer le format ambisonique.
La figure 3 illustre les traitements appliqués aux signaux numériques obtenus lors de l’étape de captation 110, dans le cadre de l’étape d’encodage 120 du procédé selon l’invention.
Dans une sous-étape d’optimisation 121 de la directivité, un filtre F2i(Z) est appliqué au signal yg du « canal Gauche >>. Le signal filtré est ensuite soustrait du signal yj du « canal Droit >> au moyen d’un soustracteur.
Selon l’invention, le filtre F2i(Z) est de type filtre à Réponse Impulsionnelle Finie (RIF, ou FIR en terminologie anglo-saxonne, pour « Finite Impulse Response »). Un tel filtre RIF permet d’agir indépendamment sur chacune des fréquences, en modifiant l’amplitude et la phase du signal d’entrée sur chacune des fréquences, et ainsi compenser les effets imputables à la présence du dispositif 1 entre les microphones.
En notant Ηι(Ζ, Θ) et H2(Z, Θ) les transformées en Z respectives des réponses impulsionnelles des microphones Mi et M2 lorsque ceux-ci sont intégrés au dispositif 1, dans la direction d’incidence donnée par l’angle d’incidence Θ, le filtre F2i(Z) est déterminé par la relation :
Le choix de l’angle d’incidence θ nul dans la détermination du filtre F2i(Z) permet d’isoler la composante du son venant de la gauche. On obtient ainsi, après soustraction des signaux, un signal amélioré y/ associé au « canal Droit >> duquel la composante du son provenant de la gauche a été sensiblement supprimée.
La directivité du microphone M2 est ainsi virtuellement modifiée pour capter essentiellement les sons venant de la droite.
La même opération est réalisée de manière similaire pour le canal Gauche. De manière similaire, un filtre Fi2(Z) est appliqué au signal yj du canal Droit. Le signal filtré est ensuite soustrait du signal yg du canal Gauche au moyen d’un soustracteur. Le filtre F12(Z) est un filtre RIF défini par la relation :
Le choix de l’angle d’incidence Θ égal à 180° dans la détermination du filtre Fi2(Z) permet d’isoler la composante du son venant de la droite. On obtient ainsi, après soustraction des signaux, un signal amélioré yg* associé au « canal Gauche » duquel la composante du son provenant de la droite a été sensiblement supprimée.
La directivité du microphone Mi est ainsi virtuellement modifiée pour capter essentiellement les sons venant de la gauche.
En pratique, les filtres F21 (Z) et F12(Z) ont des caractéristiques de filtres passe-haut et leur application produit des artéfacts. En particulier, le spectre fréquentiel des signaux améliorés yg*, yj* est atténué dans les basses fréquences et altéré dans les hautes fréquences.
Pour corriger ces défauts, on applique aux signaux améliorés au moins un filtre Gi(Z), G2(Z) de type filtre à Réponse Impulsionnelle Infinie (RII, ou IIR en terminologie anglo-saxonne, pour « Infinité Impulse Response ») aux signaux améliorés yg* et yj* respectivement.
Pour déterminer l’au moins un filtre Gi (Z), G2(Z) à appliquer, un bruit blanc B est filtré par les filtres F21(Z), F12(Z) déterminés auparavant, comme illustré sur la figure 4. Les signaux filtrés sont ensuite soustraits au bruit blanc B d’origine. La comparaison des profils P, P’ des signaux de sortie avec le bruit blanc B permet de connaître le ou les filtres Gi(Z), G2(Z) à appliquer pour corriger les altérations du spectre fréquentiel dues au traitement des signaux, lors de la sous-étape 121.
Dans un mode de mise en oeuvre, les filtres RII sont des filtres de type « peak », dont une fréquence centrale fc, un facteur de qualité Q et un gain Gjb en décibels sont paramétrables afin de corriger les artéfacts. Ainsi, une fréquence
atténuée pourra être corrigée par un gain positif, une fréquence accentuée pourra être atténuée par un gain négatif.
On obtient donc après filtrage par l’au moins un filtre RII Gi(Z), G2(Z) un signal corrigé Yq représentatif des sons provenant de la gauche et un signal corrigé Yd représentatif des sons provenant de la droite.
Par la suite, en référence à la figure 3, la sortie au format ambisonique est créée 122.
Pour obtenir la composante omnidirectionnelle W du signal sonore, les signaux corrigés Yd, Yg sont sommés puis le résultat est normalisé par multiplication par un gain Kw égal à 0.5 :
YG + YD w=^
Sur la base de la convention selon laquelle la composante Y est positive si le son vient essentiellement de la gauche, la composante sonore Gauche-Droite est obtenue en soustrayant du signal corrigé Yq associé au « canal Gauche >> le signal corrigé Yd associé au «canal Droit». Le résultat est normalisé par multiplication par un facteur Κγ égal à 0.5 : 2
Etant donné que l’on ne dispose d’aucune information concernant les composantes Avant - Arrière et Haut - Bas, les composantes X et Z sont mises à zéro. A l’issue de l’étape d’encodage 120, on obtient des données D en B-format (dans le présent exemple de réalisation, les signaux W et Y, les autres signaux X et Z étant mis à zéro) :
Il est possible de reconstituer les signaux corrigés Yg, Yd des canaux Gauche et Droit respectivement par sommation et soustraction des signaux W et Y: 5 (YG\ _(W + Y\ \yd) W - y) L’étape de restitution 130 consiste en une restitution du signal sonore, grâce à une transformation des données sous format ambisonique en canaux binauraux. 10 Dans un mode de mise en oeuvre, les données D sous format ambisonique sont transformées en données sous format binaural. L’invention n’est pas limitée à l’exemple de réalisation décrit ci-dessus. En particulier, et le nombre de micros utilisé peut être supérieur à deux. 15 Dans un mode de mise en oeuvre alternatif du procédé 100 selon l’invention, quatre microphones omnidirectionnels M1; M2, M3, M4 disposés en périphérie d’un dispositif 1, captent une onde acoustique 2 d’incidence Θ par rapport à une droite portée par les microphones Mi et M2, comme illustré sur la figure 4. 20 II est considéré ici que les deux microphones Mi ; M2 sont disposés selon la dimension Y et que les deux microphones M3, M4 sont disposés selon la dimension X. Les quatre microphones sont disposés sur un cercle, représenté en traits mixtes sur la figure 4. A l’issue de l’étape de captation 110, on obtient quatre signaux numériques 25 échantillonnés. On note : - yg le signal associé au « canal Gauche » et enregistré par le microphone Mi ; - yj le signal associé au « canal Droit » et enregistré par le microphone M2 ; 30 - xav le signal associé au « canal Avant » et enregistré par le microphone M3 ; - xar ie signai associe au « canal Arriéré » et enregistre par le microphone M4 ; lesdits signaux yg, yd ,xav ,xar constituant le signal d’entrée Sentrée :
5
En référence à la figure 6 , la sous-étape d’optimisation 121 de la directivité est illustrée pour ce mode de mise en oeuvre. Dans un souci de clarté, seul le traitement du signal yg associé au canal Gauche est illustré.
Dans ce mode de mise en oeuvre, le signal amélioré yg* est obtenu en 10 soustrayant au signal yg capté par le microphone Mi les signaux yd, xav et xar filtrés respectivement par des filtres RIF Fi2(Z), Fi3(Z) et FU(Z), définis par : 15
Où Hi (Z, θ), H2(Z, θ), H3(Z, θ), H4(Z, Θ), désignent les transformées en Z respectives des réponses impulsionnelles des microphones ΜΊ, M2, M3, M4 lorsque ceux-ci sont intégrés au dispositif 1, pour un angle d’incidence Θ.
Le choix des angles d’incidence 180°, 90°, 270° das la détermination des 20 filtres permet d’isoler les composantes du son venant respectivement de la droite, de l’avant et de l’arrière.
On obtient ainsi, après soustraction des signaux, un signal amélioré yg* associé au « canal Gauche » duquel les composantes du son provenant de la droite, de l’avant et de l’arrière ont été sensiblement supprimées.
uans un mode de mise en œuvre alternatif i invention comporte six micros pour intégrer la composante Z du format ambisonique.
Dans des modes de mise en œuvre alternatifs, l’ordre R du format ambisonique est supérieur ou égal à 2, et le nombre de microphones est adapté 5 pour intégrer l’ensemble des composantes du format ambisonique. Par exemple, pour un ordre R égal à deux, dix-huit microphones sont mis en œuvre pour former les neuf composantes du format ambisonique correspondant. Les filtres RIF appliqués aux signaux captés sont adaptés en conséquence, notamment, l’angle d’incidence θ considéré pour chaque filtre est adapté afin d’éliminer sur chacun 10 des signaux les composantes sonores issues de directions de l’espace non désirées.
Par exemple, en référence à la figure 7, un angle φ entre une direction Y portée par les microphones Mi et M2 et une direction X’ portée par les microphones M3 et M4 est strictement inférieur à 90°. 15 Dans ce mode de mise en œuvre, le filtre appliqué au signal enregistré par M3 et soustrait au signal capté par Mi est donné par : = Η1(Ζ,θ=φ) 13( } Η3(Ζ,Θ = φ)
De cette manière, on obtient après soustraction du signal filtré au signal 20 capté par Mi un signal amélioré duquel la composante sonore selon la direction X’ a été supprimée.
On peut ainsi créer un format ambisonique d’ordre supérieur ou égal à deux en rajoutant par exemple des microphones dans les directions telles que φ = 45°,φ = 90° oucp = 135°. 25
La présente invention se rapporte également à un système de traitement du signal sonore, comportant des moyens pour : - capter de façon synchrone un signal sonore d’entrée Sentrée à l’aide de N microphones, N étant un entier naturel supérieur ou égal à deux ;
30 - encoder ledit signal sonore d’entrée Sentrée en un format de données D de son de type ambisonique d’ordre R, R étant un entier naturel supérieur ou égal a un, lesaits moyens étant mis en oeuvre a i aide ae filtres de type RIF et de filtres RII de type « peak » ; - restituer un signal sonore de sortie Ssortie à l’aide d’un traitement numérique desdites données D de son. 5
Ce système de traitement du signal sonore comprend au moins une unité de calcul et une unité de mémoire. L’invention est décrite dans ce qui précède à titre d’exemple. Celui-ci n’est 10 pas limitatif de l’invention.
Un filtre Gg(Z) de type RII est ensuite appliqué pour corriger les artéfacts nés des opérations de filtrage par filtres RIF.
On obtient à l’issue de cette étape le signal corrigé YG.
Des traitements similaires peuvent être appliqués aux signaux des canaux Droit, Avant et Arrière, pour obtenir respectivement les signaux corrigés YD, Xav, Xar.
La figure 7 décrit la sous-étape 122 de création du format ambisonique dans le mode de mise en oeuvre à quatre microphones décrit ci-avant.
Pour obtenir la composante omnidirectionnelle W du signal sonore, les signaux corrigés Yd, Yg, Xav, Xar sont sommés puis le résultat est normalisé par multiplication par un gain Kw égal à un quart :
+ Xp + ^AV + %AR ~ 4
Sur la base de la convention selon laquelle la composante Y est positive si le son vient essentiellement de la gauche, la composante sonore Gauche-Droite est obtenue en soustrayant du signal corrigé Yg associé au canal Gauche le signal corrigé Yd associé au « canal Droit >>. Le résultat est normalisé par multiplication par le facteur Κγ égal à un demi : 2
Sur la base de la convention selon laquelle la composante X est positive si le son vient essentiellement de l'avant, la composante sonore Avant-Arrière est obtenue en soustrayant du signal corrigé Xav associé au canal Avant le signal corrigé Xar associé au canal Arrière. Le résultat est normalisé par multiplication par le facteur Κχ égal à un demi :
v _ XAV ~ XAR X~ 2

Claims (8)

  1. HtVtNUlUA I I U N ο
    1. Procédé (100) de traitement du signal sonore caractérisé en ce qu’il comporte les étapes suivantes : captation (110) synchrone d’un signal sonore d’entrée Sentrée à l’aide de N microphones omnidirectionnels, N étant un entier naturel supérieur ou égal à 5 deux ; encodage (120) dudit signal sonore d’entrée Sentrée en un format de données D de son de type ambisonique d’ordre R, R étant un entier naturel supérieur ou égal à un, ladite étape d’encodage comprenant une sous-étape (121) d’optimisation de directivité réalisée à l’aide de filtres de type filtre à Réponse 10 Impulsionnelle Finie RIF et ladite étape d’encodage comprenant une sous-étape (122) de création d’un signal sonore de sortie Ssortie au format ambisonique à partir de signaux améliorés issus de la sous-étape (121) d’optimisation de directivité ; restitution (130) du signal sonore de sortie Ssortie à l’aide d’un 15 traitement numérique desdites données D de son ; et en ce que, au cours de la sous-étape (121) d’optimisation de directivité, il est soustrait à chacun des signaux captés par les microphones les signaux captés par les N-1 autres microphones filtrés chacun par un filtre RIF, pour obtenir N signaux améliorés. 20
  2. 2. Procédé (100) selon la revendication 1 caractérisé en ce que les N microphones omnidirectionnels sont intégrés à un dispositif (1). 3. Procédé (100) de traitement du signal sonore selon la revendication 1 ou 25 la revendication 2 caractérisé en ce que le filtre RIF appliqué au cours de la sous- étape (121) d’optimisation de directivité à chaque signal capté est égal au rapport de la transformée en Z de la réponse impulsionnelle du microphone associé au signal objet de la soustraction sur la transformée en Z de la réponse impulsionnelle du microphone associé au signal à filtrer puis soustraire, pour un 30 angle d’incidence associé à une direction à supprimer. 4. troceae (îuu; ae traitement au signai sonore selon i une quelconque aes revendications précédentes caractérisé en ce que les microphones sont disposés selon un cercle sur un plan, espacés suivant un angle égal à 360°/N.
  3. 5. Procédé (100) de traitement du signal sonore selon la revendication 4 caractérisé en ce qu’il met en oeuvre quatre microphones espacés suivant un angle de 90° à l’horizontal.
  4. 6. Procédé (100) de traitement du signal sonore selon la revendication 2 10 caractérisé en ce que le dispositif (1) est un smartphone et en ce que ledit procédé met en oeuvre deux microphones placés chacun sur un bord latéral dudit smartphone.
  5. 7. Procédé (100) de traitement du signal sonore selon l’une quelconque des 15 revendications précédentes caractérisé en ce que au moins un filtre à Réponse Impulsionnelle Infinie RII est appliqué à chacun des signaux améliorés lors de la sous-étape (121) d’optimisation de directivité afin de corriger les artéfacts produits par les opérations de filtrage à l’aide de filtres RIF.
  6. 8. Procédé (100) de traitement du signal sonore selon la revendication 7 caractérisé en ce que l’au moins un filtre RII est un filtre de type « peak », dont une fréquence centrale fc, un facteur de qualité Q et un gain Gjb en décibels sont paramétrables pour compenser les artéfacts.
  7. 9. Procédé (100) de traitement du signal sonore selon l’une quelconque des revendications précédentes caractérisé en ce que l’ordre R du format de type ambisonique est égal à un.
  8. 10. Procédé (100) de traitement du signal sonore selon l’une quelconque 30 des revendications précédentes caractérisé en ce que la création (122) du signal de sortie au format ambisonique est réalisée par opérations algébriques réalisées sur les signaux améliorés issus de la sous-étape (121) d’optimisation de directivité pour créer les différents canaux dudit format ambisonique. 11. bysteme ae traitement au signai sonore pour la mise en oeuvre au procédé selon l’une quelconque des revendications 1 à 10, comportant des moyens pour : capter de manière synchrone un signal sonore d’entrée Sentrée à 5 l’aide de N microphones, N étant un entier naturel supérieur ou égal à deux ; encoder ledit signal sonore d’entrée en un format de données D de son de type ambisonique d’ordre R, R étant un entier naturel supérieur ou égal à un ; restituer un signal sonore de sortie à l’aide d’un traitement numérique 10 desdites données D de son ; ledit système de traitement du signal sonore étant caractérisé en ce qu’il comporte des moyens comprenant des filtres à Réponse Impulsionnelle Finie pour filtrer chacun des signaux captés par les microphones et les soustraire à chacun des autres signaux originaux non filtrés pour obtenir N signaux améliorés.
FR1757191A 2017-07-28 2017-07-28 Procede et systeme de traitement d'un signal audio incluant un encodage au format ambisonique Active FR3069693B1 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
FR1757191A FR3069693B1 (fr) 2017-07-28 2017-07-28 Procede et systeme de traitement d'un signal audio incluant un encodage au format ambisonique
PCT/EP2018/069402 WO2019020437A1 (fr) 2017-07-28 2018-07-17 Procédé et système de traitement d'un signal audio incluant un encodage au format ambisonique
US16/634,193 US11432092B2 (en) 2017-07-28 2018-07-17 Method and system for processing an audio signal including ambisonic encoding
DE112018003843.2T DE112018003843T5 (de) 2017-07-28 2018-07-17 Verfahren und system zur verarbeitung eines audio-signals, eine codierung im ambisonics-format beinhaltend

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1757191A FR3069693B1 (fr) 2017-07-28 2017-07-28 Procede et systeme de traitement d'un signal audio incluant un encodage au format ambisonique
FR1757191 2017-07-28

Publications (2)

Publication Number Publication Date
FR3069693A1 FR3069693A1 (fr) 2019-02-01
FR3069693B1 true FR3069693B1 (fr) 2019-08-30

Family

ID=60020095

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1757191A Active FR3069693B1 (fr) 2017-07-28 2017-07-28 Procede et systeme de traitement d'un signal audio incluant un encodage au format ambisonique

Country Status (4)

Country Link
US (1) US11432092B2 (fr)
DE (1) DE112018003843T5 (fr)
FR (1) FR3069693B1 (fr)
WO (1) WO2019020437A1 (fr)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2448289A1 (fr) * 2010-10-28 2012-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Appareil et procédé de dérivation dýinformations directionnelles et systèmes
US9241228B2 (en) * 2011-12-29 2016-01-19 Stmicroelectronics Asia Pacific Pte. Ltd. Adaptive self-calibration of small microphone array by soundfield approximation and frequency domain magnitude equalization
US10356514B2 (en) * 2016-06-15 2019-07-16 Mh Acoustics, Llc Spatial encoding directional microphone array

Also Published As

Publication number Publication date
US11432092B2 (en) 2022-08-30
FR3069693A1 (fr) 2019-02-01
US20200186952A1 (en) 2020-06-11
DE112018003843T5 (de) 2020-04-16
WO2019020437A1 (fr) 2019-01-31

Similar Documents

Publication Publication Date Title
EP1563485B1 (fr) Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
EP1992198B1 (fr) Optimisation d'une spatialisation sonore binaurale a partir d'un encodage multicanal
EP2000002B1 (fr) Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme
EP1836876B1 (fr) Procédé et dispositif d'individualisation de hrtfs par modélisation
WO2007110520A1 (fr) Procede de synthese binaurale prenant en compte un effet de salle
FR2974655A1 (fr) Combine audio micro/casque comprenant des moyens de debruitage d'un signal de parole proche, notamment pour un systeme de telephonie "mains libres".
FR2995754A1 (fr) Calibration optimisee d'un systeme de restitution sonore multi haut-parleurs
EP1586220B1 (fr) Procede et dispositif de pilotage d'un ensemble de restitution a partir d'un signal multicanal
EP1886535B1 (fr) Procede pour produire une pluralite de signaux temporels
FR2903562A1 (fr) Spatialisation binaurale de donnees sonores encodees en compression.
EP1479266A2 (fr) Procede et dispositif de pilotage d'un ensemble de restitution d'un champ acoustique
EP2009891B1 (fr) Transmission de signal audio dans un système de conférence audio immersive
EP3025514B1 (fr) Spatialisation sonore avec effet de salle
FR3065137A1 (fr) Procede de spatialisation sonore
FR3069693B1 (fr) Procede et systeme de traitement d'un signal audio incluant un encodage au format ambisonique
FR2764469A1 (fr) Procede et dispositif de traitement optimise d'un signal perturbateur lors d'une prise de son
WO2005015954A2 (fr) Procede et dispositif de traitement de donnees sonores en contexte ambiophonique
WO2015055946A1 (fr) Spatialisation sonore avec effet de salle, optimisee en complexite
CA2909580A1 (fr) Procede de restitution sonore d'un signal numerique audio
EP3449643B1 (fr) Procédé et système de diffusion d'un signal audio à 360°
WO2005096268A2 (fr) Procede de traitement de donnees sonores, en particulier en contexte ambiophonique
FR3132974A1 (fr) Procede de traitement d’un signal sonore numerique
WO2009081002A1 (fr) Traitement d'un flux audio 3d en fonction d'un niveau de presence de composantes spatiales

Legal Events

Date Code Title Description
PLSC Publication of the preliminary search report

Effective date: 20190201

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 5

PLFP Fee payment

Year of fee payment: 6

PLFP Fee payment

Year of fee payment: 7