DISPOSITIF DE SAISIE ET RESTITUTION DU SON UTILISANT PLUSIEURS CAPTEURS
La présente invention concerne le domaine de la prise de sons et de restitution du son. Elle concerne en particulier un système qui peut être utilisé comme capteur de sons uniquement, ou bien, simultanément en capture et en restitution du son. Les applications visées sont:
• La prise de sons en audiovisuel . Le système permet de remplacer un ou plusieurs microphones, en garantissant une grande qualité du son capté, et en permettant des diagrammes de directivités arbitraires
(contrairement aux diagrammes de directivité des microphones analogiques qui sont obtenus par des moyens purement acoustiques et subissent donc les lois de la propagation des sons) .
• Le terminal d ' audioconférence . Le système permet d ' as surer l a capture du son
(microphones) et la restitution du son (haut- parleurs ) tout en minimisant l ' écho induit depuis le haut-parleur vers le microphone .
• Les installation de « public adresse » . La directivité du système permet de réduire fortement l ' ef fet Larsen, et donc d' améliorer le niveau d' émission du signal sonore . • Les équipements de reconnaissance de parole , dans des contextes de bureautique , de voiture , de bornes interactives... Le problème que posent les dispositif s de l ' art antérieur provient de 1 ' inhomogénéité de la courbe spatiale de
sensibilité, ainsi que de la difficulté à adapter la courbe de sensibilité aux déplacements de la source sonore. ~
On a proposé dans l'art antérieur une solution décrite dans le brevet français FR2728753 décrivant un dispositif de prise de son associé à un système de pointage pour améliorer les conditions d'acquisition des capteurs.
Cette solution s'avère coûteuse et difficile à mettre en œuvre.
L'invention vise à remédier aux problèmes susvisés par une solution efficace ne nécessitant pas de solution de pointage .
A cet effet, l'invention concerne selon son acception la plus générale un système de traitement d'un signal sonore comportant un amplificateur, un circuit de conversion analogique-numérique ou un circuit de conversion numérique-analogique, un circuit de filtrage, des éléments de traitement d'extrémités et un circuit de sommation des signaux filtrés, de manière à délivrer au moins un signal de sortie, lesdits éléments de traitement d'extrémités étant des capteurs sonores ou des haut-parleurs, caractérisé en ce que le circuit de filtrage est optimisé en fonction des caractéristiques propres des éléments de traitement d'extrémités et en fonction de leur implantation géométrique et en ce qu'il comporte au moins un lobe directif et un circuit de sortie délivrant un signal de sortie par lobe directif.
Selon une variante, le système de traitement est un système d'acquisition d'un signal sonore et en ce que les éléments de traitement d'extrémités sont des capteurs sonores. Avantageusement, les capteurs sonores sont répartis selon une pluralité d'axes concentriques.
De préférence, les capteurs sonores sont répartis selon une pluralité d'axes coplanaires .
Selon un mode de mise en œuvre particulier, les capteurs sonores sont répartis selon trois axes formant un angle de 120° entre eux.
Selon un autre mode de mise en œuvre particulier, les capteurs sonores sont répartis selon cinq axes orientés respectivement avec un angle de 0°, ± 30°, ± 110° par rapport à un axe de référence .
Selon une variante, le circuit de sortie délivre plusieurs signaux de sortie correspondant chacun à un lobe directif, ces différents signaux de sortie étant recomposés pour former un signal unique correspondant à la somme des signaux directifs pondérés par l'énergie du lobe correspondant .
Avantageusement, le circuit de sortie délivre plusieurs signaux de sortie correspondant chacun à un lobe directif, ces différents signaux de sortie étant recomposés pour former un signal unique correspondant à :
S(f)= ,e (f)SH(/)+ Ln+W (f)Sn+l(f)
OÙ : S(f) désigne l'amplitude du signal de sortie en fonction de la fréquence
Lnθ(f) désigne un facteur de pondération fonction de l'identifiant du premier lobe, et de l'angle de la source,
Ln+1/Θ(f) désigne un facteur de pondération fonction de l'identifiant du deuxième lobe, et de l'angle de la source,
Sn(f) désigne l'amplitude du signal du premier lobe
Sn+1(f) désigne l'amplitude du signal du deuxième lobe.
Selon un mode de mise en œuvre particulier, le circuit de sortie délivre plusieurs signaux de sortie correspondant chacun à un lobe directif, ces différents signaux de sortie étant chacun interprétés de manière différenciée sans recomposition.
Selon une variante, le système de traitement est un système de restitution d'un signal sonore et en ce que les éléments de traitement d'extrémités sont des haut-parleurs .
De préférence, les haut-parleurs sont répartis selon une pluralité d'axes concentriques.
Avantageusement, les haut-parleurs sont répartis selon une pluralité d'axes coplanaires .
Selon un mode de mise en œuvre particulier, les haut-parleurs sont répartis selon trois axes formant un angle de 120° entre eux.
Selon un autre mode de mise en œuvre particulier, les haut-parleurs sont répartis selon cinq axes orientés respectivement avec un angle de 0°, ± 30°, ± 110° par rapport à un axe de référence. Avantageusement, le circuit de sortie diffuse plusieurs signaux de sortie correspondant chacun à un lobe directif, chaque signal de sortie étant diffusé dans son lobe directif .
Selon une variante, le système de traitement est un système d'acquisition et de restitution du son, en ce que les éléments de traitement d'extrémités sont des haut-parleurs ou des capteurs sonores et en ce qu'il comporte des filtres d'acquisition et des filtres de restitution.
Avantageusement, ce que les filtres d'acquisition sont optimisés pour ne pas recevoir le signal émis par les haut-parleurs et en ce que les filtres de restitution sont optimisés pour ne pas envoyer de signal sur les capteurs sonores .
De préférence , la géométrie des haut-parleurs est positionnée sur un axe perpendiculaire au plan des capteurs sonores .
Avantageusement , les capteurs sonores sont placés sur des hyperboles situées dans des plans verticaux.
L'invention sera mieux comprise à la lecture de la description qui suit, concernant un mode de réalisation non limitatif de l'invention, se référant aux dessins annexés où :
- la figure 1 représente une vue schématique du placement logarithmique des capteurs sur une droite ;
- la figure 2 représente une vue schématique du placement des capteurs sur un ensemble de droites issues d'une origine commune ; - la figure 3 représente une vue schématique du placement des haut-parleurs relativement aux microphones
- la figure 4 représente une vue schématique du placement des capteurs sur une hyperbole ;
- la figure 5 représente une vue schématique d'une structure du dispositif d'acquisition avec une seule voie de sortie ;
- la figure 6 représente une vue schématique d'une structure du dispositif d'acquisition avec plusieurs voies de sortie ; - la figure 7 représente une vue schématique d'une structure du dispositif de sélection des voies par l'énergie ;
- la figure 8 représente une vue schématique d'une structure du dispositif de sélection des voies par la position ; - la figure 9 représente une vue schématique d'une structure du dispositif de restitution ;
- la figure 10 représente une vue schématique d'une structure du dispositif complet avec acquisition sur une voie et restitution ; - la figure 11 représente une vue schématique d'une structure du dispositif complet avec acquisition sur plusieurs voies et restitution ; la figure 12 représente une vue schématique des hypothèses sur le bruit propre des capteurs ;
la figure 13 représente une vue schématique du dispositif de restitution avec plusieurs voies de sortie, chacune étant diffusée dans un lobe directif.
L'invention concerne un système pour la prise de son, ou pour la prise de son et la restitution de son. Il met en œuvre une pluralité de capteurs, notamment des microphones, formant un réseau à une, deux ou trois dimensions. Ce système est numérique et est constitué de : - une partie destinée à la prise de sons, une partie destinée à la restitution des sons, une partie assurant le couplage entre les deux parties ci-dessus. L'invention réside en particulier dans le placement de ces capteurs dans l'espace, pour former un réseau aux caractéristiques géométriques bien définies.
La partie assurant la prise de sons est représentée en figure 6 de façon schématique. Elle est constituée d'un ensemble de M capteurs (1, 11, 21, 31) . Ces capteurs sont constitués par des cellules microphoniques, par exemple à électrets fournissant un signal électrique analogique à partir du son capté. Chaque capteur est relié à un étage facultatif de pré amplification (2, 12, 22, 32), assurant également si nécessaire un filtrage passe-haut afin d'atténuer les composantes dont les fréquences se situent entre 0 Hz et la fréquence de coupure de ce filtre passe-haut, cette fréquence de coupure étant généralement comprise entre 20 Hz et 200 Hz.
Chaque préamplificateur est relié à un convertisseur analogique-numérique (3, 13, 23, 33), chargé de transformer le signal électrique analogique en une suite d'échantillons, à la cadence de Fe par seconde, chacun étant représenté par une valeur codée sur B bits (typiquement B=24 bits, mais d'autres valeurs pourraient être employées, telles que B=16 bits, B=18 bits, B=20 bits) ,
Ces convertisseurs analogique-numérique sont reliés à un circuit de type ligne à retard numérique (4, 14, 24, 34) permettant de retarder chaque signal d'un nombre fixé de périodes d'échantillonnage, le nombre pouvant a priori être différent pour chaque signal.
Chaque ligne à retard numérique est reliée à un circuit (5, 15, 25, 35) permettant de distribuer ces signaux à un ou plusieurs microprocesseurs de traitement du signal (DSP pour "Digital Signal Processor") , Chaque DSP est reliée à un circuit permettant de transmettre le signal numérique issu du DSP vers par exemple un enregistreur ou une console de mixage (ce circuit pourra par exemple être un émetteur au format AES-3) ou encore vers un réseau de télécommunications numérique (de type RNIS, ou de type TCP/IP) .
Le traitement effectué par le (ou les) DSP consiste à : filtrer par un filtre numérique, chaque signal issu d'un capteur, - additionner l'ensemble des -^signaux filtrés,
- normaliser l'amplitude du signal résultant, en le multipliant par un coefficient fixe, éventuellement filtrer le signal résultant par un filtre numérique. La structure du traitement est conforme par exemple à l'article de S.Haykin et T.Kesler, "Relation between the radiation pattern of an array and the two-dimensional discrète Fourier transform" paru dans la revue IEEE Transactions on Antennas and Propagation, Volume 23, numéro 3, pages 419-420, 1975.
La partie assurant la restitution de sons est représentée par la figure 9. Elle est constituée d'un processeur de traitement du signal (DSP) recevant le signal numérique à restituer, et fabricant à l'aide de P filtres
numériques (100, 110, 120, 130), P versions filtrées de ce signal à restituer.
Derrière chacun des filtres numériques, un circuit de type ligne à retard numérique (101, 111, 121, 131) permet de retarder chaque signal d'un nombre fixé de périodes d'échantillonnage, le nombre pouvant a priori être différent pour chaque signal.
Chaque ligne à retard numérique est reliée à un convertisseur numérique-analogique (102, 112, 122, 132) chargé de transformer la suite d'échantillons à la cadence de Fe par seconde, en un signal électrique analogique,
Les convertisseurs sont reliés à un étage facultatif d'amplification (103, 113, 123, 133) .
Chacun des amplificateurs est relié à un haut- parleurs fournissant un son à partir du signal électrique analogique.
La partie assurant la restitution des sons est présentée en figure 13 dans une variante qui permet à plusieurs signaux d'être diffusés simultanément, chacun d'eux étant diffusé dans un lobe directif qui lui est propre. Dans cette figure, 3 signaux différents sont représentés à titre d'exemple, mais le dispositif peut être réalisé avec un nombre quelconque de signaux d'entrée. Ce nombre sera en général inférieur au nombre P des haut-parleurs (dans le cas contraire, les lobes directifs se recouvriraient partiellement). L'étage d'amplification (103, 113, 123, 133) n'est plus facultatif, et de plus chaque amplificateur est un sommateur qui effectue la somme des signaux présents sur ses entrées et amplifie cette somme. Le signal 1 à restituer est reçu par un processeur de traitement du signal (DSP) qui le traite comme dans le cas de la figure 9. Le DSP fabrique à l'aide des P filtres numériques (100, 110, 120, 130) les P versions filtrées du signal 1 à restituer. Ces versions filtrées sont retardées par
un circuit de type ligne à retard numérique (101, 111, 121, 131) . Elles sont ensuite transformées en signal électrique analogique par les convertisseurs (102, 112, 122, 132) et ces signaux électriques sont fournis à l'une des entrées des amplificateurs (103, 113, 123, 133) effectuant la somme de leurs entrées.
Le signal 2 à restituer est traité dans une structure analogue : P filtres numériques (200, 210, 220, 230) fabriquent les P versions qui sont retardées dans les lignes à retard numériques (201, 211, 221, 231) , puis converties en signaux électriques analogiques par les convertisseurs (202, 212, 222, 232) et présentées à l'entrée des amplificateurs (103, 113, 123, 133) .
Il en est de même du signal 3 à restituer qui est traité dans une structure analogue : P filtres numériques (300, 310, 320, 330) fabriquent les P versions qui sont retardées dans les lignes à retard numériques (301, 311, 321, 331) , puis converties en signal électrique analogique par les convertisseurs (302, 312, 322, 332) et présentées à l'entrée des amplificateurs (103, 113, 123, 133).
Les positions des capteurs doivent respecter deux contraintes contradictoires, et le placement des capteurs résultera d'un compromis entre ces contraintes. Tout d'abord, il est souhaitable que l'espacement entre les capteurs soit de la moitié de la plus petite longueur d'onde
Exemple : si la fréquence maximale présente dans le signal est f = l kHz, et si la célérité du son est de C= 336 m/s, alors la longueur d'onde minimale est \ = Qlf = 0.048 - L'espacement minimal entre capteurs sera de 0.024 m pour une direction de visée orthogonale à l'axe portant les capteurs, et de 0.012 m pour une direction de visée dans l'axe des capteurs. Ces espacements sont indicatifs et pourront être modifiés en fonction de contraintes liées à la taille physique des capteurs utilisés.
Il est souhaitable que les capteurs soient les plus écartés possible, afin de garantir une résolution spatiale la meilleure possible. Typiquement, il faudrait que les capteurs couvrent un espace dont la taille soit plusieurs fois la longueur d'onde la plus grande dans le signal.
Exemple : si la fréquence minimale présente dans le signal est
336 m/s, alors la longueur d'onde minimale est λ = C//= 3.36 m. La taille minimale du réseau de capteurs sera de 3.36 m. Une telle taille sera souvent incompatible avec les contraintes réelles de l'application. Ceci conduit à une répartition logarithmique des capteurs .
La figure 1 représente un premier exemple de placement de capteurs selon un axe pour former un réseau mono dimensionnel. L'écartement de deux microphones consécutifs (1 à M) obéit à une loi de progression logarithmique.
Nous supposons ici que les capteurs sont situés sur un axe unique, le capteur m est situé à la distance d-, de l'origine (par convention, on peut poser que cette origine se situe sur le capteur 1, ce qui changera ces distances, mais ne changera pas les écartements em = dm+1 -dm pour tn e [l, —1J) . On placera les capteurs de manière telle que le rapport entre deux espacements successifs soit constant :
≤sϋ≈α Avec la convention que l'origine soit au capteur 0
{ d =0 =$ el = d2) , l'espacement entre les deux premiers capteurs sera :
„ _ min Ci —
1 2 La taille du réseau étant donnée par la distance du capteur numéroté M au premier (numéroté 1) , les espacements entre les capteurs devront donc satisfaire la contrainte :
-l dM = é =l
Le tableau ci-dessous illustre un exemple numérique de placement de 8 capteurs avec un rapport 01 = 1.25 et un espacement de 1 cm entre les 2 premiers capteurs .
Numéro du Ecart Position capteur (cm) (cm)
1 1.00 0.00
2 1.25 1.00
3 1.56 2.25
4 1.95 3.81
5 2.44 5.77
6 3.05 8.21
7 3.81 11.26
8 4.77 15.07
Une variante de réalisation efficace du dispositif comporte un placement optimisé des capteurs. Nous proposons que les capteurs microphoniques soient situés sur un ensemble de rayons à partir d'un point d'origine.
La figure 2 montre le placement des capteurs dans cette configuration. Deux exemples sont illustrés (12 capteurs répartis sur 3 rayons, et 16 capteurs répartis sur 5 rayons, avec un capteur au centre) . Le premier exemple peut permettre de former 6 voies pointant dans les directions 0°, 60°, 120°, 180°, 240° et 300°. Le deuxième exemple peut permettre de former 5 voies pointant vers les directions 0°, 30°, 110°, 250°
et 330°, qui sont les directions privilégiées pour la restitution de signaux Surround, ou 5.1.
Une autre réalisation possible du dispositif consiste à placer les capteurs sur un cercle ou sur plusieurs cercles concentriques. On pourra alors choisir de les répartir de manière uniforme sur chaque cercle. Ainsi si nous avons Q cercles, et si le cercle q compte Mq capteurs, l'écart angulaire entre deux capteurs successifs sur ce cercle sera constant et égal à :
2π
Les haut -parleurs sont situés sur un rayon à partir d'un point d'origine. On choisira avantageusement une origine commune pour les rayons portant les capteurs microphoniques, et pour le rayon portant les haut -parleurs . La figure 3 montre le placement des capteurs dans cette configuration.
Les capteurs microphoniques peuvent aussi se trouver sur des hyperboles. Dans le cas où le nombre de haut- parleurs est P=2, chaque capteur peut se situer de manière telle que la différence entre la distance dx du capteur au haut-parleur 1 et la distance d2 du capteur au haut-parleur 2 est égale à une constante (identique pour tous les capteurs) notée δ : d1-d2=δ Les capteurs sont alors situés sur un hyperboloïde dont les haut-parleurs 1 et 2 constituent les foyers. Pour simplifier la construction du dispositif, on peut aussi, dans ce cas, placer les capteurs sur des plans contenant les deux haut -parleurs . La figure 4 illustre le placement des capteurs dans cette configuration. Les deux haut-parleurs hx et h2 sont situés sur une droite verticale. Les capteurs cx et suivants (dans ce dessin, cx à c6) sont placés à la fois sur un plan passant par
la droite verticale portant les deux haut -parleurs, et dans ce plan, sur l'hyperbole de foyers hx et h2 , telle que soit respectée la condition d1-d2=Ô. D'autres capteurs (non numérotés sur la figure) peuvent se situer sur une ou plusieurs autres hyperboles identiques, situées dans d'autres plans verticaux passant par les deux haut -parleurs .
SAISIE DU SON POUR UNE SEULE VOIE DE SORTIE La structure de traitement dans la saisie du son avec une seule voie de sortie est représentée sur la figure 5. En sortie des convertisseurs analogique-numérique, les signaux des M microphones sont notés xm(t) . Après les lignes à retard, ils deviennent :
:Vm( = m(*-τm),me [1, ].
Chaque filtre numérique (filtre à réponse impulsionnelle finie de longueur L) s'écrit :
4=0
En sortie du traitement, le signal unique s'écrit
M s(t) = ∑zm(t). m=\
Pour effectuer l'optimisation des filtres, il est utile de formuler ces traitements dans le domaine des fréquences .
Nous remplaçons ici les signaux temporels par leurs transformées de Fourier : xm(t)→Xm(/) ym(t)→Ym() zm(t)→zm(/) s(t)→S(/)
Les signaux reçus Xm(f) sont d'abord retardés pour donner les signaux Ym(f) qui sont ensuite filtrés pour donner
les signaux Zm(f) ; ces derniers sont alors sommés pour donner la sortie S(f) :
Ym=X f)eJ2πfτm
Zm(f) = Hm(f)YAf)>
M S(f) = ∑Zm(f). ro=l
Nous pouvons condenser ces expressions dans l'expression suivante :
M
S(f) = ∑Hm(f)e-iZπ^Xm(f). m=l
Les retards numériques peuvent être fixés arbitrairement. Une réalisation efficace consiste à les choisir comme la partie entière du quotient du retard (par rapport au capteur de référence, pour la direction de référence) sur la période d'échantillonnage Optimisation des filtres La procédure d'optimisation des filtres que nous présentons ici se décompose en plusieurs phases :
- identification des réponses du canal acoustique entre une source visée et les capteurs
- optimisation dans le domaine des fréquences des paramètres des filtres, garantissant une réponse donnée pour la source visée, minimisant l'énergie du diagramme de directivité hors du lobe principal, sous deux contraintes d'inégalité, l'une sur le diagramme de directivité sous le lobe, l'autre sur le gain en bruit propre des capteurs - optimisation dans le domaine temporel des coefficients du filtre approchant au mieux les réponses en fréquence trouvées à 1 ' étape précédente .
Ces étapes sont détaillées ci-dessous. Caractérisation acoustique Pour l'optimisation, il est nécessaire d'identifier un certain nombre de réponses impulsionnelles de canaux
acoustiques. Une technique possible consiste à placer un haut- parleur à l'endroit de la source, émettre une séquence binaire pseudo-aléatoire, recueillir le signal sur le capteur, calculer l' intercorrélation entre la séquence binaire pseudo- aléatoire et le signal recueilli. L' intercorrélation constitue alors une mesure de la réponse impulsionnelle cherchée. CRITERE D'OPTIMISATION EN FREQUENCE
L'optimisation des filtres se fait à partir d'un ensemble de directions : - la direction de la source visée,
- les directions des sources qui se situent à l'intérieur d'un voisinage, ce sont les directions qui définissent le lobe principal du diagramme de directivité ;
- les directions des sources à rejeter, (il importe que le cardinal de cet ensemble soit supérieur au nombre de capteurs) .
Si une source se trouve dans une des directions du voisinage, elle sera reçue avec un gain voisin de 1 (en général légèrement inférieur à 1) . Si une source se trouve dans une des directions à rejeter, elle sera traitée de manière à avoir un gain très faible.
Nous définissons également une fréquence de référence; en dessous de cette fréquence, l'optimisation se fera sans contraintes sur l'ensemble de voisinage, alors qu'au-dessus de cette fréquence, nous introduirons une contrainte supplémentaire sur les directions des sources à rejeter.
Contrainte dans la direction de visée
L'optimisation des filtres se fait sous la contrainte que le diagramme de directivité ait pour valeur 1 dans la direction de la source visée.
MINIMISATION DES LOBES SECONDAIRES
Notre critère d'optimisation des filtres repose sur l'élimination des signaux qui se situent en dehors de la zone
de l'espace où se situera le lobe principal du réseau. Cette zone est définie a priori. Elle sera fonction des spécifications de l'application. Pour rejeter au maximum les sources qui se situent dans ces directions, nous minimisons la somme des carrés des amplitudes du diagramme de directivité dans ces directions.
CONTRAINTES DANS LE LOBE PRINCIPAL
Pour l'ensemble des directions se situant dans le lobe principal, lorsque la fréquence se situe au-dessus de la fréquence de référence, nous imposerons un ensemble de contraintes d'inégalités.
L'objet de ces contraintes est de permettre au diagramme de directivité de garder une forme constante pour toutes les fréquences au-dessus de la fréquence de référence. Sans cette contrainte, la minimisâtion du critère J conduirait à des valeurs du diagramme de directivité qui seraient supérieures à 1 pour les directions dans la région.
CONTRAINTE SUR LE GAIN EN BRUIT PROPRE
Les capteurs sont tous affectés par un bruit, dit bruit propre, qui provient du fonctionnement du capteur lui- même et non des sons captés. Les traitements que subissent les signaux captés dans notre dispositif risquent d'augmenter le niveau du bruit propre des capteurs. Nous devons contrôler ce niveau, en fixant une valeur maximale pour le gain d'amplification du bruit propre des capteurs.
Pour calculer le gain en bruit propre du dispositif, nous devons supposer que nous recevons d'une part un signal utile venant d'une source dans la direction de θ et d'autre part le bruit propre des capteurs. Cette situation est résumée par la Figure 12.
Le signal reçu est la somme de deux signaux, celui correspondant à la source Yu(f) et celui correspondant au bruit B(£)
Y(f)= Yh(f) + Yu(f) .
Le signal reçu de la source utile s'exprime comme le signal U(f) se propageant dans le canal dont la réponse en fréquence est Cθ(f), puis amplifié par le gain des capteurs
G(/) et enfin retardé sur chaque capteur, ce que représente la matrice V(f), avant d'être traité par les filtres H(f) :
Yu(f)=H(f)HV(f)G(f)Cθ(f)U(f)
Le bruit propre des capteurs ne se propage pas dans le canal acoustique, étant né à l'intérieur du capteur, mais il est lui aussi amplifié par le gain des capteurs, retardé sur chaque capteur, ce que représente la matrice V(f), avant d'être traité par les filtres H(f).
SAISIE DU SON AVEC PLUSIEURS VOIES DE SORTIE Structure
Les voies de sortie sont indexées par n e [1, N] . Pour fabriquer la sortie Sπ(t), on applique les retards τn> m ; après les lignes à retard, les signaux captés deviennent : yn,m(t)=xm(t-n, m ) m e [1, M] , n e [l, N] . Chaque signal yn,m(t), m e [1, M] , n e [1, N] est filtré par un filtre numérique (filtre à réponse impulsionnelle finie de longueur L) et le résultat s'écrit :
En sortie du traitement, le signal de la voie de sortie n s'écrit :
Cette structure de traitement est représentée sur la figure 6.
Sélection des voies de sortie
Lorsque l'acquisition se fait sur N voies en parallèle, on extrait de ces N voies une voie unique qui sera le signal sortant du dispositif (par exemple dans une
application de vidéoconférence ou d' audioconférence, ce sera le signal qui après compression sera expédié vers le correspondant lointain) .
Nous envisageons ici deux variantes, qui reposent pour l'une sur la sélection de la combinaison de signaux donnant le maximum d'énergie en sortie, pour l'autre sur l'identification de la direction d'arrivée du signal dominant suivi par la construction du signal de sortie correspondant (par pondération entre deux des N sorties) .
Sélection par optimisation de l'énergie en sortie L'objectif est de reconstruire un signal s(t) par combinaison linéaire entre les signaux sn(t), n e [1, N] . La combinaison retenue sera notée :
N s(t) = ∑wn(f)sn(t)
Dans cette écriture, les poids wn (t) qui affectent chacun des N signaux sn(t) , n e [1, N] sont variables au cours du temps. Pour déterminer à chaque instant les poids optimaux, nous maximisons le critère :
MinW.τRtWt , w, dans lequel la matrice Rt est la covariance des JV signaux sn(t) , n e [1, N] . , réunis dans le vecteur St :
et le vecteur W
t regroupe les poids
n(t)
La minimisation se fait sous la contrainte que le vecteur Wt ait une norme égale à 1.
Nous minimisons ce critère de manière récursive , par un algorithme de gradient , qui nous fournit une estimation Wt+1 non normalisée :
Wt+i = Wt +μ Grac^ W RAW, , avec GradwWt τRtWt = 2RtWt , soit encore : Wt+1 = Wt + 2μ RtWt .
Une autre estimation du gradient s ' obtient en remplaçant la matrice R
t par une estimation instantanée, ce qui conduit à :
soit encore W
t+l =W
t + 2μ S
ts(t)
Nous normaliserons ensuite l ' estimation Wt+1 pour obtenir l ' estimation de Wt+1 :
Cette structure de traitement est représentée sur la figure 7.
Sélection par identification de la position de la source .
L'identification de la position de la source peut se faire par des méthodes classiques, par exemple celle présentée par Y. Grenier, P.Loubaton, «Localisation de sources large bande par des méthodes temporelles», 12ème Colloque sur le Traitement du signal et ses Applications, GRETSI, Juan-les- Pins, pp 457-460, 1989. A chaque voie de sortie est associée une direction
(en général la direction dans laquelle le niveau de réception est maximal) . Si nous supposons que la direction θ de la source se trouve entre les directions associées aux voies n et (n-t-1), la source sera reçue sur ces deux voies avec des gains respectifs qui dépendent du diagramme de directivité en θ des deux voies de réception, selon les deux équations ci-dessous : Sn(f) = Gnβ(f)E(f) et S,1+1(/)= < /)E(/) .
Ceci peut encore s'écrire sous forme matricielle
Si nous recherchons un signal de sortie S( ) qui s'approche au mieux du signal E(f) émis par la source, il est naturel de chercher à minimiser l'énergie de l'écart entre les signaux observés, et ceux que devrait donner ce signal S(f) , c'est-à-dire minimiser la quantité :
La solution se calcule comme étant
expression dans laquelle A
H désigne le conjugué transposé de la matrice A . Cette expression peut aussi s'écrire (en posant que A
* est le conjugué de A ) :
S( f) _ GnS(f)*Sn(f) + Gn+w(f)*Sn+1(f)
Gn,θ(f)*Gnβ(f) + Gn+lθ(f)*Gn+lβ(f) ' soit encore
S(f) = nβ (f)Sn (f) + Ln+lβ (f)Sn+1 (f)
Cette dernière expression suggère que les fonctions
Î,Θ( )
et i
+ι,θ(/) soient tabulées pour un ensemble de valeurs de θ réparties régulièrement entre 0 et 2π radians. Plus précisément, on tabulera l
n>θ(t) et ^
+ι,e( qui sont les transformées de Fourier inverses respectives de L
n θ(f) et
-'n+l.θ (/) •
Cette structure de traitement est représentée sur la figure 8 .
Une version simplifiée s'obtient en supposant que les fonctions Lnβ(f) et Ln+l θ(f) sont indépendantes de " la f équence et réduites à deux gains Lnβ et Ln+lθ . La minimisation du critère se fait alors sur la totalité des fréquences et non plus fréquence par fréquence. Les deux gains sont alors solution de :
RESTITUTION DU SON Structure
Le signal à restituer s'écrit : r(t) . On en fabrique P versions décalées, notées up(t),p e [l,P] et avec des retards τ ~p ' up(t) = r(t- ïp), p e [1,P].
Ces signaux sont ensuite filtrés et les résultats de ces filtrages, notés vp(t) seront ensuite restitués par les haut-parleurs (après conversion numérique-analogique) :
L-\ vp(t) = ∑gp(k)up(t-k), p e [l,P] k=0
Cette structure de traitement est représentée sur la figure 9.
Diagramme de directivité
Pour obtenir le diagramme de directivité en res t i tut ion , nous procédons comme dans le cas de l ' acqui si tion . Nous remplaçons les signaux par leurs transformées de Fourier : r(t)→R(/) , up(t)→Up(f) , vp(t)→Vp(f) ,
rθ(t)→Rθ(f).
Le signal à restituer R(/) est converti en P versions décalées Up(f), qui sont ensuite filtrées pour donner les signaux V (/) qui seront restitués. En un point dont la position est repérée par θ, le signal reçu Rθ(f) est la somme des contributions de ces P signaux restitués filtrés par le canal acoustique correspondant Cpθ(f) (canal entre le haut- parleur p et le point de mesure à la position θ) :
h{f) = ∑Cpβ(f)Vp(f), p=l soit en revenant aux signaux décalés, avant filtrage, Up(f) :
W) = ∑Cptθ(f)Hp(f)Up(f), p=l puis en revenant au signal à restituer R(/) :
Re(f) = ∑Cptθ(f)Hp(f J2πfî>R(f) .
Critère d'optimisation en fréquence (restitution) L'optimisation du dispositif de restitution ressemble à celle du dispositif d'acquisition. Le point de départ est l'expression du diagramme de directivité :
Dθ(f) = nH(f)Ϋ(f)G(f)Cθ(f).
Où G (f) représente le gain du haut-parleur à la fréquence f. L'optimisation des filtres se fait à partir d'un ensemble de directions : la direction de restitution préférée, - les directions de restitution qui se situent à l'intérieur d'un voisinage, constitué par les
directions qui définissent le lobe principal, du diagramme de directivité, les directions des sources à rejeter, (il importe que le cardinal de cet ensemble soit supérieur au nombre de haut-parleurs) .
L'optimisation des filtres se fait sous la contrainte que le diagramme de directivité ait pour valeur 1 dans la direction de la source visée.
Minimisation des lobes secondaires
Notre critère d'optimisation des filtres repose sur l'absence de restitution des signaux en dehors de la zone de l'espace où se situera le lobe principal du réseau. Cette zone est définie a priori. Elle sera fonction des spécifications de l'application. Elle sera représentée par les directions de l'ensemble Θ2. Pour cela, on minimise la somme des carrés des amplitudes du diagramme de directivité dans ces directions. Contraintes dans le lobe principal
Pour l'ensemble des directions se situant dans le lobe principal, lorsque la fréquence f se situe au-dessus de la fréquence de référence, on impose un ensemble de contraintes d'inégalités. Nous définirons pour cela un ensemble de valeurs :
et nous imposerons :
Le choix des bornes άθ se fera en général en les rendant égales aux carrés de l'amplitude du diagramme de directivité à la fréquence de référence fr :
L'objet de ces contraintes est de permettre au diagramme de directivité de garder une forme constante pour toutes les fréquences au-dessus de la fréquence de référence.
Optimisation Nous n'imposons pas de contrainte sur le bruit des haut-parleurs, car ce bruit ne sera pas affecté par les traitements effectués, contrairement à ce qui se passait dans le cas de l'acquisition.
L'algorithme devient donc : Minimiser J=H( )ffR3H(/), sous les contraintes linéaires (f)HV(f)G(f)Cé (/)=1, auxquelles s'ajoutent, si f ≥ fr , les contraintes quadratiques :
||H(/)*N(/)G(/)C
Θ(/)||
2
θ Θ
x .
Restitution de plusieurs signaux
Lorsque plusieurs signaux sont à restituer simultanément , chacun par son lobe directif , en utilisant une structure comme celle illustrée par la figure 13 dans le cas de 3 signaux, l ' optimisation conduira pour chaque signal à un filtre H(/) . Le filtre sera optimisé indépendamment des f iltres assurant la diffusion des autres signaux . Par exemple , pour le signal K à restituer, on calculera des filtres Ηκ(f) . Pour calculer les filtres Hκ( ) on définira : - la direction de restitution préférée ,
- les directions de l ' ensemble Θ2(Â) qui représentent la zone de l ' espace en dehors du lobe principal , les directions de l ' ensemble Θι(K) dans le lobe principal et les valeurs des bornes éfô dans les directions de cet ensemble .
Il n'est pas nécessaire pour calculer les filtres Hκ() de tenir compte des autres filtres.
Grâce aux amplificateurs effectuant la somme des signaux analogiques, les diagrammes de directivité s'appliquent à chacun des signaux à restituer.
SAISIE ET RESTITUTION CONJOINTES
Annulation d'échos acoustiques
Le dispositif comportant à la fois l'acquisition et la restitution des sons, un couplage acoustique se produit entre la partie restitution et la partie acquisition. Par conséquent, le signal restitué par les haut-parleurs sera capté par les microphones. Ceci constitue le phénomène d'écho acoustique, bien décrit dans l'article de B. idrow et al., « Adaptive Noise Cancelling : Principles and Application », Proc. of IEEE, Vol .63 , n°12, pp 1692-1716, 1975. Il est y montré en particulier la possibilité d'établir un annuleur d'échos acoustiques sur la base d'un algorithme dit « LMS ». Un autre algorithme d'annulation d'écho, plus performant, a été présenté dans l'article E. Moulines, O.Ait Amrane , Y. Grenier, «The Generalized Multi-delay Adaptive Filter: Structure and Convergence Analysis.», IEEE Trans . on Signal Processing, Vol.43, n°l, pp 14-18, January 1995.
Dans notre dispositif, nous inclurons un annuleur d'écho (par exemple de l'un des types cités ci-dessus) , entre le signal à restituer et le signal capté. L' annuleur d'écho acoustique est noté AEC dans les schémas (AEC renvoie à Acoustic Echo Canceller) . La figure 10 montre une vue complète du dispositif, incluant l'acquisition du son avec une voie de sortie (comme dans la figure 5) , un bloc d'annulation d'écho acoustique, la restitution du son comme dans la figure 9, et un bloc de mixage comme dans la figure 7 ou la figure 8.
Lorsque nous effectuons l'acquisition de voie avec plusieurs sorties simultanées, il serait possible d'incorporer
le mixage entre l'acquisition et un annuleur d'écho fonctionnant sur une voie unique. Nous préférons insérer autant d' annuleurs d'échos que de voies de sortie : ces annuleurs utilisent le même signal « haut-parleur », et chacun d'eux annule l'écho de ce signal à restituer dans chacune de voies de sortie, avant de fournir ce signal débarrassé de l'écho au bloc assurant la sélection (ou le mixage) des signaux. La figure 11 montre une vue complète du dispositif, incluant l'acquisition du son avec plusieurs voies de sortie (comme dans la figure 6), un bloc d'annulation d'écho acoustique, la restitution du son comme dans la figure 9, et un bloc de mixage comme dans la figure 7 ou la figure 8.
Critères d'optimisation conjointe en fréquence Quand le dispositif réalise à la fois l'acquisition et la restitution, les deux critères sont modifiés pour tenir compte de cette situation. Ainsi, l'optimisation de l'acquisition aura un but supplémentaire : annuler les signaux captés en provenance du haut-parleur. De même, l'optimisation de la restitution aura pour but supplémentaire de ne pas restituer le signal vers les capteurs pour l'acquisition.
Notons Cm p(f) la fonction de transfert (transformée de Fourier de la réponse impulsionnelle) du canal acoustique entre le capteur m et le haut-parleur p .
Contraintes supplémentaires en acquisition Pour l'acquisition, les filtres Hm(f) devront vérifier les P contraintes suivantes :
H(f)HY(f)G(f)Cp(f) = 0,p e [1,P],
Contraintes supplémentaires en restitution
Pour la restitution, les filtres Hm(f) devront vérifier les M contraintes suivantes : H(/)*N(/)G(/)Cm(/)=0,me [1, ] ,
Le passage en temporel reste inchangé .