DISPOSITIF D'AMELIORATION DE L'INTELLIGIBILITE DE LA PAROLE DANS UN SYSTEME DE COMMUNICATION MULTI UTILISATEURS Domaine technique de l'invention L'invention est relative à un système de communication permettant de mettre en relation plusieurs utilisateurs en mode conférence, c'est-à-dire où chaque utilisateur peut parler et en même temps entendre tous les autres utilisateurs. L'invention se rapporte plus particulièrement à un dispositif d'amélioration de l'intelligibilité de la parole lorsque les utilisateurs parlent dans un environnement bruyant, par exemple un événement sportif dans un stade. État de la technique Dans un système de communication multi utilisateurs adapté à un environnement bruyant, on cherche à restituer la parole de façon intelligible et à atténuer le bruit ambiant, notamment pendant des phases muettes. En effet, si chaque terminal transmettait en permanence le bruit ambiant, chaque terminal recevrait la somme des bruits captés par tous les autres terminaux, ce problème s'aggravant lorsque le nombre d'utilisateurs augmente. Une solution bien connue pour supprimer le bruit pendant les phases muettes est celle employée par les talkies-walkies, c'est-à-dire que l'utilisateur, à l'aide d'un bouton, commute son terminal entre un mode d'émission seule et un mode de réception seule. Néanmoins, cette solution est peu adaptée quand le nombre d'utilisateurs qui peuvent prendre la parole dépasse trois, elle est contraignante car elle accapare une main, et elle ne permet pas à un utilisateur qui prend la parole d'entendre un message important que pourrait transmettre un autre utilisateur. On se tourne donc vers des systèmes de communication fonctionnant en mode conférence, où chaque terminal est capable de détecter la parole de l'utilisateur et soustraire le bruit d'ambiance du signal. La demande de brevet EP 1843326 décrit un tel système. La figure 1 représente un schéma de principe d'un terminal tel que décrit dans la demande de brevet EP 1843326. Un microphone 10 transmet le signal de parole de l'utilisateur à un amplificateur 12. Le signal est ensuite pré-filtré en 14 afin d'en retirer les composantes hors de la bande de la parole, puis converti en numérique par un convertisseur analogique/numérique 16. Le signal ainsi converti alimente un circuit de traitement de signal numérique DSP.
Le DSP est programmé pour effectuer les traitements de signal envisagés, notamment l'amélioration de l'intelligibilité de la parole. Un exemple de traitement est décrit dans la demande de brevet susmentionnée. Il implique la détection de la signature de la parole et le calcul de paramètres d'un filtre qui permet de soustraire le bruit ambiant du signal en préservant le signal de 1 o parole. Le signal sortant du DSP est acheminé vers une antenne 18 par l'intermédiaire d'un module de transmission RF 20 assurant les traitements requis pour passer du signal numérique fourni par le DSP en un signal transmissible sur l'antenne selon la norme utilisée par tous les terminaux. 15 L'antenne 18 reçoit également les signaux émis par d'autres terminaux, que le module RF 20 convertit et transmet au DSP. Ces signaux reçus sont traités par le DSP et envoyés sur un haut-parleur 22 par l'intermédiaire d'un circuit de mise en forme 24 qui se charge de la conversion numérique/analogique, filtrage, et amplification. 20 Un terminal du type de la figure 1 est efficace en termes d'intelligibilité de la parole et de la suppression du bruit, pourvu que le gain de l'amplificateur 12 soit toujours adapté au type de microphone, et que le microphone soit situé à un emplacement précis par rapport à la bouche de l'utilisateur. Tout écart peut nuire de manière rédhibitoire à l'efficacité du terminal. 25 Il est ainsi exclu d'utiliser, par exemple, un microphone cravate, avec lequel les conditions de mesure de la parole vont varier au cours du temps en fonction des mouvements de l'utilisateur et de l'orientation de sa tête. Si l'utilisateur souhaite changer de microphone, on doit lui permettre de régler le gain de l'amplificateur 12, par exemple à l'aide d'un potentiomètre. Ceci n'est 30 pas compatible avec un équipement qui se veut prêt à fonctionner à tout moment. 2947122 Résumé de l'invention II existe ainsi un besoin de terminal destiné à une utilisation en milieu bruyant, qui permette une grande liberté de placement du microphone. II existe également un besoin de permettre l'utilisation de plusieurs types de microphone 5 sans que l'utilisateur n'ait à faire de réglages. Pour satisfaire au moins un de ces besoins, on prévoit un dispositif d'amélioration de l'intelligibilité d'un signal issu d'une source soumise à un environnement bruité, ladite source imprimant une signature spécifique au signal, comprenant un circuit de traitement recevant le signal, et des moyens pour analyser le signal et paramétrer le circuit de traitement en fonction de caractéristiques de la signature présente dans le signal. Le dispositif comprend une première voie à faible distorsion véhiculant le signal de la source vers les moyens d'analyse, et une deuxième voie susceptible d'introduire une distorsion, véhiculant le signal de la source vers le circuit de traitement.
Description sommaire des dessins D'autres avantages et caractéristiques ressortiront plus clairement de la description qui va suivre de modes particuliers de réalisation donnés à titre d'exemples non limitatifs et illustrés à l'aide des dessins annexés, dans lesquels : la figure 1, précédemment décrite, représente un schéma de principe d'un terminal classique utilisable dans une communication multi utilisateurs de type conférence ; la figure 2 représente un schéma de principe d'un mode de réalisation de terminal visé dans la présente demande de brevet ; et la figure 3 représente des améliorations que l'on peut apporter au mode de réalisation de la figure 2. Description d'un mode de réalisation préféré de l'invention Dans une situation où l'on souhaite adapter une chaîne de traitement de signal à une source pouvant avoir une grande dynamique, il est courant d'utiliser un amplificateur d'entrée à gain variable dans une boucle de contre-réaction réglant le gain en fonction, par exemple, de l'enveloppe du signal. 4 Néanmoins, dans des situations où le bruit ambiant peut subir de brusques variations d'amplitude, par exemple dans un stade lors d'un événement sportif, la boucle de réglage du gain de l'amplificateur ne réagit pas de manière assez rapide pour éviter la saturation de la chaîne. (D'ailleurs, le temps de réaction de la boucle est volontairement lent pour réduire la distorsion dans des conditions d'utilisation nominales.) Il s'avère que cette solution à amplificateur à gain variable est inadaptée dans un terminal du type de la figure 1 (dans les conditions où l'on souhaite l'utiliser) pour compenser les variations d'emplacement du microphone. En effet, la saturation de la chaîne de traitement perturbe la détection de signature de la parole à tel point qu'il provoque de trop nombreuses fausses détections et par conséquent des filtrages de bruit inefficaces. Pour éviter la saturation dans de telles situations, on a souvent recours à un compresseur de dynamique, qui est un amplificateur ayant une courbe de gain non-linéaire, s'aplatissant asymptotiquement vers la limite de saturation. Néanmoins, un compresseur de dynamique introduit une telle distorsion que la détection de signature de la parole s'en trouve aussi gravement perturbée que dans le cas d'une saturation. La figure 2 représente des éléments d'un terminal incorporant un mode de réalisation de système de compensation d'emplacement de microphone. On y retrouve des mêmes éléments qu'à la figure 1, désignés par les mêmes références. Le signal issu du microphone 10 est transmis vers le DSP par une première voie incorporant l'amplificateur 12, filtre 14, et convertisseur 16 décrits en relation avec la figure 1. Le gain k de l'amplificateur 12 est choisi suffisamment petit pour que la saturation de la voie soit peu probable, ou survienne de temps en temps mais pendant de courtes durées. Ce gain k doit toutefois être suffisant pour qu'un signal de parole issu d'un microphone placé loin de la bouche soit traitable par le DSP.
En d'autres termes, on vise à ce que la première voie présente une faible distorsion sur toute la dynamique des signaux d'entrée. Dans ce cas, même si les signaux sont de faible amplitude, le DSP parviendra à détecter la signature de la parole.
Cette première voie est analysée par un processus 26 du DSP qui détecte la signature de la parole et calcule des paramètres de filtre en fonction des caractéristiques de la signature. Ces calculs peuvent être similaires à ceux décrits dans la demande de brevet EP 1843326. 5 Par ailleurs, le signal issu du microphone 10 est transmis vers un deuxième processus 28 du DSP par une deuxième voie comprenant un amplificateur 30 de gain K, un filtre 32 atténuant les fréquences hors de la bande de la parole, et un convertisseur analogique/numérique 34. Le gain K de l'amplificateur 30 est choisi de manière à produire un signal de parole audible dans la plupart des conditions. Il importe peu que la voie sature lors de crêtes du bruit ambiant, car cette voie n'est pas utilisée pour la détection de la parole. De préférence, comme cela est représenté, le gain K est variable et commandé par le processus 26 afin d'adapter au mieux l'amplitude du signal à la dynamique de la deuxième voie. Le gain est déterminé, par exemple, en fonction de l'enveloppe du signal véhiculé dans la première voie. Etant donné que les distorsions introduites par la deuxième voie n'affectent pas la fiabilité de la détection de signature, on peut également y insérer un compresseur de dynamique, par exemple incorporé dans l'amplificateur 30. Un compresseur de dynamique introduira davantage de distorsion dans les situations où la voie ne serait pas saturée, mais il a l'avantage de produire un signal plus intelligible dans les situations de saturation. Le processus 28 mis en oeuvre par le DSP sur la deuxième voie réalise un filtrage de bruit utilisant les paramètres calculés par le processus 26. Ce filtrage peut, comme dans la demande de brevet EP 1843326, consister à soustraire le bruit d'ambiance du signal, en préservant ainsi le signal de parole. La soustraction du bruit ambiant pendant les phases muettes ne parvient généralement pas à annuler totalement le signal, de sorte que les terminaux continuent à émettre un certain niveau de bruit pendant ces phases. La somme de ces bruits peut devenir non-négligeable en présence d'un grand nombre de terminaux. Cet inconvénient pourra être évité comme on le verra en relation avec la figure suivante. La figure 3 représente le dispositif de la figure 2 agrémenté de plusieurs améliorations que l'on pourra utiliser ensemble ou séparément.
Pour améliorer la situation du niveau de bruit pendant les phase muettes, on prévoit d'inhiber la sortie de la deuxième voie pendant les phases où le processus 26 ne détecte pas de signature de parole. Cette fonctionnalité est symbolisée par une porte 36 disposée dans la deuxième voie (30, 32, 34) en amont du processus de filtrage 28. Comme on l'a évoqué précédemment, un compromis doit être fait dans le choix du gain k de l'amplificateur 12 de la première voie de sorte à obtenir une amplitude de signal suffisante pour détecter une signature de parole dans le cas où le microphone est loin de la bouche, et à ne pas trop saturer la voie 1 o dans le cas où le microphone est près de la bouche. Ce compromis n'est pas difficile à satisfaire lorsque le terminal est prévu pour utiliser un seul type de microphone. Néanmoins, les utilisateurs peuvent souhaiter utiliser des types de microphone différents, qui diffèrent notamment par leur sensibilité. Dans ce cas, un compromis pour le gain k est plus difficile à 15 trouver. De préférence on adaptera le gain de l'amplificateur 12 à la sensibilité du microphone. Ceci peut bien entendu être fait en prévoyant un réglage de gain manuel, comme un commutateur, mais cela va à l'encontre de ce type de terminal qui se. veut prêt à fonctionner en toutes circonstances. Ainsi, on préfèrera équiper le terminal d'un moyen de détection automatique du 20 type de microphone utilisé. Les microphones de qualité professionnelle que l'on utilise avec les terminaux de ce type ne sont pas équipés de connecteurs, de sorte que le constructeur des terminaux peut les équiper de la connectique de son choix. On prévoit ici d'équiper les microphones d'un connecteur muni d'un système d'identification. 25 A la figure 3, le microphone 10 est muni d'un connecteur 38 incorporant, par exemple, une résistance 40 de valeur spécifique associée au type de microphone. Cette résistance est reliée entre une borne de masse GND du connecteur et une borne d'identification 42 du connecteur. À l'intérieur du terminal, la borne 42 est reliée à un potentiel d'alimentation Vcc 30 par une source de courant 44. La chute de tension aux bornes de la résistance 40, proportionnelle à la valeur de celle-ci, est convertie en numérique par un convertisseur 46 et analysée par le processus 26.
En fonction du type de microphone identifié par la résistance 40, le processus 26 règle le gain k de l'amplificateur 12 et éventuellement d'autres paramètres, tels qu'un courant de polarisation nécessaire à des microphones de type electret . Le courant de polarisation est fourni, par exemple, par une source de courant 48 reliée entre le potentiel Vcc et une borne dédiée du connecteur 38. Comme cela es représenté, le processus d'analyse 26 reçoit également le signal provenant de la deuxième voie. Cela permet, le cas échéant, de mettre en oeuvre dans le processus d'analyse 26 des algorithmes plus fins de io détection de signature et de détermination de paramètres de filtre. Bien que la description qui précède soit axée sur la suppression du bruit sonore d'ambiance, on comprendra que le système est tout aussi efficace pour supprimer du bruit de nature différente, notamment le bruit généré par les circuits électroniques eux-mêmes, du moment où le bruit n'est pas conforme à 15 la signature que l'on souhaite détecter. Un tel bruit, qui peut s'avérer gênant, est le bruit dit de salve ( burst en anglais) induit par l'antenne dans la voie d'acquisition audio. Le bruit de burst est un bruit de fréquence audible généré par l'enveloppe des signaux RF qui alternent entre émission et réception.
20 Jusqu'à maintenant on a considéré une détection de signature de parole. Néanmoins, le système décrit ici peut s'appliquer à la détection d'autres signatures. Dans une utilisation du système par des arbitres d'un événement sportif, il peut s'avérer utile de détecter les coups de sifflet pour déclencher les arrêts et redémarrages d'un chronomètre. Ainsi, le processus 26 peut être 25 prévu aussi pour détecter la signature d'un coup de sifflet. Dans ce cas, la détection de signature sert à déclencher un signal. Le signal pourra être envoyé à un terminal particulier qui en fera l'usage souhaité. Par ailleurs, grâce au fait qu'on dispose d'une première voie d'acquisition audio qui reste linéaire, on peut en outre prévoir dans le terminal une fonction de 30 suppression d'écho et donc d'utiliser un haut-parleur ouvert (dont le son est susceptible d'être capté par le microphone). De nombreuses variantes et modifications du système décrit ici apparaîtront à l'homme du métier. Le système a été décrit en relation avec des terminaux sans fil destinés à transmettre la voix. Il n'est pas exclu d'utiliser ces principes dans un système filaire pour traiter des sources de signal autres qu'une voix captée par un microphone.