FR3040522B1 - Procede et systeme de rehaussement d'un signal audio - Google Patents
Procede et systeme de rehaussement d'un signal audio Download PDFInfo
- Publication number
- FR3040522B1 FR3040522B1 FR1557986A FR1557986A FR3040522B1 FR 3040522 B1 FR3040522 B1 FR 3040522B1 FR 1557986 A FR1557986 A FR 1557986A FR 1557986 A FR1557986 A FR 1557986A FR 3040522 B1 FR3040522 B1 FR 3040522B1
- Authority
- FR
- France
- Prior art keywords
- audio signal
- frequency
- raising
- hearing
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000002708 enhancing effect Effects 0.000 title claims 4
- 238000001914 filtration Methods 0.000 claims abstract description 12
- 238000010606 normalization Methods 0.000 claims description 24
- 238000009826 distribution Methods 0.000 claims description 13
- 208000000114 Pain Threshold Diseases 0.000 claims description 6
- 230000037040 pain threshold Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 abstract description 8
- 238000001228 spectrum Methods 0.000 description 16
- 230000010370 hearing loss Effects 0.000 description 9
- 231100000888 hearing loss Toxicity 0.000 description 9
- 208000016354 hearing loss disease Diseases 0.000 description 9
- 206010011878 Deafness Diseases 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000009792 diffusion process Methods 0.000 description 7
- 230000007115 recruitment Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000009434 installation Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 206010003789 Auditory recruitment Diseases 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- UDHXJZHVNHGCEC-UHFFFAOYSA-N Chlorophacinone Chemical compound C1=CC(Cl)=CC=C1C(C=1C=CC=CC=1)C(=O)C1C(=O)C2=CC=CC=C2C1=O UDHXJZHVNHGCEC-UHFFFAOYSA-N 0.000 description 1
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000036407 pain Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/70—Adaptation of deaf aid to hearing loss, e.g. initial electronic fitting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Otolaryngology (AREA)
- Neurosurgery (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Procédé de rehaussement d'un signal audio destiné à être diffusé à au moins un auditeur cible, ledit procédé comprenant les étapes suivantes : - Recevoir un signal audio s(t), - Filtrer (201) le signal audio s(t) par un filtre de rehaussement fréquentiel dont le gabarit fréquentiel est déterminé à partir de valeurs statistiques d'écart de seuil d'audition, fonctions de la fréquence, caractéristiques dudit au moins un auditeur cible.
Description
Procédé et système de rehaussement d’un signal audio L’invention concerne le rehaussement temps réel de signaux sonores diffusés dans des situations diversifiées d’ambiances sonores. L’invention s’applique à des signaux de parole ou des signaux du type alarmes. L’invention vise le rehaussement de signaux sonores dans des espaces recevant du public, par exemple des gares ou des aéroports, mais également dans des espaces privés fixes, par exemple une chambre d’hôpital, ou des espaces privés mobiles, par un exemple un véhicule personnel. A cet effet, l’invention concerne également l’adaptation de la diffusion de signaux sonores à l’environnement acoustique.
En outre, l’invention vise le rehaussement de signaux sonores adapté à des profils auditifs particuliers, notamment des profils auditifs dépendant de l’âge de l’auditeur. L’invention prend en compte, en particulier, les profils auditifs de personnes presbyacousiques et permet de cibler une population présentant une grande diversité statistique de pertes auditives.
Un problème général visé par l’invention consiste à traiter des signaux sonores pour faire émerger le signal utile (constitué par exemple par une annonce vocale ou une alarme) dans un environnement sonore donné.
Plus précisément, l’invention adresse plusieurs problématiques spécifiques rencontrées dans le domaine de la diffusion de signaux sonores.
En premier lieu, il existe un problème lié à la variation de l’environnement sonore ou acoustique qui peut engendrer une perte d’information sonore et une perte de confort auditif pour l’auditeur.
En second lieu, il existe également un problème de diversité auditive du public visé par la diffusion de signaux sonores. En effet le profil auditif moyen varie d’une personne à une autre et ceci est dû à une perte auditive qui s’accentue en fonction de l’âge.
Ces deux problèmes influent sur le confort auditif de l’auditeur et sur la sécurité liée à une diffusion correcte des messages ou annonces.
Le problème de confort auditif intervient, pour l’auditeur, lorsque les signaux sonores diffusés présentent un niveau sonore trop important. Ce phénomène est particulièrement existant lorsque l’âge de l’auditeur augmente mais également pour des personnes soumises au même niveau sonore pendant une durée importante (par exemple des personnes travaillant sur le lieu de diffusion). A l’inverse, un problème de sécurité apparaît si les signaux sonores diffusés présentent un niveau sonore trop faible. Dans ce cas, ils peuvent ne pas être entendus par des personnes souffrant d’une diminution de leur capacité auditive, par exemple des personnes presbyacousiques. A titre d’exemple, ce problème apparaît notamment dans le cas de diffusion d’une sonnerie d’alerte ou d’une annonce dans une maison de retraite. Ce problème intervient également lorsqu’une personne senior, ayant une perte auditive naturelle induite par son âge, ne perçoit plus certaines alarmes de son véhicule du fait du bruit ambiant urbain. Ce problème existe aussi dans une gare dans laquelle les annonces sonores sont diffusées au sein d’une ambiance sonore comportant un niveau de bruit parfois élevé qui est également renforcé par le phénomène de réverbération du son.
Pour pouvoir s’adapter à un environnement donné, un système de diffusion de messages sonores ou d’alertes est le plus souvent soumis à des réglages lors de son installation et en cours d’utilisation. En particulier, si le système vise une population donnée ou un profil précis de consommateur, le niveau sonore doit être réglé en conséquence.
Selon le type d’environnement visé (gare, salle de conférences, salle d'hôpital, musées, structure d'accueil pour personnes âgées, ...) le réglage des systèmes est fait lors de l'installation, soit par un technicien qui n'est pas toujours au fait de la technicité des traitements ni de la population qui fréquente le lieu, soit par le consommateur lui-même qui lui non plus n’est pas expert du sujet. Ce réglage des paramètres réalisé lors de l'installation est délicat car il doit être approprié à la nature du lieu et à la population concernée.
Il existe donc un besoin pour un système de diffusion de signaux audio adapté à des profils auditifs variés.
Les systèmes classiques de diffusion de messages sonores tels que celui décrit dans la demande de brevet européenne EP2131357 sont basés sur l'estimation du niveau du bruit ambiant hors messages vocaux et la détermination du gain de diffusion nécessaire pour obtenir une qualité de référence en termes de rapport signal utile à bruit. D'autres systèmes, comme celui décrit dans la demande internationale WO2010000878, sont orientés vers une prise en compte spécifique de la composante de réverbération dans l'ajustement du niveau de diffusion de signaux. Il s'agit, dans ce cas, de procédés qui en plus de l'estimation du niveau de bruit ambiant, se basent sur une estimation du niveau de réverbération afin d'optimiser le rapport signal utile à bruit.
Ces systèmes ne traitent pas de manière explicite les profils variés de consommateurs et en particulier ne prennent pas en compte les profils presbyacousiques. Ces systèmes ne prennent en considération que l’environnement acoustique de diffusion sans addresser la problématique de la spécificité de l’auditeur. Or la diversité auditive du public dans un lieu donné fait qu’on ne peut pas atteindre avec ces systèmes un confort auditif de même niveau pour tous. L’invention propose une méthode et un système de diffusion sonore qui permet de prendre en compte une population donnée ou un profil précis de consommateurs. A cet effet, l’invention prend en compte le profil des personnes presbyacousiques ainsi qu’une diversité de profils auditifs. L’invention prend également en compte la variation de l’environnement acoustique de diffusion. L’invention prend en compte des profils auditifs variés d’auditeurs. Notamment, l’invention prend en compte, l’élévation du seuil d’audition absolu en fonction de l’âge, les pertes fréquentielles en fonction de l’âge de l’auditeur, et le phénomène de recrutement auditif qui correspond à une limitation progressive de la dynamique du système auditif des personnes presbyacousiques qui provoque la croissance anormale du volume sonore et induit une sensation d’inconfort par rapport aux sons forts. L’invention a pour objet un procédé de rehaussement d’un signal audio destiné à être diffusé à au moins un auditeur cible, ledit procédé comprenant les étapes suivantes : - Recevoir un signal audio s(t), - Filtrer le signal audio s(t) par un filtre de rehaussement fréquentieî dont le gabarit fréquentieî est déterminé à partir de valeurs statistiques d’écart de seuil d’audition, fonctions de la fréquence, caractéristiques dudit au moins un auditeur cible.
Selon un aspect particulier de l’invention, les valeurs d’écart de seuil d’audition sont des valeurs d’écart entre un seuil d’audition pour ledit au moins un auditeur cible et un seuil d’audition de référence.
Selon un aspect particulier de l’invention, les valeurs d’écart de seuil d’audition sont des valeurs médianes.
Selon un aspect particulier de l’invention, les valeurs d’écart d’audition sont moyennées selon le sexe dudit au moins un auditeur cible.
Selon un aspect particulier de l’invention, le gabarit fréquentieî du filtre de rehaussement fréquentieî est déterminé à l’aide d’une interpolation fréquentielle desdites valeurs d’écart.
Selon une variante de réalisation, le procédé selon l’invention comprend en outre une étape de filtrage passe-bas du signal rehaussé par le filtre de rehaussement fréquentieî, la fréquence de coupure du filtre passe-bas étant prise égale au maximum à la fréquence de coupure d’un haut-parleur (destiné à diffuser le signal audio filtré.
Selon une variante de réalisation, le procédé selon l’invention comprend en outre une étape de normalisation par un gain configuré en fonction dudit au moins un auditeur cible, de sorte à être compris entre un seuil d’audition absolu et un seuil de douleur.
Selon un aspect particulier de l’invention, le signal audio est un signal de parole et le gain de normalisation est un gain moyen fixe appliqué au signal pour toutes les fréquences.
Selon un aspect particulier de l’invention, le signal audio est une alarme et le gain de normalisation est un gain variable en fréquence et configuré en fonction des composantes fréquentielles du signal avant l’étape de normalisation.
Selon un aspect particulier de l’invention, ledit au moins un auditeur cible comprend un auditeur presbyacousique. L’invention a également pour objet un dispositif de rehaussement fréquentiel d’un signal audio comprenant des moyens configurés pour exécuter le procédé de rehaussement d’un signal audio selon l’invention. L’invention a encore pour objet un programme d’ordinateur comportant des instructions pour l'exécution du procédé de rehaussement d’un signal audio selon l’invention, lorsque le programme est exécuté par un processeur et un support d'enregistrement lisible par un processeur sur lequel est enregistré un programme comportant des instructions pour l'exécution du procédé de rehaussement d’un signal audio selon l’invention, lorsque le programme est exécuté par un processeur. D’autres caractéristiques et avantages de la présente invention apparaîtront mieux à la lecture de la description qui suit en relation aux dessins annexés qui représentent : - La figure 1, un synoptique d’un système électro-acoustique de diffusion de messages sonores selon l’invention, - La figure 2, un organigramme schématisant les étapes de mise en œuvre d’un procédé de pré-compensation fréquentielle d’un signal audio, - Les figures 3a,3b, deux diagrammes représentant les valeurs médianes des écarts du seuil d’audition selon le sexe (femme (3a), homme (3b)), pour trois populations d’âge de 40, 50 et 60 ans, - La figure 4, un exemple d’écart de seuil d'audition médian et l’écart du seuil d’audition attendu d'être dépassé par 25 % d'une population normale d’homme d’âge de 60 ans, - La figure 5, un diagramme représentant trois exemples de gabarits de filtres de rehaussement selon l’invention pour trois profils différents de populations correspondant à des applications diverses, - Les figures 6a,6b deux diagrammes illustrant deux exemples de gabarits de filtres de rehaussement auxquels on a ajouté une étape de filtrage passe-bas adapté au haut-parleur du système, - Les figures 7a,7b deux diagrammes représentant des courbes isosoniques en fonction du niveau d’intensité sonore et de la fréquence pour des personnes ayant une capacité auditive normale (figure 7a) et pour des personnes presbyacousiques (figure 7b), - La figure 8, un autre diagramme illustrant un exemple d’application d’un gain de normalisation au signal de parole rehaussé.
La figure 1 schématise un synoptique d’un système électro-acoustique 101 de diffusion de messages sonores selon l’invention.
Un tel système 101 reçoit en entrée un premier signal audio s(t) à diffuser. Ce premier signal peut être un signal de parole, par exemple une annonce vocale, ou un signal de type alarme. II peut provenir d’un microphone ou d’un signal préenregistré. Préférentiellement, le signal est numérique ou numérisé.
Le système 101 est connecté à sa sortie à un haut parleur HP chargé de diffuser le signal audio s(t) qui a été préalablement modifié par les traitements implémentés par le système 101. A cet effet, le système 101 comporte un filtre de pré-compensation FPC selon l’invention qui sera décrit plus en détail par la suite.
Le système 101 peut également comporter un module TR de traitement des réverbérations du signal audio ainsi qu’un dispositif de contrôle automatique de gain CAG. En outre, dans un mode de réalisation particulier, le système 101 peut être connecté en entrée à un second microphone qui a pour rôle de capter l’ambiance sonore du lieu dans lequel le signal doit être diffusé. L’ambiance sonore est mesurée sous la forme d’un second signal audio n(t). Un module d’apprentissage APP peut être intégré au système 101 pour prendre en compte la mesure du second signal audio dans le traitement de contrôle automatique de gain. Un objectif général du système 101 est de faire émerger le signal utile s(t) de l’ambiance sonore n(t) avec un niveau sonore acceptable pour un public donné. Par niveau sonore acceptable, il faut comprendre un niveau ni trop faible ni trop élevé, autrement dit un niveau compris dans une plage d’amplitude confortable pour l’oreille humaine.
Un objectif particulier de l’invention est de prendre en compte différents profils d’auditeurs, notamment en fonction de leur âge, pour adapter le niveau du signal sonore diffusé par le haut parleur HP en conséquence. A cet effet, l’invention propose un filtre de pré-compensation FPC qui implémente un procédé de pré-compensation fréquentielle du signal audio S(t), ce procédé comprenant principalement trois étapes tel qu’illustré à la figure 2.
Le procédé de pré-compensation fréquentielle comprend une première étape 201 de rehaussement fréquentieî, une deuxième étape 202 de filtrage passe bas adaptée au haut parleur HP et une troisième étape 203 de normalisation du niveau du signal.
Un objectif du procédé de pré-compensation fréquentielle selon l’invention est de compenser le spectre fréquentiel du signal audio s(t) pour l’adapter à un profil d’auditeur cible en tenant compte des pertes auditives moyennes subies par l’auditeur cible et aussi en tenant compte du niveau maximum sonore acceptable pour l’auditeur cible.
La première étape 201 de rehaussement fréquentiel consiste à appliquer au signal entrant s(t) un filtre de rehaussement pour amplifier sélectivement le signal afin de le rendre intelligible pour un auditeur cible.
Le filtrage appliqué est préférentiellement un filtrage numérique et respecte un gabarit fréquentiel donné qui dépend d’un profil d’auditeur cible.
Par exemple, un profil d’auditeur est spécifié en fonction de l’âge de l’auditeur. En effet, les pertes fréquentielles dans la capacité auditive d’un individu augmentent statistiquement avec l’âge.
Le gabarit du filtre de rehaussement fréquentiel est défini comme suit : H(f)=P(f), avec f variant dans l’intervalle [0 ;Fs/2], où Fs est la fréquence d’échantillonnage du signal audio s(t) numérisé. P est une fonction d’interpolation.
Le gabarit du filtre est généré à partir d’une distribution statistique de seuils d’audition pour un ensemble de fréquences audiométriques. Cette distribution statistique dépend d’un profil d’auditeur en particulier de l’âge de l’auditeur et de son sexe. Il y a plusieurs situations qui entraînent une prise en compte statistique du seuil d’audition. En premier lieu, lorsque l'on mesure le seuil d'audition d'une personne donnée, cela se fait pour quelques valeurs discrètes de fréquences et en général seul est considéré le seuil absolu d'audition. Par ailleurs le seuil d'audition varie au cours du temps notamment selon l'état de fatigue de la personne, la période de la journée. Pour une même personne il y a donc une distribution statistique de son seuil d'audition. En second lieu, il y a aussi une distribution statistique associée à une population d'un âge donné. Par exemple, les personnes de 65 ans ont un profil moyen donné avec une distribution statistique autour de ce profil moyen. Enfin, lorsque l'on considère un ensemble de personnes qui vont fréquenter un lieu, il y aura aussi une distribution statistique associée à la variabilité des âges.
Ces distributions statistiques sont par exemple fournies par la norme ISO 7029 produite par l’AFNOR et relative au domaine de l’acoustique.
Ces distributions statistiques sont fournies sous la forme de valeurs d’écarts de seuils d’audition pour certaines fréquences audiométriques, précisément les fréquences [125, 250, 500, 1000, 1500, 2000, 3000, 4000, 6000, 8000] Hertz. L’écart de seuil d’audition est défini, selon la norme ISO 7029 comme l’écart entre le seuil d’audition d’un sujet et un seuil de référence. Le seuil de référence est pris, selon la norme ISO 7029, égal au seuil médian d’audition d’une population de sujets âgés de 18 ans otologiquement normaux et de même sexe. Le seuil de référence peut encore être défini comme un seuil d’audition absolu qui désigne le niveau minimal de pression acoustique qu'il faut imposer à un signal sinusoïdal pour qu'il soit perçu dans une ambiance silencieuse.
La norme ISO 7029 précise comment calculer en fonction de l’âge et du sexe l’écart de seuil d’audition médian mais également la distribution statistique attendue de part et d'autre de cette valeur médiane.
Les figures 3a et 3b représentent, sur un diagramme fonction de la fréquence exprimée en Hertz, des exemples de valeurs médianes des écarts du seuil d’audition selon le sexe (les valeurs pour les femmes sont représentées à la figure 3a et les valeurs pour les hommes à la figure 3b), pour trois populations d’âges. Les courbes 301 a,301 b correspondent à des populations d’âge de 40 ans. Les courbes 302a,302b correspondent à des populations d’âge de 50 ans. Les courbes 303a,303b correspondent à des populations d’âge de 60 ans.
La figure 4 représente la courbe 303b de la figure 3b, c'est-à-dire la valeur médiane de l’écart du seuil d’audition pour des hommes âgés de 60 ans. La valeur médiane signifie que l’écart du seuil d’audition représenté par la courbe 303b est atteint par 50% de la population visée. Sur cette même figure 4, on a représenté la courbe 304b qui donne l’écart du seuil d’audition atteint par 25% de la population visée, c'est-à-dire les hommes de 60 ans.
La déviation du seuil d’audition est caractérisée par une diminution progressive de l’audition avec l’âge et une augmentation des pertes auditives en fonction des fréquences.
Le gabarit H(f) du filtre de rehaussement fréquentieî est déterminé à partir des écarts de seuil d’audition pour une cible d’auditeurs donnés. Les écarts peuvent être moyennés entre les hommes et les femmes pour la même cible d’âge. Les valeurs statistiques utilisées peuvent être des valeurs médianes ou peuvent être d’autres valeurs de déciles, ou plus généralement des valeurs qui partagent la population en X sous-populations de la même taille, X étant un nombre entier positif au moins égal à deux.
Pour générer le gabarit H(f) du filtre pour des fréquences comprises entre 20 Hz et Fs/2, on procède de la façon suivante.
Pour la bande de fréquences comprise entre 125 Hz et 8000 Hz, le gabarit du filtre est obtenu, pour un profil d’âge donné, à partir de valeurs statistiques des écarts du seuil d’audition en moyennant les valeurs obtenues pour les hommes d’une part et pour les femmes d’autre part.
En outre, comme les valeurs d’écarts de seuils d’audition ne sont données que pour certaines fréquences par la norme ISO 7029, pour obtenir un gabarit fréquentieî sur toute la plage de valeurs [125, 8000] Hz, une opération d’interpolation est réalisée. Cette opération peut être une interpolation polynomiale par morceaux, par exemple une interpolation cubique, par exemple une interpolation de Hermite. Toute autre opération d’interpolation permettant d’obtenir des valeurs continues sur une plage de fréquences donnée à partir de valeurs discrètes comprises dans cette plage est également compatible de l’invention.
Pour la bande de fréquences [0 125] Hz, les valeurs du gabarit du filtre sont constantes et prises égales à la valeur médiane de l’écart du seuil d’audition par rapport au seuil d’audition absolu pour la fréquence 125 Hz.
Pour la bande de fréquences [8000 Hz Fs/2], le gain du filtre est fixé à une valeur constante égale au gain obtenu pour la fréquence 8 kHz. Au delà de 8kHz, les pertes fréquentielles peuvent être plus importantes mais il y a un manque de connaissance du comportement fréquentiel de l’audition pour des sons de type parole ou alarmes qui présentent généralement un spectre localisé à des fréquences inférieures à 8 kHz.
De façon plus générale, si des statistiques sur les seuils d’audition peuvent être obtenues pour des fréquences inférieures à 125 Hz ou supérieures à 8 kHz, l’opération d’interpolation peut être étendue à ces fréquences et au-delà de la plage [0,125, 8] kHz.
La figure 5 représente trois gabarits de filtres de rehaussement fréquentiels 501,502,503 obtenus à l’aide de la procédure décrite ci-dessus. Le premier filtre 501 correspond à un profil cible de personnes âgées de 40 ans. Le deuxième filtre 502 correspond à un profil cible de personnes âgées de 50 ans. Le troisième filtre 503 correspond à un profil cible de personnes âgées de 60 ans.
Le premier filtre 501 peut être utilisé pour cibler un profil de personnes ayant un audiogramme spécifique avec une perte auditive légère. II peut être utilisé pour des applications privées, par exemple dans un lieu privé tel qu’un véhicule.
Le deuxième filtre 502 peut être utilisé pour cibler une large gamme de personnes car il peut convenir aussi bien pour des personnes présentant peu de perte auditive que pour des personnes présentant une perte auditive plus importante. En particulier, ce deuxième filtre 502 peut être utilisé pour des applications dans des espaces publics tels que des gares, des aéroports ou d’autres lieux publics fréquentés par un grand nombre de personnes. Ces espaces peuvent typiquement contenir aussi bien une population de personnes ayant des capacités auditives normales qu’une population dont la perte auditive variera avec l’âge.
Le troisième filtre 503 peut être utilisé pour cibler des personnes seniors dans le cadre de structures d’accueil pour personnes âgées.
Les trois exemples de filtres présentés sont donnés à titre illustratif et ne doivent pas être considérés comme limitant la portée de l’invention. A partir de distributions statistiques de seuils d’audition pour des profils de personnes donnés, on peut concevoir d’autres filtres adaptés pour ces profils.
Les coefficients du filtre temporel appliqué au signal s(t) par l’étape 201 du procédé selon l’invention peuvent être obtenus à partir du gabarit fréquentiel du filtre à l’aide de n’importe quelle méthode de synthèse d’un filtre numérique.
Par exemple, une structure récursive de filtre peut être choisie car elle permet d’avoir des filtres parcimonieux, à faible nombre de paramètres, car la forme spécifique du gabarit nécessiterait un grand nombre de coefficients avec une structure transverse. Le nombre de coefficients et les valeurs des coefficients de cette structure vont dépendre de la fréquence d’échantillonnage. Pour un même type de structure il y a plusieurs réalisations possibles (directes, factorisées, treillis,...). Un filtre peut être à phase linéaire ou non linéaire. Les paramètres du filtre peuvent être optimisés selon une approche itérative, par exemple selon la méthode des moindres carrés.
La procédure décrite ci-dessus pour générer un filtre de rehaussement utilisé à l’étape 201 du procédé est compatible à la fois de signaux de parole et de signaux d’alarme.
La deuxième étape 202 du procédé selon l’invention consiste en un filtrage passe-bas du signal rehaussé, le filtre passe-bas utilisé étant adapté au haut-parleur HP du système 101.
Cette deuxième étape 202 permet d’adapter la compensation introduite par le filtre de rehaussement à la première étape 201 au haut-parleur HP utilisé en évitant sa saturation.
Le filtre passe-bas utilisé à l’étape 202 est accordé à la réponse fréquentielle du haut-parleur HP par lequel se fait la diffusion du signal audio vers l’utilisateur final.
Le gabarit du filtre passe- bas est conçu notamment de sorte à ne pas rehausser les bruits parasites en dehors de la bande passante fréquentielle du haut-parleur.
Chaque haut-parleur peut être considéré globalement comme un filtre passe-bas de fréquence de coupure fHp. Plus précisément le comportement fréquentieî du haut-parleur au-dessus de cette fréquence de coupure fHp peut-être variable selon le type d'enceinte acoustique. II est donc utile d’implémenter, dans le filtre de pré-compensation FPC, un filtre passe-bas de fréquence de coupure inférieure à la fréquence de coupure du haut-parleur HP, pour éviter de rehausser les bruits de fond, dans la bande de fréquence au-delà de la fréquence de coupure du haut-parleur. Avantageusement, la fréquence de coupure du filtre passe-bas peut être choisie proche de la fréquence de coupure du haut-parleur HP.
Le filtre passe-bas utilisé dans l’étape 202 peut être réalisé par un filtre passe-bas numérique classique défini par son gabarit, paramétré notamment par sa fréquence de coupure fc.
Les figures 6a et 6b illustrent la réponse fréquentielle de l’opération globale de filtrage effectuée par la concaténation des étapes 201 et 202 pour deux fréquences de coupures différentes respectivement égales à 5kHz (figure 6a) et 8 kHz (figure 6b).
Sur chaque figure 6a,6b, on a représenté d’une part la réponse fréquentielle du filtre de rehaussement 601 utilisé à l’étape 201 et d’autre part la réponse fréquentielle 602,603 de l’ensemble (filtre de rehaussement et filtre passe-bas).
Dans une variante particulière de l’invention, les étapes 201 et 202 peuvent être réalisées conjointement pour générer directement un gabarit de filtre 602,603 qui inclut à la fois le rehaussement et le filtrage passe-bas adapté au haut -parleur.
Selon une troisième étape 203 du procédé selon l’invention, on applique une normalisation par l’intermédiaire d’un gain pour ajuster le niveau du signal en sortie.
Ce gain de normalisation dépend du type de signal audio s(t) reçu qui peut être soit un signal de parole dont le spectre est étendu sur une plage de fréquences large, soit un signal de type alarme dont le spectre en fréquence est plus étroit.
Pour le cas d’un signal de parole, l’étape 203 consiste à appliquer au filtre de rehaussement un gain fixe scalaire destiné à replacer le signal dans une zone de confort auditif pour l’utilisateur ciblé. Cette zone de confort est définie par le spectre moyen du signal de parole (désigné par l’acronyme anglo-saxon LTASS pour Long Term Average Speech Spectrum) associé à la dispersion statistique de ce spectre moyen. La zone de confort peut aussi prendre en compte le type d’annonces diffusé de manière à s’adapter au spectre moyen du type précis d’annonces. Par exemple, le type d’annonces considéré peut être limité à une voix féminine, à un locuteur donné ou à une langue donnée.
Le gain appliqué est également configuré pour prendre en compte le phénomène de recrutement qui correspond à une limitation progressive de la dynamique du système auditif de personnes presbyacousiques. Ce phénomène a pour effet d’engendrer une sensation d’inconfort très gênante, pour ce type de personnes, lorsque le niveau du son est trop élevé.
Les figures 7a et 7b représentent un ensemble de courbes isosoniques pour un ensemble de personnes correspondant à un profil auditif donné. Ces courbes définissent des niveaux de pression acoustique en décibels (en ordonnée) en fonction de la fréquence (en abscisse), qui provoquent la même sensation d’intensité sonore pour l’oreille humaine.
Sur la figure 7a sont représentées six courbes isosoniques Ch, Cl2, Cl3, Cl4, Cl5, Cl6, pour des personnes ayant des capacités auditives normales, chaque courbe étant associée à un niveau d’intensité sonore. Sur cette même figure 7a est également représenté le spectre moyen LTASS du signal de parole.
Sur la figure 7b sont représentées six courbes isosoniques Cl’1, Cl’2, Cl’3, Cl’4, Cl’5, Cl’e, pour des personnes presbyacousiques, chaque courbe étant associée à un niveau d’intensité sonore. Sur cette même figure 7b est également représenté le spectre moyen LTASS du signal de parole.
On remarque en comparant les figures 7a et 7b que les courbes isosoniques sont sensiblement plus resserrées pour les personnes presbyacousiques, ce qui traduit une diminution de la dynamique du système auditif chez ces personnes. Ainsi, les personnes presbyacousiques s’approchent plus rapidement du seuil de douleur que les personnes qui ont une audition normale, en fonction du niveau d’intensité sonore. Ce phénomène est qualifié de recrutement.
La figure 8 illustre, sur un exemple, l’effet de l’étape de normalisation 203 du procédé selon l’invention. L’objectif de cette étape 203 est de positionner le spectre moyen du signal de parole en sortie des étapes de filtrage 201,202, au dessus du seuil d’audition absolu SAA représenté à la figure 8 pour une cible de personnes mal-entendantes. Le spectre moyen du signal doit être positionné dans une zone de confort d’écoute en tenant compte de l’écart- type-par fréquences et en ne dépassant pas les pics de niveau de la parole NP.
Un exemple de courbe 800 de spectre moyen d’un signal de parole rehaussé et normalisé est représenté à la figure 8 pour un niveau cible de niveau de pression acoustique maximum de 80 dB. Le gain de normalisation appliqué à l’étape 203 est donc calculé de sorte que l’écart type maximum du spectre moyen ainsi que les pics de niveau de parole sur l’ensemble des fréquences ETM soient entre le seuil d’audition de l’auditeur et son seuil d’inconfort. Le réglage du gain de normalisation est fait de manière à ce que la probabilité pour que le spectre moyen du signal de parole (avec sa dispersion statistique) reste dans la zone de confort (avec sa distribution statistique) soit grande. Ce niveau permet d’obtenir un bon rehaussement du signal de parole tout en restant éloigné du seuil de douleur SD également représenté à la figure 8. L’exemple de la figure 8 est donné à titre illustratif. On comprend que le gain de normalisation dépend du profil d’auditeur visé et est calculé de sorte à ce que le spectre moyen du signal de parole soit compris entre le seuil d’audition absolu et le seuil de douleur, pour un profil d’individu donné.
Pour le cas d’un signal de type alarme, l’étape de normalisation 203 du procédé consiste à fixer un gain de normalisation scalaire fixe par bandes de fréquences. La valeur du gain est fixée sur chaque plage de sorte que les composantes du signal d’alarme rehaussé ne dépassent pas un seuil donné. Le gain de normalisation est notamment fixé de sorte que le niveau du signal de parole après normalisation 203 ne dépasse pas un seuil maximum défini par bande de fréquences. Suite au rehaussement fréquentieî 201, une nouvelle composante fréquentielle dominante peut apparaître dans le signal. Comme le rehaussement est plus important dans les hautes fréquences, la normalisation 203 permet d’assurer que ces nouvelles composantes éventuelles ne dépassent pas un seuil maximum prédéfini.
Dans le cas d’une alarme, le gain de normalisation dépend du contenu fréquentiel précis de l’alarme considérée.
En particulier, on distingue deux bandes de fréquences importantes, la bande principale et la bande haute fréquence. Dans ces deux bandes en particulier, il est important que le signal ne dépasse pas le seuil prédéterminé.
Le seuil maximum est défini en fonction du seuil de tolérance ou seuil de douleur pour un profil d’auditeurs donné et prend en compte le phénomène de recrutement chez les personnes presbyacousiques.
Ainsi, le gain de normalisation appliqué à l’étape 203 est calculé de sorte que le signal d’alarme rehaussé et normalisé soit compris entre le seuil d’audition absolu et le seuil de douleur, pour un profil d’individu donné
Le principe du réglage du gain de normalisation dans le cas d’un signal d’alarme est sensiblement le même que celui du réglage dans le cas d’un signal de parole avec cela de spécifique que le contenu fréquentiel de l'alarme est soit connu soit peut être appris en temps réel.
Le réglage du gain de normalisation est effectué par bande de fréquences pour les alarmes à la fois parce que cela conduit à un algorithme moins complexe pour des applications embarquées et parce qu’il est possible de faire la distinction entre la bande utile ou principale (liées à la fréquence fondamentale d'alarmes souvent tonales) et les hautes fréquences qui contiennent les harmoniques de cette fréquence fondamentale.
Un exemple de valeurs de gain par bandes de fréquences est donné le tableau suivant pour un signal d’alarme.
Le procédé de pré-compensation fréquentielle d’un signal audio, selon l’invention, permet notamment de lutter contre les pertes fréquentielles en fonction de l’âge de l’auditeur par l’utilisation d’un filtre de rehaussement 201. En outre, l’ajout d’une étape de normalisation 203, ainsi que l’ajout d’un filtre passe-bas 202, permet de lutter également contre l’abaissement du seuil d’audition absolu en fonction de l’âge d’un auditeur et contre le phénomène de recrutement chez les personnes presbyacousiques.
Pour des signaux de parole, l’invention permet notamment d’améliorer l’intelligibilité de la parole pour des personnes presbyacousiques et les personnes ayant des capacités auditives normales sans altérer la qualité du son perçu par ces derniers.
Pour des signaux de type alarme, l’invention permet d’améliorer la perception et la localisation de l’alarme et de conserver le pouvoir alarmant.
Le système 101 selon l’invention et en particulier le filtre de précompensation FPC peut être implémenté à partir d’éléments matériel et/ou logiciels. Le filtre de précompensation FPC peut être mis en œuvre sous forme de programme d’ordinateur. Alternativement il peut être mis en œuvre par un processeur associé à une mémoire. Le processeur peut être un processeur spécifique ou générique ou un circuit intégré. L’invention s’applique à la diffusion de signaux sonores dans des espaces publics tels que des gares, aéroports, établissements sportifs, musées, chapiteaux, centres commerciaux, établissements de cultes, mais également des espaces de taille plus réduite telles que des structures d’accueil pour personnes âgées et handicapées, des salles de conférence, des établissements d’enseignement, des établissements sanitaires, des administrations ou encore des centres d’appels. L’invention s’applique également à la diffusion d’alertes sonores dans des espaces privés tels que des moyens de transports motorisés parmi lesquels un véhicule automobile, une ambulance, un ascenseur, une télécabine, un cockpit d’avion ou une cabine de bateau.
Claims (9)
- REVENDÎCÂTSONS L Procédé de rehaussement d’un signai audio destiné à être diffusé à au moins un auditeur cible, ledit procédé comprenant les étapes suivantes : - Recevoir un signal audio s(t), - Filtre (201) le signal audio s(t) par un filtre de rehaussement fréquentîel dont le gabarit fréquentiel est déterminé à partir ’d'une distribution statistique d’écarts de seuil d’audition fonctions de la fréquence, la distribution statistique étant déterminée pour une population d’individus représentative de l’au moins un auditeur cible, - Normaliser (203) le signal filtré, par un gain configuré en fonction dudit au moins un auditeur cible, de sorte à être compris entre un seuil d’audition absolu (SAA) et un seuil de douleur (SD), - Le seuil d’audition absolu (SAA) étant déterminé pour un profil d’auditeurs donné.
- 2. Procédé de rehaussement d’un signal audio selon la revendication 1 dans lequel les valeurs d’écart de seuil d’audition sont des valeurs d’écart entre un seuil d’audition pour ledit au moins un auditeur cible et un seuil d’audition de référence. 1 Procédé de rehaussement d’un signal audio selon l’une des revendications précédentes dans lequel les valeurs d’écart de seuil d’audition sont des valeurs médianes. L Procédé de rehaussement d’un signal audio selon l’une des revendications précédentes dans lequel les valeurs d’écart d’audition sont moyennées selon le sexe dudit au moins un auditeur cible.
- 5. Procédé de rehaussement d’un signal audio selon l’une des revendications précédentes dans lequel le gabarit fréquentiel du filtre de rehaussement fréquentiel est déterminé à l’aide d’une interpolation fréquentielle desdites valeurs d’écart. b. Procédé de rehaussement d'un signas audio seion i une des revendications précédentes comprenant en outre une étape (202) de filtrage passe-bas du signai rehaussé par ie filtre de rehaussement fréquentieî, la fréquence de coupure du filtre passe-bas étant prise égale au maximum à la fréquence de coupure d’un haut-parleur (HP) destiné à diffuser le signal audio filtré.
- 7. Procédé de rehaussement d’un signai audio selon la revendication 1 dans lequel le signal audio est un signal de parole et le gain de normalisation est un gain moyen fixe appliqué au signal pour toutes les fréquences.
- 8. Procédé de rehaussement d’un signal audio seion la revendication 1 dans lequel le signal audio est une alarme et le gain de normalisation est un gain variable en fréquence et configuré en fonction des composantes fréquentielles du signal avant l’étape (203) de normalisation.
- 9. Procédé de rehaussement d’un signal audio selon l’une des revendications précédentes dans lequel ledit au moins un auditeur cible comprend un auditeur presbyacousique.
- 10. Dispositif (101) de rehaussement fréquentieî d’un signal audio comprenant des moyens (FPC) configurés pour exécuter te procédé de rehaussement d’un signal audio selon l’une des revendications précédentes.
- 11. Programme d’ordinateur comportant des instructions pour l’exécution du procédé de rehaussement d’un signal audio selon l’une quelconque des revendications 1 à 9, lorsque le programme est exécuté par un processeur.
- 12. Support d'enregistrement lisible par un processeur sur lequel est enregistré un programme comportant des instructions pour l'exécution du procédé de rehaussement d’un signal audio selon l’une quelconque des revendications 1 à 9, lorsque le programme est exécuté par un processeur.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1557986A FR3040522B1 (fr) | 2015-08-28 | 2015-08-28 | Procede et systeme de rehaussement d'un signal audio |
PCT/EP2016/070151 WO2017036940A1 (fr) | 2015-08-28 | 2016-08-26 | Procede et systeme de rehaussement d'un signal audio |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1557986A FR3040522B1 (fr) | 2015-08-28 | 2015-08-28 | Procede et systeme de rehaussement d'un signal audio |
FR1557986 | 2015-08-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
FR3040522A1 FR3040522A1 (fr) | 2017-03-03 |
FR3040522B1 true FR3040522B1 (fr) | 2019-07-19 |
Family
ID=54937245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR1557986A Expired - Fee Related FR3040522B1 (fr) | 2015-08-28 | 2015-08-28 | Procede et systeme de rehaussement d'un signal audio |
Country Status (2)
Country | Link |
---|---|
FR (1) | FR3040522B1 (fr) |
WO (1) | WO2017036940A1 (fr) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3573059B1 (fr) * | 2018-05-25 | 2021-03-31 | Dolby Laboratories Licensing Corporation | Amélioration de dialogue basée sur la parole synthétisée |
US11368776B1 (en) * | 2019-06-01 | 2022-06-21 | Apple Inc. | Audio signal processing for sound compensation |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6724862B1 (en) * | 2002-01-15 | 2004-04-20 | Cisco Technology, Inc. | Method and apparatus for customizing a device based on a frequency response for a hearing-impaired user |
US7190795B2 (en) * | 2003-10-08 | 2007-03-13 | Henry Simon | Hearing adjustment appliance for electronic audio equipment |
FR2932332B1 (fr) | 2008-06-04 | 2011-03-25 | Parrot | Systeme de controle automatique de gain applique a un signal audio en fonction du bruit ambiant |
WO2010000878A2 (fr) | 2009-10-27 | 2010-01-07 | Phonak Ag | Système et procédé d’amélioration de la qualité de la parole |
FR2986897A1 (fr) * | 2012-02-10 | 2013-08-16 | Peugeot Citroen Automobiles Sa | Procede d'adaptation de signaux sonores par filtre de correction sonore fonction d'un profil auditif, et dispositif de traitement associe |
-
2015
- 2015-08-28 FR FR1557986A patent/FR3040522B1/fr not_active Expired - Fee Related
-
2016
- 2016-08-26 WO PCT/EP2016/070151 patent/WO2017036940A1/fr active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2017036940A1 (fr) | 2017-03-09 |
FR3040522A1 (fr) | 2017-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11276384B2 (en) | Ambient sound enhancement and acoustic noise cancellation based on context | |
US10368164B2 (en) | Approach for partially preserving music in the presence of intelligible speech | |
US11153677B2 (en) | Ambient sound enhancement based on hearing profile and acoustic noise cancellation | |
US9138178B2 (en) | Method and system for self-managed sound enhancement | |
Anzalone et al. | Determination of the potential benefit of time-frequency gain manipulation | |
US8917894B2 (en) | Method and device for acute sound detection and reproduction | |
EP3641343B1 (fr) | Procédé permettant d'améliorer le signal audio provenant d'un dispositif de sortie audio | |
CN112087701B (zh) | 用于风检测的麦克风的扬声器仿真 | |
KR20110050500A (ko) | 보청기에서의 사운드 처리 방법 및 보청기 | |
JP6514371B2 (ja) | ダイナミックコンプレッサを制御する装置及び方法並びにダイナミックコンプレッサの増幅値を決定する方法 | |
WO2015085946A1 (fr) | Procédé, appareil et serveur de traitement de signal vocal | |
FR3040522B1 (fr) | Procede et systeme de rehaussement d'un signal audio | |
Kuk et al. | Improving hearing aid performance in noise: Challenges and strategies | |
Brons et al. | Detection threshold for sound distortion resulting from noise reduction in normal-hearing and hearing-impaired listeners | |
EP3755006A1 (fr) | Système audio autonome pour appui-tête de siège, appui-tête de siège et véhicule associés | |
Pandey et al. | Adaptive gain processing with offending frequency suppression for digital hearing aids | |
US11368776B1 (en) | Audio signal processing for sound compensation | |
WO2017207286A1 (fr) | Combine audio micro/casque comprenant des moyens de detection d'activite vocale multiples a classifieur supervise | |
WO2009077665A1 (fr) | Baladeur audio ou audio-video comprenant des moyens de capture d'un signal audio externe | |
FR3073694A1 (fr) | Procede de sonorisation live, au casque, tenant compte des caracteristiques de perception auditive de l’auditeur | |
Ives et al. | Effects of noise reduction on AM perception for hearing-impaired listeners | |
FR2921747A1 (fr) | Procede de traitement d'un signal audio dans un dispositif portable | |
FR2921746A1 (fr) | Baladeur audio ou audio-video comprenant des moyens de capture d'un signal audio externe |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 2 |
|
PLSC | Search report ready |
Effective date: 20170303 |
|
PLFP | Fee payment |
Year of fee payment: 3 |
|
PLFP | Fee payment |
Year of fee payment: 4 |
|
PLFP | Fee payment |
Year of fee payment: 5 |
|
ST | Notification of lapse |
Effective date: 20210405 |