FR2921747A1 - Procede de traitement d'un signal audio dans un dispositif portable - Google Patents

Procede de traitement d'un signal audio dans un dispositif portable Download PDF

Info

Publication number
FR2921747A1
FR2921747A1 FR0706832A FR0706832A FR2921747A1 FR 2921747 A1 FR2921747 A1 FR 2921747A1 FR 0706832 A FR0706832 A FR 0706832A FR 0706832 A FR0706832 A FR 0706832A FR 2921747 A1 FR2921747 A1 FR 2921747A1
Authority
FR
France
Prior art keywords
audio signal
listening
signal
function
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR0706832A
Other languages
English (en)
Inventor
Anne Touchain
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to FR0706832A priority Critical patent/FR2921747A1/fr
Priority to EP08862314A priority patent/EP2206236A1/fr
Priority to PCT/FR2008/001352 priority patent/WO2009077665A1/fr
Publication of FR2921747A1 publication Critical patent/FR2921747A1/fr
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6058Portable telephones adapted for handsfree use involving the use of a headset accessory device connected to the portable telephone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/07Applications of wireless loudspeakers or wireless microphones

Abstract

L'invention concerne un procédé de traitement d'un signal audio dans un dispositif portable (1), comprenant les étapes consistant à recevoir un premier signal audio (AS1), transférer le premier signal audio vers un moyen d'écoute (22) de ce signal, et recevoir un second signal audio (AS2) issu d'au moins un microphone (30a) agencé pour capter des sons provenant de l'extérieur du dispositif portable. Selon l'invention le procédé comprend les étapes consistant à analyser de façon numérique le second signal audio (AS2) pour y détecter au moins un événement sonore, et, lorsque l'événement sonore est détecté, transférer vers le moyen d'écoute un signal audio (AS2) apte à informer un utilisateur de la survenance de l'événement, en mélangeant ce signal avec le premier signal audio (AS1) suivant un niveau de mélange (34) déterminé. Application notamment aux baladeurs numériques.

Description

PROCEDE DE TRATI'EMENT DUN SIGNAL AUDIO DANS UN DISPOSITIF PORTABLE
La présente invention concerne un dispositif portable pour l'écoute d'un signal audio, comprenant une source d'un premier signal audio, des moyens de transfert du premier signal audio vers un moyen d'écoute de ce signal, et au moins un microphone pour s capter des sons provenant de l'extérieur du dispositif portable, fournissant un second signal audio. La présente invention concerne également un procédé de traitement d'un signal audio dans un dispositif du type précité. La présente invention concerne de façon générale les io dispositifs portables comprenant une fonction d'écoute d'un signal audio et qui, de ce fait, lorsque cette écoute est faite par l'intermédiaire d'écouteurs de type casque, oreillette stéréophonique ou écouteurs intra-auriculaires, isolent acoustiquement l'utilisateur du monde extérieur. La présente 15 invention concerne ainsi, notamment, les baladeurs numériques audio ou audio/vidéo ainsi que les téléphones portables. Ecouter de la musique ou converser téléphoniquement au moyen d'écouteurs isole l'utilisateur du monde extérieur rendant ainsi impossible la communication verbale avec autrui ou la perception 20 des bruits extérieurs. Or, la perception des bruits extérieurs peut être nécessaire à la sécurité de l'utilisateur, notamment si celui-ci se trouve en milieu potentiellement dangereux (ville, bord de route en campagne, chantier, etc.). Pouvoir entendre autrui peut être également nécessaire pour des raisons de 25 sécurité. Ainsi, une personne utilisant un baladeur MP3 dans un autocar, un train, un métro ou une voiture est soumise à un bruit ambiant très élevé pouvant dépasser les 70 dB. Une telle personne a tendance à augmenter le niveau sonore de son baladeur et s'isole 30 encore plus du monde extérieur. Pour communiquer avec autrui, l'utilisateur doit couper le son de l'appareil en question et souvent enlever un écouteur. La manipulation et la mise en place des écouteurs intra auriculaires sont délicates et relativement longues.
Il est tout particulièrement admis que les écouteurs intraauriculaires procurent une isolation acoustique élevée pouvant être dangereuse :
"Pour l'écoute de musique, le bruit extérieur est souvent une gêne importante : dans la rue mais surtout les transports en commun (métro, train, avion). Un casque classique n'offre qu'une isolation phonique faible voire négligeable (surtout dans le grave) et les solutions sont donc à rechercher soit dans le casque à réduction de bruit active soit dans le casque intra-auriculaire. Ce dernier, si on en croit la société XX, est le champion de l'isolation acoustique avec des valeurs pouvant dépasser 30 dB. Et effectivement, ce type de casque correctement mis en place vous isole très fortement de l'environnement. Et c'est peut-être une des limites de la formule : cette isolation peut être dangereuse (ne pas entendre arriver un véhicule, par exemple, lorsque vous circulez dans la rue) et aussi psychologiquement désagréable au bout d'un certain temps. Il convient de faire preuve d'une certaine prudence dans l'utilisation de tels casques !" "En revanche, il est évident que cela évitera de monter le niveau pour entendre correctement la musique et là c'est bon pour vos oreilles. À condition naturellement que vous n'en profitiez pas pour faire une orgie de décibels, chose généralement aisée avec les intra-auriculaires qui permettent d'atteindre facilement des niveaux très élevés. Rappelons que le maximum d'exposition recommandé au bruit est de une heure par jour à 94 dB(A) et de seulement 15 mn (toujours par jour !) à 100 dB(A). Ensuite vous risquez des dégâts irréversibles..." (article paru dans: http://www.tomshardware.fr) Des fabricants ont essayé de répondre à ce problème en prévoyant des casques audio ayant un microphone intégré. Cependant, l'utilisateur est alors soumis au bruit ambiant dont il voulait s'isoler et la parole d'un interlocuteur peut être noyée dans le bruit ou souffrir certaines altérations dues à l'acoustique du lieu.
Dans cet ordre d'idée, le brevet US4,491,980 propose un dispositif d'aide auditive comprenant un récepteur radio (tuner), un microphone externe et un mélangeur. Le mélangeur reçoit un premier signal audio issu du récepteur radio et un second signal audio issu du microphone externe. Des circuits de contrôle automatique de gain agencés en amont du mélangeur ajustent automatiquement le volume de chacun des signaux audio en fonction du niveau acoustique détecté par le microphone. Lorsque le niveau acoustique externe est faible, la priorité est donnée au premier signal audio. Lorsque le niveau acoustique externe est élevé, la priorité est donnée au second signal audio (microphone). Ce procédé n'est malheureusement pas utilisable en milieu ambiant bruité puisque le dispositif donne alors automatiquement la priorité au signal bruité externe et il n'est alors plus possible Io d'écouter la radio. La demande US2005/0090295 propose un caque sans fil pour téléphone mobile recevant, via une liaison Bluetooth, un signal audio interne émis par un téléphone, et comportant par ailleurs une paire de microphones fournissant un signal audio externe. Le 15 casque offre un mode de fonctionnement dit "communication" où l'utilisateur entend le signal audio interne et l'utilise comme un caque de téléphone conventionnel, et un mode dit "aide auditive" où le signal audio externe fourni par les microphones est envoyé aux écouteurs après avoir été traité au moyen d'une fonction de 20 correction auditive. La directivité des microphones est ajustée en fonction du mode de fonctionnement de l'appareil, de manière que les microphones captent préférentiellement la voix de l'utilisateur dans le mode "communication" ou les voix de personnes se trouvant en face de l'utilisateur dans le mode "aide 25 auditive". Un ou plusieurs processeurs de traitement de signal sont prévus pour assurer ces divers traitements. Bien qu'offrant une fonction d'aide auditive, ce dispositif isole également l'utilisateur du monde extérieur lorsqu'il est utilisé dans le mode "communication", s'il est réalisé sous forme de casque 30 couvrant les deux oreilles. On le trouve en réalité commercialisé sous forme d'oreillette Bluetooth sous la référence "H3650 Gennum Hearphone" ou "H100 Gennum Hearphone". La présente invention se fonde sur le fait que l'analyse d'un signal audio fourni par un microphone extérieur peut 35 permettre de distinguer des "événements sonores" de différentes natures, notamment de distinguer des événements sonores pouvant
être considérés comme utiles au plan de la sécurité de l'utilisateur ou nécessaires à la communication avec autrui. Ainsi, une idée de la présente invention est de détecter certains événements sonores extérieurs pendant l'utilisation d'un appareil diffusant un signal audio, et d'informer l'utilisateur de la survenance de ces événements. Lorsque de tels événements sont détectés, une autre idée de l'invention est de transférer à l'utilisateur le signal audio externe et/ou un signal audio synthétisé qui informe l'utilisateur qu'un événement sonore a été détecté. Une telle diffusion du signal audio externe et/ou d'un signal audio synthétisé peut être faite en superposition sur le signal audio interne, avec un taux de mélange déterminé. Par ailleurs, le signal audio externe tel que diffusé à l'utilisateur peut faire l'objet d'un traitement visant à ne transférer à l'utilisateur qu'une partie du bruit extérieur, à savoir celle qui contient l'événement sonore utile, afin de préserver. Plus particulièrement, un mode de réalisation de la présente invention concerne un dispositif portable pour l'écoute d'un signal audio, comprenant une source d'un premier signal audio, des moyens de transfert du premier signal audio vers un moyen d'écoute de ce signal, au moins un microphone pour capter des sons provenant de l'extérieur du dispositif portable, fournissant un second signal auudio, et des moyens pour analyser de façon numérique le second signal audio afin d'y détecter au moins un événement sonore déterminé, et transférer vers le moyen d'écoute un signal audio apte à informer un utilisateur de la survenance de l'événement. Selon un mode de réalisation, les moyens d'analyse du second signal audio sont configurés pour détecter en tant qu'événement sonore déterminé au moins l'un des événements suivants : un changement du rapport des niveaux acoustiques de deux bandes de fréquences, des sons ou des bruits impulsionnels, une variation du niveau acoustique capté par le microphone supérieure à un seuil de variation, des mots ou des sons déterminés dont le profil a été préalablement enregistré ou caractérisé. Selon un mode de réalisation, les moyens d'analyse du second signal audio comprennent des moyens de mémorisation de paramètres
de réglage déterminant un mode de fonctionnement du dispositif correspondant à différentes options d'analyse du second signal audio. Selon un mode de réalisation, le dispositif comprend des moyens pour, en réponse à la détection de l'événement, générer et transférer un signal de synthèse vers le moyen d'écoute avec un niveau de mélange déterminé avec le premier signal audio. Selon un mode de réalisation, le dispositif comprend des moyens pour, en réponse à la détection de l'événement, transférer Io le second signal audio vers le moyen d'écoute avec un niveau de mélange déterminé avec le premier signal audio. Selon un mode de réalisation, le dispositif comprend des moyens de sélection d'un mode d'écoute dans lequel le second signal audio est transféré en permanence au moyen d'écoute. 15 Selon un mode de réalisation, le dispositif comprend des moyens de mémorisation d'un paramètre de réglage d'un niveau de mélange par défaut du premier signal audio et du second. signal audio. Selon un mode de réalisation, le dispositif comprend des 20 moyens de traitement du second signal audio, configurés pour privilégier dans le second signal audio certains sons ou bruits provenant de l'extérieur par rapport à d'autres. Selon un mode de réalisation, les moyens de traitement du second signal audio sont configurés pour filtrer dans le second 25 signal audio des signaux de fréquence inférieure à un seuil. Selon un mode de réalisation, les moyens de traitement du second signal audio sont configurés pour appliquer au second signal audio au moins une fonction de correction auditive choisie parmi une fonction "Noise Gate", une fonction antibruit active, 30 une fonction de compression, une fonction d'égalisation et une fonction de filtre physiologique. Selon un mode de réalisation, les moyens de traitement du second signal audio sont configurés pour appliquer au second signal audio une fonction de correction auditive destinée à 35 favoriser l'écoute de sons extérieurs par des malentendants, de sorte que le dispositif peut être utilisé en tant qu'audioprothèse.
Selon un mode de réalisation, le dispositif forme un baladeur numérique ou comprend une fonction de baladeur numérique, la source du premier signal audio comprenant des fichiers audio enregistrés dans le baladeur ou reçu via un récepteur radio.
Selon un mode de réalisation, le dispositif forme un casque antibruit, le premier signal audio étant un signal antibruit. Un mode de réalisation de l'invention concerne également un procédé de traitement d'un signal audio dans un dispositif portable, comprenant les étapes consistant à recevoir un premier signal audio, transférer le premier signal audio vers un moyen d'écoute de ce signal, recevoir un second signal audio issu d'au moins un microphone agencé pour capter des sons provenant de l'extérieur du dispositif portable, analyser de façon numérique le second signal audio pour y détecter au moins un événement sonore, et transférer vers le moyen d'écoute un signal audio apte à informer un utilisateur de la survenance de l'événement. Selon un mode de réalisation, l'étape d'analyse du second signal audio est conduite de manière à détecter en tant qu'événement sonore déterminé au moins l'un des événements suivants : un changement du rapport des niveaux acoustiques de deux bandes de fréquences, des sons ou des bruits impulsionnels, une variation rapide du niveau acoustique capté par le microphone supérieure à un seuil de variation, des mots ou des sons déterminés dont le profil a été préalablement enregistré ou caractérisé. Selon un mode de réalisation, le procédé comprend une étape consistant à mémoriser des paramètres de réglage correspondant à différentes options d'analyse du second signal audio. Selon un mode de réalisation, le procédé comprend l'étape consistant à, en réponse à la détection de l'événement, générer et transférer un signal de synthèse vers le moyen d'écoute avec un niveau de mélange déterminé avec le premier signal audio. Selon un mode de réalisation, le procédé comprend une étape consistant à, en réponse à la détection de l'événement, transférer le second signal audio vers le moyen d'écoute avec un niveau de mélange déterminé avec le premier signal audio.
Selon un mode de réalisation, le procédé comprend une étape consistant à, en réponse à la réception d'un paramètre de mode de fonctionnement, transférer en permanence le second signal audio au moyen d'écoute.
Selon un mode de réalisation, le procédé comprend une étape consistant à mémoriser un paramètre de réglage d'un niveau de mélange par défaut du premier signal audio et du second signal audio. Selon un mode de réalisation, le procédé comprend une étape de traitement du second signal audio pour privilégier dans le second signal audio certains sons ou bruits provenant de l'extérieur par rapport à d'autres. Selon un mode de réalisation, le procédé comprend une étape de filtrage dans le second signal at di o de signaux de fréquence inférieure à un seuil. Selon un mode de réalisation, le procédé comprend une étape consistant à appliquer au second signal audio au moins une fonction de correction auditive choisie parmi une fonction "Noise Gate", une fonction antibruit active, une fonction de compression, une fonction d'égalisation et une fonction de filtre physiologique. Selon un mode de réalisation, le procédé comprend une étape consistant à appliquer au second signal audio une fonction de correction auditive destinée à favoriser l'écoute de sons extérieurs par des malentendants. Selon un mode de réalisation, le procédé est appliqué à un baladeur numérique ou à un dispositif comprenant une fonction de baladeur numérique, la source du premier signal audio comprenant des fichiers audio enregistrés dans le baladeur ou reçu via un récepteur radio. Selon un mode de réalisation, le procédé est appliqué à un casque antibruit, et le premier signal audio est un signal antibruit. Un exemple de réalisation de l'invention sera décrit à titre 35 non limitatif dans ce qui suit, en relation avec les figures jointes parmi lesquelles : - la figure 1 représente sous forme de schéma bloc un exemple de réalisation d'un dispositif selon l'invention, - la figure 2A représente sous forme de schéma bloc un mode de réalisation d'une fonction d'analyse, de décision et de traitement 5 présente dans le dispositif en figure 1, - la figure 2B représente sous forme de schéma bloc un mode de réalisation d'une fonction de traitement présente dans la fonction représentée en figure 2A, - la figure 3 est un organigramme représentant des étapes de 10 détection d'événements sonores par le dispositif, et des actions conduites consécutivement à la détection des événements sonores, - les figures 4A à 4C sont des organigrammes représentant des options de paramétrage du dispositif en relation avec l'écoute d'un signal audio externe, 15 - la figure 5 est un organigramme représentant des options de paramétrage du dispositif en relation avec l'écoute d'un signal audio interne, et - la figure 6 représente sous forme de schéma bloc une variante de réalisation du dispositif. 20 En 1995 déjà, la demande W096/27862 montrait qu'il était possible de détecter efficacement des bruits déterminés dans un environnement acoustique complexe grâce à une analyse numérique du signal audio capté par un microphone. Un ensemble d'échantillons du signal audio était défini au sein d'une fenêtre d'analyse 25 glissante et un algorithme simple était appliqué à cet ensemble de points. Les variations instantanées de l'énergie acoustique captée par le microphone étaient calculées et comparées à un seuil de détection variable proportionnel à l'énergie acoustique moyenne. Des étapes de filtrage permettaient en outre de s'affranchir du 30 bruit de fond non significatif et des bruits lointains. Un système d'alarme utilisant cet algorithme avait été implémenté. Le système pouvait être placé sur un parking en plein air, à coté d'une rue, et se ne déclenchait qu'en présence de bruits localisés dans le périmètre de surveillance, malgré le bruit ambiant important. 35 Depuis les premières applications du type précité, où des algorithmes de traitement d'un signal acoustique étaient embarqués dans des objets électroniques de faibles dimensions, la puissance
de calcul des microprocesseurs, des microcontrôleurs et des DSP (processeurs spécialisés dans le traitement numérique du signal) a considérablement évolué. Certains DSP disponibles dans le commerce ont une puissance de calcul surprenante et sont capables de traiter des flux de donnés importants. Les baladeurs numériques, à l'instar des PDA (Assistant de Données Personnel), deviennent de véritables plateformes informatiques sur lesquelles peuvent être greffés divers logiciels (par exemple le micrologiciel libre Rockbox). De plus, sont déjà commercialisés des baladeurs offrant une fonction de dictaphone. De tels baladeurs sont ainsi équipés d'un microphone et d'une fonction de numérisation et d'enregistrement du signal audio capté par le microphone. Avec l'accroissement de la puissance de calcul, les techniques de reconnaissance vocale ont également considérablement évolué. Des algorithmes de camiande vocale sont aujourd'hui intégrés dans un nombre croissant de dissitifs portables à faible prix de vente, comme des téléphones mobiles et des téléphones fixes sans fil. Sont également de plus en plus utilisés les algorithmes de traitement numérique de signaux audio tels que les algorithmes "antibruit actif" (émission d'un signal en opposition de phase), les algorithmes "Noise Gate" (suppression totale du bruit de fond en dessous d'un seuil), les algorithmes d'égalisation, de filtrage physiologique ("Loudness"), de compression (correction pour les malentendants notamment). Comme indiqué plus haut, la présente invention se base sur le fait qu'une analyse du signal audio fourni par un microphone extérieur peut permettre de distinguer des événements sonores "utiles" au sein d'un "brouhaha" acoustique. La détection d'événements utiles peut reposer sur diverses stratégies et ainsi comprendre plusieurs critères, chaque critère correspondant à un événement particulier ou une catégorie d'événements. Des critères peuvent éventuellement être croisés pour une détection plus précise.
Des exemples de critères représentant chacun un événement acoustique ou un indice d'événement sont décrits ci-dessous à titre non limitatif : io
CRI) Comparaison de la sonie dans deux bandes de fréquences La sonie est une grandeur psychoacoustique qui permet de mesurer l'intensité des sons telle qu'elle est perçue par l'être humain. La sonie est ainsi déterminée par une mesure d'intensité acoustique à laquelle est appliqué un terme correcteur suivant une courbe de sonie normalisée. La sonie de signaux stationnaires est notamment déterminée par les normes DIN 45631 et ISO 532B. Diverses méthodes de mesure de sonie sont connues, notamment celle préconisée par la norme ISO 532, par (Transformée de Fourier rapide) ou filtrage, suivant des niveaux de tiers d'octave pondérés par des coefficients indiqués dans la norme. Pour la détection d'un événement utile, on calcule la sonie SN1 dans une bande de fréquence Fl-F2 et la sonie SN2 dans une bande de fréquence F3-F4. La bande F3-F4 est par exemple la bande 200Hz- 2KHz où se manifeste la plupart des sons "utiles" pour la sécurité des personnes ou la communication (voix, klaxons, sirènes, etc.). La bande Fl-F2 est par exemple la bande 20Hz-200Hz (dans ce cas F2=F3) où se manifestent les bruits assimilables à du bruit de fond non "utile". Un événement utile est détecté si le rapport SN2/SNl est supérieur à un seuil SNth qui peut être choisi égal à 1. CR2-1) Détection de sons ou de bruits impulsionnels La détection de bruit par analyse numérique est une technique connue pouvant être mise en oeuvre de diverses manières : analyse ree1' du signal capté et surveillance de ses variations, détection de fronts d'énergie acoustique dans des bandes de fréquences déterminées, mesure globale des variations d'énergie acoustique instantanée comme décrit par WO96/27862, etc. Selon le type d'événement à détecter, une telle détection peut être conduite sur l'ensemble du spectre audio, ou dans des bandes de fréquences déterminées. Par exemple, des fréquences supérieures à 5 KHz pourraient ne pas être prises en compte afin d'économiser de la puissance de calcul. CR2-2) Détection d'émergence de sons ou de bruits Ce critère s'apparente à la détection d'événements impulsionnels et vise à identifier pratiquement les mêmes événements acoustiques. L'apparition d'un bruit régulier ou récurent (par exemple un battement) ou d'un signal vocal (voix) se traduit par une émergence d'énergie acoustique mesurable, à laquelle on applique un paramètre temporel d'émergence pour écarter les émergences lentes non significatives.
CR3) Détection d'une chute brutale de niveau acoustique Inversement à l'émergence de sons ou de bruits, une chute brutale du niveau acoustique peut former un événement acoustique. On définit également un paramètre temporel permettant de distinguer une chute de niveau lente et une chute de niveau brutale devant être considérée comme un événement ou non. CR4) Reconnaissance de mots clefs La reconnaissance de mots clefs peut être basée sur les méthodes classiques de reconnaissance vocale utilisées dans le domaine de la cc*miande vocale. L'identification de mots clefs peut être faite par mémorisation préalable de modèles de mots, avec ou sans auto-apprentissage, par la caractérisation des mots clefs et la prévision d'un algorithme de détection pour chaque mot clef caractérisé, ou par une analyse plus fine visant l'identification de phonèmes incluant la prise en compte de modèles génériques de rejet (sons perturbateurs ambiants ne devant pas être considérés comme des composantes d'un mot). Des mots clefs utiles liés à la sécurité ou à la communication verbale peuvent être définis, tels que "attention !", "pardon !", "monsieur !", "madame etc. CR5) Reconnaissance de sons clefs Une reconnaissance de "sons clefs" peut également être prévue, pour détecter des événements sonores spécifiques ayant une fonction d'avertissement, tels que des klaxons, sirènes (de police, d'ambulance, de pompier), etc. Divers modèles de sons peuvent être mémorisés ou être identifiés au moyen d'un algorithme de reconnaissance dédié. Ainsi, selon l'invention, une fonction d'analyse d'un signal audio externe pour la détection d'événements utiles est embarquée dans un dispositif portable. Une fonction de décision est associée à la fonction d'analyse, afin de gérer les actions à conduire suite à la détection d'un événement sonore. Les conditions d'utilisation du dispositif, à savoir l'acoustique ambiante (par
exemple ville, campagne, voiture...) peuvent être prises en compte pour affiner le processus d'analyse et de décision. Un exemple de réalisation d'un dispositif portable 1 comportant une telle fonction d'analyse de signal externe est représenté sur la figure 1. Le dispositif 1 comprend une source de signal audio 2 fournissant un signal audio interne AS1, un afficheur 3, un clavier 4 (pouvant comprendre ou être formé par une zone tactile de l'afficheur 3), une source d'alimentation électrique 5, un processeur de signal numérique ou DSP 10 et un étage 20 de transfert du signal audio vers un point d'écoute. Le processeur DSP I0 comprend une unité centrale ou CPU 11, une mémoire programme 12A, une mémoire de données 12B et, si nécessaire, divers codecs 13-1 à 13-i pour coder ou décoder le signal audio AS1 (codec MP3, AAC, POEL.. par exemple).
Dans un mode de réalisation, le dispositif 1 est par exemple un baladeur multimédia. La source de signal audio 2 est alors une mémoire ou un disque dur contenant des fichiers audio, un tuner radio ou une combinaison de ces éléments. Le processeur DSP applique au signal AS1 une fonction de traitement SPF1 exécutée par un ensemble de moyens logiciels et matériels formant les ressources du processeur DSP (mémoire programme 12A, mémoire de données 12B, codecs,...). La fonction SPF1 est représentée schématiquement par un bloc 14 en traits pointillés sur la figure 1, n'ayant pas de frontière matérielle précise au sein du dispositif. Cette fonction peut être complexe et comprendre diverses fonctions de décodage du signal AS1 ainsi que d'autres fonctions de traitement décrites plus loin. Le dispositif 1 est en outre équipé d'un ou de plusieurs microphones, ici trois microphones 30a, 30b, 30c. Un circuit de sélection 31 reçoit les signaux fournis par les microphones et sélectionne l'un de ces signaux ou plusieurs de ces signaux, tout en leur appliquant si nécessaire un traitement électrique (par exemple une preamplification) afin de préparer leur numérisation. Deux microphones 30a, 30b sont par exemple agencés sur la partie avant du dispositif, pour une capture stéréophonique des sons externes, et un microphone 30c est agencé sur le côté ou à l'arrière du dispositif 1. Le signal audio issu des microphones, désigné globalement "AS2" mais pouvant être un signal à plusieurs voies, est envoyé à des convertisseurs ADC 32 du processeur DSP qui le transforment en signal numérique à une ou plusieurs voies. Le processeur DSP applique au signal numérique AS2 une fonction ADPF d'analyse et de décision incluant ici une fonction de traitement. A l'instar de la fonction SPF1, la fonction ADPF est représentée sous la forme d'un bloc en traits pointillés car elle fait intervenir diverses ressources logicielles du processeur DSP et ne présente pas de frontière matérielle précise au sein du processeur. Le processeur DSP comporte également un mélangeur 34, recevant en entrée les signaux AS1 et AS2 et fournissant un signal audio mélangé AS3. Ce mélangeur est ici numérique (logiciel) et est représenté en traits pointillés, n'ayant pas de limite matérielle précise au sein du processeur. Le signal mélangé numérique AS3 est appliqué à l'entrée d'un convertisseur numérique-analogique DAC 15, qui fournit un signal mélangé analogique AS3 désigné par la même référence. L'étage de transfert 20 peut comprendre un amplificateur analogique 21 contrôlé par le CPU, recevant le signal AS3 fourni par le convertisseur DAC 15. L'amplificateur 21 fournit un signal amplifié à un connecteur stéréo 22, par exemple de type jack phono ou RCA/CINCH, permettant de connecter au dispositif un casque passif filaire 40 ou tout autre moyen d'écoute, notamment des écouteurs intra-auriculaires. L'amplificateur 21 peut comprendre un limiteur de volume, par exemple un limiteur à 105dB prévu par certaines législations. L'étage de transfert 20 peut également comprendre un connecteur 23 pour casque actif amplifié 41 ou tout autre moyen d'écoute amplifié, le connecteur 23 fournissant le signal analogique AS3 non amplifié. L'étage 20 peut également comprendre un connecteur 24 pour connecter au dispositif 1 un casque numérique 41', un transmetteur numérique radiofréquence pour chaîne hi-fi sans fil ou tout autre moyen d'écoute acceptant des signaux numériques, le connecteur 24 fournissant par exemple le signal numérique AS3 prélevé à la sortie du mélangeur 34. Enfin, l'étage 20 peut aussi comprendre un transmetteur radiofréquence 25,, par exemple un transmetteur Bluetooth, pour fournir le signal AS3 à un casque sans fil 42 ou tout autre moyen d'écoute sans fil. Afin d'illustrer les diverses possibilités d'utilisation du dispositif 1, il est prévu ici les modes de fonctionnement 5 suivants, sélectionnables par l'utilisateur : - "écoute mixte dynamique", - "écoute mixte forcée", - "écoute extérieure", et -"écoute du signal audio interne uniquement". 10 Dans le mode "écoute mixte dynamique" le signal AS3 comprend le mélange des signaux AS1, AS2 avec une valeur de mélange contrôlée dynamiquement par la fonction d'analyse et de décision ADPF. Dans le mode "écoute mixte forcée" le signal AS3 comprend le mélange des signaux AS1, AS2 avec une valeur de mélange fixe 15 choisie par l'utilisateur. Dans le mode "écoute extérieure", le signal AS3 ne comprend que le signal AS2. Dans le mode "écoute signal interne uniquement" le signal AS3 ne comprend que le signal AS1. L'utilisateur peut également fournir au CPU des paramètres SETi de configuration de la fonction ADPF, des paramètres SETj de 20 sélection des microphones 30a, 30b, 30c et des paramètres SETk de configuration de la fonction SPF1. La figure 2A représente plus en détail un exemple de réalisation de la fonction ADPF et du mélangeur 34. Ce dernier est représenté schématiquement (s'agissant d'un mélangeur numérique) 25 sous la forme d'un additionneur 340 précédé d'un amplificateur 341 de gain G12 recevant le signal AS2 et d'un amplificateur 342 de gain G11 recevant le signal AS1. Le signal AS3 peut donc s'écrire sous la forme AS3= G12*AS2+ Gll*AS1 et présente ainsi un taux de mélange G12/G11 des signaux AS2 et AS1. 30 La fonction ADPF comprend une fonction d'analyse AF, une fonction de décision DF et une fonction de traitement SPF2. La fonction d'analyse AF reçoit le signal audio AS2, recherche dans le signal AS2 les événements sonores déterminés, et fournit à la fonction de décision DF le résultat de cette analyse, ici sous 35 forme de paramètres CRi correspondant chacun à un critère de détection d'un événement. La fonction de décision DF contrôle la fonction de traitement SPF2 ainsi que les gains numériques G11 et G12 définissant le taux de mélange. Les fonctions d'analyse AF et de décision DF jouent un rôle actif dans le fonctionnement du dispositif 1 lorsque celui-ci est dans le mode "écoute mixte dynamique". Dans ce mode de fonctionnement, et sous réserve d'autres modes de réalisation de l'invention décrits ou évoqués plus loin, le signal audio externe AS2 n'est pas transmis aux oreilles de l'utilisateur ou ne lui est transmis qu'avec un niveau de mélange faible, tant qu'un événement i o n'a pas été détecté. Le gain G12 du mélangeur 34 est donc nul ou petit devant le gain G11. Lorsqu'un événement sonore est détecté, la fonction de décision DF modifie le taux de mélange G12/G11 afin que l'utilisateur entende le signal audio externe. La fonction de traitement SPF2 est prévue dans le but de 15 préserver le confort auditif de l'utilisateur, lorsque le signal audio AS2 lui est transmis. Cette fonction est appliquée au signal AS2 avant qu'il ne soit appliqué au mélangeur 34. Elle comprend ici plusieurs modules de traitement représentés plus en détail sur la figure 2B. 20 Dans l'exemple de réalisation représenté sur la figure 2B, la fonction SPF2 comprend un module de filtrage MD1, un module "Noise Gate" MD2 (suppression totale du bruit extérieur si celui-ci est en dessous d'un seuil), un module égaliseur MD3, un module antibruit actif ND4, un module de filtre physiologique MD5 25 (Loudness) un premier module de compression MD6 ou "compression A", un second module de compression MD7 ou "compression B" spécifiquement prévu pour les malentendants, et un module sélecteur SELM. Bien que mis en oeuvre numériquement au moyen d'un algorithme, le module sélecteur SELM est représenté ici sous forme 30 de schéma électrique, dans un but illustratif. Le module SELM comprend en parallèle un filtre passe haut 330 de gain G22 et un filtre passe bas 331 de gain G21 ayant chacun une fréquence de coupure F2. Les crains G21, G22 sont contrôlés par la fonction de décision DF. Les sorties des filtres 330, 331 sont envoyées dans 35 un additionneur 332 pour reconstituer le signal AS2. La fréquence F2 est par exemple égale à 200 Hz. Dans le mode "écoute mixte dynamique" le module SELM permet, sur décision de la fonction DF, de ne laisser passer que les informations sonores d'une fréquence supérieure à 200Hz, pour préserver le confort auditif de l'utilisateur. Les divers modules MD1-MD7 sont des options de confort du type appelé "composants logiciels enfichables" dans le domaine de l'informatique. Ainsi, le dispositif selon l'invention, selon son prix de vente et sa puissance de calcul, peut ne comprendre qu'une partie de ces modules. Par ailleurs, selon le module concerné, l'activation d'un module peut être exclusivement sous le contrôle Io de la fonction de décision DF, exclusivement sous le contrôle de l'utilisateur, ou à la fois sous le contrôle de l'utilisateur et de la fonction DF. Par exemple, le module de filtrage MD1 est activé et paramétré (fréquences de filtrage et gain du filtrage) par la 15 fonction DF et l'utilisateur n'y a pas accès. Ce module peut également être utilisé par la fonction DF comme module sélecteur SELM (qui a été représenté comme un module spécifique dans un souci d'illustration). L'activation du module "Noise Gate" MD2 peut être décidée 20 par l'utilisateur mais peut rester sous le contrôle de la fonction DF qui, en fonction de l'événement détecté, peut décider de le désactiver temporairement, sauf dans les modes de fonctionnement "écoute mixte forcée" et "écoute extérieure" où la fonction DF n'est pas active. 25 L'activation des modules MD3 et MD5 est de préférence sous le contrôle de l'utilisateur qui se voit proposer un menu de configuration spécifique. Toutefois, également, la fonction de décision DF peut désactiver temporairement ces modules dans le mode "écoute mixte dynamique" au moment où un événement est 30 détecté, si ces modules peuvent gêner la perception de l'événement. Le module MD6 de compression A est sous le contrôle de la fonction DF, qui peut décider d'augmenter le taux de compression appliqué au signal AS2 en fonction de la nature de l'événement 35 détecté. Le module MD6 peut par exemple être activé quand un événement détecté est de trop forte ou de trop faible intensité, afin de mieux le faire ressortir aux oreilles de l'utilisateur.
L'activation du module pour malentendant MD7 est laissée à la discrétion de l'utilisateur. Le module MD7 permet de transformer le dispositif en un véritable système d'aide auditive pour malentendants et est donc purement optionnel. En sus de la compression du signal, le module MD7 peut exécuter d'autres fonctions de traitement en soi connues et utilisées dans les prothèses auditives. Le module MD7 peut par exemple comprendre une fonction d'égalisation spécifique, qui peut remplacer celle exécutée par le module MD3 lorsque le module MD7 est activé. Il io peut alors être prévu que l'activation du module MD7 désactive automatiquement le module MD3. De même, il peut être prévu que l'activation du module MD7 désactive automatiquement le module MD6. Dans un mode de réalisation, la fonction de traitement 15 exécutée par le module MD7 est déterminée par un audioprothésiste et le module MD7 est chargé dans le dispositif après son achat, par l'intermédiaire d'une connexion informatique, le processeur DSP étant par exemple doté d'un port de communication lla permettant la personnalisation du dispositif portable 1. 20 Le module antibruit actif MD4, à la différence du module "Noise Gate", nécessite de capter un son externe pour y réinjecter un signal en opposition de phase. Si les microphones 30a, 30b sont activés, le signal issu du troisième microphone 30c peut être utilisé par le module MD4 pour générer un signal antibruit /AS2 25 qui supprime en grande partie le bruit ambiant capté par les microphones 30a, 30b. Dans ce cas, un traitement peut être appliqué au signal AS2 afin de mettre en valeur les événements sonores utiles, de manière que le mélange du signal AS2 avec le signal antibruit /AS2 ne neutralise pas la perception de ces 30 événements. Le module antibruit MD4 peut aussi être utilisé pour générer le signal antibruit /AS2 pendant l'écoute du signal audio interne AS1, dans le mode "écoute du signal audio interne uniquement", afin que l'utilisateur puisse écouter de la musique sans être gêné 35 par le bruit ambiant. Dans ce cas, les signaux /AS2 et AS1 sont mélangés sans injection du signal AS2 dans les écouteurs.
Un mode de fonctionnement supplémentaire ou "mode silence" peut également être prévu pour utiliser le dispositif 1, en combinaison avec des écouteurs stéréo, comme un casque antibruit. Ce mode de fonctionnement est identique au précédent mais le signal interne AS1 n'est pas transmis aux oreilles de l'utilisateur. Dans ce cas, seul le signal antibruit /AS2 est transmis à l'utilisateur. Les microphones 30a, 30b peuvent être des microphones directifs, par exemple cardioïdes, et le microphone 30c être un Io microphone omnidirectionnel. Un menu spécifique peut être prévu pour permettre à l'utilisateur de sélectionner un ou deux de ces microphones dans les modes "écoute mixte forcée" ou "écoute extérieure" (paramètres SEIj). Dans le mode "écoute mixte dynamique" où la fonction d'analyse AF recherche des événements 15 sonores, le choix du ou des microphones à utiliser peut être laissé à la fonction AF. Celle-ci peut notamment analyser tour à tour les signaux audio captés de façon unidirectionnelle ou omnidirectionnelle pour mieux identifier les événements sonores ou pour identifier la position de leur source dans l'espace. La 20 fonction AF peut ensuite donner la priorité à tel ou tel microphone afin d'aider l'utilisateur à mieux percevoir l'événement sonore détecté. La figure 3, partie gauche, est un organigramme qui décrit schématiquement le processus de recherche et de détection 25 d'événement par la fonction AF. L'analyse du signal AS2 est conduite sur un ensemble d'échantillons numérisés formant le signal AS1. Chaque ensemble d'échantillons forme une fenêtre d'analyse qui est rafraichie cycliquement soit de façon glissante (remplacement d'une partie seulement des échantillons par des 30 nouveaux échantillons) soit de façon segmentée (remplacement de tous les échantillons de la fenêtre) en fonction de la puissance de calcul du processeur DSP et du nombre de critères de détection. Les critères mis en oeuvre ici sont les critères CR1 à CR5 décrits plus haut, à savoir : 35 CR1 : Sonie de la bande 200-2KHz >- sonie de la bande 20-200 Hz (soit F1, F2, F3, F4 respectivement égales à 20Hz, 200Hz, 200Hz, 2 KHz et le seuil SNth égal à 1)
CR2 : Détection de son/bruit impulsionnel et détection d'émergence de son/bruit, CR3 : Détection d'une chute brutale de niveau acoustique, CR4 : Reconnaissance de mots clefs, CR5 : Reconnaissance de sons clefs. A l'instar des modules de traitement MD1-MD7, les critères CR1 à CR5 peuvent être des composants logiciels enfichables et des mises à jour de ces composants peuvent être prévues via l'interface de communication lia du processeur DSP, ainsi que lo l'ajout de nouveaux critères, moyennant une mise à jour correspondante de la fonction de décision DF. Ainsi, dans un mode de réalisation simplifié de l'invention, le dispositif 1 peut ne comprendre que l'un de ces critères, par exemple le critère CRI qui permet de détecter diverses catégories d'événements sonores. 15 Par ailleurs, bien que l'on ait représenté schématiquement sur la figure 1 un seul processeur DSP, il apparaitra ici clairement à l'homme de l'art que plusieurs processeurs peuvent être prévus dans le dispositif 1, notamment un DSP spécifique pour exécuter la fonction d'analyse, de décision et de traitement ADPF. 20 La partie droite de la figure 3 représente des exemples de décisions prises par la fonction DF en réponse à la validation de chaque critère (se traduisant ici par le passage à 1 d'un paramètre CRi fourni par la fonction d'analyse AF). Outre des actions sur le gain G12/G11, la fonction DF conduit d'autres 25 actions liées au mode de fonctionnement du dispositif et à des options de paramétrage offertes à l'utilisateur. Avant de décrire la partie droite de la figure 3, on se référera ainsi préalablement aux figures 4A à 4C qui représentent des exemples d'options de réglage pouvant être offertes à l'utilisateur. 30 La figure 4A représente des options offertes à l'utilisateur dans le mode "écoute mixte dynamique", la figure 4B représente des options offertes par le mode "écoute mixte forcée", la figure 4C représente des options offertes par le mode "écoute extérieure". Dans le mode "écoute du signal audio interne uniquement", les 35 options d'analyse et de traitement du signal audio externe AS2 ne sont plus actives et l'utilisateur se voit seulement proposer les
options de traitement de la fonction SPF1, illustrées sur la figure 5 décrite plus loin. On distingue sur la figure 4A plusieurs catégories d'options se rapportant respectivement : i) au mode d'utilisation du dispositif portable 1, ii) à la détection d'événements par la fonction AF, et iii) au paramétrage de la fonction de traitement SPF2, en supposant ici que tous les composants logiciels enfichables soient présents dans le dispositif. io Il apparaît également sur la figure 4A que l'utilisateur a accès à des réglages de la fonction SPF1 représenté sur la figure 5, qui sera décrite plus loin. Les options (i) relatives au mode d'utilisation comprennent des options "Polyvalent", "Voiture", "Parole", "Ville", "Nature", i5 "Concert". A chaque mode d'utilisation correspond un paramétrage spécifique préprogrammé pour la détection des événements, c'est-à-dire pour la mise en oeuvre des critères CR1-CRS, ainsi qu'un paramétrage spécifique des modules de traitement MD1 et MD6 d'une part et des modules MD2, MD3, MD4, MD5, MD7 d'autre part, sauf si 20 l'utilisateur désactive ces derniers. Dans le mode "polyvalent", les fonctions d'analyse AD et de décision DF choisissent de façon dynamique et par auto-apprentissage d'utiliser le mode Voiture, Parole, Ville, Nature ou Concert en fonction du type d'événement le plus souvent détecté. 25 Les options (ii) relatives à la détection des événements comprennent un mode de détection automatique dans lequel tous les critères sont actifs et un mode personnalisé dans lequel l'utilisateur peut désactiver individuellement chacun des critères (ON/OFF). Le mode personnalisé est destiné à l'utilisateur 30 expérimenté et bascule automatiquement sur le mode automatique après un laps de temps, à titre de précaution. Ce mode n'est aucunement obligatoire et n'est décrit ici qu'à titre d'exemple des possibilités d'exploitation du dispositif. Par exemple, l'utilisateur peut souhaiter désactiver le critère CRI (mesure de 35 sonie) s'il a constaté, après avoir consulté un rapport de détection d'événements fourni par le processeur DSP, que dans certaines conditions d'utilisation ce module détecte trop souvent
des événements sonores que l'utilisateur n'a pas besoin d'entendre. Les options (iii) relatives au traitement du signal audio externe AS2 par la fonction SPF2 peuvent également être contournées au moyen d'une option "automatique" ou être au contraire paramétrées au moyen de l'option "personnalisé". Dans ce cas l'utilisateur a le choix d'activer ou de désactiver individuellement les modules "Noise Gate" MD2, "Compression B" MD7, filtre physiologique MD5, le module antibruit actif NE4 et Io peut entrer dans le menu du module égaliseur NDID3 (non représenté). Enfin, il peut aussi être prévu de proposer à l'utilisateur de déterminer le taux de mélange par défaut, soit le rapport des gains G12/G11, en choisissant une valeur de mélange comprise entre 0 (signal externe AS2 inaudible) et 10 (signal AS2 audible). Dans 15 ce cas, l'utilisateur entend toujours, à faible niveau, les sons extérieurs, de préférence sous forme traitée ("Noise Gate", etc.), y compris en l'absence de détection d'événement sonore par la fonction AF. Une détection d'événement a seulement pour effet d'augmenter sensiblement le niveau du signal AS2. 20 On se référera de nouveau à la figure 3, partie droite, où des exemples de décisions prises par la fonction DF en réponse à la détection d'événements sonores sont représentés. Dans un souci de simplicité, on. ne décrira pas ici des exemples de recoupement de critères et l'on considérera que chaque critère correspondant à 25 la détection d'un événement sonore déterminé ou d'une catégorie d'événements, de sorte qu'un ensemble de décisions et un seul est associé à chaque critère. Il est à la portée de l'homme de l'art de prévoir, en cas de concomitance, de définir des priorités entre critères. Par exemple si une détection de mot clef (CR4=1) 30 intervient simultanément à une augmentation significative de la sonie (CR1=1), alors l'événement détecté est l'événement "détection de mot clef" lié au critère CR4 plutôt qu'un événement lié au critère CRI (qui correspond certes à un événement utile mais non identifié dans sa nature exacte). Ainsi, la partie droite 35 de la figure 3 illustre les actions prises lorsque chaque critère est satisfait isolément. Dans chaque cas, le module MD7 pour malentendant (compression B) peut être activé après détection d'un événement, si l'option a été activée ("ON") dans le menu de configuration (Fig. 4A). Critère CRI Si le critère CRI est satisfait, la fonction DF donne la s priorité au signal audio externe AS2 pendant Tl secondes en diminuant le gain G11 et en ajustant le gain G12 pour faire entendre le signal AS2 à un niveau confortable. Le module MD6 (compression A) est activé afin que l'utilisateur puisse détecter des événements de plus faible intensité (cette compression pouvant io être cumulée avec la compression B si le module MD7 est activé). La fonction DF active le module sélecteur SELM afin de couper les signaux de fréquence inférieure à F2 (ici 200 Hz) présents dans le signal AS2. Lorsque le module SELM est activé, le gain G22 est par exemple égal à 1 et le gain G21 égal à 0 (Fig. 2A). Lorsque le 15 module est désactivé les deux gains sont égaux à 1, de sorte que le signal AS2 n'est pas filtré. Critère CR2 Si le critère CR2 est satisfait, la fonction DF donne de nouveau la priorité au signal audio externe AS2, ici pendant T2 20 secondes, en diminuant le gain G11 et en ajustant le gain G12 pour faire entendre le signal AS2 à un niveau confortable. Le module MD6 (compression A) est activé, afin d'offrir une meilleure écoute extérieure en réduisant la dynamique. Le module sélecteur SELM n'est pas activé car le critère CR2 ne permet pas de savoir dans 25 quelle bande de fréquence l'événement s'est produit (sauf si un recoupement avec un autre critère permet ci. le déduire). Critère CR3 Ici la fonction DF donne de nouveau la priorité au signal audio externe AS2, pendant T3 secondes, toujours en diminuant le 30 gain G11 et en ajustant le gain G12 pour faire entendre le signal AS2 à un niveau confortable en tenant compte du fait que le niveau acoustique moyen a chuté. Le module MD6 est activé. Le module SELM n'est pas activé. Les autres modules de traitement sont appliqués au signal AS2 en fonction du mode d'utilisation sélectionné et 35 s'ils n'ont pas été désactivés par l'utilisateur. Un tel critère permet par exemple de détecter la chute du niveau sonore dans un train arrivant en gare, ceci déclenchant alors l'écoute du signal audio externe AS2 pour permettre au voyageur d'entendre le monde extérieur et notamment des messages pouvant être diffusés dans le train. Critère CR4 La fonction DF donne de nouveau la priorité au signal audio externe AS2 en activant ici le mode Parole (Cf. fig. 4A) et en ajustant comme précédemment les gains G11, G12. Le module MD6 (compression A) est activé. Le module sélecteur SELM est activé, afin de privilégier la voix. Les autres modules de traitement MD2, Io MD3, MD4, MD5, MD7 assurent également le traitement du signal AS2 si l'utilisateur ne les a pas désactivés. Dans un mode de réalisation, des modèles simples de mots clefs (modèles de type temps/fréquence) peuvent être enregistrés par l'utilisateur lui-même au cours d'une phase d'apprentissage. 15 La reconnaissance de tels mots clefs nécessite une faible puissance de calcul. Ces mots clefs (par exemple "pardon", "excusez-moi"...) peuvent ensuite être prononcés par l'utilisateur lui-même afin d'activer l'écoute extérieure. Ces mots clefs deviennent ainsi des sortes de commandes vocales qui permettent à 20 l'utilisateur de commander le fonctionnement du dispositif. Par ailleurs, et inversement au résultat recherché par la détection d'événements sonores, des mots clefs visant à empêcher le signal audio externe AS2 d'être amené aux oreilles de l'utilisateur pourraient être prévus. Par exemple, en prononçant 25 le mot "silence" l'utilisateur pourrait demander au dispositif de couper temporairement la transmission du signal AS2. Critère C R5 La fonction DF donne la priorité au signal audio externe AS2, pendant T5 secondes en diminuant le gain Gll et en ajustant 30 le gain G12 pour faire entendre le signal extérieur AS2 à un niveau confortable. Le module MD6 (compression A) est activé et le module SELM est activé ou non en fonction du type de son clef détecté, et la bande de fréquence dans laquelle le son clef présente l'énergie acoustique maximale. 35 Il sera de nouveau noté que l'activation du module MD7 peut toutefois entrainer la désactivation du module MD5. L'activation du module MD7 peut également entrainer la désactivation du module MD3 si une fonction d'égalisation spécifique est exécutée par le module ND7. Par ailleurs le niveau de mélange dans le mode "écoute mixte dynamique" en l'absence de détection d'événement sonore dépend essentiellement du choix fait par l'utilisateur. Le gain G12 pouvant être choisi par défaut égal à 0, le signal AS1 externe peut n'être pas du tout transmis dans les écouteurs ou le casque. La figure 4B représente les options offertes par le mode "écoute mixte forcée". Ces options sont identiques à celles offertes par le mode "écoute mixte dynamique" hormis les options io de détection d'événement puisque la fonction AF est désactivée. Par ailleurs le choix du niveau de mélange par défaut G12/G11 est ici un niveau de mélange permanent puisque la fonction d'analyse AF n'agit plus sur le niveau mélange. Sur la figure 4C sont représentées les options du mode 15 "écoute extérieure". Ces options sont identiques à celles offertes par le mode "écoute mixte forcée" hormis le choix du niveau de mélange par défaut G12/G11 puisque la priorité est donnée ici au signal audio externe. Enfin, dans le mode "écoute du signal audio interne 20 uniquement", toutes les options d'analyse et de traitement du signal AS2 sont inactives et l'utilisateur se voit seulement proposer les options de traitement de la fonction SPF1, illustrées sur la figure 5. Ces options sont également offertes dans les autres modes, y compris dans le mode "écoute extérieure", afin que 25 l'utilisateur puisse paramétrer le dispositif à son gout en une seule opération. On distingue des fonctions classiques d'égalisation préprogranmées telles que "Rock", "Jazz", "Classique", "Parole", ainsi qu'un mode "Personnalisé" donnant accès à des réglages fins (non représentées en détail). 30 En sus de fonctions de décodage du signal AS1, la fonction de traitement SPF1 (fig. 2A) peut elle-même être pourvue de divers modules de traitement, par exemple un module MM1 "Antibruit actif", un module MM2 "Filtre Physiologique" et un module MM3 "Egalisation". Des options d'activation ou de paramétrage 35 correspondants peuvent alors être proposées à l'utilisateur, comme représenté sur la figure 5.
Un module de traitement pour malentendant MM4 peut également être prévu dans la fonction SPF1, comme cela apparaît sur la figure 5. A l'instar du module MD7, il peut être prévu que la fonction exécutée par le module MM4 soit déterminée et réglée par un audioprothésiste puis chargée dans le dispositif au moyen d'une connexion informatique. Il apparaitra clairement à l'homme de l'art que la présente invention est susceptible de diverses variantes de réalisation. Le mode de réalisation décrit dans ce qui précède ne constitue qu'un exemple d'implémentation de l'invention. Notamment, s'il est souhaité de mettre en oeuvre l'invention dans un dispositif de prix de revient minimal, la fonction d'analyse AF pourrait être simplifiée au maximum en ne conservant par exemple qu'un nombre de critères limité, par exemple le critère CRI, permettant de couvrir un grand nombre de situations où l'utilisateur doit être informé de la survenance d'un événement sonore. De même, la fonction de traitement SPF2 pourrait être simplifiée en ne conservant par exemple que le module sélecteur SELM, permettant à lui seul d'offrir un bon confort auditif en supprimant une région de basse fréquence où se trouvent généralement des sons peu agréables et peu utiles pour la sécurité ou la communication avec autrui. Egalement, il sera noté que le mélange des signaux numériques AS1 et AS2 pourrait être fait après conversion de ces signaux en signaux analogiques, soit après le convertisseur DAC 15 en figure 1 (un convertisseur analogique-numérique multivoie serait alors utilisé). Une tendance actuelle est d'intégrer dans les téléphones mobiles ou dans les PDA des fonctions additionnelles de type agenda, appareil photo... mais également une fonction de baladeur numérique (lecteur MP3, récepteur radio numérique, récepteur radio internet WiFi, etc.). Ainsi, les divers modes de réalisation de l'invention décrits dans ce qui précède concernent également les téléphones mobiles ou les PDA de type "baladeur". Des modes de réalisation de l'invention peuvent également viser un téléphone mobile sans fonction de baladeur, dès lors que l'utilisation du. téléphone inclut l'utilisation d'un moyen d'écoute qui isole l'utilisateur du monde extérieur. Dans ce cas,
le signal interne AS1 est le signal vocal reçu par le téléphone via le réseau cellulaire. La présente invention est également susceptible de diverses autres applications. Par exemple, les casques antibruit actifs conventionnels diffusent un signal audio qui n'est pas perçu en tant que tel par l'utilisateur mais est pourtant perçu par l'oreille puisqu'il se trouve en opposition de phase avec le bruit extérieur et procure l'effet antibruit recherché. L'isolement auditif causé par les casques antibruit est important et est parfois compensé par un système de communication radiofréquence qui permet seulement aux personnes équipées de casques similaires de communiquer ensemble. L'implémentation de l'invention dans un casque antibruit permet "d'ouvrir la porte" aux sons extérieurs lorsque ceux-ci sont "utiles". Cela peut par exemple permettre à deux personnes de converser. A cet effet, un algorithme de sélection d'une bande de fréquence centrée sur la voix, avec réjection des bruits ou des sons au-delà de cette bande, peut par exemple être prévu pour éliminer du signal audio externe AS2 les sons se trouvant en dehors de la bande de fréquence de la voix.
Dans un tel mode de réalisation, un signal antibruit /AS1 est généré à partir d'un microphone externe (non représenté) utilisé en tant que source de signal audio 2 (Fig. 1) fournissant le signal AS1. Le signal AS1 n'est pas transmis aux oreilles de l'utilisateur et est seulement utilisé pour générer le signal antibruit /AS1 qui, lui, est transmis à l'utilisateur. Dans ce cas le signal audio AS2 est traité (par exemple fortement filtré) afin de ne comprendre, dans la mesure du possible, que des informations sonores externes utiles à la sécurité ou à la conversation. La transmission du signal traité AS2 aux oreilles de l'utilisateur, en superposition avec le signal antibruit /AS1, peut être assujettie à la détection d'un événement sonore (équivalent au mode "écoute mixte dynamique") ou être permanente (équivalent au mode "écoute mixte forcée"). Dans encore un autre mode de réalisation de l'invention, on génère un signal audio de synthèse en réponse à la détection d'un événement sonore par la fonction d'analyse AF. Ce signal audio de synthèse peut par exemple comprendre une suite de "bip" et est injecté dans le signal audio interne AS1 au moyen du mélangeur 34, à la place du signal audio externe AS2 ou en superposition avec celui-ci. La figure 6 illustre une modification du dispositif 1 suivant ce dernier mode de réalisation. Un synthétiseur de signal 332 de gain variable G23 fournit un signal synthétisé AS4 qui est appliqué à l'entrée de l'additionneur numérique 332, en parallèle avec les sorties des filtres 330 et 331. Le gain G23 ainsi que l'activation du synthétiseur 332 sont contrôlés par la fonction de décision DF. Ainsi, lorsque la fonction de décision DF est informée par la fonction d'analyse AF de la survenance d'un événement, elle peut décider d'émettre le signal de synthèse AS4 comme "avertisseur sonore" et de l'injecter dans l'additionneur 332 avec un gain déterminé, tout en contrôlant les gains G22, G11 des filtres 330, 331. Le signal fourni par l'additionneur 332 est alors égal à AS2+AS4 et est appliqué au mélangeur 34 (fig. 1). Selon les valeurs conférées aux gains G11, G22, G23, ce signal peut comprendre un mélange du signal AS2 et du signal de synthèse AS4, ou ne comprendre que le signal de synthèse AS4. Dans ce dernier cas, l'utilisateur n'entend que le signal de synthèse sur détection d'un événement sonore déterminé et peut décider de basculer dans le mode "écoute extérieure". Alternativement, le signal audio externe AS2 peut être transmis automatiquement à l'utilisateur après l'émission du signal de synthèse AS4, immédiatement ou après qu'un laps de temps se soit écoulé.

Claims (26)

REVENDICATIONS
1. Dispositif portable (1) pour l'écoute d'un signal audio, comprenant : -une source (2) d'un premier signal audio (AS1), - des moyens (20, 34) de transfert du premier signal audio (AS1) 5 vers un moyen d'écoute (22, 23, 24, 41, 42) de ce signal, - au moins un microphone (30a) pour capter des sons provenant de l'extérieur du dispositif portable, fournissant un second signal audio (AS2), caractérisé en ce qu'il comprend des moyens (DSP1, 33, 34, 10 330, 331, 332, AF, DF, SELM) pour : - analyser de façon numérique le second signal audio (AS2) afin d'y détecter au moins un événement sonore déterminé, et - transférer vers le moyen d'écoute un signal audio (AS2, AS4) apte à informer un utilisateur de la survenance de l'événement. 15
2. Dispositif selon la revendication 1, dans lequel les moyens d'analyse du second signal audio sont configurés pour détecter en tant qu'événement sonore déterminé au moins l'un des événements suivants : 20 - (Ai) un changement du rapport des niveaux acoustiques de deux bandes de fréquences, - (A2) des sons ou des bruits impulsionnels, - (A2, A3) une variation du niveau acoustique capté par le microphone supérieure à un seuil de variation, 25 - (A4, A5) des mots ou des sons déterminés dont le profil a été préalablement enregistré ou caractérisé.
3. Dispositif selon l'une des revendications 1 et 2, dans lequel les moyens d'analyse du second signal audio comprennent des 30 moyens de mémorisation de paramètres (SETi) de réglage déterminant un mode de fonctionnement du dispositif correspondant à différentes options d'analyse du second signal audio.
4. Dispositif selon l'une des revendications 1 à 3, 35 comprenant des moyens pour, en réponse à la détection de 28 l'événement, générer et transférer un signal de synthèse (AS4) vers le moyen d'écoute avec un niveau de mélange déterminé avec le premier signal audio (AS1).
5. Dispositif selon l'une des revendications 1 à 4 comprenant des moyens pour, en réponse à la détection de l'événement, transférer le second signal audio (AS2) vers le moyen d'écoute avec un niveau de mélange déterminé avec le premier signal audio (AS1).
6. Dispositif selon l'une des revendications 1 à 4, comprenant des moyens de sélection d'un mode d'écoute dans lequel le second signal audio (AS2) est transféré en permanence au moyen d'écoute.
7. Dispositif selon l'une des revendications 5 et 6, comprenant des moyens de mémorisation d'un paramètre (SETi) de réglage d'un niveau de mélange par défaut (G12/G11) du premier signal audio (AS1) et du second signal audio (AS2). 20
8. Dispositif selon l'une des revendications 5 à 7, comprenant des moyens (DSP, 33, SPF2, 330, 331) de traitement du second signal audio (AS2), configurés pour privilégier dans le second signal audio (AS2) certains sons ou bruits provenant de 25 l'extérieur par rapport à d'autres.
9. Dispositif selon la revendication 8, dans lequel les moyens de traitement du second signal audio sont configurés pour filtrer dans le second signal audio (AS2) des signaux de fréquence 30 inférieure à un seuil (F2).
10. Dispositif selon l'une des revendications 8 et 9, dans lequel les moyens de traitement du second signal audio sont configurés pour appliquer au second signal audio au moins une 35 fonction de correction auditive choisie parmi une fonction "Noise Gate", une fonction antibruit active, une fonction de compression,15une fonction d'égalisation et une fonction de filtre physiologique.
11. Dispositif selon l'une des revendications 8 à 10, dans lequel les moyens de traitement du second signal audio sont configurés pour appliquer au second signal audio une fonction de correction auditive destinée à favoriser l'écoute de sons extérieurs par des malentendants, de sorte que le dispositif peut être utilisé en tant qu'audioprothèse. io
12. Dispositif portable (1) selon l'une des revendications 1 à 11, formant un baladeur numérique ou comprenant une fonction de baladeur numérique, la source (2) du premier signal audio (AS1) comprenant des fichiers audio enregistrés dans le baladeur ou reçu 15 via un récepteur radio.
13. Dispositif portable selon l'une des revendications 1 à 11, formant un casque antibruit, le premier signal audio (AS1) étant un signal antibruit. 20
14. Procédé de traitement d'un signal audio dans un dispositif portable (1), comprenant les étapes consistant à : - recevoir un premier signal audio (AS1), - transférer le premier signal audio vers un moyen d'écoute (22, 25 23, 24, 41, 42) de ce signal, - recevoir un second signal audio (AS2) issu d'au moins un microphone (30a) agencé pour capter des sons provenant de l'extérieur du dispositif portable, caractérisé en ce qu'il comprend les étapes consistant à : 30 - analyser de façon numérique le second signal audio (AS2) pour y détecter au moins un événement sonore, et - transférer vers le moyen d'écoute un signal audio (AS2, AS4) apte à informer un utilisateur de la survenance de l'événement. 35
15. Procédé selon la revendication 14, dans lequel l'étape d'analyse du second signal audio est conduite de manière àdétecter en tant qu'événement sonore déterminé au moins l'un des événements suivants : - (A1) un changement du rapport des niveaux acoustiques de deux bandes de fréquences, - (A2) des sons cu des bruits impulsionnels, - (A2, A3) une variation rapide du niveau acoustique capté par le microphone supérieure à un seuil de variation, - (A5, A6) des mots ou des sons déterminés dont le profil a été préalablement enregistré ou caractérisé.
16. Procédé selon l'une des revendications 14 et 15, comprenant une étape consistant à mémoriser des paramètres (SETi) de réglage correspondant à différentes options d'analyse du second signal audio.
17. Procédé selon l'une des revendications 14 à 16, comprenant l'étape consistant à, en réponse à la détection de l'événement, générer et transférer un signal de synthèse (AS4) vers le moyen d'écoute avec un niveau de mélange déterminé avec le premier signal audio (AS1).
18. Procédé selon l'une des revendications 14 à 17, comprenant une étape consistant à, en réponse à la détection de l'événement, transférer le second signal audio (AS2) vers le moyen d'écoute avec un niveau de mélange déterminé avec le premier signal audio (AS1).
19. Procédé selon l'une des revendications 14 à 18, comprenant une étape consistant à, en réponse à la réception d'un paramètre de mode de fonctionnement, transférer en permanence le second signal audio (AS2) au moyen d'écoute.
20. Procédé selon l'une des revendications 18 à 19, comprenant une étape consistant à mémoriser un paramètre (SEI'i) de 35 réglage d'un niveau de mélange par défaut (G12/G11) du premier signal audio (AS1) et du second signal audio (AS2).
21. Procédé selon l'une des revendications 18 à 20, comprenant une étape de traitement du second signal audio (AS2) pour privilégier dans le second signal audio (AS2) certains sons ou bruits provenant de l'extérieur par rapport à d'autres.
22. Procédé selon l'une des revendications 18 à 21, comprenant une étape de filtrage dans le second signal audio (AS2) de signaux de fréquence inférieure à un seuil (F2). io
23. Procédé selon l'une des revendications 18 à 22, comprenant une étape consistant à appliquer au second signal audio au moins une fonction de correction auditive choisie parmi une fonction "Noise Gate", une fonction antibruit active, une fonction de compression, une fonction d'égalisation et une fonction de 15 filtre physiologique.
24. Procédé selon l'une des revendications 18 à 23, comprenant une étape consistant à appliquer au second signal audio une fonction de correction auditive destinée à favoriser l'écoute 20 de sons extérieurs par des malentendants.
25. Procédé selon l'une des revendications 14 à 24, appliqué à un baladeur numérique ou à un dispositif comprenant une fonction de baladeur numérique, la source (2) du premier signal audio (AS1) 25 comprenant des fichiers audio enregistrés dans le baladeur ou reçu via un récepteur radio.
26. Procédé selon l'une des revendications 14 à 24, appliqué à un casque antibruit, dans lequel le premier signal audio (AS1) 30 est un signal antibruit.5
FR0706832A 2007-09-28 2007-09-28 Procede de traitement d'un signal audio dans un dispositif portable Pending FR2921747A1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
FR0706832A FR2921747A1 (fr) 2007-09-28 2007-09-28 Procede de traitement d'un signal audio dans un dispositif portable
EP08862314A EP2206236A1 (fr) 2007-09-28 2008-09-29 Baladeur audio ou audio-video comprenant des moyens de capture d'un signal audio externe
PCT/FR2008/001352 WO2009077665A1 (fr) 2007-09-28 2008-09-29 Baladeur audio ou audio-video comprenant des moyens de capture d'un signal audio externe

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0706832A FR2921747A1 (fr) 2007-09-28 2007-09-28 Procede de traitement d'un signal audio dans un dispositif portable

Publications (1)

Publication Number Publication Date
FR2921747A1 true FR2921747A1 (fr) 2009-04-03

Family

ID=39671357

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0706832A Pending FR2921747A1 (fr) 2007-09-28 2007-09-28 Procede de traitement d'un signal audio dans un dispositif portable

Country Status (1)

Country Link
FR (1) FR2921747A1 (fr)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050090295A1 (en) * 2003-10-14 2005-04-28 Gennum Corporation Communication headset with signal processing capability
WO2006076369A1 (fr) * 2005-01-10 2006-07-20 Targus Group International, Inc. Appareil de derivation pour casque audio et procede correspondant
WO2007007916A1 (fr) * 2005-07-14 2007-01-18 Matsushita Electric Industrial Co., Ltd. Appareil de transmission et procede permettant de generer une alerte dependant de types de sons
JP2007243493A (ja) * 2006-03-07 2007-09-20 Sanyo Electric Co Ltd 携帯機器

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050090295A1 (en) * 2003-10-14 2005-04-28 Gennum Corporation Communication headset with signal processing capability
WO2006076369A1 (fr) * 2005-01-10 2006-07-20 Targus Group International, Inc. Appareil de derivation pour casque audio et procede correspondant
WO2007007916A1 (fr) * 2005-07-14 2007-01-18 Matsushita Electric Industrial Co., Ltd. Appareil de transmission et procede permettant de generer une alerte dependant de types de sons
JP2007243493A (ja) * 2006-03-07 2007-09-20 Sanyo Electric Co Ltd 携帯機器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BASU S ET AL: "Smart headphones: enhancing auditory awareness through robust speech detection and source localization", 2001 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING. PROCEEDINGS. (ICASSP). SALT LAKE CITY, UT, MAY 7 - 11, 2001; [IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP)], NEW YORK, NY : IEEE, US, vol. 5, 7 May 2001 (2001-05-07), pages 3361 - 3364, XP010803362, ISBN: 978-0-7803-7041-8 *

Similar Documents

Publication Publication Date Title
US11710473B2 (en) Method and device for acute sound detection and reproduction
US9747367B2 (en) Communication system for establishing and providing preferred audio
EP2518724B1 (fr) Combiné audio micro/casque comprenant des moyens de débruitage d'un signal de parole proche, notamment pour un système de téléphonie "mains libres"
EP3081011B1 (fr) Dispositif d'écoute sensible au nom
JP6325686B2 (ja) ヘッドセットと音源との間のオーディオの協調的処理
JP6374529B2 (ja) ヘッドセットと音源との間のオーディオの協調的処理
EP3171612A1 (fr) Casque audio à contrôle actif de bruit, contrôle anti-occlusion et annulation de l'atténuation passive, en fonction de la présence ou de l'absence d'une activité vocale de l'utilisateur de casque
EP2930942A1 (fr) Casque audio à contrôle actif de bruit anc avec réduction du souffle électrique
FR3021180A1 (fr) Casque audio a controle actif de bruit anc avec prevention des effets d'une saturation du signal microphonique "feedback"
US11832072B2 (en) Audio processing using distributed machine learning model
US11849274B2 (en) Systems, apparatus, and methods for acoustic transparency
WO2009097009A1 (fr) Procédé et dispositif de contrôle de matrice de liaison d'un écouteur
WO2019228329A1 (fr) Dispositif auditif personnel, dispositif de traitement sonore externe et produit programme d'ordinateur associé
WO2017207286A1 (fr) Combine audio micro/casque comprenant des moyens de detection d'activite vocale multiples a classifieur supervise
EP2206236A1 (fr) Baladeur audio ou audio-video comprenant des moyens de capture d'un signal audio externe
FR2921747A1 (fr) Procede de traitement d'un signal audio dans un dispositif portable
FR2921746A1 (fr) Baladeur audio ou audio-video comprenant des moyens de capture d'un signal audio externe
US20240127785A1 (en) Method and device for acute sound detection and reproduction
US20240127850A1 (en) Preserving sounds-of-interest in audio signals
US20240127844A1 (en) Processing and utilizing audio signals based on speech separation
US20240127843A1 (en) Processing and utilizing audio signals according to activation selections
US20240135951A1 (en) Mapping sound sources in a user interface
FR3073694A1 (fr) Procede de sonorisation live, au casque, tenant compte des caracteristiques de perception auditive de l’auditeur
WO2023242841A1 (fr) Traitement et utilisation de signaux audio