FR2762180A1 - Selective acoustic amplification procedure - Google Patents

Selective acoustic amplification procedure Download PDF

Info

Publication number
FR2762180A1
FR2762180A1 FR9704859A FR9704859A FR2762180A1 FR 2762180 A1 FR2762180 A1 FR 2762180A1 FR 9704859 A FR9704859 A FR 9704859A FR 9704859 A FR9704859 A FR 9704859A FR 2762180 A1 FR2762180 A1 FR 2762180A1
Authority
FR
France
Prior art keywords
frequency
signal
speech
bands
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9704859A
Other languages
French (fr)
Other versions
FR2762180B1 (en
Inventor
Roland Roger Carrat
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to FR9704859A priority Critical patent/FR2762180B1/en
Publication of FR2762180A1 publication Critical patent/FR2762180A1/en
Application granted granted Critical
Publication of FR2762180B1 publication Critical patent/FR2762180B1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • H04R25/505Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility

Abstract

The sound signal at all times has a frequency spectrum, the envelope of which presents a certain number of peaks. The interval of frequencies is divided corresponding to the spectrum of the speech into n frequency bands. The width and the central frequency of the main bands are determined with a view to retaining the values in which evolve with the greatest probability the formative parts of speech for the language under consideration. On each occasion, a selection is made of the k formant bands (k is less than n) in which the peaks evolve. Also on each occasion k command signals are formed, the amplitude of which is proportional to the energy of the peaks or of the band. K electrical coding signals are modulated each time in terms of the k command signals, and with the aid of at least one of the parameters frequency and amplitude.

Description

La présente Invention a pour objet un procédé de détection et d'amplification sélective des sons de la parole afin d'augmenter son intelligibilité et sa netteté après dégradation par une transmission défavorable ourler par une déficience auditive et les dispositifs pour la mise en oeuvre du dit procédé
De l'ensemble des signaux acoustiques pouvant etre perçus par l'oreille humaine, les messages vocaux occupent une place p:épondérante. car lis conditionnent la communication orale inter-humaine.
The present invention relates to a method of selective detection and amplification of speech sounds in order to increase its intelligibility and its sharpness after degradation by an unfavorable transmission hemmed by hearing impairment and the devices for implementing said process
Of all the acoustic signals that can be perceived by the human ear, voice messages occupy a significant place. because they condition inter-human oral communication.

Malgré les oerfectionnements apportés par les procédés modernes électroniques le recuell la transmission et l'amplification de la parole restent très souvent générateurs de bruit et de phénomènes de distorsion vocale qui diminuent la qualité du message transmis et le débit d'information. Déjà sensible pour un normo-entendant, cette dégradation est encore plus marquée chez le déficient auditif appareillé. car elle conjugue le bruit et les distorsions Induits par l'appareil prothétique avec un dysfonctionnement du récepteur auditif. La gêne peut être suffisamment d'importance pour entrainer le rejet de la prothèse.Despite the improvements made by modern electronic processes, the receiver, transmission and amplification of speech very often generate noise and vocal distortion phenomena which reduce the quality of the message transmitted and the information rate. Already sensitive for a hearing impaired person, this deterioration is even more marked in the hearing impaired. because it combines the noise and distortions induced by the prosthetic device with a dysfunction of the hearing receptor. The discomfort may be significant enough to cause rejection of the prosthesis.

La qualité des messages vocaux est sous la dépendance des nombreux paramètres physiques et psycho-physiologiques qui interviennent dans la chaîne de communication parlée. N'importe lequel des maillons de cette chaîne peut être en cause aussi bien au niveau de l'émetteur et du signal émis: la parole. qu'au niveau du canal de transmission, ou enfin du récepteur: I'oreille. The quality of the voice messages is dependent on the numerous physical and psycho-physiological parameters which intervene in the chain of spoken communication. Any of the links in this chain can be involved both in terms of the transmitter and the signal sent: speech. than at the level of the transmission channel, or finally of the receiver: the ear.

Le premier maillon conceme l'émission de la voix. Le signal acoustique vocal, né au niveau du larynx et des voies aériennes supra-laryngées du locutew, est en permanence modulé par la conformation variable du conduit (larynx, pharynx, cavité buccale etlou nasale). ce qui conditonne son spectre. C'est un continuum sonore qui, mises à part l'occlusion précédant certaines consonnes (plosives) et les pauses nécessaires à la respiration, ne montre pas de discontinuité. L'absence de hiatus entre les sons élémentaires (ou phonèmes) ou à l'intérieur des mots, ou entre les mots successifs, implique donc que le traitement de ce signal doit être continu, qu'il soit analogique ou numérique. The first link concerns the emission of the voice. The vocal acoustic signal, born at the level of the larynx and the super-laryngeal airways of the locutew, is permanently modulated by the variable conformation of the duct (larynx, pharynx, oral cavity and nasal). which conditions its spectrum. It is a sound continuum which, apart from the occlusion preceding certain consonants (plosives) and the pauses necessary for breathing, does not show any discontinuity. The absence of a hiatus between elementary sounds (or phonemes) or within words, or between successive words, therefore implies that the processing of this signal must be continuous, whether analog or digital.

Le spectre de fréquence de la parole est très large il s'étend de quelques dizaines de Hz à 10 000 ou même 15 000 Hz. II diffère selon le type de parole considéré: voisée, chuchotée ou criée. The frequency spectrum of speech is very wide, ranging from a few tens of Hz to 10,000 or even 15,000 Hz. It differs according to the type of speech considered: voiced, whispered or shouted.

- dans la parole voisée: ce spectre présente une série de raies équidistantes correspondant à la fréquence de vibration de la source laryngée, ou Fréquence dite Fondamentale F0, et à ses fréquences harmoniques dont l'amplitude diminue au fur et 9 mesure que le rang croit. Lors du passage de signal dans les résonateurs supra-laryngés, certaines fréquences sont atténuées, d'autres sont renforcées et apparaissent alors dans le spectre sous la forme de pics bien définis appelés fonnants (F1, F2, F3. etc) (fig 1 représentant le spectre de fréquence de la voyelle lul). L'absence du fondamental n'enfrave pas la compréhension de la parole au niveau sémantique .- in voiced speech: this spectrum presents a series of equidistant lines corresponding to the vibration frequency of the laryngeal source, or so-called fundamental frequency F0, and to its harmonic frequencies whose amplitude decreases as the rank increases . When the signal passes through the supra-laryngeal resonators, certain frequencies are attenuated, others are reinforced and then appear in the spectrum in the form of well-defined peaks called fonnants (F1, F2, F3. Etc) (fig 1 representing the frequency spectrum of the vowel lul). The absence of the fundamental does not interfere with the understanding of speech at the semantic level.

- dans la parole chuchotée ou non voisée, les cordes vocales n'étant pas sollicitées. la voix est faite de bruits dont le spectre devient continu et dont l'énergie est relativement faible (15 dB) sauf au dessus de 2000 Hz. Ce spectre présente cependant des zones de renforcement (bruit de bandes); - enfin. en parole canée. la surpression au niveau des cordes vocales à conduit fermé engendre lors de !'ouverture brutale (attaque glottale) des sons de type volsé å de forte énergle (80 dB).- in whispered or unvoiced speech, the vocal cords are not used. the voice is made of noises whose spectrum becomes continuous and whose energy is relatively low (15 dB) except above 2000 Hz. This spectrum however has areas of reinforcement (band noise); - finally. in word cane. the overpressure at the level of the vocal cords with closed conduit generates at the time of the brutal opening (glottal attack) sounds of the stolen type with strong energetic (80 dB).

La position relative des pics formantiques entre eux (et des bandes de bruit formantlque en voix chuchotée) est caractéristique d'une voyelle donnée. Mais considérés individuellement. on observe une relative variabilité de la fréquence centrale des formants. pour un même locuteur. d'un locuteur à l'autre (voix d'homme. de femme ou d'enfant), d'un individu de même sexe a l'autre, enfin avec la langue considérée (vox de tête voix gutturale) Cette instabilité du signal acoustique de la parole peut être enfin aggravée selon le canal de transmission contingences acoustiques du local, bruit de fond, caractéristiques du canal :téléphone par ex). etc. The relative position of the peaks forming between them (and bands of noise forming in whispered voice) is characteristic of a given vowel. But considered individually. there is a relative variability in the central frequency of the formants. for the same speaker. from one speaker to another (male, female or child's voice), from an individual of the same sex to another, finally with the language considered (vox of head guttural voice) This instability of the signal speech acoustics can finally be worsened depending on the transmission channel local acoustic contingencies, background noise, characteristics of the channel: telephone for example). etc.

Le signal de la parole est très redondant A partir d'un débit physique moyen de 300 000 bitlsec (par comparalson le téléphone transporte 50 000 biUsec). I'oreille fait un premier tn et ne retient que 10 9 20 000 bitlsec Enfin le Système Nerveux Central. en tenant compte de l'expérience linguistique, n'utiliserait que 50 bitlsec. Le signal de la parole peut donc être théoriquement simplifié sans que le message transporté subisse de perte notable d'information. The speech signal is very redundant From an average physical speed of 300,000 bitlsec (by comparison the phone carries 50,000 biUsec). The ear makes a first tn and retains only 10 9 20 000 bitlsec Finally the Central Nervous System. taking into account linguistic experience, would only use 50 bitlsec. The speech signal can therefore be theoretically simplified without the transported message suffering any significant loss of information.

Considérée sous son aspect psycho-acoustique, la parole est un objet sonore qui possède trois dimensions que l'on peut classer par importance décroissante : le temps, la fréquence et le niveau (fig 2). Les propriétés adaptatives de l'oreille font que le niveau semble secondaire, de sorte que pour extraire l'information, L'analyse doit donc porter sur l'évolution des fréquences ou de bandes de fréquences en fonction du temps. L'information, définie comme un taux d'originalité, ne peut être transportée par les parties stables du message, redondantes par définition. Elle ne se trouve pas dans les phonèmes eux-memes (sons élémentaires de la phonétique), mais essentiellement dans la transition d'un phonème à l'autre (les diphonèmes ou phonatomes). La représentation la mieux adaptée à l'étude de la parole et plus précisément des variations spectrales dss tonnants est une sorte de projection de l'objet sonore sur le plan fréquence4emps le sonagramme (fig 3 montrant le sonagramme du mot "parole"). Considered under its psycho-acoustic aspect, speech is a sound object that has three dimensions that can be classified by decreasing importance: time, frequency and level (fig 2). The adaptive properties of the ear make the level seem secondary, so that to extract the information, The analysis must therefore relate to the evolution of frequencies or frequency bands as a function of time. Information, defined as an originality rate, cannot be transported by the stable parts of the message, redundant by definition. It is not found in the phonemes themselves (elementary sounds of phonetics), but essentially in the transition from one phoneme to another (the diphonemes or phonatoms). The representation best suited to the study of speech and more precisely of thunderous spectral variations is a kind of projection of the sound object on the frequency4 time plane the sonogram (fig 3 showing the sonogram of the word "speech").

La perception de la parole et la reconnaissance du message vocal par un sujet normo-entendant ne pose pas difficulté dans un environnement silencieux. Inversement, la présence de bruit surajouté introduit un effet de masque, objectivé, selon son niveau, par un effacement plus ou moins marqués des pics formantiques dans le spectre sonore. La perception ne redevient satisfaisante que si ces pics émergent d'environ 30 dB du bruit de fond (fig 4, montrant en 1 le seuil auditif normal, en 2 le seuil normal de la douleur, en 3 les différents pics fréquentiels formantiques apparaissant à un instant donné dans le mot Iparolel, en 4 la courbe d'enveloppe du spectre d'un bruit de fond résultant d'une conversation de groupe). Speech perception and recognition of the voice message by a normal hearing subject does not pose any difficulty in a silent environment. Conversely, the presence of superimposed noise introduces a mask effect, objectified, depending on its level, by a more or less marked erasure of the formic peaks in the sound spectrum. The perception only becomes satisfactory again if these peaks emerge around 30 dB from the background noise (fig 4, showing in 1 the normal hearing threshold, in 2 the normal pain threshold, in 3 the different formic frequency peaks appearing at a instant given in the word Iparolel, in 4 the envelope curve of the spectrum of a background noise resulting from a group conversation).

En termes de psycho-acoustique, la capacité de l'oreille normale peut être assimilée à un volume qui ne peut recevoir qu'un nombre limité de volumes élémentaires, d'informations élémentaires, les logons, (fig 5 : les logons sont définis par les seuils différentiels dF, dl et dT). La surcharge de la parole par le bruit apporte un excès d'information et introduit un facteur aléatoire dans la discrimination de ces informations élémentaires utiles, pertinentes, par le récepteur auditif (fig 6, montrant que l'oreille ne peut discriminer qu'un nombre limité d'informations élémentaires. On a figuré en gns sur ce schéma. en haut et à gauche le champ auditif résiduel du sourd profond, au centre la zone dite conversationnelle). A cette diminution du débit d'information dùe au bruit. vient s'ajouter chez le déficient auditif. une diminution du débit d'information liée d'une part au rétrécissement du champ auditif (la capacité totale du nombre de logons perceptibles par l'oreille est beaucoup plus limitée) et d'autre part à l'augmentation des seulls différentiels (les logons sont plus gros). Dans les deux situations, la perception optimale de la parole suppose donc une adaptation du flux informatif au débit du canal auditif de l'auditeur (réduction)
Le second maillon de la chaîne de communication parlée est celui du canal de transmission, comprenant d'une part le milieu dans lequel se propagent les vibrations acoustiques de la parole (habituellement aérien occasionnellement gazeux plongeurs spatlonautes) et d'autre part l'appareil amplificatejr proprement dit y compris le transducteur électro-mécanique ( haut-parleur ou écouteur).
In terms of psycho-acoustics, the capacity of the normal ear can be compared to a volume which can only receive a limited number of elementary volumes, elementary information, logons, (fig 5: logons are defined by the differential thresholds dF, dl and dT). Speech overload with noise provides an excess of information and introduces a random factor in the discrimination of this useful, relevant elementary information by the auditory receiver (fig 6, showing that the ear can only discriminate a number limited elementary information. We have figured in gns on this diagram: at the top left the residual hearing field of the deaf, in the center the so-called conversational area). This reduction in the information rate due to noise. is added in hearing impaired. a decrease in the flow of information linked on the one hand to the narrowing of the hearing field (the total capacity of the number of logons perceptible by the ear is much more limited) and on the other hand to the increase in differential thresholds (the logons are bigger). In both situations, optimal speech perception therefore supposes an adaptation of the information flow to the flow of the listener's ear canal (reduction)
The second link in the spoken communication chain is that of the transmission channel, comprising on the one hand the medium in which the acoustic vibrations of speech are propagated (usually aerial occasionally gaseous plungers) and on the other hand the amplificatejr apparatus itself including the electro-mechanical transducer (speaker or earpiece).

Les procédés de transmission - amplification du signal vocal sont obligatoirement entachés de phénomènes de distorsion et d'introduction de bruit dont les causes sont de siège variable et multiples au niveau de l'émetteur (bruits internes, agitation thermo-électronique génératrice de bruit blanc, bruits extérieurs simultanés). - au niveau du canal de transmission (le milieu ambiant: acoustique du local, ondes réfléchies. superposition de plusieurs signaux, superposition de bruits et vibrations aléatoires parasites, affaiblissement du signal par la distance, affaiblissement par les milieux (impédance acoustique), défauts de l'appareil (bande passante, distorsions, résonance, effets de trainage). (dans un circuit classique, I'un des formants de la parole peut par exemple correspondre à un pic de résonance de l'écouteur avec production d'une altération du timbre; chaque étage d'amplification peut aussi modifier le signal dans sa forme eUou son intensité et générer certaines déformations du signal appelées distorsions harmoniques et d'intermodulation); enfin de l'adaptation de l'écouteur (coque, embout, évent ou non, etc). The transmission and amplification processes of the voice signal are necessarily tainted with distortion and noise introduction phenomena, the causes of which are of variable location and multiple at the transmitter level (internal noise, thermo-electronic agitation generating white noise, simultaneous outside noise). - at the level of the transmission channel (the ambient environment: local acoustics, reflected waves. superposition of several signals, superposition of noise and parasitic random vibrations, weakening of the signal by distance, weakening by the media (acoustic impedance), defects in the device (bandwidth, distortions, resonance, drag effects). (in a conventional circuit, one of the speech formants can for example correspond to a peak in resonance of the earpiece with production of an alteration of the timbre; each amplification stage can also modify the signal in its form or its intensity and generate certain distortions of the signal called harmonic distortions and intermodulation); finally the adaptation of the earpiece (shell, end piece, vent or not , etc).

La qualité d'une transduction est habituellement représentée par le rapport signale bruit SIB. Alors que pour les acousticiens, ce rapport est une représentation fidèle de la performance du transducteur ( plus le rapport est élevé, plus la performance est bonne), pour les psycho-acousticiens, la valeur de ce rapport SIB ne représente pas exactement la qualité de la transmission des messages vocaux en raison d'une déténoration de ces messages. Cette dégradation de l'information se traduit par la diminution du score d'intelligibilité de la parole, et par une sensation de distorsion de la hauteur des sons, dont on peut facilement mesurer le degré en ayant recours aux tests vocaux utilisés en audiométrie vocale. The quality of a transduction is usually represented by the signal signal noise SIB. While for acousticians, this ratio is a faithful representation of the performance of the transducer (the higher the ratio, the better the performance), for psycho-acousticians, the value of this SIB ratio does not exactly represent the quality of the transmission of voice messages due to a deterioration of these messages. This deterioration of information results in a decrease in the speech intelligibility score, and in a feeling of distortion of the pitch of sounds, the degree of which can easily be measured by using the voice tests used in speech audiometry.

Le troisième maillon de la chaîne, le récepteur, est constitué par le système auditif. Précédé d'un adaptateur servo-régulé (le système tympanosssiculaire et les muscles de l'oreille moyenne) le véritable récepteur du signal vocal est constitué par l'oreille interne (cochlée). Ce capteur effectue une conversion analogiquedigitale du signal acoustique en transformant les vibrations mécaniques de la membrane basilaire en impulsions électriques véhiculées par les fibres nerveuses auditives. Plus précisément, cette conversion se produit au niveau d'une batterie de capteurs de mouvement ( les cellules de Corti qui reposent sur la membrane basilaire), sensibles non pas à la vitesse du déplacement auquel lis sont soumis, mais à l'accélération. Alors que les théories classiques de l'audition postulent l'existence d'une analyse spectrale du signal au niveau la cochlée et d'une cartographie fréquentielle (tonotopie) la théorie de l'echantillonnage neuro-sensoriel cochléaire proposée par l'auteur, en application du théoréme de Shannon. souscrit au concep; d'un codage des mouvements vibratoires membranaires par échantillonnage spatial des cellules de Corti ( codage des fréquences par les cellules ciliées internes et codage du niveau pour les cellules cillées externes; Outre que cette théorie permet d'expliquer de nombreux paradoxes de la psycho-acoustique (fondamental absent, Insensibilité à la phase, battements etc) elle montre également que la qualité de l'échantillonnage acoustique dépend de la densité des capteurs de Cortl et de celle des cellules nerveuses auditives entrant en connexion avec eux Ainsi. la raréfaction des cellules neuro-sensonelles (surdité par presbyacousle par ex) entraine un abaissement de la limite supérieure d'audibilité aux sons purs et la survenue de distorsions par un phénomène d'ailasing. Leur destruction localisée à la base de la cochlée explique la difficulté d'échantillonnage des transitoires et les confusions des consonnes brèves (plosives) Même en présence de conditions idéales de transmission du signal, I'oreille reste intnnséquement source de distorsions d'autant plus marquées que l'échantillonnage est plus défectueux. Enfin. lorsque certaines fréquences ont disparu du champ auditive, une amplification sélective même surpuissante ne peut être en mesure de redonner une sensation sonore dans la bande considérée, I'oreille interne n'étant plus physiquement capable d'échantililonner le signal acoustique s'il se produit une perception sonore. elle ne peut correspondre qu'à des fréquences "fantômes" générées par aliasing. The third link in the chain, the receiver, is the hearing system. Preceded by a servo-regulated adapter (the tympanosssicular system and the muscles of the middle ear), the real receptor for the voice signal consists of the inner ear (cochlea). This sensor performs an analog digital conversion of the acoustic signal by transforming the mechanical vibrations of the basilar membrane into electrical impulses carried by the auditory nerve fibers. More precisely, this conversion occurs at the level of a battery of movement sensors (the cells of Corti which rest on the basilar membrane), sensitive not to the speed of the displacement to which they are subjected, but to acceleration. Whereas the classical theories of hearing postulate the existence of a spectral analysis of the signal at the level of the cochlea and of a frequency mapping (tonotopy) the theory of cochlear neurosensory sampling proposed by the author, in application of Shannon's theorem. subscribed to the concept; a coding of the vibratory membrane movements by spatial sampling of the cells of Corti (coding of the frequencies by the internal hair cells and coding of the level for the external hair cells; Besides that this theory makes it possible to explain many paradoxes of psycho-acoustics (fundamental absent, insensitivity to the phase, beats, etc.) it also shows that the quality of the acoustic sampling depends on the density of the Cortl sensors and that of the auditory nerve cells entering into connection with them. Thus the rarefaction of neuro cells -sensonelles (deafness by presbyacousle for example) causes a lowering of the upper limit of hearing to pure sounds and the occurrence of distortions by a phenomenon of ailasing. Their localized destruction at the base of the cochlea explains the difficulty of sampling of transients and confusions of brief consonants (plosives) Even in the presence of ideal conditions When transmitting the signal, the ear is always a source of distortion the more marked the more defective the sampling. Finally. when certain frequencies have disappeared from the hearing field, a selective amplification even overpowered cannot be able to restore a sound sensation in the band considered, the inner ear being no longer physically able to sample the acoustic signal if it occurs a sound perception. it can only correspond to "ghost" frequencies generated by aliasing.

Les techniques actuelles de transmission et d'amplification du signal de la parole s'efforcent de reconstituer à la sortie des transducteurs un signal acoustique de spectre fréquentiel le plus large possible (Hi-Fi) et accentuent au besoin l'amplification des bandes de fréquence déficitaires (equalizers). Ces memes techniques sont également retenues lors de la correction prothétique de surdités. Leur principal défaut est de ne pas tenir compte de l'incapacité fonctionnelle de l'oreille qui se comporte comme un filtre vis à vis du signal acoustique qui lui est imposé; aussi complexe soit-il. Par déformation volontaire du spectre, elles aggravent la distorsion du signal acoustique. Current techniques of transmission and amplification of the speech signal endeavor to reconstitute at the output of the transducers an acoustic signal of the widest possible frequency spectrum (Hi-Fi) and accentuate if necessary the amplification of the frequency bands. loss-making (equalizers). These same techniques are also retained during the prosthetic correction of deafness. Their main defect is to ignore the functional incapacity of the ear which behaves like a filter with respect to the acoustic signal which is imposed on it; as complex as it is. By voluntary distortion of the spectrum, they aggravate the distortion of the acoustic signal.

La présente invention a pour objet, inversement, au lieu de transmettre un signal de très large spectre ou de compenser un déficit auditif par une amplification sonore sélective, de procéder à une adaptation du signal a la capacité du recepteur, en effectuant une analyse réductnce de la parole pilis la synthèse d'un nouveau signal codé compatible avec le canal auditif du sujet, en d'autres termes d'adapter le flux d'information au débit du canal auditif (fig 7 montrant schématiquement que le canal de communication du sourd est rétréci au niveau de l'oreille interne eUou des voies neuronales auditives ). The object of the present invention is, conversely, instead of transmitting a signal of very wide spectrum or of compensating for a hearing deficit by selective sound amplification, of carrying out an adaptation of the signal to the capacity of the receiver, by carrying out a reduction analysis of speech pilis the synthesis of a new coded signal compatible with the ear canal of the subject, in other words to adapt the flow of information to the flow of the ear canal (fig 7 schematically showing that the communication channel of the deaf is narrowed at the level of the inner ear or the auditory neural pathways).

Pour améliorer l'intelligibilté et la netteté du signal vocal soumis à dégradation soit au cours de sa transmission et (ou) de son amplification, soit au cours de sa réception par un système auditif déficient, tant sur le plan esthétique que sémantique. la présente invention s'appuie sur deux objectifs 1 la détection par l'oreille des zones fréquentielles formantiques, à l'intérieur desquelles se trouvent et se déplacent les éléments pertinents nécessaires à la reconnaissance de l'information phonétique L'analyse-synthèse de la parole montre que l'information repose sur les variations du support acoustique, du squelette formantique, et plus précisement gu niveau des voyelles, non à l'emplacement des formants sur l'échelle des fréquences mais à leur rapport entre eux, au niveau des consonnes occlusives à leur propre spectre mais aussi à leur Interaction avec F2 de la voyelle voisine (la transition caractériséee par l'inclinaison du formant par sa pente, sert å leur identification , au niveau des constrictives à la durée du bruit. La détection de ces zones formantiques est essentielle. car elle conditionne, au sens donné par la Gestalt-theorie la reconnaissance des "formes sonores" 2 la réduction du bruit de fond. I'extraction de la forme sur le fond. En effet, lors de sa transmission et avant d'atteindre le récepteur !oreille) le signal est surchargé par le bruit de fond du canal et le bruit de fond de l'environnement sous ses multiples aspects. Certes, s la reconnaissance des "formes" acoustiques organisées. support de l'information, est dans les conditions normales d'écoute, favonsée par l'adaptabellte de l'oreille (sa capacité de faire émerger la forme sur le fond en baissant le fond grâce au système ossiculaire, d'augmenter le contraste). et par l'émergence psychologique (par sa prégnance le système auditif est capable de reconstituer les formes d'un signal partiellement détruit à partir des éléments restants: la perception d'une forme est la conscience de sa prévisibilité). elle dépend néanmoins du rapport SlB. L'invention consiste donc à supprimer par filtrage les bandes de bruit entourant les bandes fréquentielles formantiques afin d'améliorer le rapport SlB (le contraste) et favoriser l'émergence des formes sonores de la parole. To improve the intelligibility and clarity of the voice signal subject to degradation either during its transmission and / or its amplification, or during its reception by a deficient hearing system, both aesthetically and semantically. the present invention is based on two objectives 1 the detection by the ear of the frequency forming zones, inside which are and move the relevant elements necessary for the recognition of the phonetic information The analysis-synthesis of the speech shows that the information is based on the variations of the acoustic support, the formantic skeleton, and more precisely gu level of the vowels, not at the location of the formants on the frequency scale but at their relationship between them, at the level of consonants occlusive to their own spectrum but also to their Interaction with F2 of the neighboring vowel (the transition characterized by the inclination of the component by its slope, serves for their identification, at the level of the constrictives for the duration of the noise. Detection of these areas form is essential, because it conditions, in the sense given by the Gestalt theory the recognition of "sound forms" 2 the reduction of the noise of f und the extraction of the form on the bottom. Indeed, during its transmission and before reaching the receiver! Ear) the signal is overloaded by the background noise of the channel and the background noise of the environment in its multiple aspects. Admittedly, s the recognition of organized acoustic "forms". information carrier, is in normal listening conditions, favored by the adaptability of the ear (its ability to bring out the shape on the bottom by lowering the bottom thanks to the ossicular system, to increase the contrast) . and by the psychological emergence (by its dominance the auditory system is able to reconstitute the forms of a partially destroyed signal from the remaining elements: the perception of a form is the awareness of its predictability). it nevertheless depends on the SlB report. The invention therefore consists in suppressing by noise the noise bands surrounding the form frequency bands in order to improve the SlB ratio (the contrast) and favor the emergence of the sound forms of speech.

Le principe de l'invention consiste plus précisément à: 1 sélectionner par une analyse continue du spectre sonore en temps réel au moyen d'une batterie de filtres, les bandes de fréquence dans lesquels évoluent avec la plus grande probabilité les formants de la parole. (la détection très fine des pics formantiques en temps réel sur l'ensemble du spectre de la parole étant difficilement compatible avec la réalisation d'un appareil ambulatoire ). En raison de leur grande Instabilité fréquentielle, on peut en effet définir des largeurs de bande de fréquence dans laquelle évoluent "statistiquement" les différents formants d'un grand nombre d'individu pour une langue donnée, et pendant une durée relativement longue et déterminer une valeur fréquentielle "centrale" pour chaque bande. The principle of the invention consists more specifically in: 1 selecting by continuous analysis of the sound spectrum in real time by means of a battery of filters, the frequency bands in which the speech formants evolve with the greatest probability. (the very fine detection of formic peaks in real time over the entire speech spectrum is hardly compatible with the production of an ambulatory device). Because of their high frequency instability, we can indeed define frequency bandwidths in which the different formants of a large number of individuals evolve "statistically" for a given language, and for a relatively long period and determine a "central" frequency value for each band.

Certaines consonnes ayant une composition spectrale proche de celle d'un bruit (sifflantes), et repérables par la présence d'une bande de bruit à la partie supérieure du champ auditif, leur détection nécessite l'adjonction d'un filtre passe-bande dans cette zone fréquentielle ( en prévision d'une éventuelle transposition dans la zone d'audibilité de certains malentendants (fig 8 montrant schématiquement le siège de la bande de bruit BS généré par certaines consonnes dans le champ auditif et sa situation par rapport aux bandes formantiques). Certain consonants having a spectral composition close to that of noise (wheezing), and identifiable by the presence of a noise band at the upper part of the auditory field, their detection requires the addition of a bandpass filter in this frequency zone (in anticipation of a possible transposition in the audibility zone of certain hearing impaired people (fig 8 schematically showing the seat of the noise band BS generated by certain consonants in the auditory field and its situation in relation to the formic bands) .

2. I'énergie de chaque pic ou de chaque bande étant imputée au formant correspondant, procéder à une amplification sélective de ces bandes dans lesquelles évoluent les pics formantiques afin de privilégier la reconnaissance des traits pertinents de la parole, éléments qui supportent 1" information sémantique. 2. the energy of each peak or of each band being imputed to the corresponding trainer, proceed to a selective amplification of these bands in which the formic peaks evolve in order to favor the recognition of the relevant features of speech, elements which support information semantics.

3. supprimer les zones spectrales susceptibles de générer un effet de masque sur les formants et de se comporter comme du bruit, plus précisément en excluant la transmission des zones fréquentielles anter-formantiques ainsi que, dans le procédé standard réservé au normo-entendant, de la bande formantique FO. (le fondamental n'étant pas indispensable à la reconnaissance vocale). De la sorte, en augmentant le niveau des bandes formantiques et en atténuant, voire en supprimant, le niveau des zones inter-formantiques on accentue le contraste des éléments sonores utiles par rapport au bruit de fond On favorise ainsi la détection des formes sonores, on diminue la probabllté d'erreur de discrimination (confusions avec des maximums parasites ou entre F0 et Fl) et on atténue enfin l'effet psycho-acoustique de masque (un son grave est masquant pour un son plus aigu). La plupart des bruits de la vie quotidienne (circulation automobile, machines électriques groupe conversationnel) ayant un spectre marqué dans les graves, il est plus efficlent de suppnmer le bruit de fond plutôt que d'amplifier l'ensemble du spectre sonore
4 assurer le traltement (détection avec ou sans amplification) d' un nombre optimal de bandes Dans un procédé standard on ne retient que les trois bandes formantiques F1. F2 et F3 qui sont en général suffisamment représentatives de la parole Cependant, les formants F1 et F2 de certaines voyelles étant susceptibles de se recouvrir mutuellement (ce qui entrave de façon aléatoire leur reconnalssance) on peut augmenter la probabilité de reconnaissance de la parole en augmentant le nombre de zones formantiques traitées par l'adjonction par exemple de F4.
3. suppress the spectral zones likely to generate a mask effect on the formants and to behave like noise, more precisely by excluding the transmission of the anter-forming frequency zones as well as, in the standard process reserved for the hearing-impaired, the FO formant band. (the fundamental is not essential for voice recognition). In this way, by increasing the level of the forming bands and by attenuating, or even eliminating, the level of the inter-forming zones, the contrast of the useful sound elements is accentuated in relation to the background noise. decreases the probability of discrimination error (confusion with parasitic maximums or between F0 and Fl) and finally attenuates the psycho-acoustic mask effect (a deep sound is masking for a more acute sound). Most of the noises of everyday life (car traffic, electric machines conversational group) having a marked spectrum in the bass, it is more efficient to suppress the background noise rather than to amplify the whole sound spectrum.
4 ensuring the tralation (detection with or without amplification) of an optimal number of bands. In a standard process, only the three forming bands F1 are retained. F2 and F3 which are generally sufficiently representative of speech However, the formants F1 and F2 of certain vowels being likely to overlap each other (which hampers their recognition in a random way) we can increase the probability of speech recognition by increasing the number of forming zones treated by the addition, for example, of F4.

5. coder chez le sourd un signal acoustique adapté à sa capacité auditive par une analyse-synthèse réductrice de la parole. afin déviter une surcharge d'information. En effet. compte-tenu des caractères spécifiques de l'oreille du sourd, à savoir: - d'une part, I'existence quasi constante de troubles de la sélectivité dl, dF et dT altérés, en général augmentés, (représentée par une augmentation de volume des unités acoustiques élémentaires de la parole ou logons), - d'autre part, une diminution de la capacité auditive par réduction du champ auditif fréquentiel, de la dynamique ( élévation du seuil auditif ) et de la sélectivité temporelle, (représentée par une diminution de volume du récepteur auditif et du nombre total des logons suceptibles d'étre séparément discriminés par l'oreille), la discrimination des logons utiles dans un flux de logons redondant devient nécessairement aléatoire et responsable d'une diminution du score d'intelligibilité. En termes de théorie de la communication, le canal de communication du sourd est rétréci par un goulot d'étranglement situé au niveau de l'oreille interne, ce qui diminue le débit d'information et impose de réduire la redondance du signal (fig 7). 5. coding in the deaf an acoustic signal adapted to their hearing capacity by a reduction-analysis of speech synthesis. to avoid information overload. Indeed. taking into account the specific characteristics of the deaf ear, namely: - on the one hand, the almost constant existence of impaired selectivity dl, dF and dT, generally increased, (represented by an increase in volume elementary acoustic units of speech or logons), - on the other hand, a decrease in hearing capacity by reduction of the frequency auditory field, of dynamics (raising the hearing threshold) and of temporal selectivity, (represented by a reduction volume of the hearing receptor and the total number of logons likely to be separately discriminated by the ear), the discrimination of useful logons in a redundant flow of logons necessarily becomes random and responsible for a decrease in the intelligibility score. In terms of communication theory, the deaf communication channel is narrowed by a bottleneck located at the level of the inner ear, which decreases the flow of information and imposes to reduce the redundancy of the signal (fig 7 ).

Dans la situation la plus générale comportant une élévation du seuil d'audition associée à une perte de sélectivité, on procéde soit à une amplification préalable de l'ensemble des fréquences du spectre auditif complétée par une amplification suffisante des bandes formantiques afin que le niveau de sortie du signal codé se situe à environ 30 dB au dessus du seuil global (en fonction de la tolérance du sujet), soit à une amplification directe et isolée des seules bandes formantiques. In the most general situation involving an increase in the hearing threshold associated with a loss of selectivity, either a prior amplification of all the frequencies of the auditory spectrum is carried out, supplemented by sufficient amplification of the bands so that the level of coded signal output is approximately 30 dB above the global threshold (depending on the subject's tolerance), ie direct and isolated amplification of the form bands only.

Dans les deux cas, cette amplification des bandes formantiques peut être sélective ou non: - dans un premier procédé, on amplifie les bandes F1, F2, F3, voire F4 (fig 9, montrant l'amplification des bandes formantiques dans le champ auditif d'un presbyacousique délimité par le trait en pointillé P), - dans un second procédé, on effectue une translation de l'analyse en fonction de la courbe audiométrique du sourd. Plus précisément, L'analyse et l'amplification porte alors sur les bandes FO, F1, et F2 (fig 10 a), ou ailleurs sur les bandes F2, F3 et F4 (fig 10 b). In both cases, this amplification of the forming bands can be selective or not: - in a first method, the bands F1, F2, F3, or even F4 are amplified (fig 9, showing the amplification of the forming bands in the hearing field d 'a presbyacousic delimited by the dotted line P), - in a second process, we perform a translation of the analysis according to the audiometric curve of the deaf. More specifically, the analysis and amplification then relates to the bands FO, F1, and F2 (fig 10 a), or elsewhere on the bands F2, F3 and F4 (fig 10 b).

6. réaliser une éventuelle transposition de l'information, le principe étant de coder les éléments signifiants de la parole non perçus par le sourd sous la forme d'un signal acoustique émis dans l'échelle résiduelle des fréquences audibles par ce même sourd. Selon le degré ce surdité,
- dans un premier procédé lorsque le champ auditif est trés rétréci, (cas du sourd sévère ou profond), et en général limité à la perception des sons graves, on effectue un codage sonore par transposition. par attribution des bandes formantiques à des bandes fréquentielles discrlmlnables par le sourd (fig 11), soit par codage uniquement de la bande la plus énergétique F2 sur une bande quelconque discriminée par le sourd
- dans un second procédé. lorsque la perte auditive est limitée à la partie supérieure du champ auditif et plus précisément aux fréquences dites supra-conversationnelles dans lesquelles évolue en particulier le bruit des consonnes fricatives, on effectue un codage par transposition de ces dites bandes fréquentielles sur tout ou partie du spectre audible ( sur la totalité du spectre d'audibilité, ou sur une bande large. ou au niveau des intervalles des bandes formantiques) sous la forme d'un signal sonore codé tel qu'un bruit de type aléatoire (bruit blanc, bande de bruit blanc, bruit rose), ledit procédé permettant une discrimination par codage sonore des phénomènes acoustiques brefs de la parole (transitoires) et dont le spectre de fréquence se situe pour une grande part dans la zone supraconversationnelle du champ auditif (fig 12 montrant schématiquement le principe de la transposition d'une bande de bruit consonnantique et non percue par le sourd sous forme d'un signal de type aléatoire émis dans une zone quelconque du champ auditif résiduel du sourd).
6. carry out a possible transposition of information, the principle being to code the signifying elements of speech not perceived by the deaf person in the form of an acoustic signal emitted in the residual scale of the frequencies audible by this same deaf person. Depending on the degree of deafness,
- In a first process when the auditory field is very narrowed, (case of severe or deep deaf), and in general limited to the perception of serious sounds, a sound coding is carried out by transposition. by allocation of the formative bands to frequency bands which can be discriminated by the deaf (FIG. 11), or by coding only the most energetic band F2 on any band discriminated by the deaf
- in a second process. when the hearing loss is limited to the upper part of the hearing field and more precisely to the so-called supra-conversational frequencies in which the noise of the fricative consonants evolves in particular, coding is carried out by transposition of these said frequency bands over all or part of the spectrum audible (over the entire audibility spectrum, or over a wide band. or at the intervals of the forming bands) in the form of a coded sound signal such as random noise (white noise, noise band white, pink noise), said method allowing discrimination by sound coding of brief acoustic phenomena of speech (transient) and whose frequency spectrum is largely located in the supraconversational zone of the auditory field (fig 12 schematically showing the principle of the transposition of a band of consonant noise not heard by the deaf in the form of a signal of random type é placed in any area of the deaf's residual hearing field).

Le principe de l'invention diffère de celui du vocoder en ce que le spectre de la parole n'est pas divisé en bandes égales, en ce que le nombre de bandes retenues est restreint, en ce que les dites bandes ne sont pas contigües.  The principle of the invention differs from that of the vocoder in that the speech spectrum is not divided into equal bands, in that the number of bands retained is limited, in that said bands are not contiguous.

II diffère du principe du vocoder à formants en ce que les bandes formantiques ne sont pas transmisses dans leur totalité mais sélectionnées en fonction du type de surdité (atteinte des graves ou des aigues), en ce qu'on réalise un codage par transposition des fréquences ou des bandes fréquentielles non perçues sous forme d'un signal émis dans la zone d'audition résiduelle du sourd. It differs from the principle of vocoder with formants in that the formic bands are not transmitted in their entirety but selected according to the type of deafness (attack of the low or high frequencies), in that one carries out a coding by transposition of the frequencies or frequency bands not perceived as a signal emitted in the deaf's residual hearing area.

Le procédé diffère de celui des appareils à transposition proposés dans l'appareillage du sourdprofond en ce qu'il ne sélectionne et amplifie que certaines bandes fréquentielles, en ce qu'il élimine la fréquence fondamentale F0 et les zones fréquentielles adjacentes, en ce qu'ii ne transpose qu'un spectre fréquentiel limité et plus précisément un nombre restreint de bandes de fréquences, et enfin en ce qu'il n'effectue pas de "compression" du spectre dans la zone résiduelle d'audibilité afin d'éviter une surcharge d'information et des troubles de discrimination. The process differs from that of the transposition apparatuses proposed in the apparatus of the deep deaf in that it only selects and amplifies certain frequency bands, in that it eliminates the fundamental frequency F0 and the adjacent frequency zones, in that ii transposes only a limited frequency spectrum and more precisely a limited number of frequency bands, and finally in that it does not effect "compression" of the spectrum in the residual audibility zone in order to avoid an overload information and discrimination disorders.

Le procédé diffère de celui retenu dans la réalisation des prothèses auditives actuelles en ce qu'il repose sur la détection exclusive des formants ou des bandes formantiques de la parole alors que les dites prothèses ne sélectionnent pas précisément les zones formantiques, qu'elles amplifient soit la totalité du spectre fréquentiel du champ auditif, soit de larges bandes juxtaposées (en général au nombre de trois) et recouvrant la totalité du spectre, qu'elles ne codent pas par transposition les fréquences non perçues par le malentendant sous forme d'un signal acoustique audible par ce même sourd, enfin en ce qu'elles visent à amplifier préférentiellement et par substitution les fréquences non audibles par le sourd
Dans son mode de réalisation le procédé destiné å favoriser l'émergence de la parole dégradée par le bruit chez le normo-entendant et à coder les éléments pertinents de la parole chez le déficlent auditif se caracténse - en ce qu'on divise l'lntervalle de fréquences correspondant au spectre de la parole en n bandes de fréquences de largeur inégales - en ce qu'on retient les bandes de fréquences dans lesquelles évoluent les pics ou bandes formantiques de la parole, - en ce qu'on élabore en permanence k signaux de commande dont l'amplitude est proportionnelle au niveau sonore de chaque pic ou de chaque bande, - en ce qu'on module en fonction des k signaux de commande et à l'aide d'au moins un des paramétres fréquence et amplitude k signaux de codage.
The method differs from that used in the production of current hearing aids in that it is based on the exclusive detection of formants or speech training bands while said prostheses do not precisely select the training areas, which they amplify either the entire frequency spectrum of the auditory field, that is to say wide juxtaposed bands (generally three in number) and covering the whole spectrum, which they do not encode by frequencies the frequencies not perceived by the hearing impaired in the form of a signal acoustics audible by the same deaf, finally in that they aim to amplify preferentially and by substitution the frequencies not audible by the deaf
In its embodiment, the method intended to promote the emergence of speech degraded by noise in the hearing-impaired person and to code the relevant elements of speech in the hearing impaired characterizes itself - in that the interval is divided of frequencies corresponding to the spectrum of speech in n frequency bands of unequal width - in that we retain the frequency bands in which the peaks or formic bands of speech evolve, - in that we continuously develop k signals control whose amplitude is proportional to the sound level of each peak or of each band, - in that one modulates as a function of the k control signals and using at least one of the frequency and amplitude parameters k signals coding.

- en ce que, selon un premier mode de mise en oeuvre, lesdits signaux de codage sont des signaux électriques et sont superposés pour obtenir un signal codé, et en ce qu'on convertit ledit signal codé électrique en un signal sonore, - en ce que, selon un deuxième mode de mise en oeuvre, on détecte les zones formantiques situées à la limite fréquentielle supérieure du champ de la parole et les bandes de bruit supraconversationnel, en ce que le signal de commande module un signal électrique pour générer un signal acoustique codé et transposé dans la zone audible résiduelle sous la forme d'un signal acoustique aléatoire pouvant occuper les espaces fréquentiels interformantiques etlou les bandes formantiques elles-mêmes, - en ce que, selon un troisième mode de mise en oeuvre, on procède à une amplification de la totalité du spectre de la parole en cas d'élévation du seuil auditif du sourd préalablement å la mise oeuvre du premier mode de mise en oeuvre (adjonction du signal électrique amplifié correspondant aux bandes de fréquence sélectionnées), - en ce que, selon un - en usage industriel: casques ou obturateurs auriculaires à double finalité permettant d'une part une protection contre les niveaux sonores traumatisants et d'autre part l'écoute vocale et la compréhension des consignes ou des ordres dans le bruit, - aide auditive pour déficients auditifs, et plus partilièrement en présence de phénomènes d'intolérance des prothèses conventionnelles, de troubles persistants de l'intelligibilité dans le bruit, de phénomènes de recrutement, de troubles importants de la sélectivité fréquentielle dont la correction par l'appareillage prothétique conventionnel est peu efficient (surdités génétiques, surdités profondes avec reliquat auditif ;Irnl-F! ai ix fréquences les plus basses du champ auditif, surdités traumatiques par ex). - in that, according to a first embodiment, said coding signals are electrical signals and are superimposed to obtain a coded signal, and in that said coded electric signal is converted into a sound signal, - in that that, according to a second embodiment, the formic zones located at the upper frequency limit of the speech field and the supraconversational noise bands are detected, in that the control signal modulates an electrical signal to generate an acoustic signal encoded and transposed in the residual audible zone in the form of a random acoustic signal which can occupy the interformant frequency spaces and / or the forming bands themselves, - in that, according to a third embodiment, an amplification is carried out of the entire speech spectrum in the event of an increase in the hearing threshold of the deaf prior to the implementation of the first mode of implementation (adjunct on of the amplified electric signal corresponding to the selected frequency bands), - in that, according to one - in industrial use: headphones or ear plugs with dual purpose allowing on the one hand protection against traumatic sound levels and on the other hand l listening and understanding instructions or orders in noise, - hearing aid for hearing impaired, and more particularly in the presence of intolerance phenomena of conventional prostheses, persistent disturbances of intelligibility in noise, phenomena of recruitment, significant frequency selectivity disorders whose correction by conventional prosthetic devices is inefficient (genetic deafness, deep deafness with auditory balance; Irnl-F! have the lowest frequencies of the hearing field, eg traumatic deafness).

Claims (4)

REVENDICATIONS 1. Procédé d'amplification acoustique sélective des sons dans lequel on code le signal sonore de la parole émis, ledit signal ayant à chaque Instant un spectre de fréquence dont l'enveloppe présente un certain nombre de pics, caractérisé en ce que:1. A method of selective acoustic amplification of sounds in which the sound signal of the emitted speech is coded, said signal having at each instant a frequency spectrum whose envelope has a certain number of peaks, characterized in that: - on divise l'intervalle des fréquences correspondant au spectre de la parole en n bandes de fréquence, - the frequency range corresponding to the speech spectrum is divided into n frequency bands, - on détermine statistiquement la largeur et la fréquence centrale des principales bandes en vue de retenir les valeurs dans lesquelles évoluent avec la plus grande probabilité les formants de la parole pour la langue considérée, - the width and central frequency of the main bands are statistically determined in order to retain the values in which the speech formants for the language considered evolve with the greatest probability, - on sélectionne à chaque instant les k bandes formantiques (k < n) dans lesquelles évoluent les pics, - the k forming bands (k <n) in which the peaks evolve are selected at each instant, - on élabore à chaque instant k signaux de commande dont l'amplitude est proportionnelle à l'énergie des pics ou de la bande, - k control signals are produced at each instant, the amplitude of which is proportional to the energy of the peaks or of the band, - on module à chaque instant en fonction des k signaux de commande, et à l'aide d'au moins un des paramètres fréquence et amplitude, k signaux de codage électriques, - modules are modulated at each instant as a function of the k control signals, and using at least one of the frequency and amplitude parameters, k electrical coding signals, - on superpose les dits signaux de codage électriques pour obtenir un signal codé électrique qui est enfin converti en un signal sonore. - said electrical coding signals are superimposed to obtain an electric coded signal which is finally converted into an audible signal. 2. Procédé selon la revendication1 caractérisé en ce qu'on détecte les zones formantiques situées à la limite fréquentielle supérieure du champ de la parole et les bandes de bruit supraconversationnel et en ce que le signal de commande module un signal électrique pour générer un signal acoustique codé et transposé dans la zone audible résiduelle, sous la forme d'un signal acoustique aléatoire pouvant occuper les espaces fréquentiels interformantiques etlou les bandes formantiques elles-mêmes. 2. Method according to claim1 characterized in that the formic zones located at the upper frequency limit of the speech field and the supraconversational noise bands are detected and in that the control signal modulates an electrical signal to generate an acoustic signal coded and transposed in the residual audible zone, in the form of a random acoustic signal which can occupy the interformant frequency spaces and / or the form bands themselves. 3. Procédé selon la revendication 1 caractérisé en ce qu'on procède à une amplification préalable de la :~.alliå du spectre de ia parole.3. Method according to claim 1 characterized in that one proceeds to a prior amplification of the: ~ .alliå of the spectrum of ia speech. 4. Procédé selon les revendications 1, 2 et 3 caractérisé en ce que le signal codé est limité dans son amplitude par écrêtage ou compression. 4. Method according to claims 1, 2 and 3 characterized in that the coded signal is limited in its amplitude by clipping or compression.
FR9704859A 1997-04-15 1997-04-15 METHOD AND DEVICE FOR AMPLIFYING AND ENCODING THE VOICE SIGNAL FOR IMPROVING INTELLIGIBILITY IN A NOISE ENVIRONMENT AND FOR CORRECTING DEAFNESSES Expired - Fee Related FR2762180B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR9704859A FR2762180B1 (en) 1997-04-15 1997-04-15 METHOD AND DEVICE FOR AMPLIFYING AND ENCODING THE VOICE SIGNAL FOR IMPROVING INTELLIGIBILITY IN A NOISE ENVIRONMENT AND FOR CORRECTING DEAFNESSES

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9704859A FR2762180B1 (en) 1997-04-15 1997-04-15 METHOD AND DEVICE FOR AMPLIFYING AND ENCODING THE VOICE SIGNAL FOR IMPROVING INTELLIGIBILITY IN A NOISE ENVIRONMENT AND FOR CORRECTING DEAFNESSES

Publications (2)

Publication Number Publication Date
FR2762180A1 true FR2762180A1 (en) 1998-10-16
FR2762180B1 FR2762180B1 (en) 1999-05-07

Family

ID=9506105

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9704859A Expired - Fee Related FR2762180B1 (en) 1997-04-15 1997-04-15 METHOD AND DEVICE FOR AMPLIFYING AND ENCODING THE VOICE SIGNAL FOR IMPROVING INTELLIGIBILITY IN A NOISE ENVIRONMENT AND FOR CORRECTING DEAFNESSES

Country Status (1)

Country Link
FR (1) FR2762180B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005055645A1 (en) * 2003-12-01 2005-06-16 Koninklijke Philips Electronics N.V. Selective audio signal enhancement

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4039754A (en) * 1975-04-09 1977-08-02 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Speech analyzer
WO1985002085A1 (en) * 1983-10-25 1985-05-09 The Commonwealth Of Australia Hearing aid amplification method and apparatus
WO1991003913A1 (en) * 1989-09-08 1991-03-21 Cochlear Pty. Limited Multi-peak speech processor
EP0441642A2 (en) * 1990-02-08 1991-08-14 Btg International Limited Methods and apparatus for spectral analysis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4039754A (en) * 1975-04-09 1977-08-02 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Speech analyzer
WO1985002085A1 (en) * 1983-10-25 1985-05-09 The Commonwealth Of Australia Hearing aid amplification method and apparatus
WO1991003913A1 (en) * 1989-09-08 1991-03-21 Cochlear Pty. Limited Multi-peak speech processor
EP0441642A2 (en) * 1990-02-08 1991-08-14 Btg International Limited Methods and apparatus for spectral analysis

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005055645A1 (en) * 2003-12-01 2005-06-16 Koninklijke Philips Electronics N.V. Selective audio signal enhancement

Also Published As

Publication number Publication date
FR2762180B1 (en) 1999-05-07

Similar Documents

Publication Publication Date Title
Stone et al. Tolerable hearing aid delays. III. Effects on speech production and perception of across-frequency variation in delay
US6647123B2 (en) Signal processing circuit and method for increasing speech intelligibility
EP3171612A1 (en) Audio headphones with active noise control, anti-occlusion control and passive attenuation cancellation, based on the presence or the absence of a vocal activity of the headphone user
Alexander et al. Effects of frequency compression and frequency transposition on fricative and affricate perception in listeners with normal hearing and mild to moderate hearing loss
US20050095564A1 (en) Methods and devices for treating non-stuttering speech-language disorders using delayed auditory feedback
Killion et al. Twenty years later: A new count-the-dots method
US9936308B2 (en) Hearing aid apparatus with fundamental frequency modification
Monson et al. The maximum audible low-pass cutoff frequency for speech
Kates Signal processing for hearing aids
Schmitt et al. A phoneme perception test method for high-frequency hearing aid fitting
EP1104222B1 (en) Hearing aid
Bhattacharya et al. Combined spectral and temporal enhancement to improve cochlear-implant speech perception
Zorilă et al. Evaluation of near-end speech enhancement under equal-loudness constraint for listeners with normal-hearing and mild-to-moderate hearing loss
KR20090082605A (en) Creation Method of channel of digital hearing-aid and Multi-channel digital hearing-aid
FR2762180A1 (en) Selective acoustic amplification procedure
EP3711307A1 (en) Method for live public address, in a helmet, taking into account the auditory perception characteristics of the listener
Svärd et al. The benefit method: fitting hearing aids in noise
Yadav et al. The Effect of Stimulus Bandwidth on Perception of Fricative/s/among Individuals with Different Degrees of Sensorineural Hearing Loss.
Ellaham Binaural speech intelligibility prediction and nonlinear hearing devices
Yun et al. Changes of the Korean Consonant-Vowel Syllabic Recognition Scores According to the Compression Threshold Control of Multi-Channel Hearing Aid
Rahbar Frequency lowering
Ifukube et al. Sound Signal Processing for Auditory Aids
Rawool The effects of hearing loss on temporal processing, Part 3: Addressing temporal processing deficits through amplification strategies
Lee et al. Cue weighting strategy of fricative perception in noise for normal hearing listeners
Ortmann et al. Impact of spectrally asynchronous delays on consonant voicing perception

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20101230