EP2434781A1 - Verfahren zum Rekonstruieren eines Sprachsignals und Hörvorrichtung - Google Patents
Verfahren zum Rekonstruieren eines Sprachsignals und Hörvorrichtung Download PDFInfo
- Publication number
- EP2434781A1 EP2434781A1 EP11182407A EP11182407A EP2434781A1 EP 2434781 A1 EP2434781 A1 EP 2434781A1 EP 11182407 A EP11182407 A EP 11182407A EP 11182407 A EP11182407 A EP 11182407A EP 2434781 A1 EP2434781 A1 EP 2434781A1
- Authority
- EP
- European Patent Office
- Prior art keywords
- amplitude spectrum
- input signal
- speech
- spectrum
- predetermined amplitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000001228 spectrum Methods 0.000 claims abstract description 91
- 238000001514 detection method Methods 0.000 claims abstract description 10
- 230000003321 amplification Effects 0.000 claims abstract description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 5
- 230000001419 dependent effect Effects 0.000 claims 1
- 230000003595 spectral effect Effects 0.000 description 6
- 208000032041 Hearing impaired Diseases 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 210000000613 ear canal Anatomy 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 210000003454 tympanic membrane Anatomy 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/35—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
- H04R25/353—Frequency, e.g. frequency shift or compression
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/35—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
- H04R25/356—Amplitude, e.g. amplitude shift or compression
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L2021/065—Aids for the handicapped in understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/43—Signal processing in hearing aids to enhance the speech intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
Definitions
- the present invention relates to a method for reconstructing a speech signal. Moreover, the present invention relates to a hearing device with which a speech signal can be reconstructed.
- hearing device is here understood to mean any sound-emitting device which can be worn on or in the ear, in particular a hearing device, a headset, headphones and the like.
- Hearing aids are portable hearing aids that are used to care for the hearing impaired.
- different types of hearing aids such as behind-the-ear hearing aids (BTE), hearing aid with external receiver (RIC: receiver in the canal) and in-the-ear hearing aids (IDO), e.g. Concha hearing aids or canal hearing aids (ITE, CIC).
- BTE behind-the-ear hearing aids
- RIC hearing aid with external receiver
- IDO in-the-ear hearing aids
- ITE canal hearing aids
- the hearing aids listed by way of example are worn on the outer ear or in the ear canal.
- bone conduction hearing aids, implantable or vibrotactile hearing aids are also available on the market. The stimulation of the damaged hearing takes place either mechanically or electrically.
- Hearing aids have in principle as essential components an input transducer, an amplifier and an output transducer.
- the input transducer is usually a sound receiver, z. As a microphone, and / or an electromagnetic receiver, for. B. an induction coil.
- the output transducer is usually used as an electroacoustic transducer, z. As miniature speaker, or as an electromechanical transducer, z. B. bone conduction, realized.
- the amplifier is usually integrated in a signal processing unit. This basic structure is in FIG. 1 shown using the example of a behind-the-ear hearing aid. In a hearing aid housing 1 for carrying behind the ear are one or more microphones 2 to Built-in sound recording from the environment.
- a signal processing unit 3 which is also integrated in the hearing aid housing 1, processes the microphone signals and amplifies them.
- the output signal of the signal processing unit 3 is transmitted to a loudspeaker or earpiece 4, which outputs an acoustic signal.
- the sound is optionally transmitted via a sound tube, which is fixed with an earmold in the ear canal, to the eardrum of the device carrier.
- the power supply of the hearing device and in particular the signal processing unit 3 is effected by a likewise integrated into the hearing aid housing 1 battery. 5
- Speech intelligibility An essential aspect in the care of the hearing-impaired with hearing aids is speech intelligibility. This means that a word or a word component should also be recognized as such or as such by the hearing aid wearer.
- An essential role in speech intelligibility is played by the consonants, in particular, for example, the "S". In the listening situation "speech in noise”, consonants are often not clearly audible or are heard as other consonants. For example, the word “nonfiction" can be heard as a "textbook”.
- noise reduction algorithms or speech enhancement algorithms are mostly used.
- speech in broadband noise only a directional microphone increases speech intelligibility.
- Directional microphones work only meaningful if the noise and the language come from different directions.
- Other noise reduction algorithms e.g. Wiener filters, do not increase speech intelligibility in noise. At best they reduce the listening effort.
- the object of the present invention is thus to propose a method and a hearing device with which increased speech intelligibility can be ensured.
- this object is achieved by a method for reconstructing a speech signal by storing a predetermined amplitude spectrum of a speech component, detecting an amplitude spectrum of an input signal containing the speech signal, detecting at least a matching part and a mismatched part of the predetermined amplitude spectrum with the amplitude spectrum of the input signal and Changing a gain of the input signal in the mismatched portion of the amplitude spectrum such that a greater match than the original gain with the predetermined amplitude spectrum is achieved.
- the invention provides a hearing device with which a speech signal is reconstructable, comprising a memory device for storing a predetermined amplitude spectrum of a speech component, a detection device for detecting an amplitude spectrum of an input signal containing the speech signal, a detection device for detecting at least one matching part and mismatched part of the predetermined amplitude spectrum with the amplitude spectrum of the input signal and an amplifying means, with which a gain of the speech signal in the mismatching part of the amplitude spectrum is variable such that a relation to an original gain further match with the predetermined amplitude spectrum is achieved.
- the input signal containing the speech signal and any noise is examined for predetermined patterns in the amplitude spectrum. If certain patterns or pattern parts are detected in the amplitude spectrum of the input signal, the remaining amplitude spectrum can be adapted to the given pattern by changing the gain. Thus, for example, a predetermined Language component of an amplitude spectrum are "worked out".
- the processing of the input signal takes place in a plurality of frequency channels, and each amplitude spectrum is characterized by one amplitude value per frequency channel. This is equivalent if the processing takes place in digital frequency values and an amplitude value is assigned to each frequency value in a specific amplitude spectrum.
- the language component is a consonant. Consonants have a greater importance in speech intelligibility than vowels.
- a predetermined amplitude spectrum of a plurality of speech components is stored, the amplitude spectrum of the input signal is checked for at least partial coincidence with each of the predetermined amplitude spectra, and the gain is changed in response to the at least partially coincident predetermined amplitude spectrum.
- the reconstruction of several different consonants in an input signal can be achieved in a targeted manner if corresponding parts of amplitude spectra are detected.
- the detection for matches can be limited to formants.
- Formants are rapidly detectable in a spectrum and they carry the essential information for the distinctness of language components.
- the gain may be changed to achieve full match with the predetermined amplitude spectrum. In this way, certain speech components can be made very clearly audible.
- Detecting at least one matching part and a mismatched part of the predetermined amplitude spectrum with the amplitude spectrum of the input signal may include balancing the absolute values of the predetermined amplitude spectrum with the absolute values of the amplitude spectrum of the input signal.
- the amplitude spectrum of the input signal it is not necessary for the amplitude spectrum of the input signal to be absolutely identical to the stored amplitude spectrum. Rather, a relative agreement of the spectral values is sufficient.
- the input signal can be additionally amplified in its entirety or transferred to another frequency range. This further increases the audibility of the reconstructed speech component.
- the inventive method for reconstructing a speech signal can be used particularly advantageously in signal processing in a hearing aid.
- a corresponding time signal can be obtained, as in FIG. 2 symbolically indicated. From this time signal, a sample or snapshot sa with a certain time width can be obtained.
- a short-term spectrum can be obtained from the temporal snapshot sa, which is described by way of example in FIG. 3 is shown.
- the short-term spectrum of a consonant has a typical shape.
- a consonant can be identified on the basis of its specific position of the formants 10, 11.
- one or more consonants are now recorded in an undisturbed environment.
- the spectrum of each consonant is, for example, sampled digitally and the individual samples 12 of the short-term spectrum 13 are stored in a memory device of the hearing device and in particular of the hearing device. In this way, for each consonant being recorded, a short-term spectrum can be stored in the hearing device.
- the hearing device now permanently analyzes the input signal and searches for the spectral pattern of the consonant or the patterns of the stored consonants.
- the consonant hereinafter the method is described by means of a single consonant
- the background noise has the noise spectrum 14, while the consonant, ie the useful signal, has the spectrum 15.
- the noise spectrum 14 predominates, while in a other section s, the signal spectrum 15, namely that of the spoken consonant predominates.
- the consonant spectrum 15 is actually sampled by the signal processing.
- the sampled spectrum 15 is compared with the stored spectrum 13.
- this part of the spectrum 15 has, for example, a very characteristic form, it can be concluded that the stored consonant has been spoken. It is then assumed that the signal in the spectral range n is superimposed by a noise. The amplification is then lowered, for example channel by channel, so that the stored spectrum 13 of the consonant is also given in the spectral range n. This reduction in gain is in FIG. 4 symbolized by the arrows 16. The spectrum is thus reconstructed in the region n or extrapolated from the measured consonant spectrum 15 using the stored spectrum 13. The resulting spectrum corresponds to that of the stored spectrum, which was recorded without background noise. If the hearing aid wearer now reproduces the reconstructed spectrum, he hears the consonant more clearly, since the background noise was damped. He practically hears the consonant as if it were spoken calmly.
- FIG. 4 Only a very small part of the short-term spectrum (area s) is detected as a prominent area. Whether this small area alone is sufficient to identify the corresponding consonant depends on the performance of the detection device in the hearing device. As a rule, a single peak or formant 10 will not be sufficient to correctly identify a consonant. Therefore be with FIG. 5 explains a second embodiment, in which an identification is easier to carry out.
- the same consonant spectrum 15 is here superimposed with an interference spectrum 14 'of lower amplitude. Only in a very small area n 'dominates the noise. In the much larger area s' dominates the consonant spectrum 15. In particular, the formants protrude 10 and 11 on the interference spectrum 14 '.
- the spoken consonant can be identified more easily by comparison with the stored spectrum 13 than in the case of FIG. 4 .
- To reconstruct the entire spectrum only the gain in the region n 'according to the arrows 16' has to be reduced. The reconstructed spectrum then no longer has any interfering components. The hearing aid wearer perceives the spoken consonant as if it were spoken in peace.
- the reconstructed consonants can then be further processed, e.g. through specific reinforcement. Likewise, the reconstructed consonants can be pushed, for example, by frequency shift / compression in an audible range for the hearing aid wearer.
- Analogous to the reduction of noise components and the useful signal components of the speech component can be raised in terms of higher gain.
- the entire spectrum is then raised uniformly, for example, in the regions s ', while in the region n' it is only channel-specifically raised in such a way that ultimately the pattern of the stored spectrum 13 is formed.
- the present invention detect by statistical methods a spectral pattern of a speech component in a background noise.
- the noisy pattern is then reconstructed from a known pattern by specific reduction of gain (in the relevant channels).
- the reconstructed language component can be further processed.
- the respective language component is thus suppressed, whereby an increased speech intelligibility in noise can be achieved.
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Otolaryngology (AREA)
- Neurosurgery (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
Die Sprachverständlichkeit bei Hörvorrichtungen und insbesondere bei Hörgeräten soll verbessert werden. Daher wird ein Verfahren zum Rekonstruieren eines Sprachsignals vorgeschlagen, bei dem ein vorgegebenes Amplitudenspektrum eines Sprachbestandteils abgespeichert wird. Das Amplitudenspektrum (15) eines Eingangssignals, das das Sprachsignal enthält, wird erfasst. Mindestens ein übereinstimmender Teil (s) und ein nicht übereinstimmender Teil (n) des vorgegebenen Amplitudenspektrums mit dem Amplitudenspektrum des Eingangssignals wird detektiert. Schließlich wird die Verstärkung des Eingangssignals in dem nicht übereinstimmenden Teil (n) des Amplitudenspektrums (15) derart geändert, dass eine gegenüber der ursprünglichen Verstärkung weitergehende Übereinstimmung mit dem vorgegebenen Amplitudenspektrum erreicht wird.
Description
- Die vorliegende Erfindung betrifft ein Verfahren zum Rekonstruieren eines Sprachsignals. Darüber hinaus betrifft die vorliegende Erfindung eine Hörvorrichtung, mit der ein Sprachsignal rekonstruierbar ist. Unter dem Begriff "Hörvorrichtung" wird hier jedes am oder im Ohr tragbare, schallausgebende Gerät verstanden, insbesondere ein Hörgerät, ein Headset, Kopfhörer und dergleichen.
- Hörgeräte sind tragbare Hörvorrichtungen, die zur Versorgung von Schwerhörenden dienen. Um den zahlreichen individuellen Bedürfnissen entgegenzukommen, werden unterschiedliche Bauformen von Hörgeräten wie Hinter-dem-Ohr-Hörgeräte (HdO), Hörgerät mit externem Hörer (RIC: receiver in the canal) und In-dem-Ohr-Hörgeräte (IdO), z.B. auch Concha-Hörgeräte oder Kanal-Hörgeräte (ITE, CIC), bereitgestellt. Die beispielhaft aufgeführten Hörgeräte werden am Außenohr oder im Gehörgang getragen. Darüber hinaus stehen auf dem Markt aber auch Knochenleitungshörhilfen, implantierbare oder vibrotaktile Hörhilfen zur Verfügung. Dabei erfolgt die Stimulation des geschädigten Gehörs entweder mechanisch oder elektrisch.
- Hörgeräte besitzen prinzipiell als wesentliche Komponenten einen Eingangswandler, einen Verstärker und einen Ausgangswandler. Der Eingangswandler ist in der Regel ein Schallempfänger, z. B. ein Mikrofon, und/oder ein elektromagnetischer Empfänger, z. B. eine Induktionsspule. Der Ausgangswandler ist meist als elektroakustischer Wandler, z. B. Miniaturlautsprecher, oder als elektromechanischer Wandler, z. B. Knochenleitungshörer, realisiert. Der Verstärker ist üblicherweise in eine Signalverarbeitungseinheit integriert. Dieser prinzipielle Aufbau ist in
FIG 1 am Beispiel eines Hinter-dem-Ohr-Hörgeräts dargestellt. In ein Hörgerätegehäuse 1 zum Tragen hinter dem Ohr sind ein oder mehrere Mikrofone 2 zur Aufnahme des Schalls aus der Umgebung eingebaut. Eine Signalverarbeitungseinheit 3, die ebenfalls in das Hörgerätegehäuse 1 integriert ist, verarbeitet die Mikrofonsignale und verstärkt sie. Das Ausgangssignal der Signalverarbeitungseinheit 3 wird an einen Lautsprecher bzw. Hörer 4 übertragen, der ein akustisches Signal ausgibt. Der Schall wird gegebenenfalls über einen Schallschlauch, der mit einer Otoplastik im Gehörgang fixiert ist, zum Trommelfell des Geräteträgers übertragen. Die Energieversorgung des Hörgeräts und insbesondere die der Signalverarbeitungseinheit 3 erfolgt durch eine ebenfalls ins Hörgerätegehäuse 1 integrierte Batterie 5. - Ein wesentlicher Aspekt bei der Versorgung von Hörgeschädigten mit Hörgeräten ist die Sprachverständlichkeit. Dies bedeutet, dass ein Wort oder ein Wortbestandteil auch als solches bzw. als solcher vom Hörgeräteträger erkannt werden sollte. Eine wesentliche Rolle bei der Sprachverständlichkeit spielen die Konsonanten, insbesondere beispielsweise das "S". In der Hörsituation "Sprache in Störgeräusch" sind Konsonanten oft nicht eindeutig hörbar oder werden als andere Konsonanten gehört. So kann beispielsweise das Wort "Sachbuch" als "Fachbuch" gehört werden.
- Um die Sprachverständlichkeit zu verbessern, werden meist Störgeräuschreduktionsalgorithmen oder Sprachverstärkungsalgorithmen eingesetzt. In der Hörsituation "Sprache in breitbandigem Rauschen" erhöht nur ein Richtmikrofon die Sprachverständlichkeit. Richtmikrofone arbeiten aber nur dann sinnvoll, wenn das Störgeräusch und die Sprache aus unterschiedlichen Richtungen kommen. Andere Störgeräuschunterdrückungsalgorithmen, z.B. Wiener-Filter, erhöhen die Sprachverständlichkeit in Störgeräusch nicht. Sie vermindern allenfalls die Höranstrengungen.
- Die Aufgabe der vorliegenden Erfindung besteht somit darin, ein Verfahren und eine Hörvorrichtung vorzuschlagen, mit denen eine erhöhte Sprachverständlichkeit gewährleistet werden kann.
- Erfindungsgemäß wird diese Aufgabe gelöst durch ein Verfahren zum Rekonstruieren eines Sprachsignals durch Speichern eines vorgegebenen Amplitudenspektrums eines Sprachbestandteils, Erfassen eines Amplitudenspektrums eines Eingangssignals, das das Sprachsignal enthält, Detektieren zumindest eines übereinstimmenden Teils und eines nicht übereinstimmenden Teils des vorgegebenen Amplitudenspektrums mit dem Amplitudenspektrum des Eingangssignals und Ändern einer Verstärkung des Eingangssignals in dem nicht übereinstimmenden Teil des Amplitudenspektrums derart, dass eine gegenüber der ursprünglichen Verstärkung weitergehende Übereinstimmung mit dem vorgegebenen Amplitudenspektrum erreicht wird.
- Darüber hinaus wird erfindungsgemäß bereitgestellt eine Hörvorrichtung, mit der ein Sprachsignal rekonstruierbar ist, umfassend eine Speichereinrichtung zum Speichern eines vorgegebenen Amplitudenspektrums eines Sprachbestandteils, eine Erfassungseinrichtung zum Erfassen eines Amplitudenspektrums eines Eingangssignals, das das Sprachsignal enthält, eine Detektionseinrichtung zum Detektieren zumindest eines übereinstimmenden Teils und eines nicht übereinstimmenden Teils des vorgegebenen Amplitudenspektrums mit dem Amplitudenspektrum des Eingangssignals und eine Verstärkungseinrichtung, mit der eine Verstärkung des Sprachsignals in dem nicht übereinstimmenden Teil des Amplitudenspektrums derart veränderbar ist, dass eine gegenüber einer ursprünglichen Verstärkung weitergehende Übereinstimmung mit dem vorgegebenen Amplitudenspektrum erreicht ist.
- In vorteilhafter Weise wird das Eingangssignal, das das Sprachsignal und etwaige Störgeräusche enthält, nach vorgegebenen Mustern im Amplitudenspektrum untersucht. Werden bestimmte Muster oder Musterteile im Amplitudenspektrum des Eingangssignals erkannt, so kann das übrige Amplitudenspektrum an das vorgegebene Muster durch Verändern der Verstärkung angepasst werden. Damit kann beispielsweise ein vorgegebener Sprachbestandteil aus einem Amplitudenspektrum "herausgearbeitet" werden.
- Vorzugsweise erfolgt die Verarbeitung des Eingangssignals in mehreren Frequenzkanälen, und jedes Amplitudenspektrum zeichnet sich durch jeweils einen Amplitudenwert pro Frequenzkanal aus. Dem ist gleichbedeutend, wenn die Verarbeitung in digitalen Frequenzwerten erfolgt und in einem bestimmten Amplitudenspektrum jedem Frequenzwert ein Amplitudenwert zugeordnet ist.
- Besonders vorteilhaft ist, wenn der Sprachbestandteil ein Konsonant ist. Konsonanten haben bei der Sprachverständlichkeit eine größere Bedeutung als Vokale.
- In einer weiteren Ausführungsform wird jeweils ein vorgegebenes Amplitudenspektrum von mehreren Sprachbestandteilen gespeichert, das Amplitudenspektrum des Eingangssignals wird hinsichtlich einer zumindest teilweisen Übereinstimmung mit jedem der vorgegebenen Amplitudenspektren überprüft, und die Verstärkung wird in Abhängigkeit von dem zumindest teilweise übereinstimmenden, vorgegebenen Amplitudenspektrum geändert. Damit kann zielgerichtet beispielsweise die Rekonstruktion von mehreren unterschiedlichen Konsonanten in einem Eingangssignal erreicht werden, falls entsprechende Teile von Amplitudenspektren detektiert werden.
- Das Detektieren hinsichtlich Übereinstimmungen kann auf Formanten beschränkt werden. Formanten sind in einem Spektrum rasch detektierbar und sie tragen die wesentlichen Informationen für die Unterscheidbarkeit von Sprachbestandteilen.
- In einer weiteren Ausführungsform kann die Verstärkung so geändert werden, dass eine vollständige Übereinstimmung mit dem vorgegebenen Amplitudenspektrum erreicht wird. Auf diese Weise können bestimmte Sprachanteile sehr deutlich hörbar gemacht werden.
- Das Detektieren zumindest eines übereinstimmenden Teils und eines nicht übereinstimmenden Teils des vorgegebenen Amplitudenspektrums mit dem Amplitudenspektrum des Eingangssignals kann einen Abgleich der Absolutwerte des vorgegebenen Amplitudenspektrums mit den Absolutwerten des Amplitudenspektrums des Eingangssignals beinhalten. Damit ist es nicht notwendig, dass das Amplitudenspektrum des Eingangssignals mit dem gespeicherten Amplitudenspektrum absolut übereinstimmt. Vielmehr genügt auch eine relative Übereinstimmung der Spektralwerte.
- Weiterhin kann das Eingangssignal nach dem Ändern der Verstärkung zusätzlich insgesamt verstärkt werden oder in einen anderen Frequenzbereich transferiert werden. Dadurch lässt sich die Hörbarkeit des rekonstruierten Sprachbestandteils weiter erhöhen.
- Besonders vorteilhaft lässt sich das erfindungsgemäße Verfahren zum Rekonstruieren eines Sprachsignals bei der Signalverarbeitung in einem Hörgerät einsetzen.
- Die vorliegende Erfindung wird nun anhand der beigefügten Zeichnungen näher erläutert, in denen zeigen:
- FIG 1
- den prinzipiellen Aufbau eines Hörgeräts gemäß dem Stand der Technik;
- FIG 2
- ein schematisches Zeitsignal eines Konsonanten;
- FIG 3
- das Spektrum des Zeitsignals von
FIG 2 ; - FIG 4
- eine Detektion und Rekonstruktion eines Spektrums in einem ersten Ausführungsbeispiel; und
- FIG 5
- eine Detektion und Rekonstruktion eines Spektrums in einem zweiten Ausführungsbeispiel.
- Die nachfolgend näher geschilderten Ausführungsbeispiele stellen bevorzugte Ausführungsformen der vorliegenden Erfindung dar.
- Wenn ein Konsonant ausgesprochen wird, lässt sich ein entsprechendes Zeitsignal gewinnen, wie dies in
FIG 2 symbolisch angedeutet ist. Aus diesem Zeitsignal lässt sich ein Sample oder Schnappschuss sa mit einer bestimmten zeitlichen Breite gewinnen. - In üblicher Weise kann aus dem zeitlichen Schnappschuss sa ein Kurzzeitspektrum gewonnen werden, das exemplarisch in
FIG 3 dargestellt ist. Das Kurzzeitspektrum eines Konsonanten besitzt eine typische Form. Insbesondere kann ein Konsonant anhand seiner spezifischen Lage der Formanten 10, 11 identifiziert werden. - Zur Durchführung des erfindungsgemäßen Verfahrens bzw. zur Realisierung der erfindungsgemäßen Hörvorrichtung werden nun einer oder mehrere Konsonanten in einer ungestörten Umgebung aufgenommen. Das Spektrum jedes Konsonanten wird beispielsweise digital abgetastet und die einzelnen Abtastwerte 12 des Kurzzeitspektrums 13 werden in einer Speichereinrichtung der Hörvorrichtung und insbesondere des Hörgeräts gespeichert. Auf diese Weise lässt sich für jeden Konsonanten, der aufgenommen wird, ein Kurzzeitspektrum in der Hörvorrichtung abspeichern.
- Während des Betriebs analysiert nun die Hörvorrichtung permanent das Eingangssignal und sucht nach dem spektralen Muster des Konsonanten bzw. den Mustern der gespeicherten Konsonanten. Üblicherweise wird dann der Konsonant (nachfolgend wird das Verfahren anhand eines einzelnen Konsonanten geschildert) vor einem Hintergrundgeräusch gesprochen. In dem Ausführungsbeispiel von
FIG 4 besitzt das Hintergrundgeräusch das Störgeräuschspektrum 14, während der Konsonant, also das Nutzsignal, das Spektrum 15 besitzt. In einem Abschnitt n des Spektrums überwiegt das Störgeräuschspektrum 14, während in einem anderen Abschnitt s das Signalspektrum 15, nämlich das des gesprochenen Konsonanten, überwiegt. In dem Bereich s wird beim Abtasten des Gesamtspektrums tatsächlich das Konsonantenspektrum 15 durch die Signalverarbeitung abgetastet. Das abgetastete Spektrum 15 wird mit dem abgespeicherten Spektrum 13 verglichen. Falls dieser Teil des Spektrums 15 beispielsweise eine sehr charakteristische Form besitzt, kann daraus geschlossen werden, dass der abgespeicherte Konsonant gesprochen wurde. Es wird dann davon ausgegangen, dass das Signal im Spektralbereich n durch ein Störgeräusch überlagert ist. Die Verstärkung wird dann beispielsweise kanalweise so abgesenkt, dass das abgespeicherte Spektrum 13 des Konsonanten auch in dem Spektralbereich n gegeben ist. Diese Absenkung der Verstärkung ist inFIG 4 durch die Pfeile 16 symbolisiert. Das Spektrum wird also in dem Bereich n rekonstruiert bzw. ausgehend von dem gemessenen Konsonantenspektrum 15 mithilfe des abgespeicherten Spektrums 13 extrapoliert. Das resultierende Spektrum entspricht demjenigen des abgespeicherten Spektrums, das ohne Hintergrundrauschen aufgenommen wurde. Wird nun dem Hörgeräteträger das rekonstruierte Spektrum wiedergegeben, so hört er den Konsonanten deutlicher, da ja das Hintergrundrauschen gedämpft wurde. Er hört den Konsonanten praktisch so, als ob er in Ruhe gesprochen wäre. - In dem Beispiel von
FIG 4 wird nur ein sehr geringer Teil des Kurzzeitspektrums (Bereich s) als markanter Bereich detektiert. Ob dieser kleine Bereich alleine reicht, den entsprechenden Konsonanten zu identifizieren, hängt von der Leistungsfähigkeit der Detektionseinrichtung in der Hörvorrichtung ab. In aller Regel wird ein einzelner Peak bzw. Formant 10 nicht ausreichen, um einen Konsonanten einwandfrei identifizieren zu können. Daher sei mitFIG 5 ein zweites Ausführungsbeispiel erläutert, bei dem eine Identifizierung leichter durchführbar ist. Das gleiche Konsonantenspektrum 15 ist hier mit einem Störspektrum 14' geringerer Amplitude überlagert. Nur in einem sehr kleinen Bereich n' dominiert das Störgeräusch. In dem weitaus größeren Bereich s' dominiert das Konsonantenspektrum 15. Insbesondere ragen die Formanten 10 und 11 über das Störspektrum 14'. Anhand der Formanten 10, 11 und gegebenenfalls zusätzlich anhand der spektralen Verläufe in den Bereichen s' lässt sich der gesprochene Konsonant durch Vergleich mit dem abgespeicherten Spektrum 13 leichter identifizieren als in dem Fall vonFIG 4 . Zur Rekonstruktion des gesamten Spektrums muss auch nur die Verstärkung in dem Bereich n' gemäß den Pfeilen 16' reduziert werden. Das rekonstruierte Spektrum weist dann auch keine Störkomponenten mehr auf. Der Hörgeräteträger nimmt den gesprochenen Konsonanten dann so wahr, als wäre er in Ruhe gesprochen. - Die rekonstruierten Konsonanten können dann weiterverarbeitet werden, z.B. durch spezifische Verstärkung. Ebenso können die rekonstruierten Konsonanten beispielsweise durch Frequenzverschiebung/-kompression in einen für den Hörgeräteträger hörbaren Bereich geschoben werden.
- Die obigen Beispiele beziehen sich immer auf Konsonanten. Das Verfahren lässt sich aber auch auf andere Sprachbestandteile wie ganze Wörter oder Logatome anwenden.
- Analog zu dem Reduzieren von Störgeräuschanteilen können auch die Nutzsignalanteile des Sprachbestandteils im Sinne höherer Verstärkung angehoben werden. Das gesamte Spektrum wird dann beispielsweise in den Bereichen s' gleichmäßig angehoben, während es in dem Bereich n' kanalspezifisch nur so angehoben wird, dass letztlich das Muster des abgespeicherten Spektrums 13 entsteht.
- In vorteilhafter Weise ist es durch die vorliegende Erfindung möglich, mit statistischen Methoden ein spektrales Muster eines Sprachbestandteils in einem Hintergrundgeräusch zu detektieren. Das verrauschte Muster ist dann anhand eines bekannten Musters durch spezifische Reduktion der Verstärkung (in den relevanten Kanälen) rekonstruiert. Anschließend kann der rekonstruierte Sprachbestandteil weiterverarbeitet werden. Insgesamt wird damit der jeweilige Sprachbestandteil entstört, wodurch eine erhöhte Sprachverständlichkeit in Störgeräusch erzielt werden kann.
Claims (10)
- Verfahren zum Rekonstruieren eines Sprachsignals, gekennzeichnet durch- Speichern eines vorgegebenen Amplitudenspektrums (13) eines Sprachbestandteils,- Erfassen eines Amplitudenspektrums (15) eines Eingangssignals, das das Sprachsignal enthält,- Detektieren zumindest eines übereinstimmenden Teils (s) und eines nicht übereinstimmenden Teils (n) des vorgegebenen Amplitudenspektrums (13) mit dem Amplitudenspektrum (15) des Eingangssignals und- Ändern einer Verstärkung des Eingangssignals in dem nicht übereinstimmenden Teil (n) des Amplitudenspektrums (15) derart, dass eine gegenüber der ursprünglichen Verstärkung weitergehende Übereinstimmung mit dem vorgegebenen Amplitudenspektrum (13) erreicht wird.
- Verfahren nach Anspruch 1, wobei die Verarbeitung des Eingangssignals in mehreren Frequenzkanälen erfolgt, und jedes Amplitudenspektrum sich durch jeweils einen Amplitudenwert pro Frequenzkanal auszeichnet.
- Verfahren nach Anspruch 1 oder 2, wobei der Sprachbestandteil ein Konsonant ist.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei jeweils ein vorgegebenes Amplitudenspektrum (13) von mehreren Sprachbestandteilen gespeichert wird, und das Amplitudenspektrum (15) des Eingangssignals hinsichtlich einer zumindest teilweisen Übereinstimmung mit jedem der vorgegebenen Amplitudenspektren (13) überprüft wird, und die Verstärkung in Abhängigkeit von dem zumindest teilweise übereinstimmenden, vorgegebenen Amplitudenspektrum (13) geändert wird.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei das Detektieren hinsichtlich Übereinstimmungen auf Formanten (10, 11) beschränkt ist.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei die Verstärkung so geändert wird, dass eine vollständige Übereinstimmung mit dem vorgegebenen Amplitudenspektrum (13) erreicht wird.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei das Detektieren einen Abgleich der Absolutwerte des vorgegebenen Amplitudenspektrums (13) mit den Absolutwerten des Amplitudenspektrums (15) des Eingangssignals beinhaltet.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei das Eingangssignal nach dem Ändern der Verstärkung zusätzlich verstärkt oder in einen anderen Frequenzbereich transferiert wird.
- Verfahren zum Verarbeiten eines Sprachsignals in einem Hörgerät mit einer Rekonstruktion des Sprachsignals entsprechend einem der Verfahren gemäß einem der vorhergehenden Ansprüche.
- Hörvorrichtung, mit der ein Sprachsignal rekonstruierbar ist,
gekennzeichnet durch- eine Speichereinrichtung zum Speichern eines vorgegebenen Amplitudenspektrums (13) eines Sprachbestandteils,- eine Erfassungseinrichtung zum Erfassen eines Amplitudenspektrums (15) eines Eingangssignals, das das Sprachsignal enthält,- eine Detektionseinrichtung zum Detektieren zumindest eines übereinstimmenden Teils (s) und eines nicht übereinstimmenden Teils (n) des vorgegebenen Amplitudenspektrums (13) mit dem Amplitudenspektrum (15) des Eingangssignals und- eine Verstärkungseinrichtung, mit der eine Verstärkung des Sprachsignals in dem nicht übereinstimmenden Teil (n) des Amplitudenspektrums derart veränderbar ist, dass eine gegenüber einer ursprünglichen Verstärkung weitergehende Übereinstimmung mit dem vorgegebenen Amplitudenspektrum (13) erreicht ist.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102010041435A DE102010041435A1 (de) | 2010-09-27 | 2010-09-27 | Verfahren zum Rekonstruieren eines Sprachsignals und Hörvorrichtung |
Publications (1)
Publication Number | Publication Date |
---|---|
EP2434781A1 true EP2434781A1 (de) | 2012-03-28 |
Family
ID=44674558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP11182407A Withdrawn EP2434781A1 (de) | 2010-09-27 | 2011-09-22 | Verfahren zum Rekonstruieren eines Sprachsignals und Hörvorrichtung |
Country Status (3)
Country | Link |
---|---|
US (1) | US20120076331A1 (de) |
EP (1) | EP2434781A1 (de) |
DE (1) | DE102010041435A1 (de) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10187112B2 (en) * | 2015-02-04 | 2019-01-22 | Viavi Solutions, Inc. | Leakage detection in DOCSIS 3.1 environment |
TWI662544B (zh) * | 2018-05-28 | 2019-06-11 | 塞席爾商元鼎音訊股份有限公司 | 偵測環境噪音以改變播放語音頻率之方法及其聲音播放裝置 |
CN110570875A (zh) * | 2018-06-05 | 2019-12-13 | 塞舌尔商元鼎音讯股份有限公司 | 检测环境噪音以改变播放语音频率的方法及声音播放装置 |
CN110648686B (zh) * | 2018-06-27 | 2023-06-23 | 达发科技股份有限公司 | 调整语音频率的方法及其声音播放装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1901286A2 (de) * | 2006-09-13 | 2008-03-19 | Fujitsu Limited | Sprachverbesserungsvorrichtung, Sprachaufzeichnungsvorrichtung, Sprachverbesserungsprogramm, Sprachaufzeichnungsprogramm, Sprachverbesserungsverfahren und Sprachaufzeichnungsverfahren |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4454609A (en) * | 1981-10-05 | 1984-06-12 | Signatron, Inc. | Speech intelligibility enhancement |
GB8613327D0 (en) * | 1986-06-02 | 1986-07-09 | British Telecomm | Speech processor |
GB2196460B (en) * | 1986-10-03 | 1991-05-15 | Ricoh Kk | Methods for comparing an input voice pattern with a registered voice pattern and voice recognition systems |
US5630011A (en) * | 1990-12-05 | 1997-05-13 | Digital Voice Systems, Inc. | Quantization of harmonic amplitudes representing speech |
US5226084A (en) * | 1990-12-05 | 1993-07-06 | Digital Voice Systems, Inc. | Methods for speech quantization and error correction |
US7065485B1 (en) * | 2002-01-09 | 2006-06-20 | At&T Corp | Enhancing speech intelligibility using variable-rate time-scale modification |
WO2004075162A2 (en) * | 2003-02-20 | 2004-09-02 | Ramot At Tel Aviv University Ltd. | Method apparatus and system for processing acoustic signals |
US7457741B2 (en) * | 2004-03-30 | 2008-11-25 | National Institute of Advnaced Industrial Science and Technology | Device for transmitting speech information |
US8983832B2 (en) * | 2008-07-03 | 2015-03-17 | The Board Of Trustees Of The University Of Illinois | Systems and methods for identifying speech sound features |
-
2010
- 2010-09-27 DE DE102010041435A patent/DE102010041435A1/de not_active Withdrawn
-
2011
- 2011-09-22 EP EP11182407A patent/EP2434781A1/de not_active Withdrawn
- 2011-09-27 US US13/245,993 patent/US20120076331A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1901286A2 (de) * | 2006-09-13 | 2008-03-19 | Fujitsu Limited | Sprachverbesserungsvorrichtung, Sprachaufzeichnungsvorrichtung, Sprachverbesserungsprogramm, Sprachaufzeichnungsprogramm, Sprachverbesserungsverfahren und Sprachaufzeichnungsverfahren |
Also Published As
Publication number | Publication date |
---|---|
US20120076331A1 (en) | 2012-03-29 |
DE102010041435A1 (de) | 2012-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2603018B1 (de) | Hörvorrichtung mit Sprecheraktivitätserkennung und Verfahren zum Betreiben einer Hörvorrichtung | |
EP3451705B1 (de) | Verfahren und vorrichtung zum schnellen erkennen der eigenen stimme | |
EP2229010B1 (de) | Hörgerät und Verfahren zur Störschallkompensation bei einem Hörgerät | |
EP1931172A1 (de) | Hörgerät mit Störschallunterdrückung und entsprechendes Verfahren | |
DE102012200745A1 (de) | Verfahren und Hörvorrichtung zum Schätzen eines Bestandteils der eigenen Stimme | |
DE102020207579A1 (de) | Verfahren zur richtungsabhängigen Rauschunterdrückung für ein Hörsystem, welches eine Hörvorrichtung umfasst | |
EP2434781A1 (de) | Verfahren zum Rekonstruieren eines Sprachsignals und Hörvorrichtung | |
EP2495724B1 (de) | Verfahren und Vorrichtung zum Schätzen eines Störgeräusches | |
DE102016221578B3 (de) | Verfahren zur Takterkennung mittels eines Hörgerätes | |
DE102008046040A1 (de) | Verfahren zum Betrieb einer Hörvorrichtung mit Richtwirkung und zugehörige Hörvorrichtung | |
EP1912470A2 (de) | Verfahren zur Dynamikkompression eines Audiosignals und entsprechende Hörvorrichtung | |
EP1962554A2 (de) | Hörvorrichtung mit Störsignaltrennung und entsprechendes Verfahren | |
EP1926087A1 (de) | Anpassung einer Hörvorrichtung an ein Sprachsignal | |
DE102017203947A1 (de) | Verfahren zum Betreiben einer Hörhilfevorrichtung sowie Hörhilfevorrichtung | |
DE102021210098A1 (de) | Verfahren zum Betrieb eines Hörgeräts | |
EP2793488B1 (de) | Binaurale Mikrofonanpassung mittels der eigenen Stimme | |
DE102009009040A1 (de) | Vorrichtung und Verfahren zur Störgeräuschschätzung bei einer binauralen Hörgeräteversorgung | |
DE102011006472B4 (de) | Verfahren zur Verbesserung der Sprachverständlichkeit mit einem Hörhilfegerät sowie Hörhilfegerät | |
EP3048813B1 (de) | Verfahren und vorrichtung zur rauschunterdrückung basierend auf inter-subband-korrelation | |
EP2982136A1 (de) | Verfahren zum schätzen eines nutzsignals und hörvorrichtung | |
DE102020201615B3 (de) | Hörsystem mit mindestens einem im oder am Ohr des Nutzers getragenen Hörinstrument sowie Verfahren zum Betrieb eines solchen Hörsystems | |
EP2635048A2 (de) | Verstärken eines Sprachsignals in Abhängigkeit vom Eingangspegel | |
DE102023200412B3 (de) | Verfahren zum Betrieb eines Hörgeräts | |
EP3985997B1 (de) | Hörgerätsystem und verfahren zu dessen betrieb | |
DE102011089865B4 (de) | Verfahren zum Anpassen einer Frequenzkompressionseinrichtung einer Hörvorrichtung und entsprechende Anpassungsvorrichtung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR |
|
AX | Request for extension of the european patent |
Extension state: BA ME |
|
17P | Request for examination filed |
Effective date: 20120411 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN |
|
18D | Application deemed to be withdrawn |
Effective date: 20140401 |