EP1258865B1 - Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen - Google Patents

Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen Download PDF

Info

Publication number
EP1258865B1
EP1258865B1 EP02005495A EP02005495A EP1258865B1 EP 1258865 B1 EP1258865 B1 EP 1258865B1 EP 02005495 A EP02005495 A EP 02005495A EP 02005495 A EP02005495 A EP 02005495A EP 1258865 B1 EP1258865 B1 EP 1258865B1
Authority
EP
European Patent Office
Prior art keywords
circuit arrangement
input
signal
pass filter
arrangement according
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
EP02005495A
Other languages
English (en)
French (fr)
Other versions
EP1258865A3 (de
EP1258865A2 (de
Inventor
Matthias Vierthaler
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TDK Micronas GmbH
Original Assignee
TDK Micronas GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TDK Micronas GmbH filed Critical TDK Micronas GmbH
Publication of EP1258865A2 publication Critical patent/EP1258865A2/de
Publication of EP1258865A3 publication Critical patent/EP1258865A3/de
Application granted granted Critical
Publication of EP1258865B1 publication Critical patent/EP1258865B1/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility

Definitions

  • the invention relates to a circuit arrangement for improving the intelligibility of speech-containing audio signals according to the features of the preamble of claim 1.
  • the aim of the present invention is to improve the speech intelligibility of a relatively good audio signal with unchanged volume. This means equal intelligibility at lower volume or improved intelligibility in ambient noise.
  • consonants are about 12 dB weaker than vowels. Increasing the consonants relative to the vowels increases the intelligibility of speech in the audio signal. If you replace the clipper with a fast "peak limiter” (22 msec) you can increase the intelligibility even further. At -10 dBlimitting, intelligibility increased from 56% to 84%.
  • US 5,553,151 describes a so-called "forward masking".
  • weak consonants are temporally covered by the previous strong vowels.
  • This publication proposes a relatively fast compressor with an "attack time” of about 10 msec. and a release time of about 75 to 150 msec. in front.
  • a problem in the previously known systems for increasing the speech intelligibility of speech in audio signals is their relatively high complexity, which means that both a high software cost for calculating the individual algorithms and a high hardware cost is necessary.
  • the audio signal is changed so that the language no longer sounds very natural.
  • the speech signal can be disrupted, which can even counteract improved intelligibility.
  • the aim of the present invention is therefore to provide a circuit arrangement for improving the speech quality of audio signals, on the one hand requires little effort and on the other hand, the language still sound natural.
  • the invention is essentially based on amplifying the audio signal to a predetermined factor and filtering it in a high-pass filter, wherein the cutoff frequency of the high-pass filter is controlled such that the amplitude of the audio signal after the processing path is equal to or proportional to the amplitude of the audio signal at the input of the processing path is.
  • the fundamental wave of the speech signal which contributes relatively little to the intelligibility but has the largest energy, can be attenuated and the usual signal spectrum of the audio signal can be correspondingly increased.
  • the amplitude of the vowels (large amplitude, low frequency) in the transition region consonant (small amplitude, high frequency) can be lowered to vowel to reduce the so-called "backward masking".
  • the entire signal is increased by a factor of g. This factor controls the strength of the signal enhancement effect, with meaningful values for the factor g being between about 1.5 and 4.
  • the circuit arrangement according to the invention are raised as higher-frequency components and lowered the low-frequency fundamental wave to the same extent, so that the amplitude (or energy) of the audio signal remains unchanged.
  • the corner frequency of the variable high-pass filter can be lowered with the circuit arrangement according to the present invention. Therefore, an "offset" can be added in the control to the input signal, which is either fixed or proportional to the peak amplitude of the input-side audio signal.
  • the corner frequency f c of the variable high-pass filter is limited downwards, since the lowest frequency for speech is about 200 Hz. A range of approximately 100 to 120 Hz has proven suitable for a lower corner frequency.
  • the circuit arrangement has a variable high pass 20, which is variable in its corner frequency f c .
  • the variable high-pass filter 20 has a control input 21 to which a control signal for changing the corner frequency f c is can be applied.
  • This variable high-pass filter 20 is preferably supplied via a low pass filter 10 to be improved.
  • an input terminal 1 is provided for applying the audio signal.
  • the low pass 10 must not provided, but is advantageous to eliminate signal interference in the audio signal.
  • At the output of the variable high-pass filter 20 sits an amplifier stage 30, which amplifies the output-side signal of the variable high-pass filter 20 by a factor of g.
  • This factor g is adjustable and is preferably between about 1.5 and 4. Once set gain factor is preferably not changed.
  • the entire processing path consisting of variable high pass 20 and amplifier 30 and optional low-pass filter 10 has an output terminal 2, at which the processed audio signal can be tapped as an output signal.
  • a regulation of the cut-off frequency f c of the variable high-pass filter 20 is carried out in the following manner for improving speech intelligibility of speech within the audio signal. If the amplitude (or energy) of the input signal at the input 1 of the circuit arrangement is greater than the amplitude (or energy) at the output 2 of the transmission path, then the corner frequency f c is lowered. Incidentally, increased. Provided that the amplitudes at the input 1 and output 2 are the same or proportional to a predetermined factor, no further change in the corner frequency f c.
  • FIG. 2 shows a development of the circuit arrangement of Figure 1 is shown.
  • FIG. 2 shows a comparator 36 with a downstream integrator, which is preceded by a scaling factor Ki.
  • the output terminal of the integrator 40 is connected to the control input 21 of the variable high-pass filter 20 in combination.
  • the comparator 36 has two input terminals 34, 35, at the first terminal 34, the input signal and at its terminal 35, the output signal of the transmission path is applied.
  • the circuit arrangement of FIG. 3 differs from the circuit arrangement of FIG. 2 in that the integrator 40 is replaced by a digital circuit arrangement 60.
  • the corner frequency f c is increased or decreased by a step d, depending on whether the output signal xc at the output of the comparator 36 is greater or less than 0.
  • FIG. 4 shows a further development of the circuit arrangement according to the invention.
  • the development consists in adding an offset K to the input signal present at the input 34.
  • This offset may be chosen to be constant or may be a factor K weighted output of a peak detector 70.
  • the audio signal is applied on the input side.
  • variable high-pass filter 20 is responsible.
  • the circuit operates as follows: A vowel is low-frequency with large amplitude. A consonant, in contrast, is high-frequency with a small amplitude.
  • the amplification factor g is set so that a gain of 6 dB is achieved. Due to the low-frequency vowel, the corner frequency of the variable high-pass filter 20 has adjusted to this low frequency. The fundamental wave is lowered so far that the Output amplitude is the same input amplitude of the audio signal, although the gain of 6 dB has been selected.
  • the inventive circuit arrangement of FIG. 1 operates as follows.
  • the high pass filter 20 has adjusted to the frequency of the consonant.
  • the amplitude of the input signal corresponds to the amplitude of the output signal.
  • the relatively high cut-off frequency f c of the high-pass filter 20 attenuates the vowels in the temporal transition and consequently does not cover the consonant.
  • the corner frequency f c is adjusted due to the control loop so that the amplitude of the input signal corresponds to the amplitude of the output signal.
  • the audio path (high pass, low pass, gain) is calculated separately for left and right, but the high passes have the same corner frequency f c .

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)

Description

  • Die Erfindung betrifft eine Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen gemäß den Merkmalen des Oberbegriffs des Anspruchs 1.
  • Eine solche Anordnung ist z.B. aus US-A- 5,083,312 bekannt.
  • Es gibt verschiedene Möglichkeiten, wie die Sprachverständlichkeit von Audiosignalen verbessert werden kann. Eine Möglichkeit liegt in der Verbesserung des verrauschten Signals. Eine andere Möglichkeit liegt darin, solche Signale zu verbessern, die durch Hall und Echos etc. degradiert wurden. Schließlich kann ein gutes Audiosignal verändert werden, so dass es für Schwerhörige besser verständlich wird. Dies wird beispeilsweise mit Hörgeräten erreicht. Letzlich ist die Veränderung eines guten Audiosignals möglich, so dass es bei starken Hintergrundgeräuschen besser verständlich ist.
  • Ziel der vorliegenden Erfindung ist es, die Sprachverständlichkeit eines verhältnismäßig guten Audiosignals bei unveränderter Lautstärke zu verbessern. Dies bedeutet, gleiche Verständlichkeit bei geringerer Lautstärke oder verbesserte Verständlichkeit bei Umgebungslärm.
  • Aus US 5,459,813 ist es bekannt, dass sogenannte "unvoiced sounds" (z. B. Konsonanten) von den viel stärkeren "voiced sounds" (z. B. Vokale) überdeckt werden. Da die "unvoiced sounds" wichtig für die Sprachverständlichkeit sind, wird in dieser Veröffentlichung vorgeschlagen, diese z. B. durch Clipping oder Amplitudenkompression zu verstärken.
  • In der Veröffentlichung "effects of amplitud distorsion upon intellegibility of speech" von J. C. Liqulider in dem Journal of acustical society of america, Oktober 1946 ist ein sogenanntes "peak clipping" bekannt. Ein solches "peak clipping" ohne Umgebungsrauschen hat kaum Einfluss auf die Sprachverständlichkeit. Ein "peak clipping" bei -20 dB führt immer noch zu einer Verständlchkeit von etwa 96%. Das sogenannte "center clipping" ist wesentlich schlechter, da hier die Konsonanten entfernt werden, die für die Verständlichkeit besonders wichtig sind. "Peak clipping" bei -24 dB braucht nur eine Verstärkung von etwa 14 dB, um dieselbe Verständlichkeit zu erreichen. Aus der Veröffentlichung Elwood Kretsinger et al "The Use of fast Limiting to improve the Intelligibility of Speech in Noise", Speech Monographs, March 1960 ist es bekannt, dass Konsonanten ca. 12 dB schwächer als Vokale sind. Verstärkt man die Konsonanten relativ zu den Vokalen, wird deshalb die Verständlichkeit von Sprache im Audiosignal erhöht. Ersetzt man den Clipper durch einen schnellen "peak limitter" (22 msec) kann man die Verständlichkeit noch weiter erhöhen. Bei -10 dBlimitting erhöhte sich die Verständlichkeit von 56 % auf 84 %.
  • Aus Veröffentlichung Ian Thomas et al. "The Intelligibility of filtered-clipped Speech in Noise", The Journal of the Audio Engineering Society, June 1970 ist es bekannt, dass die Grundwelle eines Audiosignals, das Sprache enthält, nur wenig zur Sprachverständlichkeit beiträgt, während die erste Resonanzfrequenz sehr wichtig ist. Deshalb sollte das Signal vor dem Clipping hochpassgefiltert werden.
  • Aus Veröffentlichung Ian Thomas et al., "Intelligibility enhancement through spectral weigthing", Proceedings of the 1972 IEEE Conference on Speech Communication and Processing ist es bekannt, dass das Clipping zwar die Verständlichkeit von Sprache erhöht, jedoch die Signalqualität beeinträchtigt. In dieser Veröffentlichung wird deshalb vorgeschlagen, die Signalenergie in die signifikanten Frequenzbereiche zu verlagern.
  • Aus US 5,479,560 ist es darüber hinaus bekannt, das Audiosignal in mehrere Frequenzbänder aufzuteilen und diejenigen Frequenzbänder mit großer Energie verhältnismäßig stark zu verstärken und die anderen abzusenken. Dies wird deshalb vorgeschlagen, weil Sprache aus einer Aneinanderreihung von Phonehmen besteht. Phoneme bestehen aus einer Vielzahl von Frequenzen. Diese werden an den Resonanzfrequenzen des Mund- und Rachenraums besonders verstärkt. Ein Frequenzband mit solche einem spektralen Peak wird Formant genannt. Formants sind besonders wichtig zur Erkennung von Phonemen und somit Sprache. Ein Ansatz zur Verbesserung der Sprachverständlichkeit ist es daher, die Peaks (Formants) des Frequenzspektrums eines Audiosignals zu verstärken und die dazwischen liegenden Täler abzuschwächen. Für einen Erwachsenen Mann liegt die Grundfrequenz von Sprache bei etwa 60 bis 250 Hz. Die ersten vier Formants liegen bei 500 Hz, 1 500 Hz, 2 500 Hz und 3 500 Hz (vgl. hierzu US-Patent 5,459,813.
  • Aus US 4,454,609 ist es bekannt, hauptsächlich die Konsonanten zu verstärken.
  • Schließlich beschreibt US 5,553,151 ein sogenanntes "forward masking". Hierbei werden schwache Konsonanten durch die vorhergehenden starken Vokale zeitlich überdeckt. Diese Veröffentlichung schlägt einen verhältnismäßig schnellen Kompressor mit einer "attack time" von ca. 10 msec. und einer "release time" von ca. 75 bis 150 msec. vor.
  • Problematisch bei den bisher bekannten Systemen zur Erhöhung der Sprachverständlichkeit von Sprache in Audiosignalen ist deren verhältnismäßig hohe Komplexität, das bedeutet, dass sowohl ein hoher Softwareaufwand zur Berechnung der einzelnen Allgorithmen sowie ein hoher Hardwareaufwand notwendig ist. Bei einfacheren Systemen wird dagegen das Audiosignal so verändert, dass die Sprache nicht mehr sehr natürlich klingt. Des Weiteren kann bei einfachen Systemen dem Sprachsignal Störungen zugefügt werden, das einer verbesserten Verständlichkeit sogar entgegen wirken kann.
  • Ziel der vorliegenden Erfindung ist es daher, eine Schaltungsanordnung zur Verbesserung der Sprachqualität von Audiosignalen anzugeben, das einerseits geringen Aufwand erfordert und andererseits die Sprache noch natürlich klingen lässt.
  • Dieses Ziel wird durch eine Schaltungsanordnung mit dem Merkmale des Anspruchs 1 gelöst.
  • Weiterbildungen einer solchen Schaltungsanordnung sind Gegenstand der Unteransprüche.
  • Die Erfindung beruht im Wesentlichen darauf, das Audiosignal auf einen vorgegebenen Faktor zu verstärken und in einem Hochpass zu filtern, wobei die Eckfrequenz des Hochpasses so geregelt wird, dass die Amplitude des Audiosignals nach der Verarbeitungsstrecke gleich oder proportional der Amplitude des Audiosignals am Eingang der Verarbeitungsstrecke ist.
  • Mit dieser Schaltungsanordnung kann die Grundwelle des Sprachsignals, die relativ wenig zur Verständlichkeit beiträgt, aber die größte Energie besitzt, abgeschwächt werden und das übliche Signalspektrums des Audiosignals entsprechend angehoben werden. Außerdem kann die Amplitude der Vokale (große Amplitude, tiefe Frequenz) im Übergangsbereich Konsonant (kleine Amplitude, große Frequenz) zu Vokal abgesenkt werden, um das sogenannte "backward masking" zu verringern. Dazu wird das gesamte Signal um einen Faktor g angehoben. Dieser Faktor steuert die Stärke des Effekts der Signalverbesserung, wobei sinnvolle Werte für den Faktor g etwa zwischen 1,5 und 4 liegen. Mit der erfindungsgemäßen Schaltungsanordnung werden als höher frequente Anteile angehoben und die tieffrequente Grundwelle im gleichen Maße abgesenkt, so dass die Amplitude (oder Energie) des Audiosignales unverändert bleibt. Für Signalanteile mit kleinen Amplituden, also Konsonanten, kann mit der Schaltungsanordnung nach der vorliegenden Erfindung die Eckfrequenz des variablen Hochpasses abgesenkt werden. Deshalb kann in der Regelung zu dem Eingangssignal noch ein "offset" addiert werden, der entweder fix oder proportional zur Peak-Amplitude des eingangsseitigen Audiosignal ist.
  • In einer Weiterbildung der Erfindung ist vorgesehen, dass höherfrequenzte Signalanteile im Audiosignal abgesenkt werden. Mit einem Tiefpass vor dem variablen Hochpass können Störungen im Signal unterdrückt werden.
  • In einer Weiterbildung der Erfindung ist vorgesehen, dass die Eckfrequenz fc des variablen Hochpassfilters nach unten begrenzt wird, da die unterste Frequenz für Sprache bei ca. 200 Hz liegt. Bewährt hat sich für eine untere Eckfrequenz ein Bereich von etwa 100 bis 120 Hz.
  • Nachfolgend wird die erfindungsgemäße Schaltungsanordnung anhand von Figuren beispielhaft erläutert. Es zeigen:
  • Figur 1
    die prinzipielle Schaltungsanordnung zur Verbesserung der Sprachverständlichkeit in einem Audiosignal,
    Figur 2
    eine Weiterbildung der Schaltungsanordnung von Figur 1,
    Figur 3
    eine andere Weiterbildung der Schaltungsanordnung von Figur 1, und
    Figur 4
    eine andere Weiterbildung der Schaltungsanordnung von Figur 1, und
    Figur 5
    eine vierte Weiterbildung der erfindungsgemäßen Schaltungsanordnung.
  • In den nachfolgenden Figuren bezeichnen gleiche Bezugszeichen, sofern nicht anders angegeben, gleiche Teile mit gleicher Bedeutung.
  • In Figur 1 ist der prinzipielle Aufbau der erfindungsgemäßen Schaltungsanordnung gezeigt. Die Schaltungsanordnung weist einen variablen Hochpass 20 auf, der in seiner Eckfrequenz fc veränderbar ist. Hierfür verfügt der variable Hochpass 20 über einen Steuereingang 21, an dem ein Steuersignal zur Veränderung der Eckfrequenz fc anlegbar ist. Diesem variablen Hochpass 20 wird vorzugsweise über einen Tiefpass 10 das zu verbessernde Audiosignal zugeführt. Hierfür ist eine Eingangsklemme 1 zum Anlegen des Audiosignals vorgesehen. Der Tiefpass 10 muss nicht vorgesehen sein, ist jedoch vorteilhaft, um Signalstörungen im Audiosignal zu beseitigen. Am Ausgang des variablen Hochpasses 20 sitzt eine Verstärkerstufe 30, die das ausgangsseitige Signal des variablen Hochpasses 20 um einen Faktor g verstärkt. Dieser Faktor g ist einstellbar und liegt vorzugsweise zwischen etwa 1,5 und 4. Ein einmal eingstellter Verstärkungsfaktor wird vorzugsweise nicht mehr verändert. Die gesamte Verarbeitungsstrecke bestehend aus variablen Hochpass 20 und Verstärker 30 sowie optionalem Tiefpass 10 verfügt über eine Ausgangsklemme 2, an der das verarbeitete Audiosignal als Ausgangssignal abgreifbar ist.
  • Erfindungsgemäß wird eine Regelung der Eckfrequenz fc des variablen Hochpasses 20 in folgender Art und Weise zur Verbesserung der Sprachverständlichkeit von Sprache innerhalb des Audiosignals durchgeführt. Ist die Amplitude (oder auch Energie) des Eingangssignals am Eingang 1 der Schaltungsanordnung größer als die Amplitude (oder Energie) am Ausgang 2 der Übertragungsstrecke, dann wird die Eckfrequenz fc erniedrigt. Im Übrigen erhöht. Sofern die Amplituden am Eingang 1 und Ausgang 2 gleich oder zu einem vorgegebenen Faktor proportional sind, erfolgt keine weitere Veränderung der Eckfrequenz fc.
  • In Figur 2 ist eine Weiterbildung der Schaltungsanordnung von Figur 1 dargestellt. In Figur 2 ist ein Vergleicher 36 mit nachgeschaltetem Integrator, dem ein Skalierungsfaktor Ki vorgeschaltet ist, vorgesehen. Die Ausgangsklemme des Integrators 40 ist mit dem Steuereingang 21 des variablen Hochpasses 20 in Verbindung. Der Vergleicher 36 weist zwei Eingangsklemmen 34, 35 auf, an deren erste Klemme 34 das Eingangssignal und an dessen Klemme 35 das Ausgangssignal der Übertragungsstrecke angelegt wird.
  • Die Schaltungsanordnung von Figur 3 unterscheidet sich von der Schaltungsanordnung von Figur 2 dadurch, dass der Integrator 40 durch eine digitale Schaltungsanordnung 60 ersetzt ist. In der digitalen Schaltungsanordnung 60 wird nach Maßgabe des Ausgangssignals des Vergleichers 36 die Eckfrequenz fc um einen Schritt d erhöht oder erniedrigt, je nachdem, ob das Ausgangssignal xc am Ausgang des Vergleichers 36 größer oder kleiner 0 ist.
  • Schließlich ist in Figur 4 noch eine Weiterbildung der erfindungsgemäßen Schaltungsanordnung dargestellt. Die Weiterbildung besteht darin, dass zu dem an dem Eingang 34 anstehenden Eingangssignal ein Offset K addiert wird. Dieser Offset kann konstant gewählt werden oder ein mit einem Faktor K gewichteter Ausgang eines Peak-Detektor 70 sein. An dem Peak-Detektor 70 wird eingangsseitig das Audiosignal angelegt.
  • Mit der erfindungsgemäßen Schaltungsanordnung gemäß den Figuren 1 bis 4 ist es möglich, die Grundwelle des Audiosignals abzusenken und den restlichen Signalanteil anzuheben. Hierfür ist das variable Hochpassfilter 20 verantwortlich.
  • Für den Fall, dass im Sprachsignal ein Konsonant einem Vokal folgt, arbeitet die Schaltungsanordnung folgendermaßen: Ein Vokal ist tieffrequent mit großer Amplitude. Ein Konsonant ist dagegen hochfrequent mit kleine Amplitude. Bei der erfindungsgemäßen Schaltungsanordnung wird der Verstärkungsfaktor g so eingestellt, dass eine Verstärkung von 6 dB erreicht wird. Durch den tieffrequenten Vokal hat sich die Eckfrequenz des variablen Hochpassfilters 20 auf diese tiefe Frequenz eingestellt. Die Grundwelle ist also so weit abgesenkt, dass die Ausgangsamplitude gleicher Eingangsamplitude des Audiosignals ist, obwohl die Verstärkung von 6 dB gewählt wurde. Folgt auf den Vokal nun ein Konsonant (höhere Frequenz!) wird dieser sofort um 6 dB angehoben, da die Eckfrequenz des Hochpassfilters 20 noch auf die tiefe Frequenz des Vokals eingestellt ist. Der Konsonant wird als weniger stark vom Vokal überdeckt. Erst nach einigen Millisekunden erhöht sich die Eckfrequenz fc und senkt somit auch den Konsonant ab, so dass die Amplitude des Eingangssignals gleich der Amplitude des Ausgangssignals der Verarbeitungsstrecke ist.
  • Bei einem Übergang Konsonant auf Vokal arbeitet die erfindungsgemäße Schaltungsanordnung von Figur 1 folgendermaßen. Das Hochpassfilter 20 hat sich auf die Frequenz des Konsonants eingestellt. Die Amplitude des Eingangssignals entspricht der Amplitude des Ausgangssignals. Folgt nun ein Vokal (tieffrequent) wird durch die verhältnismäßig hohe Eckfrequenz fc des Hochpassfilters 20 der Vokal beim zeitlichen Übergang gedämpft und der Konsonant folglich nicht überdeckt. Erst nach einigen Millisekunden ist die Eckfrequenz fc aufgrund der Regelzeit der Regelschleife so eingeregelt, dass die Amplitude des Eingangssignals der Amplitude des Ausgangssignals entspricht.
  • Abschließend ist noch folgendes anzumerken: Bei einem Stereosignal kann entweder jeder Kanal eine eigene Regelung erhalten wie oben beschrieben oder sie können eine gemeinsame Regelung benutzen. Dann ist z. B. (vgl. Figur 5) an den Eingang 34=Abs (Input_Left)+Abs(Input_Right) anzulegen und an den Eingang 35=Abs (Output_Left)+Abs (Output_Right). Der Audiopfad (Hochpass, Tiefpass, Gain) wird für links und rechts getrennt berechnet, die Hochpässe besitzen aber dieselbe Eckfrequenz fc.

Claims (13)

  1. Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen, bei welcher Frequenz- und/oder Amplitudenanteile des Audiosignals nach vorgegebenen Parametern verändert werden und das Audiosignal in einer Verarbeitungsstrecke durch einen Hochpass (20) geführt wird, dessen Eckfrequenz fc regelbar ist, und worin nach dem Hochpass (20) das Signal mit einem vorgebaren Faktor g verstärkt wird, dadurch gekennzeichnet, dass zur Einstellung der Eckfrequenz fc des Hochpasses (20) sowohl die Amplitude des Eingangssignals als auch des Ausgangssignals der Verarbeitungsstrecke erfasst wird, und dass dann, wenn die Amplitude des Eingangssignals größer als die Amplitude des Ausgangssignals am Ausgang der Verarbeitungsstrecke ist, die Eckfrequenz fc erniedrigt und im umgekehrten Fall erhöht wird.
  2. Schaltungsanordnung nach Anspruch 1,
    dadurch gekennzeichnet, dass der Faktor g > = 1 gewält ist.
  3. Schaltungsanordnung nach Anspruch 1 oder 2,
    dadurch gekennzeichnet, dass der Faktor g etwa zwischen 1,5 und 4 gewählt ist.
  4. Schaltungsanordnung nach einem der Ansprüche 1 bis 3,
    dadurch gekennzeichnet, dass die Änderung der Eckfrequenz fc inkremental erfolgt, vorzugsweise in ein Hz-Schritten.
  5. Schaltungsanordnung nach einem der Ansprüche 1 bis 4,
    dadurch gekennzeichnet, dass die Eckfrequenz fc im Bereich von etwa 100 Hz bis 1 kHz variierbar ist.
  6. Schaltungsanordnung nach einem der Ansprüche 1 bis 5,
    dadurch gekennzeichnet, dass die untere Eckfrequenz fc bei etwa 100 bis 120 Hz liegt.
  7. Schaltungsanordnung nach einem der Ansprüche 1 bis 6,
    dadurch gekennzeichnet, dass vor dem variablen Hochpass (20) ein Tiefpass (10) geschaltet ist.
  8. Schaltungsanordnung nach Anspruch 7,
    dadurch gekennzeichnet, dass der Tiefpass (10) eine Eckfrequenz bei etwa 6 kHz aufweist.
  9. Schaltungsanordnung nach einem der Ansprüche 1 bis 8,
    dadurch gekennzeichnet, dass an einem Steuereingang (21) des variablen Hochpasses (20) zur Veränderung der Eckfrequenz fc ein Vergleicher (36) gekoppelt ist, an dessen einen Eingang (34) des Eingangssignal der Verarbeitungstrecke und an dessen anderen Eingang (35) das Ausgangssignal der Verarbeitungsstrecke geschaltet ist.
  10. Schaltungsanordnung nach Anspruch 9,
    dadurch gekennzeichnet, dass zwischen den Steuereingang (21) des variablen Hochpasses (20) und den Ausgang des Vergleichers (36) ein Integrator (40) geschaltet ist.
  11. Schaltungsanordnung nach Anspruch 9,
    dadurch gekennzeichnet, dass zwischen den Steuereingang (21) des variablen Hochpasses (20) und den Ausgang des Vergleichers (36) eine digitale Schaltungsanordnung (60) zum Inkrementieren der Eckfrequenz fc in Schritten (d) vorgesehen ist.
  12. Schaltungsanordnung nach einem der Ansprüche 9 bis 11,
    dadurch gekennzeichnet, dass dem Eingangssignal an einem Eingang (34) des Vergleichers (36) ein Offset addiert wird.
  13. Schaltungsanordnung nach einem der Ansprüche 9 bis 12,
    dadurch gekennzeichnet, dass das Audiosignal ein Stereosignal ist, und dass einem ersten Eingang (34) des Vergleichers (36) die Summe aus den Eingangssignalen für den linken und rechten Kanal und dass dem zweiten Eingang (35) des Vergleichers (36) die Summe aus dem Ausgangssignal für den linken und rechten Kanal zugeführt wird.
EP02005495A 2001-05-18 2002-03-11 Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen Expired - Fee Related EP1258865B1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10124699A DE10124699C1 (de) 2001-05-18 2001-05-18 Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen
DE10124699 2001-05-18

Publications (3)

Publication Number Publication Date
EP1258865A2 EP1258865A2 (de) 2002-11-20
EP1258865A3 EP1258865A3 (de) 2004-05-06
EP1258865B1 true EP1258865B1 (de) 2006-10-18

Family

ID=7685568

Family Applications (1)

Application Number Title Priority Date Filing Date
EP02005495A Expired - Fee Related EP1258865B1 (de) 2001-05-18 2002-03-11 Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen

Country Status (4)

Country Link
US (1) US7418379B2 (de)
EP (1) EP1258865B1 (de)
JP (1) JP4141736B2 (de)
DE (2) DE10124699C1 (de)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10256799B3 (de) 2002-12-05 2004-04-29 Wabco Gmbh & Co. Ohg Verfahren zur Programmierung von Flash-E-PROMs in einer mit einem Mikroprozessor ausgerüsteten Steuerelektronik für Straßenfahrzeuge
EP1609134A1 (de) * 2003-01-31 2005-12-28 Oticon A/S Schallsystem mit verbessertersprachverständlichkeit
US7127076B2 (en) * 2003-03-03 2006-10-24 Phonak Ag Method for manufacturing acoustical devices and for reducing especially wind disturbances
US7474752B2 (en) * 2003-09-16 2009-01-06 Koninklijke Philips Electronics N.V. Audio frequency range adaptation
US7539614B2 (en) * 2003-11-14 2009-05-26 Nxp B.V. System and method for audio signal processing using different gain factors for voiced and unvoiced phonemes
US8718298B2 (en) * 2003-12-19 2014-05-06 Lear Corporation NVH dependent parallel compression processing for automotive audio systems
JP4282524B2 (ja) * 2004-03-30 2009-06-24 三洋電機株式会社 Am受信回路
US7643991B2 (en) * 2004-08-12 2010-01-05 Nuance Communications, Inc. Speech enhancement for electronic voiced messages
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
KR100667852B1 (ko) * 2006-01-13 2007-01-11 삼성전자주식회사 휴대용 레코더 기기의 잡음 제거 장치 및 그 방법
TWI376925B (en) * 2007-08-28 2012-11-11 Micro Star Int Co Ltd Adjusting device and method of notification sound according to the environment
AU2009267047A1 (en) * 2008-06-30 2010-01-07 Able Planet, Incorporated Method and system for auditory enhancement and hearing conservation
WO2010071521A1 (en) * 2008-12-19 2010-06-24 Telefonaktiebolaget L M Ericsson (Publ) Systems and methods for improving the intelligibility of speech in a noisy environment
US8553897B2 (en) * 2009-06-09 2013-10-08 Dean Robert Gary Anderson Method and apparatus for directional acoustic fitting of hearing aids
US8879745B2 (en) * 2009-07-23 2014-11-04 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Method of deriving individualized gain compensation curves for hearing aid fitting
US9101299B2 (en) * 2009-07-23 2015-08-11 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Hearing aids configured for directional acoustic fitting
CN103003877B (zh) * 2010-08-23 2014-12-31 松下电器产业株式会社 声音信号处理装置及声音信号处理方法
US8942397B2 (en) 2011-11-16 2015-01-27 Dean Robert Gary Anderson Method and apparatus for adding audible noise with time varying volume to audio devices
JP5284517B1 (ja) * 2012-06-07 2013-09-11 株式会社東芝 測定装置およびプログラム
DK2739069T3 (en) * 2012-11-30 2018-03-05 Gn Hearing As Hearing aid with analog filtration and associated method
US8693716B1 (en) 2012-11-30 2014-04-08 Gn Resound A/S Hearing device with analog filtering and associated method
CN104078050A (zh) 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
US9531333B2 (en) * 2014-03-10 2016-12-27 Lenovo (Singapore) Pte. Ltd. Formant amplifier
US10373608B2 (en) * 2015-10-22 2019-08-06 Texas Instruments Incorporated Time-based frequency tuning of analog-to-information feature extraction
US10142743B2 (en) 2016-01-01 2018-11-27 Dean Robert Gary Anderson Parametrically formulated noise and audio systems, devices, and methods thereof

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3678416A (en) * 1971-07-26 1972-07-18 Richard S Burwen Dynamic noise filter having means for varying cutoff point
US3696252A (en) * 1970-11-20 1972-10-03 Motorola Inc Active filter for selecting and controlling signals
JPS574492Y2 (de) * 1972-05-13 1982-01-27
US4454609A (en) * 1981-10-05 1984-06-12 Signatron, Inc. Speech intelligibility enhancement
DE3205685A1 (de) * 1982-02-17 1983-08-25 Robert Bosch Gmbh, 7000 Stuttgart Hoergeraet
US4539526A (en) 1983-01-31 1985-09-03 Dbx, Inc. Adaptive signal weighting system
US5170434A (en) * 1988-08-30 1992-12-08 Beltone Electronics Corporation Hearing aid with improved noise discrimination
FR2635680B1 (fr) * 1988-08-30 1997-12-26 Belone Electronics Corp Prothese auditive
US5083312A (en) * 1989-08-01 1992-01-21 Argosy Electronics, Inc. Programmable multichannel hearing aid with adaptive filter
CA2056110C (en) * 1991-03-27 1997-02-04 Arnold I. Klayman Public address intelligibility system
US5305420A (en) * 1991-09-25 1994-04-19 Nippon Hoso Kyokai Method and apparatus for hearing assistance with speech speed control function
WO1994007341A1 (en) * 1992-09-11 1994-03-31 Hyman Goldberg Electroacoustic speech intelligibility enhancement method and apparatus
US5479560A (en) * 1992-10-30 1995-12-26 Technology Research Association Of Medical And Welfare Apparatus Formant detecting device and speech processing apparatus
US5406633A (en) * 1992-11-03 1995-04-11 Auditory System Technologies, Inc. Hearing aid with permanently adjusted frequency response
US5796842A (en) 1996-06-07 1998-08-18 That Corporation BTSC encoder
US7110951B1 (en) * 2000-03-03 2006-09-19 Dorothy Lemelson, legal representative System and method for enhancing speech intelligibility for the hearing impaired

Also Published As

Publication number Publication date
JP4141736B2 (ja) 2008-08-27
US20020173950A1 (en) 2002-11-21
DE50208467D1 (de) 2006-11-30
JP2003018691A (ja) 2003-01-17
EP1258865A3 (de) 2004-05-06
EP1258865A2 (de) 2002-11-20
US7418379B2 (en) 2008-08-26
DE10124699C1 (de) 2002-12-19

Similar Documents

Publication Publication Date Title
EP1258865B1 (de) Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen
DE112009000805B4 (de) Rauschreduktion
DE69922940T2 (de) Vorrichtung und verfahren zur kombinierung von audiokompression und rückkopplungsunterdrückung in einem hörgerät
DE69630580T2 (de) Rauschunterdrücker und Verfahren zur Unterdrückung des Hintergrundrauschens in einem verrauschten Sprachsignal und eine Mobilstation
DE19948308C2 (de) Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung
EP1853089B1 (de) Verfahren zum Unterdrücken von Rückkopplungen und zur Spektralerweiterung bei Hörvorrichtungen
EP1143416B1 (de) Geräuschunterdrückung im Zeitbereich
EP0912974B1 (de) Verfahren zur verringerung von störungen eines sprachsignals
EP0668007B1 (de) Mobilfunkgerät mit freisprecheinrichtung
DE69628411T2 (de) Vorrichtung und Verfahren zur Geräuschreduzierung eines Sprachsignals
DE102005019677A1 (de) Verbesserungen für oder in Bezug auf eine Signalverarbeitung
WO2001043503A2 (de) Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals
EP1152527B1 (de) Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
EP3818727B1 (de) Vorrichtung und verfahren zur modifizierung eines lautsprechersignals zur vermeidung einer membranüberauslenkung
EP3565270B1 (de) Verfahren zur rauschunterdrückung in einem audiosignal
EP1155561B1 (de) Vorrichtung und verfahren zur geräuschunterdrückung in fernsprecheinrichtungen
DE10137348A1 (de) Verfahren und Schaltungsanordnung zur Geräuschreduktion bei der Sprachübertragung in Kommunikationssystemen
DE60303278T2 (de) Vorrichtung zur Verbesserung der Spracherkennung
EP1453355A1 (de) Signalverarbeitung in einem Hörgerät
DE10025655B4 (de) Verfahren zum Entfernen einer unerwünschten Komponente aus einem Signal und System zum Unterscheiden zwischen unerwünschten und erwünschten Signalkomponenten
WO2003037032A1 (de) Verfahren und vorrichtung zur störbefreiung eines redundanten akustischen signals
EP1351550A1 (de) Verfahren zur Anpassung einer Signalverstärkung in einem Hörgerät sowie ein Hörgerät
EP1130577B1 (de) Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen
DE2451278A1 (de) Vorrichtung und verfahren zur ausloeschung akustischer rueckkopplung
DE10137685C1 (de) Verfahren zum Erkennen des Vorliegens von Sprachsignalen

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

AX Request for extension of the european patent

Free format text: AL;LT;LV;MK;RO;SI

PUAL Search report despatched

Free format text: ORIGINAL CODE: 0009013

AK Designated contracting states

Kind code of ref document: A3

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

AX Request for extension of the european patent

Extension state: AL LT LV MK RO SI

RIC1 Information provided on ipc code assigned before grant

Ipc: 7G 10L 21/02 A

Ipc: 7H 03G 5/16 B

Ipc: 7H 04R 25/00 B

17P Request for examination filed

Effective date: 20040603

AKX Designation fees paid

Designated state(s): DE FR GB IT NL

17Q First examination report despatched

Effective date: 20050506

RBV Designated contracting states (corrected)

Designated state(s): DE FR GB IT NL

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): DE FR GB IT NL

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT;WARNING: LAPSES OF ITALIAN PATENTS WITH EFFECTIVE DATE BEFORE 2007 MAY HAVE OCCURRED AT ANY TIME BEFORE 2007. THE CORRECT EFFECTIVE DATE MAY BE DIFFERENT FROM THE ONE RECORDED.

Effective date: 20061018

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 20061018

REF Corresponds to:

Ref document number: 50208467

Country of ref document: DE

Date of ref document: 20061130

Kind code of ref document: P

ET Fr: translation filed
PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20070719

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20100402

Year of fee payment: 9

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20100322

Year of fee payment: 9

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: IT

Payment date: 20100326

Year of fee payment: 9

REG Reference to a national code

Ref country code: NL

Ref legal event code: SD

Effective date: 20101011

REG Reference to a national code

Ref country code: GB

Ref legal event code: 732E

Free format text: REGISTERED BETWEEN 20101125 AND 20101201

REG Reference to a national code

Ref country code: FR

Ref legal event code: TP

REG Reference to a national code

Ref country code: DE

Ref legal event code: R081

Ref document number: 50208467

Country of ref document: DE

Owner name: ENTROPIC COMMUNICATIONS, INC., SAN DIEGO, US

Free format text: FORMER OWNER: MICRONAS GMBH, 79108 FREIBURG, DE

Effective date: 20110210

GBPC Gb: european patent ceased through non-payment of renewal fee

Effective date: 20110311

REG Reference to a national code

Ref country code: FR

Ref legal event code: ST

Effective date: 20111130

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: FR

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20110331

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20110311

Ref country code: GB

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20110311

REG Reference to a national code

Ref country code: DE

Ref legal event code: R084

Ref document number: 50208467

Country of ref document: DE

Effective date: 20110426

REG Reference to a national code

Ref country code: DE

Ref legal event code: R082

Ref document number: 50208467

Country of ref document: DE

Representative=s name: EPPING HERMANN FISCHER, PATENTANWALTSGESELLSCH, DE

REG Reference to a national code

Ref country code: DE

Ref legal event code: R082

Ref document number: 50208467

Country of ref document: DE

Representative=s name: EPPING HERMANN FISCHER, PATENTANWALTSGESELLSCH, DE

Effective date: 20121023

Ref country code: DE

Ref legal event code: R081

Ref document number: 50208467

Country of ref document: DE

Owner name: ENTROPIC COMMUNICATIONS, INC., US

Free format text: FORMER OWNER: TRIDENT MICROSYSTEMS (FAR EAST) LTD., GRAND CAYMAN, KY

Effective date: 20121023

Ref country code: DE

Ref legal event code: R081

Ref document number: 50208467

Country of ref document: DE

Owner name: ENTROPIC COMMUNICATIONS, INC., SAN DIEGO, US

Free format text: FORMER OWNER: TRIDENT MICROSYSTEMS (FAR EAST) LTD., GRAND CAYMAN, KY

Effective date: 20121023

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20130327

Year of fee payment: 12

REG Reference to a national code

Ref country code: NL

Ref legal event code: SD

Effective date: 20130916

REG Reference to a national code

Ref country code: DE

Ref legal event code: R119

Ref document number: 50208467

Country of ref document: DE

REG Reference to a national code

Ref country code: DE

Ref legal event code: R119

Ref document number: 50208467

Country of ref document: DE

Effective date: 20141001

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: DE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20141001

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: NL

Payment date: 20150326

Year of fee payment: 14

REG Reference to a national code

Ref country code: NL

Ref legal event code: MM

Effective date: 20160401

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: NL

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20160401