EP1258865A2 - Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen - Google Patents

Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen Download PDF

Info

Publication number
EP1258865A2
EP1258865A2 EP02005495A EP02005495A EP1258865A2 EP 1258865 A2 EP1258865 A2 EP 1258865A2 EP 02005495 A EP02005495 A EP 02005495A EP 02005495 A EP02005495 A EP 02005495A EP 1258865 A2 EP1258865 A2 EP 1258865A2
Authority
EP
European Patent Office
Prior art keywords
circuit arrangement
frequency
arrangement according
input
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP02005495A
Other languages
English (en)
French (fr)
Other versions
EP1258865B1 (de
EP1258865A3 (de
Inventor
Matthias Vierthaler
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TDK Micronas GmbH
Original Assignee
TDK Micronas GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TDK Micronas GmbH filed Critical TDK Micronas GmbH
Publication of EP1258865A2 publication Critical patent/EP1258865A2/de
Publication of EP1258865A3 publication Critical patent/EP1258865A3/de
Application granted granted Critical
Publication of EP1258865B1 publication Critical patent/EP1258865B1/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility

Definitions

  • the invention relates to a circuit arrangement for improvement the intelligibility of speech-containing audio signals according to the features of the preamble of claim 1.
  • the aim of the present invention is speech intelligibility a relatively good audio signal with unchanged Improve volume. This means equal intelligibility at a lower volume or improved intelligibility with ambient noise.
  • US 5,553,151 describes a so-called “forward masking ".
  • weak consonants are replaced by the previous ones strong vowels covered over time.
  • This release beats a relatively fast compressor with an “attack time” of approx. 10 msec. and a “release time “from approx. 75 to 150 msec.
  • the aim of the present invention is therefore a circuit arrangement to improve the speech quality of audio signals to indicate that on the one hand requires little effort and on the other hand, the language still sounds natural.
  • the invention is essentially based on the audio signal amplify to a predetermined factor and in a high pass to filter, the corner frequency of the high pass being regulated that the amplitude of the audio signal after the processing route equal to or proportional to the amplitude of the audio signal is at the entrance of the processing line.
  • the fundamental wave of the speech signal which contributes relatively little to intelligibility, but possesses the greatest energy, is weakened and the usual Signal spectrum of the audio signal increased accordingly become.
  • the whole Signal raised by a factor g. This factor controls the strength of the effect of signal enhancement, being meaningful Values for the factor g are between 1.5 and 4.
  • an "offset" can be added to the input signal, which is either fixed or proportional to the peak amplitude of the audio signal on the input side.
  • the cut-off frequency f c of the variable high-pass filter has a lower limit, since the lowest frequency for speech is approx. A range of approximately 100 to 120 Hz has proven useful for a lower corner frequency.
  • the circuit arrangement has a variable high-pass filter 20 whose corner frequency f c can be changed.
  • the variable high-pass filter 20 has a control input 21, to which a control signal for changing the corner frequency f c can be applied.
  • the audio signal to be improved is preferably supplied to this variable high pass 20 via a low pass 10.
  • an input terminal 1 is provided for applying the audio signal.
  • the low pass 10 does not have to be provided, but is advantageous in order to eliminate signal interference in the audio signal.
  • At the output of the variable high pass 20 there is an amplifier stage 30 which amplifies the output signal of the variable high pass 20 by a factor g. This factor g is adjustable and is preferably between about 1.5 and 4. A gain factor that has been set is preferably no longer changed.
  • the entire processing line consisting of variable high-pass filter 20 and amplifier 30 as well as optional low-pass filter 10 has an output terminal 2, at which the processed audio signal can be tapped as an output signal.
  • the corner frequency f c of the variable high-pass filter 20 is regulated in the following manner in order to improve the intelligibility of speech within the audio signal. If the amplitude (or also energy) of the input signal at input 1 of the circuit arrangement is greater than the amplitude (or energy) at output 2 of the transmission link, then the basic frequency f c is reduced. Incidentally, increased. If the amplitudes at input 1 and output 2 are the same or proportional to a predetermined factor, there is no further change in the base frequency f c .
  • FIG downstream integrator which is preceded by a scaling factor Ki is provided.
  • the output terminal of the integrator 40 is connected to the control input 21 of the variable high pass 20 Connection.
  • the comparator 36 has two input terminals 34, 35 on, at the first terminal 34 the input signal and on whose terminal 35 the output signal of the transmission link is created.
  • the circuit arrangement of FIG. 3 differs from the circuit arrangement of FIG. 2 in that the integrator 40 is replaced by a digital circuit arrangement 60.
  • the basic frequency f c is increased or decreased by a step d in accordance with the output signal of the comparator 36, depending on whether the output signal xc at the output of the comparator 36 is greater or less than 0.
  • the circuit arrangement works as follows: A vowel is low-frequency with a large amplitude. In contrast, a consonant is high-frequency with a small amplitude.
  • the amplification factor g is set such that an amplification of 6 dB is achieved.
  • the corner frequency of the variable high-pass filter 20 has been adjusted to this low frequency by the low-frequency vowel.
  • the fundamental wave is so far lowered that the output amplitude is the same as the input amplitude of the audio signal, although the gain of 6 dB has been selected.
  • the circuit arrangement according to the invention from FIG. 1 operates as follows.
  • the high pass filter 20 has tuned to the frequency of the consonant.
  • the amplitude of the input signal corresponds to the amplitude of the output signal. If a vowel follows (low frequency), the relatively high cut-off frequency f c of the high-pass filter 20 attenuates the vowel during the time transition and consequently does not cover the consonant. Only after a few milliseconds, the base frequency f c is adjusted based on the control time of the control loop so that the amplitude of the input signal corresponds to the amplitude of the output signal.
  • each channel can receive its own control as described above or you can use a common control.
  • the audio path (high pass, low pass, gain) is calculated separately for left and right, but the high passes have the same corner frequency f c .

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)

Abstract

Die Sprachverständlichkeit eines Audiosignal bei unveränderter Lautstärke wird verbessert, in dem das gesamte Audiosignal um einen konstanten Faktor angehoben und die Amplitude dieses angehobenen Signales durch einen Hochpass abgesenkt wird. Die Eckfrequenz fc des Hochpasses wird dabei so geregelt, dass die Ausgangsamplitude des Audiosignals am Ende der Verarbeitungsstrecke gleich oder proportional der Eingangsamplitude des Audiosignals ist. <IMAGE>

Description

Die Erfindung betrifft eine Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen gemäß den Merkmalen des Oberbegriffs des Anspruchs 1.
Es gibt verschiedene Möglichkeiten, wie die Sprachverständlichkeit von Audiosignalen verbessert werden kann. Eine Möglichkeit liegt in der Verbesserung des verrauschten Signals. Eine andere Möglichkeit liegt darin, solche Signale zu verbessern, die durch Hall und Echos etc. degradiert wurden. Schließlich kann ein gutes Audiosignal verändert werden, so
dass es für Schwerhörige besser verständlich wird. Dies wird beispeilsweise mit Hörgeräten erreicht. Letzlich ist die Veränderung eines guten Audiosignals möglich, so dass es bei starken Hintergrundgeräuschen besser verständlich ist.
Ziel der vorliegenden Erfindung ist es, die Sprachverständlichkeit eines verhältnismäßig guten Audiosignals bei unveränderter Lautstärke zu verbessern. Dies bedeutet, gleiche Verständlichkeit bei geringerer Lautstärke oder verbesserte Verständlichkeit bei Umgebungslärm.
Aus US 5,459,813 ist es bekannt, dass sogenannte "unvoiced sounds" (z. B. Konsonanten) von den viel stärkeren "voiced sounds" (z. B. Vokale) überdeckt werden. Da die "unvoiced sounds" wichtig für die Sprachverständlichkeit sind, wird in dieser Veröffentlichung vorgeschlagen, diese z. B. durch Clipping oder Amplitudenkompression zu verstärken.
In der Veröffentlichung "effects of amplitud distorsion upon intellegibility of speech" von J. C. Liqulider in dem Journal of acustical society of america, Oktober 1946 ist ein sogenanntes "peak clipping" bekannt. Ein solches "peak clipping" ohne Umgebungsrauschen hat kaum Einfluss auf die Sprachverständlichkeit. Ein "peak clipping" bei -20 dB führt immer noch zu einer Verständlchkeit von etwa 96%. Das sogenannte "center clipping" ist wesentlich schlechter, da hier die Konsonanten entfernt werden, die für die Verständlichkeit besonders wichtig sind. "Peak clipping" bei -24 dB braucht nur eine Verstärkung von etwa 14 dB, um dieselbe Verständlichkeit zu erreichen. Aus der Veröffentlichung Elwood Kretsinger et al "The Use of fast Limiting to improve the Intelligibility of Speech in Noise", Speech Monographs, March 1960 ist es bekannt, dass Konsonanten ca. 12 dB schwächer als Vokale sind. Verstärkt man die Konsonanten relativ zu den Vokalen, wird deshalb die Verständlichkeit von Sprache im Audiosignal erhöht. Ersetzt man den Clipper durch einen schnellen "peak limitter" (22 msec) kann man die Verständlichkeit noch weiter erhöhen. Bei -10 dBlimitting erhöhte sich die Verständlichkeit von 56 % auf 84 %.
Aus Veröffentlichung Ian Thomas et al. "The Intelligibility of filtered-clipped Speech in Noise", The Journal of the Audio Engineering Society, June 1970 ist es bekannt, dass die Grundwelle eines Audiosignals, das Sprache enthält, nur wenig zur Sprachverständlichkeit beiträgt, während die erste Resonanzfrequenz sehr wichtig ist. Deshalb sollte das Signal vor dem Clipping hochpassgefiltert werden.
Aus Veröffentlichung Ian Thomas et al., "Intelligibility enhancement through spectral weigthing", Proceedings of the 1972 IEEE Conference on Speech Communication and Processing ist es bekannt, dass das Clipping zwar die Verständlichkeit von Sprache erhöht, jedoch die Signalqualität beeinträchtigt. In dieser Veröffentlichung wird deshalb vorgeschlagen, die Signalenergie in die signifikanten Frequenzbereiche zu verlagern.
Aus US 5,479,560 ist es darüber hinaus bekannt, das Audiosignal in mehrere Frequenzbänder aufzuteilen und diejenigen Frequenzbänder mit großer Energie verhältnismäßig stark zu verstärken und die anderen abzusenken. Dies wird deshalb vorgeschlagen, weil Sprache aus einer Aneinanderreihung von Phonehmen besteht. Phoneme bestehen aus einer Vielzahl von Frequenzen. Diese werden an den Resonanzfrequenzen des Mund- und Rachenraums besonders verstärkt. Ein Frequenzband mit solche einem spektralen Peak wird Formant genannt. Formants sind besonders wichtig zur Erkennung von Phonemen und somit Sprache. Ein Ansatz zur Verbesserung der Sprachverständlichkeit ist es daher, die Peaks (Formants) des Frequenzspektrums eines Audiosignals zu verstärken und die dazwischen liegenden Täler abzuschwächen. Für einen Erwachsenen Mann liegt die Grundfrequenz von Sprache bei etwa 60 bis 250 Hz. Die ersten vier Formants liegen bei 500 Hz, 1 500 Hz, 2 500 Hz und 3 500 Hz (vgl. hierzu US-Patent 5,459,813.
Aus US 4,454,609 ist es bekannt, hauptsächlich die Konsonanten zu verstärken.
Schließlich beschreibt US 5,553,151 ein sogenanntes "forward masking". Hierbei werden schwache Konsonanten durch die vorhergehenden starken Vokale zeitlich überdeckt. Diese Veröffentlichung schlägt einen verhältnismäßig schnellen Kompressor mit einer "attack time" von ca. 10 msec. und einer "release time" von ca. 75 bis 150 msec. vor.
Problematisch bei den bisher bekannten Systemen zur Erhöhung der Sprachverständlichkeit von Sprache in Audiosignalen ist deren verhältnismäßig hohe Komplexität, das bedeutet, dass sowohl ein hoher Softwareaufwand zur Berechnung der einzelnen Allgorithmen sowie ein hoher Hardwareaufwand notwendig ist. Bei einfacheren Systemen wird dagegen das Audiosignal so verändert, dass die Sprache nicht mehr sehr natürlich klingt. Des Weiteren kann bei einfachen Systemen dem Sprachsignal Störungen zugefügt werden, das einer verbesserten Verständlichkeit sogar entgegen wirken kann.
Ziel der vorliegenden Erfindung ist es daher, eine Schaltungsanordnung zur Verbesserung der Sprachqualität von Audiosignalen anzugeben, das einerseits geringen Aufwand erfordert und andererseits die Sprache noch natürlich klingen lässt.
Dieses Ziel wird durch eine Schaltungsanordnung mit dem Merkmale des Anspruchs 1 gelöst.
Weiterbildungen einer solchen Schaltungsanordnung sind Gegenstand der Unteransprüche.
Die Erfindung beruht im Wesentlichen darauf, das Audiosignal auf einen vorgegebenen Faktor zu verstärken und in einem Hochpass zu filtern, wobei die Eckfrequenz des Hochpasses so geregelt wird, dass die Amplitude des Audiosignals nach der Verarbeitungsstrecke gleich oder proportional der Amplitude des Audiosignals am Eingang der Verarbeitungsstrecke ist.
Mit dieser Schaltungsanordnung kann die Grundwelle des Sprachsignals, die relativ wenig zur Verständlichkeit beiträgt, aber die größte Energie besitzt, abgeschwächt werden und das übliche Signalspektrums des Audiosignals entsprechend angehoben werden. Außerdem kann die Amplitude der Vokale (große Amplitude, tiefe Frequenz) im Übergangsbereich Konsonant (kleine Amplitude, große Frequenz) zu Vokal abgesenkt werden, um das sogenannte "backward masking" zu verringern. Dazu wird das gesamte Signal um einen Faktor g angehoben. Dieser Faktor steuert die Stärke des Effekts der Signalverbesserung, wobei sinnvolle Werte für den Faktor g etwa zwischen 1,5 und 4 liegen. Mit der erfindungsgemäßen Schaltungsanordnung werden als höher frequente Anteile angehoben und die tieffrequente Grundwelle im gleichen Maße abgesenkt, so dass die Amplitude (oder Energie) des Audiosignales unverändert bleibt. Für Signalanteile mit kleinen Amplituden, also Konsonanten, kann mit der Schaltungsanordnung nach der vorliegenden Erfindung die Eckfrequenz des variablen Hochpasses abgesenkt werden. Deshalb kann in der Regelung zu dem Eingangssignal noch ein "offset" addiert werden, der entweder fix oder proportional zur Peak-Amplitude des eingangsseitigen Audiosignal ist.
In einer Weiterbildung der Erfindung ist vorgesehen, dass höherfrequenzte Signalanteile im Audiosignal abgesenkt werden. Mit einem Tiefpass vor dem variablen Hochpass können Störungen im Signal unterdrückt werden.
In einer Weiterbildung der Erfindung ist vorgesehen, dass die Eckfrequenz fc des variablen Hochpassfilters nach unten begrenzt wird, da die unterste Frequenz für Sprache bei ca. 200 Hz liegt. Bewährt hat sich für eine untere Eckfrequenz ein Bereich von etwa 100 bis 120 Hz.
Nachfolgend wird die erfindungsgemäße Schaltungsanordnung anhand von Figuren beispielhaft erläutert. Es zeigen:
Figur 1
die prinzipielle Schaltungsanordnung zur Verbesserung der Sprachverständlichkeit in einem Audiosignal,
Figur 2
eine Weiterbildung der Schaltungsanordnung von Figur 1,
Figur 3
eine andere Weiterbildung der Schaltungsanordnung von Figur 1, und
Figur 4
eine andere Weiterbildung der Schaltungsanordnung von Figur 1, und
Figur 5
eine vierte Weiterbildung der erfindungsgemäßen Schaltungsanordnung.
In den nachfolgenden Figuren bezeichnen gleiche Bezugszeichen, sofern nicht anders angegeben, gleiche Teile mit gleicher Bedeutung.
In Figur 1 ist der prinzipielle Aufbau der erfindungsgemäßen Schaltungsanordnung gezeigt. Die Schaltungsanordnung weist einen variablen Hochpass 20 auf, der in seiner Eckfrequenz fc veränderbar ist. Hierfür verfügt der variable Hochpass 20 über einen Steuereingang 21, an dem ein Steuersignal zur Veränderung der Eckfrequenz fc anlegbar ist. Diesem variablen Hochpass 20 wird vorzugsweise über einen Tiefpass 10 das zu verbessernde Audiosignal zugeführt. Hierfür ist eine Eingangsklemme 1 zum Anlegen des Audiosignals vorgesehen. Der Tiefpass 10 muss nicht vorgesehen sein, ist jedoch vorteilhaft, um Signalstörungen im Audiosignal zu beseitigen. Am Ausgang des variablen Hochpasses 20 sitzt eine Verstärkerstufe 30, die das ausgangsseitige Signal des variablen Hochpasses 20 um einen Faktor g verstärkt. Dieser Faktor g ist einstellbar und liegt vorzugsweise zwischen etwa 1,5 und 4. Ein einmal eingstellter Verstärkungsfaktor wird vorzugsweise nicht mehr verändert. Die gesamte Verarbeitungsstrecke bestehend aus variablen Hochpass 20 und Verstärker 30 sowie optionalem Tiefpass 10 verfügt über eine Ausgangsklemme 2, an der das verarbeitete Audiosignal als Ausgangssignal abgreifbar ist.
Erfindungsgemäß wird eine Regelung der Eckfrequenz fc des variablen Hochpasses 20 in folgender Art und Weise zur Verbesserung der Sprachverständlichkeit von Sprache innerhalb des Audiosignals durchgeführt. Ist die Amplitude (oder auch Energie) des Eingangssignals am Eingang 1 der Schaltungsanordnung größer als die Amplitude (oder Energie) am Ausgang 2 der Übertragungsstrecke, dann wird die Eckfrequenz fc erniedrigt. Im Übrigen erhöht. Sofern die Amplituden am Eingang 1 und Ausgang 2 gleich oder zu einem vorgegebenen Faktor proportional sind, erfolgt keine weitere Veränderung der Eckfrequenz fc.
In Figur 2 ist eine Weiterbildung der Schaltungsanordnung von Figur 1 dargestellt. In Figur 2 ist ein Vergleicher 36 mit nachgeschaltetem Integrator, dem ein Skalierungsfaktor Ki vorgeschaltet ist, vorgesehen. Die Ausgangsklemme des Integrators 40 ist mit dem Steuereingang 21 des variablen Hochpasses 20 in Verbindung. Der Vergleicher 36 weist zwei Eingangsklemmen 34, 35 auf, an deren erste Klemme 34 das Eingangssignal und an dessen Klemme 35 das Ausgangssignal der Übertragungsstrecke angelegt wird.
Die Schaltungsanordnung von Figur 3 unterscheidet sich von der Schaltungsanordnung von Figur 2 dadurch, dass der Integrator 40 durch eine digitale Schaltungsanordnung 60 ersetzt ist. In der digitalen Schaltungsanordnung 60 wird nach Maßgabe des Ausgangssignals des Vergleichers 36 die Eckfrequenz fc um einen Schritt d erhöht oder erniedrigt, je nachdem, ob das Ausgangssignal xc am Ausgang des Vergleichers 36 größer oder kleiner 0 ist.
Schließlich ist in Figur 4 noch eine Weiterbildung der erfindungsgemäßen Schaltungsanordnung dargestellt. Die Weiterbildung besteht darin, dass zu dem an dem Eingang 34 anstehenden Eingangssignal ein Offset K addiert wird. Dieser Offset kann konstant gewählt werden oder ein mit einem Faktor K gewichteter Ausgang eines Peak-Detektor 70 sein. An dem Peak-Detektor 70 wird eingangsseitig das Audiosignal angelegt.
Mit der erfindungsgemäßen Schaltungsanordnung gemäß den Figuren 1 bis 4 ist es möglich, die Grundwelle des Audiosignals abzusenken und den restlichen Signalanteil anzuheben. Hierfür ist das variable Hochpassfilter 20 verantwortlich.
Für den Fall, dass im Sprachsignal ein Konsonant einem Vokal folgt, arbeitet die Schaltungsanordnung folgendermaßen: Ein Vokal ist tieffrequent mit großer Amplitude. Ein Konsonant ist dagegen hochfrequent mit kleine Amplitude. Bei der erfindungsgemäßen Schaltungsanordnung wird der Verstärkungsfaktor g so eingestellt, dass eine Verstärkung von 6 dB erreicht wird. Durch den tieffrequenten Vokal hat sich die Eckfrequenz des variablen Hochpassfilters 20 auf diese tiefe Frequenz eingestellt. Die Grundwelle ist also so weit abgesenkt, dass die Ausgangsamplitude gleicher Eingangsamplitude des Audiosignals ist, obwohl die Verstärkung von 6 dB gewählt wurde. Folgt auf den Vokal nun ein Konsonant (höhere Frequenz!) wird dieser sofort um 6 dB angehoben, da die Eckfrequenz des Hochpassfilters 20 noch auf die tiefe Frequenz des Vokals eingestellt ist. Der Konsonant wird als weniger stark vom Vokal überdeckt. Erst nach einigen Millisekunden erhöht sich die Eckfrequenz fc und senkt somit auch den Konsonant ab, so dass die Amplitude des Eingangssignals gleich der Amplitude des Ausgangssignals der Verarbeitungsstrecke ist.
Bei einem Übergang Konsonant auf Vokal arbeitet die erfindungsgemäße Schaltungsanordnung von Figur 1 folgendermaßen. Das Hochpassfilter 20 hat sich auf die Frequenz des Konsonants eingestellt. Die Amplitude des Eingangssignals entspricht der Amplitude des Ausgangssignals. Folgt nun ein Vokal (tieffrequent) wird durch die verhältnismäßig hohe Eckfrequenz fc des Hochpassfilters 20 der Vokal beim zeitlichen Übergang gedämpft und der Konsonant folglich nicht überdeckt. Erst nach einigen Millisekunden ist die Eckfrequenz fc aufgrund der Regelzeit der Regelschleife so eingeregelt, dass die Amplitude des Eingangssignals der Amplitude des Ausgangssignals entspricht.
Abschließend ist noch folgendes anzumerken: Bei einem Stereosignal kann entweder jeder Kanal eine eigene Regelung erhalten wie oben beschrieben oder sie können eine gemeinsame Regelung benutzen. Dann ist z. B. (vgl. Figur 5) an den Eingang 34=Abs(Input_Left)+Abs(Input_Right) anzulegen und an den Eingang 35=Abs(Output_Left)+Abs(Output_Right). Der Audiopfad (Hochpass, Tiefpass, Gain) wird für links und rechts getrennt berechnet, die Hochpässe besitzen aber dieselbe Eckfrequenz fc.

Claims (14)

  1. Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen, bei welcher Frequenz- und/oder Amplitudenanteile des Audiosignals nach vorgegebenen Parametern verändert werden,
    dadurch gekennzeichnet, dass das Audiosignal in einer Verarbeitungsstrecke um einen vorgegebenen Faktor g verstärkt sowie in einem Hochpasses (20) geführt wird, wobei eine Eckfrequenz fc des Hochpasses (20) so regelbar ist, dass die Amplitude des Audiosignals (2) nach der Verarbeitungsstrecke gleich oder proportional der Amplitude des Audiosignals vor der Verarbeitungsstrekke ist.
  2. Schaltungsanordnung nach Anspruch 1,
    dadurch gekennzeichnet, dass der Faktor g > = 1 gewält ist.
  3. Schaltungsanordnung nach Anspruch 1 oder 2,
    dadurch gekennzeichnet, dass der Faktor g etwa zwischen 1,5 und 4 gewählt ist.
  4. Schaltungsanordnung nach einem der Ansprüche 1 bis 3,
    dadurch gekennzeichnet, dass dann, wenn die Amplitude des Eingangssignals größer als die Ampliude des Ausgangssignals am Ausgang der Verarbeitungsstrecke ist, die Eckfrequenz fc erniedrigt wird und im umgekehrten Fall erhöht wird.
  5. Schaltungsanordnung nach einem der Ansprüche 1 bis 4,
    dadurch gekennzeichnet, dass die Änderung der Eckfrequenz fc inkremental erfolgt, vorzugsweise in ein Hz-Schritten.
  6. Schaltungsanordnung nach einem der Ansprüche 1 bis 5,
    dadurch gekennzeichnet, dass die Eckfrequenz fc im Bereich von etwa 100 Hz bis 1 kHz variierbar ist.
  7. Schaltungsanordnung nach einem der Ansprüche 1 bis 6,
    dadurch gekennzeichnet, dass die untere Eckfrequenz fc bei etwa 100 bis 120 Hz liegt.
  8. Schaltungsanordnung nach einem der Ansprüche 1 bis 7,
    dadurch gekennzeichnet, dass vor dem variablen Hochpass (20) ein Tiefpass (10) geschaltet ist.
  9. Schaltungsanordnung nach Anspruch 8,
    dadurch gekennzeichnet, dass der Tiefpass (10) eine Eckfrequenz bei etwa 6 kHz aufweist.
  10. Schaltungsanordnung nach einem der Ansprüche 1 bis 9,
    dadurch gekennzeichnet, dass an einen Steuereingang (21) des variablen Hochpasses (20) zur Veränderung der Eckfrequenz (fc) ein Vergleicher (36) gekoppelt ist, an dessen einen Eingang (34) das Eingangssignal der Verarbeitungstrecke und an dessen anderen Eingang (35) das Ausgangssignal der Verarbeitungsstrecke geschaltet ist.
  11. Schaltungsanordnung nach Anspruch 10,
    dadurch gekennzeichnet, dass zwischen den Steuereingang (21) des variablen Hochpasses (20) und den Ausgang des Vergleichers (36) ein Integrator (40) geschaltet ist.
  12. Schaltungsanordnung nach Anspruch 10,
    dadurch gekennzeichnet, dass zwischen den Steuereingagn (21) des variablen Hochpasses (20) und den Ausgang des Vergleichers (36) eine digitale Schaltungsanordnung (60) zum Inkrementieren der Eckfrequenz fc in Schritten (d) vorgesehen ist.
  13. Schaltungsanordnung nach einem der Ansprüche 10 bis 12,
    dadurch gekennzeichnet, dass dem Eingangssignal an einem Eingang (34) des Vergleichers (36) ein Offset addiert wird.
  14. Schaltungsanordnung nach einem der Ansprüche 10 bis 13,
    dadurch gekennzeichnet, dass das Audiosignal ein Stereosignal ist, und dass einem ersten Eingang (34) des Vergleichers (36) die Summe aus den Eingangssignalen für den linken und rechten Kanal und dass dem zweiten Eingang (35) des Vergleichers (36) die Summe aus dem Ausgangssignal für den linken und rechten Kanal zugeführt wird.
EP02005495A 2001-05-18 2002-03-11 Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen Expired - Lifetime EP1258865B1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10124699A DE10124699C1 (de) 2001-05-18 2001-05-18 Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen
DE10124699 2001-05-18

Publications (3)

Publication Number Publication Date
EP1258865A2 true EP1258865A2 (de) 2002-11-20
EP1258865A3 EP1258865A3 (de) 2004-05-06
EP1258865B1 EP1258865B1 (de) 2006-10-18

Family

ID=7685568

Family Applications (1)

Application Number Title Priority Date Filing Date
EP02005495A Expired - Lifetime EP1258865B1 (de) 2001-05-18 2002-03-11 Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen

Country Status (4)

Country Link
US (1) US7418379B2 (de)
EP (1) EP1258865B1 (de)
JP (1) JP4141736B2 (de)
DE (2) DE10124699C1 (de)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6799101B2 (en) 2002-12-05 2004-09-28 Wabco Gmbh & Co. Ohg Method for programming flash EEPROMS in microprocessor-equipped vehicle control electronics
US8693716B1 (en) 2012-11-30 2014-04-08 Gn Resound A/S Hearing device with analog filtering and associated method
EP2739069A1 (de) * 2012-11-30 2014-06-04 GN Resound A/S Hörgerät mit Analogfilterung und zugehöriges Verfahren
EP2979267B1 (de) 2013-03-26 2019-12-18 Dolby Laboratories Licensing Corporation Vorrichtungen und verfahren zur audioklassifizierung und -verarbeitung

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060126859A1 (en) * 2003-01-31 2006-06-15 Claus Elberling Sound system improving speech intelligibility
US7127076B2 (en) * 2003-03-03 2006-10-24 Phonak Ag Method for manufacturing acoustical devices and for reducing especially wind disturbances
EP1665874A1 (de) * 2003-09-16 2006-06-07 Koninklijke Philips Electronics N.V. Audiofrequenzbereichsanpassung
US7539614B2 (en) * 2003-11-14 2009-05-26 Nxp B.V. System and method for audio signal processing using different gain factors for voiced and unvoiced phonemes
US8718298B2 (en) * 2003-12-19 2014-05-06 Lear Corporation NVH dependent parallel compression processing for automotive audio systems
JP4282524B2 (ja) * 2004-03-30 2009-06-24 三洋電機株式会社 Am受信回路
US7643991B2 (en) * 2004-08-12 2010-01-05 Nuance Communications, Inc. Speech enhancement for electronic voiced messages
DE102004049347A1 (de) 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
KR100667852B1 (ko) * 2006-01-13 2007-01-11 삼성전자주식회사 휴대용 레코더 기기의 잡음 제거 장치 및 그 방법
TWI376925B (en) * 2007-08-28 2012-11-11 Micro Star Int Co Ltd Adjusting device and method of notification sound according to the environment
EP2308046A4 (de) * 2008-06-30 2011-08-17 Able Planet Inc Verfahren und system zur gehörverbesserung und zum hören eines gesprächs
WO2010071521A1 (en) * 2008-12-19 2010-06-24 Telefonaktiebolaget L M Ericsson (Publ) Systems and methods for improving the intelligibility of speech in a noisy environment
US8553897B2 (en) 2009-06-09 2013-10-08 Dean Robert Gary Anderson Method and apparatus for directional acoustic fitting of hearing aids
US9101299B2 (en) * 2009-07-23 2015-08-11 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Hearing aids configured for directional acoustic fitting
US8879745B2 (en) * 2009-07-23 2014-11-04 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Method of deriving individualized gain compensation curves for hearing aid fitting
CN103003877B (zh) * 2010-08-23 2014-12-31 松下电器产业株式会社 声音信号处理装置及声音信号处理方法
US8942397B2 (en) 2011-11-16 2015-01-27 Dean Robert Gary Anderson Method and apparatus for adding audible noise with time varying volume to audio devices
JP5284517B1 (ja) * 2012-06-07 2013-09-11 株式会社東芝 測定装置およびプログラム
US9531333B2 (en) * 2014-03-10 2016-12-27 Lenovo (Singapore) Pte. Ltd. Formant amplifier
US10373608B2 (en) 2015-10-22 2019-08-06 Texas Instruments Incorporated Time-based frequency tuning of analog-to-information feature extraction
US10142743B2 (en) 2016-01-01 2018-11-27 Dean Robert Gary Anderson Parametrically formulated noise and audio systems, devices, and methods thereof

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3678416A (en) * 1971-07-26 1972-07-18 Richard S Burwen Dynamic noise filter having means for varying cutoff point
US3696252A (en) * 1970-11-20 1972-10-03 Motorola Inc Active filter for selecting and controlling signals
JPS574492Y2 (de) * 1972-05-13 1982-01-27
US4454609A (en) * 1981-10-05 1984-06-12 Signatron, Inc. Speech intelligibility enhancement
DE3205685A1 (de) * 1982-02-17 1983-08-25 Robert Bosch Gmbh, 7000 Stuttgart Hoergeraet
US4539526A (en) * 1983-01-31 1985-09-03 Dbx, Inc. Adaptive signal weighting system
US5170434A (en) * 1988-08-30 1992-12-08 Beltone Electronics Corporation Hearing aid with improved noise discrimination
FR2635680B1 (fr) * 1988-08-30 1997-12-26 Belone Electronics Corp Prothese auditive
US5083312A (en) * 1989-08-01 1992-01-21 Argosy Electronics, Inc. Programmable multichannel hearing aid with adaptive filter
CA2056110C (en) * 1991-03-27 1997-02-04 Arnold I. Klayman Public address intelligibility system
US5305420A (en) * 1991-09-25 1994-04-19 Nippon Hoso Kyokai Method and apparatus for hearing assistance with speech speed control function
WO1994007341A1 (en) * 1992-09-11 1994-03-31 Hyman Goldberg Electroacoustic speech intelligibility enhancement method and apparatus
US5479560A (en) * 1992-10-30 1995-12-26 Technology Research Association Of Medical And Welfare Apparatus Formant detecting device and speech processing apparatus
US5406633A (en) * 1992-11-03 1995-04-11 Auditory System Technologies, Inc. Hearing aid with permanently adjusted frequency response
US5796842A (en) * 1996-06-07 1998-08-18 That Corporation BTSC encoder
US7110951B1 (en) * 2000-03-03 2006-09-19 Dorothy Lemelson, legal representative System and method for enhancing speech intelligibility for the hearing impaired

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6799101B2 (en) 2002-12-05 2004-09-28 Wabco Gmbh & Co. Ohg Method for programming flash EEPROMS in microprocessor-equipped vehicle control electronics
US8693716B1 (en) 2012-11-30 2014-04-08 Gn Resound A/S Hearing device with analog filtering and associated method
EP2739069A1 (de) * 2012-11-30 2014-06-04 GN Resound A/S Hörgerät mit Analogfilterung und zugehöriges Verfahren
US9407998B2 (en) 2012-11-30 2016-08-02 Gn Resound A/S Hearing device with analog filtering and associated method
EP3340658A1 (de) * 2012-11-30 2018-06-27 GN Hearing A/S Hörgerät mit analogfilterung und zugehöriges verfahren
EP2979267B1 (de) 2013-03-26 2019-12-18 Dolby Laboratories Licensing Corporation Vorrichtungen und verfahren zur audioklassifizierung und -verarbeitung
EP3598448B1 (de) 2013-03-26 2020-08-26 Dolby Laboratories Licensing Corporation Vorrichtungen und verfahren zur audioklassifizierung und -verarbeitung

Also Published As

Publication number Publication date
EP1258865B1 (de) 2006-10-18
US7418379B2 (en) 2008-08-26
DE50208467D1 (de) 2006-11-30
JP2003018691A (ja) 2003-01-17
JP4141736B2 (ja) 2008-08-27
DE10124699C1 (de) 2002-12-19
US20020173950A1 (en) 2002-11-21
EP1258865A3 (de) 2004-05-06

Similar Documents

Publication Publication Date Title
EP1258865B1 (de) Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen
DE68913139T2 (de) Störunterdrückung.
EP1853089B1 (de) Verfahren zum Unterdrücken von Rückkopplungen und zur Spektralerweiterung bei Hörvorrichtungen
DE69131095T2 (de) Verständlichkeitsverbesserungsanordnung für eine Beschallungsanlage
DE69123500T2 (de) 32 Kb/s codeangeregte prädiktive Codierung mit niedrigen Verzögerung für Breitband-Sprachsignal
DE69737235T2 (de) Digitales hörhilfegerät unter verwendung von differenzsignaldarstellungen
DE69719246T2 (de) Spektrale Umsetzung eines digitalen Audiosignals
DE69428119T2 (de) Verringerung des hintergrundrauschens zur sprachverbesserung
EP1919257B1 (de) Pegelabhängige Geräuschreduktion
DE2526034A1 (de) Hoerhilfeverfahren und vorrichtung zur durchfuehrung des verfahrens
DE69420183T2 (de) Verfahren und Vorrichtung zur Sprachkodierung und Sprachdekodierung und Sprachnachverarbeitung
EP0076234A1 (de) Verfahren und Vorrichtung zur redundanzvermindernden digitalen Sprachverarbeitung
EP0668007A1 (de) Mobilfunkgerät mit freisprecheinrichtung
DE69820362T2 (de) Nichtlinearer Filter zur Geräuschunterdrückung in linearen Prädiktions-Sprachkodierungs-Vorrichtungen
CH625900A5 (de)
EP3818727B1 (de) Vorrichtung und verfahren zur modifizierung eines lautsprechersignals zur vermeidung einer membranüberauslenkung
EP1152527B1 (de) Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
EP3565270B1 (de) Verfahren zur rauschunterdrückung in einem audiosignal
DE3733983A1 (de) Verfahren zum daempfen von stoerschall in von hoergeraeten uebertragenen schallsignalen
EP0658874B1 (de) Verfahren und Schaltungsanordnung zur Vergrösserung der Bandbreite von schmalbandigen Sprachsignalen
DE19832472A1 (de) Vorrichtung und Verfahren zur Beeinflussung eines Audiosignals in Abhängigkeit von Umgebungsgeräuschen
EP1453355A1 (de) Signalverarbeitung in einem Hörgerät
DE69427331T2 (de) Verfahren und Vorrichtung zur Verarbeitung von Signalen
EP2394271B1 (de) Methode zur trennung von signalpfaden und anwendung auf die verbesserung von sprache mit elektro-larynx
DE69015753T2 (de) Tonsyntheseanordnung.

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

AX Request for extension of the european patent

Free format text: AL;LT;LV;MK;RO;SI

PUAL Search report despatched

Free format text: ORIGINAL CODE: 0009013

AK Designated contracting states

Kind code of ref document: A3

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

AX Request for extension of the european patent

Extension state: AL LT LV MK RO SI

RIC1 Information provided on ipc code assigned before grant

Ipc: 7G 10L 21/02 A

Ipc: 7H 03G 5/16 B

Ipc: 7H 04R 25/00 B

17P Request for examination filed

Effective date: 20040603

AKX Designation fees paid

Designated state(s): DE FR GB IT NL

17Q First examination report despatched

Effective date: 20050506

RBV Designated contracting states (corrected)

Designated state(s): DE FR GB IT NL

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): DE FR GB IT NL

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT;WARNING: LAPSES OF ITALIAN PATENTS WITH EFFECTIVE DATE BEFORE 2007 MAY HAVE OCCURRED AT ANY TIME BEFORE 2007. THE CORRECT EFFECTIVE DATE MAY BE DIFFERENT FROM THE ONE RECORDED.

Effective date: 20061018

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 20061018

REF Corresponds to:

Ref document number: 50208467

Country of ref document: DE

Date of ref document: 20061130

Kind code of ref document: P

ET Fr: translation filed
PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20070719

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20100402

Year of fee payment: 9

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20100322

Year of fee payment: 9

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: IT

Payment date: 20100326

Year of fee payment: 9

REG Reference to a national code

Ref country code: NL

Ref legal event code: SD

Effective date: 20101011

REG Reference to a national code

Ref country code: GB

Ref legal event code: 732E

Free format text: REGISTERED BETWEEN 20101125 AND 20101201

REG Reference to a national code

Ref country code: FR

Ref legal event code: TP

REG Reference to a national code

Ref country code: DE

Ref legal event code: R081

Ref document number: 50208467

Country of ref document: DE

Owner name: ENTROPIC COMMUNICATIONS, INC., SAN DIEGO, US

Free format text: FORMER OWNER: MICRONAS GMBH, 79108 FREIBURG, DE

Effective date: 20110210

GBPC Gb: european patent ceased through non-payment of renewal fee

Effective date: 20110311

REG Reference to a national code

Ref country code: FR

Ref legal event code: ST

Effective date: 20111130

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: FR

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20110331

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20110311

Ref country code: GB

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20110311

REG Reference to a national code

Ref country code: DE

Ref legal event code: R084

Ref document number: 50208467

Country of ref document: DE

Effective date: 20110426

REG Reference to a national code

Ref country code: DE

Ref legal event code: R082

Ref document number: 50208467

Country of ref document: DE

Representative=s name: EPPING HERMANN FISCHER, PATENTANWALTSGESELLSCH, DE

REG Reference to a national code

Ref country code: DE

Ref legal event code: R082

Ref document number: 50208467

Country of ref document: DE

Representative=s name: EPPING HERMANN FISCHER, PATENTANWALTSGESELLSCH, DE

Effective date: 20121023

Ref country code: DE

Ref legal event code: R081

Ref document number: 50208467

Country of ref document: DE

Owner name: ENTROPIC COMMUNICATIONS, INC., US

Free format text: FORMER OWNER: TRIDENT MICROSYSTEMS (FAR EAST) LTD., GRAND CAYMAN, KY

Effective date: 20121023

Ref country code: DE

Ref legal event code: R081

Ref document number: 50208467

Country of ref document: DE

Owner name: ENTROPIC COMMUNICATIONS, INC., SAN DIEGO, US

Free format text: FORMER OWNER: TRIDENT MICROSYSTEMS (FAR EAST) LTD., GRAND CAYMAN, KY

Effective date: 20121023

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20130327

Year of fee payment: 12

REG Reference to a national code

Ref country code: NL

Ref legal event code: SD

Effective date: 20130916

REG Reference to a national code

Ref country code: DE

Ref legal event code: R119

Ref document number: 50208467

Country of ref document: DE

REG Reference to a national code

Ref country code: DE

Ref legal event code: R119

Ref document number: 50208467

Country of ref document: DE

Effective date: 20141001

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: DE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20141001

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: NL

Payment date: 20150326

Year of fee payment: 14

REG Reference to a national code

Ref country code: NL

Ref legal event code: MM

Effective date: 20160401

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: NL

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20160401