EP1103956B1 - Exponential reduction of echo and noise during speech pauses - Google Patents

Exponential reduction of echo and noise during speech pauses Download PDF

Info

Publication number
EP1103956B1
EP1103956B1 EP00124577A EP00124577A EP1103956B1 EP 1103956 B1 EP1103956 B1 EP 1103956B1 EP 00124577 A EP00124577 A EP 00124577A EP 00124577 A EP00124577 A EP 00124577A EP 1103956 B1 EP1103956 B1 EP 1103956B1
Authority
EP
European Patent Office
Prior art keywords
signal
noise
speech
signals
echo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
EP00124577A
Other languages
German (de)
French (fr)
Other versions
EP1103956A3 (en
EP1103956A2 (en
Inventor
Hans Jürgen Matt
Michael Walker
Michael Maurer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alcatel CIT SA
Alcatel Lucent SAS
Original Assignee
Alcatel CIT SA
Alcatel SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alcatel CIT SA, Alcatel SA filed Critical Alcatel CIT SA
Publication of EP1103956A2 publication Critical patent/EP1103956A2/en
Publication of EP1103956A3 publication Critical patent/EP1103956A3/en
Application granted granted Critical
Publication of EP1103956B1 publication Critical patent/EP1103956B1/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses

Definitions

  • TK telecommunications
  • so-called echoes occur in telecommunications connections in two-wire TK networks as line echoes and for example in simple and more uncomfortable TK terminals in the form of acoustic echoes occur.
  • the noise in the first Speech pauses measured and in the form of a power density spectrum continuously stored in a memory.
  • the power density spectrum is over won a Fourier transformation.
  • the stored noise spectrum "as the best current estimate” Subtracted from the current disturbed speech spectrum, then in the Time domain transformed back to this way a noise reduction for the disturbed signal.
  • the power density spectra for the noise and for the speech itself are first estimated by means of a spectral subtraction.
  • a spectral acoustic masking threshold R T (f) for the human ear is then calculated using the rules from the MPEG standard, for example.
  • a filter pass curve H (f) is then calculated according to a simple rule, which is designed so that essential spectral parts of the speech are transmitted as unchanged as possible and spectral parts of the noise are lowered as far as possible.
  • the compander initially has the property of having speech signals certain (pre-set) "normal speech signal level" (possibly normal Called volume) virtually unchanged from its entrance to the exit transferred to.
  • the compander thus consists of a compressor for speech signal levels, which are greater than or equal to a normal level and an expander for Signal levels that are less than the normal level.
  • the gain reduction in the expander becomes stronger with increasingly smaller input levels.
  • Object of the present invention is in contrast, a method with to present the features described above, in which possible inexpensive and inexpensive way without big Computing and with low demand for computer memory and Data storage is an echo and noise reduction is effected with simple means as pleasant as possible for the human ear Acoustic overall impression produced, depending on the taste in addition to individual needs can be adjusted.
  • a significant noise reduction is achieved.
  • that a reduction of the noise during a speech break the hearing significantly less burdened by making the deafness effect louder Sound effect significantly reduces.
  • the ear can be reinserted when the Speech more responsive and listen more carefully.
  • the value of the time constant ⁇ 1 in humans is usually between 50 ms to 150 ms and is preferably about 65 ms.
  • a 0 (k + 1) assumes a predetermined constant value c 2 during a speech pause and / or a value c 3 ⁇ c 2 if an echo signal is present if the predecessor value a 0 (k ) ⁇ c 2 has become.
  • the given function f (N) is a function g (S / N), which is derived from the quotient S / N from the power value of the signal level S the useful signals to be transmitted and the power value of the noise level N or that the given function f (N) is a function g '(N / S), which depends on the reciprocal N / S of this quotient.
  • the given function f (N) is a function g '(N / S), which depends on the reciprocal N / S of this quotient.
  • noise reduction f max or g max should be at a maximum between 20 and 30, preferably about 25 dB.
  • the functions f (N) or g (S / N) or g '(N / S) are chosen so that the Reduction of the noise level N is correct according to the psychoacoustic Means of the human auditory spectrum is done.
  • the value for S and / or N not only from the instantaneous power value alone, but also determined from a weighted spectral curve of S and N and in total, a hearing aid, i. a psychoacoustically pleasant sounding noise reduction achieved. Since there is no easily representable measure for an acoustically pleasant sounding Noise reduction is there, all quality assessments are extensive Hearing tests dependent, which then optimized by means of statistical Methods are evaluated to a rating scale, (similar to Speech codecs).
  • a good noise level estimation requires a good speech pause detector, because one can only be sure that in the speech pause sections just annoying noise and not some mix between noise and speech fragments, as is common in practice occurs.
  • a method variant which is characterized by this is particularly preferred characterized in that in the speech pause detector from the input signal x a short-term output sam (x) by means of a short-term level estimator, by means of a middle-time level estimator, a middle-time output signal mam (x) and by means of a long-term level estimator, a long-term output signal lam (x) is formed, that the three output signals sam (x), mam (x) and lam (x) via suitable gain coefficients are set to be approximately equal large, if the input signal x is a pure noise signal, where sam (x) ⁇ mam (x) ⁇ lam (x), that the three output signals sam (x), mam (x) and lam (x) be monitored by comparators, and that the presence of a Speech signal is assumed as the input signal x, if sam (x) and mam (x) initially each become larger than lam (x), and the presence of a Speech signal is
  • a development of this variant of the method provides that the three output signals sam (x), mam (x) and lam (x) for speech pause estimation be supplied to a neural network, which with a variety was trained by scenarios with different input signals x.
  • One Neural network may advantageously have linear and non-linear relationships between a large amount of input parameters and the desired ones Map output values.
  • a prerequisite for this is that the neural Net once with a sufficient amount of input values and training associated output values. Therefore, neural are suitable Networks especially for the task of speech pause detection Presence of different disturbing noises.
  • the presence of echo signals is also detected and / or predicted, and the corresponding echo signals are suppressed or reduced.
  • echoes also occur in a telephone channel, they can generally be predicted on the basis of a previously determined signal propagation time ⁇ E of an echo and the previously determined echo coupling ERL in the channel and the signal strength ES which triggers the echo in the return channel. This estimation can be carried out in such a way that the magnitude of the delayed incoming echoes is estimated as a function of the transmitted speech signal and its instantaneous power.
  • this echo-loaded signal is preferably additionally briefly damped, for example by the abovementioned exponential depression, to a value which is necessary for a substantial reduction of the echo signal.
  • a compander characteristic curve can also be briefly moved in the direction of greater input volume for echoes and returned to its original position after the echoes have faded away.
  • R which describes a reduction of signal levels for both noises and echoes: R (S, N, ES, ⁇ e , ERL, thrs) ⁇ g (S / N) d (ES, ⁇ e , ERL, thrs), where g (S / N) is the above-described noise reduction and dummy is the independently additionally occurring echo reduction when the estimated echo signal exceeds the predetermined threshold value thrs.
  • a noise reduction is also at a constant noise level constant.
  • a sudden onset of echo reduction in the rhythm of Language also means a noise reduction (at least in the short Period) in the speech rhythm. This leads to a pulsed Background noise, which does not sound natural. Therefore, it is advantageous, in the moments of an additional echo reduction Synthetic noise of a suitable noise generator in the Magnitude of the normal background noise to the processed signal to add. This should be as consistent as possible background noise be conveyed to the listener.
  • spectral subtraction with Downstream level reduction in the speech pauses is that First, by means of spectral subtraction, a part of the noise from the Speech signal itself is eliminated and only then the speech pauses in the described type of noise and echoes are released. Total results This combination in subjective tests better hearing impressions than just one simple spectral subtraction.
  • the method provides that the useful signal to be transmitted is a subjected to human hearing adapted spectral filtering.
  • the means of a spectral subtraction first a Estimation of noises, speech and echoes performed, then determines an auricular masking threshold and then the entire Signal via a suitably set transmission filter so edited that the Language components as unadulterated as possible and the echo and noise components be suppressed as much as possible.
  • a combination with the downstream level reduction in the Speech pauses further improve the listening experience.
  • no (or in other examples only a small) suppression of interference signals in the overall signal is carried out, so that the speech signal is forwarded as unadulterated as possible and unhindered.
  • FIG. 2 schematically shows the mode of operation of an arrangement for noise and echo reduction in accordance with the abovementioned reduction function R (S, N, ES, ⁇ E , ERL, thrs) with a speech pause detector SPD.
  • the function value g or g 'for the case S / N ⁇ 0 dB, ie for an extremely high background noise changes into a constant value g 0 of the noise reduction of approximately 6 dB.
  • S / N 0 dB
  • an increased noise reduction is achieved with increasing improvement of the signal-to-noise ratio S / N, reaching a maximum g max ⁇ 25 dB at approximately S / N ⁇ 12 dB.
  • S / N the degree of noise reduction finally drops to zero in order to perform as little manipulation in the transmitted useful signal with low background noise.

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

The exponential echo (E) and noise (N) reduction system samples the received signal regularly and has a speech pause detector (SPD) to scale down the cancellation constant (a0(k)) used to weight the stored best estimate of noise power spectral density (g(S/N)) during pauses.

Description

Die Erfindung betrifft ein Verfahren zur Reduktion von Echo- und/oder Geräuschsignalen bei Telekommunikations(=TK)-Systemen für die Übertragung von akustischen Nutzsignalen, insbesondere menschlicher Sprache, bei dem mittels Sprach-Pausen-Detektion ermittelt wird, wann in der zu übertragenden Mischung aus Nutzsignalen und Störsignalen ein Sprachsignal enthalten ist oder wann eine Sprachpause vorliegt, wobei mittels eines Multiplizierers mit zwei Eingängen die in der Regel durch Echo- und/oder Geräuschsignale gestörten Nutzsignale in ihrer Amplitude durch ein zeitabhängiges Steuersignal a0(t) bzw. durch ein im Rhythmus einer Abtastrate fT=1/T getaktetes Steuersignal a0(k) verändert werden, wobei k ∈

Figure 00010001
die Abtastwerte durchzählt und T die Periodendauer von einem Abtastwert zum nächsten bedeutet. The invention relates to a method for the reduction of echo and / or noise signals in telecommunications (= TK) systems for the transmission of useful acoustic signals, in particular human speech, in which by means of speech pause detection is determined when in the mixture to be transferred from useful signals and interfering signals, a speech signal is included or when there is a speech break, wherein by means of a multiplier with two inputs the disturbed usually by echo and / or noise signals useful in their amplitude by a time-dependent control signal a 0 (t) or by a in the rhythm of a sampling rate f T = 1 / T clocked control signal a 0 (k) are changed, where k ∈
Figure 00010001
the samples are counted and T is the period from one sample to the next.

Ein solches Verfahren ist beispielsweise bekannt aus der DE 42 29 912 A1.Such a method is known for example from DE 42 29 912 A1.

Während einer natürlichen Kommunikation zwischen Menschen passt man in der Regel die Amplitude der gesprochenen Sprache automatisch an die akustische Umgebung an. Bei einer Sprachkommunikation zwischen entfernten Orten jedoch befinden sich die Gesprächspartner nicht im selben akustischen Umfeld und sind sich daher jeweils nicht der akustischen Situation am Ort des anderen Gesprächspartners bewusst. Besonders verschärft tritt daher ein Problem auf, wenn einer der Partner aufgrund seiner akustischen Umgebung gezwungen ist, sehr laut zu sprechen, während der andere Partner in einer leisen akustischen Umgebung Sprachsignale mit geringer Amplitude erzeugt.During a natural communication between people one fits in usually the amplitude of the spoken language automatically to the acoustic environment. In case of voice communication between remote But places are not in the same acoustic Environment and are therefore each not the acoustic situation at the place of other interlocutor aware. Particularly aggravated therefore occurs Problem if one of the partners because of its acoustic environment is forced to speak very loud while the other partner in one quiet acoustic environment produces low-amplitude speech signals.

Hinzu kommt das Problem, dass auf einem TK-Kanal auch ein "elektronisch erzeugtes" Geräusch entsteht und als Hintergrund zum Nutzsignal mitübertragen wird. Des weiteren ist es auch vorteilhaft, Störsignale wie unerwünschten Hintergrundlärm (Straßenlärm, Fabriklärm, Bürolärm, Kantinenlärm, Fluglärm etc.) zu reduzieren oder ganz zu unterdrücken. Um den Komfort beim Telefonieren zu erhöhen, ist man generell bestrebt, jede Art von Geräusch möglichst gering zu halten.In addition there is the problem that on a TK channel also an "electronic generated "noise arises and as a background to the useful signal is transferred. Furthermore, it is also advantageous to interference signals such as unwanted background noise (street noise, factory noise, office noise, Canteen noise, aircraft noise, etc.) to reduce or completely suppress. To the To increase comfort when making calls, one is generally anxious to do any kind of Keep noise as low as possible.

Schließlich entstehen bei TK-Verbindungen auch noch sogenannte Echos, die in Zweidraht-TK-Netzen als Leitungsechos und beispielsweise in einfachen und unkomfortableren TK-Endgeräten in Form von akustischen Echos auftreten.Finally, so-called echoes occur in telecommunications connections in two-wire TK networks as line echoes and for example in simple and more uncomfortable TK terminals in the form of acoustic echoes occur.

Allgemein ist es deshalb bei der Übertragung von einem Gemisch aus Sprachsignal und Störsignalen über TK-Netze wichtig, die Störsignale wie Geräusch und Echo soweit wie möglich in ihrer Amplitude abzusenken.In general, therefore, it is in the transmission of a mixture of Speech signal and interference signals over TK networks important, the interference signals such Lowering the noise and echo as much as possible in their amplitude.

Ein bekanntes Verfahren zur Geräuschreduktion ist die sogenannte "spektrale Subtraktion", die beispielsweise in der Veröffentlichung "A new approach to noise reduction based on auditory masking effects" von S. Gustafsson und P. Jax, ITG-Fachtagung, Dresden, 1998, beschrieben ist. Dabei handelt es sich um ein spektrales Geräuschabsenkungsverfahren, bei dem eine akustische Verdeckungsschwelle (beispielsweise nach dem MPEG-Standard) berücksichtigt wird. Nachteilig bei derartigen Verfahren ist die aufwendige Bestimmung dieser akustischen Verdeckungsschwelle und die Ausführung aller mit diesem Verfahren verbundenen Rechenoperationen.One known method of noise reduction is the so-called "spectral Subtraction ", for example, in the publication" A new approach to noise reduction based on auditory masking effects "by S. Gustafsson and P. Jax, ITG Symposium, Dresden, 1998. It is about to a spectral noise reduction method, in which an acoustic Masking threshold (for example according to the MPEG standard) is taken into account. A disadvantage of such methods is the complicated Determination of this acoustic masking threshold and the execution of all arithmetic operations associated with this method.

Bei einer spektralen Subtraktion wird zunächst das Geräusch in den Sprachpausen gemessen und in Form eines Leistungsdichtespektrums fortlaufend in einem Speicher abgelegt. Das Leistungsdichtespektrum wird über eine Fourier Transformation gewonnen. Beim Auftreten von Sprache wird sodann das gespeicherte Geräuschspektrum "als bester aktueller Schätzwert" vom aktuellen gestörten Sprachspektrum subtrahiert, sodann in den Zeitbereich zurücktransformiert, um auf diese Weise eine Geräuschreduktion für das gestörte Signal zu erhalten.In a spectral subtraction, the noise in the first Speech pauses measured and in the form of a power density spectrum continuously stored in a memory. The power density spectrum is over won a Fourier transformation. When speech occurs then the stored noise spectrum "as the best current estimate" Subtracted from the current disturbed speech spectrum, then in the Time domain transformed back to this way a noise reduction for the disturbed signal.

Ein weiterer Nachteil der spektralen Subtraktion besteht darin, dass durch den Vorgang einer prinzipiell nicht genauen spektralen Geräuschschätzung und nachfolgender Subtraktion auch Fehler im Ausgangssignal auftreten, die sich als "musical tones" bemerkbar machen. Außerdem ist dieses bekannte Verfahren kaum zur Unterdrückung von Echosignalen bei TK-Verbindungen geeignet.Another disadvantage of the spectral subtraction is that due to the Process of a principally inaccurate spectral noise estimation and Subsequent subtraction also errors occur in the output signal itself as "musical tones" noticeable. Besides, this is known Method hardly to suppress echo signals in TK connections suitable.

Bei der erweiterten spektralen Signalbearbeitung, die ebenfalls in dem genannten Zitat beschrieben ist, werden zunächst mit Hilfe einer spektralen Subtraktion die Leistungsdichtespektren für das Geräusch und für die Sprache selbst geschätzt. Aus der Kenntnis dieser Teilspektren wird sodann mit Hilfe z.B. der Regeln aus dem MPEG Standard eine spektrale akustische Verdeckungsschwelle RT(f) für das menschliche Ohr berechnet. Mit Hilfe dieser Verdeckungsschwelle und den geschätzten Spektren für Geräusch und Sprache wird sodann nach einer einfachen Regel eine Filterdurchlasskurve H(f) berechnet, die so gestaltet ist, dass wesentliche spektrale Teile der Sprache möglichst unverändert durchgelassen und spektrale Teile des Geräusches möglichst abgesenkt werden.In the extended spectral signal processing, which is also described in the above citation, the power density spectra for the noise and for the speech itself are first estimated by means of a spectral subtraction. From the knowledge of these partial spectra, a spectral acoustic masking threshold R T (f) for the human ear is then calculated using the rules from the MPEG standard, for example. Using this masking threshold and the estimated spectra for noise and speech, a filter pass curve H (f) is then calculated according to a simple rule, which is designed so that essential spectral parts of the speech are transmitted as unchanged as possible and spectral parts of the noise are lowered as far as possible.

Sodann wird das originale gestörte Sprachsignal nur durch dieses Filter gegeben, um auf diese Weise eine Geräuschreduktion für das gestörte Signal zu erhalten. Der Vorteil dieses Verfahrens besteht nun darin, dass vom gestörten Signal "Nichts addiert oder subtrahiert" wird und daher Fehler in den Schätzungen weniger bis kaum wahrnehmbar sind. Nachteilig ist wieder der erhebliche Rechenaufwand für die spektrale Geräuschunterdrückung sowie das für eine Echounterdrückung vorzuschaltende adaptive Filter.Then the original disturbed speech signal is only through this filter given in order to reduce noise for the disturbed signal to obtain. The advantage of this method is that of disturbed signal "Nothing is added or subtracted" and therefore errors in the Estimates are less to barely perceptible. The disadvantage is again the considerable computational effort for the spectral noise suppression as well as the adaptive filters to be pre-switched for echo cancellation.

Bei dem bekannten Kompander-Verfahren, wie es beispielsweise in der eingangs zitierten DE 42 29 912 A1 beschrieben ist, wird der Grad der Geräusch- und Echoabsenkung gemäß einer fest vorgegebenen Transferfunktion festgelegt, die unter anderem eine Pegelabsenkung auch bei sehr kleinen Eingangssignalen vornimmt.In the known Kompander method, as for example in the the initially cited DE 42 29 912 A1 is described, the degree of Noise and echo reduction according to a fixed preset Transfer function, among other things, a level reduction also at makes very small input signals.

Der Kompander hat zunächst die Eigenschaft, Sprachsignale mit einem bestimmten (vorab eingestellten) "normalen Sprachsignalpegel" (ggf. normale Lautstärke genannt) praktisch unverändert von seinem Eingang zum Ausgang zu übertragen.The compander initially has the property of having speech signals certain (pre-set) "normal speech signal level" (possibly normal Called volume) virtually unchanged from its entrance to the exit transferred to.

Wird nun aber das Eingangssignal einmal zu laut, z.B. weil ein Sprecher zu dicht an sein Mikrofon kommt, so begrenzt ein Dynamik-Kompressor den Ausgangspegel auf nahezu den gleichen Wert wie im Normalfall, indem die aktuelle Verstärkung im Kompander mit zunehmender Eingangslautstärke linear abgesenkt wird. Durch diese Eigenschaft bleibt die Sprache am Ausgang des Kompandersystems etwa gleich laut - unabhängig davon wie stark die Eingangslautstärke schwankt.But if the input signal becomes too loud, e.g. because a speaker too comes close to his microphone, so limited a dynamic compressor the Output level to almost the same value as in the normal case by the current gain in compander with increasing input volume linear is lowered. This property leaves the language at the output of the Kompandersystems about the same volume - regardless of how strong the Input volume fluctuates.

Wird nun andererseits ein Signal mit einem Pegel, der kleiner als der Normalpegel ist, auf den Eingang des Kompanders gegeben, so wird das Signal zusätzlich gedämpft, indem die Verstärkung zurückgeregelt wird, um Hintergrundgeräusche möglichst nur abgeschwächt zu übertragen.Now, on the other hand, a signal with a level that is smaller than the Normal level is given to the input of the compander, so will that Signal is additionally attenuated by the gain being back-regulated to If possible, transmit background noise only attenuated.

Der Kompander besteht somit aus einem Kompressor für Sprachsignalpegel, die größer oder gleich einem Normalpegel sind und einem Expander für Signalpegel, die kleiner als der Normalpegel sind. Die Verstärkungsabsenkung im Expander wird dabei mit zunehmend kleineren Eingangspegeln stärker.The compander thus consists of a compressor for speech signal levels, which are greater than or equal to a normal level and an expander for Signal levels that are less than the normal level. The gain reduction in the expander becomes stronger with increasingly smaller input levels.

Nachteilig bei der Kompander-Lösung ist der erhebliche Rechenaufwand, der zur Durchführung des bekannten Verfahrens erforderlich ist. Durch die Kompression des Sprachsignalpegels einerseits und durch die Expansion andererseits wird außerdem eine Modulation in der Sprachlautstärke hervorgerufen, die das Sprachsignal in einer Weise verändert, dass das Ergebnis subjektiv oft als unbefriedigend empfunden wird, d.h. einen unbefriedigenden Höreindruck hinterlässt.A disadvantage of the compander solution is the considerable computational effort, the is required to carry out the known method. By the Compression of the speech signal level on the one hand and through the expansion on the other hand, there is also a modulation in the speech volume which changes the speech signal in a manner that the The subjective result is often perceived as unsatisfactory, i. one unsatisfactory hearing impression leaves behind.

Ein anderes Verfahren zur Geräuschreduktion ist im Dokument US-5.533.133.A offenbart. In diesem Dokument werden Sprachlose Segmente linear unit Sprachsegmenten überblendet.Another method of noise reduction is in document US-5,533,133. A. This document discusses Speechless Segments linear unit superimposes speech segments.

Aufgabe der vorliegenden Erfindung ist es demgegenüber, ein Verfahren mit den eingangs beschriebenen Merkmalen vorzustellen, bei dem in möglichst unaufwendiger und kostengünstiger Art und Weise ohne großen Rechenaufwand und mit geringem Bedarf an Rechenspeicher und Datenspeicherplatz eine Echo- und Geräuschabsenkung bewirkt wird, die mit einfachen Mitteln einen für das menschliche Ohr möglichst angenehmen akustischen Gesamteindruck erzeugt, der je nach Geschmack zusätzlich an individuelle Bedürfnisse angepasst werden kann.Object of the present invention is in contrast, a method with to present the features described above, in which possible inexpensive and inexpensive way without big Computing and with low demand for computer memory and Data storage is an echo and noise reduction is effected with simple means as pleasant as possible for the human ear Acoustic overall impression produced, depending on the taste in addition to individual needs can be adjusted.

Erfindungsgemäß wird diese Aufgabe auf ebenso einfache wie wirkungsvolle Art und Weise dadurch gelöst, dass das Steuersignal a0(t) bzw. a0(k) so variiert wird, dass während des Vorliegens von Sprachsignalen im Nutzsignal die Amplitude des Steuersignals a0(t) bzw. a0(k) auf einen vorgegebenen konstanten Verstärkungswert c0 gesetzt wird und mit Beginn einer Sprachpause im Nutzsignal die Amplitude des Steuersignals a0(t) bzw. a0(k) von einem Abtastwert zum nächsten gemäß der Rekursionsformel a0(k+1) = a0(k) · β   mit β < 1 stetig abgesenkt wird,
und dass nach dem Ende einer Sprachpause wieder a0(k) = c0 gesetzt wird.
According to the invention, this object is achieved in a manner that is simple and effective in that the control signal a 0 (t) or a 0 (k) is varied such that the amplitude of the control signal a 0 (t 1 ) during the presence of speech signals in the useful signal ) or a 0 (k) is set to a predetermined constant gain value c 0 and at the beginning of a speech break in the payload the amplitude of the control signal a 0 (t) or a 0 (k) from one sample to the next according to the recursion formula a 0 (k + 1) = a 0 (k) · β with β <1 is steadily lowered,
and that after the end of a speech pause again a 0 (k) = c 0 is set.

Damit steht eine sehr einfache und sehr kostengünstige Methode bereit, die auch eine überraschend gute Qualität bezüglich einer Störreduktion ergibt, indem sie vorzugsweise in Sprachpausen die störenden Echo- und Geräuschsignale reduziert. Während der Sprachphasen selbst werden die Störgeräusche zumindest teilweise maskiert und daher vom menschlichen Ohr weit weniger deutlich wahrgenommen. Durch das Weglassen der Kompression nach dem bekannten Kompander-Verfahren wird das originale Sprachsignal erheblich weniger verändert, so dass im Ergebnis ein in der Regel besser klingendes Sprachsignal am anderen Ende der Leitung ankommt. Außerdem erfordert das erfindungsgemäße Verfahren eine geringere Rechenleistung als das Kompander-Verfahren, da ja zumindest die Kompression unterbleibt. Entsprechend sind geringere Kapazitäten an Datenspeichern und Rechenspreicher erforderlich, was das erfindungsgemäße Verfahren im Gegensatz zu den bekannten Verfahren einfacher und kostengünstiger gestaltet.This is a very simple and very cost-effective method ready, the also gives a surprisingly good quality with respect to a noise reduction, by preferably in speech pauses the disturbing echo and Noise signals reduced. During the language phases themselves the Noise at least partially masked and therefore from the human ear much less clearly perceived. By omitting the compression according to the known compander method, the original speech signal significantly less changed, so in the end a generally better sounding voice signal arrives at the other end of the line. Furthermore the method according to the invention requires less computing power than The compander method, since at least the compression is omitted. Accordingly, lower capacities of data memories and Compensators required, which is the inventive method in Contrary to the known methods simpler and cheaper designed.

Um eine effektive Geräuschreduktion zu erzielen, wird das zu übertragende Signal während der Sprachpausen in seinem Leistungswert gemäß einer zeitlichen Exponentialfunktion, im Gegensatz zu einer vom Eingangspegel abhängigen Absenkung, wie bei dem Kompander-Verfahren, abgesenkt. Damit wird bereits eine wesentliche Geräuschminderung erzielt. Hinzu kommt, dass eine Absenkung der Geräusche während einer Sprachpause das Gehör deutlich weniger belastet, indem es den Taubheitseffekt nach lauter Schalleinwirkung wesentlich mindert. Das Ohr kann bei Wiedereinsetzen der Sprache empfindlicher reagieren und genauer hinhören. In order to achieve an effective noise reduction, the to be transmitted Signal during the pauses in its power value according to a temporal exponential function, as opposed to one of the input level dependent lowering, as in the compander method, lowered. In order to Already a significant noise reduction is achieved. In addition, that a reduction of the noise during a speech break the hearing significantly less burdened by making the deafness effect louder Sound effect significantly reduces. The ear can be reinserted when the Speech more responsive and listen more carefully.

Vorteilhaft wird der Faktor β so gewählt, dass die stetige zeitliche Absenkung in etwa einer Zeitkonstanten τ1 der Wahrnehmbarkeit des menschlichen Ohres entspricht. Dies bedeutet, dass das menschliche Ohr nach einem starken Schallereignis neue Schallereignisse zeitlich und in ihrer Amplitude unterhalb eines mit der Zeitkonstanten τ1 abklingenden Kurvenverlaufes nach dem Ende des starken Schallereignisses nicht wahrnimmt. Bevorzugt ist daher eine Variante des erfindungsgemäßen Verfahrens, bei der der Faktor β aus der Abtastrate fT, aus einer Zeitkonstanten τ1 und aus einem vorgegebenen konstanten Vorfaktor c1 bestimmt wird gemäß der Beziehung β = c1·exp(-1/τ1fT)Advantageously, the factor β is chosen so that the steady time reduction in about a time constant τ 1 corresponds to the perceptibility of the human ear. This means that after a strong sound event, the human ear does not perceive new sound events in time and in their amplitude below a curve which decays with the time constant τ 1 after the end of the strong sound event. Therefore, a variant of the method according to the invention is preferred in which the factor β is determined from the sampling rate f T , from a time constant τ 1 and from a predetermined constant prefactor c 1 according to the relationship β = c 1 · exp (-1 / τ 1 f T )

Der Wert der Zeitkonstanten τ1 liegt beim Menschen in der Regel zwischen 50 ms bis 150 ms und beträgt vorzugsweise etwa 65 ms.The value of the time constant τ 1 in humans is usually between 50 ms to 150 ms and is preferably about 65 ms.

Um den Faktor β genau nach der Zeitkonstanten τ1 zu dimensionieren, ist es günstig, wenn c0=1 gewählt wird.In order to dimension the factor β exactly according to the time constant τ 1 , it is favorable if c 0 = 1 is selected.

Wird die stetige exponentielle Absenkung der Störsignale nach der oben beschriebenen Rekursionsformel nicht begrenzt, so wird der Wert von a0 (k) mit wachsendem k sehr rasch ziemlich klein und geht gegen 0. Dies ist aber nicht immer erwünscht, da man in vielen Fällen lieber ein kleines Restgeräusch hören möchte, um während einer Sprachpause den Eindruck zu vermeiden, die TK-Leitung sei plötzlich "tot" oder unterbrochen. Bevorzugt ist daher eine Variante des erfindungsgemäßen Verfahrens, bei der a0(k+1) während einer Sprachpause einen vorgegebenen konstanten Wert c2 und/oder bei Vorliegen eines Echosignals einen Wert c3 < c2 annimmt, falls der Vorgängerwert a0(k) ≤ c2 geworden ist.If the steady exponential decay of the interfering signals is not limited according to the recursion formula described above, the value of a 0 (k) grows very rapidly with increasing k and approaches 0. However, this is not always desirable since in many cases it is better want to hear a small residual noise to avoid during a speech break the impression that the telecommunications line is suddenly "dead" or interrupted. A variant of the method according to the invention is therefore preferred in which a 0 (k + 1) assumes a predetermined constant value c 2 during a speech pause and / or a value c 3 <c 2 if an echo signal is present if the predecessor value a 0 (k ) ≤ c 2 has become.

Ferner ist es wünschenswert, den Grad der Signalpegel-Absenkung in den Sprachpausen der momentanen Situation im TK-Kanal anzupassen. Furthermore, it is desirable to reduce the degree of signal level reduction in the Language pauses of the current situation in the TK channel adapt.

Beispielsweise wird man Geräusche vorzugsweise in Abhängigkeit vom momentanen Geräuschpegel N bzw. in Abhängigkeit von einer Funktion g(S/N) des Signal-zu-Geräuschabstandes S/N absenken, aber kurzzeitig auftretende Echos stärker absenken und nach dem Ende der Echos die Absenkung auf den geringeren Wert der Geräuschabsenkung zurückführen.For example, one sounds preferably depending on instantaneous noise level N or as a function of a function g (S / N) Lower the signal-to-noise ratio S / N, but short-term Lower echoes more and lower the echo to the end of the echoes reduce the value of the noise reduction.

Besonders bevorzugt ist daher eine Verfahrensvariante, die sich dadurch auszeichnet, dass bei Vorliegen eines Geräuschsignals und/oder Echosignals und für a0(k) ≤ c2 , wobei c2 eine vorgegebene Konstante ist, der Leistungswert des Geräuschpegels N im aktuell benutzten TK-Kanal fortlaufend gemessen und/oder geschätzt wird, und dass in Abhängigkeit vom aktuellen Geräuschpegel N laufend das Steuersignal a0(k+1) eingestellt wird gemäß a0(k+1) = f(N), wobei f(N) eine vorgegebene Funktion von N ist.Particularly preferred is therefore a method variant, which is characterized in that in the presence of a noise signal and / or echo signal and for a 0 (k) ≤ c 2 , where c 2 is a predetermined constant, the power value of the noise level N in the currently used TK- Channel continuously measured and / or estimated, and that depending on the current noise level N, the control signal a 0 (k + 1) is continuously set according to a 0 (k + 1) = f (N), where f (N) a predetermined Function of N is.

Damit wird der Grad einer Geräuschabsenkung vom aktuell auftretenden Leistungswert N des Geräusches automatisch mitgesteuert und dem aktuellen Geräuschwert im Telefonkanal angepasst und in vorbestimmter definierter Weise nachgeführt. Über die Wahl der Funktion f(N) kann auch der subjektive Eindruck des erzeugten Gesamtsignals angepasst werden. Ein weiterer Vorteil dieser Verfahrensvariante besteht darin, dass bei einem Bündel von Telefonkanälen, beispielsweise zwischen internationalen Vermittlungsstellen, die Geräuschsituation in jedem einzelnen Kanal, die ja von Kanal zu Kanal sehr verschieden sein kann, automatisch eingestellt und individuell optimiert werden kann.Thus, the degree of noise reduction from the currently occurring Power value N of the noise automatically controlled and the current Noise value in the telephone channel adapted and defined in a predetermined Tracked manner. By choosing the function f (N), the subjective Impression of the generated overall signal to be adjusted. Another advantage This variant of the method consists in that in a bundle of Telephone channels, for example between international exchanges, the noise situation in each individual channel, which is very good from channel to channel can be different, adjusted automatically and optimized individually can.

Besonders bevorzugt ist eine Variante des erfindungsgemäßen Verfahrens, die sich dadurch auszeichnet, dass die vorgegebene Funktion f(N) eine Funktion g(S/N) ist, die vom Quotienten S/N aus dem Leistungswert des Signalpegels S der zu übertragenden Nutzsignale und dem Leistungswert des Geräuschpegels N abhängt, oder dass die vorgegebene Funktion f(N) eine Funktion g'(N/S) ist, die vom Kehrwert N/S dieses Quotienten abhängt. Aus Gründen einer einfacheren praktischen Realisierung kann man auch eine Funktion von (S+N)/N oder von (S+N)/S verwenden.Particularly preferred is a variant of the method according to the invention is characterized in that the given function f (N) is a function g (S / N), which is derived from the quotient S / N from the power value of the signal level S the useful signals to be transmitted and the power value of the noise level N or that the given function f (N) is a function g '(N / S), which depends on the reciprocal N / S of this quotient. For the sake of one simpler practical realization can also be a function of (S + N) / N or from (S + N) / S.

Der Vorteil der obigen Verfahrensvariante besteht darin, dass bei stark variierendem Nutzsignalpegel S in den Telefonkanälen eines Bündels immer die richtige Einstellung für die Geräuschabsenkung gefunden wird. Bei einer Steuerung der Geräuschreduktion proportional zum Kehrwert N/S lässt sich die Funktion g'(N/S) leicht auf einem digitalen Signalprozessor (=DSP) mit festen Computerwortlängen von beispielsweise 16 bit unter Verwendung von besonders einfacher Software implementieren, da für N/S vorzugsweise ein Zahlenbereich 0 < N/S < 1 zur Steuerung der Geräuschreduktion relevant bzw. interessant ist.The advantage of the above process variant is that when strong varying signal level S in the telephone channels of a bundle always the correct setting for the noise reduction is found. At a Controlling the noise reduction proportional to the reciprocal N / S can be the Function g '(N / S) easily on a digital signal processor (= DSP) with fixed Computer word lengths of, for example, 16 bits using implement a particularly simple software, as for N / S preferably a Number range 0 <N / S <1 relevant for controlling the noise reduction or interesting is.

Akustische Gehörtests haben ergeben, dass bei S/N = 0 db die Sprache bereits so stark gestört ist, dass man das Geräusch nur bedingt um einen Wert f 0 bzw. g0 zwischen 5 und 10 dB, vorzugsweise zwischen 6 und 8 dB reduzieren darf, um den akustischen Gesamteindruck im Hinblick auf eine Natürlichkeit der Sprache nicht zu verschlechtern. Bei noch ungünstigeren Werten des Signal-zu-Rausch-Verhältnisses S/N < 0 dB kann dann der Wert f0 bzw. g0 beibehalten werden, da jede weitere Geräuschabsenkung den Gesamteindruck nur verschlechtert.Acoustic hearing tests have shown that with S / N = 0 db the speech is already so strongly disturbed that it is only possible to reduce the noise by a value f 0 or g 0 between 5 and 10 dB, preferably between 6 and 8 dB in order not to impair the overall acoustic impression with regard to the naturalness of the language. With even less favorable values of the signal-to-noise ratio S / N <0 dB, the value f 0 or g 0 can then be maintained, since any further noise reduction only worsens the overall impression.

Bei mittleren S/N kann gemäß diesen Untersuchungen eine stärkere Geräuschabsenkung vorgenommen werden. Ein Maximum ergibt sich dabei im Bereich 10 bis 15 dB. Der Wert der Geräuschabsenkung fmax bzw. gmax sollte im Maximum zwischen 20 und 30, vorzugsweise etwa 25 dB betragen.At medium S / N, a greater noise reduction can be made according to these studies. A maximum results in the range of 10 to 15 dB. The value of the noise reduction f max or g max should be at a maximum between 20 and 30, preferably about 25 dB.

Bei sehr guten Rauschwerten S/N > 40 dB sollte nur noch eine minimale Absenkung zwischen 0 und 3 dB eingestellt werden, um die Natürlichkeit der übertragenen Sprache so gut wie möglich zu erhalten. With very good noise S / N> 40 dB should only a minimum Lowering between 0 and 3 dB can be set to the naturalness of the receive as much as possible translated language.

Der Klang der Sprache und die Verständlichkeit sind besonders gut, wenn die Funktion f(N) bzw. g(S/N) über die drei oben diskutierten Bereiche hinweg in stetiger Weise miteinander zusammenhängt, wobei schnelle Änderungen in N oder in S(N) vorteilhaft durch Filterungen geglättet werden können.The sound of the language and the intelligibility are especially good when the Function f (N) or g (S / N) over the three areas discussed above in FIG constantly related to each other, with rapid changes in N or in S (N) can be advantageously smoothed by filtering.

Eine relativ einfache Realisierung in Hardware und/oder Software ergibt sich, indem man die Funktionen f(N) bzw. g(S/N) bzw. g'(N/S) durch gerade Kennlinienstücke zwischen den drei oben beschriebenen Betriebspunkten approximiert (abschnittsweise lineare Näherung).A relatively simple realization in hardware and / or software results, by passing the functions f (N) or g (S / N) or g '(N / S) through even Characteristic sections between the three operating points described above approximates (sectionally linear approximation).

Bei einer etwas aufwendigeren Variante des erfindungsgemäßen Verfahrens, die aber im Ergebnis zu einem besseren Klangbild führt, wird eine Polynomfunktion zur Implementierung der stetigen Funktionen f(N) bzw. g(S/N) bzw. g'(N/S) in den drei diskutierten Bereichen herangezogen, was im Ergebnis zu einer Art unsymmetrischer Glockenfunktion führt.In a somewhat more complicated variant of the method according to the invention, but the result in the result to a better sound, is one Polynomial function for implementing the continuous functions f (N) and g (S / N) or g '(N / S) in the three areas discussed, which resulted leads to a kind of asymmetrical bell function.

Besonders bevorzugt ist eine Variante des erfindungsgemäßen Verfahrens, bei der die Funktionen f(N) bzw. g(S/N) oder g'(N/S) so gewählt werden, dass die Reduktion des Geräuschpegels N gehörrichtig gemäß den psychoakustischen Mittelwerten des menschlichen Gehörspektrums erfolgt. Dabei wird der Wert für S und/oder N nicht nur aus dem momentanen Leistungswert alleine, sondern auch aus einem gewichteten spektralen Verlauf von S bzw. N bestimmt und insgesamt über die so gewonnene Funktion eine gehörrichtige, d.h. eine psychoakustisch angenehm klingende Geräuschreduktion erzielt. Da es kein einfach darstellbares Maß für eine akustisch angenehm klingende Geräuschreduktion gibt, sind alle Qualitätsbeurteilungen auf umfangreiche Gehörtests angewiesen, die anschließend mittels dafür optimierter statistischer Methoden ausgewertet werden, um einen Bewertungsmaßstab, (ähnlich wie bei Sprachcodecs) zu erhalten.Particularly preferred is a variant of the method according to the invention the functions f (N) or g (S / N) or g '(N / S) are chosen so that the Reduction of the noise level N is correct according to the psychoacoustic Means of the human auditory spectrum is done. The value for S and / or N not only from the instantaneous power value alone, but also determined from a weighted spectral curve of S and N and in total, a hearing aid, i. a psychoacoustically pleasant sounding noise reduction achieved. Since there is no easily representable measure for an acoustically pleasant sounding Noise reduction is there, all quality assessments are extensive Hearing tests dependent, which then optimized by means of statistical Methods are evaluated to a rating scale, (similar to Speech codecs).

Eine gute Geräuschpegel-Schätzung erfordert einen guten Sprach-Pausen-Detektor, da man nur dann sicher sein kann, dass in den Sprachpausen-Abschnitten lediglich störendes Geräusch und nicht irgendeine Mischung zwischen Geräusch und Sprachfetzen vorliegt, wie es in der Praxis häufig vorkommt.A good noise level estimation requires a good speech pause detector, because one can only be sure that in the speech pause sections just annoying noise and not some mix between noise and speech fragments, as is common in practice occurs.

Besonders bevorzugt ist daher eine Verfahrensvariante, die sich dadurch auszeichnet, dass im Sprach-Pausen-Detektor aus dem Eingangssignal x mittels eines Kurzzeit-Pegelschätzers ein Kurzzeit-Ausgangssignal sam(x), mittels eines Mittelzeit-Pegelschätzers ein Mittelzeit-Ausgangssignal mam(x) und mittels eines Langzeit-Pegelschätzers ein Langzeit-Ausgangssignal lam(x) gebildet wird, dass die drei Ausgangssignale sam(x), mam(x) und lam(x) über geeignete Verstärkungskoeffizienten so eingestellt werden, dass sie etwa gleich groß, wenn das Eingangssignal x ein reines Rauschsignal ist, wobei sam(x) < mam(x) < lam(x), dass die drei Ausgangssignale sam(x), mam(x) und lam(x) von Komparatoren überwacht werden, und dass das Vorliegen eines Sprachsignals als Eingangssignal x angenommen wird, wenn sam(x) und mam(x) zunächst jeweils größer werden als lam(x), und das Vorliegen einer Sprachpause, wenn danach sam(x) und/oder mam(x) wieder kleiner wird als lam(x).Therefore, a method variant which is characterized by this is particularly preferred characterized in that in the speech pause detector from the input signal x a short-term output sam (x) by means of a short-term level estimator, by means of a middle-time level estimator, a middle-time output signal mam (x) and by means of a long-term level estimator, a long-term output signal lam (x) is formed, that the three output signals sam (x), mam (x) and lam (x) via suitable gain coefficients are set to be approximately equal large, if the input signal x is a pure noise signal, where sam (x) < mam (x) <lam (x), that the three output signals sam (x), mam (x) and lam (x) be monitored by comparators, and that the presence of a Speech signal is assumed as the input signal x, if sam (x) and mam (x) initially each become larger than lam (x), and the presence of a Speech pause, after which sam (x) and / or mam (x) becomes smaller again than lam (x).

Mit Hilfe dieser relativ einfachen Arten der Bildung von verschiedenen Mittelwerten des Zeitsignals kann bereits eine überraschend gute Sprachpausen-Detektion durchgeführt werden, die nur einen sehr geringen Rechenaufwand erfordert.With the help of these relatively simple ways of forming different Averages of the time signal can already be a surprisingly good Speech pause detection are performed, which is only a very small Computing effort required.

Eine Weiterbildung dieser Verfahrensvariante sieht vor, dass die drei Ausgangssignale sam(x), mam(x) und lam(x) zur Sprach-Pausen-Abschätzung einem neuronalen Netz zugeführt werden, das mit einer Vielzahl von Szenarien mit unterschiedlichen Eingangssignalen x trainiert wurde. Ein neuronales Netz kann vorteilhaft lineare und nichtlineare Zusammenhänge zwischen einer großen Menge von Eingabeparametem und den gewünschten Ausgabewerten abbilden. Eine Voraussetzung dafür ist, dass das neuronale Netz einmal mit einer hinreichenden Menge von Eingabewerten und zugehörigen Ausgabewerten trainiert wurde. Daher eignen sich neuronale Netze besonders für die Aufgabe einer Sprachpausen-Detektion bei Anwesenheit von unterschiedlichen störenden Geräuschen.A development of this variant of the method provides that the three output signals sam (x), mam (x) and lam (x) for speech pause estimation be supplied to a neural network, which with a variety was trained by scenarios with different input signals x. One Neural network may advantageously have linear and non-linear relationships between a large amount of input parameters and the desired ones Map output values. A prerequisite for this is that the neural Net once with a sufficient amount of input values and training associated output values. Therefore, neural are suitable Networks especially for the task of speech pause detection Presence of different disturbing noises.

Vorzugsweise wird zusätzlich zur Erkennung und Reduktion von Geräuschsignalen auch das Vorliegen von Echosignalen detektiert und/oder vorhergesagt und die entsprechenden Echosignale unterdrückt oder reduziert. Wenn in einem Telefonkanal zusätzlich zu Geräuschen auch Echos auftreten, so können diese in der Regel anhand einer vorab ermittelten Signallaufzeit τE eines Echos sowie der vorab ermittelten Echokopplung ERL im Kanal und der Signalstärke ES, die das Echo im Rückkanal auslöst, vorhergesagt werden. Man kann diese Schätzung in der Weise durchführen, dass in Abhängigkeit vom ausgesendeten Sprachsignal und seiner momentanen Leistung die Größe der verzögert eintreffenden Echos abgeschätzt wird. Überschreitet das jeweils geschätzte Echosignal in bestimmten kurzen Zeitabschnitten einen vorgegebenen Schwellwert thrs, so wird dieses echobehaftete Signal vorzugsweise kurzzeitig zusätzlich, beispielsweise durch die oben erwähnte exponentielle Absenkung, auf einen Wert gedämpft, der für eine wesentliche Reduktion des Echosignals erforderlich ist. Im gleichen Sinn kann auch eine Kompander-Kennlinie kurzzeitig bei Echos in die Richtung größerer Eingangslautstärke verschoben und nach Abklingen der Echos wieder in ihre ursprüngliche Lage zurückgeführt werden.Preferably, in addition to the detection and reduction of noise signals, the presence of echo signals is also detected and / or predicted, and the corresponding echo signals are suppressed or reduced. If, in addition to noise, echoes also occur in a telephone channel, they can generally be predicted on the basis of a previously determined signal propagation time τ E of an echo and the previously determined echo coupling ERL in the channel and the signal strength ES which triggers the echo in the return channel. This estimation can be carried out in such a way that the magnitude of the delayed incoming echoes is estimated as a function of the transmitted speech signal and its instantaneous power. If the respectively estimated echo signal exceeds a predefined threshold value thrs in certain short time segments, then this echo-loaded signal is preferably additionally briefly damped, for example by the abovementioned exponential depression, to a value which is necessary for a substantial reduction of the echo signal. In the same sense, a compander characteristic curve can also be briefly moved in the direction of greater input volume for echoes and returned to its original position after the echoes have faded away.

Besonders bevorzugt ist eine Weiterbildung dieser Verfahrensvariante, bei der das Steuersignal a0(k+1) laufend eingestellt wird gemäß a0(k+1) = h(N,S,ES,τE,ERL), wobei h(N,S,ES,τE,ERL) eine vorgegebene Funktion von N, S, dem Nutzsignal ES in Gegenrichtung eines sprechenden TK-Partners, τE eine konstante Verzögerungszeit des Echosignals und ERL eine Dämpfungskonstante der Amplitude des Echosignals ist.Particularly preferred is a development of this method variant, in which the control signal a 0 (k + 1) is set continuously according to a 0 (k + 1) = h (N, S, ES, τ E , ERL), where h (N, S, ES, τ E , ERL) is a predetermined function of N, S, the useful signal ES in the opposite direction of a speaking TK partner, τ E is a constant delay time of the echo signal and ERL is an attenuation constant of the amplitude of the echo signal.

Man kann vorteilhaft eine gehörrichtige Geräuschabsenkung mit einer unabhängig davon arbeitenden Echoreduktion verbinden. Das ist besonders dann wichtig, wenn im Telefonkanal so gut wie kein Hintergrundgeräusch existiert, da dann keine Geräuschabsenkung wirksam wird, und somit auftretende Echos ungehindert zum Sprecher gelangen können.It can be advantageous to aurally sound reduction with a regardless of working echo reduction. That's special then important if in the phone channel as well as no background noise exists, since then no noise reduction is effective, and thus occurring echoes unhindered can reach the speaker.

Eine Trennung der Steuerung einer Geräuschreduktion von der einer Echoabsenkung ist zweckmäßig, da Geräusche und Echos unabhängig voneinander auftreten und auch in der Regel völlig unterschiedliche physikalische Ursachen haben. Man kann aber mathematisch eine generelle Reduktionsfunktion R angeben, die eine Absenkung von Signalpegeln sowohl für Geräusche als auch für Echos beschreibt: R(S, N, ES, τE, ERL, thrs) ~ g(S/N) d(ES, τE, ERL, thrs) , wobei g(S/N) die oben beschriebene Geräuschreduktion und d(...) die unabhängig zusätzlich einsetzende Echoabsenkung bedeuten, wenn das geschätzte Echosignal den vorgegebenen Schwellwert thrs überschreitet.A separation of the control of a noise reduction from that of an echo reduction is expedient, since noises and echoes occur independently of each other and also generally have completely different physical causes. Mathematically, however, one can specify a general reduction function R which describes a reduction of signal levels for both noises and echoes: R (S, N, ES, τ e , ERL, thrs) ~ g (S / N) d (ES, τ e , ERL, thrs), where g (S / N) is the above-described noise reduction and d (...) is the independently additionally occurring echo reduction when the estimated echo signal exceeds the predetermined threshold value thrs.

Besonders vorteilhaft ist eine Verfahrensvariante, bei der während der Zeitdauer einer Echo-Reduktion zum Nutzsignal zusätzlich ein künstliches Geräuschsignal addiert wird.Particularly advantageous is a process variant in which during the Duration of an echo reduction to the useful signal in addition an artificial Noise signal is added.

Eine Geräuschabsenkung ist bei gleichbleibendem Geräuschpegel ebenfalls konstant. Eine plötzlich zusätzlich einsetzende Echoreduktion im Rhythmus der Sprache bedeutet auch eine Geräuschabsenkung (zumindest in dem kurzen Zeitabschnitt) im Sprachrhythmus. Dies führt zu einem gepulsten Hintergrundgeräusch, welches sich nicht natürlich anhört. Daher ist es vorteilhaft, in den Augenblicken einer zusätzlichen Echoreduktion ein synthetisches Geräusch eines geeigneten Rauschgenerators in der Größenordnung des normalen Hintergrundgeräusches zum bearbeiteten Signal hinzuzufügen. Damit soll ein möglichst gleichbleibendes Hintergrundgeräusch für den Hörer vermittelt werden. A noise reduction is also at a constant noise level constant. A sudden onset of echo reduction in the rhythm of Language also means a noise reduction (at least in the short Period) in the speech rhythm. This leads to a pulsed Background noise, which does not sound natural. Therefore, it is advantageous, in the moments of an additional echo reduction Synthetic noise of a suitable noise generator in the Magnitude of the normal background noise to the processed signal to add. This should be as consistent as possible background noise be conveyed to the listener.

Der Rauschgenerator kann so gestaltet werden, dass das künstliche Geräuschsignal eine psychoakustisch als angenehm empfundene akustische Signalsequenz (=comfort noise) umfasst.The noise generator can be designed so that the artificial Sound signal a psychoacoustically perceived as pleasant acoustic Signal sequence (= comfort noise) includes.

Anstelle eines synthetischen Hintergrundgeräusches kann aber auch ein Abschnitt eines zuvor aufgezeichneten echten Hintergrundgeräusches in passender Stärke in den Echozeitabschnitten eingefügt werden. Das hinzugefügte Geräusch unterscheidet sich dann so gut wie überhaupt nicht vom vorherigen Geräusch und wird daher keine störende akustische Veränderung beim Hörer hervorrufen.But instead of a synthetic background noise can also Section of a previously recorded true background noise in appropriate strength in the echo time slots. The added noise then differs as well as not at all from the previous noise and therefore no annoying acoustic Cause change in the listener.

Das Hinzufügen von Geräuschen zur akustischen Verdeckung von Effekten sowie die Maßnahmen einer getrennten Behandlung von Geräuschen und Echos werden, wenn sie richtig aufeinander abgestimmt sind, einen besonders verständlichen und angenehmen Spracheindruck auch bei "schwieriger" Umgebung (Echos plus Geräusche) bewirken.The addition of sounds for the acoustic masking of effects as well as the measures of separate treatment of noise and Echoes, if properly matched, will be extra special understandable and pleasant language impression even with "difficult" Environment (echoes plus noise).

Besonders bevorzugt ist auch eine Variante des erfindungsgemäßen Verfahrens, bei der das zu übertragende Nutzsignal einer spektralen Subtraktion unterzogen wird. Der Vorteil einer spektralen Subtraktion mit nachgeschalteter Pegelabsenkung in den Sprachpausen besteht darin, dass zuerst mittels spektraler Subtraktion ein Teil der Störgeräusche aus dem Sprachsignal selbst eliminiert wird und erst danach die Sprachpausen in der beschriebenen Art von Geräuschen und Echos befreit werden. Insgesamt ergibt diese Kombination bei subjektiven Tests bessere Höreindrücke als nur eine einfache spektrale Subtraktion.Particularly preferred is also a variant of the invention Method in which the useful signal to be transmitted to a spectral Subtraction is subjected. The advantage of a spectral subtraction with Downstream level reduction in the speech pauses is that First, by means of spectral subtraction, a part of the noise from the Speech signal itself is eliminated and only then the speech pauses in the described type of noise and echoes are released. Total results This combination in subjective tests better hearing impressions than just one simple spectral subtraction.

Eine weitere besonders vorteilhafte Variante des erfindungsgemäßen Verfahrens schließlich sieht vor, dass das zu übertragende Nutzsignal einer dem menschlichen Gehör angepassten spektralen Filterung unterzogen wird. Auch hier wird mit den Mitteln einer spektralen Subtraktion zunächst eine Schätzung von Geräuschen, von Sprache und den Echos durchgeführt, sodann eine gehörrichtige Verdeckungsschwelle bestimmt und dann das gesamte Signal über ein passend eingestelltes Übertragungsfilter so bearbeitet, dass die Sprachanteile möglichst unverfälscht und die Echo- und Geräuschanteile möglichst weitgehend unterdrückt werden.Another particularly advantageous variant of the invention Finally, the method provides that the useful signal to be transmitted is a subjected to human hearing adapted spectral filtering. Again, the means of a spectral subtraction first a Estimation of noises, speech and echoes performed, then determines an auricular masking threshold and then the entire Signal via a suitably set transmission filter so edited that the Language components as unadulterated as possible and the echo and noise components be suppressed as much as possible.

Eine Kombination mit der nachgeschalteten Pegelabsenkung in den Sprachpausen verbessert den Höreindruck weiter.A combination with the downstream level reduction in the Speech pauses further improve the listening experience.

In den Rahmen der vorliegenden Erfindung fällt auch eine Servereineit zur Unterstützung des oben beschriebenen erfindungsgemäßen Verfahrens sowie ein Computerprogramm zur Durchführung des Verfahrens. Das Verfahren kann sowohl als Hardwareschaltung, als auch in Form eines Computerprogramms realisiert werden. Heutzutage wird eine Software-Programmierung für leistungsstarke DSP's bevorzugt, da neue Erkenntnisse und Zusatzfunktionen leichter durch eine Veränderung der Software auf bestehender Hardwarebasis implementierbar sind. Verfahren können aber auch als Hardwarebausteine beispielsweise in TK-Endgeräten oder Telefonanlagen implementiert werden.In the context of the present invention also falls to a server Support of the method according to the invention described above as well a computer program for carrying out the method. The procedure can both as a hardware circuit, as well as in the form of a computer program will be realized. Nowadays, software programming for powerful DSP's preferred because new knowledge and additional features easier by changing the software on an existing hardware basis can be implemented. However, methods can also be used as hardware components For example, be implemented in telecommunications terminals or telephone systems.

Weitere Vorteile der Erfindung ergeben sich aus der Beschreibung und der Zeichnung. Ebenso können die vorstehend genannten und die noch weiter aufgeführten Merkmale erfindungsgemäß jeweils einzeln für sich oder zu mehreren in beliebigen Kombinationen Verwendung finden. Die gezeigten und beschriebenen Ausführungsformen sind nicht als abschließende Aufzählung zu verstehen, sondern haben vielmehr beispielhaften Charakter für die Schilderung der Erfindung.Further advantages of the invention will become apparent from the description and the Drawing. Likewise, those mentioned above and even further listed features according to the invention in each case individually or for themselves several in any combination use find. The shown and described embodiments are not to be exhaustive enumeration but rather have an exemplary character for the description the invention.

Die Erfindung ist in der Zeichnung dargestellt und wird anhand von Ausführungsbeispielen näher erläutert. Es zeigen:

Fig. 1
das Steuersignal ao bei Vorliegen von Sprachsignalen, während einer Sprachpause und bei erneutem Einsetzen der Sprachsignale;
Fig. 2
ein Schema einer Anordnung zur gesteuerten Signalabsenkung;
Fig. 3a
die Funktion g(S/N) in der linearen Näherung;
Fig. 3b
die entsprechende Funktion g'(N/S);
Fig. 4a
die Funktion g(S/N) als unsymmetrische Glockenkurve; und
Fig. 4b
die entsprechende Funktion g'(N/S).
The invention is illustrated in the drawing and will be explained in more detail with reference to embodiments. Show it:
Fig. 1
the control signal ao in the presence of speech signals, during a speech pause and on re-insertion of the speech signals;
Fig. 2
a schematic of a controlled signal reduction arrangement;
Fig. 3a
the function g (S / N) in the linear approximation;
Fig. 3b
the corresponding function g '(N / S);
Fig. 4a
the function g (S / N) as unbalanced bell curve; and
Fig. 4b
the corresponding function g '(N / S).

Das in Fig. 1 als Funktion der Zeit t bzw. der Abtastzahl k dargestellte Steuersignal a0 wird während einer ersten Phase T1, in welcher Sprachsignale detektiert werden, auf einem Wert c0 = 1 gehalten. Während einer Sprachpause im Zeitabschnitt T2 wird das Steuersignal a0 exponentiell auf einen kurz über 0 liegenden konstanten Wert c2 abgesenkt, um dann bei erneutem Einsetzen der Sprachsignale während einer Phase T3 sprungartig wieder auf den Wert c0 = 1 (oder eine andere, beliebig wählbare Konstante) heraufgesetzt zu werden. Dadurch wird während der Sprachphasen T1, T3 keine (oder bei anderen Beispielen nur eine geringe) Unterdrückung von Störsignalen im Gesamtsignal vorgenommen, so dass das Sprachsignal möglichst unverfälscht und ungehindert weitergeleitet wird. Während der Sprachpause in der Phase T2 wird möglichst schnell (exponentiell) eine möglichst effektive Unterdrückung von Echos und Geräuschsignalen bewirkt, wobei aber im vorliegenden Beispiel nicht auf den Wert 0, sondern auf einen kleinen Restwert c2 abgesenkt wird, um nicht am anderen Ende den Eindruck einer "toten" Leitung zu erwecken. Beim Auftreten von Echos wird eine Absenkung auf einen Restwert c3 < c2 vorgenommen.The control signal a 0 shown in FIG. 1 as a function of the time t or the sampling number k is maintained at a value c 0 = 1 during a first phase T1 in which speech signals are detected. During a speech pause in the time period T2, the control signal a 0 is lowered exponentially to a constant value c 2 , which is just above 0, and then abruptly returns to the value c 0 = 1 (or another, arbitrary) when the speech signals are reinserted during a phase T3 selectable constant). As a result, during the speech phases T1, T3, no (or in other examples only a small) suppression of interference signals in the overall signal is carried out, so that the speech signal is forwarded as unadulterated as possible and unhindered. During the speech pause in the phase T2 as effective as possible suppression of echoes and noise signals is effected as quickly as possible (in the present example, not to the value 0, but to a small residual value c 2 is lowered, so as not at the other end of the Impression of a "dead" line to awaken. When echoes occur, a reduction to a residual value c 3 <c 2 is made.

In Fig.2 ist schematisch die Funktionsweise einer Anordnung zur Geräuschund Echoreduktion entsprechend der oben genannten Reduktionsfunktion R(S, N, ES, τE, ERL, thrs) mit einem Sprach-Pausen-Detektor SPD dargestellt. FIG. 2 schematically shows the mode of operation of an arrangement for noise and echo reduction in accordance with the abovementioned reduction function R (S, N, ES, τ E , ERL, thrs) with a speech pause detector SPD.

Für sämtliche in den Figuren 3a bis 4b dargestellten Kurven gilt, dass der Funktionswert g bzw. g' für den Fall S/N < 0 dB, also bei extrem hohem Geräuschhintergrund, in einen konstanten Wert g0 der Geräuschreduktion von etwa 6 dB übergeht. Beginnend von S/N = 0 dB wird mit zunehmender Verbesserung des Signal-zu-Rausch-Verhältnisses S/N eine erhöhte Geräuschreduktion vorgenommen, die ein Maximum gmax ≈ 25 dB bei etwa S/N ≈ 12dB erreicht. Mit weiter zunehmendem S/N sinkt der Grad der Geräuschreduktion schließlich gegen Null, um bei geringem Hintergrundgeräusch möglichst wenig Manipulationen im übertragenen Nutzsignal vorzunehmen.For all the curves illustrated in FIGS. 3a to 4b, the function value g or g 'for the case S / N <0 dB, ie for an extremely high background noise, changes into a constant value g 0 of the noise reduction of approximately 6 dB. Starting from S / N = 0 dB, an increased noise reduction is achieved with increasing improvement of the signal-to-noise ratio S / N, reaching a maximum g max ≈ 25 dB at approximately S / N≈12 dB. With increasing S / N, the degree of noise reduction finally drops to zero in order to perform as little manipulation in the transmitted useful signal with low background noise.

Claims (23)

  1. Method for reduction of echo and/or noise signals in telecommunications (= TK) systems for the transmission of acoustic useful signals, in particular human speech in which by means of speech-pause detection it is determined when a speech signal is contained in the mixture of useful signals and interference signals to be transmitted or when a speech pause is present, where by means of a multiplier with two inputs the useful signals usually disrupted by echo and/or noise signals are modified in their amplitude by a time-dependent control signal a0(t) or by a control signal a0(k) pulsed at the rhythm of a sampling rate fT=1/T, where k∈N counts through the sampled values and T indicates the period from one sampled value to the next, characterised in that the control signal a0(t) or a0(k) is varied so that during the presence of speech signals in the useful signal the amplitude of the control signal a0(t) or a0(k) is set to a prespecified constant value c0, and on start of a speech pause in the useful signal the amplitude of the control signal a0(t) or a0(k) is lowered constantly from one sampled value to the next according to the recursion formula a0(k+1) = a0(k) . β   with β < 1 and that after the end of a speech pause a0(k)=c0 is set.
  2. Method according to claim 1, characterised in that the factor β is determined from the sampling rate fT, a time constant τ1 and a prespecified constant prefactor c1 according to the relation β = c1.exp(-1/τ1fT).
  3. Method according to claim 2, characterised in that the time constant τ1 is selected between 50 ms and 150 ms, preferably τ1 ≈ 65 ms.
  4. Method according to any of the previous claims, characterised in that the constant value c0 = 1.
  5. Method according to any of the previous claims, characterised in that a0(k+1) during a speech pause and/or the presence of an echo signal assumes a prespecified constant value c2 if the preceding value a0(k) ≤ c2.
  6. Method according to any of claims 1 to 4, characterised in that during a speech pause and/or the presence of an echo signal and for a0(k) ≤ c2, where c2 is a prespecified constant, the power value of the noise level N in the TK channel currently used is measured and/or estimated continuously, and that depending on the current noise level N the control signal a0(k+1) is adjusted constantly according to a0(k+1) = f(N), where f(N) is a prespecified function of N.
  7. Method according to claim 6, characterised in that the prespecified function f(N) is a function g(S/N) which depends on the quotient S/N of the power value of the signal level S of the useful signal to be transmitted and the power value of the noise level N, or that the prespecified function f(N) is a function g'(N/S) which depends on the reciprocal value N/S of this quotient.
  8. Method according to claim 7, characterised in that the function f(N) or g(S/N) at 1/N<<1 or S/N = 0dB begins at a constant value f0>0 or g0>0, rises to a maximum fmax or gmax in the range between N or S/N = 10dB to 15dB preferably at N or S/N = 12dB, and then falls to a minimum value fmin or gmin preferably at 0dB, where 5dB ≤ f0, g0 ≤ 10dB, preferably 6dB ≤ f0, g0 ≤ 8dB, and where 20dB ≤ fmax, gmax ≤ 30dB, preferably fmax, gmax ≈ 25dB.
  9. Method according to any of claims 6 to 8, characterised in that the function f(N) or g(S/N) runs at least in sections, preferably in all part sections, linear with N or S/N.
  10. Process according to any of claims 6 to 8, characterised in that the function f(N) or g(S/N) is constructed from polynomials and runs as an asymmetric bell curve over N or S/N.
  11. Method according to any of claims 6 to 10, characterised in that the functions f(N) and g(S/N) and g' (N/5) are selected so that the reduction in noise level N is acoustically correct according to the psycho-acoustic mean value of the human hearing spectrum.
  12. Method according to any of the previous claims, characterised in that in addition to the detection and reduction of noise signals, the presence of echo signals is detected and/or predicted and the echo signals are suppressed or reduced.
  13. Method according to claim 12 and one of claims 6 to 11, characterised in that the control signal a0(k+1) is adjusted continuously according to a0(k+1) = h(N,S,ES,τE,ERL), where h(N,S,ES,τE,ERL) is a prespecified function of N, S, in the opposite direction to the useful signal ES of a speaking TK partner, τE a constant delay time of the echo signal and ERL a damping constant of the amplitude of the echo signal.
  14. Method according to claim 12, characterised in that the reduction of noise signals and the reduction of echo signals are controlled separately.
  15. Method according to any of claims 12 to 14,
    characterised in that for the duration of an echo reduction, a synthetic noise signal is also added to the useful signal.
  16. Method according to claim 15, characterised in that the synthetic noise signal comprises an acoustic signal sequence perceived as pleasant psycho-acoustically (= comfort noise).
  17. Method according to claim 15, characterised in that the synthetic noise signal comprises a noise signal previously recorded during the current TK connection.
  18. Method according to any of the previous claims, characterised in that in a speech-pause detector (SPD) from an input signal x by means of a short-term level estimator a short-term output signal sam(x) is formed, by means of a medium-term level estimator the medium-term output signal mam(x) and by means of a long-term level estimator a long-term output signal lam(x), that the three output signals sam(x), mam(x) and lam(x) are set via suitable amplification co-efficients so that they are approximately equally large when the input x is a pure noise signal, where sam(x) < mam(x) < lam(x), that the three output signals sam(x), mam(x) and lam(x) arc monitored by comparators, and that the presence of a speech signal is taken as input signal x if sam(x) and mam(x) at first are each greater than lam(x), and the presence of the speech pause if thereafter sam(x) and/or mam(x) become smaller than lam(x).
  19. Method according to claim 18, characterised in that for speech-pause estimation, the three output signals sam(x), mam(x) and lam(x) are supplied to a neuronal network which has been trained with a multiplicity of scenarios with different input signals x.
  20. Method according to any of the previous claims, characterised in that the useful signal to be transmitted is subjected to spectral subtraction.
  21. Method according to any of the previous claims, characterised in that the useful signal to be transmitted is subjected to spectral filtering adapted to human hearing.
  22. Server unit with means for performance of each individual step of the method according to any of claims 1 to 21.
  23. Computer program which has instructions for performance of each individual step of the method according to any of claims 1 to 21 on a computer when the computer program is loaded on the computer.
EP00124577A 1999-11-27 2000-11-10 Exponential reduction of echo and noise during speech pauses Expired - Lifetime EP1103956B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19957221 1999-11-27
DE19957221A DE19957221A1 (en) 1999-11-27 1999-11-27 Exponential echo and noise reduction during pauses in speech

Publications (3)

Publication Number Publication Date
EP1103956A2 EP1103956A2 (en) 2001-05-30
EP1103956A3 EP1103956A3 (en) 2001-12-05
EP1103956B1 true EP1103956B1 (en) 2005-06-08

Family

ID=7930611

Family Applications (1)

Application Number Title Priority Date Filing Date
EP00124577A Expired - Lifetime EP1103956B1 (en) 1999-11-27 2000-11-10 Exponential reduction of echo and noise during speech pauses

Country Status (6)

Country Link
US (1) US6999920B1 (en)
EP (1) EP1103956B1 (en)
JP (1) JP2001202100A (en)
KR (1) KR20010051980A (en)
AT (1) ATE297590T1 (en)
DE (2) DE19957221A1 (en)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10030926A1 (en) * 2000-06-24 2002-01-03 Alcatel Sa Interference-dependent adaptive echo cancellation
US7428223B2 (en) * 2001-09-26 2008-09-23 Siemens Corporation Method for background noise reduction and performance improvement in voice conferencing over packetized networks
DE10150519B4 (en) * 2001-10-12 2014-01-09 Hewlett-Packard Development Co., L.P. Method and arrangement for speech processing
US7158572B2 (en) * 2002-02-14 2007-01-02 Tellabs Operations, Inc. Audio enhancement communication techniques
DE10216322B4 (en) * 2002-04-13 2004-07-15 Güttler, Gerhard, Prof. Dr. votes converter
US7366295B2 (en) * 2003-08-14 2008-04-29 John David Patton Telephone signal generator and methods and devices using the same
US8394114B2 (en) * 2003-09-26 2013-03-12 Medtronic, Inc. Surgical connection apparatus and methods
US20060104460A1 (en) * 2004-11-18 2006-05-18 Motorola, Inc. Adaptive time-based noise suppression
JP4283212B2 (en) 2004-12-10 2009-06-24 インターナショナル・ビジネス・マシーンズ・コーポレーション Noise removal apparatus, noise removal program, and noise removal method
US7599357B1 (en) * 2004-12-14 2009-10-06 At&T Corp. Method and apparatus for detecting and correcting electrical interference in a conference call
US7599719B2 (en) 2005-02-14 2009-10-06 John D. Patton Telephone and telephone accessory signal generator and methods and devices using the same
US7430048B2 (en) * 2005-02-16 2008-09-30 Applied Biosystems Inc. Axial illumination for capillary electrophoresis
JP4562573B2 (en) * 2005-03-30 2010-10-13 ローランド株式会社 Howling prevention device
US8509450B2 (en) * 2010-08-23 2013-08-13 Cambridge Silicon Radio Limited Dynamic audibility enhancement
KR102413692B1 (en) 2015-07-24 2022-06-27 삼성전자주식회사 Apparatus and method for caculating acoustic score for speech recognition, speech recognition apparatus and method, and electronic device
KR102192678B1 (en) 2015-10-16 2020-12-17 삼성전자주식회사 Apparatus and method for normalizing input data of acoustic model, speech recognition apparatus
GB2551499B (en) * 2016-06-17 2021-05-12 Toshiba Kk A speech processing system and speech processing method
CN107274909A (en) * 2017-06-16 2017-10-20 深圳市华域无线技术股份有限公司 A kind of active the machine audio removing method in speech recognition
CN111128213B (en) * 2019-12-10 2022-09-27 展讯通信(上海)有限公司 Noise suppression method and system for processing in different frequency bands

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US786760A (en) * 1904-06-15 1905-04-04 Hartshorn Bros Couch.
NL8000361A (en) * 1980-01-21 1981-08-17 Philips Nv DEVICE AND METHOD FOR GENERATING A VOICE SIGNAL
JPS57212831A (en) * 1981-06-24 1982-12-27 Kokusai Denshin Denwa Co Ltd <Kdd> Echo controlling system
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
JP3080641B2 (en) * 1990-07-24 2000-08-28 株式会社東芝 Echo canceller
US5369711A (en) * 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
DE4229912A1 (en) * 1992-09-08 1994-03-10 Sel Alcatel Ag Method for improving the transmission properties of an electroacoustic system
US5533133A (en) * 1993-03-26 1996-07-02 Hughes Aircraft Company Noise suppression in digital voice communications systems
JP3152171B2 (en) * 1997-06-16 2001-04-03 日本電気株式会社 Adaptive filter, step size control method, and recording medium recording program
US6549587B1 (en) * 1999-09-20 2003-04-15 Broadcom Corporation Voice and data exchange over a packet based network with timing recovery

Also Published As

Publication number Publication date
EP1103956A3 (en) 2001-12-05
DE50010504D1 (en) 2005-07-14
JP2001202100A (en) 2001-07-27
EP1103956A2 (en) 2001-05-30
DE19957221A1 (en) 2001-05-31
US6999920B1 (en) 2006-02-14
ATE297590T1 (en) 2005-06-15
KR20010051980A (en) 2001-06-25

Similar Documents

Publication Publication Date Title
EP1103956B1 (en) Exponential reduction of echo and noise during speech pauses
EP1143416B1 (en) Time domain noise reduction
EP0698986B1 (en) Method for adaptive echo compensation
DE60108401T2 (en) SYSTEM FOR INCREASING LANGUAGE QUALITY
DE69630580T2 (en) Noise canceller and method for suppressing background noise in a noisy speech signal and a mobile station
DE60116255T2 (en) NOISE REDUCTION DEVICE AND METHOD
EP0742664B1 (en) Method for hand-free talking for a multi-channel transmission system
DE60222813T2 (en) HEARING DEVICE AND METHOD FOR INCREASING REDEEMBLY
DE60030736T2 (en) FEEDBACK SUPPRESSION USING BANDWIDTH DETECTION
DE2207141C3 (en) Circuit arrangement for suppressing unwanted speech signals by means of a predictive filter
DE19806015C2 (en) Process for improving acoustic attenuation in hands-free systems
DE60026570T3 (en) NOISE IN HOUR
EP1155561B1 (en) Method and device for suppressing noise in telephone devices
EP1055317A1 (en) Method for improving acoustic noise attenuation in hand-free devices
DE602004006912T2 (en) A method for processing an acoustic signal and a hearing aid
EP1126687A2 (en) Method for coordinated echo and/or noise reduction
DE3329779C2 (en) Method and circuit arrangement for establishing conference connections in a switching system
AT504164A1 (en) DEVICE FOR NOISE REDUCTION ON AN AUDIO SIGNAL
EP1453355B1 (en) Signal processing in a hearing aid
EP1351550B1 (en) Method for adapting a signal amplification in a hearing aid and a hearing aid
DE69930109T2 (en) LANGUAGE-CONTROLLED SWITCH FOR USE IN HIGH AMBIENT NOISE
DE19957220A1 (en) Noise suppression adapted to the current noise level
DE10030926A1 (en) Interference-dependent adaptive echo cancellation
DE10016619A1 (en) Interference component lowering method involves using adaptive filter controlled by interference estimated value having estimated component dependent on reverberation of acoustic voice components
EP4235664A1 (en) Method for suppressing an acoustic reverberation in an audio signal

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

AX Request for extension of the european patent

Free format text: AL;LT;LV;MK;RO;SI

PUAL Search report despatched

Free format text: ORIGINAL CODE: 0009013

AK Designated contracting states

Kind code of ref document: A3

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

AX Request for extension of the european patent

Free format text: AL;LT;LV;MK;RO;SI

RIC1 Information provided on ipc code assigned before grant

Free format text: 7G 10L 21/02 A, 7H 03G 3/34 B

17P Request for examination filed

Effective date: 20011220

AKX Designation fees paid

Free format text: AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: TR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050608

Ref country code: NL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050608

Ref country code: IE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050608

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050608

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 20050608

REF Corresponds to:

Ref document number: 50010504

Country of ref document: DE

Date of ref document: 20050714

Kind code of ref document: P

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

Free format text: LANGUAGE OF EP DOCUMENT: GERMAN

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050908

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050908

Ref country code: DK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050908

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: ES

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050919

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20051110

Ref country code: AT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20051110

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: PT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20051114

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20051130

Ref country code: BE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20051130

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20051130

Ref country code: MC

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20051130

Ref country code: LU

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20051130

NLV1 Nl: lapsed or annulled due to failure to fulfill the requirements of art. 29p and 29m of the patents act
REG Reference to a national code

Ref country code: IE

Ref legal event code: FD4D

ET Fr: translation filed
PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20060309

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

BERE Be: lapsed

Owner name: ALCATEL

Effective date: 20051130

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: IT

Payment date: 20101123

Year of fee payment: 11

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20111110

REG Reference to a national code

Ref country code: FR

Ref legal event code: GC

Effective date: 20140717

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 16

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 17

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20161122

Year of fee payment: 17

Ref country code: FR

Payment date: 20161118

Year of fee payment: 17

Ref country code: DE

Payment date: 20161121

Year of fee payment: 17

REG Reference to a national code

Ref country code: DE

Ref legal event code: R119

Ref document number: 50010504

Country of ref document: DE

GBPC Gb: european patent ceased through non-payment of renewal fee

Effective date: 20171110

REG Reference to a national code

Ref country code: FR

Ref legal event code: ST

Effective date: 20180731

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: DE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20180602

Ref country code: FR

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20171130

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20171110

REG Reference to a national code

Ref country code: DE

Ref legal event code: R081

Ref document number: 50010504

Country of ref document: DE

Owner name: WSOU INVESTMENTS, LLC, LOS ANGELES, US

Free format text: FORMER OWNER: ALCATEL LUCENT, PARIS, FR

Ref country code: DE

Ref legal event code: R082

Ref document number: 50010504

Country of ref document: DE

Representative=s name: BARKHOFF REIMANN VOSSIUS, DE

REG Reference to a national code

Ref country code: GB

Ref legal event code: 732E

Free format text: REGISTERED BETWEEN 20200820 AND 20200826