EP1103956A2 - Exponential reduction of echo and noise during speech pauses - Google Patents
Exponential reduction of echo and noise during speech pauses Download PDFInfo
- Publication number
- EP1103956A2 EP1103956A2 EP00124577A EP00124577A EP1103956A2 EP 1103956 A2 EP1103956 A2 EP 1103956A2 EP 00124577 A EP00124577 A EP 00124577A EP 00124577 A EP00124577 A EP 00124577A EP 1103956 A2 EP1103956 A2 EP 1103956A2
- Authority
- EP
- European Patent Office
- Prior art keywords
- signal
- noise
- speech
- signals
- echo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009467 reduction Effects 0.000 title claims abstract description 58
- 230000003595 spectral effect Effects 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims description 60
- 230000006870 function Effects 0.000 claims description 39
- 238000001228 spectrum Methods 0.000 claims description 9
- 230000002829 reductive effect Effects 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 230000007774 longterm Effects 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 2
- 238000013016 damping Methods 0.000 claims description 2
- 230000005236 sound signal Effects 0.000 claims description 2
- 230000036962 time dependent Effects 0.000 claims description 2
- 230000003321 amplification Effects 0.000 claims 1
- 238000003199 nucleic acid amplification method Methods 0.000 claims 1
- 230000001020 rhythmical effect Effects 0.000 claims 1
- 238000002592 echocardiography Methods 0.000 description 17
- 230000000873 masking effect Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000002238 attenuated effect Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000033764 rhythmic process Effects 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012074 hearing test Methods 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- XOJVVFBFDXDTEG-UHFFFAOYSA-N Norphytane Natural products CC(C)CCCC(C)CCCC(C)CCCC(C)C XOJVVFBFDXDTEG-UHFFFAOYSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 231100000895 deafness Toxicity 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
Definitions
- TC telecommunications
- echoes also arise in TC connections in two-wire telecommunications networks as line echoes and, for example, in simple and more uncomfortable telecommunications terminals occur in the form of acoustic echoes.
- a known method for noise reduction is the so-called “spectral Subtraction”, for example in the publication”
- a new approach to noise reduction based on auditory masking effects "by S. Gustafsson and P. Jax, ITG conference, Dresden, 1998. It is about a spectral noise reduction method in which an acoustic Masking threshold (e.g. according to the MPEG standard) is taken into account.
- the disadvantage of such methods is that they are complex Determination of this acoustic masking threshold and the execution of all arithmetic operations associated with this method.
- the noise is initially in the Speech breaks measured and in the form of a power density spectrum continuously stored in a memory.
- the power density spectrum is about won a Fourier transformation.
- the stored noise spectrum "as the best current estimate” subtracted from the current disturbed language spectrum, then into the Time domain transformed back to reduce noise in this way to get for the disturbed signal.
- the power density spectra for the noise and for the speech itself are first estimated with the aid of a spectral subtraction.
- a spectral acoustic masking threshold R T (f) for the human ear is then calculated using, for example, the rules from the MPEG standard.
- a filter pass curve H (f) is then calculated according to a simple rule, which is designed in such a way that essential spectral parts of the speech are passed through as unchanged as possible and spectral parts of the noise are reduced as much as possible.
- the compander initially has the property of speech signals with a certain (pre-set) "normal speech signal level" (possibly normal Called volume) practically unchanged from its entrance to the exit transferred to.
- a dynamic compressor limits it Output level to almost the same value as normal by using the current gain in the compander linearly with increasing input volume is lowered. This property keeps the language at the exit of the Compander systems about the same loud - regardless of how strong the Input volume fluctuates.
- the compander thus consists of a compressor for speech signal levels, which are greater than or equal to a normal level and an expander for Signal levels that are lower than the normal level.
- the disadvantage of the compander solution is the considerable computing effort that is necessary to carry out the known method.
- the result is often perceived as unsatisfactory, i.e. one leaves an unsatisfactory listening impression.
- the object of the present invention is to provide a method with to introduce the features described at the outset, in which as possible uncomplicated and inexpensive way without large Computing effort and with little need for computing memory and Data storage space causes an echo and noise reduction, which with simple means one as pleasant as possible for the human ear overall acoustic impression, which also depends on the taste individual needs can be adjusted.
- the one to be transmitted Signal during the speech pauses in its performance value according to one temporal exponential function in contrast to one from the input level dependent lowering, as in the compander process.
- a substantial reduction in noise is already achieved.
- the ear can be reinserted React language more sensitively and listen more carefully.
- the factor ⁇ is advantageously chosen such that the constant decrease in time corresponds approximately to a time constant ⁇ 1 of the perceptibility of the human ear. This means that after a strong sound event, the human ear does not perceive new sound events in time and in their amplitude below a curve shape that decays with the time constant ⁇ 1 after the end of the strong sound event.
- the value of the time constant ⁇ 1 is usually between 50 ms to 150 ms in humans and is preferably about 65 ms.
- a 0 (k + 1) assumes a predetermined constant value c 2 during a speech pause and / or a value c 3 ⁇ c 2 if an echo signal is present if the previous value a 0 (k ) Has become ⁇ c 2 .
- noise is preferred depending on instantaneous noise level N or depending on a function g (S / N) lower the signal-to-noise ratio S / N, but short-term ones Lower echoes more and after the end of the echoes the lowering to the reduce the lower value of the noise reduction.
- the degree of noise reduction is thus different from that currently occurring Power value N of the noise automatically controlled and the current Noise level in the telephone channel adjusted and in a predefined defined Wisely tracked.
- the subjective function can also be selected via the function f (N) Impression of the total signal generated can be adjusted.
- Another advantage This variant of the method consists in that with a bundle of Telephone channels, for example between international exchanges, the noise situation in each individual channel, which is very different from channel to channel can be different, automatically set and individually optimized can.
- a variant of the method according to the invention is particularly preferred, the is characterized in that the predetermined function f (N) is a function g (S / N), which is the quotient S / N from the power value of the signal level S the useful signals to be transmitted and the power level of the noise level N depends, or that the given function f (N) is a function g '(N / S), which depends on the reciprocal N / S of this quotient.
- the predetermined function f (N) is a function g (S / N), which is the quotient S / N from the power value of the signal level S the useful signals to be transmitted and the power level of the noise level N depends
- the given function f (N) is a function g '(N / S), which depends on the reciprocal N / S of this quotient.
- the predetermined function f (N) is a function g (S / N), which is the quotient S / N from the power value of the signal
- the advantage of the above process variant is that with strong Varying useful signal level S in the telephone channels of a bundle always the correct setting for noise reduction is found.
- the maximum value of the noise reduction f max or g max should be between 20 and 30, preferably about 25 dB.
- a variant of the method according to the invention is particularly preferred for functions f (N) or g (S / N) or g '(N / S) are selected so that the Reduction of the noise level N according to the psychoacoustic Averages of the human hearing spectrum are made.
- the value for S and / or N not only from the current performance value alone, but also determined from a weighted spectral profile of S or N and Overall, an aurally correct, i.e. a achieved a pleasant sounding noise reduction that is psychoacoustically pleasing. Since there is no easy-to-display dimension for an acoustically pleasant sounding Noise reduction there, all quality assessments are extensive Hearing tests instructed, which are then optimized using statistical Methods are evaluated to an evaluation scale, (similar to Voice codecs).
- a good noise level estimate requires a good speech pause detector, because you can only be sure that in the speech pause sections just annoying noise and not any mix between noise and scraps of speech, as is often the case in practice occurs.
- a method variant which is characterized thereby is particularly preferred distinguishes that in the speech pause detector from the input signal x a short-term output signal sam (x) using a short-term level estimator, a middle time output signal mam (x) by means of a middle time level estimator and by means of a long-term level estimator a long-term output signal lam (x) is formed that the three output signals sam (x), mam (x) and lam (x) over suitable gain coefficients are set so that they are approximately equal large if the input signal x is a pure noise signal, where sam (x) ⁇ mam (x) ⁇ lam (x) that the three output signals sam (x), mam (x) and lam (x) are monitored by comparators and that the existence of a Speech signal is assumed as the input signal x if sam (x) and mam (x) initially become larger than lam (x), and the existence of a Speech pause when sam (x) and
- a further development of this method variant provides that the three output signals sam (x), mam (x) and lam (x) for speech pause estimation a neural network can be supplied with a variety was trained by scenarios with different input signals x.
- Neural network can advantageously linear and non-linear relationships between a large amount of input parameters and the desired ones Show output values.
- a prerequisite for this is that the neural Network with a sufficient amount of input values and associated output values were trained. Therefore neural are suitable Networks especially for the task of speech pause detection Presence of different disturbing noises.
- the presence of echo signals is preferably also detected and / or predicted and the corresponding echo signals are suppressed or reduced. If, in addition to noise, echoes also occur in a telephone channel, these can generally be predicted on the basis of a previously determined signal propagation time ⁇ E of an echo as well as the previously determined echo coupling ERL in the channel and the signal strength ES which triggers the echo in the return channel. This estimation can be carried out in such a way that the size of the delayed arriving echoes is estimated as a function of the transmitted speech signal and its instantaneous power.
- this echo-laden signal is preferably briefly attenuated, for example by the exponential reduction mentioned above, to a value which is necessary for a substantial reduction in the echo signal.
- a compander characteristic curve can also be briefly shifted in the direction of greater input volume in the case of echoes and returned to its original position after the echoes have subsided.
- a method variant is particularly advantageous in which during the Duration of an echo reduction in addition to the useful signal is an artificial one Noise signal is added.
- a noise reduction is also with the same noise level constant.
- a sudden additional echo reduction in the rhythm of the Language also means a reduction in noise (at least in the short Period) in the rhythm of speech. This leads to a pulsed Background noise, which does not sound natural. Therefore, it is advantageous in the moments of an additional echo reduction synthetic noise of a suitable noise generator in the Magnitude of normal background noise to the processed signal to add. This is to ensure that the background noise remains as constant as possible be conveyed to the listener.
- a Section of a previously recorded real background noise in appropriate strength can be inserted in the echo periods.
- the added noise then hardly differs from that at all previous noise and therefore will not be an annoying acoustic Cause a change in the listener.
- a variant of the invention is also particularly preferred Method in which the useful signal to be transmitted is spectral Subtracted.
- the advantage of using spectral subtraction downstream level reduction in the speech pauses is that first by means of spectral subtraction some of the noise from the Speech signal itself is eliminated and only then the speech pauses in the described type of noise and echoes are freed. Total results this combination gives better auditory impressions than subjective tests simple spectral subtraction.
- the method provides that the useful signal to be transmitted is a spectral filtering adapted to human hearing.
- spectral subtraction is used to create one Estimation of noise, speech and echoes performed, then determines an audible masking threshold and then the whole Signal processed via an appropriately set transmission filter so that the Speech parts as pristine as possible and the echo and noise parts be suppressed as much as possible.
- a combination with the downstream level reduction in the Language breaks further improve the listening experience.
- a server unit also falls within the scope of the present invention Supporting the inventive method described above and a computer program for performing the method.
- the procedure can both as a hardware circuit and in the form of a computer program will be realized.
- software programming for powerful DSP's preferred because of new knowledge and additional functions easier by changing the software on an existing hardware basis are implementable.
- Processes can also be used as hardware modules for example, implemented in telecommunications terminals or telephone systems.
- no (or, in other examples, only a slight) suppression of interference signals in the overall signal is carried out during the speech phases T1, T3, so that the speech signal is passed on as unadulterated and unimpeded as possible.
- echo and noise signals are suppressed as effectively as possible (exponentially), but in the present example it is not reduced to the value 0, but to a small residual value c 2 , so as not to cause the other end To give the impression of a "dead" line. If echoes occur, they are reduced to a residual value c 3 ⁇ c 2 .
- FIG. 2 schematically shows the functioning of an arrangement for noise and echo reduction in accordance with the above-mentioned reduction function R (S, N, ES, ⁇ E , ERL, thrs) with a speech pause detector SPD.
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
Die Erfindung betrifft ein Verfahren zur Reduktion von Echo- und/oder Geräuschsignalen bei Telekommunikations(=TK)-Systemen für die Übertragung von akustischen Nutzsignalen, insbesondere menschlicher Sprache, bei dem mittels Sprach-Pausen-Detektion ermittelt wird, wann in der zu übertragenden Mischung aus Nutzsignalen und Störsignalen ein Sprachsignal enthalten ist oder wann eine Sprachpause vorliegt, wobei mittels eines Multiplizierers mit zwei Eingängen die in der Regel durch Echo- und/oder Geräuschsignale gestörten Nutzsignale in ihrer Amplitude durch ein zeitabhängiges Steuersignal a0(t) bzw. durch ein im Rhythmus einer Abtastrate fT=1/T getaktetes Steuersignal a0(k) verändert werden, wobei k ∈ die Abtastwerte durchzählt und T die Periodendauer von einem Abtastwert zum nächsten bedeutet. The invention relates to a method for reducing echo and / or noise signals in telecommunications (= TC) systems for the transmission of acoustic useful signals, in particular human speech, in which it is determined by means of speech pause detection when in the mixture to be transmitted a speech signal is included from useful signals and interference signals or when there is a speech pause, the useful signals in their amplitude, which are usually disturbed by echo and / or noise signals, being amplified by a time-dependent control signal a 0 (t) or by a multiplier with two inputs in the rhythm of a sampling rate f T = 1 / T clocked control signal a 0 (k) are changed, where k ∈ the samples are counted and T means the period from one sample to the next.
Ein solches Verfahren ist beispielsweise bekannt aus der DE 42 29 912 A1.Such a method is known for example from DE 42 29 912 A1.
Während einer natürlichen Kommunikation zwischen Menschen passt man in der Regel die Amplitude der gesprochenen Sprache automatisch an die akustische Umgebung an. Bei einer Sprachkommunikation zwischen entfernten Orten jedoch befinden sich die Gesprächspartner nicht im selben akustischen Umfeld und sind sich daher jeweils nicht der akustischen Situation am Ort des anderen Gesprächspartners bewusst. Besonders verschärft tritt daher ein Problem auf, wenn einer der Partner aufgrund seiner akustischen Umgebung gezwungen ist, sehr laut zu sprechen, während der andere Partner in einer leisen akustischen Umgebung Sprachsignale mit geringer Amplitude erzeugt.During a natural communication between people you fit in usually the amplitude of the spoken language automatically to the acoustic environment. With voice communication between distant In places, however, the conversation partners are not in the same acoustic Environment and are therefore not aware of the acoustic situation at the location of the aware of other interlocutors. This is why it occurs particularly sharply Problem when one of the partners due to its acoustic environment is forced to speak very loudly while the other partner in one quiet acoustic environment generates voice signals with low amplitude.
Hinzu kommt das Problem, dass auf einem TK-Kanal auch ein "elektronisch erzeugtes" Geräusch entsteht und als Hintergrund zum Nutzsignal mitübertragen wird. Des weiteren ist es auch vorteilhaft, Störsignale wie unerwünschten Hintergrundlärm (Straßenlärm, Fabriklärm, Bürolärm, Kantinenlärm, Fluglärm etc.) zu reduzieren oder ganz zu unterdrücken. Um den Komfort beim Telefonieren zu erhöhen, ist man generell bestrebt, jede Art von Geräusch möglichst gering zu halten.Added to this is the problem that an "electronic generated "noise arises and as a background to the useful signal is also transmitted. Furthermore, it is also advantageous to produce interference signals such as unwanted background noise (street noise, factory noise, office noise, To reduce or completely suppress canteen noise, aircraft noise etc.). To the To increase comfort when making a call, one is generally anxious to do any kind of To keep noise as low as possible.
Schließlich entstehen bei TK-Verbindungen auch noch sogenannte Echos, die in Zweidraht-TK-Netzen als Leitungsechos und beispielsweise in einfachen und unkomfortableren TK-Endgeräten in Form von akustischen Echos auftreten.Finally, so-called echoes also arise in TC connections in two-wire telecommunications networks as line echoes and, for example, in simple and more uncomfortable telecommunications terminals occur in the form of acoustic echoes.
Allgemein ist es deshalb bei der Übertragung von einem Gemisch aus Sprachsignal und Störsignalen über TK-Netze wichtig, die Störsignale wie Geräusch und Echo soweit wie möglich in ihrer Amplitude abzusenken.It is therefore general when transferring from a mixture Voice signal and interference signals via telecommunications networks important, the interference signals like Reduce the amplitude of noise and echo as much as possible.
Ein bekanntes Verfahren zur Geräuschreduktion ist die sogenannte "spektrale Subtraktion", die beispielsweise in der Veröffentlichung "A new approach to noise reduction based on auditory masking effects" von S. Gustafsson und P. Jax, ITG-Fachtagung, Dresden, 1998, beschrieben ist. Dabei handelt es sich um ein spektrales Geräuschabsenkungsverfahren, bei dem eine akustische Verdeckungsschwelle (beispielsweise nach dem MPEG-Standard) berücksichtigt wird. Nachteilig bei derartigen Verfahren ist die aufwendige Bestimmung dieser akustischen Verdeckungsschwelle und die Ausführung aller mit diesem Verfahren verbundenen Rechenoperationen.A known method for noise reduction is the so-called "spectral Subtraction ", for example in the publication" A new approach to noise reduction based on auditory masking effects "by S. Gustafsson and P. Jax, ITG conference, Dresden, 1998. It is about a spectral noise reduction method in which an acoustic Masking threshold (e.g. according to the MPEG standard) is taken into account. The disadvantage of such methods is that they are complex Determination of this acoustic masking threshold and the execution of all arithmetic operations associated with this method.
Bei einer spektralen Subtraktion wird zunächst das Geräusch in den Sprachpausen gemessen und in Form eines Leistungsdichtespektrums fortlaufend in einem Speicher abgelegt. Das Leistungsdichtespektrum wird über eine Fourier Transformation gewonnen. Beim Auftreten von Sprache wird sodann das gespeicherte Geräuschspektrum "als bester aktueller Schätzwert" vom aktuellen gestörten Sprachspektrum subtrahiert, sodann in den Zeitbereich zurücktransformiert, um auf diese Weise eine Geräuschreduktion für das gestörte Signal zu erhalten.In the case of spectral subtraction, the noise is initially in the Speech breaks measured and in the form of a power density spectrum continuously stored in a memory. The power density spectrum is about won a Fourier transformation. When language occurs then the stored noise spectrum "as the best current estimate" subtracted from the current disturbed language spectrum, then into the Time domain transformed back to reduce noise in this way to get for the disturbed signal.
Ein weiterer Nachteil der spektralen Subtraktion besteht darin, dass durch den Vorgang einer prinzipiell nicht genauen spektralen Geräuschschätzung und nachfolgender Subtraktion auch Fehler im Ausgangssignal auftreten, die sich als "musical tones" bemerkbar machen. Außerdem ist dieses bekannte Verfahren kaum zur Unterdrückung von Echosignalen bei TK-Verbindungen geeignet.Another disadvantage of spectral subtraction is that Process of a generally inaccurate spectral noise estimate and Subsequent subtraction also errors in the output signal occur make it noticeable as "musical tones". In addition, this is well known Hardly any method for suppressing echo signals in telecommunications connections suitable.
Bei der erweiterten spektralen Signalbearbeitung, die ebenfalls in dem genannten Zitat beschrieben ist, werden zunächst mit Hilfe einer spektralen Subtraktion die Leistungsdichtespektren für das Geräusch und für die Sprache selbst geschätzt. Aus der Kenntnis dieser Teilspektren wird sodann mit Hilfe z.B. der Regeln aus dem MPEG Standard eine spektrale akustische Verdeckungsschwelle RT(f) für das menschliche Ohr berechnet. Mit Hilfe dieser Verdeckungsschwelle und den geschätzten Spektren für Geräusch und Sprache wird sodann nach einer einfachen Regel eine Filterdurchlasskurve H(f) berechnet, die so gestaltet ist, dass wesentliche spektrale Teile der Sprache möglichst unverändert durchgelassen und spektrale Teile des Geräusches möglichst abgesenkt werden.In the extended spectral signal processing, which is also described in the citation mentioned, the power density spectra for the noise and for the speech itself are first estimated with the aid of a spectral subtraction. From the knowledge of these partial spectra, a spectral acoustic masking threshold R T (f) for the human ear is then calculated using, for example, the rules from the MPEG standard. With the aid of this masking threshold and the estimated spectra for noise and speech, a filter pass curve H (f) is then calculated according to a simple rule, which is designed in such a way that essential spectral parts of the speech are passed through as unchanged as possible and spectral parts of the noise are reduced as much as possible.
Sodann wird das originale gestörte Sprachsignal nur durch dieses Filter gegeben, um auf diese Weise eine Geräuschreduktion für das gestörte Signal zu erhalten. Der Vorteil dieses Verfahrens besteht nun darin, dass vom gestörten Signal "Nichts addiert oder subtrahiert" wird und daher Fehler in den Schätzungen weniger bis kaum wahrnehmbar sind. Nachteilig ist wieder der erhebliche Rechenaufwand für die spektrale Geräuschunterdrückung sowie das für eine Echounterdrückung vorzuschaltende adaptive Filter.Then the original disturbed speech signal is only through this filter given in this way a noise reduction for the disturbed signal to obtain. The advantage of this method is that from disturbed signal "nothing added or subtracted" and therefore errors in the Estimates are less or hardly noticeable. The disadvantage is again considerable computing effort for the spectral noise suppression as well adaptive filters to be connected upstream for echo suppression.
Bei dem bekannten Kompander-Verfahren, wie es beispielsweise in der eingangs zitierten DE 42 29 912 A1 beschrieben ist, wird der Grad der Geräusch- und Echoabsenkung gemäß einer fest vorgegebenen Transferfunktion festgelegt, die unter anderem eine Pegelabsenkung auch bei sehr kleinen Eingangssignalen vornimmt.In the known compander method, as it is for example in the DE 42 29 912 A1 cited at the beginning, the degree of Noise and echo reduction according to a predefined Transfer function set, which also includes a level reduction very small input signals.
Der Kompander hat zunächst die Eigenschaft, Sprachsignale mit einem bestimmten (vorab eingestellten) "normalen Sprachsignalpegel" (ggf. normale Lautstärke genannt) praktisch unverändert von seinem Eingang zum Ausgang zu übertragen.The compander initially has the property of speech signals with a certain (pre-set) "normal speech signal level" (possibly normal Called volume) practically unchanged from its entrance to the exit transferred to.
Wird nun aber das Eingangssignal einmal zu laut, z.B. weil ein Sprecher zu dicht an sein Mikrofon kommt, so begrenzt ein Dynamik-Kompressor den Ausgangspegel auf nahezu den gleichen Wert wie im Normalfall, indem die aktuelle Verstärkung im Kompander mit zunehmender Eingangslautstärke linear abgesenkt wird. Durch diese Eigenschaft bleibt die Sprache am Ausgang des Kompandersystems etwa gleich laut - unabhängig davon wie stark die Eingangslautstärke schwankt.If the input signal becomes too loud, e.g. because a speaker too comes close to its microphone, a dynamic compressor limits it Output level to almost the same value as normal by using the current gain in the compander linearly with increasing input volume is lowered. This property keeps the language at the exit of the Compander systems about the same loud - regardless of how strong the Input volume fluctuates.
Wird nun andererseits ein Signal mit einem Pegel, der kleiner als der Normalpegel ist, auf den Eingang des Kompanders gegeben, so wird das Signal zusätzlich gedämpft, indem die Verstärkung zurückgeregelt wird, um Hintergrundgeräusche möglichst nur abgeschwächt zu übertragen.On the other hand, a signal with a level that is lower than that Normal level is given to the input of the compander, so it will be Signal attenuated by reducing the gain to To reduce background noise, if possible, only attenuated.
Der Kompander besteht somit aus einem Kompressor für Sprachsignalpegel, die größer oder gleich einem Normalpegel sind und einem Expander für Signalpegel, die kleiner als der Normalpegel sind. Die Verstärkungsabsenkung im Expander wird dabei mit zunehmend kleineren Eingangspegeln stärker.The compander thus consists of a compressor for speech signal levels, which are greater than or equal to a normal level and an expander for Signal levels that are lower than the normal level. The gain reduction the expander becomes stronger with increasingly smaller input levels.
Nachteilig bei der Kompander-Lösung ist der erhebliche Rechenaufwand, der zur Durchführung des bekannten Verfahrens erforderlich ist. Durch die Kompression des Sprachsignalpegels einerseits und durch die Expansion andererseits wird außerdem eine Modulation in der Sprachlautstärke hervorgerufen, die das Sprachsignal in einer Weise verändert, dass das Ergebnis subjektiv oft als unbefriedigend empfunden wird, d.h. einen unbefriedigenden Höreindruck hinterlässt.The disadvantage of the compander solution is the considerable computing effort that is necessary to carry out the known method. Through the Compression of the speech signal level on the one hand and through the expansion on the other hand there is also a modulation in the speech volume that changes the speech signal in such a way that the Subjectively, the result is often perceived as unsatisfactory, i.e. one leaves an unsatisfactory listening impression.
Aufgabe der vorliegenden Erfindung ist es demgegenüber, ein Verfahren mit den eingangs beschriebenen Merkmalen vorzustellen, bei dem in möglichst unaufwendiger und kostengünstiger Art und Weise ohne großen Rechenaufwand und mit geringem Bedarf an Rechenspeicher und Datenspeicherplatz eine Echo- und Geräuschabsenkung bewirkt wird, die mit einfachen Mitteln einen für das menschliche Ohr möglichst angenehmen akustischen Gesamteindruck erzeugt, der je nach Geschmack zusätzlich an individuelle Bedürfnisse angepasst werden kann.In contrast, the object of the present invention is to provide a method with to introduce the features described at the outset, in which as possible uncomplicated and inexpensive way without large Computing effort and with little need for computing memory and Data storage space causes an echo and noise reduction, which with simple means one as pleasant as possible for the human ear overall acoustic impression, which also depends on the taste individual needs can be adjusted.
Erfindungsgemäß wird diese Aufgabe auf ebenso einfache wie wirkungsvolle
Art und Weise dadurch gelöst, dass das Steuersignal a0(t) bzw. a0(k) so variiert
wird, dass während des Vorliegens von Sprachsignalen im Nutzsignal die
Amplitude des Steuersignals a0(t) bzw. a0(k) auf einen vorgegebenen
konstanten Verstärkungswert c0 gesetzt wird und mit Beginn einer Sprachpause
im Nutzsignal die Amplitude des Steuersignals a0(t) bzw. a0(k) von einem
Abtastwert zum nächsten gemäß der Rekursionsformel
und dass nach dem Ende einer Sprachpause wieder a0(k) = c0 gesetzt wird.According to the invention, this object is achieved in a simple and effective manner in that the control signal a 0 (t) or a 0 (k) is varied in such a way that during the presence of speech signals in the useful signal, the amplitude of the control signal a 0 (t ) or a 0 (k) is set to a predetermined constant gain value c 0 and with the beginning of a speech pause in the useful signal, the amplitude of the control signal a 0 (t) or a 0 (k) from one sample value to the next according to the recursion formula
and that after the end of a speech pause, a 0 (k) = c 0 is set again.
Damit steht eine sehr einfache und sehr kostengünstige Methode bereit, die auch eine überraschend gute Qualität bezüglich einer Störreduktion ergibt, indem sie vorzugsweise in Sprachpausen die störenden Echo- und Geräuschsignale reduziert. Während der Sprachphasen selbst werden die Störgeräusche zumindest teilweise maskiert und daher vom menschlichen Ohr weit weniger deutlich wahrgenommen. Durch das Weglassen der Kompression nach dem bekannten Kompander-Verfahren wird das originale Sprachsignal erheblich weniger verändert, so dass im Ergebnis ein in der Regel besser klingendes Sprachsignal am anderen Ende der Leitung ankommt. Außerdem erfordert das erfindungsgemäße Verfahren eine geringere Rechenleistung als das Kompander-Verfahren, da ja zumindest die Kompression unterbleibt. Entsprechend sind geringere Kapazitäten an Datenspeichern und Rechenspreicher erforderlich, was das erfindungsgemäße Verfahren im Gegensatz zu den bekannten Verfahren einfacher und kostengünstiger gestaltet.This provides a very simple and very inexpensive method that also gives surprisingly good quality in terms of interference reduction, by preferring the interfering echo and Noise signals reduced. During the language phases themselves Noise at least partially masked and therefore from the human ear perceived far less clearly. By omitting compression the original speech signal is produced using the known compander method changed significantly less, so the result is usually a better one sounding voice signal arrives at the other end of the line. Moreover the method according to the invention requires less computing power than the compander process, since at least the compression is omitted. Correspondingly, there are smaller capacities in data storage and Computing required what the inventive method in In contrast to the known methods easier and cheaper designed.
Um eine effektive Geräuschreduktion zu erzielen, wird das zu übertragende Signal während der Sprachpausen in seinem Leistungswert gemäß einer zeitlichen Exponentialfunktion, im Gegensatz zu einer vom Eingangspegel abhängigen Absenkung, wie bei dem Kompander-Verfahren, abgesenkt. Damit wird bereits eine wesentliche Geräuschminderung erzielt. Hinzu kommt, dass eine Absenkung der Geräusche während einer Sprachpause das Gehör deutlich weniger belastet, indem es den Taubheitseffekt nach lauter Schalleinwirkung wesentlich mindert. Das Ohr kann bei Wiedereinsetzen der Sprache empfindlicher reagieren und genauer hinhören. In order to achieve effective noise reduction, the one to be transmitted Signal during the speech pauses in its performance value according to one temporal exponential function, in contrast to one from the input level dependent lowering, as in the compander process. In order to a substantial reduction in noise is already achieved. On top of that a reduction in noise during a pause in hearing significantly less burdened by the deafness effect after louder Sound exposure significantly reduced. The ear can be reinserted React language more sensitively and listen more carefully.
Vorteilhaft wird der Faktor β so gewählt, dass die stetige zeitliche Absenkung in etwa einer Zeitkonstanten τ1 der Wahrnehmbarkeit des menschlichen Ohres entspricht. Dies bedeutet, dass das menschliche Ohr nach einem starken Schallereignis neue Schallereignisse zeitlich und in ihrer Amplitude unterhalb eines mit der Zeitkonstanten τ1 abklingenden Kurvenverlaufes nach dem Ende des starken Schallereignisses nicht wahrnimmt. Bevorzugt ist daher eine Variante des erfindungsgemäßen Verfahrens, bei der der Faktor β aus der Abtastrate fT, aus einer Zeitkonstanten τ1 und aus einem vorgegebenen konstanten Vorfaktor c1 bestimmt wird gemäß der Beziehung β = c1·exp(-1/τ1fT)The factor β is advantageously chosen such that the constant decrease in time corresponds approximately to a time constant τ 1 of the perceptibility of the human ear. This means that after a strong sound event, the human ear does not perceive new sound events in time and in their amplitude below a curve shape that decays with the time constant τ 1 after the end of the strong sound event. A variant of the method according to the invention is therefore preferred, in which the factor β is determined from the sampling rate f T , from a time constant τ 1 and from a predetermined constant pre-factor c 1 according to the relationship β = c 1 · exp (-1 / τ 1 f T )
Der Wert der Zeitkonstanten τ1 liegt beim Menschen in der Regel zwischen 50 ms bis 150 ms und beträgt vorzugsweise etwa 65 ms.The value of the time constant τ 1 is usually between 50 ms to 150 ms in humans and is preferably about 65 ms.
Um den Faktor β genau nach der Zeitkonstanten τ1 zu dimensionieren, ist es günstig, wenn c0=1 gewählt wird.In order to dimension the factor β exactly according to the time constant τ 1 , it is expedient if c 0 = 1 is selected.
Wird die stetige exponentielle Absenkung der Störsignale nach der oben beschriebenen Rekursionsformel nicht begrenzt, so wird der Wert von a0 (k) mit wachsendem k sehr rasch ziemlich klein und geht gegen 0. Dies ist aber nicht immer erwünscht, da man in vielen Fällen lieber ein kleines Restgeräusch hören möchte, um während einer Sprachpause den Eindruck zu vermeiden, die TK-Leitung sei plötzlich "tot" oder unterbrochen. Bevorzugt ist daher eine Variante des erfindungsgemäßen Verfahrens, bei der a0(k+1) während einer Sprachpause einen vorgegebenen konstanten Wert c2 und/oder bei Vorliegen eines Echosignals einen Wert c3 < c2 annimmt, falls der Vorgängerwert a0(k) ≤ c2 geworden ist.If the constant exponential reduction of the interference signals is not limited according to the recursion formula described above, the value of a 0 (k) very quickly becomes very small with increasing k and goes towards 0. However, this is not always desirable, since in many cases one prefers want to hear a little residual noise to avoid the impression during a pause in speech that the telecommunications line is suddenly "dead" or interrupted. A variant of the method according to the invention is therefore preferred, in which a 0 (k + 1) assumes a predetermined constant value c 2 during a speech pause and / or a value c 3 <c 2 if an echo signal is present if the previous value a 0 (k ) Has become ≤ c 2 .
Ferner ist es wünschenswert, den Grad der Signalpegel-Absenkung in den Sprachpausen der momentanen Situation im TK-Kanal anzupassen. It is also desirable to consider the level of signal level reduction in the Adapt speech pauses to the current situation in the TK channel.
Beispielsweise wird man Geräusche vorzugsweise in Abhängigkeit vom momentanen Geräuschpegel N bzw. in Abhängigkeit von einer Funktion g(S/N) des Signal-zu-Geräuschabstandes S/N absenken, aber kurzzeitig auftretende Echos stärker absenken und nach dem Ende der Echos die Absenkung auf den geringeren Wert der Geräuschabsenkung zurückführen.For example, noise is preferred depending on instantaneous noise level N or depending on a function g (S / N) lower the signal-to-noise ratio S / N, but short-term ones Lower echoes more and after the end of the echoes the lowering to the reduce the lower value of the noise reduction.
Besonders bevorzugt ist daher eine Verfahrensvariante, die sich dadurch auszeichnet, dass bei Vorliegen eines Geräuschsignals und/oder Echosignals und für a0(k) ≤ c2 , wobei c2 eine vorgegebene Konstante ist, der Leistungswert des Geräuschpegels N im aktuell benutzten TK-Kanal fortlaufend gemessen und/oder geschätzt wird, und dass in Abhängigkeit vom aktuellen Geräuschpegel N laufend das Steuersignal a0(k+1) eingestellt wird gemäß a0(k+1) = f(N), wobei f(N) eine vorgegebene Funktion von N ist.A method variant is therefore particularly preferred, which is characterized in that, in the presence of a noise signal and / or echo signal and for a 0 (k) c c 2 , where c 2 is a predetermined constant, the power value of the noise level N in the currently used TC Channel is continuously measured and / or estimated, and that, depending on the current noise level N, the control signal a 0 (k + 1) is continuously set according to a 0 (k + 1) = f (N), where f (N) is a predetermined one Is a function of N.
Damit wird der Grad einer Geräuschabsenkung vom aktuell auftretenden Leistungswert N des Geräusches automatisch mitgesteuert und dem aktuellen Geräuschwert im Telefonkanal angepasst und in vorbestimmter definierter Weise nachgeführt. Über die Wahl der Funktion f(N) kann auch der subjektive Eindruck des erzeugten Gesamtsignals angepasst werden. Ein weiterer Vorteil dieser Verfahrensvariante besteht darin, dass bei einem Bündel von Telefonkanälen, beispielsweise zwischen internationalen Vermittlungsstellen, die Geräuschsituation in jedem einzelnen Kanal, die ja von Kanal zu Kanal sehr verschieden sein kann, automatisch eingestellt und individuell optimiert werden kann.The degree of noise reduction is thus different from that currently occurring Power value N of the noise automatically controlled and the current Noise level in the telephone channel adjusted and in a predefined defined Wisely tracked. The subjective function can also be selected via the function f (N) Impression of the total signal generated can be adjusted. Another advantage This variant of the method consists in that with a bundle of Telephone channels, for example between international exchanges, the noise situation in each individual channel, which is very different from channel to channel can be different, automatically set and individually optimized can.
Besonders bevorzugt ist eine Variante des erfindungsgemäßen Verfahrens, die sich dadurch auszeichnet, dass die vorgegebene Funktion f(N) eine Funktion g(S/N) ist, die vom Quotienten S/N aus dem Leistungswert des Signalpegels S der zu übertragenden Nutzsignale und dem Leistungswert des Geräuschpegels N abhängt, oder dass die vorgegebene Funktion f(N) eine Funktion g'(N/S) ist, die vom Kehrwert N/S dieses Quotienten abhängt. Aus Gründen einer einfacheren praktischen Realisierung kann man auch eine Funktion von (S+N)/N oder von (S+N)/S verwenden.A variant of the method according to the invention is particularly preferred, the is characterized in that the predetermined function f (N) is a function g (S / N), which is the quotient S / N from the power value of the signal level S the useful signals to be transmitted and the power level of the noise level N depends, or that the given function f (N) is a function g '(N / S), which depends on the reciprocal N / S of this quotient. For the sake of one simpler practical implementation can also be a function of Use (S + N) / N or from (S + N) / S.
Der Vorteil der obigen Verfahrensvariante besteht darin, dass bei stark
variierendem Nutzsignalpegel S in den Telefonkanälen eines Bündels immer
die richtige Einstellung für die Geräuschabsenkung gefunden wird. Bei einer
Steuerung der Geräuschreduktion proportional zum Kehrwert N/S lässt sich die
Funktion g'(N/S) leicht auf einem digitalen Signalprozessor (=DSP) mit festen
Computerwortlängen von beispielsweise 16 bit unter Verwendung von
besonders einfacher Software implementieren, da für N/S vorzugsweise ein
Zahlenbereich 0 < N/S < 1 zur Steuerung der Geräuschreduktion relevant bzw.
interessant ist.The advantage of the above process variant is that with strong
Varying useful signal level S in the telephone channels of a bundle always
the correct setting for noise reduction is found. At a
The control of the noise reduction proportional to the reciprocal N / S can be done
Function g '(N / S) easily on a digital signal processor (= DSP) with fixed
Computer word lengths of, for example, 16 bit using
Implement particularly simple software, because for N / S preferably a
Akustische Gehörtests haben ergeben, dass bei S/N = 0 db die Sprache bereits so stark gestört ist, dass man das Geräusch nur bedingt um einen Wert f0 bzw. g0 zwischen 5 und 10 dB, vorzugsweise zwischen 6 und 8 dB reduzieren darf, um den akustischen Gesamteindruck im Hinblick auf eine Natürlichkeit der Sprache nicht zu verschlechtern. Bei noch ungünstigeren Werten des Signal-zu-Rausch-Verhältnisses S/N < 0 dB kann dann der Wert f0 bzw. g0 beibehalten werden, da jede weitere Geräuschabsenkung den Gesamteindruck nur verschlechtert.Acoustic hearing tests have shown that at S / N = 0 db the speech is already so disturbed that the noise may only be reduced by a value f 0 or g 0 between 5 and 10 dB, preferably between 6 and 8 dB in order not to worsen the overall acoustic impression with regard to the naturalness of the language. With even more unfavorable values of the signal-to-noise ratio S / N <0 dB, the value f 0 or g 0 can then be retained, since any further noise reduction only worsens the overall impression.
Bei mittleren S/N kann gemäß diesen Untersuchungen eine stärkere Geräuschabsenkung vorgenommen werden. Ein Maximum ergibt sich dabei im Bereich 10 bis 15 dB. Der Wert der Geräuschabsenkung fmax bzw. gmax sollte im Maximum zwischen 20 und 30, vorzugsweise etwa 25 dB betragen.With medium S / N, a stronger noise reduction can be carried out according to these studies. A maximum results in the range of 10 to 15 dB. The maximum value of the noise reduction f max or g max should be between 20 and 30, preferably about 25 dB.
Bei sehr guten Rauschwerten S/N > 40 dB sollte nur noch eine minimale Absenkung zwischen 0 und 3 dB eingestellt werden, um die Natürlichkeit der übertragenen Sprache so gut wie möglich zu erhalten. With very good noise values S / N> 40 dB, only a minimal one should be left Reduction between 0 and 3 dB can be set to the naturalness of the to get transmitted language as good as possible.
Der Klang der Sprache und die Verständlichkeit sind besonders gut, wenn die Funktion f(N) bzw. g(S/N) über die drei oben diskutierten Bereiche hinweg in stetiger Weise miteinander zusammenhängt, wobei schnelle Änderungen in N oder in S(N) vorteilhaft durch Filterungen geglättet werden können.The sound of the language and the intelligibility are particularly good when the Function f (N) or g (S / N) across the three areas discussed above in is interrelated, with rapid changes in N or in S (N) can advantageously be smoothed by filtering.
Eine relativ einfache Realisierung in Hardware und/oder Software ergibt sich, indem man die Funktionen f(N) bzw. g(S/N) bzw. g'(N/S) durch gerade Kennlinienstücke zwischen den drei oben beschriebenen Betriebspunkten approximiert (abschnittsweise lineare Näherung).A relatively simple implementation in hardware and / or software results by the functions f (N) or g (S / N) or g '(N / S) by straight Characteristic pieces between the three operating points described above approximated (linear approximation in sections).
Bei einer etwas aufwendigeren Variante des erfindungsgemäßen Verfahrens, die aber im Ergebnis zu einem besseren Klangbild führt, wird eine Polynomfunktion zur Implementierung der stetigen Funktionen f(N) bzw. g(S/N) bzw. g'(N/S) in den drei diskutierten Bereichen herangezogen, was im Ergebnis zu einer Art unsymmetrischer Glockenfunktion führt.In a somewhat more complex variant of the method according to the invention, but the result is a better sound, becomes a Polynomial function to implement the continuous functions f (N) or g (S / N) or g '(N / S) in the three areas discussed, which is the result leads to a kind of asymmetrical bell function.
Besonders bevorzugt ist eine Variante des erfindungsgemäßen Verfahrens, bei der die Funktionen f(N) bzw. g(S/N) oder g'(N/S) so gewählt werden, dass die Reduktion des Geräuschpegels N gehörrichtig gemäß den psychoakustischen Mittelwerten des menschlichen Gehörspektrums erfolgt. Dabei wird der Wert für S und/oder N nicht nur aus dem momentanen Leistungswert alleine, sondern auch aus einem gewichteten spektralen Verlauf von S bzw. N bestimmt und insgesamt über die so gewonnene Funktion eine gehörrichtige, d.h. eine psychoakustisch angenehm klingende Geräuschreduktion erzielt. Da es kein einfach darstellbares Maß für eine akustisch angenehm klingende Geräuschreduktion gibt, sind alle Qualitätsbeurteilungen auf umfangreiche Gehörtests angewiesen, die anschließend mittels dafür optimierter statistischer Methoden ausgewertet werden, um einen Bewertungsmaßstab, (ähnlich wie bei Sprachcodecs) zu erhalten.A variant of the method according to the invention is particularly preferred for functions f (N) or g (S / N) or g '(N / S) are selected so that the Reduction of the noise level N according to the psychoacoustic Averages of the human hearing spectrum are made. The value for S and / or N not only from the current performance value alone, but also determined from a weighted spectral profile of S or N and Overall, an aurally correct, i.e. a achieved a pleasant sounding noise reduction that is psychoacoustically pleasing. Since there is no easy-to-display dimension for an acoustically pleasant sounding Noise reduction there, all quality assessments are extensive Hearing tests instructed, which are then optimized using statistical Methods are evaluated to an evaluation scale, (similar to Voice codecs).
Eine gute Geräuschpegel-Schätzung erfordert einen guten Sprach-Pausen-Detektor, da man nur dann sicher sein kann, dass in den Sprachpausen-Abschnitten lediglich störendes Geräusch und nicht irgendeine Mischung zwischen Geräusch und Sprachfetzen vorliegt, wie es in der Praxis häufig vorkommt.A good noise level estimate requires a good speech pause detector, because you can only be sure that in the speech pause sections just annoying noise and not any mix between noise and scraps of speech, as is often the case in practice occurs.
Besonders bevorzugt ist daher eine Verfahrensvariante, die sich dadurch auszeichnet, dass im Sprach-Pausen-Detektor aus dem Eingangssignal x mittels eines Kurzzeit-Pegelschätzers ein Kurzzeit-Ausgangssignal sam(x), mittels eines Mittelzeit-Pegelschätzers ein Mittelzeit-Ausgangssignal mam(x) und mittels eines Langzeit-Pegelschätzers ein Langzeit-Ausgangssignal lam(x) gebildet wird, dass die drei Ausgangssignale sam(x), mam(x) und lam(x) über geeignete Verstärkungskoeffizienten so eingestellt werden, dass sie etwa gleich groß, wenn das Eingangssignal x ein reines Rauschsignal ist, wobei sam(x) < mam(x) < lam(x), dass die drei Ausgangssignale sam(x), mam(x) und lam(x) von Komparatoren überwacht werden, und dass das Vorliegen eines Sprachsignals als Eingangssignal x angenommen wird, wenn sam(x) und mam(x) zunächst jeweils größer werden als lam(x), und das Vorliegen einer Sprachpause, wenn danach sam(x) und/oder mam(x) wieder kleiner wird als lam(x).A method variant which is characterized thereby is particularly preferred distinguishes that in the speech pause detector from the input signal x a short-term output signal sam (x) using a short-term level estimator, a middle time output signal mam (x) by means of a middle time level estimator and by means of a long-term level estimator a long-term output signal lam (x) is formed that the three output signals sam (x), mam (x) and lam (x) over suitable gain coefficients are set so that they are approximately equal large if the input signal x is a pure noise signal, where sam (x) < mam (x) <lam (x) that the three output signals sam (x), mam (x) and lam (x) are monitored by comparators and that the existence of a Speech signal is assumed as the input signal x if sam (x) and mam (x) initially become larger than lam (x), and the existence of a Speech pause when sam (x) and / or mam (x) then becomes smaller than lam (x).
Mit Hilfe dieser relativ einfachen Arten der Bildung von verschiedenen Mittelwerten des Zeitsignals kann bereits eine überraschend gute Sprachpausen-Detektion durchgeführt werden, die nur einen sehr geringen Rechenaufwand erfordert.With the help of these relatively simple types of formation of various Average values of the time signal can already be a surprisingly good one Speech pause detection can be carried out, which is only a very small one Computational effort required.
Eine Weiterbildung dieser Verfahrensvariante sieht vor, dass die drei Ausgangssignale sam(x), mam(x) und lam(x) zur Sprach-Pausen-Abschätzung einem neuronalen Netz zugeführt werden, das mit einer Vielzahl von Szenarien mit unterschiedlichen Eingangssignalen x trainiert wurde. Ein neuronales Netz kann vorteilhaft lineare und nichtlineare Zusammenhänge zwischen einer großen Menge von Eingabeparametern und den gewünschten Ausgabewerten abbilden. Eine Voraussetzung dafür ist, dass das neuronale Netz einmal mit einer hinreichenden Menge von Eingabewerten und zugehörigen Ausgabewerten trainiert wurde. Daher eignen sich neuronale Netze besonders für die Aufgabe einer Sprachpausen-Detektion bei Anwesenheit von unterschiedlichen störenden Geräuschen.A further development of this method variant provides that the three output signals sam (x), mam (x) and lam (x) for speech pause estimation a neural network can be supplied with a variety was trained by scenarios with different input signals x. On Neural network can advantageously linear and non-linear relationships between a large amount of input parameters and the desired ones Show output values. A prerequisite for this is that the neural Network with a sufficient amount of input values and associated output values were trained. Therefore neural are suitable Networks especially for the task of speech pause detection Presence of different disturbing noises.
Vorzugsweise wird zusätzlich zur Erkennung und Reduktion von Geräuschsignalen auch das Vorliegen von Echosignalen detektiert und/oder vorhergesagt und die entsprechenden Echosignale unterdrückt oder reduziert. Wenn in einem Telefonkanal zusätzlich zu Geräuschen auch Echos auftreten, so können diese in der Regel anhand einer vorab ermittelten Signallaufzeit τE eines Echos sowie der vorab ermittelten Echokopplung ERL im Kanal und der Signalstärke ES, die das Echo im Rückkanal auslöst, vorhergesagt werden. Man kann diese Schätzung in der Weise durchführen, dass in Abhängigkeit vom ausgesendeten Sprachsignal und seiner momentanen Leistung die Größe der verzögert eintreffenden Echos abgeschätzt wird. Überschreitet das jeweils geschätzte Echosignal in bestimmten kurzen Zeitabschnitten einen vorgegebenen Schwellwert thrs, so wird dieses echobehaftete Signal vorzugsweise kurzzeitig zusätzlich, beispielsweise durch die oben erwähnte exponentielle Absenkung, auf einen Wert gedämpft, der für eine wesentliche Reduktion des Echosignals erforderlich ist. Im gleichen Sinn kann auch eine Kompander-Kennlinie kurzzeitig bei Echos in die Richtung größerer Eingangslautstärke verschoben und nach Abklingen der Echos wieder in ihre ursprüngliche Lage zurückgeführt werden.In addition to the detection and reduction of noise signals, the presence of echo signals is preferably also detected and / or predicted and the corresponding echo signals are suppressed or reduced. If, in addition to noise, echoes also occur in a telephone channel, these can generally be predicted on the basis of a previously determined signal propagation time τ E of an echo as well as the previously determined echo coupling ERL in the channel and the signal strength ES which triggers the echo in the return channel. This estimation can be carried out in such a way that the size of the delayed arriving echoes is estimated as a function of the transmitted speech signal and its instantaneous power. If the respectively estimated echo signal exceeds a predetermined threshold value thrs in certain short time segments, then this echo-laden signal is preferably briefly attenuated, for example by the exponential reduction mentioned above, to a value which is necessary for a substantial reduction in the echo signal. In the same sense, a compander characteristic curve can also be briefly shifted in the direction of greater input volume in the case of echoes and returned to its original position after the echoes have subsided.
Besonders bevorzugt ist eine Weiterbildung dieser Verfahrensvariante, bei der das Steuersignal a0(k+1) laufend eingestellt wird gemäß a0(k+1) = h(N,S,ES,τE,ERL), wobei h(N,S,ES,τE,ERL) eine vorgegebene Funktion von N, S, dem Nutzsignal ES in Gegenrichtung eines sprechenden TK-Partners, τE eine konstante Verzögerungszeit des Echosignals und ERL eine Dämpfungskonstante der Amplitude des Echosignals ist.A development of this method variant is particularly preferred, in which the control signal a 0 (k + 1) is continuously set according to a 0 (k + 1) = h (N, S, ES, τ E , ERL), where h (N, S, ES, τ E , ERL) is a predetermined function of N, S, the useful signal ES in the opposite direction of a speaking TC partner, τ E is a constant delay time of the echo signal and ERL is a damping constant of the amplitude of the echo signal.
Man kann vorteilhaft eine gehörrichtige Geräuschabsenkung mit einer unabhängig davon arbeitenden Echoreduktion verbinden. Das ist besonders dann wichtig, wenn im Telefonkanal so gut wie kein Hintergrundgeräusch existiert, da dann keine Geräuschabsenkung wirksam wird, und somit auftretende Echos ungehindert zum Sprecher gelangen können.You can advantageously use an ear-sound reduction connect independent echo reduction. It is special important if there is almost no background noise in the telephone channel exists because no noise reduction is effective, and thus occurring echoes can reach the speaker unhindered.
Eine Trennung der Steuerung einer Geräuschreduktion von der einer
Echoabsenkung ist zweckmäßig, da Geräusche und Echos unabhängig
voneinander auftreten und auch in der Regel völlig unterschiedliche
physikalische Ursachen haben. Man kann aber mathematisch eine generelle
Reduktionsfunktion R angeben, die eine Absenkung von Signalpegeln sowohl
für Geräusche als auch für Echos beschreibt:
Besonders vorteilhaft ist eine Verfahrensvariante, bei der während der Zeitdauer einer Echo-Reduktion zum Nutzsignal zusätzlich ein künstliches Geräuschsignal addiert wird.A method variant is particularly advantageous in which during the Duration of an echo reduction in addition to the useful signal is an artificial one Noise signal is added.
Eine Geräuschabsenkung ist bei gleichbleibendem Geräuschpegel ebenfalls konstant. Eine plötzlich zusätzlich einsetzende Echoreduktion im Rhythmus der Sprache bedeutet auch eine Geräuschabsenkung (zumindest in dem kurzen Zeitabschnitt) im Sprachrhythmus. Dies führt zu einem gepulsten Hintergrundgeräusch, welches sich nicht natürlich anhört. Daher ist es vorteilhaft, in den Augenblicken einer zusätzlichen Echoreduktion ein synthetisches Geräusch eines geeigneten Rauschgenerators in der Größenordnung des normalen Hintergrundgeräusches zum bearbeiteten Signal hinzuzufügen. Damit soll ein möglichst gleichbleibendes Hintergrundgeräusch für den Hörer vermittelt werden. A noise reduction is also with the same noise level constant. A sudden additional echo reduction in the rhythm of the Language also means a reduction in noise (at least in the short Period) in the rhythm of speech. This leads to a pulsed Background noise, which does not sound natural. Therefore, it is advantageous in the moments of an additional echo reduction synthetic noise of a suitable noise generator in the Magnitude of normal background noise to the processed signal to add. This is to ensure that the background noise remains as constant as possible be conveyed to the listener.
Der Rauschgenerator kann so gestaltet werden, dass das künstliche Geräuschsignal eine psychoakustisch als angenehm empfundene akustische Signalsequenz (=comfort noise) umfasst.The noise generator can be designed so that the artificial Sound signal a psycho-acoustically perceived as pleasant acoustic Signal sequence (= comfort noise) includes.
Anstelle eines synthetischen Hintergrundgeräusches kann aber auch ein Abschnitt eines zuvor aufgezeichneten echten Hintergrundgeräusches in passender Stärke in den Echozeitabschnitten eingefügt werden. Das hinzugefügte Geräusch unterscheidet sich dann so gut wie überhaupt nicht vom vorherigen Geräusch und wird daher keine störende akustische Veränderung beim Hörer hervorrufen.Instead of a synthetic background noise, a Section of a previously recorded real background noise in appropriate strength can be inserted in the echo periods. The added noise then hardly differs from that at all previous noise and therefore will not be an annoying acoustic Cause a change in the listener.
Das Hinzufügen von Geräuschen zur akustischen Verdeckung von Effekten sowie die Maßnahmen einer getrennten Behandlung von Geräuschen und Echos werden, wenn sie richtig aufeinander abgestimmt sind, einen besonders verständlichen und angenehmen Spracheindruck auch bei "schwieriger" Umgebung (Echos plus Geräusche) bewirken.The addition of sounds to acoustically mask effects and the measures of separate treatment of noise and Echoes, when properly coordinated, make you special understandable and pleasant language impression even with "difficult" Effect environment (echoes plus noise).
Besonders bevorzugt ist auch eine Variante des erfindungsgemäßen Verfahrens, bei der das zu übertragende Nutzsignal einer spektralen Subtraktion unterzogen wird. Der Vorteil einer spektralen Subtraktion mit nachgeschalteter Pegelabsenkung in den Sprachpausen besteht darin, dass zuerst mittels spektraler Subtraktion ein Teil der Störgeräusche aus dem Sprachsignal selbst eliminiert wird und erst danach die Sprachpausen in der beschriebenen Art von Geräuschen und Echos befreit werden. Insgesamt ergibt diese Kombination bei subjektiven Tests bessere Höreindrücke als nur eine einfache spektrale Subtraktion.A variant of the invention is also particularly preferred Method in which the useful signal to be transmitted is spectral Subtracted. The advantage of using spectral subtraction downstream level reduction in the speech pauses is that first by means of spectral subtraction some of the noise from the Speech signal itself is eliminated and only then the speech pauses in the described type of noise and echoes are freed. Total results this combination gives better auditory impressions than subjective tests simple spectral subtraction.
Eine weitere besonders vorteilhafte Variante des erfindungsgemäßen Verfahrens schließlich sieht vor, dass das zu übertragende Nutzsignal einer dem menschlichen Gehör angepassten spektralen Filterung unterzogen wird. Auch hier wird mit den Mitteln einer spektralen Subtraktion zunächst eine Schätzung von Geräuschen, von Sprache und den Echos durchgeführt, sodann eine gehörrichtige Verdeckungsschwelle bestimmt und dann das gesamte Signal über ein passend eingestelltes Übertragungsfilter so bearbeitet, dass die Sprachanteile möglichst unverfälscht und die Echo- und Geräuschanteile möglichst weitgehend unterdrückt werden.Another particularly advantageous variant of the invention Finally, the method provides that the useful signal to be transmitted is a spectral filtering adapted to human hearing. Here too, spectral subtraction is used to create one Estimation of noise, speech and echoes performed, then determines an audible masking threshold and then the whole Signal processed via an appropriately set transmission filter so that the Speech parts as pristine as possible and the echo and noise parts be suppressed as much as possible.
Eine Kombination mit der nachgeschalteten Pegelabsenkung in den Sprachpausen verbessert den Höreindruck weiter.A combination with the downstream level reduction in the Language breaks further improve the listening experience.
In den Rahmen der vorliegenden Erfindung fällt auch eine Servereineit zur Unterstützung des oben beschriebenen erfindungsgemäßen Verfahrens sowie ein Computerprogramm zur Durchführung des Verfahrens. Das Verfahren kann sowohl als Hardwareschaltung, als auch in Form eines Computerprogramms realisiert werden. Heutzutage wird eine Software-Programmierung für leistungsstarke DSP's bevorzugt, da neue Erkenntnisse und Zusatzfunktionen leichter durch eine Veränderung der Software auf bestehender Hardwarebasis implementierbar sind. Verfahren können aber auch als Hardwarebausteine beispielsweise in TK-Endgeräten oder Telefonanlagen implementiert werden.A server unit also falls within the scope of the present invention Supporting the inventive method described above and a computer program for performing the method. The procedure can both as a hardware circuit and in the form of a computer program will be realized. Nowadays software programming for powerful DSP's preferred because of new knowledge and additional functions easier by changing the software on an existing hardware basis are implementable. Processes can also be used as hardware modules for example, implemented in telecommunications terminals or telephone systems.
Weitere Vorteile der Erfindung ergeben sich aus der Beschreibung und der Zeichnung. Ebenso können die vorstehend genannten und die noch weiter aufgeführten Merkmale erfindungsgemäß jeweils einzeln für sich oder zu mehreren in beliebigen Kombinationen Verwendung finden. Die gezeigten und beschriebenen Ausführungsformen sind nicht als abschließende Aufzählung zu verstehen, sondern haben vielmehr beispielhaften Charakter für die Schilderung der Erfindung.Further advantages of the invention result from the description and the Drawing. Likewise, the above and the others Features listed according to the invention individually for themselves or to several can be used in any combination. The shown and The described embodiments are not to be considered as a conclusive list understand, but rather have exemplary character for the description the invention.
Die Erfindung ist in der Zeichnung dargestellt und wird anhand von Ausführungsbeispielen näher erläutert. Es zeigen:
- Fig. 1
- das Steuersignal ao bei Vorliegen von Sprachsignalen, während einer Sprachpause und bei erneutem Einsetzen der Sprachsignale;
- Fig. 2
- ein Schema einer Anordnung zur gesteuerten Signalabsenkung;
- Fig. 3a
- die Funktion g(S/N) in der linearen Näherung;
- Fig. 3b
- die entsprechende Funktion g'(N/S);
- Fig. 4a
- die Funktion g(S/N) als unsymmetrische Glockenkurve; und
- Fig. 4b
- die entsprechende Funktion g'(N/S).
- Fig. 1
- the control signal ao when speech signals are present, during a speech pause and when the speech signals are used again;
- Fig. 2
- a diagram of an arrangement for controlled signal reduction;
- Fig. 3a
- the function g (S / N) in the linear approximation;
- Fig. 3b
- the corresponding function g '(N / S);
- Fig. 4a
- the function g (S / N) as an asymmetrical bell curve; and
- Fig. 4b
- the corresponding function g '(N / S).
Das in Fig. 1 als Funktion der Zeit t bzw. der Abtastzahl k dargestellte
Steuersignal a0 wird während einer ersten Phase T1, in welcher Sprachsignale
detektiert werden, auf einem Wert c0 = 1 gehalten. Während einer Sprachpause
im Zeitabschnitt T2 wird das Steuersignal a0 exponentiell auf einen kurz über 0
liegenden konstanten Wert c2 abgesenkt, um dann bei erneutem Einsetzen der
Sprachsignale während einer Phase T3 sprungartig wieder auf den Wert c0 = 1
(oder eine andere, beliebig wählbare Konstante) heraufgesetzt zu werden.
Dadurch wird während der Sprachphasen T1, T3 keine (oder bei anderen
Beispielen nur eine geringe) Unterdrückung von Störsignalen im Gesamtsignal
vorgenommen, so dass das Sprachsignal möglichst unverfälscht und
ungehindert weitergeleitet wird. Während der Sprachpause in der Phase T2
wird möglichst schnell (exponentiell) eine möglichst effektive Unterdrückung von
Echos und Geräuschsignalen bewirkt, wobei aber im vorliegenden Beispiel
nicht auf den Wert 0, sondern auf einen kleinen Restwert c2 abgesenkt wird, um
nicht am anderen Ende den Eindruck einer "toten" Leitung zu erwecken. Beim
Auftreten von Echos wird eine Absenkung auf einen Restwert c3 < c2
vorgenommen.The control signal a 0 shown in FIG. 1 as a function of the time t or the number of samples k is kept at a value c 0 = 1 during a first phase T1, in which speech signals are detected. During a speech pause in the time period T2, the control signal a 0 is lowered exponentially to a constant value c 2 , which is just above 0, and then jumps back to the value c 0 = 1 (or another, arbitrary) when the speech signals are used again during a phase T3 selectable constant). As a result, no (or, in other examples, only a slight) suppression of interference signals in the overall signal is carried out during the speech phases T1, T3, so that the speech signal is passed on as unadulterated and unimpeded as possible. During the speech pause in phase T2, echo and noise signals are suppressed as effectively as possible (exponentially), but in the present example it is not reduced to the
In Fig.2 ist schematisch die Funktionsweise einer Anordnung zur Geräusch- und Echoreduktion entsprechend der oben genannten Reduktionsfunktion R(S, N, ES, τE, ERL, thrs) mit einem Sprach-Pausen-Detektor SPD dargestellt. 2 schematically shows the functioning of an arrangement for noise and echo reduction in accordance with the above-mentioned reduction function R (S, N, ES, τ E , ERL, thrs) with a speech pause detector SPD.
Für sämtliche in den Figuren 3a bis 4b dargestellten Kurven gilt, dass der Funktionswert g bzw. g' für den Fall S/N < 0 dB, also bei extrem hohem Geräuschhintergrund, in einen konstanten Wert g0 der Geräuschreduktion von etwa 6 dB übergeht. Beginnend von S/N = 0 dB wird mit zunehmender Verbesserung des Signal-zu-Rausch-Verhältnisses S/N eine erhöhte Geräuschreduktion vorgenommen, die ein Maximum gmax ≈ 25 dB bei etwa S/N ≈ 12dB erreicht. Mit weiter zunehmendem S/N sinkt der Grad der Geräuschreduktion schließlich gegen Null, um bei geringem Hintergrundgeräusch möglichst wenig Manipulationen im übertragenen Nutzsignal vorzunehmen.It applies to all the curves shown in FIGS. 3a to 4b that the function value g or g 'for the case S / N <0 dB, that is to say with an extremely high noise background, changes to a constant value g 0 of the noise reduction of approximately 6 dB. Starting from S / N = 0 dB, with increasing improvement in the signal-to-noise ratio S / N, an increased noise reduction is achieved, which reaches a maximum g max ≈ 25 dB at approximately S / N ≈ 12 dB. As the S / N continues to increase, the degree of noise reduction finally drops to zero in order to carry out as little manipulation as possible in the transmitted useful signal with low background noise.
Claims (23)
dadurch gekennzeichnet,
dass das Steuersignal a0(t) bzw. a0(k) so variiert wird, dass während des Vorliegens von Sprachsignalen im Nutzsignal die Amplitude des Steuersignals a0(t) bzw. a0(k) auf einen vorgegebenen konstanten Wert c0 gesetzt wird und mit Beginn einer Sprachpause im Nutzsignal die Amplitude des Steuersignals a0(t) bzw. a0(k) von einem Abtastwert zum nächsten gemäß der Rekursionsformel
und dass nach dem Ende einer Sprachpause a0(k) = c0 gesetzt wird. Method for reducing echo and / or noise signals in telecommunications (= TC) systems for the transmission of acoustic useful signals, in particular human speech, in which it is determined by means of speech pause detection when in the mixture of useful signals and interference signals to be transmitted a speech signal is included or when there is a speech pause, with the aid of a multiplier with two inputs, the amplitude of the useful signals, which are generally disturbed by echo and / or noise signals, by a time-dependent control signal a 0 (t) or by a rhythmic sampling rate f T = 1 / T clocked control signal a 0 (k) can be changed, where k ∈ the samples are counted and T means the period from one sample to the next,
characterized,
that the control signal a 0 (t) or a 0 (k) is varied such that during the presence of speech signals in the useful signal, the amplitude of the control signal a 0 (t) or a 0 (k) to a predetermined constant value c 0 is set and with the beginning of a speech pause in the useful signal, the amplitude of the control signal a 0 (t) or a 0 (k) from one sample value to the next according to the recursion formula
and that after the end of a speech pause a 0 (k) = c 0 is set.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19957221 | 1999-11-27 | ||
DE19957221A DE19957221A1 (en) | 1999-11-27 | 1999-11-27 | Exponential echo and noise reduction during pauses in speech |
Publications (3)
Publication Number | Publication Date |
---|---|
EP1103956A2 true EP1103956A2 (en) | 2001-05-30 |
EP1103956A3 EP1103956A3 (en) | 2001-12-05 |
EP1103956B1 EP1103956B1 (en) | 2005-06-08 |
Family
ID=7930611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP00124577A Expired - Lifetime EP1103956B1 (en) | 1999-11-27 | 2000-11-10 | Exponential reduction of echo and noise during speech pauses |
Country Status (6)
Country | Link |
---|---|
US (1) | US6999920B1 (en) |
EP (1) | EP1103956B1 (en) |
JP (1) | JP2001202100A (en) |
KR (1) | KR20010051980A (en) |
AT (1) | ATE297590T1 (en) |
DE (2) | DE19957221A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107274909A (en) * | 2017-06-16 | 2017-10-20 | 深圳市华域无线技术股份有限公司 | A kind of active the machine audio removing method in speech recognition |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10030926A1 (en) * | 2000-06-24 | 2002-01-03 | Alcatel Sa | Interference-dependent adaptive echo cancellation |
US7428223B2 (en) * | 2001-09-26 | 2008-09-23 | Siemens Corporation | Method for background noise reduction and performance improvement in voice conferencing over packetized networks |
DE10150519B4 (en) | 2001-10-12 | 2014-01-09 | Hewlett-Packard Development Co., L.P. | Method and arrangement for speech processing |
US7158572B2 (en) * | 2002-02-14 | 2007-01-02 | Tellabs Operations, Inc. | Audio enhancement communication techniques |
DE10216322B4 (en) * | 2002-04-13 | 2004-07-15 | Güttler, Gerhard, Prof. Dr. | votes converter |
US7366295B2 (en) * | 2003-08-14 | 2008-04-29 | John David Patton | Telephone signal generator and methods and devices using the same |
US8394114B2 (en) * | 2003-09-26 | 2013-03-12 | Medtronic, Inc. | Surgical connection apparatus and methods |
US20060104460A1 (en) * | 2004-11-18 | 2006-05-18 | Motorola, Inc. | Adaptive time-based noise suppression |
JP4283212B2 (en) | 2004-12-10 | 2009-06-24 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Noise removal apparatus, noise removal program, and noise removal method |
US7599357B1 (en) * | 2004-12-14 | 2009-10-06 | At&T Corp. | Method and apparatus for detecting and correcting electrical interference in a conference call |
US7599719B2 (en) | 2005-02-14 | 2009-10-06 | John D. Patton | Telephone and telephone accessory signal generator and methods and devices using the same |
WO2006089089A2 (en) * | 2005-02-16 | 2006-08-24 | Applera Corporation | Refractive index matching in capillary illumination |
JP4562573B2 (en) * | 2005-03-30 | 2010-10-13 | ローランド株式会社 | Howling prevention device |
US8509450B2 (en) * | 2010-08-23 | 2013-08-13 | Cambridge Silicon Radio Limited | Dynamic audibility enhancement |
KR102413692B1 (en) | 2015-07-24 | 2022-06-27 | 삼성전자주식회사 | Apparatus and method for caculating acoustic score for speech recognition, speech recognition apparatus and method, and electronic device |
KR102192678B1 (en) | 2015-10-16 | 2020-12-17 | 삼성전자주식회사 | Apparatus and method for normalizing input data of acoustic model, speech recognition apparatus |
GB2551499B (en) * | 2016-06-17 | 2021-05-12 | Toshiba Kk | A speech processing system and speech processing method |
CN111128213B (en) * | 2019-12-10 | 2022-09-27 | 展讯通信(上海)有限公司 | Noise suppression method and system for processing in different frequency bands |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US786760A (en) * | 1904-06-15 | 1905-04-04 | Hartshorn Bros | Couch. |
US5533133A (en) * | 1993-03-26 | 1996-07-02 | Hughes Aircraft Company | Noise suppression in digital voice communications systems |
US5537509A (en) * | 1990-12-06 | 1996-07-16 | Hughes Electronics | Comfort noise generation for digital communication systems |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8000361A (en) * | 1980-01-21 | 1981-08-17 | Philips Nv | DEVICE AND METHOD FOR GENERATING A VOICE SIGNAL |
JPS57212831A (en) * | 1981-06-24 | 1982-12-27 | Kokusai Denshin Denwa Co Ltd <Kdd> | Echo controlling system |
US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
JP3080641B2 (en) * | 1990-07-24 | 2000-08-28 | 株式会社東芝 | Echo canceller |
US5369711A (en) * | 1990-08-31 | 1994-11-29 | Bellsouth Corporation | Automatic gain control for a headset |
DE4229912A1 (en) * | 1992-09-08 | 1994-03-10 | Sel Alcatel Ag | Method for improving the transmission properties of an electroacoustic system |
JP3152171B2 (en) * | 1997-06-16 | 2001-04-03 | 日本電気株式会社 | Adaptive filter, step size control method, and recording medium recording program |
US6549587B1 (en) * | 1999-09-20 | 2003-04-15 | Broadcom Corporation | Voice and data exchange over a packet based network with timing recovery |
-
1999
- 1999-11-27 DE DE19957221A patent/DE19957221A1/en not_active Ceased
-
2000
- 2000-11-10 EP EP00124577A patent/EP1103956B1/en not_active Expired - Lifetime
- 2000-11-10 AT AT00124577T patent/ATE297590T1/en not_active IP Right Cessation
- 2000-11-10 DE DE50010504T patent/DE50010504D1/en not_active Expired - Lifetime
- 2000-11-16 JP JP2000349077A patent/JP2001202100A/en not_active Withdrawn
- 2000-11-21 US US09/716,272 patent/US6999920B1/en not_active Expired - Lifetime
- 2000-11-27 KR KR1020000071015A patent/KR20010051980A/en not_active Application Discontinuation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US786760A (en) * | 1904-06-15 | 1905-04-04 | Hartshorn Bros | Couch. |
US5537509A (en) * | 1990-12-06 | 1996-07-16 | Hughes Electronics | Comfort noise generation for digital communication systems |
US5533133A (en) * | 1993-03-26 | 1996-07-02 | Hughes Aircraft Company | Noise suppression in digital voice communications systems |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107274909A (en) * | 2017-06-16 | 2017-10-20 | 深圳市华域无线技术股份有限公司 | A kind of active the machine audio removing method in speech recognition |
Also Published As
Publication number | Publication date |
---|---|
DE19957221A1 (en) | 2001-05-31 |
JP2001202100A (en) | 2001-07-27 |
US6999920B1 (en) | 2006-02-14 |
DE50010504D1 (en) | 2005-07-14 |
ATE297590T1 (en) | 2005-06-15 |
EP1103956A3 (en) | 2001-12-05 |
KR20010051980A (en) | 2001-06-25 |
EP1103956B1 (en) | 2005-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1103956B1 (en) | Exponential reduction of echo and noise during speech pauses | |
EP1143416B1 (en) | Time domain noise reduction | |
DE69428119T2 (en) | REDUCING BACKGROUND NOISE FOR LANGUAGE ENHANCEMENT | |
DE60108401T2 (en) | SYSTEM FOR INCREASING LANGUAGE QUALITY | |
DE69630580T2 (en) | Noise canceller and method for suppressing background noise in a noisy speech signal and a mobile station | |
EP0698986B1 (en) | Method for adaptive echo compensation | |
DE60116255T2 (en) | NOISE REDUCTION DEVICE AND METHOD | |
DE60030736T2 (en) | FEEDBACK SUPPRESSION USING BANDWIDTH DETECTION | |
DE69627359T2 (en) | IMPROVED ECHOCOMPENSOR FOR USE IN DIGITAL TELEPHONY | |
EP2158588A1 (en) | Spectral smoothing method for noisy signals | |
DE19806015C2 (en) | Process for improving acoustic attenuation in hands-free systems | |
DE60026570T3 (en) | NOISE IN HOUR | |
EP1155561B1 (en) | Method and device for suppressing noise in telephone devices | |
DE602004006912T2 (en) | A method for processing an acoustic signal and a hearing aid | |
DE102018117557B4 (en) | ADAPTIVE FILTERING | |
EP1126687A2 (en) | Method for coordinated echo and/or noise reduction | |
AT504164A1 (en) | DEVICE FOR NOISE REDUCTION ON AN AUDIO SIGNAL | |
EP1453355B1 (en) | Signal processing in a hearing aid | |
EP1351550B1 (en) | Method for adapting a signal amplification in a hearing aid and a hearing aid | |
EP1104096A2 (en) | Noise suppression adapted to actual Noise Level | |
DE10052626A1 (en) | Adaptive noise level estimator | |
DE10030926A1 (en) | Interference-dependent adaptive echo cancellation | |
DE102019201879B3 (en) | Method for operating a hearing system and hearing system | |
DE102019105458B4 (en) | System and method for time delay estimation | |
EP4235664A1 (en) | Method for suppressing an acoustic reverberation in an audio signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
AK | Designated contracting states |
Kind code of ref document: A2 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR |
|
AX | Request for extension of the european patent |
Free format text: AL;LT;LV;MK;RO;SI |
|
PUAL | Search report despatched |
Free format text: ORIGINAL CODE: 0009013 |
|
AK | Designated contracting states |
Kind code of ref document: A3 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR |
|
AX | Request for extension of the european patent |
Free format text: AL;LT;LV;MK;RO;SI |
|
RIC1 | Information provided on ipc code assigned before grant |
Free format text: 7G 10L 21/02 A, 7H 03G 3/34 B |
|
17P | Request for examination filed |
Effective date: 20011220 |
|
AKX | Designation fees paid |
Free format text: AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR |
|
GRAP | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOSNIGR1 |
|
GRAS | Grant fee paid |
Free format text: ORIGINAL CODE: EPIDOSNIGR3 |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: TR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20050608 Ref country code: NL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20050608 Ref country code: IE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20050608 Ref country code: FI Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20050608 |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: FG4D Free format text: NOT ENGLISH |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: EP |
|
GBT | Gb: translation of ep patent filed (gb section 77(6)(a)/1977) |
Effective date: 20050608 |
|
REF | Corresponds to: |
Ref document number: 50010504 Country of ref document: DE Date of ref document: 20050714 Kind code of ref document: P |
|
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FG4D Free format text: LANGUAGE OF EP DOCUMENT: GERMAN |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: SE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20050908 Ref country code: GR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20050908 Ref country code: DK Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20050908 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: ES Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20050919 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: CY Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20051110 Ref country code: AT Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20051110 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: PT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20051114 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: CH Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20051130 Ref country code: BE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20051130 Ref country code: LI Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20051130 Ref country code: MC Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20051130 Ref country code: LU Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20051130 |
|
NLV1 | Nl: lapsed or annulled due to failure to fulfill the requirements of art. 29p and 29m of the patents act | ||
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FD4D |
|
ET | Fr: translation filed | ||
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
26N | No opposition filed |
Effective date: 20060309 |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: PL |
|
BERE | Be: lapsed |
Owner name: ALCATEL Effective date: 20051130 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: IT Payment date: 20101123 Year of fee payment: 11 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: IT Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20111110 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: GC Effective date: 20140717 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 16 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 17 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: GB Payment date: 20161122 Year of fee payment: 17 Ref country code: FR Payment date: 20161118 Year of fee payment: 17 Ref country code: DE Payment date: 20161121 Year of fee payment: 17 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R119 Ref document number: 50010504 Country of ref document: DE |
|
GBPC | Gb: european patent ceased through non-payment of renewal fee |
Effective date: 20171110 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: ST Effective date: 20180731 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: DE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20180602 Ref country code: FR Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20171130 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: GB Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20171110 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R081 Ref document number: 50010504 Country of ref document: DE Owner name: WSOU INVESTMENTS, LLC, LOS ANGELES, US Free format text: FORMER OWNER: ALCATEL LUCENT, PARIS, FR Ref country code: DE Ref legal event code: R082 Ref document number: 50010504 Country of ref document: DE Representative=s name: BARKHOFF REIMANN VOSSIUS, DE |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: 732E Free format text: REGISTERED BETWEEN 20200820 AND 20200826 |