EP1143416B1 - Time domain noise reduction - Google Patents
Time domain noise reduction Download PDFInfo
- Publication number
- EP1143416B1 EP1143416B1 EP01440083A EP01440083A EP1143416B1 EP 1143416 B1 EP1143416 B1 EP 1143416B1 EP 01440083 A EP01440083 A EP 01440083A EP 01440083 A EP01440083 A EP 01440083A EP 1143416 B1 EP1143416 B1 EP 1143416B1
- Authority
- EP
- European Patent Office
- Prior art keywords
- signal
- frequency
- noise
- frequency spectrum
- process according
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000009467 reduction Effects 0.000 title abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 64
- 238000001228 spectrum Methods 0.000 claims abstract description 52
- 230000008569 process Effects 0.000 claims abstract description 23
- 230000009466 transformation Effects 0.000 claims abstract description 15
- 230000005540 biological transmission Effects 0.000 claims abstract description 5
- 238000012935 Averaging Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 230000008447 perception Effects 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 2
- 230000003595 spectral effect Effects 0.000 abstract description 17
- 238000012545 processing Methods 0.000 abstract description 14
- 238000005457 optimization Methods 0.000 abstract description 5
- 230000000873 masking effect Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 101100390736 Danio rerio fign gene Proteins 0.000 description 1
- 101100390738 Mus musculus Fign gene Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012074 hearing test Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012432 intermediate storage Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
Definitions
- the call partners are not in the same acoustic environment and therefore are not aware of the acoustic situation at the other party's location. Therefore, a problem arises more intensively when one of the partners is forced to speak very loudly due to its acoustic environment, while the other partner generates low amplitude voice signals in a quiet acoustic environment.
- the terminals are designed so small that an immediate spatial proximity between speaker and microphone unavoidable is. Due to the direct sound transmission, in particular by structure-borne noise between speaker and microphone, the acoustic interference signal come in the same order of magnitude as the useful signal of the speaker on respective terminal or this even exceed in amplitude. Such a thing Noise problem also occurs with several spatially adjacent Terminals, for example in an office or conference room with many Telephone connections in a significant extent, since a coupling of every loudspeaker signal is sent to each microphone.
- noise such as unwanted background noise (Street noise, factory noise, office noise, canteen noise, aircraft noise, etc.) to reduce or completely suppress.
- the degree of noise reduction according to a fixed predetermined transfer function has first the property of voice signals with a specific (pre-set) "normal speech signal level" (possibly called normal volume) practical unchanged from its input to the output. But now once the input signal is too loud, e.g. because a speaker is too close Microphone comes, so limits a dynamic compressor to the output level almost the same value as normally, adding the current gain in the Kompander is linearly lowered with increasing input volume. By this property remains the language at the output of the compander system about the same - no matter how strong the input volume fluctuates.
- normal speech signal level possibly called normal volume
- a signal with a level that is smaller than the Normal level is given to the input of the compander, so will that Signal is additionally attenuated by the gain being back-regulated to If possible, transmit background noise only attenuated.
- the Kompander thus consists of two sub-functions, a compressor for Speech signal levels greater than or equal to a normal level and one Expander for signal levels lower than the normal level.
- the noise measured in the speech pauses and in the form of a Power density spectrum continuously stored in a memory.
- the power density spectrum is won over a Fourier transformation.
- the stored sound spectrum "as the best current estimate "subtracted from the current disturbed speech spectrum, then transformed back into the time domain to create in this way a To obtain noise reduction for the disturbed signal.
- a disadvantage of such methods is the complex determination of this acoustic Masking threshold and the execution of all with this procedure connected arithmetic operations.
- Another disadvantage of the spectral subtraction is that by the process of a basically inaccurate spectral noise estimation and subsequent subtraction also errors in the Output signal occur, which are noticeable as "musical tones".
- a spectral acoustic masking threshold R T (f) for the human ear is then calculated using the rules from the MPEG standard, for example.
- a filter pass curve H (f) is calculated according to a simple rule, designed to let the essential spectral parts of the speech pass as unaltered as possible and reduce the spectral parts of the noise as much as possible.
- Object of the present invention is in contrast, a method possible low complexity with the features described above, in a technically inexpensive way a noise reduction or noise suppression is achieved, and at the original signal remains untouched until the actual noise deduction.
- the procedure should be simple, especially with less computational effort as far as possible, one for the human ear possible pleasant overall acoustic impression, depending on the taste can be adapted to individual needs.
- the new method completely independent of the requirements for a voice signal processing can be performed and thus a simple optimization to the requirements of spectral processing of noise signals enable.
- the inventive method made possible by the separate replica the noise signal in the frequency domain regardless of processing the original voice signal direct deduction of the replicated Noise signal from the original, unadulterated input signal, which neither a Fourier transform nor an inverse Fourier transform is subjected. With a corresponding phase correction in the frequency domain is even a noise subtraction from the original signal with no time delay possible.
- the inventive method is less complex as the above-described known prior art methods, requires less computing power and leads to better frequency resolution.
- step (d) By separating the noise simulation from the transmission of the original signal allows the process of the invention in a particularly preferred Variant that in step (d) only a selected part of the generated Frequency spectrum used to generate the simulated noise signal becomes.
- the for carrying out the method according to the invention required computing power further minimized or the process itself be done even faster.
- a development of this variant of the method is characterized in that the selection of the for generating the simulated noise signal used part of the frequency spectrum according to criteria of psychoacoustics according to the mean values of the perceptual spectrum of the human Hearing takes place.
- the value for the sound signal to be reproduced is not only from the instantaneous power value of an original signal in speech pauses alone, but also from a weighted spectral course of the corresponding signal determined and in total over the function thus gained a hearing-correct, i.e. Achieved a psychoacoustically pleasing-sounding noise reduction.
- the Selection of the signal used to generate the simulated noise signal Part of the frequency spectrum such that only discrete frequencies of the Spectrum are considered, and that the distance of the discrete frequencies steadily larger in the direction of higher frequencies, preferably after one logarithmic function is selected. This is the frequency resolution to the Perception of the human ear better adapted.
- Step (c) or before step (d) takes place.
- step (b) the frequency spectrum in step (b) the branched TK signal only in a predetermined frequency range is produced. If the source of interference only a limited frequency spectrum can, in turn, with this measure, considerable computing power be saved. For example, in motor vehicles with sources of interference in a frequency range only up to a maximum of 1 KHz to be expected, since the Interference signal mainly due to low-frequency sound generation (engine, Gear, rolling noise, etc.) is formed.
- step (b) a discrete Fourier transform or an inverse discrete Fourier transform is applied, wherein the incoming TK signal with discrete time amplitude values a sampling frequency f T are sampled.
- FFT fast Fourier transform
- IDFT inverse discrete Fourier transform
- step (b) broadband interferers can be processed particularly economically become.
- an embodiment is selected in which only that part of the generated frequency spectrum which is below half the sampling frequency f T / 2. This in turn can be achieved in savings in computing power, but also in storage space.
- step (c) a frequency spectrum is buffered, the by averaging the frequency spectrum currently generated in step (b) previously generated frequency spectra is obtained.
- psychoacoustic Weighting the frequency dependent settling times to the adapted to human hearing. This achieves an optimization of the system in terms of naturalness, stability and adaptation time.
- step (e) according to predetermined criteria with a weighting factor a ⁇ 1 weighted simulated noise signal from the currently arriving one TK signal deducted.
- the weighting factor a is used as one of Faults of the TK system dependent constant value selected. This makes possible an inexpensive and simple optimization of the invention Procedure to the errors of the respective telecommunications system. The errors become automatic recorded, the weighting can also take place during operation.
- the weighting factor a may be determined as one after one by the user of the TK-Systems selectable quality level adjustable value can be selected.
- One such user-defined weighting factor allows an individual, custom adaptation of the method according to the invention to the individual Needs. Is the system of the invention in an existing integrated parent concept can be a user-provided statistical value, such as the error probability or recognition rate used to control the weighting factor.
- the weighting factor for example also be derived from the speed or speed.
- the weighting factor a is adaptive is adapted to the current incoming TK signal.
- the adaptive weighting allows automatic optimization of noise reduction during of the operation.
- the weighting factor may vary from statistical values such as probability of error, Mean value, state changes, etc. are derived. With the adaptive weighting are particularly easy and quick adjustments of the inventive method to individual circumstances in the acoustic environment of the telecommunications terminal possible.
- a further advantageous variant of the method according to the invention is characterized characterized in that the simulated noise signal generated in step (d) before step (e) a synthetic noise signal is added.
- the Admixture of an artificial noise signal with constant power density can mask dynamic, non-stationary interferers in the output signal serve.
- a further variant of the method according to the invention provides that the currently arriving TK signal before step (e) of a defined time delay is subjected, which is preferably designed so that the phase angle of the incoming TK signal with the phase position of the simulated noise signal matches before withdrawal.
- the currently arriving TK signal is fed without delay to the trigger in step (e), and that the simulated noise signal in its phase position before step (e) to the phase angle of the currently arriving TK signal is adjusted.
- the Phase angle of the reproduced noise signal in the frequency range before Corrected inverse transformation the subtraction from the instantaneous signal take place in the time domain. Disturbing signal delays can thus be dispensed with. These inevitably occur in all procedures in which the useful signal (Language) makes the detour via two transformations, such as in the known spectral subtraction discussed above.
- the noise reproduction also includes a echo reproduction that with a connected to the remote TK subscriber signal is connected.
- This process variant can be improved by the fact that the control the reduction of noise signals and the reduction of echo signals done separately.
- the scope of the present invention also includes a server line, a Processor assembly and a gate array assembly to support the method described above and a computer program to carry out the process.
- the method can be used both as a hardware circuit, as well as in the form of a computer program.
- software programming for powerful DSP's preferred because new knowledge and additional functions easier by a Modification of the software can be implemented on an existing hardware basis are.
- methods can also be used as hardware components, for example in TK terminals or telephone systems are implemented.
- Fig. 1 it is shown how from an incoming original signal x, which contains a voice portion s and a noise n, on the one hand in a device 1, a noise signal y n in the frequency domain is simulated and on the other hand, the original signal x s + n separated from the noise simulation of a Noise subtraction is supplied, wherein optionally a time delay time delay ⁇ can be made.
- the noise-reduced signal y s is then forwarded in the TK system.
- a simple embodiment is shown in which in the device 1 a for noise simulation a virtually always required speech pause detector 2 is provided, which determines when the incoming Signal may contain speech signals or when there is a speech break.
- the incoming TK signal of a Fourier transform FT subjected to generating a Frequenzsprektrums and each of them resulting frequency spectrum stored in a buffer 3.
- the time sequentially stored frequency spectra can help with a means 4 are averaged.
- the speech pause detector 2 determines that a speech pause is over is and in the incoming original signal and speech signals can be present, becomes the last stored in the buffer memory 3 frequency spectrum (possibly averaged with previously recorded spectra) of an inverse Fourier transformation IFT subjected and in a Sub Volumeglied 5 of Original signal, which was possibly subjected to a time delay ⁇ deducted, to get a noise-free or at least noise-reduced signal.
- FIG. 4 shows a further embodiment of the invention, in which the original signal x s + n, which is initially received in the time domain, is processed block-by-block in the device 1 b for noise simulation.
- the time signal before the transformation into the frequency range is subjected to a windowing (eg according to Hamming) in a correspondingly upstream device 4 'or 4 "In order to compensate for the errors caused by the windowing during the inverse transformation, in addition to the processing in a first Path is made parallel processing in another path with the same fenestration, wherein only the signal is offset by half the window length and otherwise the simulated noise signal is calculated by the same means, whereby a compensation of the errors generated by the fenestration can be achieved.
- a windowing eg according to Hamming
- the windowing is performed in a device 4 ', then the time signal is subjected to a fast Fourier transformation FFT and the resulting spectrum is stored in an intermediate memory 3'.
- FFT fast Fourier transformation
- An inverse fast Fourier transformation IFFT is connected to the latches 3 ', 3 ", and the resulting spectra in the time domain are combined to form a simulated noise signal Yn in an overlap device 6.
- the simulated noise signal in the subtraction element 5 is converted by a optionally subtracted by a time ⁇ time-offset original signal x s + n in order to obtain the noise-corrected output signal y S.
- the subtraction of the noise signal from the original signal in the subtraction element 5 can be phase-adjusted.
- FIG. 5 A further embodiment is shown in Fig. 5, where the branched incoming TK signal x s + n + e in addition to speech and noise signals also contains echo signals.
- a device 1c for noise and echo replica also an echo signal e is input, which is further treated in a processing path parallel to the noise training path.
- the incoming original signal X s + n + e is first subjected to a windowing in a device 4a, then a fast Fourier transform FFT and the obtained frequency spectrum are buffered in a buffer 3a.
- the echo signal e in a device 4b is also subjected to a windowing and then Fourier-transformed.
- the frequency spectra of both paths are buffered in a buffer 3b and possibly subjected to averaging. Thereafter, a fast inverse Fourier transformation IFFT is performed separately on both paths.
- the simulated noise signal and the simulated echo signal are overlapped into a total signal y n + e to be subtracted, which is subtracted in the subtraction device 5 from the original signal x s + n + e delayed or delayed by a time ⁇ in order to record the noise and echo-reduced TK signal y s .
- FIGS. 6a to 6c show examples of noise signals calculated in the frequency domain according to the method of the invention.
- the noise signal to be reproduced has been obtained from a fast Fourier transformation FFT.
- the typical mirror symmetry can be seen around half the frequency value f s / 2.
- Fig. 6c shows the result of using a modified discrete Fourier transform with higher resolution, again processing only half of the frequency spectrum up to the frequency f s / 2.
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Noise Elimination (AREA)
- Mobile Radio Communication Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Plural Heterocyclic Compounds (AREA)
- Details Of Television Scanning (AREA)
- Diaphragms For Electromechanical Transducers (AREA)
Abstract
Description
Die Erfindung betrifft ein Verfahren zur Reduktion von Geräuschsignalen bei Telekommunikations(=TK)-Systemen für die Übertragung von akustischen Nutzsignalen, insbesondere menschlicher Sprache. The invention relates to a method for the reduction of noise signals in Telecommunication (= TK) systems for the transmission of acoustic Useful signals, in particular human speech.
Ein bekanntes Verfahren zur Geräuschreduktion ist die sogenannte "spektrale
Subtraktion", die beispielsweise in der Veröffentlichung "A new approach to
noise reduction based on auditory masking effects" von S. Gustafsson und P.
Jax, ITG-Fachtagung, Dresden, 1998, beschrieben ist. Dabei handelt es sich
um ein spektrales Geräuschabsenkungsverfahren, bei dem eine akustische
Verdeckungsschwelle (beispielsweise nach dem MPEG-Standard)
berücbsichtigtwird. Noch ein bekanntes Verfahren zum Geräuschredukten
wird in US.6 038 532 beschrieben.
Während einer natürlichen Kommunikation zwischen Menschen passt man in
der Regel die Amplitude der gesprochenen Sprache automatisch an die akustische
Umgebung an. Bei einer Sprachkommunikation zwischen entfernten Orten
jedoch befinden sich die Gesprächspartner nicht im selben akustischen Umfeld
und sind sich daher jeweils nicht der akustischen Situation am Ort des anderen
Gesprächspartners bewusst. Verstärkt tritt daher ein Problem auf, wenn einer
der Partner aufgrund seiner akustischen Umgebung gezwungen ist, sehr laut zu
sprechen, während der andere Partner in einer leisen akustischen Umgebung
Sprachsignale mit geringer Amplitude erzeugt.One known method for noise reduction is the so-called "spectral subtraction", which is described, for example, in the publication "A new approach to noise reduction based on auditory masking effects" by S. Gustafsson and P. Jax, ITG-Fachforum, Dresden, 1998 , This is a spectral noise reduction technique which takes into account an acoustic masking threshold (for example according to the MPEG standard). Another known method for noise reduction is described in
During natural communication between people, one usually adjusts the amplitude of the spoken language automatically to the acoustic environment. However, in the case of voice communication between remote locations, the call partners are not in the same acoustic environment and therefore are not aware of the acoustic situation at the other party's location. Therefore, a problem arises more intensively when one of the partners is forced to speak very loudly due to its acoustic environment, while the other partner generates low amplitude voice signals in a quiet acoustic environment.
Besonders verschärft ergeben sich Geräuschprobleme bei neueren Anwendungen von Kommunikationssystemen, wie beispielsweise Mobiltelefone, bei denen die Endgeräte derart klein gestaltet werden, dass eine unmittelbare räumliche Nachbarschaft zwischen Lautsprecher und Mikrofon nicht zu vermeiden ist. Aufgrund der direkten Schallübertragung, insbesondere durch Körperschall zwischen Lautsprecher und Mikrofon kann das akustische Störsignal in die gleiche Größenordnung kommen wie das Nutzsignal des Sprechers am jeweiligen Endgerät oder dieses sogar in der Amplitude übertreffen. Ein derartiges Geräuschproblem tritt auch bei mehreren räumlich benachbart angeordneten Endgeräten, beispielsweise in einem Büro- oder Konferenzraum mit vielen Telefonanschlüssen in nicht unerheblichem Umfang auf, da eine Kopplung von jedem Lautsprechersignal auf jedes Mikrofon erfolgt. Particularly exacerbated noise problems arise in newer applications of communication systems, such as mobile phones the terminals are designed so small that an immediate spatial proximity between speaker and microphone unavoidable is. Due to the direct sound transmission, in particular by structure-borne noise between speaker and microphone, the acoustic interference signal come in the same order of magnitude as the useful signal of the speaker on respective terminal or this even exceed in amplitude. Such a thing Noise problem also occurs with several spatially adjacent Terminals, for example in an office or conference room with many Telephone connections in a significant extent, since a coupling of every loudspeaker signal is sent to each microphone.
Hinzu kommt das Problem, dass auf einem TK-Kanal auch ein "elektronisch erzeugtes" Geräusch entsteht und als Hintergrund zum Nutzsignal mitübertragen wird. Um den Komfort beim Telefonieren zu erhöhen, ist man deshalb bestrebt, jede Art von Geräusch im Verhältnis zum Nutzsignal möglichst gering zu halten.In addition there is the problem that on a TK channel also an "electronic generated "noise arises and mitübertragen as background to the useful signal becomes. To increase the comfort of the phone, that's why you strives to minimize any kind of noise in relation to the useful signal to keep.
Schließlich ist man auch bestrebt, Störsignale wie unerwünschten Hintergrundlärm (Straßenlärm, Fabriklärm, Bürolärm, Kantinenlärm, Fluglärm etc.) zu reduzieren oder ganz zu unterdrücken.Finally, one also strives to noise such as unwanted background noise (Street noise, factory noise, office noise, canteen noise, aircraft noise, etc.) to reduce or completely suppress.
Bei dem bekannten Kompander-Verfahren, wie es beispielsweise in der DE 42 29 912 A1 beschrieben ist, wird der Grad der Geräuschabsenkung gemäß einer fest vorgegebenen Transferfunktion festgelegt. Der Kompander hat zunächst die Eigenschaft, Sprachsignale mit einem bestimmten (vorab eingestellten) "normalen Sprachsignalpegel" (ggf. normale Lautstärke genannt) praktisch unverändert von seinem Eingang zum Ausgang zu übertragen. Wird nun aber das Eingangssignal einmal zu laut, z.B. weil ein Sprecher zu dicht an sein Mikrofon kommt, so begrenzt ein Dynamik-Kompressor den Ausgangspegel auf nahezu den gleichen Wert wie im Normalfall, indem die aktuelle Verstärkung im Kompander mit zunehmender Eingangslautstärke linear abgesenkt wird. Durch diese Eigenschaft bleibt die Sprache am Ausgang des Kompandersystems etwa gleich laut - unabhängig davon wie stark die Eingangslautstärke schwankt. Wird nun andererseits ein Signal mit einem Pegel, der kleiner als der Normalpegel ist, auf den Eingang des Kompanders gegeben, so wird das Signal zusätzlich gedämpft, indem die Verstärkung zurückgeregelt wird, um Hintergrundgeräusche möglichst nur abgeschwächt zu übertragen. Der Kompander besteht somit aus zwei Teilfunktionen, einem Kompressor für Sprachsignalpegel, die größer oder gleich einem Normalpegel sind und einem Expander für Signalpegel, die kleiner als der Normalpegel sind. In the known compander method, as described for example in DE 42 29 912 A1 is described, the degree of noise reduction according to a fixed predetermined transfer function. The compander has first the property of voice signals with a specific (pre-set) "normal speech signal level" (possibly called normal volume) practical unchanged from its input to the output. But now once the input signal is too loud, e.g. because a speaker is too close Microphone comes, so limits a dynamic compressor to the output level almost the same value as normally, adding the current gain in the Kompander is linearly lowered with increasing input volume. By this property remains the language at the output of the compander system about the same - no matter how strong the input volume fluctuates. Now, on the other hand, a signal with a level that is smaller than the Normal level is given to the input of the compander, so will that Signal is additionally attenuated by the gain being back-regulated to If possible, transmit background noise only attenuated. Of the Kompander thus consists of two sub-functions, a compressor for Speech signal levels greater than or equal to a normal level and one Expander for signal levels lower than the normal level.
Bei der oben angesprochenen spektralen Subtraktion wird zu diesem Zweck zunächst das Geräusch in den Sprachpausen gemessen und in Form eines Leistungsdichtespektrums fortlaufend in einem Speicher abgelegt. Das Leistungsdichtespektrum wird über eine Fourier Transformation gewonnen. Beim Auftreten von Sprache wird das gespeicherte Geräuschspektrum "als bester aktueller Schätzwert" vom aktuellen gestörten Sprachspektrum subtrahiert, sodann in den Zeitbereich zurücktransformiert, um auf diese Weise eine Geräuschreduktion für das gestörte Signal zu erhalten.In the above-mentioned spectral subtraction is for this purpose First, the noise measured in the speech pauses and in the form of a Power density spectrum continuously stored in a memory. The power density spectrum is won over a Fourier transformation. At the Occurrence of speech, the stored sound spectrum "as the best current estimate "subtracted from the current disturbed speech spectrum, then transformed back into the time domain to create in this way a To obtain noise reduction for the disturbed signal.
Nachteilig bei derartigen Verfahren ist die aufwendige Bestimmung dieser akustischen Verdeckungsschwelle und die Ausführung aller mit diesem Verfahren verbundenen Rechenoperationen. Ein weiterer Nachteil der spektralen Subtraktion besteht darin, dass durch den Vorgang einer prinzipiell nicht genauen spektralen Geräuschschätzung und nachfolgender Subtraktion auch Fehler im Ausgangssignal auftreten, die sich als "musical tones" bemerkbar machen.A disadvantage of such methods is the complex determination of this acoustic Masking threshold and the execution of all with this procedure connected arithmetic operations. Another disadvantage of the spectral subtraction is that by the process of a basically inaccurate spectral noise estimation and subsequent subtraction also errors in the Output signal occur, which are noticeable as "musical tones".
Bei der erweiterten spektralen Signalbearbeitung, die ebenfalls in dem eingangs genannten Zitat beschrieben ist, werden zunächst mit Hilfe einer spektralen Subtraktion die Leistungsdichtespektren für das Geräusch und für die Sprache selbst geschätzt. Aus der Kenntnis dieser Teilspektren wird sodann mit Hilfe z.B. der Regeln aus dem MPEG Standard eine spektrale akustische Verdeckungsschwelle RT(f) für das menschliche Ohr berechnet. Mit Hilfe dieser Verdeckungsschwelle und den geschätzten Spektren für Geräusch und Sprache wird nach einer einfachen Regel eine Filterdurchlasskurve H(f) berechnet, die so gestaltet ist, dass wesentliche spektrale Teile der Sprache möglichst unverändert durchgelassen und spektrale Teile des Geräusches möglichst abgesenkt werden.In the extended spectral signal processing, which is also described in the citation mentioned above, first the power density spectra for the noise and for the speech itself are estimated by means of a spectral subtraction. From the knowledge of these partial spectra, a spectral acoustic masking threshold R T (f) for the human ear is then calculated using the rules from the MPEG standard, for example. With the help of this masking threshold and the estimated noise and speech spectra, a filter pass curve H (f) is calculated according to a simple rule, designed to let the essential spectral parts of the speech pass as unaltered as possible and reduce the spectral parts of the noise as much as possible.
Sodann wird das originale gestörte Sprachsignal nur durch dieses Filter gegeben, um auf diese Weise eine Geräuschreduktion für das gestörte Signal zu erhalten. Der Vorteil dieses Verfahrens besteht nun darin, dass vom gestörten Signal "Nichts addiert oder subtrahiert" wird und daher Fehler in den Schätzungen weniger bis kaum wahrnehmbar sind. Nachteilig ist wieder der erheblich größere Rechenaufwand.Then the original disturbed speech signal is given only by this filter, in this way, a noise reduction for the disturbed signal receive. The advantage of this method is that of the disturbed Signal "Nothing is added or subtracted" and therefore error in the estimates are less or hardly perceptible. The disadvantage is again the significant greater computational effort.
Von besonderem Nachteil bei allen diesen bekannten Verfahren ist die Tatsache, dass das eingehende Originalsignal bereits vor der eigentlichen Subtraktion eines wie auch immer nachgebildeten Geräuschsignals einem Signalbearbeitungsprozess unterworfen und damit prinzipiell verfälscht wird.Of particular disadvantage with all these known methods is the fact that the incoming original signal already before the actual subtraction a simulated sound signal anyway a signal processing process subject to and thus fundamentally falsified.
Aufgabe der vorliegenden Erfindung ist es demgegenüber, ein Verfahren möglichst geringer Komplexität mit den eingangs beschriebenen Merkmalen vorzustellen, bei dem in technisch unaufwendiger Art und Weise eine Geräuschabsenkung bzw. Geräuschunterdrückung erreicht wird, und bei der das Originalsignal bis zum eigentlichen Geräuschabzug unverfälscht erhalten bleibt. Dabei sollte das Verfahren mit einfachen Mitteln, insbesondere mit geringerem Rechenaufwand als bisher ermöglichen, einen für das menschliche Ohr möglichst angenehmen akustischen Gesamteindruck zu erzeugen, der je nach Geschmack an individuelle Bedürfnisse angepasst werden kann. Schließlich sollte das neue Verfahren völlig unabhängig von den Anforderungen für eine Sprachsignalverarbeitung durchgeführt werden können und damit eine einfache Optimierung auf die Erfordernisse der Spektralverarbeitung von Geräuschsignalen ermöglichen.Object of the present invention is in contrast, a method possible low complexity with the features described above, in a technically inexpensive way a noise reduction or noise suppression is achieved, and at the original signal remains untouched until the actual noise deduction. there The procedure should be simple, especially with less computational effort as far as possible, one for the human ear possible pleasant overall acoustic impression, depending on the taste can be adapted to individual needs. Finally, should the new method completely independent of the requirements for a voice signal processing can be performed and thus a simple optimization to the requirements of spectral processing of noise signals enable.
Erfindungsgemäß wird diese Aufgabe auf ebenso einfache wie wirkungsvolle
Art und Weise durch folgende Verfahrensschritte gelöst:
Das erfindungsgemäße Verfahren ermöglicht durch die getrennte Nachbildung des Geräuschsignals im Frequenzbereich unabhängig von einer Verarbeitung des originalen Sprachsignals einen direkten Abzug des nachgebildeten Geräuschsignals vom originalen, unverfälschten Eingangssignal, welches weder einer Fourier-Transformation noch einer inversen Fourier-Transformation unterworfen wird. Bei einer entsprechenden Phasenkorrektur im Frequenzbereich ist sogar eine Geräuschsubtraktion vom Originalsignal ohne Zeitverzögerung möglich. Dabei ist das erfindungsgemäße Verfahren weniger komplex als die oben geschilderten bekannten Verfahren aus dem Stand der Technik, erfordert geringere Rechenleistungen und führt zu einer besseren Frequenzauflösung.The inventive method made possible by the separate replica the noise signal in the frequency domain regardless of processing the original voice signal direct deduction of the replicated Noise signal from the original, unadulterated input signal, which neither a Fourier transform nor an inverse Fourier transform is subjected. With a corresponding phase correction in the frequency domain is even a noise subtraction from the original signal with no time delay possible. The inventive method is less complex as the above-described known prior art methods, requires less computing power and leads to better frequency resolution.
Durch die Abtrennung der Geräuschnachbildung von der Weitergabe des Originalsignals ermöglicht das erfindungsgemäße Verfahren in einer besonders bevorzugten Variante, dass in Schritt (d) nur ein ausgewählter Teil des erzeugten Frequenzspektrums zur Erzeugung des nachgebildeten Geräuschsignals verwendet wird. Damit kann die zur Durchführung des erfindungsgemäßen Verfahrens erforderliche Rechenleistung weiter minimiert bzw. das Verfahren selbst noch schneller durchgeführt werden.By separating the noise simulation from the transmission of the original signal allows the process of the invention in a particularly preferred Variant that in step (d) only a selected part of the generated Frequency spectrum used to generate the simulated noise signal becomes. Thus, the for carrying out the method according to the invention required computing power further minimized or the process itself be done even faster.
Eine Weiterbildung dieser Verfahrensvariante zeichnet sich dadurch aus, dass die Auswahl des zur Erzeugung des nachgebildeten Geräuschsignals verwendeten Teils des Frequenzspektrums nach Kriterien der Psychoakustik gemäß den Mittelwerten des Wahrnehmungs-spektrums des menschlichen Gehörs erfolgt.A development of this variant of the method is characterized in that the selection of the for generating the simulated noise signal used part of the frequency spectrum according to criteria of psychoacoustics according to the mean values of the perceptual spectrum of the human Hearing takes place.
Dabei wird der Wert für das nachzubildende Geräuschsignal nicht nur aus dem momentanen Leistungswert eines Originalsignals in Sprachpausen alleine, sondern auch aus einem gewichteten spektralen Verlauf des entsprechenden Signals bestimmt und insgesamt über die so gewonnene Funktion eine gehörrichtige, d.h. eine psychoakustisch angenehm klingende Geräuschreduktion erzielt.The value for the sound signal to be reproduced is not only from the instantaneous power value of an original signal in speech pauses alone, but also from a weighted spectral course of the corresponding signal determined and in total over the function thus gained a hearing-correct, i.e. Achieved a psychoacoustically pleasing-sounding noise reduction.
Da es kein einfach darstellbares Maß für eine akustisch angenehm klingende Geräuschreduktion gibt, sind alle Qualitätsbeurteilungen auf umfangreiche Gehörtests angewiesen, die anschließend mittels dafür optimierter statistischer Methoden ausgewertet werden, um einen Bewertungsmaßstab, (ähnlich wie bei Sprachcodecs) zu erhalten.Because it is not an easily reproducible measure of an acoustically pleasant sounding Noise reduction is there, all quality assessments are extensive Hearing tests dependent, which then optimized by means of statistical Methods are evaluated to a rating scale, (similar to Speech codecs).
Die grundlegenden Vorgehensweisen hierzu sind beispielsweise dem Lehrbuch von E. Zwicker, "Psychoakustik", Springer-Verlag Berlin, 1982, insbesondere Seiten 51-53 zu entnehmen.The basic procedures for this are, for example, the textbook by E. Zwicker, "Psychoacoustics", Springer-Verlag Berlin, 1982, in particular Pages 51-53.
Durch die psychoakustische Bewertung kann nicht nur die wahrnehmbare Qualität des Gesamtsignals optimiert werden, sondern es sind zudem auch noch weitere Einsparungen in der erforderlichen Rechenleistung möglich, wenn beispielsweise Maskiereffekte ausgenützt werden oder nur diejenigen Frequenzen Berücksichtigung finden, die eindeutig durch Geräusch- oder Störquellen verursacht wurden. Through the psychoacoustic evaluation can not only the perceptible quality the overall signal are optimized, but there are also still Further savings in the required computing power possible, for example Masking effects are exploited or only those frequencies Consideration that is clearly caused by sources of noise or interference were.
In einer alternativen Weiterbildung der obigen Verfahrensvariante erfolgt die Auswahl des zur Erzeugung des nachgebildeten Geräuschsignals verwendeten Teiles des Frequenzspektrums derart, dass nur diskrete Frequenzen des Spektrums betrachtet werden, und dass der Abstand der diskreten Frequenzen in Richtung höherer Frequenzen stetig größer, vorzugsweise nach einer logarithmischen Funktion gewählt wird. Damit ist die Frequenzauflösung an die Wahrnehmung des menschlichen Ohres besser angepasst.In an alternative development of the above method variant, the Selection of the signal used to generate the simulated noise signal Part of the frequency spectrum such that only discrete frequencies of the Spectrum are considered, and that the distance of the discrete frequencies steadily larger in the direction of higher frequencies, preferably after one logarithmic function is selected. This is the frequency resolution to the Perception of the human ear better adapted.
Weiter verbessert werden können diese Weiterbildungen dadurch, dass der ausgewählte Teil des Frequenzspektrums in vorher festgelegte Frequenzgruppen aufgeteilt wird, und dass in jeder Frequenzgruppe nur die Frequenz bzw. das Frequenzband mit der größten Signalenergie innerhalb der Frequenzgruppe selektiert und zur Erzeugung des nachgebildeten Geräuschsignals weiterverwendet wird. Mit dieser Selektion wird eine starke Reduzierung der zu berechnenden Frequenzen bei gleichbleibender hörbarer oder wahrnehmbarer Qualität erreicht, wodurch die Rechenleistung für das Verfahren weiter verringert und die Qualität des Ausgangssignals noch weiter erhöht wird.Can be further improved these developments in that the selected part of the frequency spectrum in predetermined frequency groups divided and that in each frequency group only the frequency or the frequency band with the largest signal energy within the frequency group selected and used to generate the simulated noise signal becomes. With this selection, a large reduction of the to be calculated Frequencies at a constant audible or perceptible Quality achieved, which further reduces the processing power for the process and the quality of the output signal is further increased.
Besonders vorteilhaft ist es, wenn die Selektion der Frequenz bzw. des Frequenzbandes mit der größten Signalenergie innerhalb der Frequenzgruppe vor Schritt (c) bzw. vor Schritt (d) erfolgt. Durch die Auswahl einer bestimmten Frequenz aus einer Frequenzgruppe sind Unterschiede in der Signalenergie besonders einfach detektierbar.It is particularly advantageous if the selection of the frequency or the frequency band with the largest signal energy within the frequency group Step (c) or before step (d) takes place. By selecting a specific frequency From a frequency group, differences in the signal energy are particularly easily detectable.
Vorteilhaft ist auch eine Verfahrensvariante, bei der in Schritt (b) das Frequenzspektrum des abgezweigten TK-Signals nur in einem vorgegebenen Frequenzbereich erzeugt wird. Sofern die Störquelle nur ein eingeschränktes Frequenzspektrum aufweist, kann mit dieser Maßnahme wiederum erhebliche Rechenleistung eingespart werden. Beispielsweise ist in Kraftfahrzeugen mit Störquellen in einem Frequenzbereich nur bis zu maximal 1 KHz zu rechnen, da das Störsignal in der Hauptsache durch niederfrequente Schallerzeugung (Motor, Getriebe, Rollgeräusche etc.) gebildet wird. Also advantageous is a method variant in which the frequency spectrum in step (b) the branched TK signal only in a predetermined frequency range is produced. If the source of interference only a limited frequency spectrum can, in turn, with this measure, considerable computing power be saved. For example, in motor vehicles with sources of interference in a frequency range only up to a maximum of 1 KHz to be expected, since the Interference signal mainly due to low-frequency sound generation (engine, Gear, rolling noise, etc.) is formed.
Besonders einfach ist eine Verfahrensvariante, die sich dadurch auszeichnet, dass in Schritt (b) und/oder in Schritt (d) eine diskrete Fourier-Transformation bzw. eine inverse diskrete Fourier-Transformation angewandt wird, wobei vom ankommenden TK-Signal zeitdiskrete Amplitudenwerte mit einer Abtastfrequenz fT abgetastet werden.Particularly simple is a method variant, which is characterized in that in step (b) and / or in step (d) a discrete Fourier transform or an inverse discrete Fourier transform is applied, wherein the incoming TK signal with discrete time amplitude values a sampling frequency f T are sampled.
In einer bevorzugten Weiterbildung der Verfahrensvariante wird in Schritt (b) eine schnelle Fourier-Transformation (= FFT) angewandt. Wenn ein großes Frequenzgebiet bei gleichzeitiger hoher Frequenzauflösung abgedeckt werden soll, lässt sich mit dieser Vorgehensweise die Analyse mit der geringsten Rechenleistung ausführen. Die FFT ist besonders dann sinnvoll, wenn beispielsweise mit mehr als 128 Frequenzlinien gerechnet werden muss.In a preferred embodiment of the method variant, in step (b) a fast Fourier transform (= FFT) is applied. If a large frequency area with simultaneous high frequency resolution, With this approach you can analyze with the lowest computing power To run. The FFT is particularly useful if, for example must be expected with more than 128 frequency lines.
Vorteilhafterweise kann in Schritt (d) eine inverse diskrete Fourier-Transformation (= IDFT) angewandt werden. Hierdurch lässt sich eine Signalsynthese mit der geringsten Rechenleistung ausführen, wenn ein ausgewähltes Spektrum bearbeitet wird, da der Nachteil einer äquidistanten Frequenzaufteilung bei der FFT vermieden wird. Die IDFT kann daher vorteilhaft für einen definierten Frequenzbereich angewendet werden. Die Verteilung der Frequenzen kann individuell erfolgen. Ab einer Frequenzauflösung von weniger als 128 Frequenzlinien ist eine Einsparung der Rechenleistung gegenüber der FFT möglich.Advantageously, in step (d) an inverse discrete Fourier transform (= IDFT). This allows a signal synthesis with Perform the least amount of processing if a selected spectrum is processed, since the disadvantage of an equidistant frequency distribution in the FFT is avoided. The IDFT can therefore be advantageous for a defined frequency range be applied. The distribution of frequencies can be individual respectively. From a frequency resolution of less than 128 frequency lines is a saving of the computing power compared to the FFT possible.
In der Applikation sind auch Einsparungen in der Rechenleistung oder Qualitätsverbesserungen erreichbar, wenn in Schritt (d) eine inverse schnelle Fourier-Transformation (=IFFT) angewandt wird. In Kombination mit einer FFT in Schritt (b) können breitbandige Störer besonders wirtschaftlich bearbeitet werden.In the application are also savings in computing power or quality improvements achievable if in step (d) an inverse fast Fourier transform (= IFFT) is applied. In combination with an FFT In step (b) broadband interferers can be processed particularly economically become.
Alternativ zur letztgenannten Verfahrensvariante ist eine Ausführungsform, bei der nur der Teil des erzeugten Frequenzspektrums ausgewählt wird, der unterhalb der halben Abtastfrequenz fT/2 liegt. Damit lassen sich wiederum Einsparungen in der Rechenleistung, aber auch im Speicherplatzaufwand erzielen.As an alternative to the latter method variant, an embodiment is selected in which only that part of the generated frequency spectrum which is below half the sampling frequency f T / 2. This in turn can be achieved in savings in computing power, but also in storage space.
Besonders vorteilhaft ist auch eine Variante des erfindungsgemäßen Verfahrens, bei der in Schritt (c) ein Frequenzspektrum zwischengespeichert wird, das durch eine Mittelung des aktuell in Schritt (b) erzeugten Frequenzspektrums mit vorher erzeugten Frequenzspektren gewonnen wird. Durch die Mittelung werden Spektrallinien mit großer Energie gefunden und Zufallswerte oder sporadische Fehler systematisch unterdrückt.Also particularly advantageous is a variant of the method according to the invention, wherein in step (c) a frequency spectrum is buffered, the by averaging the frequency spectrum currently generated in step (b) previously generated frequency spectra is obtained. By averaging Spectral lines found with great energy and random or sporadic Error systematically suppressed.
Dabei ist es besonders günstig, wenn die Mittelung mit unterschiedlicher relativer Wichtung des aktuell erzeugten Frequenzspektrums in unterschiedlichen Frequenzbereichen erfolgt. Allgemein kann mit derartigen unterschiedlichen Richtungen das natürliche Einschwingverhalten von Störern berücksichtigt werden. Beispielsweise kann sich die Drehzahl eines Motors in einem Kraftfahrzeug in der Regel nicht schlagartig ändern. Niederfrequente Störer haben eine höhere Einschwingzeit als hochfrequente. Die vorgeschlagene Wichtung hilft dabei, die Adaptivität eines Systems stabil und schnell zu machen.It is particularly advantageous if the averaging with different relative Weighting of the currently generated frequency spectrum in different Frequency ranges takes place. Generally, with such different Consider the natural transient response of interferers. For example, the speed of an engine in a motor vehicle usually not change abruptly. Low frequency interferers have one higher transient time than high frequency. The proposed weighting helps to make the adaptivity of a system stable and fast.
Dabei ist es wiederum besonders vorteilhaft, wenn die Wichtung nach Kriterien der Psychoakustik gemäß den Mittelwerten des Wahrnehmungsspektrums des menschlichen Gehörs erfolgt. Wie bereits oben diskutiert, werden bei der psychoakustischen Wichtung die frequenzabhängigen Einschwingzeiten dem menschlichen Hörempfinden angepasst. Dadurch erreicht man eine Optimierung des Systems hinsichtlich Natürlichkeit, Stabilität und Adaptionszeit.It is again particularly advantageous if the weighting according to criteria psychoacoustics according to the means of the perception spectrum of the human hearing. As discussed above, psychoacoustic Weighting the frequency dependent settling times to the adapted to human hearing. This achieves an optimization of the system in terms of naturalness, stability and adaptation time.
Um eine Überkompensation bei der Geräuschbehandlung zu vermeiden, wird bei einer besonders bevorzugten Variante des erfindungsgemäßen Verfahrens in Schritt (e) ein nach vorgegebenen Kriterien mit einem Wichtungsfaktor a < 1 gewichtetes nachgebildetes Geräuschsignal vom vom aktuell ankommenden TK-Signal abgezogen. To avoid overcompensation in the noise treatment is in a particularly preferred variant of the method according to the invention in step (e) according to predetermined criteria with a weighting factor a <1 weighted simulated noise signal from the currently arriving one TK signal deducted.
Bei einer vorteilhaften Weiterbildung wird der Wichtungsfaktor a als ein von Fehlern des TK-Systems abhängiger konstanter Wert gewählt. Dies ermöglicht eine kostengünstige und einfache Optimierung des erfindungsgemäßen Verfahrens an die Fehler des jeweiligen TK-Systems. Werden die Fehler automatisch erfasst, so kann die Wichtung auch während des Betriebs erfolgen.In an advantageous development, the weighting factor a is used as one of Faults of the TK system dependent constant value selected. this makes possible an inexpensive and simple optimization of the invention Procedure to the errors of the respective telecommunications system. The errors become automatic recorded, the weighting can also take place during operation.
Alternativ kann der Wichtungsfaktor a als ein nach einem vom Benutzer des TK-Systems wählbaren Qualitätsmaß einstellbarerer Wert gewählt werden. Ein derartiger vom Benutzer definierter Wichtungsfaktor ermöglicht eine individuelle, benutzerdefinierte Anpassung des erfindungsgemäßen Verfahrens an die individuellen Bedürfnisse. Wird das erfindungsgemäße System in ein vorhandenes übergeordnetes Konzept integriert, kann ein vom Benutzer bereitgestellter statistischer Wert, wie beispielsweise die Fehlerwahrscheinlichkeit oder Erkennungsrate zur Steuerung des Wichtungsfaktors herangezogen werden. Bei Anwendungen im Kraftfahrzeugbereich kann der Wichtungsfaktor beispielsweise auch aus der Drehzahl oder Geschwindigkeit abgeleitet werden.Alternatively, the weighting factor a may be determined as one after one by the user of the TK-Systems selectable quality level adjustable value can be selected. One such user-defined weighting factor allows an individual, custom adaptation of the method according to the invention to the individual Needs. Is the system of the invention in an existing integrated parent concept can be a user-provided statistical value, such as the error probability or recognition rate used to control the weighting factor. For applications in the automotive sector, the weighting factor, for example also be derived from the speed or speed.
Dies lässt sich dadurch weiterverbessern, dass der Wichtungsfaktor a adaptiv an das aktuelle ankommende TK-Signal angepasst wird. Die adaptive Gewichtung erlaubt eine automatische Optimierung der Geräuschminderung während des Betriebes. Der Gewichtungsfaktor kann von statistischen Werten wie Fehlerwahrscheinlichkeit, Mittelwert, Zustandsänderungen etc. abgeleitet werden. Mit der adaptiven Wichtung sind besonders einfache und schnelle Anpassungen des erfindungsgemäßen Verfahrens an individuelle Gegebenheiten in der akustischen Umgebung des TK-Endgeräts möglich.This can be further improved by the fact that the weighting factor a is adaptive is adapted to the current incoming TK signal. The adaptive weighting allows automatic optimization of noise reduction during of the operation. The weighting factor may vary from statistical values such as probability of error, Mean value, state changes, etc. are derived. With the adaptive weighting are particularly easy and quick adjustments of the inventive method to individual circumstances in the acoustic environment of the telecommunications terminal possible.
Eine weitere vorteilhafte Variante des erfindungsgemäßen Verfahrens zeichnet sich dadurch aus, dass dem in Schritt (d) erzeugten nachgebildeten Geräuschsignal vor Schritt (e) ein synthetisches Geräuschsignal beigemischt wird. Die Beimischung eines künstlichen Rauschsignals mit konstanter Leistungsdichte kann zur Maskierung von dynamischen, nicht-stationären Störern im Ausgangssignal dienen. A further advantageous variant of the method according to the invention is characterized characterized in that the simulated noise signal generated in step (d) before step (e) a synthetic noise signal is added. The Admixture of an artificial noise signal with constant power density can mask dynamic, non-stationary interferers in the output signal serve.
Eine weitere Variante des erfindungsgemäßen Verfahrens sieht vor, dass das aktuell ankommende TK-Signal vor Schritt (e) einer definierten Zeitverzögerung unterworfen wird, die vorzugsweise so ausgelegt ist, dass die Phasenlage des ankommenden TK-Signals mit der Phasenlage des nachgebildeten Geräuschsignals vor dem Abzug übereinstimmt.A further variant of the method according to the invention provides that the currently arriving TK signal before step (e) of a defined time delay is subjected, which is preferably designed so that the phase angle of the incoming TK signal with the phase position of the simulated noise signal matches before withdrawal.
Bei einer alternativen Verfahrensvariante ist vorgesehen, dass das aktuell ankommende TK-Signal unverzögert dem Abzug in Schritt (e) zugeführt wird, und dass das nachgebildete Geräuschsignal in seiner Phasenlage vor Schritt (e) an die Phasenlage des aktuell ankommenden TK-Signals angepasst wird. Wird die Phasenlage des reproduzierten Geräuschsignals im Frequenzbereich vor der Rücktransformation korrigiert, kann die Subtraktion vom unverzögerten Signal im Zeitbereich erfolgen. Störende Signalverzögerungen können somit entfallen. Diese treten zwangsläufig bei allen Verfahren auf, bei denen das Nutzsignal (Sprache) den Umweg über zwei Transformationen macht, wie beispielsweise bei der oben diskutierten bekannten spektralen Subtraktion.In an alternative variant of the method it is provided that the currently arriving TK signal is fed without delay to the trigger in step (e), and that the simulated noise signal in its phase position before step (e) to the phase angle of the currently arriving TK signal is adjusted. Will the Phase angle of the reproduced noise signal in the frequency range before Corrected inverse transformation, the subtraction from the instantaneous signal take place in the time domain. Disturbing signal delays can thus be dispensed with. These inevitably occur in all procedures in which the useful signal (Language) makes the detour via two transformations, such as in the known spectral subtraction discussed above.
Besonders bevorzugt ist eine Variante des erfindungsgemäßen Verfahrens, bei der zusätzlich zur Erkennung und Reduktion von Geräuschsignalen das Vorliegen von Echosignalen detektiert und/oder vorhergesagt wird und die Echosignale unterdrückt oder reduziert werden. Eine zusätzliche Echounterdrückung ist allerdings nur dann möglich, wenn das empfangene Originalsignal vom fernen TK-Teilnehmer zur Echoberechnung miteinbezogen wird. Dies bedeutet, dass die Geräuschreproduktion auch eine Echoreproduktion beinhaltet, die mit einem vom fernen TK-Teilnehmer ankommenden Signal verbunden ist.Particularly preferred is a variant of the method according to the invention in addition to the detection and reduction of noise signals presence echo signals are detected and / or predicted and the echo signals be suppressed or reduced. An additional echo cancellation is however, only possible if the received original signal from the remote TK participant is included in the echo calculation. This means that the noise reproduction also includes a echo reproduction that with a connected to the remote TK subscriber signal is connected.
Diese Verfahrensvariante kann dadurch verbessert werden, dass die Steuerung der Reduktion von Geräuschsignalen und der Reduktion von Echosignalen getrennt erfolgt. This process variant can be improved by the fact that the control the reduction of noise signals and the reduction of echo signals done separately.
Vorteilhaft ist es auch, wenn während der Zeitdauer einer Echo-Reduktion zum Nutzsignal zusätzlich ein künstliches Geräuschsignal addiert wird, wie es bereits oben näher diskutiert wurde, um den subjektiven Eindruck einer "toten Leitung" zu vermeiden.It is also advantageous if, during the period of an echo reduction to User signal in addition an artificial noise signal is added, as it already is discussed above to give the subjective impression of a "dead Line "to avoid.
Insbesondere kann das künstliche Geräuschsignal eine psychoakustisch als angenehm empfundene akustische Signalsequenz (=comfort noise) umfassen.In particular, the artificial noise signal may be psychoacoustically pleasing perceived acoustic signal sequence (= comfort noise) include.
Alternativ kann das künstliche Geräuschsignal ein zuvor während der aktuellen TK-Verbindung aufgezeichnetes Geräuschsignal umfassen, das die aktuelle akustische Umgebungssituation besonders "lebensecht" nachzubilden vermag.Alternatively, the artificial noise signal may be pre-selected during the current one TK connection recorded sound signal, which includes the current reproduce the acoustic environment particularly "lifelike".
In den Rahmen der vorliegenden Erfindung fällt auch eine Servereineit, eine Prozessor-Baugruppe sowie eine Gate-Array-Baugruppe zur Unterstützung des oben beschriebenen erfindungsgemäßen Verfahrens sowie ein Computerprogramm zur Durchführung des Verfahrens. Das Verfahren kann sowohl als Hardwareschaltung, als auch in Form eines Computerprogramms realisiert werden. Heutzutage wird eine Software-Programmierung für leistungsstarke DSP's bevorzugt, da neue Erkenntnisse und Zusatzfunktionen leichter durch eine Veränderung der Software auf bestehender Hardwarebasis implementierbar sind. Verfahren können aber auch als Hardwarebausteine beispielsweise in TK-Endgeräten oder Telefonanlagen implementiert werden.The scope of the present invention also includes a server line, a Processor assembly and a gate array assembly to support the method described above and a computer program to carry out the process. The method can be used both as a hardware circuit, as well as in the form of a computer program. Nowadays, software programming for powerful DSP's preferred because new knowledge and additional functions easier by a Modification of the software can be implemented on an existing hardware basis are. However, methods can also be used as hardware components, for example in TK terminals or telephone systems are implemented.
Weitere Vorteile der Erfindung ergeben sich aus der Beschreibung und der Zeichnung. Ebenso können die vorstehend genannten und die noch weiter aufgeführten Merkmale erfindungsgemäß jeweils einzeln für sich oder zu mehreren in beliebigen Kombinationen Verwendung finden. Die gezeigten und beschriebenen Ausführungsformen sind nicht als abschließende Aufzählung zu verstehen, sondern haben vielmehr beispielhaften Charakter für die Schilderung der Erfindung. Further advantages of the invention will become apparent from the description and the Drawing. Likewise, the above and those listed further Features according to the invention each individually or for several find use in any combination. The shown and described Embodiments are not to be exhaustive but rather have an exemplary character for the description the invention.
Die Erfindung ist in der Zeichnung dargestellt und wird anhand von Ausführungsbeispielen näher erläutert. Es zeigen:
- Fig. 1
- ein stark schematisiertes Diagramm der Funktionsweise einer Einrichtung zur Durchführung des erfindungsgemäßen Verfahrens;
- Fig. 2
- eine detailliertere schematische Darstellung einer Einrichtung zur Durchführung des erfindungsgemäßen Verfahrens;
- Fig. 3
- ein Schema für ein spektrales Subtraktionsverfahren nach dem Stand der Technik;
- Fig. 4
- eine Ausführungsform der Erfindung mit schneller Fourier-Transformation und schneller Rücktransformation sowie blockweise überlappender Bearbeitung des eingegebenen Zeitsignals im Frequenzbereich;
- Fig. 5
- Ein Schema einer Ausführungsform mit gleichzeitiger Echo-reduktion;
- Fig. 6a
- ein Beispiel eines mit FFT berechneten Geräuschsignals im Frequenzraum;
- Fig. 6b
- ein mit einer diskreten Fourier-Transformation und nur bis fs/2 berechneten Geräuschsignals; und
- Fig. 6c
- ein Geräuschsignal im Frequenzbereich bis fs/2 als Ergebnis einer modifizierten Fourier-Transformation mit höherer Auflösung.
- Fig. 1
- a highly schematic diagram of the operation of a device for carrying out the method according to the invention;
- Fig. 2
- a more detailed schematic representation of a device for carrying out the method according to the invention;
- Fig. 3
- a scheme for a spectral subtraction method according to the prior art;
- Fig. 4
- an embodiment of the invention with fast Fourier transform and fast back propagation and block overlapping processing of the input time signal in the frequency domain;
- Fig. 5
- A schematic of an embodiment with simultaneous echo reduction;
- Fig. 6a
- an example of a FFT calculated noise signal in frequency space;
- Fig. 6b
- a noise signal calculated with a discrete Fourier transform and only up to f s / 2; and
- Fig. 6c
- a noise signal in the frequency range up to f s / 2 as a result of a modified Fourier transform with higher resolution.
In Fig. 1 ist gezeigt, wie aus einem ankommenden Originalsignal x, welches
einen Sprachanteil s sowie einen Geräuschanteil n enthält, einerseits in einer
Einrichtung 1 ein Geräuschsignal yn im Frequenzbereich nachgebildet wird und
andererseits das Originalsignal xs+n getrennt von der Geräuschnachbildung
einer Geräuschsubtraktion zugeführt wird, wobei wahlweise eine Zeitverzöge-Zeitverzögerung
τ vorgenommen werden kann. Das geräuschreduzierte Signal ys wird dann
im TK-System weitergeleitet.In Fig. 1 it is shown how from an incoming original signal x, which contains a voice portion s and a noise n, on the one hand in a
In Fig. 2 ist eine einfache Ausführungsform gezeigt, bei der in der Einrichtung
1 a zur Geräuschnachbildung ein praktisch immer erforderlicher Sprachpausendetektor
2 vorgesehen ist, mit dem ermittelt wird, wann das eingehende
Signal Sprachsignale enthalten kann oder wann eine Sprachpause vorliegt.
Parallel dazu wird das eingehende TK-Signal einer Fourier-Transformation FT
zur Erzeugung eines Frequenzsprektrums unterworfen und das jeweils daraus
entstehende Frequenzspektrum in einem Zwischenspeicher 3 abgespeichert.
Die zeitlich nacheinander abgespeicherten Frequenzspektren können mit Hilfe
einer Einrichtung 4 einer Mittelwertbildung unterzogen werden.In Fig. 2, a simple embodiment is shown in which in the
Sobald der Sprachpausendetektor 2 feststellt, dass eine Sprachpause beendet
ist und im eingehenden Originalsignal auch Sprachsignale vorhanden sein können,
wird das letzte im Zwischenspeicher 3 abgespeicherte Frequenzspektrum
(ggf. gemittelt mit vorher aufgenommenen Spektren) einer inversen Fourier-Transformation
IFT unterworfen und in einem Subtraktionsglied 5 vom
Originalsignal, das ggf. einer Zeitverzögerung τ unterworfen wurde, abgezogen,
um ein geräuschbefreites oder zumindest geräuschreduziertes Signal zu erhalten.Once the
Im Gegensatz dazu wird bei bekannten Verfahren der spektralen Subtraktion das eingehende Originalsignal, wie in Fig. 3 dargestellt, direkt einer Fourier-Transformation FT unterzogen, ein nachgebildetes Geräuschsignal im Frequenzbereich in einem Subtraktionsglied 5' vom Fourier-transformierten Originalsignal abgezogen und das daraus entstehende neue, geräuschreduzierte Signal im Frequenzbereich einer inversen Fourier-Transformation In contrast, in known methods of spectral subtraction the incoming original signal, as shown in Fig. 3, directly a Fourier transform FT, a replicated noise signal in the frequency domain in a subtractor 5 'from the Fourier-transformed Original signal subtracted and the resulting new, noise-reduced Signal in the frequency domain of an inverse Fourier transform
IFT unterzogen und als geräuschreduziertes TK-Signal im Zeitbereich weitergeleitet. Es findet also bei den bekannten Verfahren im Stand der Technik grundsätzlich immer eine Veränderung des Originalsignals auch schon vor dem eigentlichen Geräuschabzug statt.IFT subjected and forwarded as a noise-reduced TK signal in the time domain. It thus finds in the known methods in the prior art basically always a change of the original signal even before actual sound reduction instead.
In Fig. 4 ist eine weitere Ausführungsform der Erfindung dargestellt, bei der das
zunächst im Zeitbereich eingehende Originalsignal xs+n in der Einrichtung 1 b zur
Geräuschnachbildung blockweise verarbeitet wird. Hierbei wird das Zeitsignal
vor der Transformation in den Frequenzbereich einer Fensterung (z.B. nach
Hamming) in einer entsprechend vorgeschalteten Vorrichtung 4' bzw. 4"
unterzogen. Um bei der Rücktransformation die durch die Fensterung
entstandenen Fehler zu kompensieren, wird neben der Verarbeitung in einem
ersten Pfad eine parallele Verarbeitung in einem weiteren Pfad mit der gleichen
Fensterung vorgenommen, wobei lediglich das Signal um die halbe
Fensterlänge versetzt ist und ansonsten das nachzubildende Geräuschsignal
mit den gleichen Mitteln berechnet wird, wodurch eine Kompensation der durch
die Fensterung erzeugten Fehler erreicht werden kann.FIG. 4 shows a further embodiment of the invention, in which the original signal x s + n, which is initially received in the time domain, is processed block-by-block in the
Im Einzelnen wird bei dem gezeigten Beispiel im ersten Pfad die Fensterung in
einer Vorrichtung 4' vorgenommen, danach das Zeitsignal einer schneller
Fourier-Transformation FFT unterworfen und das entstehende Spektrum in
einem Zwischenspeicher 3' gespeichert. Das Gleiche geschieht im zweiten Pfad
über eine Fenstervorrichtung 4" und eine Zwischenspeicherung des Fourier-transformierten
Signals in einem Zwischenspeicher 3". An die Zwischenspeicher
3', 3" schließt sich eine inverse schnelle Fourier-Transformation IFFT
jeweils an, und die daraus hervorgehenden Spektren im Zeitbereich werden in
einer Überlappeinrichtung 6 zu einem nachgebildeten Geräuschsignal Yn
zusammengeführt. Anschließend wird das nachgebildete Geräuschsignal wiederum
im Subtraktionsglied 5 von einem wahlweise um eine Zeit τ zeitversetzten
Originalsignal xs+n abgezogen, um das geräuschbereinigte Ausgangssignal
ys zu erhalten. Die Subtraktion des Geräuschsignals vom Originalsignal im
Subtraktionsglied 5 kann phasenangepasst erfolgen. Specifically, in the example shown, in the first path the windowing is performed in a device 4 ', then the time signal is subjected to a fast Fourier transformation FFT and the resulting spectrum is stored in an intermediate memory 3'. The same happens in the second path via a
Ein weiteres Ausführungsbeispiel ist in Fig. 5 dargestellt, wo das abgezweigte
eingehende TK-Signal xs+n+e neben Sprach- und Geräuschsignalen auch Echosignale
enthält. In einer Einrichtung 1c zur Geräusch- und Echonachbildung
wird außerdem ein Echosignal e eingegeben, welches in einem zum Geräuschnachbildungspfad
parallelen Verarbeitungspfad weiterbehandelt wird.A further embodiment is shown in Fig. 5, where the branched incoming TK signal x s + n + e in addition to speech and noise signals also contains echo signals. In a
Das eingehende Originalsignal Xs+n+e wird zunächst einer Fensterung in einer
Vorrichtung 4a unterzogen, danach einer schnellen Fourier-Transformation FFT
und das erhaltene Frequenzspektrum in einem Zwischenspeicher 3a zwischengespeichert.
Parallel dazu wird das Echosignal e in einer Vorrichtung 4b ebenfalls
einer Fensterung unterzogen und danach Fourier-transformiert. Die Frequenzspektren
beider Pfade werden in einen Zwischenspeicher 3b zwischengespeichert
und evtl. einer Mittelung unterzogen. Danach erfolgt auf beiden
Pfaden jeweils getrennt eine schnelle inverse Fourier-Transformation IFFT. In
einer Einrichtung 6a schließlich werden das nachgebildete Geräuschsignal und
das nachgebildete Echosignal zu einem abzuziehenden Gesamtsignal yn+e
überlappt, welches in der Subtraktionseinrichtung 5 von dem unveränderten
oder um eine Zeit τ verzögerten Originalsignal xs+n+e abgezogen wird, um das
geräusch- und echoreduzierte TK-Signal ys zu erhalten.The incoming original signal X s + n + e is first subjected to a windowing in a device 4a, then a fast Fourier transform FFT and the obtained frequency spectrum are buffered in a buffer 3a. In parallel, the echo signal e in a device 4b is also subjected to a windowing and then Fourier-transformed. The frequency spectra of both paths are buffered in a
Die Fign. 6a bis 6c schließlich zeigen Beispiele für nach dem erfindungsgemäßen Verfahren berechnete Geräuschsignale im Frequenzraum. Dabei ist bei dem Beispiel nach Fig. 6a das nachzubildende Geräuschsignal aus einer schnellen Fourier-Transformation FFT gewonnen worden. Man sieht die typische Spiegelsymmetrie um den halben Frequenzwert fs/2.The Fign. Finally, FIGS. 6a to 6c show examples of noise signals calculated in the frequency domain according to the method of the invention. In this case, in the example according to FIG. 6a, the noise signal to be reproduced has been obtained from a fast Fourier transformation FFT. The typical mirror symmetry can be seen around half the frequency value f s / 2.
Es reicht aber auch schon aus, wenn nur die erste Hälfte des nachgebildeten Geräuschsignals im Frequenzraum bis zur Frequenz fs/2 verwendet wird, was in Fig. 6b anhand eines Beispieles dargestellt ist, dessen Ergebnis mit Hilfe einer diskreten Fourier-Transformation erhalten wurde. However, it is also sufficient if only the first half of the simulated noise signal in the frequency space up to the frequency f s / 2 is used, which is illustrated in FIG. 6 b by means of an example whose result was obtained by means of a discrete Fourier transformation.
Fig. 6c schließlich zeigt das Ergebnis der Anwendung einer modifizierten diskreten Fourier-Transformation mit höherer Auflösung, wobei wiederum nur die Hälfte des Frequenzspektrums bis zur Frequenz fs/2 verarbeitet wird.Finally, Fig. 6c shows the result of using a modified discrete Fourier transform with higher resolution, again processing only half of the frequency spectrum up to the frequency f s / 2.
Claims (14)
- Process for reducing noise signals in telecommunications (TC) systems for the transmission of acoustic useful signals, in particular human speech, with the following steps:(a) Determining by means of speech pause detection when a speech signal is contained in the mixture of useful signals and interference signals to be transmitted, or when a speech pause is present;(b) Branching the incoming TC signal from the main signal path and using a Fourier transformation on the branched TC signal to generate a frequency spectrum of the branched TC signal;(c) Storing in a buffer memory (3) the last frequency spectrum recorded during the last speech pause;(d) Using an inverse Fourier transformation on the last respective recorded frequency spectrum to generate a simulated noise signal;(e) Subtracting the simulated noise signal in the time domain from the current incoming TC signal.
- Process according to Claim 1, characterised in that in step (d) only one selected part of the generated frequency spectrum is utilised for the generation of the simulated noise signal.
- Process according to Claim 2, characterised in that the selection of the part of the frequency spectrum used for the generation of the simulated noise signal is made in accordance with psycho-acoustic criteria implementing the mean values of the perception spectrum of the human ear.
- Process according to Claim 2, characterised in that the selection of the part of the frequency spectrum used for the generation of the simulated noise signal is made in such a way that only discrete frequencies of the spectrum are considered, and that the spacing between the discrete frequencies is made to steadily increase towards the higher frequencies and preferably in accordance with a logarithmic function.
- Process according to Claim 2, characterised in that the selected part of the frequency spectrum is divided into previously determined frequency groups, and that in each frequency group only the frequency or frequency band, respectively, having the highest signal energy within the frequency group is selected and further utilised for the generation of the simulated noise signal.
- Process according to Claim 5, characterised in that the selection of the frequency or frequency band, respectively, having the highest signal energy within the frequency group is made prior to step (c) or step (d), respectively.
- Process according to Claim 1, characterised in that in step (b) the frequency spectrum of the branched TC signal is generated only in a predetermined frequency band.
- Process according to Claim 1, characterised in that a frequency spectrum that is obtained by averaging the current frequency spectrum generated in step (b) and the previously generated frequency spectra, is temporarily stored in step (c).
- Process according to Claim 8, characterised in that the averaging with a different relative weighting of the currently generated frequency spectrum is realised in different frequency bands.
- Process according to Claim 9, characterised in that the weighting is realised in accordance with psycho-acoustic criteria implementing the mean values of the perception spectrum of the human ear.
- Process according to Claim 1, characterised in that a simulated noise signal weighted with a weighting factor a < 1 in accordance with predetermined criteria is subtracted from the current incoming TC signal in step (e).
- Process according to Claim 1, characterised in that prior to step (e) a synthetic noise signal is mixed with the simulated noise signal generated in step (d).
- Process according to Claim 1, characterised in that prior to step (e) the current incoming TC signal undergoes a specified time delay that is preferably designed so that the phase of the incoming TC signal coincides with the phase of the simulated noise signal prior to subtraction.
- Process according to Claim 1, characterised in that the current incoming TC signal is fed for immediate subtraction in step (e) and that prior to step (e) the phase of the simulated noise signal is matched to the phase of the current incoming TC signal.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10017646A DE10017646A1 (en) | 2000-04-08 | 2000-04-08 | Noise suppression in the time domain |
DE10017646 | 2000-04-08 |
Publications (3)
Publication Number | Publication Date |
---|---|
EP1143416A2 EP1143416A2 (en) | 2001-10-10 |
EP1143416A3 EP1143416A3 (en) | 2004-04-21 |
EP1143416B1 true EP1143416B1 (en) | 2005-11-16 |
Family
ID=7638139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP01440083A Expired - Lifetime EP1143416B1 (en) | 2000-04-08 | 2001-03-22 | Time domain noise reduction |
Country Status (8)
Country | Link |
---|---|
US (1) | US6801889B2 (en) |
EP (1) | EP1143416B1 (en) |
JP (1) | JP2001350498A (en) |
CN (1) | CN1225104C (en) |
AT (1) | ATE310305T1 (en) |
AU (1) | AU3336101A (en) |
DE (2) | DE10017646A1 (en) |
HU (1) | HUP0101288A2 (en) |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7117149B1 (en) * | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
US8019091B2 (en) | 2000-07-19 | 2011-09-13 | Aliphcom, Inc. | Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression |
US20030179888A1 (en) * | 2002-03-05 | 2003-09-25 | Burnett Gregory C. | Voice activity detection (VAD) devices and methods for use with noise suppression systems |
US9066186B2 (en) | 2003-01-30 | 2015-06-23 | Aliphcom | Light-based detection for acoustic applications |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US8073689B2 (en) * | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
US7895036B2 (en) * | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
US7725315B2 (en) * | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
US7949522B2 (en) * | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US7885420B2 (en) * | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US7340397B2 (en) * | 2003-03-03 | 2008-03-04 | International Business Machines Corporation | Speech recognition optimization tool |
US9099094B2 (en) | 2003-03-27 | 2015-08-04 | Aliphcom | Microphone array with rear venting |
DE10330286B4 (en) * | 2003-07-04 | 2005-08-18 | Infineon Technologies Ag | Method and apparatus for transmitting voice signals over a communications network |
JP4340686B2 (en) * | 2004-03-31 | 2009-10-07 | パイオニア株式会社 | Speech recognition apparatus and speech recognition method |
US20050254629A1 (en) * | 2004-05-14 | 2005-11-17 | China Zhu X | Measurement noise reduction for signal quality evaluation |
DE102004036154B3 (en) * | 2004-07-26 | 2005-12-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for robust classification of audio signals and method for setting up and operating an audio signal database and computer program |
US7716046B2 (en) * | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US8543390B2 (en) | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US7610196B2 (en) * | 2004-10-26 | 2009-10-27 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US7949520B2 (en) * | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US7680652B2 (en) | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8170879B2 (en) | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US8306821B2 (en) * | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US8284947B2 (en) * | 2004-12-01 | 2012-10-09 | Qnx Software Systems Limited | Reverberation estimation and suppression system |
US8027833B2 (en) | 2005-05-09 | 2011-09-27 | Qnx Software Systems Co. | System for suppressing passing tire hiss |
US7492814B1 (en) | 2005-06-09 | 2009-02-17 | The U.S. Government As Represented By The Director Of The National Security Agency | Method of removing noise and interference from signal using peak picking |
US7676046B1 (en) | 2005-06-09 | 2010-03-09 | The United States Of America As Represented By The Director Of The National Security Agency | Method of removing noise and interference from signal |
US8170875B2 (en) | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
US8311819B2 (en) * | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
US8233636B2 (en) | 2005-09-02 | 2012-07-31 | Nec Corporation | Method, apparatus, and computer program for suppressing noise |
US7599430B1 (en) * | 2006-02-10 | 2009-10-06 | Xilinx, Inc. | Fading channel modeling |
FR2899372B1 (en) * | 2006-04-03 | 2008-07-18 | Adeunis Rf Sa | WIRELESS AUDIO COMMUNICATION SYSTEM |
US7844453B2 (en) | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US8335685B2 (en) * | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
US8326620B2 (en) | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8904400B2 (en) | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
US8209514B2 (en) | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
WO2009140792A1 (en) * | 2008-05-21 | 2009-11-26 | Lin Han | Method and device for reducing audio frequency interference |
US8543061B2 (en) | 2011-05-03 | 2013-09-24 | Suhami Associates Ltd | Cellphone managed hearing eyeglasses |
EP2724340B1 (en) | 2011-07-07 | 2019-05-15 | Nuance Communications, Inc. | Single channel suppression of impulsive interferences in noisy speech signals |
FR2988549B1 (en) * | 2012-03-22 | 2015-06-26 | Bodysens | WIRELESS VOICE COMMUNICATION METHOD, TERMINAL AND HELMET WITH SELF SYNCHRONIZATION |
CA2995530C (en) | 2013-09-12 | 2018-07-24 | Saudi Arabian Oil Company | Dynamic threshold methods, systems, computer readable media, and program code for filtering noise and restoring attenuated high-frequency components of acoustic signals |
CN110265058B (en) | 2013-12-19 | 2023-01-17 | 瑞典爱立信有限公司 | Estimating background noise in an audio signal |
US9691378B1 (en) * | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
DE102017203469A1 (en) * | 2017-03-03 | 2018-09-06 | Robert Bosch Gmbh | A method and a device for noise removal of audio signals and a voice control of devices with this Störfreireiung |
CN110136733B (en) * | 2018-02-02 | 2021-05-25 | 腾讯科技(深圳)有限公司 | Method and device for dereverberating audio signal |
US10957342B2 (en) * | 2019-01-16 | 2021-03-23 | Cirrus Logic, Inc. | Noise cancellation |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU633673B2 (en) * | 1990-01-18 | 1993-02-04 | Matsushita Electric Industrial Co., Ltd. | Signal processing device |
DE4229912A1 (en) | 1992-09-08 | 1994-03-10 | Sel Alcatel Ag | Method for improving the transmission properties of an electroacoustic system |
US5903819A (en) * | 1996-03-13 | 1999-05-11 | Ericsson Inc. | Noise suppressor circuit and associated method for suppressing periodic interference component portions of a communication signal |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
US6175602B1 (en) * | 1998-05-27 | 2001-01-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by spectral subtraction using linear convolution and casual filtering |
US6122610A (en) * | 1998-09-23 | 2000-09-19 | Verance Corporation | Noise suppression for low bitrate speech coder |
US6507623B1 (en) * | 1999-04-12 | 2003-01-14 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by time-domain spectral subtraction |
US6523003B1 (en) * | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
-
2000
- 2000-04-08 DE DE10017646A patent/DE10017646A1/en not_active Withdrawn
-
2001
- 2001-03-22 DE DE50108051T patent/DE50108051D1/en not_active Expired - Lifetime
- 2001-03-22 AT AT01440083T patent/ATE310305T1/en not_active IP Right Cessation
- 2001-03-22 EP EP01440083A patent/EP1143416B1/en not_active Expired - Lifetime
- 2001-03-29 HU HU0101288A patent/HUP0101288A2/en unknown
- 2001-03-30 AU AU33361/01A patent/AU3336101A/en not_active Abandoned
- 2001-03-30 JP JP2001101112A patent/JP2001350498A/en not_active Withdrawn
- 2001-04-04 US US09/825,335 patent/US6801889B2/en not_active Expired - Lifetime
- 2001-04-06 CN CNB011163011A patent/CN1225104C/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6801889B2 (en) | 2004-10-05 |
JP2001350498A (en) | 2001-12-21 |
EP1143416A3 (en) | 2004-04-21 |
EP1143416A2 (en) | 2001-10-10 |
US20010028713A1 (en) | 2001-10-11 |
CN1225104C (en) | 2005-10-26 |
AU3336101A (en) | 2001-10-11 |
DE50108051D1 (en) | 2005-12-22 |
HU0101288D0 (en) | 2001-06-28 |
DE10017646A1 (en) | 2001-10-11 |
HUP0101288A2 (en) | 2001-12-28 |
CN1325222A (en) | 2001-12-05 |
ATE310305T1 (en) | 2005-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1143416B1 (en) | Time domain noise reduction | |
DE69428119T2 (en) | REDUCING BACKGROUND NOISE FOR LANGUAGE ENHANCEMENT | |
DE69409121T2 (en) | INTERFERENCE REDUCTION SYSTEM FOR A BINAURAL HEARING AID | |
DE60108401T2 (en) | SYSTEM FOR INCREASING LANGUAGE QUALITY | |
DE69827911T2 (en) | METHOD AND DEVICE FOR MULTI-CHANNEL COMPENSATION OF AN ACOUSTIC ECHO | |
DE69905035T2 (en) | NOISE REDUCTION BY SPECTRAL SUBTRACTION USING LINEAR FOLDING PRODUCT AND CAUSAL FILTERING | |
EP0912974B1 (en) | Method of reducing voice signal interference | |
DE60116255T2 (en) | NOISE REDUCTION DEVICE AND METHOD | |
DE602004004242T2 (en) | System and method for improving an audio signal | |
DE69931580T2 (en) | Identification of an acoustic arrangement by means of acoustic masking | |
DE60029453T2 (en) | Measuring the transmission quality of a telephone connection in a telecommunications network | |
EP2158588B1 (en) | Spectral smoothing method for noisy signals | |
EP0698986A2 (en) | Method for adaptive echo compensation | |
EP0747880B1 (en) | System for speech recognition | |
EP1103956B1 (en) | Exponential reduction of echo and noise during speech pauses | |
DE69731573T2 (en) | Noise reduction arrangement | |
DE112007003625T5 (en) | Echo cancellation device, echo cancellation system, echo cancellation method and computer program | |
DE60308336T2 (en) | METHOD AND SYSTEM FOR MEASURING THE TRANSMISSION QUALITY OF A SYSTEM | |
EP3454572A1 (en) | Method for detection of a defect in a listening instrument | |
EP1155561B1 (en) | Method and device for suppressing noise in telephone devices | |
EP1239455A2 (en) | Method and system for implementing a Fourier transformation which is adapted to the transfer function of human sensory organs, and systems for noise reduction and speech recognition based thereon | |
DE602004006912T2 (en) | A method for processing an acoustic signal and a hearing aid | |
EP1126687A2 (en) | Method for coordinated echo and/or noise reduction | |
DE10137348A1 (en) | Noise filtering method in voice communication apparatus, involves controlling overestimation factor and background noise variable in transfer function of wiener filter based on ratio of speech and noise signal | |
EP1351550B1 (en) | Method for adapting a signal amplification in a hearing aid and a hearing aid |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
AK | Designated contracting states |
Kind code of ref document: A2 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR |
|
AX | Request for extension of the european patent |
Free format text: AL;LT;LV;MK;RO;SI |
|
PUAL | Search report despatched |
Free format text: ORIGINAL CODE: 0009013 |
|
AK | Designated contracting states |
Kind code of ref document: A3 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR |
|
AX | Request for extension of the european patent |
Extension state: AL LT LV MK RO SI |
|
17P | Request for examination filed |
Effective date: 20040323 |
|
AKX | Designation fees paid |
Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR |
|
GRAP | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOSNIGR1 |
|
GRAS | Grant fee paid |
Free format text: ORIGINAL CODE: EPIDOSNIGR3 |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: IE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20051116 Ref country code: NL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20051116 Ref country code: FI Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20051116 |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: FG4D Free format text: NOT ENGLISH |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: EP |
|
GBT | Gb: translation of ep patent filed (gb section 77(6)(a)/1977) | ||
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FG4D Free format text: LANGUAGE OF EP DOCUMENT: GERMAN |
|
REF | Corresponds to: |
Ref document number: 50108051 Country of ref document: DE Date of ref document: 20051222 Kind code of ref document: P |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: GR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20060216 Ref country code: SE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20060216 Ref country code: DK Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20060216 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: ES Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20060227 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: AT Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20060322 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: CH Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20060331 Ref country code: BE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20060331 Ref country code: MC Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20060331 Ref country code: LU Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20060331 Ref country code: LI Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20060331 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: PT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20060417 |
|
NLV1 | Nl: lapsed or annulled due to failure to fulfill the requirements of art. 29p and 29m of the patents act | ||
ET | Fr: translation filed | ||
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FD4D |
|
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
26N | No opposition filed |
Effective date: 20060817 |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: PL |
|
BERE | Be: lapsed |
Owner name: ALCATEL Effective date: 20060331 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: TR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20051116 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: CY Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20051116 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: IT Payment date: 20110325 Year of fee payment: 11 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: IT Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20120322 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: GC Effective date: 20140717 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: RG Effective date: 20141016 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 15 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 16 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 17 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: FR Payment date: 20170322 Year of fee payment: 17 Ref country code: DE Payment date: 20170322 Year of fee payment: 17 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: GB Payment date: 20170322 Year of fee payment: 17 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R119 Ref document number: 50108051 Country of ref document: DE |
|
GBPC | Gb: european patent ceased through non-payment of renewal fee |
Effective date: 20180322 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: DE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20181002 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: GB Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20180322 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: FR Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20180331 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R082 Ref document number: 50108051 Country of ref document: DE Representative=s name: BARKHOFF REIMANN VOSSIUS, DE Ref country code: DE Ref legal event code: R081 Ref document number: 50108051 Country of ref document: DE Owner name: WSOU INVESTMENTS, LLC, LOS ANGELES, US Free format text: FORMER OWNER: ALCATEL LUCENT, PARIS, FR |