EP1143416B1

EP1143416B1 - Time domain noise reduction

Info

Publication number: EP1143416B1
Application number: EP01440083A
Authority: EP
Inventors: Michael Walker
Original assignee: Alcatel CIT SA; Alcatel SA
Current assignee: Alcatel CIT SA; Alcatel Lucent SAS
Priority date: 2000-04-08
Filing date: 2001-03-22
Publication date: 2005-11-16
Anticipated expiration: 2021-03-22
Also published as: US6801889B2; JP2001350498A; EP1143416A3; EP1143416A2; US20010028713A1; CN1225104C; AU3336101A; DE50108051D1; HU0101288D0; DE10017646A1; HUP0101288A2; CN1325222A; ATE310305T1

Abstract

A process for noise reduction during the transmission of acoustic useful signals includes the following steps of: (a) determining when a speech pause is present; (b) branching the incoming TC signal from the main signal path and utilizing a Fourier transformation to generate a frequency spectrum; (c) storing in a buffer memory (3) the last frequency spectrum recorded during the last speech pause; (d) using an inverse Fourier transformation on the respective last recorded frequency spectrum to generate a simulated noise signal; (e) subtracting the simulated noise signal in the time domain from the current incoming TC signal. As a result, the original signal is maintained uncorrupted up to the actual noise subtraction. With a simple arrangement and less computing effort than before, the process enables an overall acoustic impression to be produced, which is as agreeable as possible to the human ear and which can be matched to individual requirements. Simple optimization to the spectral processing requirements of noise signals can be realized independently of the voice signal processing requirements.

Description

Die Erfindung betrifft ein Verfahren zur Reduktion von Geräuschsignalen bei Telekommunikations(=TK)-Systemen für die Übertragung von akustischen Nutzsignalen, insbesondere menschlicher Sprache. The invention relates to a method for the reduction of noise signals in Telecommunication (= TK) systems for the transmission of acoustic Useful signals, in particular human speech.

Ein bekanntes Verfahren zur Geräuschreduktion ist die sogenannte "spektrale Subtraktion", die beispielsweise in der Veröffentlichung "A new approach to noise reduction based on auditory masking effects" von S. Gustafsson und P. Jax, ITG-Fachtagung, Dresden, 1998, beschrieben ist. Dabei handelt es sich um ein spektrales Geräuschabsenkungsverfahren, bei dem eine akustische Verdeckungsschwelle (beispielsweise nach dem MPEG-Standard) berücbsichtigtwird. Noch ein bekanntes Verfahren zum Geräuschredukten wird in US.6 038 532 beschrieben.
Während einer natürlichen Kommunikation zwischen Menschen passt man in der Regel die Amplitude der gesprochenen Sprache automatisch an die akustische Umgebung an. Bei einer Sprachkommunikation zwischen entfernten Orten jedoch befinden sich die Gesprächspartner nicht im selben akustischen Umfeld und sind sich daher jeweils nicht der akustischen Situation am Ort des anderen Gesprächspartners bewusst. Verstärkt tritt daher ein Problem auf, wenn einer der Partner aufgrund seiner akustischen Umgebung gezwungen ist, sehr laut zu sprechen, während der andere Partner in einer leisen akustischen Umgebung Sprachsignale mit geringer Amplitude erzeugt.One known method for noise reduction is the so-called "spectral subtraction", which is described, for example, in the publication "A new approach to noise reduction based on auditory masking effects" by S. Gustafsson and P. Jax, ITG-Fachforum, Dresden, 1998 , This is a spectral noise reduction technique which takes into account an acoustic masking threshold (for example according to the MPEG standard). Another known method for noise reduction is described in US 6 038 532.
During natural communication between people, one usually adjusts the amplitude of the spoken language automatically to the acoustic environment. However, in the case of voice communication between remote locations, the call partners are not in the same acoustic environment and therefore are not aware of the acoustic situation at the other party's location. Therefore, a problem arises more intensively when one of the partners is forced to speak very loudly due to its acoustic environment, while the other partner generates low amplitude voice signals in a quiet acoustic environment.

Besonders verschärft ergeben sich Geräuschprobleme bei neueren Anwendungen von Kommunikationssystemen, wie beispielsweise Mobiltelefone, bei denen die Endgeräte derart klein gestaltet werden, dass eine unmittelbare räumliche Nachbarschaft zwischen Lautsprecher und Mikrofon nicht zu vermeiden ist. Aufgrund der direkten Schallübertragung, insbesondere durch Körperschall zwischen Lautsprecher und Mikrofon kann das akustische Störsignal in die gleiche Größenordnung kommen wie das Nutzsignal des Sprechers am jeweiligen Endgerät oder dieses sogar in der Amplitude übertreffen. Ein derartiges Geräuschproblem tritt auch bei mehreren räumlich benachbart angeordneten Endgeräten, beispielsweise in einem Büro- oder Konferenzraum mit vielen Telefonanschlüssen in nicht unerheblichem Umfang auf, da eine Kopplung von jedem Lautsprechersignal auf jedes Mikrofon erfolgt. Particularly exacerbated noise problems arise in newer applications of communication systems, such as mobile phones the terminals are designed so small that an immediate spatial proximity between speaker and microphone unavoidable is. Due to the direct sound transmission, in particular by structure-borne noise between speaker and microphone, the acoustic interference signal come in the same order of magnitude as the useful signal of the speaker on respective terminal or this even exceed in amplitude. Such a thing Noise problem also occurs with several spatially adjacent Terminals, for example in an office or conference room with many Telephone connections in a significant extent, since a coupling of every loudspeaker signal is sent to each microphone.

Hinzu kommt das Problem, dass auf einem TK-Kanal auch ein "elektronisch erzeugtes" Geräusch entsteht und als Hintergrund zum Nutzsignal mitübertragen wird. Um den Komfort beim Telefonieren zu erhöhen, ist man deshalb bestrebt, jede Art von Geräusch im Verhältnis zum Nutzsignal möglichst gering zu halten.In addition there is the problem that on a TK channel also an "electronic generated "noise arises and mitübertragen as background to the useful signal becomes. To increase the comfort of the phone, that's why you strives to minimize any kind of noise in relation to the useful signal to keep.

Schließlich ist man auch bestrebt, Störsignale wie unerwünschten Hintergrundlärm (Straßenlärm, Fabriklärm, Bürolärm, Kantinenlärm, Fluglärm etc.) zu reduzieren oder ganz zu unterdrücken.Finally, one also strives to noise such as unwanted background noise (Street noise, factory noise, office noise, canteen noise, aircraft noise, etc.) to reduce or completely suppress.

Bei dem bekannten Kompander-Verfahren, wie es beispielsweise in der DE 42 29 912 A1 beschrieben ist, wird der Grad der Geräuschabsenkung gemäß einer fest vorgegebenen Transferfunktion festgelegt. Der Kompander hat zunächst die Eigenschaft, Sprachsignale mit einem bestimmten (vorab eingestellten) "normalen Sprachsignalpegel" (ggf. normale Lautstärke genannt) praktisch unverändert von seinem Eingang zum Ausgang zu übertragen. Wird nun aber das Eingangssignal einmal zu laut, z.B. weil ein Sprecher zu dicht an sein Mikrofon kommt, so begrenzt ein Dynamik-Kompressor den Ausgangspegel auf nahezu den gleichen Wert wie im Normalfall, indem die aktuelle Verstärkung im Kompander mit zunehmender Eingangslautstärke linear abgesenkt wird. Durch diese Eigenschaft bleibt die Sprache am Ausgang des Kompandersystems etwa gleich laut - unabhängig davon wie stark die Eingangslautstärke schwankt. Wird nun andererseits ein Signal mit einem Pegel, der kleiner als der Normalpegel ist, auf den Eingang des Kompanders gegeben, so wird das Signal zusätzlich gedämpft, indem die Verstärkung zurückgeregelt wird, um Hintergrundgeräusche möglichst nur abgeschwächt zu übertragen. Der Kompander besteht somit aus zwei Teilfunktionen, einem Kompressor für Sprachsignalpegel, die größer oder gleich einem Normalpegel sind und einem Expander für Signalpegel, die kleiner als der Normalpegel sind. In the known compander method, as described for example in DE 42 29 912 A1 is described, the degree of noise reduction according to a fixed predetermined transfer function. The compander has first the property of voice signals with a specific (pre-set) "normal speech signal level" (possibly called normal volume) practical unchanged from its input to the output. But now once the input signal is too loud, e.g. because a speaker is too close Microphone comes, so limits a dynamic compressor to the output level almost the same value as normally, adding the current gain in the Kompander is linearly lowered with increasing input volume. By this property remains the language at the output of the compander system about the same - no matter how strong the input volume fluctuates. Now, on the other hand, a signal with a level that is smaller than the Normal level is given to the input of the compander, so will that Signal is additionally attenuated by the gain being back-regulated to If possible, transmit background noise only attenuated. Of the Kompander thus consists of two sub-functions, a compressor for Speech signal levels greater than or equal to a normal level and one Expander for signal levels lower than the normal level.

Bei der oben angesprochenen spektralen Subtraktion wird zu diesem Zweck zunächst das Geräusch in den Sprachpausen gemessen und in Form eines Leistungsdichtespektrums fortlaufend in einem Speicher abgelegt. Das Leistungsdichtespektrum wird über eine Fourier Transformation gewonnen. Beim Auftreten von Sprache wird das gespeicherte Geräuschspektrum "als bester aktueller Schätzwert" vom aktuellen gestörten Sprachspektrum subtrahiert, sodann in den Zeitbereich zurücktransformiert, um auf diese Weise eine Geräuschreduktion für das gestörte Signal zu erhalten.In the above-mentioned spectral subtraction is for this purpose First, the noise measured in the speech pauses and in the form of a Power density spectrum continuously stored in a memory. The power density spectrum is won over a Fourier transformation. At the Occurrence of speech, the stored sound spectrum "as the best current estimate "subtracted from the current disturbed speech spectrum, then transformed back into the time domain to create in this way a To obtain noise reduction for the disturbed signal.

Nachteilig bei derartigen Verfahren ist die aufwendige Bestimmung dieser akustischen Verdeckungsschwelle und die Ausführung aller mit diesem Verfahren verbundenen Rechenoperationen. Ein weiterer Nachteil der spektralen Subtraktion besteht darin, dass durch den Vorgang einer prinzipiell nicht genauen spektralen Geräuschschätzung und nachfolgender Subtraktion auch Fehler im Ausgangssignal auftreten, die sich als "musical tones" bemerkbar machen.A disadvantage of such methods is the complex determination of this acoustic Masking threshold and the execution of all with this procedure connected arithmetic operations. Another disadvantage of the spectral subtraction is that by the process of a basically inaccurate spectral noise estimation and subsequent subtraction also errors in the Output signal occur, which are noticeable as "musical tones".

Bei der erweiterten spektralen Signalbearbeitung, die ebenfalls in dem eingangs genannten Zitat beschrieben ist, werden zunächst mit Hilfe einer spektralen Subtraktion die Leistungsdichtespektren für das Geräusch und für die Sprache selbst geschätzt. Aus der Kenntnis dieser Teilspektren wird sodann mit Hilfe z.B. der Regeln aus dem MPEG Standard eine spektrale akustische Verdeckungsschwelle R_T(f) für das menschliche Ohr berechnet. Mit Hilfe dieser Verdeckungsschwelle und den geschätzten Spektren für Geräusch und Sprache wird nach einer einfachen Regel eine Filterdurchlasskurve H(f) berechnet, die so gestaltet ist, dass wesentliche spektrale Teile der Sprache möglichst unverändert durchgelassen und spektrale Teile des Geräusches möglichst abgesenkt werden.In the extended spectral signal processing, which is also described in the citation mentioned above, first the power density spectra for the noise and for the speech itself are estimated by means of a spectral subtraction. From the knowledge of these partial spectra, a spectral acoustic masking threshold R _T (f) for the human ear is then calculated using the rules from the MPEG standard, for example. With the help of this masking threshold and the estimated noise and speech spectra, a filter pass curve H (f) is calculated according to a simple rule, designed to let the essential spectral parts of the speech pass as unaltered as possible and reduce the spectral parts of the noise as much as possible.

Sodann wird das originale gestörte Sprachsignal nur durch dieses Filter gegeben, um auf diese Weise eine Geräuschreduktion für das gestörte Signal zu erhalten. Der Vorteil dieses Verfahrens besteht nun darin, dass vom gestörten Signal "Nichts addiert oder subtrahiert" wird und daher Fehler in den Schätzungen weniger bis kaum wahrnehmbar sind. Nachteilig ist wieder der erheblich größere Rechenaufwand.Then the original disturbed speech signal is given only by this filter, in this way, a noise reduction for the disturbed signal receive. The advantage of this method is that of the disturbed Signal "Nothing is added or subtracted" and therefore error in the estimates are less or hardly perceptible. The disadvantage is again the significant greater computational effort.

Von besonderem Nachteil bei allen diesen bekannten Verfahren ist die Tatsache, dass das eingehende Originalsignal bereits vor der eigentlichen Subtraktion eines wie auch immer nachgebildeten Geräuschsignals einem Signalbearbeitungsprozess unterworfen und damit prinzipiell verfälscht wird.Of particular disadvantage with all these known methods is the fact that the incoming original signal already before the actual subtraction a simulated sound signal anyway a signal processing process subject to and thus fundamentally falsified.

Aufgabe der vorliegenden Erfindung ist es demgegenüber, ein Verfahren möglichst geringer Komplexität mit den eingangs beschriebenen Merkmalen vorzustellen, bei dem in technisch unaufwendiger Art und Weise eine Geräuschabsenkung bzw. Geräuschunterdrückung erreicht wird, und bei der das Originalsignal bis zum eigentlichen Geräuschabzug unverfälscht erhalten bleibt. Dabei sollte das Verfahren mit einfachen Mitteln, insbesondere mit geringerem Rechenaufwand als bisher ermöglichen, einen für das menschliche Ohr möglichst angenehmen akustischen Gesamteindruck zu erzeugen, der je nach Geschmack an individuelle Bedürfnisse angepasst werden kann. Schließlich sollte das neue Verfahren völlig unabhängig von den Anforderungen für eine Sprachsignalverarbeitung durchgeführt werden können und damit eine einfache Optimierung auf die Erfordernisse der Spektralverarbeitung von Geräuschsignalen ermöglichen.Object of the present invention is in contrast, a method possible low complexity with the features described above, in a technically inexpensive way a noise reduction or noise suppression is achieved, and at the original signal remains untouched until the actual noise deduction. there The procedure should be simple, especially with less computational effort as far as possible, one for the human ear possible pleasant overall acoustic impression, depending on the taste can be adapted to individual needs. Finally, should the new method completely independent of the requirements for a voice signal processing can be performed and thus a simple optimization to the requirements of spectral processing of noise signals enable.

Erfindungsgemäß wird diese Aufgabe auf ebenso einfache wie wirkungsvolle Art und Weise durch folgende Verfahrensschritte gelöst:

(a) Feststellen mittels Sprach-Pausen-Detektion, wann in der zu übertragenden Mischung aus Nutzsignalen und Störsignalen ein Sprachsignal enthalten ist oder wann eine Sprachpause vorliegt;

(b) Abzweigen des ankommenden TK-Signals von Hauptsignalpfad und Anwenden einer Fourier-Transformation auf das abgezweigte TK-Signal zur Erzeugung eines Frequenzspektrums des abgezweigten TK-Signals;

(c) Speichern des letzten während der letzten Sprachpause aufgenommenen Frequenzspektrums in einem Zwischenspeicher;

(d) Anwenden einer inversen Fourier-Transformation auf das jeweils letzte aufgenommenen Frequenzspektrum zur Erzeugung eines nachgebildeten Geräuschsignals;

(e) Abziehen des nachgebildeten Geräuschsignals im Zeitbereich vom aktuell ankommenden TK-Signal.

According to the invention this object is achieved in a simple yet effective manner by the following method steps:

(A) detecting by means of speech pause detection, when in the mixture of useful signals and interference signals to be transmitted a speech signal is included or when there is a speech break;

(b) branching the incoming TK signal from the main signal path and applying a Fourier transform to the branched TK signal to produce a frequency spectrum of the branched TK signal;

(c) storing the last frequency spectrum recorded during the last speech break in a buffer;

(d) applying an inverse Fourier transform to the latest recorded frequency spectrum to produce a replicated noise signal;

(e) subtracting the simulated noise signal in the time domain from the currently arriving TK signal.

Das erfindungsgemäße Verfahren ermöglicht durch die getrennte Nachbildung des Geräuschsignals im Frequenzbereich unabhängig von einer Verarbeitung des originalen Sprachsignals einen direkten Abzug des nachgebildeten Geräuschsignals vom originalen, unverfälschten Eingangssignal, welches weder einer Fourier-Transformation noch einer inversen Fourier-Transformation unterworfen wird. Bei einer entsprechenden Phasenkorrektur im Frequenzbereich ist sogar eine Geräuschsubtraktion vom Originalsignal ohne Zeitverzögerung möglich. Dabei ist das erfindungsgemäße Verfahren weniger komplex als die oben geschilderten bekannten Verfahren aus dem Stand der Technik, erfordert geringere Rechenleistungen und führt zu einer besseren Frequenzauflösung.The inventive method made possible by the separate replica the noise signal in the frequency domain regardless of processing the original voice signal direct deduction of the replicated Noise signal from the original, unadulterated input signal, which neither a Fourier transform nor an inverse Fourier transform is subjected. With a corresponding phase correction in the frequency domain is even a noise subtraction from the original signal with no time delay possible. The inventive method is less complex as the above-described known prior art methods, requires less computing power and leads to better frequency resolution.

Durch die Abtrennung der Geräuschnachbildung von der Weitergabe des Originalsignals ermöglicht das erfindungsgemäße Verfahren in einer besonders bevorzugten Variante, dass in Schritt (d) nur ein ausgewählter Teil des erzeugten Frequenzspektrums zur Erzeugung des nachgebildeten Geräuschsignals verwendet wird. Damit kann die zur Durchführung des erfindungsgemäßen Verfahrens erforderliche Rechenleistung weiter minimiert bzw. das Verfahren selbst noch schneller durchgeführt werden.By separating the noise simulation from the transmission of the original signal allows the process of the invention in a particularly preferred Variant that in step (d) only a selected part of the generated Frequency spectrum used to generate the simulated noise signal becomes. Thus, the for carrying out the method according to the invention required computing power further minimized or the process itself be done even faster.

Eine Weiterbildung dieser Verfahrensvariante zeichnet sich dadurch aus, dass die Auswahl des zur Erzeugung des nachgebildeten Geräuschsignals verwendeten Teils des Frequenzspektrums nach Kriterien der Psychoakustik gemäß den Mittelwerten des Wahrnehmungs-spektrums des menschlichen Gehörs erfolgt.A development of this variant of the method is characterized in that the selection of the for generating the simulated noise signal used part of the frequency spectrum according to criteria of psychoacoustics according to the mean values of the perceptual spectrum of the human Hearing takes place.

Dabei wird der Wert für das nachzubildende Geräuschsignal nicht nur aus dem momentanen Leistungswert eines Originalsignals in Sprachpausen alleine, sondern auch aus einem gewichteten spektralen Verlauf des entsprechenden Signals bestimmt und insgesamt über die so gewonnene Funktion eine gehörrichtige, d.h. eine psychoakustisch angenehm klingende Geräuschreduktion erzielt.The value for the sound signal to be reproduced is not only from the instantaneous power value of an original signal in speech pauses alone, but also from a weighted spectral course of the corresponding signal determined and in total over the function thus gained a hearing-correct, i.e. Achieved a psychoacoustically pleasing-sounding noise reduction.

Da es kein einfach darstellbares Maß für eine akustisch angenehm klingende Geräuschreduktion gibt, sind alle Qualitätsbeurteilungen auf umfangreiche Gehörtests angewiesen, die anschließend mittels dafür optimierter statistischer Methoden ausgewertet werden, um einen Bewertungsmaßstab, (ähnlich wie bei Sprachcodecs) zu erhalten.Because it is not an easily reproducible measure of an acoustically pleasant sounding Noise reduction is there, all quality assessments are extensive Hearing tests dependent, which then optimized by means of statistical Methods are evaluated to a rating scale, (similar to Speech codecs).

Die grundlegenden Vorgehensweisen hierzu sind beispielsweise dem Lehrbuch von E. Zwicker, "Psychoakustik", Springer-Verlag Berlin, 1982, insbesondere Seiten 51-53 zu entnehmen.The basic procedures for this are, for example, the textbook by E. Zwicker, "Psychoacoustics", Springer-Verlag Berlin, 1982, in particular Pages 51-53.

Durch die psychoakustische Bewertung kann nicht nur die wahrnehmbare Qualität des Gesamtsignals optimiert werden, sondern es sind zudem auch noch weitere Einsparungen in der erforderlichen Rechenleistung möglich, wenn beispielsweise Maskiereffekte ausgenützt werden oder nur diejenigen Frequenzen Berücksichtigung finden, die eindeutig durch Geräusch- oder Störquellen verursacht wurden. Through the psychoacoustic evaluation can not only the perceptible quality the overall signal are optimized, but there are also still Further savings in the required computing power possible, for example Masking effects are exploited or only those frequencies Consideration that is clearly caused by sources of noise or interference were.

In einer alternativen Weiterbildung der obigen Verfahrensvariante erfolgt die Auswahl des zur Erzeugung des nachgebildeten Geräuschsignals verwendeten Teiles des Frequenzspektrums derart, dass nur diskrete Frequenzen des Spektrums betrachtet werden, und dass der Abstand der diskreten Frequenzen in Richtung höherer Frequenzen stetig größer, vorzugsweise nach einer logarithmischen Funktion gewählt wird. Damit ist die Frequenzauflösung an die Wahrnehmung des menschlichen Ohres besser angepasst.In an alternative development of the above method variant, the Selection of the signal used to generate the simulated noise signal Part of the frequency spectrum such that only discrete frequencies of the Spectrum are considered, and that the distance of the discrete frequencies steadily larger in the direction of higher frequencies, preferably after one logarithmic function is selected. This is the frequency resolution to the Perception of the human ear better adapted.

Weiter verbessert werden können diese Weiterbildungen dadurch, dass der ausgewählte Teil des Frequenzspektrums in vorher festgelegte Frequenzgruppen aufgeteilt wird, und dass in jeder Frequenzgruppe nur die Frequenz bzw. das Frequenzband mit der größten Signalenergie innerhalb der Frequenzgruppe selektiert und zur Erzeugung des nachgebildeten Geräuschsignals weiterverwendet wird. Mit dieser Selektion wird eine starke Reduzierung der zu berechnenden Frequenzen bei gleichbleibender hörbarer oder wahrnehmbarer Qualität erreicht, wodurch die Rechenleistung für das Verfahren weiter verringert und die Qualität des Ausgangssignals noch weiter erhöht wird.Can be further improved these developments in that the selected part of the frequency spectrum in predetermined frequency groups divided and that in each frequency group only the frequency or the frequency band with the largest signal energy within the frequency group selected and used to generate the simulated noise signal becomes. With this selection, a large reduction of the to be calculated Frequencies at a constant audible or perceptible Quality achieved, which further reduces the processing power for the process and the quality of the output signal is further increased.

Besonders vorteilhaft ist es, wenn die Selektion der Frequenz bzw. des Frequenzbandes mit der größten Signalenergie innerhalb der Frequenzgruppe vor Schritt (c) bzw. vor Schritt (d) erfolgt. Durch die Auswahl einer bestimmten Frequenz aus einer Frequenzgruppe sind Unterschiede in der Signalenergie besonders einfach detektierbar.It is particularly advantageous if the selection of the frequency or the frequency band with the largest signal energy within the frequency group Step (c) or before step (d) takes place. By selecting a specific frequency From a frequency group, differences in the signal energy are particularly easily detectable.

Vorteilhaft ist auch eine Verfahrensvariante, bei der in Schritt (b) das Frequenzspektrum des abgezweigten TK-Signals nur in einem vorgegebenen Frequenzbereich erzeugt wird. Sofern die Störquelle nur ein eingeschränktes Frequenzspektrum aufweist, kann mit dieser Maßnahme wiederum erhebliche Rechenleistung eingespart werden. Beispielsweise ist in Kraftfahrzeugen mit Störquellen in einem Frequenzbereich nur bis zu maximal 1 KHz zu rechnen, da das Störsignal in der Hauptsache durch niederfrequente Schallerzeugung (Motor, Getriebe, Rollgeräusche etc.) gebildet wird. Also advantageous is a method variant in which the frequency spectrum in step (b) the branched TK signal only in a predetermined frequency range is produced. If the source of interference only a limited frequency spectrum can, in turn, with this measure, considerable computing power be saved. For example, in motor vehicles with sources of interference in a frequency range only up to a maximum of 1 KHz to be expected, since the Interference signal mainly due to low-frequency sound generation (engine, Gear, rolling noise, etc.) is formed.

Besonders einfach ist eine Verfahrensvariante, die sich dadurch auszeichnet, dass in Schritt (b) und/oder in Schritt (d) eine diskrete Fourier-Transformation bzw. eine inverse diskrete Fourier-Transformation angewandt wird, wobei vom ankommenden TK-Signal zeitdiskrete Amplitudenwerte mit einer Abtastfrequenz f_T abgetastet werden.Particularly simple is a method variant, which is characterized in that in step (b) and / or in step (d) a discrete Fourier transform or an inverse discrete Fourier transform is applied, wherein the incoming TK signal with discrete time amplitude values a sampling frequency f _{T are} sampled.

In einer bevorzugten Weiterbildung der Verfahrensvariante wird in Schritt (b) eine schnelle Fourier-Transformation (= FFT) angewandt. Wenn ein großes Frequenzgebiet bei gleichzeitiger hoher Frequenzauflösung abgedeckt werden soll, lässt sich mit dieser Vorgehensweise die Analyse mit der geringsten Rechenleistung ausführen. Die FFT ist besonders dann sinnvoll, wenn beispielsweise mit mehr als 128 Frequenzlinien gerechnet werden muss.In a preferred embodiment of the method variant, in step (b) a fast Fourier transform (= FFT) is applied. If a large frequency area with simultaneous high frequency resolution, With this approach you can analyze with the lowest computing power To run. The FFT is particularly useful if, for example must be expected with more than 128 frequency lines.

Vorteilhafterweise kann in Schritt (d) eine inverse diskrete Fourier-Transformation (= IDFT) angewandt werden. Hierdurch lässt sich eine Signalsynthese mit der geringsten Rechenleistung ausführen, wenn ein ausgewähltes Spektrum bearbeitet wird, da der Nachteil einer äquidistanten Frequenzaufteilung bei der FFT vermieden wird. Die IDFT kann daher vorteilhaft für einen definierten Frequenzbereich angewendet werden. Die Verteilung der Frequenzen kann individuell erfolgen. Ab einer Frequenzauflösung von weniger als 128 Frequenzlinien ist eine Einsparung der Rechenleistung gegenüber der FFT möglich.Advantageously, in step (d) an inverse discrete Fourier transform (= IDFT). This allows a signal synthesis with Perform the least amount of processing if a selected spectrum is processed, since the disadvantage of an equidistant frequency distribution in the FFT is avoided. The IDFT can therefore be advantageous for a defined frequency range be applied. The distribution of frequencies can be individual respectively. From a frequency resolution of less than 128 frequency lines is a saving of the computing power compared to the FFT possible.

In der Applikation sind auch Einsparungen in der Rechenleistung oder Qualitätsverbesserungen erreichbar, wenn in Schritt (d) eine inverse schnelle Fourier-Transformation (=IFFT) angewandt wird. In Kombination mit einer FFT in Schritt (b) können breitbandige Störer besonders wirtschaftlich bearbeitet werden.In the application are also savings in computing power or quality improvements achievable if in step (d) an inverse fast Fourier transform (= IFFT) is applied. In combination with an FFT In step (b) broadband interferers can be processed particularly economically become.

Alternativ zur letztgenannten Verfahrensvariante ist eine Ausführungsform, bei der nur der Teil des erzeugten Frequenzspektrums ausgewählt wird, der unterhalb der halben Abtastfrequenz f_T/2 liegt. Damit lassen sich wiederum Einsparungen in der Rechenleistung, aber auch im Speicherplatzaufwand erzielen.As an alternative to the latter method variant, an embodiment is selected in which only that part of the generated frequency spectrum which is below half the sampling frequency f _T / 2. This in turn can be achieved in savings in computing power, but also in storage space.

Besonders vorteilhaft ist auch eine Variante des erfindungsgemäßen Verfahrens, bei der in Schritt (c) ein Frequenzspektrum zwischengespeichert wird, das durch eine Mittelung des aktuell in Schritt (b) erzeugten Frequenzspektrums mit vorher erzeugten Frequenzspektren gewonnen wird. Durch die Mittelung werden Spektrallinien mit großer Energie gefunden und Zufallswerte oder sporadische Fehler systematisch unterdrückt.Also particularly advantageous is a variant of the method according to the invention, wherein in step (c) a frequency spectrum is buffered, the by averaging the frequency spectrum currently generated in step (b) previously generated frequency spectra is obtained. By averaging Spectral lines found with great energy and random or sporadic Error systematically suppressed.

Dabei ist es besonders günstig, wenn die Mittelung mit unterschiedlicher relativer Wichtung des aktuell erzeugten Frequenzspektrums in unterschiedlichen Frequenzbereichen erfolgt. Allgemein kann mit derartigen unterschiedlichen Richtungen das natürliche Einschwingverhalten von Störern berücksichtigt werden. Beispielsweise kann sich die Drehzahl eines Motors in einem Kraftfahrzeug in der Regel nicht schlagartig ändern. Niederfrequente Störer haben eine höhere Einschwingzeit als hochfrequente. Die vorgeschlagene Wichtung hilft dabei, die Adaptivität eines Systems stabil und schnell zu machen.It is particularly advantageous if the averaging with different relative Weighting of the currently generated frequency spectrum in different Frequency ranges takes place. Generally, with such different Consider the natural transient response of interferers. For example, the speed of an engine in a motor vehicle usually not change abruptly. Low frequency interferers have one higher transient time than high frequency. The proposed weighting helps to make the adaptivity of a system stable and fast.

Dabei ist es wiederum besonders vorteilhaft, wenn die Wichtung nach Kriterien der Psychoakustik gemäß den Mittelwerten des Wahrnehmungsspektrums des menschlichen Gehörs erfolgt. Wie bereits oben diskutiert, werden bei der psychoakustischen Wichtung die frequenzabhängigen Einschwingzeiten dem menschlichen Hörempfinden angepasst. Dadurch erreicht man eine Optimierung des Systems hinsichtlich Natürlichkeit, Stabilität und Adaptionszeit.It is again particularly advantageous if the weighting according to criteria psychoacoustics according to the means of the perception spectrum of the human hearing. As discussed above, psychoacoustic Weighting the frequency dependent settling times to the adapted to human hearing. This achieves an optimization of the system in terms of naturalness, stability and adaptation time.

Um eine Überkompensation bei der Geräuschbehandlung zu vermeiden, wird bei einer besonders bevorzugten Variante des erfindungsgemäßen Verfahrens in Schritt (e) ein nach vorgegebenen Kriterien mit einem Wichtungsfaktor a < 1 gewichtetes nachgebildetes Geräuschsignal vom vom aktuell ankommenden TK-Signal abgezogen. To avoid overcompensation in the noise treatment is in a particularly preferred variant of the method according to the invention in step (e) according to predetermined criteria with a weighting factor a <1 weighted simulated noise signal from the currently arriving one TK signal deducted.

Bei einer vorteilhaften Weiterbildung wird der Wichtungsfaktor a als ein von Fehlern des TK-Systems abhängiger konstanter Wert gewählt. Dies ermöglicht eine kostengünstige und einfache Optimierung des erfindungsgemäßen Verfahrens an die Fehler des jeweiligen TK-Systems. Werden die Fehler automatisch erfasst, so kann die Wichtung auch während des Betriebs erfolgen.In an advantageous development, the weighting factor a is used as one of Faults of the TK system dependent constant value selected. this makes possible an inexpensive and simple optimization of the invention Procedure to the errors of the respective telecommunications system. The errors become automatic recorded, the weighting can also take place during operation.

Alternativ kann der Wichtungsfaktor a als ein nach einem vom Benutzer des TK-Systems wählbaren Qualitätsmaß einstellbarerer Wert gewählt werden. Ein derartiger vom Benutzer definierter Wichtungsfaktor ermöglicht eine individuelle, benutzerdefinierte Anpassung des erfindungsgemäßen Verfahrens an die individuellen Bedürfnisse. Wird das erfindungsgemäße System in ein vorhandenes übergeordnetes Konzept integriert, kann ein vom Benutzer bereitgestellter statistischer Wert, wie beispielsweise die Fehlerwahrscheinlichkeit oder Erkennungsrate zur Steuerung des Wichtungsfaktors herangezogen werden. Bei Anwendungen im Kraftfahrzeugbereich kann der Wichtungsfaktor beispielsweise auch aus der Drehzahl oder Geschwindigkeit abgeleitet werden.Alternatively, the weighting factor a may be determined as one after one by the user of the TK-Systems selectable quality level adjustable value can be selected. One such user-defined weighting factor allows an individual, custom adaptation of the method according to the invention to the individual Needs. Is the system of the invention in an existing integrated parent concept can be a user-provided statistical value, such as the error probability or recognition rate used to control the weighting factor. For applications in the automotive sector, the weighting factor, for example also be derived from the speed or speed.

Dies lässt sich dadurch weiterverbessern, dass der Wichtungsfaktor a adaptiv an das aktuelle ankommende TK-Signal angepasst wird. Die adaptive Gewichtung erlaubt eine automatische Optimierung der Geräuschminderung während des Betriebes. Der Gewichtungsfaktor kann von statistischen Werten wie Fehlerwahrscheinlichkeit, Mittelwert, Zustandsänderungen etc. abgeleitet werden. Mit der adaptiven Wichtung sind besonders einfache und schnelle Anpassungen des erfindungsgemäßen Verfahrens an individuelle Gegebenheiten in der akustischen Umgebung des TK-Endgeräts möglich.This can be further improved by the fact that the weighting factor a is adaptive is adapted to the current incoming TK signal. The adaptive weighting allows automatic optimization of noise reduction during of the operation. The weighting factor may vary from statistical values such as probability of error, Mean value, state changes, etc. are derived. With the adaptive weighting are particularly easy and quick adjustments of the inventive method to individual circumstances in the acoustic environment of the telecommunications terminal possible.

Eine weitere vorteilhafte Variante des erfindungsgemäßen Verfahrens zeichnet sich dadurch aus, dass dem in Schritt (d) erzeugten nachgebildeten Geräuschsignal vor Schritt (e) ein synthetisches Geräuschsignal beigemischt wird. Die Beimischung eines künstlichen Rauschsignals mit konstanter Leistungsdichte kann zur Maskierung von dynamischen, nicht-stationären Störern im Ausgangssignal dienen. A further advantageous variant of the method according to the invention is characterized characterized in that the simulated noise signal generated in step (d) before step (e) a synthetic noise signal is added. The Admixture of an artificial noise signal with constant power density can mask dynamic, non-stationary interferers in the output signal serve.

Eine weitere Variante des erfindungsgemäßen Verfahrens sieht vor, dass das aktuell ankommende TK-Signal vor Schritt (e) einer definierten Zeitverzögerung unterworfen wird, die vorzugsweise so ausgelegt ist, dass die Phasenlage des ankommenden TK-Signals mit der Phasenlage des nachgebildeten Geräuschsignals vor dem Abzug übereinstimmt.A further variant of the method according to the invention provides that the currently arriving TK signal before step (e) of a defined time delay is subjected, which is preferably designed so that the phase angle of the incoming TK signal with the phase position of the simulated noise signal matches before withdrawal.

Bei einer alternativen Verfahrensvariante ist vorgesehen, dass das aktuell ankommende TK-Signal unverzögert dem Abzug in Schritt (e) zugeführt wird, und dass das nachgebildete Geräuschsignal in seiner Phasenlage vor Schritt (e) an die Phasenlage des aktuell ankommenden TK-Signals angepasst wird. Wird die Phasenlage des reproduzierten Geräuschsignals im Frequenzbereich vor der Rücktransformation korrigiert, kann die Subtraktion vom unverzögerten Signal im Zeitbereich erfolgen. Störende Signalverzögerungen können somit entfallen. Diese treten zwangsläufig bei allen Verfahren auf, bei denen das Nutzsignal (Sprache) den Umweg über zwei Transformationen macht, wie beispielsweise bei der oben diskutierten bekannten spektralen Subtraktion.In an alternative variant of the method it is provided that the currently arriving TK signal is fed without delay to the trigger in step (e), and that the simulated noise signal in its phase position before step (e) to the phase angle of the currently arriving TK signal is adjusted. Will the Phase angle of the reproduced noise signal in the frequency range before Corrected inverse transformation, the subtraction from the instantaneous signal take place in the time domain. Disturbing signal delays can thus be dispensed with. These inevitably occur in all procedures in which the useful signal (Language) makes the detour via two transformations, such as in the known spectral subtraction discussed above.

Besonders bevorzugt ist eine Variante des erfindungsgemäßen Verfahrens, bei der zusätzlich zur Erkennung und Reduktion von Geräuschsignalen das Vorliegen von Echosignalen detektiert und/oder vorhergesagt wird und die Echosignale unterdrückt oder reduziert werden. Eine zusätzliche Echounterdrückung ist allerdings nur dann möglich, wenn das empfangene Originalsignal vom fernen TK-Teilnehmer zur Echoberechnung miteinbezogen wird. Dies bedeutet, dass die Geräuschreproduktion auch eine Echoreproduktion beinhaltet, die mit einem vom fernen TK-Teilnehmer ankommenden Signal verbunden ist.Particularly preferred is a variant of the method according to the invention in addition to the detection and reduction of noise signals presence echo signals are detected and / or predicted and the echo signals be suppressed or reduced. An additional echo cancellation is however, only possible if the received original signal from the remote TK participant is included in the echo calculation. This means that the noise reproduction also includes a echo reproduction that with a connected to the remote TK subscriber signal is connected.

Diese Verfahrensvariante kann dadurch verbessert werden, dass die Steuerung der Reduktion von Geräuschsignalen und der Reduktion von Echosignalen getrennt erfolgt. This process variant can be improved by the fact that the control the reduction of noise signals and the reduction of echo signals done separately.

Vorteilhaft ist es auch, wenn während der Zeitdauer einer Echo-Reduktion zum Nutzsignal zusätzlich ein künstliches Geräuschsignal addiert wird, wie es bereits oben näher diskutiert wurde, um den subjektiven Eindruck einer "toten Leitung" zu vermeiden.It is also advantageous if, during the period of an echo reduction to User signal in addition an artificial noise signal is added, as it already is discussed above to give the subjective impression of a "dead Line "to avoid.

Insbesondere kann das künstliche Geräuschsignal eine psychoakustisch als angenehm empfundene akustische Signalsequenz (=comfort noise) umfassen.In particular, the artificial noise signal may be psychoacoustically pleasing perceived acoustic signal sequence (= comfort noise) include.

Alternativ kann das künstliche Geräuschsignal ein zuvor während der aktuellen TK-Verbindung aufgezeichnetes Geräuschsignal umfassen, das die aktuelle akustische Umgebungssituation besonders "lebensecht" nachzubilden vermag.Alternatively, the artificial noise signal may be pre-selected during the current one TK connection recorded sound signal, which includes the current reproduce the acoustic environment particularly "lifelike".

In den Rahmen der vorliegenden Erfindung fällt auch eine Servereineit, eine Prozessor-Baugruppe sowie eine Gate-Array-Baugruppe zur Unterstützung des oben beschriebenen erfindungsgemäßen Verfahrens sowie ein Computerprogramm zur Durchführung des Verfahrens. Das Verfahren kann sowohl als Hardwareschaltung, als auch in Form eines Computerprogramms realisiert werden. Heutzutage wird eine Software-Programmierung für leistungsstarke DSP's bevorzugt, da neue Erkenntnisse und Zusatzfunktionen leichter durch eine Veränderung der Software auf bestehender Hardwarebasis implementierbar sind. Verfahren können aber auch als Hardwarebausteine beispielsweise in TK-Endgeräten oder Telefonanlagen implementiert werden.The scope of the present invention also includes a server line, a Processor assembly and a gate array assembly to support the method described above and a computer program to carry out the process. The method can be used both as a hardware circuit, as well as in the form of a computer program. Nowadays, software programming for powerful DSP's preferred because new knowledge and additional functions easier by a Modification of the software can be implemented on an existing hardware basis are. However, methods can also be used as hardware components, for example in TK terminals or telephone systems are implemented.

Weitere Vorteile der Erfindung ergeben sich aus der Beschreibung und der Zeichnung. Ebenso können die vorstehend genannten und die noch weiter aufgeführten Merkmale erfindungsgemäß jeweils einzeln für sich oder zu mehreren in beliebigen Kombinationen Verwendung finden. Die gezeigten und beschriebenen Ausführungsformen sind nicht als abschließende Aufzählung zu verstehen, sondern haben vielmehr beispielhaften Charakter für die Schilderung der Erfindung. Further advantages of the invention will become apparent from the description and the Drawing. Likewise, the above and those listed further Features according to the invention each individually or for several find use in any combination. The shown and described Embodiments are not to be exhaustive but rather have an exemplary character for the description the invention.

Die Erfindung ist in der Zeichnung dargestellt und wird anhand von Ausführungsbeispielen näher erläutert. Es zeigen:

Fig. 1: ein stark schematisiertes Diagramm der Funktionsweise einer Einrichtung zur Durchführung des erfindungsgemäßen Verfahrens;
Fig. 2: eine detailliertere schematische Darstellung einer Einrichtung zur Durchführung des erfindungsgemäßen Verfahrens;
Fig. 3: ein Schema für ein spektrales Subtraktionsverfahren nach dem Stand der Technik;
Fig. 4: eine Ausführungsform der Erfindung mit schneller Fourier-Transformation und schneller Rücktransformation sowie blockweise überlappender Bearbeitung des eingegebenen Zeitsignals im Frequenzbereich;
Fig. 5: Ein Schema einer Ausführungsform mit gleichzeitiger Echo-reduktion;
Fig. 6a: ein Beispiel eines mit FFT berechneten Geräuschsignals im Frequenzraum;
Fig. 6b: ein mit einer diskreten Fourier-Transformation und nur bis f_s/2 berechneten Geräuschsignals; und
Fig. 6c: ein Geräuschsignal im Frequenzbereich bis f_s/2 als Ergebnis einer modifizierten Fourier-Transformation mit höherer Auflösung.

The invention is illustrated in the drawing and will be explained in more detail with reference to embodiments. Show it:

Fig. 1: a highly schematic diagram of the operation of a device for carrying out the method according to the invention;
Fig. 2: a more detailed schematic representation of a device for carrying out the method according to the invention;
Fig. 3: a scheme for a spectral subtraction method according to the prior art;
Fig. 4: an embodiment of the invention with fast Fourier transform and fast back propagation and block overlapping processing of the input time signal in the frequency domain;
Fig. 5: A schematic of an embodiment with simultaneous echo reduction;
Fig. 6a: an example of a FFT calculated noise signal in frequency space;
Fig. 6b: a noise signal calculated with a discrete Fourier transform and only up to f _s / 2; and
Fig. 6c: a noise signal in the frequency range up to f _s / 2 as a result of a modified Fourier transform with higher resolution.

In Fig. 1 ist gezeigt, wie aus einem ankommenden Originalsignal x, welches einen Sprachanteil s sowie einen Geräuschanteil n enthält, einerseits in einer Einrichtung 1 ein Geräuschsignal y_n im Frequenzbereich nachgebildet wird und andererseits das Originalsignal x_s+n getrennt von der Geräuschnachbildung einer Geräuschsubtraktion zugeführt wird, wobei wahlweise eine Zeitverzöge-Zeitverzögerung τ vorgenommen werden kann. Das geräuschreduzierte Signal y_s wird dann im TK-System weitergeleitet.In Fig. 1 it is shown how from an incoming original signal x, which contains a voice portion s and a noise n, on the one hand in a device 1, a noise signal y _n in the frequency domain is simulated and on the other hand, the original signal x _{s + n} separated from the noise simulation of a Noise subtraction is supplied, wherein optionally a time delay time delay τ can be made. The noise-reduced signal y _s is then forwarded in the TK system.

In Fig. 2 ist eine einfache Ausführungsform gezeigt, bei der in der Einrichtung 1 a zur Geräuschnachbildung ein praktisch immer erforderlicher Sprachpausendetektor 2 vorgesehen ist, mit dem ermittelt wird, wann das eingehende Signal Sprachsignale enthalten kann oder wann eine Sprachpause vorliegt. Parallel dazu wird das eingehende TK-Signal einer Fourier-Transformation FT zur Erzeugung eines Frequenzsprektrums unterworfen und das jeweils daraus entstehende Frequenzspektrum in einem Zwischenspeicher 3 abgespeichert. Die zeitlich nacheinander abgespeicherten Frequenzspektren können mit Hilfe einer Einrichtung 4 einer Mittelwertbildung unterzogen werden.In Fig. 2, a simple embodiment is shown in which in the device 1 a for noise simulation a virtually always required speech pause detector 2 is provided, which determines when the incoming Signal may contain speech signals or when there is a speech break. In parallel, the incoming TK signal of a Fourier transform FT subjected to generating a Frequenzsprektrums and each of them resulting frequency spectrum stored in a buffer 3. The time sequentially stored frequency spectra can help with a means 4 are averaged.

Sobald der Sprachpausendetektor 2 feststellt, dass eine Sprachpause beendet ist und im eingehenden Originalsignal auch Sprachsignale vorhanden sein können, wird das letzte im Zwischenspeicher 3 abgespeicherte Frequenzspektrum (ggf. gemittelt mit vorher aufgenommenen Spektren) einer inversen Fourier-Transformation IFT unterworfen und in einem Subtraktionsglied 5 vom Originalsignal, das ggf. einer Zeitverzögerung τ unterworfen wurde, abgezogen, um ein geräuschbefreites oder zumindest geräuschreduziertes Signal zu erhalten.Once the speech pause detector 2 determines that a speech pause is over is and in the incoming original signal and speech signals can be present, becomes the last stored in the buffer memory 3 frequency spectrum (possibly averaged with previously recorded spectra) of an inverse Fourier transformation IFT subjected and in a Subtraktionsglied 5 of Original signal, which was possibly subjected to a time delay τ deducted, to get a noise-free or at least noise-reduced signal.

Im Gegensatz dazu wird bei bekannten Verfahren der spektralen Subtraktion das eingehende Originalsignal, wie in Fig. 3 dargestellt, direkt einer Fourier-Transformation FT unterzogen, ein nachgebildetes Geräuschsignal im Frequenzbereich in einem Subtraktionsglied 5' vom Fourier-transformierten Originalsignal abgezogen und das daraus entstehende neue, geräuschreduzierte Signal im Frequenzbereich einer inversen Fourier-Transformation In contrast, in known methods of spectral subtraction the incoming original signal, as shown in Fig. 3, directly a Fourier transform FT, a replicated noise signal in the frequency domain in a subtractor 5 'from the Fourier-transformed Original signal subtracted and the resulting new, noise-reduced Signal in the frequency domain of an inverse Fourier transform

IFT unterzogen und als geräuschreduziertes TK-Signal im Zeitbereich weitergeleitet. Es findet also bei den bekannten Verfahren im Stand der Technik grundsätzlich immer eine Veränderung des Originalsignals auch schon vor dem eigentlichen Geräuschabzug statt.IFT subjected and forwarded as a noise-reduced TK signal in the time domain. It thus finds in the known methods in the prior art basically always a change of the original signal even before actual sound reduction instead.

In Fig. 4 ist eine weitere Ausführungsform der Erfindung dargestellt, bei der das zunächst im Zeitbereich eingehende Originalsignal x_s+n in der Einrichtung 1 b zur Geräuschnachbildung blockweise verarbeitet wird. Hierbei wird das Zeitsignal vor der Transformation in den Frequenzbereich einer Fensterung (z.B. nach Hamming) in einer entsprechend vorgeschalteten Vorrichtung 4' bzw. 4" unterzogen. Um bei der Rücktransformation die durch die Fensterung entstandenen Fehler zu kompensieren, wird neben der Verarbeitung in einem ersten Pfad eine parallele Verarbeitung in einem weiteren Pfad mit der gleichen Fensterung vorgenommen, wobei lediglich das Signal um die halbe Fensterlänge versetzt ist und ansonsten das nachzubildende Geräuschsignal mit den gleichen Mitteln berechnet wird, wodurch eine Kompensation der durch die Fensterung erzeugten Fehler erreicht werden kann.FIG. 4 shows a further embodiment of the invention, in which the original signal x _{s + n,} which is initially received in the time domain, is processed block-by-block in the device 1 b for noise simulation. In this case the time signal before the transformation into the frequency range is subjected to a windowing (eg according to Hamming) in a correspondingly upstream device 4 'or 4 "In order to compensate for the errors caused by the windowing during the inverse transformation, in addition to the processing in a first Path is made parallel processing in another path with the same fenestration, wherein only the signal is offset by half the window length and otherwise the simulated noise signal is calculated by the same means, whereby a compensation of the errors generated by the fenestration can be achieved.

Im Einzelnen wird bei dem gezeigten Beispiel im ersten Pfad die Fensterung in einer Vorrichtung 4' vorgenommen, danach das Zeitsignal einer schneller Fourier-Transformation FFT unterworfen und das entstehende Spektrum in einem Zwischenspeicher 3' gespeichert. Das Gleiche geschieht im zweiten Pfad über eine Fenstervorrichtung 4" und eine Zwischenspeicherung des Fourier-transformierten Signals in einem Zwischenspeicher 3". An die Zwischenspeicher 3', 3" schließt sich eine inverse schnelle Fourier-Transformation IFFT jeweils an, und die daraus hervorgehenden Spektren im Zeitbereich werden in einer Überlappeinrichtung 6 zu einem nachgebildeten Geräuschsignal Yn zusammengeführt. Anschließend wird das nachgebildete Geräuschsignal wiederum im Subtraktionsglied 5 von einem wahlweise um eine Zeit τ zeitversetzten Originalsignal x_s+n abgezogen, um das geräuschbereinigte Ausgangssignal y_s zu erhalten. Die Subtraktion des Geräuschsignals vom Originalsignal im Subtraktionsglied 5 kann phasenangepasst erfolgen. Specifically, in the example shown, in the first path the windowing is performed in a device 4 ', then the time signal is subjected to a fast Fourier transformation FFT and the resulting spectrum is stored in an intermediate memory 3'. The same happens in the second path via a window device 4 "and an intermediate storage of the Fourier-transformed signal in a buffer 3". An inverse fast Fourier transformation IFFT is connected to the latches 3 ', 3 ", and the resulting spectra in the time domain are combined to form a simulated noise signal Yn in an overlap device 6. Subsequently, the simulated noise signal in the subtraction element 5 is converted by a optionally subtracted by a time τ time-offset original signal x _{s + n in} order to obtain the noise-corrected output signal y _S. The subtraction of the noise signal from the original signal in the subtraction element 5 can be phase-adjusted.

Ein weiteres Ausführungsbeispiel ist in Fig. 5 dargestellt, wo das abgezweigte eingehende TK-Signal x_s+n+e neben Sprach- und Geräuschsignalen auch Echosignale enthält. In einer Einrichtung 1c zur Geräusch- und Echonachbildung wird außerdem ein Echosignal e eingegeben, welches in einem zum Geräuschnachbildungspfad parallelen Verarbeitungspfad weiterbehandelt wird.A further embodiment is shown in Fig. 5, where the branched incoming TK signal x _{s + n + e in} addition to speech and noise signals also contains echo signals. In a device 1c for noise and echo replica also an echo signal e is input, which is further treated in a processing path parallel to the noise training path.

Das eingehende Originalsignal X_s+n+e wird zunächst einer Fensterung in einer Vorrichtung 4a unterzogen, danach einer schnellen Fourier-Transformation FFT und das erhaltene Frequenzspektrum in einem Zwischenspeicher 3a zwischengespeichert. Parallel dazu wird das Echosignal e in einer Vorrichtung 4b ebenfalls einer Fensterung unterzogen und danach Fourier-transformiert. Die Frequenzspektren beider Pfade werden in einen Zwischenspeicher 3b zwischengespeichert und evtl. einer Mittelung unterzogen. Danach erfolgt auf beiden Pfaden jeweils getrennt eine schnelle inverse Fourier-Transformation IFFT. In einer Einrichtung 6a schließlich werden das nachgebildete Geräuschsignal und das nachgebildete Echosignal zu einem abzuziehenden Gesamtsignal y_n+e überlappt, welches in der Subtraktionseinrichtung 5 von dem unveränderten oder um eine Zeit τ verzögerten Originalsignal x_s+n+e abgezogen wird, um das geräusch- und echoreduzierte TK-Signal y_s zu erhalten.The incoming original signal X _{s + n + e} is first subjected to a windowing in a device 4a, then a fast Fourier transform FFT and the obtained frequency spectrum are buffered in a buffer 3a. In parallel, the echo signal e in a device 4b is also subjected to a windowing and then Fourier-transformed. The frequency spectra of both paths are buffered in a buffer 3b and possibly subjected to averaging. Thereafter, a fast inverse Fourier transformation IFFT is performed separately on both paths. Finally, in a device 6a, the simulated noise signal and the simulated echo signal are overlapped into a total signal y _{n + e to be} subtracted, which is subtracted in the subtraction device 5 from the original signal x _{s + n + e} delayed or delayed by a time τ in order to record the noise and echo-reduced TK signal y _s .

Die Fign. 6a bis 6c schließlich zeigen Beispiele für nach dem erfindungsgemäßen Verfahren berechnete Geräuschsignale im Frequenzraum. Dabei ist bei dem Beispiel nach Fig. 6a das nachzubildende Geräuschsignal aus einer schnellen Fourier-Transformation FFT gewonnen worden. Man sieht die typische Spiegelsymmetrie um den halben Frequenzwert f_s/2.The Fign. Finally, FIGS. 6a to 6c show examples of noise signals calculated in the frequency domain according to the method of the invention. In this case, in the example according to FIG. 6a, the noise signal to be reproduced has been obtained from a fast Fourier transformation FFT. The typical mirror symmetry can be seen around half the frequency value f _s / 2.

Es reicht aber auch schon aus, wenn nur die erste Hälfte des nachgebildeten Geräuschsignals im Frequenzraum bis zur Frequenz f_s/2 verwendet wird, was in Fig. 6b anhand eines Beispieles dargestellt ist, dessen Ergebnis mit Hilfe einer diskreten Fourier-Transformation erhalten wurde. However, it is also sufficient if only the first half of the simulated noise signal in the frequency space up to the frequency f _s / 2 is used, which is illustrated in FIG. 6 _b by means of an example whose result was obtained by means of a discrete Fourier transformation.

Fig. 6c schließlich zeigt das Ergebnis der Anwendung einer modifizierten diskreten Fourier-Transformation mit höherer Auflösung, wobei wiederum nur die Hälfte des Frequenzspektrums bis zur Frequenz f_s/2 verarbeitet wird.Finally, Fig. 6c shows the result of using a modified discrete Fourier transform with higher resolution, again processing only half of the frequency spectrum up to the frequency f _s / 2.

Claims

Process for reducing noise signals in telecommunications (TC) systems for the transmission of acoustic useful signals, in particular human speech, with the following steps:

(a) Determining by means of speech pause detection when a speech signal is contained in the mixture of useful signals and interference signals to be transmitted, or when a speech pause is present;

(b) Branching the incoming TC signal from the main signal path and using a Fourier transformation on the branched TC signal to generate a frequency spectrum of the branched TC signal;

(c) Storing in a buffer memory (3) the last frequency spectrum recorded during the last speech pause;

(d) Using an inverse Fourier transformation on the last respective recorded frequency spectrum to generate a simulated noise signal;

(e) Subtracting the simulated noise signal in the time domain from the current incoming TC signal.
Process according to Claim 1, characterised in that in step (d) only one selected part of the generated frequency spectrum is utilised for the generation of the simulated noise signal.
Process according to Claim 2, characterised in that the selection of the part of the frequency spectrum used for the generation of the simulated noise signal is made in accordance with psycho-acoustic criteria implementing the mean values of the perception spectrum of the human ear.
Process according to Claim 2, characterised in that the selection of the part of the frequency spectrum used for the generation of the simulated noise signal is made in such a way that only discrete frequencies of the spectrum are considered, and that the spacing between the discrete frequencies is made to steadily increase towards the higher frequencies and preferably in accordance with a logarithmic function.
Process according to Claim 2, characterised in that the selected part of the frequency spectrum is divided into previously determined frequency groups, and that in each frequency group only the frequency or frequency band, respectively, having the highest signal energy within the frequency group is selected and further utilised for the generation of the simulated noise signal.
Process according to Claim 5, characterised in that the selection of the frequency or frequency band, respectively, having the highest signal energy within the frequency group is made prior to step (c) or step (d), respectively.
Process according to Claim 1, characterised in that in step (b) the frequency spectrum of the branched TC signal is generated only in a predetermined frequency band.
Process according to Claim 1, characterised in that a frequency spectrum that is obtained by averaging the current frequency spectrum generated in step (b) and the previously generated frequency spectra, is temporarily stored in step (c).
Process according to Claim 8, characterised in that the averaging with a different relative weighting of the currently generated frequency spectrum is realised in different frequency bands.
Process according to Claim 9, characterised in that the weighting is realised in accordance with psycho-acoustic criteria implementing the mean values of the perception spectrum of the human ear.
Process according to Claim 1, characterised in that a simulated noise signal weighted with a weighting factor a < 1 in accordance with predetermined criteria is subtracted from the current incoming TC signal in step (e).
Process according to Claim 1, characterised in that prior to step (e) a synthetic noise signal is mixed with the simulated noise signal generated in step (d).
Process according to Claim 1, characterised in that prior to step (e) the current incoming TC signal undergoes a specified time delay that is preferably designed so that the phase of the incoming TC signal coincides with the phase of the simulated noise signal prior to subtraction.
Process according to Claim 1, characterised in that the current incoming TC signal is fed for immediate subtraction in step (e) and that prior to step (e) the phase of the simulated noise signal is matched to the phase of the current incoming TC signal.