DE10356063B4 - Method for interference suppression of audio signals - Google Patents

Method for interference suppression of audio signals Download PDF

Info

Publication number
DE10356063B4
DE10356063B4 DE10356063A DE10356063A DE10356063B4 DE 10356063 B4 DE10356063 B4 DE 10356063B4 DE 10356063 A DE10356063 A DE 10356063A DE 10356063 A DE10356063 A DE 10356063A DE 10356063 B4 DE10356063 B4 DE 10356063B4
Authority
DE
Germany
Prior art keywords
audio signals
signal
reverberation
determined
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE10356063A
Other languages
German (de)
Other versions
DE10356063A1 (en
Inventor
Frank Lorenz
Christoph Dr. Pörschmann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE10356063A priority Critical patent/DE10356063B4/en
Priority to PCT/EP2004/012101 priority patent/WO2005062298A1/en
Publication of DE10356063A1 publication Critical patent/DE10356063A1/en
Application granted granted Critical
Publication of DE10356063B4 publication Critical patent/DE10356063B4/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Abstract

Verfahren zur Entstörung von Audiosignalen (1, 5.1) eines Kommunikationsgerätes, wobei das Kommunikationsgerät Audiosignale (1, 5.1) verschiedener Frequenzen aufnimmt, denen störende Anteile, vorzugsweise in Form von Nachhall (3) und Echo (2) überlagert sind und die Nachhallzeit (T60) bestimmt wird, bei dem die Audiosignale (1, 5.1) in einzelne aufeinanderfolgende Zeitblöcke (= Signalframes) aufgeteilt werden und dann vom Zeitbereich in den Frequenzbereich transformiert (6.1), entstört und danach rücktransformiert (6.2) werden und zur Entstörung der aufgenommenen und störbehafteten Audiosignale (1, 5.1) die Störanteile (2, 3) durch einen Algorithmus entfernt werden, wobei die Schallenergie der Audiosignale (1, 5.1) dem Quadrat der Signalamplituden der Audiosignale (1, 5.1) entspricht, dadurch gekennzeichnet, dass die Schallenergie der störenden Anteile (2, 3) eines jeweils nachfolgenden Signalframes in Abhängigkeit der Nachhallzeit (T60) bestimmt wird und weiterhin ein Signalamplitudenverhältnis RD (7.1) von störenden Anteilen (2, 3) zu ungestörten Anteilen (1) bestimmt wird (7), wobei die Schallenergie der störenden Anteile (2, 3) mit...method for filtering of audio signals (1, 5.1) of a communication device, wherein the communication device Receives audio signals (1, 5.1) of different frequencies, which disturbing parts, preferably in the form of reverberation (3) and echo (2) are superimposed and the reverberation time (T60) is determined at which the audio signals (1, 5.1) divided into individual successive time blocks (= signal frames) and then transformed from the time domain to the frequency domain (6.1), suppressed and then transformed back (6.2) and to filtering the recorded and interference-prone Audio signals (1, 5.1) the interference components (2, 3) are removed by an algorithm where the sound energy of the audio signals (1, 5.1) the square of the signal amplitudes of the audio signals (1, 5.1), characterized in that the sound energy the disturbing Shares (2, 3) of a respective subsequent signal frame in dependence the reverberation time (T60) is determined and further a signal amplitude ratio RD (7.1) of disturbing Shares (2, 3) undisturbed Shares (1) is determined (7), whereby the sound energy of the disturbing shares (2, 3) with ...

Figure 00000001
Figure 00000001

Description

Die Erfindung betrifft ein Verfahren zur Entstörung von Audiosignalen eines Kommunikationsgerätes, wobei das Kommunikationsgerät Audiosignale verschiedener Frequenzen aufnimmt, denen störende Anteile, vorzugsweise in Form von Nachhall und Echo, überlagert sind und die Nachhallzeit bestimmt wird, bei dem die Audiosignale in einzelne aufeinanderfolgende Zeitblöcke (= Signalframes) aufgeteilt werden und dann vom Zeitbereich in den Frequenzbereich transformiert, entstört und danach rücktransformiert werden und zur Entstörung der aufgenommenen und störbehafteten Audiosignale die Störanteile durch einen Algorithmus entfernt werden, wobei die Schallenergie der Audiosignale dem Quadrat der Signalamplituden der Audiosignale entspricht.The The invention relates to a method for interference suppression of audio signals of a Communications equipment the communication device Receives audio signals of different frequencies, which disturbing parts, preferably in the form of reverberation and echo, are superimposed and the reverberation time is determined, in which the audio signals in each successive blocks of time (= Signal frames) and then from the time domain into the frequency domain transformed, suppressed and then transformed back become and to the suppression the recorded and interference-prone Audio signals the interference components be removed by an algorithm where the sound energy the audio signals the square of the signal amplitudes of the audio signals equivalent.

Ein solches bekanntes Verfahren ist beispielsweise in der DE 694 20 027 T2 beschrieben, ebenso wie in dem Fachartikel „Spectral Subtraction Based on Minimum Statistics", von R. Martin, EUSIPCO-94, Edinburgh, Scotland, 13.–16. September 1994, S. 1182–1185.Such a known method is for example in the DE 694 20 027 T2 as well as in the technical article "Spectral Subtraction Based on Minimum Statistics", by R. Martin, EUSIPCO-94, Edinburgh, Scotland, September 13-16, 1994, pp. 1182-1185.

Es ist allgemein bekannt, dass über Lautsprecher abgestrahlte oder von einer Schallquelle, zum Beispiel der menschlichen Stimme, erzeugte Audiosignale in Räumen im Allgemeinen durch Echos und Nachhall verfälscht werden. Die Art und Dauer des Nachhalls wird von der Geometrie des Raumes und der Beschaffenheit der Wände entscheidend beeinflusst. Während die Echos aus direkten, einfachen und frühen Reflexionen des Audiosignals an einer der Begrenzungsflächen des Raumes, zum Beispiel den Wänden, dem Boden oder der Decke, bestehen, ist der Nachhall diffus und wird durch mehrfache, nur noch nach statistischen Methoden abschätzbare Reflexionen an den Begrenzungsflächen erzeugt.It is well known that over Speaker radiated or from a sound source, for example the human voice, generated audio signals in rooms in the Generally falsified by echoes and reverberations. The type and duration of reverberation is determined by the geometry of the room and the texture the walls decisively influenced. While the echoes from direct, simple and early reflections of the audio signal on one of the boundary surfaces of space, for example the walls, the floor or the ceiling, the reverberation is diffuse and becomes by multiple, only by statistic methods estimable reflections at the boundary surfaces generated.

Beispielsweise bei der Kommunikation von zwei Mobilfunkteilnehmern, die im Freisprechmodus telefonieren, führt der Nachhall häufig zu einer erheblichen Verschlechterung der Sprachqualität und Sprachverständlichkeit für den fernen Mobilfunkteilnehmer.For example in the communication of two mobile subscribers calling in hands-free mode, leads the Reverberation often to a significant deterioration of voice quality and speech intelligibility for the remote mobile subscribers.

Abhilfe können hier neben dem Einsatz gerichteter Mikrophone Verfahren zur Enthallung des Audiosignals schaffen.remedy can here in addition to the use of directed microphones method for reverberation of the audio signal.

Es sind bereits einige Verfahren und Algorithmen zur Enthallung von Audiosignalen aus der Literatur bekannt. Beispielsweise werden folgende Literaturangaben genannt, die vollinhaltlich in diese Anmeldung übernommen werden:It There are already some algorithms and algorithms for rewriting Audio signals known from the literature. For example, the following Cited references, which are incorporated in full in this application become:

  • [1] Louis D. Fielder: "Analysis of Traditional and Reverberation-Reducing Methods of Room Equalization"; AES Journal Vol. 51 Number 1/2; p. 3–26; Jan. 2003.[1] Louis D. Fielder: "Analysis of Traditional and Reconversion-Reducing Methods of Room Equalization "; AES Journal Vol. 51 Number 1/2; p. 3-26; Jan. 2003.
  • [2] Yegnanarayana and Murthy: "Enhancement of Reverberant Speech Using LP Residual Signal"; IEEE Transactions on Speech and Audio Processing; Vol. 8, No. 3; May 2000.[2] Yegnanarayana and Murthy: "Enhancement of Reverberant Speech Using LP Residual Signal "; IEEE Transactions on Speech and Audio Processing; Vol. 8, no. 3; may 2000th
  • [3] Wu and Wang: "A One-Microphone Algorithm for Reverberant Speech Enhancement"; Proc. IEEE Int. Conference on Acoustics, Speech and Signal Processing; Hong Kong; April 6–10 2003[3] Wu and Wang: "A One-Microphone Algorithm for Reverberant Speech Enhancement "; Proc. IEEE Int. Conference on acoustics, speech and signal processing; Hong Kong; April 6-10 2003
  • [4] Gillespie, Malvar and Florencio: "Speech Dereverberation Via Maximum-Kurtosis Subband Adaptive Filtering"; Proc. IEEE Int. Conference on Acoustics, Speech and Signal Processing; Salt Lake City, Utah, USA; May 2001.[4] Gillespie, Malvar and Florencio: "Speech Dereverberation Via Maximum Kurtosis Subband Adaptive Filtering "; Proc. IEEE Int. Conference on Acoustics, Speech and Signal Processing; Salt Lake City, Utah, USA; May 2001.

Einige dieser Verfahren nutzen zum einen statistische Eigenschaften von Sprachsignalen zur Reduzierung des Nachhalls. Manche der Verfahren der digitalen Sprach- und Audio-Signalverarbeitung benötigen eine Abschätzung der sogenannten Nachhallzeit oder führen diese im Rahmen eines Algorithmus durch.Some On the one hand, these methods use statistical properties of Speech signals to reduce the reverberation. Some of the procedures of Digital voice and audio signal processing require one appraisal the so-called reverberation time or lead this under a Algorithm through.

Beispielsweise stellt der von Wu und Wang [3] beschriebene Algorithmus einen allgemeinen Ansatz dar, bei dem untersucht wird, welchen Einfluss die Energie in einem bestimmten Frequenzband innerhalb eines Sprachsignalabschnittes (Frame) auf die Energie in den folgenden Frames in jedem einzelnen Frequenzband hat.For example represents the algorithm described by Wu and Wang [3] a general Approach, which examines the influence of energy in a certain frequency band within a speech signal section (Frame) on the energy in the following frames in each one Frequency band has.

Eine andere Gruppe von Verfahren sind Störgeräuschunterdrückungsverfahren, die auf Basis spektraler Subtraktion arbeiten. Diese Verfahren erfassen und schätzen über einen längeren Zeitraum die spektrale Struktur von Störgeräuschen und reduzieren dann im Frequenzbereich das Audiosignal so, dass es genau um die Anteile des Störsignals reduziert wird.A Another group of methods are noise suppression based on spectral Subtraction work. These methods capture and estimate via a longer Period the spectral structure of noise and then reduce in the frequency domain the audio signal so that it is exactly the shares of the interference signal is reduced.

Der Nachteil der Verfahren, die die statistischen Eigenschaften von Sprachsignalen zur Reduzierung des Nachhalls nutzen, ist, dass die Reduzierung des Nachhalls, abhängig von den statistischen Schwankungen, ungenau ist. Auch die Störgeräuschunterdrückungsverfahren, die auf Basis spektraler Subtraktion arbeiten, weisen immer noch eine gewisse Reststörung auf.Of the Disadvantage of the methods that the statistical properties of Using voice signals to reduce reverberation is that the Reduction of reverberation, depending from the statistical fluctuations, is inaccurate. Also the noise reduction methods, which still work on the basis of spectral subtraction a certain residual disturbance on.

Es ist daher Aufgabe der Erfindung, ein verbessertes Verfahren zur Entstörung von Audiosignalen zu finden, welches im Vergleich zu den bisher bekannten Verfahren eine genauere Entstörung der Audiosignale zulässt.It It is therefore an object of the invention to provide an improved method for suppression of audio signals, which compared to the previous ones known method allows a more accurate interference suppression of the audio signals.

Diese Aufgabe der Erfindung wird durch ein Verfahren mit den Merkmalen des Patentanspruches 1 gelöst. Vorteilhafte Weiterbildungen der Erfindung sind Gegenstand untergeordneter Patentansprüche.These The object of the invention is achieved by a method having the features of claim 1. Advantageous developments of the invention are subordinate to the subject Claims.

Die Erfinder haben erkannt, dass störende Anteile, wie Nachhall oder Echo, erheblich aus einem Audiosignal reduziert werden können, wenn ein mittlerer Abfall der Energie beziehungsweise der Schallenergie des Audiosignals über der Zeit ermittelt wird und das zu enthallende Audiosignal, entsprechend dieser so ermittelten Nachhallkurve, in bestimmten Bereichen hinsichtlich der Schallenergie verringert wird.The Inventors have recognized that disturbing parts, like reverberation or echo, significantly reduced from an audio signal can be if a medium drop in energy or sound energy of the audio signal the time is determined and the audio signal to be included, according to this thus determined reverberation curve, in certain areas in terms the sound energy is reduced.

Entsprechend diesem Erfindungsgedanken schlagen die Erfinder vor, das bekannte Verfahren zur Entstörung von Audiosignalen eines Kommunikationsgerätes, wobei das Kommunikationsgerät Audiosignale verschiedener Frequenzen aufnimmt, denen störende Anteile, vorzugsweise in Form von Nachhall und Echo, überlagert sind und die Nachhallzeit bestimmt wird, bei dem die Audiosignale in einzelne aufeinanderfolgende Zeitblöcke (= Signalframes) aufgeteilt werden und dann vom Zeitbereich in den Frequenzbereich transformiert, entstört und danach rücktransformiert werden und zur Entstörung der aufgenommenen und störbehafteten Audiosignale die Störanteile durch einen Algorithmus entfernt werden, wobei die Schallenergie der Audiosignale dem Quadrat der Signalamplituden der Audiosignale entspricht, dahingehend zu verbessern, dass die Schallenergie oder die Signalamplitude der störenden Anteile eines jeweils nachfolgenden Signalframes in Abhängigkeit der Nachhallzeit bestimmt wird und weiterhin ein Signalamplituden- oder Signalenergieverhältnis RD von störenden Anteilen zu ungestörten Anteilen bestimmt wird, wobei die Signalamplitude oder die Schallenergie der störenden Anteile mit RD gewichtet wird und die so bestimmten und gewichteten Störanteile vom nachfolgenden Signalframe entfernt werden.Corresponding In accordance with this inventive concept, the inventors propose the known one Method for filtering of audio signals of a communication device, wherein the communication device audio signals different frequencies, which disturbing shares, preferably in the form of reverberation and echo, superimposed and the reverberation time is determined at which the audio signals divided into individual consecutive time blocks (= signal frames) and then transformed from the time domain to the frequency domain, suppressed and then transformed back and to suppress the recorded and noisy Audio signals the interference components be removed by an algorithm where the sound energy the audio signals correspond to the square of the signal amplitudes of the audio signals, to improve the sound energy or the signal amplitude the disturbing Shares of a respective subsequent signal frame in dependence the reverberation time is determined and further a signal amplitude or signal energy ratio RD of disturbing Shares to undisturbed Shares is determined, the signal amplitude or the sound energy the disturbing Shares are weighted with RD and the so determined and weighted interference components be removed from the subsequent signal frame.

Hierdurch lässt sich das störbehaftete Audiosignal um die Anteile reduzieren, die nicht vom störfreien Direktschall, sondern vom Nachhall herrühren. Die Reduktion des Hallanteiles erfolgt blockweise in dem gewünschten Frequenzbereich, ähnlich wie die Reduktion von Hintergrundgeräuschen bei den bekannten Störgeräuschunterdrückungsverfahren. Bei der Störgeräuschunterdrückung wird auf folgende Literaturstelle verwiesen, deren gesamte Inhalt in diese Anmeldung übernommen wird: Rainer Martin: "Spectral Subtraction Based on Minimum Statistics" in Signal Processing VII: Theories and Applications M. Holt, C. Cowan, P. Grant, W. Sandham (Eds.), (c) 1994 European Association for Signal Processing) Das Verfahren eignet sich besonders gut für Kommunikationsendgeräte, wie zum Beispiel für Funkgeräte, Mobilfunkgeräte oder Festnetztelefone. Aber auch für Stand-Alone-Geräte, die Audiosignale über einen Lautsprecher ausgeben und auch Audiosignale über ein Mikrofon aufnehmen können, ist das Verfahren geeignet, die sich durch die Umgebungsbedingung des Stand-Alone-Gerätes ergebende Störanteile zu entstören.hereby let yourself the noisy one To reduce the audio signal by the portions that are not from the interference-free Direct sound, but come from the reverberation. The reduction of the reverb content takes place in blocks in the desired Frequency range, similar like the reduction of background noise in the known noise reduction methods. When noise reduction is Reference is made to the following literature, the entire contents of which are incorporated herein by reference accepted this application will: Rainer Martin: "Spectral Subtraction Based on Minimum Statistics "in Signal Processing VII: Theories and Applications M. Holt, C. Cowan, P. Grant, W. Sandham (Eds.), (c) 1994 European Association for Signal Processing) The procedure is especially good for Communication terminals, like for example Radios, mobile devices or Landline telephones. But also for Stand-alone devices that Audio signals via output a speaker and also audio signals via a Can record a microphone, the method is suitable, which is determined by the ambient conditions of the Stand-alone device resulting interference components to suppress.

Die Nachhallzeit kann im neuen Verfahren frequenzabhängig bestimmt werden. Analog dazu kann das Signalamplitudenverhältnis RD frequenzabhängig bestimmt werden.The Reverberation time can be determined frequency-dependent in the new process. Analogous For this purpose, the signal amplitude ratio RD can be determined as a function of frequency become.

Die frequenzabhängige Bestimmung von Nachhallzeit und/oder Signalamplitudenverhältnis ermöglicht eine verbesserte Bestimmung der Störanteile, zum Beispiels des Nachhalls, insbesondere dann, wenn die Nachhallzeiten des Raumes für unterschiedliche Frequenzen stark variieren. Dies führt dann zu einer verbesserten Störgeräuschreduzierung und damit zu einer höheren Qualität des entstörten Ausgangssignals.The frequency-dependent Determination of reverberation time and / or signal amplitude ratio allows a improved determination of the noise components, for example, the reverberation, especially when the reverberation times of the room for different frequencies vary greatly. This then leads to an improved noise reduction and thus to a higher one quality of the disturbed one Output signal.

Der Algorithmus, der zur Entstörung der aufgenommenen und störbehafteten Audiosignale verwendet wird, kann die Störanteile spektral subtrahieren. Somit können Energieanteile auftreten, die durch die Subtraktion negative Werte ergeben und von dem Algorithmus zu Null gesetzt werden. Alternativ können durch den Algorithmus initiiert die Audiosignale frequenzabhängig mit einem Faktor multipliziert werden. Dieser Faktor liegt im Bereich zwischen Null und Eins. Der Faktor ist nahe Null, wenn im zugehörigen Frequenzbereich des Audiosignals der Störanteil eine ähnlich hohe oder gar eine höhere Energie besitzt als das Audiosignal. Der Faktor ist gleich eins, wenn im zugehörigen Frequenzbereich nahezu oder gar kein Störanteil vorhanden ist.Of the Algorithm for filtering the recorded and interference-prone Audio signals is used, can spectrally subtract the noise components. Thus, you can Energy shares occur by subtracting negative values and set to zero by the algorithm. alternative can The algorithm initiates the audio signals in a frequency-dependent manner multiplied by a factor. This factor is in the range between zero and one. The factor is close to zero, if in the associated frequency range of the audio signal the noise component a similar one high or even higher Energy possesses as the audio signal. The factor is one, if in the associated frequency range almost or no noise component is available.

Im neuen Verfahren kann zur Transformation der Audiosignale vom Zeitbereich in den Frequenzbereich eine Fouriertransformation oder eine Diskrete Cosinus Transformation (DCT) oder eine Modulated Complex Lapped Transformation (MCLT) verwendet werden. Speziell zur MCLT wird auf folgende Literatur verwiesen: Henrique S. Malvar: „A modulated complex lapped transform and its application to audio processing", Proc. ICASSP, pp. 1421–1424, 1999.in the new method can be used to transform the audio signals from the time domain in the frequency domain a Fourier transform or a discrete Cosine Transformation (DCT) or a Modulated Complex Lapped Transformation (MCLT) can be used. Especially for the MCLT will open following literature: Henrique S. Malvar: "A modulated complex lapped transform and its application to audio processing ", Proc. ICASSP, pp. 1421-1424, 1999.

Es ist günstig, wenn die Audiosignale in einen Betragsanteil und einen Phasenanteil aufgeteilt werden. Aus dem Betragsanteil des Audiosignals kann relativ einfach die Signalenergie ermittelt werden, wodurch entsprechend eine frequenzabhängige Energiedämpfung ermöglicht wird. Der Phasenanteil bleibt unverändert.It is cheap, when the audio signals in a magnitude portion and a phase portion be split. From the amount portion of the audio signal can be relative simply the signal energy can be determined, which accordingly a frequency-dependent energy attenuation is enabled. The phase content remains unchanged.

Der zeitliche Verlauf der Schallenergie des Störsignals E(f, n) kann gemäß folgender Formel modelliert werden: E(f, n) = E(f, n–1) e–A(f)+ S(f, n), wobei E(f, n-1) die frequenzabhängige Energie des Signalframes mit dem Index n–1 zu einem bestimmten Zeitpunkt ist und A(f) ein Faktor, der durch die Nachhallzeit bestimmt wird und S(f, n) der frequenzabhängigen Energie des entstörten Signalframes mit dem Index n entspricht.The time course of the sound energy of the interference signal E (f, n) can be modeled according to the following formula: E (f, n) = E (f, n-1) e -A (f) + S (f, n), where E (f, n-1) is the frequency-dependent energy of the signal frame having the index n-1 at a certain time, and A (f) is a factor determined by the reverberation time and S (f, n) is the frequency-dependent energy of the noise suppressed Signal frames with the index n corresponds.

Weiterhin ist es günstig, wenn die Nachhallzeit aus dem energetischen Abfall des Nachhalls berechnet wird, wobei die Information über die Geschwindigkeit dieses Abfalls in der Raumimpulsantwort enthalten ist. Die Raumimpulsantwort ist beispielsweise für ein diracartiges Audiosignal (= peakartiger und eng begrenzter Impuls), der Schalldruckverlauf über der Zeit in einem bestimmten Raum. Hierdurch kann eine genauere Bestimmung der Nachhallzeit gegenüber der statistisch basierten Schätzung der Nachhallzeit erfolgen.Farther is it cheap when the reverberation time from the energetic fall of the reverberation is calculated, the information about the speed of this Waste is included in the room impulse response. The room impulse response is for example a dirac-like audio signal (= peak-like and narrowly limited impulse), the sound pressure curve over time in a certain space. This can be a more accurate Determination of the reverberation time compared to the statistically based estimation of the Reverberation time.

Das Verfahren zur Entstörung, vorzugsweise zur Nachhallreduktion, kann besonders günstig durch ein zu ermittelndes Pegelverhältnis RD (f) gesteuert werden. Das Pegelverhältnis RD (f) gibt das Verhältnis zwischen störendem Anteil des Audiosignals und ungestörtem Audiosignal wieder. Es ist vorteilhaft, dieses Pegelverhältnis RD (f) durch einen geeigneten Algorithmus, welcher Informationen aus dem Betrag beziehungsweise der Energie des entstörten Signalframes benutzt, anzupassen. Im Falle der spektralen Subtraktion wird zum Beispiel der Wert RD (f) erhöht, solange keine oder weniger als 50 Prozent, vorzugsweise weniger als 25 Prozent, der Energie- oder Betragswerte der entstörten Signalframes negative Werte aufweisen. Hierdurch wird sichergestellt, dass nicht eine zu starke Dämpfung des Audiosignals erfolgt.The Method for interference suppression, preferably for reverberation reduction, can be particularly favorable by a level to be determined RD (f) are controlled. The level ratio RD (f) gives the ratio between disturbing Proportion of audio signal and undisturbed audio signal again. It is advantageous, this level ratio RD (f) by a suitable Algorithm, which information from the amount or the energy of the suppressed Signal frames used to adapt. In the case of spectral subtraction For example, the value RD (f) is increased as long as no or less than 50 percent, preferably less than 25 percent, of the energy or Amount values of the suppressed Signal frames have negative values. This will ensure that not too much damping of the audio signal.

Umgekehrt sollte das Pegelverhältnis RD (f) erniedrigt werden, sobald negative Werte für den Betrag der entstörten Signalframes auftreten. Hierdurch wird sichergestellt, dass eine ausreichende Dämpfung der Störanteile des Audiosignals erfolgt.Vice versa should the level ratio RD (f) are lowered as soon as negative values for the amount the disturbed Signal frames occur. This will ensure that a sufficient damping the disturbance parts of the audio signal.

Im Folgenden wird die Erfindung anhand bevorzugter Ausführungsbeispiele mit Hilfe der 1 bis 4 beschrieben, wobei in den Figuren die folgenden Abkürzungen verwendet werden: 1: Direktschall eines impulsartigen Audiosignals; 2: Echos; 3: Diffuser Nachhall/Nachhallkurve; 4: Verschiebung der Nachhallkurve; 5.1: Zeitabhängiges Eingangssignal; 5.2: Betragsanteil des Eingangssignals, das in den Frequenzbereich transformiert wurde; 5.2': Entstörter Betragsanteil des Eingangssignals; 5.3: Phasenanteil des Eingangssignals, das in den Frequenzbereich transformiert wurde; 5.4: Zeitabhängiges (entstörtes) Ausgangssignal; 6.1: Fast Fourier Transformation; 6.2: Inverse Fast Fourier Transformation; 7: Bestimmung und Anpassung des Pegelverhältnis RD (f) der Echos zum Direktschall; 7.1: Bestimmtes und angepasstes Pegelverhältnis RD(f); 8: Quadrierung; 8.1: Addieren des Energiewertes; 9: Schallenergie im Raum; 10: Berechnung des energetischen Abfalls der Schallenergie; 11: Wurzelwertbildung der Schallenergie; 11.1: Angepasster Amplitudenwert = Wurzelwert der angepassten Schallenergie; 12: Multiplikation; 12.1: Störsignalschätzung; 13: Subtraktion; A60: Energiebereich, in dem die Energie um 60 Dezibel abfällt; T60: Nachhallzeit.In the following the invention will be described with reference to preferred embodiments with the aid of 1 to 4 The following abbreviations are used in the figures: 1 : Direct sound of a pulse-like audio signal; 2 : Echoes; 3 : Diffuse reverberation / reverberation curve; 4 : Shift of the reverberation curve; 5.1 : Time-dependent input signal; 5.2 : Amount portion of the input signal that has been transformed into the frequency domain; 5.2 ' : Suppressed amount portion of the input signal; 5.3 : Phase component of the input signal transformed into the frequency domain; 5.4 : Time-dependent (interference-suppressed) output signal; 6.1 : Fast Fourier Transformation; 6.2 : Inverse Fast Fourier Transformation; 7 : Determination and adjustment of the level ratio RD (f) of the echoes to the direct sound; 7.1 : Specific and adjusted level ratio RD (f); 8th : Squaring; 8.1 : Adding the energy value; 9 : Sound energy in the room; 10 : Calculation of the energetic decrease of the sound energy; 11 : Rooting of the sound energy; 11.1 : Adjusted amplitude value = root value of the adjusted sound energy; 12 : Multiplication; 12.1 : Noise signal estimation; 13 : Subtraction; A60: energy range in which the energy drops by 60 decibels; T60: reverberation time.

1: Zeitliche Energieverteilung eines ursprünglich impulsförmigen Audiosignals in einem Raum; 1 : Temporal energy distribution of an originally pulsed audio signal in a room;

2: Zeitliche Energieverteilung des selben Audiosignals aus 1, wobei zusätzlich die Verschiebung der Nachhallkurve in Abhängigkeit des Pegelverhältnisses zwischen Direktschall und Reflexionen dargestellt ist; 2 : Temporal energy distribution of the same audio signal 1 , wherein additionally the displacement of the reverberation curve is shown as a function of the level ratio between direct sound and reflections;

3: Blockschaltbild, welches das Verfahren zur Enthallung von Audiosignalen erläutert; 3 : Block diagram which explains the method for reverberating audio signals;

4: Blockschaltbild, welches ein weitere Durchführung des neuen Verfahren zur Enthallung von Audiosignalen erläutert. 4 : Block diagram, which explains a further implementation of the new method for reverberation of audio signals.

Die 1 zeigt exemplarisch in einem Diagramm die zeitliche Energieverteilung eines Audiosignals, die man in einem Raum mit einem Mikrofon aufnehmen und messen kann, wenn ein impulsartiges Audiosignal, zum Beispiel ein Knall, auftritt. Diese Energieverteilung erhält man, indem man das Betragsquadrat einer Raumimpulsantwort bildet und dieses logarithmiert.The 1 shows by way of example in a diagram the temporal energy distribution of an audio signal which can be recorded and measured in a room with a microphone when a pulse-like audio signal, for example a bang, occurs. This energy distribution is obtained by forming the absolute square of a spatial impulse response and logarithmizing it.

Auf der Ordinate des Diagramms sind die logarithmierten Signalamplituden, als Maß für die (Schall-)Energie des Audiosignals, und auf der Abszisse die Zeit, jeweils in willkürlichen Einheiten, aufgetragen.On the ordinate of the diagram are the logarithmized signal amplitudes, as a measure of the (sound) energy of the audio signal, and on the abscissa the time, each in arbitrary Units, applied.

Man erkennt als erste Linie ganz links im Diagramm den sogenannten Direktschall 1, welcher auf direktem Weg von der Schallquelle zum Messmikrofon gelangt. Dann folgen die in diesem Beispiel energetisch schwächeren Echos 2, die einmal oder zweimal an Wänden des Raumes reflektiert wurden, bevor sie zum Messmikrofon gelangen.You can see the so-called direct sound as the first line on the far left of the diagram 1 , which passes directly from the sound source to the measuring microphone. Then follow in this example energetically weaker echoes 2 that have been reflected once or twice on walls of the room before they reach the measuring microphone.

Zuletzt folgt, symbolisiert durch ein Dreieck, der diffuse Nachhall 3, welcher aus quasi chaotischen überlagerten Reflexionen des Audiosignals im Raum besteht und diffus am Messmikrofon eintrifft.Finally, followed by a triangle, the diffuse reverberation follows 3 , which consists of quasi-chaotic superimposed reflections of the audio signal in the room and diffusely arrives at the measuring microphone.

Auch die Nachhallzeit, meist mit T60 bezeichnet, die eine in der Akustik charakteristische Größe darstellt, ist der Energieverteilung des Audiosignals in der 1 zu entnehmen.The reverberation time, usually designated T60, which represents a characteristic in acoustics size, is the energy distribution of the audio signal in the 1 refer to.

Zur Bestimmung der Nachhallzeit wird in 1 auf der Ordinate des Diagramms ein Energiebereich A60 bestimmt, der im Bereich des diffusen Nachhalls 3 liegt, in dem die Energie des Nachhalls um 60 Dezibel abfällt. Der obere und der untere Grenzwert des Energiebereiches A60 werden zuerst auf die Nachhallkurve 3 und danach auf die Abszisse, also die Zeitachse, projiziert. Der projizierte Bereich auf der Zeitachse entspricht der Nachhallzeit T60.To determine the reverberation time, see 1 determined on the ordinate of the diagram, an energy range A60, which is in the range of diffuse reverberation 3 in which the energy of the reverberation drops by 60 decibels. The upper and lower limits of the energy range A60 are first applied to the reverberation curve 3 and then projected onto the abscissa, ie the time axis. The projected area on the time axis corresponds to the reverberation time T60.

In 2 wird wiederum exemplarisch die zeitliche Energieverteilung eines impulsartigen Audiosignals, zum Beispiel eines Knalles, dargestellt. Analog zu 1 sind auf der Ordinate des Diagramms die logarithmierten Signalamplituden, als Maß für die (Schall-)Energie des Audiosignals, und auf der Abszisse die Zeit, jeweils in willkürlichen Einheiten, aufgetragen. Entsprechend sind im Diagramm der 2 der Direktschall 1 und die Echos 2 dargestellt.In 2 Again, the temporal energy distribution of a pulse-like audio signal, for example a bang, is shown as an example. Analogous to 1 On the ordinate of the diagram are the logarithmized signal amplitudes, as a measure of the (sound) energy of the audio signal, and on the abscissa the time, in arbitrary units, is plotted. Accordingly, in the diagram of 2 the direct sound 1 and the echoes 2 shown.

Im Diagramm der 2 wird nun verdeutlicht, wie in Abhängigkeit der konkreten Situation, zum Beispiel abhängig vom Raum und vom Abstand zwischen Schallquelle und Mikrofon, sich das Pegelverhältnis oder Signalamplitudenverhältnis von Direktschall 1 zu Reflexionen 2 und Nachhall 3 verändert. Tendenziell werden in nur schwach halligen Räumen und bei geringer Entfernung zwischen Schallquelle und Mikrofon die Reflexionen 2 und der Nachhall 3 einen geringen Pegel bzw. eine geringe Amplitude im Vergleich zum Direktschall 1 haben, so dass die Nachhallkurve eher wie die weiß gestrichelte Linie (2) verläuft. Umgekehrt werden bei stark halligen Räumen und großer Entfernung zwischen Schallquelle und Mikrofon die Reflexionen 2 und der Nachhall 3 stärker sein, so dass die Nachhallkurve eher einem durch die schwarz gestrichelten Linie angegebenen Verlauf entspricht.In the diagram of 2 It now becomes clear how, depending on the specific situation, for example, depending on the space and the distance between the sound source and microphone, the level ratio or signal amplitude ratio of direct sound 1 to reflections 2 and reverberation 3 changed. The reflections tend to be in only slightly reverberant rooms and with a small distance between the sound source and the microphone 2 and the reverberation 3 a low level or a low amplitude compared to the direct sound 1 so that the reverberation curve is more like the white dashed line ( 2 ) runs. Conversely, in strongly reverberant rooms and long distances between the sound source and the microphone reflections 2 and the reverberation 3 be stronger, so that the reverberation curve rather corresponds to a course indicated by the black dashed line.

Dieses frequenzabhängige Pegelverhältnis oder Signalamplitudenverhältnis des Direktschalls 1 zum Nachhall 3, meist mit RD (f) (Reverberation to Direct Sound ratio = Verhältnis von Widerhall zu Direktschall) abgekürzt, beeinflusst die Nachhallkurve 3 entscheidend. Diese Tatsache wird beim neuen Verfahren zur Enthallung eines Audiosignals genutzt.This frequency-dependent level ratio or signal amplitude ratio of the direct sound 1 to the reverberation 3 , usually abbreviated to RD (f) (Reverberation to Direct Sound Ratio), affects the reverberation curve 3 crucial. This fact is exploited in the new method of reverberating an audio signal.

Die 3 zeigt ein Blockschaltbild, welches das neue Verfahren zur Enthallung von Audiosignalen erläutert. Ein zeitabhängiges Eingangssignal 5.1 wird blockweise aufgeteilt und im Block 6.1 nach Fourier transformiert. Das heißt, es findet eine Transformation der Signalblöcke oder auch Signalframes genannt vom Zeitbereich in den Frequenzbereich statt. Das Eingangssignal 5.1 wird in einen frequenzabhängigen Betragsanteil 5.2 und einen frequenzabhängigen Phasenanteil 5.3 aufgespalten. Der transformierte frequenzabhängige Phasenanteil 5.3 des Eingangssignals 5.1 bleibt unverändert. Lediglich auf den transformierten frequenzabhängigen Betragsanteil 5.2 des Eingangssignal 5.1 wird das neue Entstörverfahren angewendet, das weiter unten erläutert wird. Der entstörte Betragsanteil 5.2' und der unveränderte Phasenanteil 5.3 werden wieder zusammengeführt und im Block 6.2 einer inversen Fouriertransformation unterzogen, um eine Rücktransformation vom Frequenzbereich in den Zeitbereich zu erhalten. Das hierdurch entstörte Signal, also von Echo und Nachhall zumindest wesentlich reduzierte Signal, wird wieder als zeitabhängiges (entstörtes) Ausgangssignal 5.4 ausgegeben.The 3 shows a block diagram, which explains the new method for reverberation of audio signals. A time-dependent input signal 5.1 is split in blocks and in the block 6.1 transformed to Fourier. That is, there is a transformation of the signal blocks or signal frames called from the time domain in the frequency domain instead. The input signal 5.1 is in a frequency-dependent amount portion 5.2 and a frequency-dependent phase component 5.3 split. The transformed frequency-dependent phase component 5.3 of the input signal 5.1 stays unchanged. Only on the transformed frequency-dependent amount portion 5.2 the input signal 5.1 the new suppression method is used, which will be explained below. The suppressed amount share 5.2 ' and the unchanged phase proportion 5.3 are merged again and in the block 6.2 subjected to an inverse Fourier transform to obtain a back transformation from the frequency domain to the time domain. The thus interference-suppressed signal, ie at least substantially reduced signal from echo and reverberation, again becomes a time-dependent (interference-suppressed) output signal 5.4 output.

Im neuen Entstörverfahren werden die Störanteile der Signale in Abhängigkeit der frequenzabhängigen Energie verringert. Das neue Entstörverfahren wird folgendermaßen auf den frequenzabhängigen Betragsanteil 5.2 angewendet: Im Block mit dem Bezugszeichen 8 wird der entstörte Betragsanteil 5.2' quadriert, um eine Umwandlung der Amplitudensignale in Energiesignale zu bekommen.In the new suppression method, the interference components of the signals are reduced as a function of the frequency-dependent energy. The new interference suppression method is based on the frequency-dependent amount as follows 5.2 applied: In the block with the reference numeral 8th is the suppressed amount share 5.2 ' squared to get a conversion of the amplitude signals into energy signals.

Der nach der Quadrierung 8 erhaltene Energiewert wird – durch das Bezugszeichen 8.1 ausgedrückt – zur Schallenergie 9 addiert.The after squaring 8th obtained energy value is - by the reference numeral 8.1 expressed - to the sound energy 9 added.

Im Block 10 wird die frequenzabhängige Schallenergie 9 nach der Formel: E(f, n) = E(f, n–1) e–A(f) modelliert, wobei n dem Index des Signalframes und f dem Frequenzindex entspricht und der Faktor A(f) umgekehrt proportional zur Nachhallzeit ist und somit den zeitlichen Abfall der Energie beinhaltet.In the block 10 becomes the frequency-dependent sound energy 9 according to the formula: E (f, n) = E (f, n-1) e -A (f) where n is the index of the signal frame and f is the frequency index and the factor A (f) is inversely proportional to the reverberation time and thus includes the temporal decline of energy.

Im Block 11 wird der so erhaltene angepasste Energiewert durch Wurzelziehen in einen angepassten Amplitudenwert 11.1 umgewandelt.In the block 11 the adjusted energy value thus obtained is converted into an adjusted amplitude value by root extraction 11.1 transformed.

Im Block 7 wird aus dem entstörten Betragsanteil 5.2' des Eingangssignals 5.1 das Pegel- oder Amplitudenverhältnis RD (f) 7.1 zwischen Echo und Direktschall bestimmt und angepasst.In the block 7 is from the suppressed amount share 5.2 ' of the input signal 5.1 the level or amplitude ratio RD (f) 7.1 determined and adapted between echo and direct sound.

Das Pegel- oder Amplitudenverhältnis RD (f) 7.1 und der angepasste Amplitudenwert 11.1 werden im Block 12 miteinander multipliziert. Das so berechnete Signalframe 12.1 entspricht dem geschätzten Störanteil. Dieser Störanteil wird schließlich im Block 13 vom frequenzabhängigen Betragsanteil 5.2 des Einganssignals 5.1 subtrahiert. Hierdurch werden die Störanteile, wie Nachhall und Echo, weitestgehend aus dem Einganssignals 5.1 entfernt und somit eine Entstörung erreicht.The level or amplitude ratio RD (f) 7.1 and the adjusted amplitude value 11.1 be in the block 12 multiplied by each other. The signal frame calculated in this way 12.1 corresponds to the estimated noise component. This piece of noise is finally in the block 13 from the frequency dependent amount share 5.2 of the input signal 5.1 subtracted. As a result, the interference components, such as reverberation and echo, largely from the Einganssignals 5.1 removed and thus achieved a filtering.

Treten nach der Subtraktion 13 negative Werte für den Betragsanteil 5.2 der Signalframes auf, das heißt der Algorithmus subtrahiert zu viel Energie, so wird der Faktor RD (f) 7.1 verringert, ansonsten wird eine langsame Erhöhung durchgeführt.Join after the subtraction 13 negative values for the amount share 5.2 the signal frames on, that is the algorithm subtracts too much energy, the factor RD (f) 7.1 decreases, otherwise a slow increase is performed.

Das Blockschaltbild in der 4 beschreibt eine weitere Möglichkeit der Durchführung des neuen Verfahren zur Enthallung von Audiosignalen. Im Unterschied zur 3 wird bereits nach der Aufteilung des Eingangssignals 5.1 in den Betragsanteil 5.2 und den Phasenanteil 5.3 eine Quadrierung 8 des Betragsanteil 5.2 des Eingangssignals durchgeführt. Es werden also die Signalamplituden des Betragsanteil 5.2 in Schallenergien umgerechnet.The block diagram in the 4 describes another way of implementing the new method for reverberating audio signals. In contrast to 3 is already after the split of the input signal 5.1 in the amount share 5.2 and the phase proportion 5.3 a squaring 8th the amount share 5.2 of the input signal. So it will be the signal amplitudes of the amount share 5.2 converted into sound energies.

Das Entfernen der störbehafteten Audiosignalamteile erfolgt unter den Blöcken 7, 9, 10, 12 und 13 analog, wie in 3 beschrieben.The removal of the noisy audio signal parts is done under the blocks 7 . 9 . 10 . 12 and 13 analogous, as in 3 described.

Vor der Zusammenführung des entstörten Betragsanteils 5.2' und des unveränderten Phasenanteils 5.3 wird durch Wurzelwertbildung 11 des entstörten Betragsanteils 5.2' eine Rückumwandlung von „Schallenergie" in „Signalamplituden" durchgeführt. Danach werden die zusammengeführten Signalamplituden des entstörten Betragsanteils 5.2' und des unveränderten Phasenanteils 5.3 im Block 6.2 einer inversen Fouriertransformation unterzogen, um dann eine Rücktransformation vom Frequenzbereich in den Zeitbereich zu erhalten. Das hierdurch entstörte Signal, also von Echo und Nachhall zumindest wesentlich reduzierte Signal, wird wieder als zeitabhängiges (entstörtes) Ausgangssignal 5.4 ausgegeben.Before merging the suppressed amount share 5.2 ' and the unchanged phase component 5.3 is through rooting 11 of the suppressed amount share 5.2 ' a re-conversion of "sound energy" in "signal amplitudes" performed. Thereafter, the merged signal amplitudes of the suppressed amount portion 5.2 ' and the unchanged phase component 5.3 in the block 6.2 subjected to an inverse Fourier transform, to then obtain a back transformation from the frequency domain to the time domain. The thus interference-suppressed signal, ie at least substantially reduced signal from echo and reverberation, again becomes a time-dependent (interference-suppressed) output signal 5.4 output.

Insgesamt wird durch das neue Verfahren ein Audiosignal wesentlich genauer als bisher entstört.All in all the audio signal will be much more accurate due to the new procedure as previously suppressed.

Es versteht sich, dass die vorstehend genannten Merkmale der Erfindung nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder in Alleinstellung verwendbar sind, ohne den Rahmen der Erfindung zu verlassen.It it is understood that the above features of the invention not only in the specified combination, but also in others Combinations or alone, without the frame to leave the invention.

Claims (11)

Verfahren zur Entstörung von Audiosignalen (1, 5.1) eines Kommunikationsgerätes, wobei das Kommunikationsgerät Audiosignale (1, 5.1) verschiedener Frequenzen aufnimmt, denen störende Anteile, vorzugsweise in Form von Nachhall (3) und Echo (2) überlagert sind und die Nachhallzeit (T60) bestimmt wird, bei dem die Audiosignale (1, 5.1) in einzelne aufeinanderfolgende Zeitblöcke (= Signalframes) aufgeteilt werden und dann vom Zeitbereich in den Frequenzbereich transformiert (6.1), entstört und danach rücktransformiert (6.2) werden und zur Entstörung der aufgenommenen und störbehafteten Audiosignale (1, 5.1) die Störanteile (2, 3) durch einen Algorithmus entfernt werden, wobei die Schallenergie der Audiosignale (1, 5.1) dem Quadrat der Signalamplituden der Audiosignale (1, 5.1) entspricht, dadurch gekennzeichnet, dass die Schallenergie der störenden Anteile (2, 3) eines jeweils nachfolgenden Signalframes in Abhängigkeit der Nachhallzeit (T60) bestimmt wird und weiterhin ein Signalamplitudenverhältnis RD (7.1) von störenden Anteilen (2, 3) zu ungestörten Anteilen (1) bestimmt wird (7), wobei die Schallenergie der störenden Anteile (2, 3) mit RD (7.1) gewichtet (12) wird und die so bestimmten und gewichteten Störanteile (12.1) vom nachfolgenden Signalframe entfernt werden (13).Method for interference suppression of audio signals ( 1 . 5.1 ) of a communication device, wherein the communication device audio signals ( 1 . 5.1 ) of different frequencies, which disturbing shares, preferably in the form of reverberation ( 3 ) and echo ( 2 ) and the reverberation time (T60) is determined at which the audio signals ( 1 . 5.1 ) are divided into individual successive time blocks (= signal frames) and then transformed from the time domain into the frequency domain ( 6.1 ), and then back-transformed ( 6.2 ) and for interference suppression of recorded and noisy audio signals ( 1 . 5.1 ) the interference components ( 2 . 3 ) are removed by an algorithm whereby the sound energy of the audio signals ( 1 . 5.1 ) the square of the signal amplitudes of the audio signals ( 1 . 5.1 ), characterized in that the sound energy of the disturbing components ( 2 . 3 ) of a respective subsequent signal frame as a function of the reverberation time (T60) is determined, and further a signal amplitude ratio RD ( 7.1 ) of disturbing shares ( 2 . 3 ) to undisturbed shares ( 1 ) is determined ( 7 ), wherein the sound energy of the disturbing components ( 2 . 3 ) with RD ( 7.1 weighted ( 12 ) and the thus determined and weighted noise components ( 12.1 ) are removed from the subsequent signal frame ( 13 ). Verfahren gemäß dem voranstehenden Patentanspruch 1, dadurch gekennzeichnet, dass die Nachhallzeit (T60) frequenzabhängig bestimmt wird.Method according to the preceding Claim 1, characterized in that the reverberation time (T60) frequency dependent is determined. Verfahren gemäß einem der voranstehenden Patentansprüche 1 und 2, dadurch gekennzeichnet, dass das Signalamplitudenverhältnis RD (7) frequenzabhängig bestimmt wird.Method according to one of the preceding claims 1 and 2, characterized in that the signal amplitude ratio RD ( 7 ) is determined frequency dependent. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 3, dadurch gekennzeichnet, dass der Algorithmus die Störanteile spektral subtrahiert (13).Method according to one of the preceding claims 1 to 3, characterized in that the algorithm spectrally subtracts the interference components ( 13 ). Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 4, dadurch gekennzeichnet, dass der Algorithmus die Audiosignale (1, 5.1) frequenzabhängig mit einem Faktor multipliziert.Method according to one of the preceding claims 1 to 4, characterized in that the algorithm the audio signals ( 1 . 5.1 ) Frequency-dependent multiplied by a factor. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 5, dadurch gekennzeichnet, dass zur Transformation der Audiosignale (1, 5.1) vom Zeitbereich in den Frequenzbereich eine Fouriertransformation (6.1) oder eine Diskrete Cosinus Transformation (DCT) oder eine Modulated Complex Lapped Transformation (MCLT) verwendet wird.Method according to one of the preceding claims 1 to 5, characterized in that for the transformation of the audio signals ( 1 . 5.1 ) from the time domain into the frequency domain a Fourier transformation ( 6.1 ) or a Discrete Cosine Transformation (DCT) or a Modulated Complex Lapped Transformation (MCLT). Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 6, dadurch gekennzeichnet, dass die Audiosignale (1, 5.1) in einen Betragsanteil (5.2) und einen Phasenanteil (5.3) aufgeteilt werden.Method according to one of the preceding claims 1 to 6, characterized in that the audio signals ( 1 . 5.1 ) in an amount ( 5.2 ) and a phase portion ( 5.3 ). Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 7, dadurch gekennzeichnet, dass der zeitliche Verlauf der Schallenergie E(f, n) des Störsignals gemäß folgender Formel modelliert (10) wird: E(f, n) = E(f, n–1) e–A(f) + S(f, n), wobei E(f, n–1) die frequenzabhängige Energie des Signalframes mit dem Index n–1 zu einem bestimmten Zeitpunkt ist und A(f) ein Faktor, der durch die Nachhallzeit (T60) bestimmt wird und S(f, n) der frequenzabhängigen Energie des entstörten Signalframes mit dem Index n entspricht.Method according to one of the preceding claims 1 to 7, characterized in that the time profile of the sound energy E (f, n) of the interference signal is modeled (10) according to the following formula: E (f, n) = E (f, n-1 ) e -A (f) + S (f, n), where E (f, n-1) is the frequency dependent energy of the signal frame with the index n-1 at a given time and A (f) is a factor that is determined by the reverberation time (T60) is determined and S (f, n) corresponds to the frequency-dependent energy of the suppressed signal frame with the index n. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 8, dadurch gekennzeichnet, dass die Nachhallzeit (T60) aus dem energetischen Abfalls (A60) des Nachhalls (3) einer Raumimpulsantwort berechnet wird.Method according to one of the preceding claims 1 to 8, characterized in that the reverberation time (T60) from the energetic waste (A60) of the reverberation (A60) 3 ) of a room impulse response is calculated. Verfahren gemäß Anspruch 7, dadurch gekennzeichnet, dass das Signalamplitudenverhältnis RD (7.1) erhöht wird, solange keine oder weniger als 50 Prozent, vorzugsweise weniger als 25 Prozent, der Betragswerte der entstörten Signalframes (5.2') negative Werte aufweisen.A method according to claim 7, characterized in that the signal amplitude ratio RD ( 7.1 ), as long as no or less than 50 percent, preferably less than 25 percent, of the magnitude values of the suppressed signal frames ( 5.2 ' ) have negative values. Verfahren gemäß Anspruch 7, dadurch gekennzeichnet, dass das Signalamplitudenverhältnis RD (7.1) erniedrigt wird, sobald negative Werte für den Betrag der entstörten Signalframes (5.2') auftreten.Method according to claim 7, characterized in that the signal amplitude ratio RD ( 7.1 ) is lowered as soon as negative values for the amount of suppressed signal frames ( 5.2 ' ) occur.
DE10356063A 2003-12-01 2003-12-01 Method for interference suppression of audio signals Expired - Fee Related DE10356063B4 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE10356063A DE10356063B4 (en) 2003-12-01 2003-12-01 Method for interference suppression of audio signals
PCT/EP2004/012101 WO2005062298A1 (en) 2003-12-01 2004-10-26 Method for suppressing the interference of audio signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10356063A DE10356063B4 (en) 2003-12-01 2003-12-01 Method for interference suppression of audio signals

Publications (2)

Publication Number Publication Date
DE10356063A1 DE10356063A1 (en) 2005-06-30
DE10356063B4 true DE10356063B4 (en) 2005-08-18

Family

ID=34625448

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10356063A Expired - Fee Related DE10356063B4 (en) 2003-12-01 2003-12-01 Method for interference suppression of audio signals

Country Status (2)

Country Link
DE (1) DE10356063B4 (en)
WO (1) WO2005062298A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011110239A1 (en) * 2010-03-10 2011-09-15 Siemens Medical Instruments Pte. Ltd. Reverberation reduction for signals in a binaural hearing apparatus

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69420027T2 (en) * 1993-02-12 2000-07-06 British Telecomm NOISE REDUCTION

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3786188A (en) * 1972-12-07 1974-01-15 Bell Telephone Labor Inc Synthesis of pure speech from a reverberant signal

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69420027T2 (en) * 1993-02-12 2000-07-06 British Telecomm NOISE REDUCTION

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MARTIN, R.: Spectral Subtraction Based on Minimum Statistics, EUSIPCO-94, Edinburgh, Scotland, 13.-16. September 1994, S. 1182-1185 *
Matheboard.de: Absoluter Betrag Definition - Er- klärung im Mathe Lexikon. Im Internet: <http://www .matheboard.de/lexikon/Absoluter_Betrag.definition .htm>
Matheboard.de: Absoluter Betrag Definition - Er- klärung im Mathe Lexikon. Im Internet: <http://www.matheboard.de/lexikon/Absoluter_Betrag.definition.htm> *

Also Published As

Publication number Publication date
DE10356063A1 (en) 2005-06-30
WO2005062298A1 (en) 2005-07-07

Similar Documents

Publication Publication Date Title
DE60027438T2 (en) IMPROVING A HARMFUL AUDIBLE SIGNAL
EP1143416B1 (en) Time domain noise reduction
EP0912974B1 (en) Method of reducing voice signal interference
DE602005000539T2 (en) Gain-controlled noise cancellation
DE60116255T2 (en) NOISE REDUCTION DEVICE AND METHOD
DE19747885B4 (en) Method for reducing interference of acoustic signals by means of the adaptive filter method of spectral subtraction
EP0698986B1 (en) Method for adaptive echo compensation
DE60131639T2 (en) Apparatus and methods for determining noise cancellation performance values for a voice communication system
EP2158588B1 (en) Spectral smoothing method for noisy signals
DE102008039330A1 (en) Apparatus and method for calculating filter coefficients for echo cancellation
DE4330143A1 (en) Arrangement for signal processing of acoustic input signals
DE10119277A1 (en) Masking noise modulation and interference noise in non-speech intervals in telecommunication system that uses echo cancellation, by inserting noise to match estimated level
EP1103956B1 (en) Exponential reduction of echo and noise during speech pauses
DE112007003674T5 (en) Method and apparatus for single-channel speech enhancement based on a latency-reduced auditory model
DE10043064B4 (en) Method and device for eliminating loudspeaker interference from microphone signals
EP1155561B1 (en) Method and device for suppressing noise in telephone devices
EP2080197B1 (en) Apparatus for noise suppression in an audio signal
DE10137348A1 (en) Noise filtering method in voice communication apparatus, involves controlling overestimation factor and background noise variable in transfer function of wiener filter based on ratio of speech and noise signal
DE10356063B4 (en) Method for interference suppression of audio signals
EP0669606A2 (en) Method for noise reduction in disturbed voice channels
DE102019105458B4 (en) System and method for time delay estimation
DE19729521A1 (en) Noise and echo suppression method especially for hands-free apparatus
DE10016619A1 (en) Interference component lowering method involves using adaptive filter controlled by interference estimated value having estimated component dependent on reverberation of acoustic voice components
DE10342307B4 (en) Method for interference suppression of transmitted audio signals between telecommunication terminals
EP1519618B1 (en) Method and communication equipment with means for audio signals interference suppression

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee