DE19948308C2

DE19948308C2 - Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung

Info

Publication number: DE19948308C2
Application number: DE19948308A
Authority: DE
Inventors: Dietmar Ruwisch
Original assignee: CORTOLOGIC AG
Current assignee: RUWISCH, DIETMAR, DR., 12557 BERLIN, DE
Priority date: 1999-10-06
Filing date: 1999-10-06
Publication date: 2002-05-08
Anticipated expiration: 2019-10-07
Also published as: EP1091349A3; US6820053B1; DE19948308A1; TW482993B; CA2319995C; EP1091349B1; ATE289110T1; EP1091349A2; DE50009461D1; CA2319995A1

Description

Die Erfindung betrifft ein Verfahren und eine Vorrich tung zur Geräuschunterdrückung bei der Sprachübertra gung durch ein mehrschichtiges, selbstorganisierendes, rückgekoppeltes neuronales Netzwerk.

Mit einem derartigen Verfahren, wie es aus der DE 43 09 985 A1 bekannt ist, soll das bei der Telekommunikation sowie bei der Aufzeichnung von Sprache in tragbaren Speichergeräten auftretende Problem gelöst werden, daß die Sprachverständlichkeit durch Störgeräusche stark beeinträchtigt ist. Insbesondere beim Telefonieren im Auto mit Hilfe einer Freisprecheinrichtung ist dieses Problem evident. Zur Unterdrückung der Störgeräusche werden Filter in den Signalweg eingebaut. Klassische Bandpaßfilter bieten nur einen geringen Nutzen, da Störgeräusche im allgemeinen in denselben Frequenzbe reichen liegen wie das Sprachsignal. Daher werden adap tive Filter benötigt, die sich selbständig den vorhan denen Störgeräuschen und den Eigenschaften des zu über tragenden Sprachsignals anpassen. Hierzu sind verschie dene Konzepte bekannt, beispielsweise mehrschichtige, rückgekoppelte neurale Netzwerke, wie aus der DE 694 14 752 T2 bekannt sind.

Ferner ist aus der optimalen Filtertheorie das Wiener- Komolgorov-Filter abgeleitet, wie es in S. V. Vaseghi, Advanced Signal Processing and Digital Noise Reduction", John Wiley and Teubner-Verlag, 1996 beschrieben ist. Dieses Verfahren basiert auf der Minimierung des mittleren quadratischen Fehlers zwischen dem tatsächli chen und dem erwarteten Sprachsignal. Dieses Filterkon zept erfordert einen erheblichen Rechenaufwand. Außer dem ist, wie bei den meisten bekannten Verfahren, ein stationäres Störsignal theoretische Voraussetzung.

Ein ähnliches Filterprinzip liegt dem Kalman-Filter zu grunde, wie es in E. Wan and A. Nelson, Removal of noi se from speech using the Dual Extended Kalman Filter algorithm, Proceedings of the IEEE International Confe rence on Acoustics and Signal Processing (ICASSP '98), Seattle 1998 beschrieben ist. Nachteilig bei diesem Filterkonzept wirkt sich die lange Trainingszeit aus, die benötigt wird, um die Filterparameter zu ermitteln.

Ein weiteres Filterkonzept ist aus H. Hermansky and N. Morgan, RASTA processing of speech, IEEE Transactions on Speech and Audio Processing, Vol. 2, No. 4, p. 587, 1994, bekannt. Auch bei diesem Verfahren ist eine Trai ningsprozedur erforderlich, außerdem erfordern unter schiedliche Störgeräusche verschiedene Parameterein stellungen.

Ein als LPC bekanntes Verfahren benötigt die aufwendige Berechnung von Korrelationsmatrizen, um mit Hilfe eines linearen Prädiktionsverfahrens Filterkoeffizienten zu berechnen, wie aus T. Arai, H. Hermansky, M. Paveland, C. Avendano, Intelligibility of Speech with Filtered Time Trajectories of LPC Cepstrum, The Journal of the Acoustical Society of Maerica, Vol. 100, No. 4, Pt. 2, p. 2756, 1996, bekannt ist.

Andere bekannte Verfahren setzen neuronale Netzwerke vom Typ eines mehrschichtigen Perzeptrons zur Sprachverstärkung ein, so wie in H. Hermansky, E. Wan, C. Avendano, Speech Enhancement Based an Temporal Proces sing. Proceedings of the IEEE International Conference an Acoustics and Signal Processing (ICASSP '95), De troit, 1995, beschrieben.

Aus der DE 197 28 756 A1 ist es schließlich bekannt, Halbleiter mittels Diffusion zu dotieren, um sie mit bestimmten elektrischen Eigenschaften zu versehen. Hierbei entstehen fest vorgegebene Einstellungen der Gewichte eines neuronalen Netzwerkes; für eine adaptive Geräuschunterdrückung ist dies ungeeignet.

Aufgabe der vorliegenden Erfindung ist es, ein Verfah ren zu schaffen, das mit geringem Rechenaufwand ein Sprachsignal an seinen zeitlichen und spektralen Eigen schaften erkennt und von Störgeräuschen befreit werden kann.

Gelöst wird diese Aufgabe dadurch, daß eine Minimade tektionsschicht, eine Reaktionsschicht, eine Diffusi onsschicht und eine Integrationsschicht eine Filter funktion F(f,T) zur Geräuschfilterung bestimmen.

Ein derart ausgelegtes Netzwerk erkennt ein Sprachsi gnal an seinen zeitlichen und spektralen Eigenschaften und befreit dieses von Störgeräuschen. Im Vergleich zu bekannten Verfahren ist der benötigte Rechenaufwand ge ring. Das Verfahren zeichnet sich durch eine besonders kurze Adaptionszeit aus, innerhalb derer sich das Sy stem auf die Art des Störgeräusches einstellt. Die Si gnalverzögerung bei der Verarbeitung des Signals ist sehr kurz, so daß das Filter im Echtzeitbetrieb für Te lekommunikation einsatzfähig ist.

Weitere vorteilhafte Maßnahmen sind in den Unteransprü chen beschrieben. Die Erfindung ist in der beiliegenden Zeichnung dargestellt und wird nachfolgend näher be schrieben; es zeigt:

Fig. 1 das Gesamtsystem zur Sprachfilterung;

Fig. 2 ein eine Minimadetektions-Schicht, eine Reaktions-Schicht, eine Diffusions- Schicht und eine Integrations-Schicht enthaltendes neuronales Netzwerk;

Fig. 3 ein Neuron der Minima-Detektions-Schicht, welche M(f,T) ermittelt;

Fig. 4 ein Neuron der Reaktions-Schicht, welches mit Hilfe einer Reaktionsfunktion x[S(T- 1)] aus dem Integralsignal S(T-1) und ei nem frei wählbaren Parameter K, welcher den Grad der Geräuschunterdrückung be stimmt, aus A(f,T) und M(f,T) das Rela tivspektrum R(f,T) ermittelt;

Fig. 5 Neuronen der Diffusionsschicht, in wel cher eine der Diffusion entsprechende, lokale Kopplung zwischen den Moden herge stellt wird;

Fig. 6 ein Neuron der gezeigte Ausführung der Integrationsschicht;

Fig. 7 ein Beispiel für Filtereigenschaften der Erfindung bei verschiedenen Einstellungen des Kontrollparameters K.

Der in der Fig. 1 schematisch und beispielhaft darge stellte Gesamtsystem zur Sprachfilterung. Dieses be steht aus einer Samplingeinheit 10, die das geräuschbe haftete Sprachsignal in der Zeit t abtastet und diskre tisiert und somit Samples x(t) erzeugt, die in der Zeit T zu Frames aus n Samples zusammengefaßt werden.

Von jedem Frame wird mittels Fouriertransformiation das Spektrum A(f,T) zur Zeit T ermittelt und einer Filtereinheit 11 zugeführt, die mit Hilfe eines neuronalen Netzwerks, wie es in der Fig. 2 dargestellt ist, eine Filterfunktion F(f,T) berechnet, mit der das Spektrum A(f,T) des Signals multipliziert wird, um das ge räuschbefreite Spektrum B(f,T) zu erzeugen. Anschlie ßend wird das so gefilterte Signal einer Syntheseein heit (12) übergeben, die mittels inverser Fouriertrans formation aus dem gefilterten Spektrum B(f,T) das ge räuschbefreite Sprachsignal y(t) synthetisiert.

Die Fig. 2 zeigt ein eine Minimadetektions-Schicht, eine Reaktions-Schicht, eine Diffusions-Schicht und ei ne Integrations-Schicht enthaltende neuronales Netz werk, welchem das Spektrum A(f,T) des Eingangssignals zu geführt wird, woraus die Filterfunktion F(f,T) berech net wird. Jeder der Moden des Spektrums, die sich durch die Frequenz f unterscheiden, entspricht dabei ein ein zelnes Neuron pro Schicht des Netzwerks mit Ausnahme der Integrationsschicht. Die einzelnen Schichten werden in den folgenden Figuren genauer spezifiziert.

So zeigt Fig. 3 ein Neuron der Minima-Detektions- Schicht, welche M(f,T) ermittelt. M(f,T) ist in der Mo de mit Frequenz f das Minimum der über m Frames gemit telten Amplitude A(f,T) innerhalb eines Intervalls der Zeit T, welches der Länge von l Frames entspricht.

Fig. 4 zeigt ein Neuron der Reaktions-Schicht, welches mit Hilfe einer Reaktionsfunktion r[S(T-1)] aus dem In tegralsignal S(T-1), wie es in der Fig. 6 im Detail dargestellt ist, und einem frei wählbaren Parameter K, welcher den Grad der Geräuschunterdrückung bestimmt, aus A(f,T) und M(f,T) das Relativspektrum R(f,T) ermit telt. R(f,T) hat einen Wert zwischen null und eins. Die Reaktionsschicht unterscheidet Sprache von Geräuschen anhand des zeitlichen Verhaltens des Signals.

Fig. 5 zeigt ein Neuronen der Diffusionsschicht, in welcher eine der Diffusion entsprechende, lokale Kopp lung zwischen den Moden hergestellt wird. Die Diffusi onskonstante D bestimmt dabei die Stärke der resultie renden Glättung über den Frequenzen f bei festgehalte ner Zeit T. Die Diffusionsschicht bestimmt aus dem Re lativsignal R(f,T) die eigentliche Filterfunktion F(f,T), mit der das Spektrum A(f,T) multipliziert wird, um Störgeräusche zu eliminieren. In der Diffusions schicht wird Sprache von Geräuschen anhand spektraler Eigenschaften unterschieden.

Fig. 6 zeigt das in der gewählten Ausführung der Er findung einzige Neuron der Integrationsschicht, das die Filterfunktion F(f,T) bei festgehaltener Zeit T über die Frequenzen f integriert und das so erhaltene Inte gralsignal S(T) in die Reaktionsschicht zurückkoppelt, wie Fig. 2 zeigt. Diese globale Kopplung sorgt dafür, daß bei hohem Störpegel stark gefiltert wird, während geräuschfreie Sprache unverfälscht übertragen wird.

Fig. 7 zeigt beispielhafte Angabe der Filtereigen schaften der Erfindung für verschiedene Einstellungen des Kontrollparameters K. Die restlichen Parameter der Erfindung haben die Werte n = 256 Samples/Frame, m = 2.5 Frames, l = 15 Frames, D = 0.25. Die Abbildung zeigt die Dämpfung von amplitudenmoduliertem weißen Rauschen in Abhängigkeit der Modulationsfrequenz. Bei Modulations frequenzen zwischen 0.6 Hz und 6 Hz beträgt die Dämp fung weniger als 3 dB. Dieses Intervall entspricht der typischen Modulation menschlicher Sprache.

Die Erfindung wird im folgenden anhand eines Ausfüh rungsbeispiels näher erläutert. Zunächst wird ein Sprachsignal, das durch beliebige Störgeräusche beein trächtigt sei, in einer Sampling-Einheit 10 abgetastet und digitalisiert, wie die Fig. 1 zeigt. Auf diese Weise erhält man in der Zeit t die Samples x(t). Von diesen Samples werden jeweils n zu einem Frame zusam mengefaßt, von dem zur Zeit T mittels Fouriertransfor mation ein Spektrum A(f,T) berechnet wird.

Die Moden des Spektrums unterscheiden sich durch ihre Frequenz f. In einer Filtereinheit 11 wird aus dem Spektrum A(f,T) eine Filterfunktion F(f,T) erzeugt und mit dem Spektrum multipliziert. Dadurch erhält man das gefilterte Spektrum B(f,T), aus dem in einer Synthese einheit durch inverse Fouriertransformation das ge räuschbefreite Sprachsignal y(t) erzeugt wird. Dieses kann nach Digital-Analog-Wandlung in einem Lautsprecher hörbar gemacht werden.

Die Filterfunktion F(f,T) wird von einem neuronalen Netzwerk erzeugt, das eine Minimadetektions-Schicht, eine Reaktions-Schicht, eine Diffusions-Schicht und ei ne Integrationsschicht enthält, wie Fig. 2 zeigt. Das von der Samplingeinheit 10 erzeugte Spektrum A(f,T) wird zunächst der Minimadetektions-Schicht zugeführt, wie sie die Fig. 3 zeigt.

Ein einzelnes Neuron dieser Schicht bearbeitet unabhän gig von den anderen Neuronen der Minimadetektions- Schicht eine einzelne Mode, die durch die Frequenz f gekennzeichnet ist. Für diese Mode mittelt das Neuron die Amplituden A(f,T) in der Zeit T über m Frames. Von diesen gemittelten Amplituden bestimmt das Neuron so dann über einen Zeitraum in T, der der Länge von l Fra mes entspricht, für seine Mode das Minimum. Auf diese Weise erzeugen die Neuronen der Minimadetektionsschicht das Signal M(f,T), das sodann der Reaktionsschicht zu geführt wird.

Auch jedes Neuron der Reaktionsschicht, wie sie Fig. 4 zeigt, bearbeitet eine einzelne Mode der Frequenz f, unabhängig von den anderen Neuronen in dieser Schicht. Dazu wird allen Neuronen außerdem ein extern einstell barer Paramter K zugeführt, dessen Größe den Grad der Geräuschunterdrückung des gesamten Filters bestimmt Zu sätzlich steht diesen Neuronen das Integralsignal S(T- 1) vom vorigen Frame (Zeitpunkt T-1) zur Verfügung, das in der Integrations-Schicht, wie sie Fig. 6 zeigt, be rechnet wurde.

Dieses Signal ist das Argument einer nichtlinearen Re aktionsfunktion r, mit deren Hilfe die Neuronen der Re aktionsschicht das Relativspektrum R(f,T) zum Zeitpunkt T berechnen.

Der Wertebereich der Reaktionsfunktion ist auf ein In tervall [r1, r2] eingeschränkt. Der Wertebereich des auf diese Weise resultierenden Relativspektrums R(f,T) beschränkt sich auf das Intervall [0, 1].

In der Reaktionsschicht wird das zeitliche Verhalten des Sprachsignals zur Unterscheidung von Nutz- und Störsignal ausgewertet.

Spektrale Eigenschaften des Sprachsignals werden in der Diffusionsschicht, wie sie die Fig. 5 zeigt, ausgewer tet, deren Neuronen eine lokale Modenkopplung nach Art einer Diffusion im Frequenzraum durchführen.

In der von den Neuronen der Diffusions-Schicht erzeug ten Filterfunktion F(f,T) führt dies zu einer Anglei chung benachbarter Moden, deren Stärke durch die Diffusionskonstante D bestimmt wird. Ähnliche Mechanismen, wie sie in der Reaktions- und der Diffusionsschicht am Werke sind, führen in sogenannten dissipativen Medien zu Strukturbildungsphänomenen, die ein Forschungsgegen stand der nichtlinearen Physik sind.

Alle Moden der Filterfunktion F(f,T) werden zum Zeit punkt T mit den entsprechenden Amplituden A(f,T) multi pliziert. Auf diese Weise resultiert das von Störgeräu schen befreite Spektrum B(f,T), das mittels inverser Fouriertransformation in das geräuschbefreite Sprachsi gnal y(t) verwandelt wird. Über die Moden der Filter funktion F(f,T) wird in der Integrations-Schicht inte griert, so daß das Integralsignal S(T) resultiert, wie es Fig. 6 zeigt.

Dieses Integralsignal wird in die Reaktions-Schicht zu rückgekoppelt. Diese globale Kopplung führt dazu, daß die Stärke der Signalmanipulation im Filter vom Störpe gel abhängig ist. Sprachsignale mit geringer Ge räuschbelastung passieren das Filter praktisch unbeein flußt, während bei hohem Geräuschpegel ein starker Fil tereffekt wirksam wird. Dadurch unterscheidet sich die Erfindung von klassischen Bandpaßfiltern, deren Einfluß auf das Signal nur von den gewählten, fest vorgegebenen Parametern abhängig ist.

Anders als ein klassisches Filter besitzt der Gegen stand der Erfindung keinen Frequenzgang im herkömmli chen Sinne. Bei der Messung mit einem durchstimmbaren sinusförmigen Testsignal würde bereits die Modulations geschwindigkeit des Testsignals die Filtereigenschaften beeinflussen.

Ein geeignetes Verfahren zur Analyse der Eigenschaften des Filters benutzt ein amplitudenmoduliertes Rauschsignal, um in Abhängigkeit der Modulationsfrequenz die Dämpfung des Filters zu bestimmen, wie die Fig. 7 zeigt. Dazu setzt man die eingangs- und ausgangsseiti ge mittlere integrale Leistung zueinander ins Verhält nis und trägt diesen Wert gegen die Modulationsfrequenz des Testsignals auf. In Fig. 7 ist dieser "Modula tionsgang" für verschiedene Werte des Kontrollparame ters K dargestellt.

Für Modulationsfrequenzen zwischen 0.6 Hz und 6 Hz be trägt die Dämpfung für alle gezeigten Werte des Kon trollparameters K weniger als 3 dB. Dieses Intervall entspricht der Modulation menschlicher Sprache, die den Filter daher optimal passieren kann. Signale außerhalb des genannten Modulationsfrequenzintervalls werden da gegen als Störgeräusche identifiziert und in Abhängig keit der Einstellung des Parameters K stark gedämpft.

Bezugszeichen

10

Samplingeinheit, die ein Sprachsignal x(t) abta stet, digitalisiert, in Frames zerlegt und durch Fouriertransformation das Spektrum A(f,T) ermit telt

11

Filtereinheit, die aus dem Spektrum A(f,T) eine Filterfunktion F(f,T) berechnet und damit das ge räuschbefreite Spektrum B(f,T) erzeugt

12

Syntheseeinheit, die aus dem gefilterten Spektrum B(f,T) das geräuschbefreite Sprachsignal y(t) er zeugt
A(f,T) Signalspektrum, d. h. Amplitude der Mode der Frequenz f zum Zeitpunkt T
B(f,T) spektrale Amplitude der Mode der Frequenz f zum Zeitpunkt T nach der Filterung
D Diffusionskonstante, die die Stärke der Glät tung in der Diffusions-Schicht bestimmt
F(f,T) Filterfunktion, die B(f,T) aus A(f,t) er zeugt: B(f,T) = F(f,T)A(f,T) für alle f zur Zeit T
f Frequenz, durch die sich die Moden eines Spektrums unterscheiden
K Parameter zum Einstellen der Stärke der Ge räuschunterdrückung.
l Anzahl der Frames, aus denen man M(f,T) als Minimum der gemittelten A(f,T) er hält
m Anzahl der Frames, über die bei der Bestim mung von M(f,T) gemittelt wird
n Anzahl der Abtastwerte (Samples) pro Frame
M(f,T) Minimum der über m Frames gemittelten Ampli tude A(f,T) innerhalb von l Frames.
R(f,T) Relativspektrum, das von der Reaktionsschicht erzeugt wird
r[S(T)] Reaktionsfunktion der Neuronen in der Reakti onsschicht
r1, r2 Grenzen des Wertebereichs der Reaktionsfunk tion r1 < r(S(T)) < r2
S(T) Integralsignal, das dem Integral von F(f,T) über f zum Zeitpunkt T entspricht
t Zeit in der das Sprachsignal abgetastet wird
T Zeit in der das Zeitsignal zu Frames und die se zu Spektren verarbeitet werden
x(t) Samples des geräuschbehafteten Sprachsignals
y(t) Samples des geräuschbefreiten Sprachsignals

Claims

1. Verfahren zur Geräuschunterdrückung bei der Sprachü bertragung durch ein mehrschichtiges, selbstorgani sierendes, rückgekoppeltes neuronales Netzwerk, da durch gekennzeichnet, daß eine Minimadetektions schicht, eine Reaktionsschicht, eine Diffusions schicht und eine Integrationsschicht eine Filter funktion F(f,T) zur Geräuschfilterung bestimmen.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das mittels der Filterfunktion F(f,T) von Stör geräuschen befreite Spektrum B(f,T) mittels inverser Fouriertransformation in ein geräuschbefreites Sprachsignal y(t) verwandelt wird.

3. Verfahren nach den Ansprüchen 1 und 2, dadurch ge kennzeichnet, daß die Signalverzögerung bei der Ver arbeitung des Signals so kurz ist, daß das Filter im Echtzeitbetrieb für Telekommunikation einsatzfähig bleibt wird, wobei allen Neuronen ein extern ein stellbarer Paramter K zugeführt wird, dessen Größe den Grad der Geräuschunterdrückung des gesamten Fil ters bestimmt.

4. Verfahren nach den Ansprüchen 1 bis 3, dadurch ge kennzeichnet, daß das die Filterfunktion F(f,T) bei festgehaltener Zeit T über die Frequenzen f inte griert und das so erhaltene Integralsignal S(T) in die Reaktionsschicht zurückkoppelt wird.

5. Verfahren nach den Ansprüchen 1 bis 4, dadurch ge kennzeichnet, daß das von einer Samplingeinheit (10) erzeugte Spektrum A(f,T) der Minimadetektions- Schicht zugeführt wird.

6. Verfahren nach den Ansprüchen 1 bis 5, dadurch ge kennzeichnet, daß in einer Filtereinheit (11) aus dem Spektrum A(f,T) eine Filterfunktion F(f,T) er zeugt und mit dem Spektrum multipliziert wird.

7. Verfahren nach den Ansprüchen 1 bis 6, gekennzeich net durch einen Frame mittels dem eine Fouriertrans formiation das Spektrum A(f,T) zur Zeit T ermittelt und einer Filtereinheit (11) zugeführt wird, die mit Hilfe eines neuronalen Netzwerks eine Filterfunktion F(f,T) berechnet, mit der das Spektrum A(f,T) des Signals multipliziert wird, um ein geräuschbefreites Spektrum B(f,T) zu erzeugen.

8. Verfahren nach den Ansprüchen 1 bis 7, dadurch ge kennzeichnet, daß das ein gefiltertes Signal einer Syntheseeinheit (12) übergeben wird, die mittels in verser Fouriertransformation aus dem gefilterten Spektrum B(f,T) ein geräuschbefreites Sprachsignal y(t) synthetisiert.

9. Verfahren nach den Ansprüchen 1 bis 8, dadurch ge kennzeichnet, daß ein einzelnes Neuron einer Schicht unabhängig von den anderen Neuronen der Minimadetek tions-Schicht eine einzelne Mode bearbeitet, die durch die Frequenz f gekennzeichnet ist.

10. Verfahren nach den Ansprüchen 1 bis 9, dadurch ge kennzeichnet, daß die spektralen Eigenschaften des Sprachsignals in der Diffusionsschicht ausgewertet werden, deren Neuronen eine lokale Modenkopplung nach Art einer Diffusion im Frequenzraum durchfüh ren.

11. Verfahren nach den Ansprüchen 1 bis 10, dadurch gekennzeichnet, daß alle Moden der Filterfunktion F(f,T) zum Zeitpunkt T mit den entsprechenden Ampli tuden A(f,T) multipliziert werden.

12. Verfahren nach den Ansprüchen 1 bis 11, dadurch gekennzeichnet, daß über die Moden der Filterfunkti on F(f,T) in der Integrations-Schicht integriert wird, so daß das Integralsignal S(T) resultiert.

13. Verfahren nach den Ansprüchen 1 bis 12, dadurch gekennzeichnet, daß Sprachsignale mit geringer Ge räuschbelastung das Filter praktisch unbeeinflußt passieren, während bei Sprachsignalen mit hohem Ge räuschpegel ein starker Filtereffekt wirksam wird.

14. Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung, insbesondere bei einem Verfahren nach den Ansprüchen 1 bis 13, dadurch gekennzeich net, daß eine Minimadetektions-Schicht, eine Reakti ons-Schicht, eine Diffusions-Schicht und eine Inte grations-Schicht enthaltendes neuronales Netzwerk vorgesehen sind.

15. Vorrichtung nach Anspruch 13, dadurch gekennzeich net, daß die Moden des Spektrums, die sich durch die Frequenz f unterscheiden, einen einzelnen Neuron pro Schicht des Netzwerks mit Ausnahme der Integrations schicht entsprechen.

16. Vorrichtung nach den Ansprüchen 13 bis 15, dadurch gekennzeichnet, daß ein Neuron der Minima- Detektions-Schicht die Funktion M(f,T) ermittelt, wobei M(f,T) in der Mode mit Frequenz f das Minimum der über m Frames gemittelten Amplitude A(f,T) zum Zeitpunkt T ist.

17. Vorrichtung nach den Ansprüchen 13 bis 16, gekenn zeichnet durch ein Neuron der Reaktions-Schicht, welches mit Hilfe einer Reaktionsfunktion r[S(T-1)] aus dem Integralsignal S(T-1) und einem frei wählba ren Parameter K, welcher den Grad der Geräuschunter drückung bestimmt, aus A(f,T) und M(f,T) das Rela tivspektrum R(f,T) ermittelt, wobei das Relativspek trum R(f,T) einen Wertebereich zwischen null und eins hat.

18. Vorrichtung nach den Ansprüchen 13 bis 17, dadurch gekennzeichnet, daß den Neuronen ein in der Integra tions-Schicht berechnetes Integralsignal S(T-1) vom vorigen Frame (Zeitpunkt T-1) zur Verfügung steht.

19. Vorrichtung nach den Ansprüchen 13 bis 18, dadurch gekennzeichnet, daß der Wertebereich der Reaktions funktion auf ein Intervall [r1, r2] eingeschränkt ist, wobei der Wertebereich des resultierenden Rela tivspektrums R(f,T) auf das Intervall [0, 1] be schränkt ist.

20. Vorrichtung nach den Ansprüchen 13 bis 19, dadurch gekennzeichnet, daß für Modulationsfrequenzen zwi schen 0.6 Hz und 6 Hz die Dämpfung für alle gezeig ten Werte des Kontrollparameters K weniger als 3 dB beträgt.