DE3230391A1

DE3230391A1 - Verfahren zur signalverbesserung von gestoerten sprachsignalen

Info

Publication number: DE3230391A1
Application number: DE19823230391
Authority: DE
Inventors: Wolfgang Dipl.-Ing. 8500 Nürnberg Brox; Karl Dipl.-Ing. 8729 Wonfurt Hellwig; Peter Dr. 8522 Herzogenaurach Vary
Original assignee: Philips Kommunikations Industrie AG
Current assignee: Philips Intellectual Property and Standards GmbH
Priority date: 1982-08-14
Filing date: 1982-08-14
Publication date: 1984-02-16
Also published as: DE3230391C2

Description

Verfahren zur Signalverbesserung von gestörten
Sprachsignalen Die Erfindung betrifft ein Verfahren zur Signalverbesserung von gestörten Sprachsignalen bei dem gestörte Sprachsignale mittels einer Filterbank in spektrale Teilsignale aufgespaltet werden, bei dem die spektralen Teilsignale kanalweise verarbeitet werden, indem diese mit Koeffizienten adaptiv werden und bei dem die kanalweise verarbeiteten, spektralen Teilsignale zum Ausgangssignal zusammengefügt werden.
Die Kurzzeitspektralanalyse ist ein wichtiges Hilfsmittel zur Bestimmung spektraler Eigenschaften, Ein Wanderfenster gleitet über die zu analysierende Signalfolge, wobei laufend die Spektralkoeffizienten der ausgeblendeten und gewichteten Signalwerte an den interessierenden Frequenzpunkten bestimmt werden. Die zeitliche Veränderung des Kurzzeitspektrums kommt in der Abhängigkeit der Spektralkoeffizienten von der jeweiligen Position des Wanderfensters zum Ausdruck. Der Aufwand zur Durchführung der Kurzzeitspektralanalyse kann durch Verwendung einer Filterbank nach dem Polyphasenprinzip gegenüber einer Filterbank nach dem Prinzip des Wanderfensters erheblich reduziert werden. Insbesondere ist dabei keine zeitliche Begrenzung des Wanderfensters entsprechend einer nichtrekursiven Filterung erforderlich, d.h. es können rekursive Filter verwendet werden.
Es ist ein Verfahren zur Aufbereitung elektrischer Signale mittels einer adaptiven Filterbank unter Verwendung von Polyphasen-Netzwerken vorgeschlagen worden (P 31 18 473.1-35).
Durch die Verwendung der Polyphasen-Netzwerke sind weniger Rechenschritte erforderlich als bei der Verwendung von äquivalenten, adaptiven, hochgradigen Transversalfiltern. Die vorgeschlagene adaptive Polyphasen-Filterbank (P 31 18 473.1-35) besteht aus einem Signal-Analyseteil, einem Signal-Verarbeitungsteil und einem Signal-Syntheseteil.
Der Signal-Analyseteil enthält ein Polyphasen-Netzwerk, das sich aus einzelnen Teilfiltern zusammensetzt, und einem diskreten Fourier-Transformations-Prozessor zur Fourier-Transformation. Das der adaptiven Polyphasen-Filterbank zugeführte Eingangssignal wird in spektrale Teilsignale (in der Torm komplexwertiger Tiefpaßsignale) aufgespaltet.
Wegen der damit verbundenen Taktreduktion (dezimierende Technik), ist der Rechenaufwand in den einzelnen Teilfiltern im Vergleich zu einer digitalen Filterbank ohne Taktreduktion erheblich geringer. Die Reduktion der Abtastfrequenz für das Eingangssignal kann durch einen am Eingang der adaptiven Polyphasen-Filterbank angeordneten, rotierenden Schalter verdeutlicht werden. Die Koeffizienten der einzelnen Teilfilter des Polyphasen-Netzwerkes können durch Transformation der Koeffizienten eines rekursiven oder nicht-rekursiven Prototyp-Tiefpasses gewonnen werden. Die gefilterten Teilsignale, d.h. die Ausgangssignale der Teilfilter, werden mit Hilfe des Rechenverfahrens der diskreten Fourier-Transformation im diskreten Fourier-Transformations-Prozessors in komplexwertige Tiefpaß- signale übergeführt. Die spektralen Teilsignale an den Ausgängen des diskreten Fourier-Transformations-Prozessors sind interpretierbar als komplexwertige Tiefpaßsignale gemäß einer Quadratur-Bandpaßfilterung mit Umsetzung in die Tiefpaßlage und gleichzeitiger Taktreduktion.
Um eine Signalverbesserung von z.B. gestörten Sprachsignalen zu erreichen, werden die spektralen Teilsignale einer adaptiven, komplexwertigen Verarbeitung (Filterung) unterzogen. Die spektralen Teilsignale liegen getrennt nach Real- und Imaginärteil vor. Zur adaptiven Gewichtung der zu verarbeitenden, spektralen Teilsignale nach einer Gewichtungsregel (adaptive Pegel steuerung) wird der aus Real- und Imaginärteil ableitbare Betrag mit einem Koeffizienten multipliziert, der nach einer Gewichtungsregel gebildet wird. Zur Koeffizientenberechnung können beispielsweise Kurzzeitleistungen von Störsignalen in Sprachpausen herangezogen werden.
Die Kurzzeitleistung eines spektralen Teilsignals, welches sich aus Signalanteil und Störanteil additiv zusammensetzt, kann beispielsweise durch gleitende Mittelwertbildung (Rechteckfenster mit evtl. unterschiedlichen Fensterlängen) berechnet werden.
Unter der Voraussetzung einer stationären Störung kann für jedes spektrale Teilsignal der Koeffizient so berechnet werden, daß die Kurzzeitleistungen aller verarbeiteten, spektralen Teilsignale nach erfolgter Pegelsteuerung mit der Kurzzeitleistung des ungestörten Signalanteils übereinstimmen. Die Zeitkonstanten bei der Mittelwertbildung werden von einem Sprachpausendetektor gesteuert.
Die verarbeiteten, spektralen Teilsignale (komplexwertige Zeitsignale) werden im Syntheseteil durch inverse Transformation und inverse,interpolierende Polyphasenfilterung in ein reellwertiges Schätzsignal (Ausgangssignal) umgeformt, wobei die Taktfrequenz wieder auf das ursprüngliche Maß (interpolierende Technik) erhöht wird. Die in der adaptiven Polyphasen-Filterbank vorgenommene Taktfrequenzerhöhung kann durch einen Schalter, welcher mit Teilfiltern des inversen Polyphasen-Netzwerks verbunden ist, verdeutlicht werden.
Wie Untersuchungen gezeigt haben, verbleiben bei einer solchen Signalverarbeitung durch adaptive Gewichtung spektraler Teilsignale Reststörungen.
Die verbleibende Reststörung ist akustisch beschreibbar als plätscherndes Geräusch, musikalische Töne, Sprachverzerrungen oder rauhe Sprachkomponenten.
Ein weiteres Verfahren zur Signalverbesserung unter Verwendung des Kurzzeitspektrums und Subtraktion des Störspektrums vom gestörten Signalspektrum ist aus einer Abhandlung in den IEEE Transactions, Band ASSP-27, Seiten 113 bis 120 bekannt. Es wird als das Verfahren der spektralen Subtraktion bezeichnet. Dabei wird mit Hilfe der Spektraltransformation das Kurzzeitspektrum für Blöcke des gestörten Signals nach Betrag und Phase ermittelt.
Von den der Spektraltransformation unterworfenen Blöcken des gestörten Signals wird die Phaseninformation abgespaltet und ein Kurzzeit-Leistungsspektrum (Kurzzeit-Betragsspektrum) gebildet. Das in den Sprachpausen geschätzte Störspektrum, ein Betrag (Leistungs)-Spektrum, wird von diesem Kurzzeit- Leistungsspektrum subtrahiert. Dabei auftretende negative Resultate werden im Sinne einer Gleichrichtung korrigiert. Nach der Subtraktion wird Betragsspektrum mit Phase des gestörten Spektrums verknüpft und eine inverse Spektraltransformation ausgeführt. Nach Anwendung dieser Maßnahmen verbleibt ein störendes Restgeräusch.
Nach Durchführung der spektralen Subtraktion werden die zeitlichen Betragsverläufe der Kurzzeitspektren (Abtastwerte) für feste Frequenzen unabhängig voneinander verarbeitet. Liegt in der Sprachpause der einzelne Abtastwert unterhalb von Abtastwerten dieses Kanals, so wird der momentane Abtastwert durch einen lokalen Minimalwert ersetzt. Zur Bestimmung dieses Minimums werden die beiden zeitlich benachbarten Abtastwerte herangezogen.
Ein solches Verfahren weist den Nachteil auf, daß der lokale Minimalwert von der Aussteuerung abhängig ist. Daraus folgt eine Gesamtabschwächung des Schätzsignals. Ein weiterer Nachteil ist, bedingt durch die Auswertung eines mittleren Leistungskriteriums in Abhängigkeit von zeitlich benachbarten Abtastwerten, das Fehlen einer Kopplung benachbarter Spektrallinien bzw. benachbarter Kanäle. Auch der Aufwand bei der Realisierung eines solchen Verfahrens, insbesondere der Speicheraufwand und die Zahl der Rechenoperationen pro Abtastwert, ist relativ hoch.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren anzugeben, welches mit einem geringen Aufwand an Mitteln eine nach Signalverarbeitung von spektralen Teilsignalen durch adaptive Gewichtung noch verbleibende Reststörung annähernd beseitigt.
Diese Aufgabe wird erfindungsgemäß dadurch gelöst, daß erste, zeitabhängige Koeffizienten kanalweise nach einer Gewichtungsregel gebildet werden und Vergleiche-zwischen den ersten Koeffizienten und mindestens einem vorgebbaren Koeffizienten-Schwellenwert und/oder Vergleiche kanalweise und gleichzeitig berechneter Koeffizienten miteinander und/oder Vergleiche zwischen zeitlich aufeinanderfolgenden Koeffizienten mindestens eines Kanals durchgeführt werden.
Bei dem vorgeschlagenen Verfahren (P 31 18 473.1-35) wird eine multiplikative Verknüpfung der Koeffizienten mit den spektralen Teilsignalen vorgenommen. Die zugrundeliegende Gewichtungsregel, evtl. in Kombination mit einer zeitlichen Mittelung der Betragssignale, ist zur Beseitigung stationärer Geräusche geeignet. Bei schwach instationären Störungen verbleiben infolge der statistischen Schwankungen der berechneten Kurzzeitmittelwerte Reststöranteile, die allein durch multiplikative Gewichtung nicht ohne Sprachverzerrungen zu beseitigen sind. Es läßt sich anhand eines statistischen Modells theoretisch zeigen, daß die unter der Annahme der Stationarität zu erzielende Geräuschreduktion prinzipiell begrenzt ist, sofern das Eingangssignal instationäre Komponenten enthält. Die Erfindung zeigt einen neuen Weg auf,indem bei der Vorgabe der Gewichtungsregel, hinsichtlich der psychoakustischen Komponente, das Ohr als Empfänger berücksichtigt und die Verarbeitung der Empfängercharakteristik angepaßt wird. Unter Berücksichtigung des Modells der Spracherzeugung ist die Verarbeitung auch auf die Sendercharakteristik abzustimmen, wozu eine Analyse der Merkmale einer Störung vorzunehmen ist.
Die Analyse verschiedener Störungen (Windgeräusch, Motorgeräusch) zeigt, daß in der Regel instationäre Störanteile auftreten, die sich charakteristisch vom Sprachsignal unterscheiden. Aus gezielten akustischen Experimenten mit synthetisierten Signalen, bestehend aus Sprachanteil und additiv überlagerten Störanteil, sind Adaptions-Algorithmen ableitbar, welche nach psychoakustischen Gesichtspunkten ausgelegt und für die Anwendung bei einer adaptiven Polyphasen-Filterbank oder einer Filterbank geeignet sind. Die Analyse der in den Sprachpausen unverdeckt auftretenden instationären Störanteile zeigt im Vergleich zum Sprachsignal das isolierte Auftreten von Frequenzlagen und die kurze zeitliche Dauer von energiereichen Störimpulsen. Derartig isolierte Komponenten treten in Sprachsignalen nicht auf, da der Sprachtrakt entweder durch ein rauschartiges oder ein sehr obertonreiches Signal angeregt wird. Außerdem sind wegen der nur relativ langsamen Veränderung der Sprachtrakt-Parameter keine extrem kurzen, impulsartigen Signalanteile festzustellen.
Das erfindungsgemäße Verfahren bietet eine einfache Möglichkeit aus der Betrachtung der Koeffizienten, welche den zu verarbeitenden spektralen Teilsignalen zugeordnet (kanalweise Zuordnung) sind, Regeln abzuleiten um die verbleibende Reststörung zu eliminieren.
Zur Geräuschreduktion gestörter Sprachsignale kann vorzugsweise eine adaptive Polyphasen-Filterbank verwendet werden. Das erfindungsgemäße Verfahren ist nicht an diesen Anwendungsfall gebunden. Zur Signalanalyse kann auch eine Filterbank aus einzelnen, diskreten Bandpässen verwendet werden. Dann werden die Koeffizienten nicht aus den Beträgen der spektralen Teilsignale, sondern aus den Einhüllenden der reellen Bandpaßsignale abgeleitet. Die beschriebenen Vorteile ergeben sich für den Anwendungsfall adaptive Polyphasen-Filterbank. Ein erster Verfahrensschritt ist, unter Berücksichtigung der Wahrscheinlichkeitsrechnung, die Vorgabe eines Koeffizienten-Schwellenwerts.
Dieser ergibt sich aus einem Kompromiß zwischen Störgeräuschreduktion und Sprachverzerrung, Diese nichtlineare Nachverarbeitung der Koeffizienten vermindert bereits die Reststörung. Ein weiterer Verfahrensschritt beruht auf dem Vergleich kanalweise und gleichzeitig berechneter Koeffizienten miteinander. Durch diese Maßnahme können isoliert auf tretenCe Frequenzlagen eliminiert werden. Dabei ist bei der Festlegung der Mindestanzahl der zum Vergleich herangezogenen Koeffizienten die Eigenschaft von Sprachsignalen mit hoher Sprachgrundfrequenz (z.B. Frauen-und Kinderstimmen) zu berücksichtigen, wonach im Sprachsignal isolierte Frequenz lagen auftreten können, wenn die Grundfrequenz größer ist als der Kanalabstand der spektralen Teilsignale.Ein weiterer Verfahrensschritt besteht darin, in mindestens einen Kanal einen Vergleich zwischen zeitlich aufeinanderfolgenden Koeffizienten dieses Kanals durchzuführen.
Dadurch können kurze Störanteile eliminiert werden.
Die einzelnen Verfahrensschritte werden auf die Betragssignale oder auf die Real- und Imaginärteilsignale angewandt, welche in gewissen Grenzen gemittelt werden, d.h. die gestörten Phasensignale können, wegen der relativ großen Unempfindlichkeit des Gehörs gegenüber Phasenstörungen, unverändert beibehalten werden.
Weiterhin wird vorgeschlagen, daß ersten Koeffizienten kleiner dem vorgebbaren Koeffizienten-Schwellenwert der Wert 0 zugeordnet wird. Der Koeffizienten-Schwellenwert liegt vorzugsweise bei 0,1. Der vorge- gebene Koeffizienten-Schwellenwert von 0,1 stellt einen Kompromiß zwischen Störgeräuschreduktion und Sprachverzerrung dar.
Es hat sich als vorteilhaft erwiesen, den Vergleich gleichzeitig berechneter Koeffizienten jeweils für Koeffizienten benachbarter Kanäle durchzuführen. Bei Feststellung, daß sich ein Koeffizient von denen benachbarter höherer und tieferer Kanäle um ein Mindestmaß unterscheidet, wird eine nichtlineare Glättung vorgenommen. Bei der nichtlinearen Glättung wird dem Koeffizienten ein Wert zugeordnet, welcher sich aus dem Mittelwert von Koeffizienten benachbarter Kanäle oder deren Linearkombination ergibt. Das Mindestmaß beruht auf einem Vergleich der Koeffizienten benachbarter Kanäle mit einer Schwelle oder auf einem Vergleich des Koeffizienten mit der Linearkombination.
Das erfindungsgemäße Verfahren bringt den Vorteil mit sich, daß durch einfache Auswertung der Koeffizienten sprachuntypische Merkmale erkannt und somit eine Reduktion des Störanteils erreichbar ist.
Weiterhin wird vorgeschlagen, daß die zeitliche Koeffizientenfolge mindestens eines Kanals auf 0-Folgen untersucht wird. Wird eine solche festgestellt, so wird erst für eine Mindestzahl von zeitlich aufeinanderfolgenden und von 0 verschiedenen Kaeffizienten, der Koeffizient selbst zur adaptiven Gewichtung, insbesondere zur multiplikativen Verknüpfung mit den spektralen Teilsignalen verwendet. Dadurch können auf einfache Weise kurze zeitliche Störanteile eliminiert werden. Damit der Spracheinsatz nicht verfälscht wird ist die Mindestanzahl, d.h. die Verzögerung der spektralen Teilsignale, unter Berücksich- tigung psychoakustischer Gesichtspunkte festzulegen.
Vorzugsweise wird bei Feststellung von langen, gleich zeitig auftretenden 0-Folgen der Koeffizienten in einer Mindestanzahl von Kanälen auch jenen von 0 verschiedenen Koeffizienten anderer Kanäle für diesen Zeitraum der Wert 0 zugeordnet. Diese Maßnahme geht einher mit der Erkennung von Sprachpausen. Zur Sprachpausenerkennung kann es sich als vorteilhaft erweisen nur einen bestimmten Spektralbereich auszuwählen, d.h. nur einige Kanäle zu verwenden. Der zu analysierende Bereich liegt vorzugsweise zwischen 300 und 1 kHz, da dort der größte Anteil der Sprachleistung liegt. Ist eine Sprachpause, insbesondere eine Langzeitpause erkannt worden, so kann eine globale Pausenabschaltung vorgenommen werden.
Schließlich wird vorgeschlagen, daß die Koeffizienten innerhalb eines Zahlenintervalls von 0 bis 1 liegen und der erste Koeffizient eine Funktion von Langzeitmittelwert der Störung und Kurzzeitmittelwert des gestörten Signals und einer reellwertigen Konstante ist. Die Verwendung einer Gewichtungsregel, welche auch eine Funktion von geschätzten Störabständen ist, bringt den Vorteil einer Verringerung des erforderlichen Realisierungsaufwandes mit sich.
Es ist ein Kompromiß zwischen verbleibender Reststörung und Realisierungsaufwand anzustreben. Nach Anwendung der Gewichtungsregel verbleibende Reststörung kann mittels der geschilderten, erfindungsgemäßen Verfahrensschritte weitgehend unterdrückt werden.
Das erfindungsgemäße Verfahren wird nachfolgend anhand des in der Zeichnung dargestellten Ausführungsbeispiels näher beschrieben und erläutert.
Das Ausführungsbeispiel der Erfindung zeigt nur die für das Verständnis der Erfindung erforderlichen Einzelheiten. Die vorgeschlagene adaptive Polyphasen-Filterbank (P 31 18 473.1-35) besteht aus einem Signal-Analyseteil, einem Signal-Verarbeitungsteil zur adaptiven Signalverbesserung und einem Signal-Syntheseteil. Die Wirkung der Polyphasen-Netzwerke ist beschreibbar durch ein Ersatzmodell bestehend aus Demodulator, Tiefpaß und Unterabtaster. In Verbindung mit einem diskreten Fourier-Transformations-Prozessor zur Fast-Fourier-Transformation wird eine Kurzzeitspektralanalyse mit Taktreduktion eines zugeführten Eingangssignals erzielt. Die zeitliche und spektrale Auflösung wird durch einen Prototyp-Tiefpaß mit dessen Impulsantwort bestimmt. Wie der vorgeschlagenen digitalen Filteranordnung (P 31 18 473.1-38) zu entnehmen ist, ist die Signal-Synthese durch Anwendung inverser Operationen möglich.
Im Signal-Analyseteil der adaptiven Polyphasen-Filterbank, bestehend aus Polyphasen-Netzwerk und dem diskreten Fourier-Transformations-Prozessor zur Fast-Fourier-Transformation, wird eine Aufspaltung des Eingangssignals in spektrale Teilsignale durchgeführt.
In der Zeichnung ist ein spektrales Teilsignal mit bezeichnet. Durch die Indizierung mit dem Index v soll ein spektrales Teilsignal im v-ten Kanal bezeichnet werden. Zur Vereinfachung der Betrachtung ist in der Zeichnung das spektrale Teilsignal für den v-ten Kanal dargestellt, wobei in den anderen Kanälen die gleiche Darstellung zutreffend ist, In der Zeichnung sind zum Erleichtern des Verständnisses der Signal-Analyse- und Signal-Syntheseteil der adaptiven Polyphasen-Filterbank weggelassen. Wie aus der Zeichnung ersichtlich ist, besteht die Verarbeitung nicht nur in einer multiplikativen Gewichtung der spektralen Teilsignale V (P 31 18 473.1-38), sondern in zusätzlichen nichtlinearen Operationen. Die verarbeiteten spektralen Teilsignale ß werden durch, in der Zeichnung nicht dargestellte, inverse, diskrete Fourier-Transformation und inverse, interpolierende Polyphasenfilterung- umgeformt, wobei die Taktfrequenz wieder auf das ursprüngliche Maß erhöht wird.
Das Eingangssignal besteht aus einem Sprachsignal SV und einem additiv überlagerten Störsignal nv. Durch multiplikative Verknüpfung der zu verarbeitenden spektralen Teilsignale, z.B. Vy mit ersten Koeffizientenc und unter Anwendung des erfindungsgemäßen Verfahrens kann neben der Reduktion von stationären Störungen auch eine Reduktion von instationären Störungen erreicht werden.
Das zu verarbeitende, spektrale Teilsignal Vv wird einer Einrichtung 1 zur Umwandlung der, getrennt in Real- und Imaginärteil vorliegenden, spektralen Teilsignale in Polarkoordinaten zugeführt. Das erfindungsgemäße Verfahren ist unabhängig davon in welchem Koordinatensystem die spektralen Teilsignale darstellbar sind. Werden die Real- und Imaginärteile der spektralen Teilsignale V nicht mittels der Einrichtung 1 in Polarkoordinaten umgewandelt, so erübrigt sich dann auch die Rückwandlung der verarbeiteten, spektralen Teilsignale S in kartesische Koordinaten mittels einer Einrichtung 17. Die spektralen Teilsignale (komplexwertige Zeitsignale) V9 werden zur Ableitung der ersten Koeffizienten verwendet, während die gestörten Phasensignale v beibehalten werden. Da zur Ableitung der ersten Koeffizienten CV eine bestimmte Zeit erforderlich ist, wird Betrag IV I und Phase tv in Einrichtungen 14 und 16 verzögert. Diese zeitliche Verzögerung steht in einem Zusammenhang mit der Zeit für die Berechnung des ersten Koeffizienten c in einer Einrichtung 6 gemäß einer Gewichtungsregel. Eine weitere Verzögerung ergibt sich aus der Bestimmung eines Koeffizienten c3 mittels einer Einrichtung 11.
In einer Einrichtung 2 werden Kurzzeitmittelwert E2 des gestörten Signals, zum Beispiel der spektralen Teilsignale Vvberechnet. Die in der Einrichtung 2 berechneten Kurzzeitmittelwerte E2 weichen aufgrund der kurzzeitigen Instationarität der spektralen Teilsignale V9 (Instationarität des Störsignals ny) statistisch von einem in. einer Einrichtung 5 berechneten Langzeitmittelwert E1 ab. In der Einrichtung 5 kann der Langzeitmittelwert E1 von nv berechnet werden wozu eine Sprachpausenerkennung (Einrichtung 4) erforderlich ist. Unter Verwendung der Kurzzeitbetragssumme ist im Zeitbereich eine sichere Erkennung von Sprachpausen möglich. Wie der Zeichnung zu entnehmen ist, wird bei erkannter Sprachpause ein Schalter 3 geschlossen und in der Einrichtung 5 der Langzeitmittelwert E1 der Störung nv berechnet. In der Einrichtung 6 wird aus dem zugeführten Langzeitmit'telwert E1 der Störung nv und den ermittelten Kurzzeitmittelwerten E2 des gestörten Signals (sV+nv), gemäß einer Gewichtungsregel, der erste Koeffizient Cv ermittelt. Die verwendete Gewichtungsregel ist eine Funktion von Langzeitmittelwert E1 der Störung ny und Kurzzeitmittelwert E2 des gestörten Signals (s,+n (eines lokalen Kurzzeit-Signal-Störabstands p) und einer reellwertigen Konstante K. Beispiel für eine solche Gewichtungsregel ist Die angegebene Gewichtungsregel G wurde aus einer großen Vielfalt von Kombinationsmöglichkeiten unter Zuhilfenahme umfangreicher objektiver und subjektiver Hörtests entwickelt. Das Problem der Vorgabe der Gewichtungsregel liegt in den teilweise sich widersprechenden Forderungen nach hoher Geräuschreduktion und guter Sprachverständlichkeit. Da die Pegelbewertung des Betrags IV I gemäß der Gewichtungsregel die exakte Kenntnis der Kurzzeit-Signal-Störabstände p E2 (p=E2 L -K) voraussetzt, diese aber nur geschätzt werden können, verbleiben in den Sprachpausen Reststörungen.
Durch Anwendung des erfindungsgemäßen Verfahrens kann die, im Falle der Verwendung der Gewichtungsregel G, verbleibende Reststörung, welche sich akustisch als plätschernde Geräusche, musikalische Töne, Verzerrungen oder rauhe Sprachkomponente zeigt, reduziert werden.
Dazu werden als erster Verfahrensschritt für den Fall, daß erste, zeitabhängige Koeffizienten c kleiner einem vorgebbaren Koeffizienten-Schwellenwert cmin auftreten, einem Koeffizienten cl (Ausgangssignal einer Einrichtung 7) der Wert 0 zugeordnet. Der Koeffizienten-Schwellenwert cmin wurde empirisch zu 0,1 ermittelt. Dieser Vergleich ist beschreibbar durch die Gleichung (1):

~Cv ; Cv > Cmin

(1)

cmin

und wird mittels der Einrichtung 7 durchgeführt.
Zur weiteren Signalverbesserung wird das Ausgangssignal cl'> der Einrichtung 7 hinsichtlich der einzelnen Kanäle ausgewertet, Dazu wird ein Koeffizientenvergleich jeweils für im Frequenzbereich benachbarte Koeffizienten, z.B. c1#+1, c1#-1 durchgeführt. Aufgrund dieses Koeffizientenvergleichs mittels einer Einrichtung 9 wird eine nichtlineare Glättung über dem Kanalindex # vorgenommen. Beispielsweise wird für den Fall, daß Koeffizienten c1#+1, c1#-1 gleich 0 im höher und tiefer gelegenen Frequenzbereich auftreten, einem Koeffizienten c2v der Wert O zugeordnet (Einrichtung 8). Dies ist zur Beseitigung des additiv überlagerten Störsignals n# (sprachuntypische Merkmale) geeignet ohne das Sprachsignal sy zu verzerren. Durch Verarbeitung von Koeffizienten ist diese unabhängig von der Aussteuerung in einer adaptiven Filterbank. Die Koeffizienten c#, cl c2#, c3# und c4# liegen innerhalb eines Zahlenintervalls von 0 bis 1. Die Verarbeitung in der Einrichtung 9 kann z.B. gemäß der folgenden Gleichung (2) vorgenommen werden.

c19 ; sonst

c29 = cl'> +2 (2)

v 1 C a. C1v+ibAv

i=-2 1 >+1 >

wobei z.B. a=l; a+1=a+2= -0,25; A#=0, 25; Dabei bezeichnet Ay einen Schwellenwert,während die a. Gewichtungsfaktoren darstellen, Wie aus der Gleichung (2) ersichtlich ist, wird der Vergleich mit jeweils zwei im Frequenzbereich höher und tiefer gelegenen Koeffizienten ci#+1, cl Cl9+e und cl 1, C19 2 vorgenommen. Eine Verallgemeinerung im Sinne einer Veränderung der Summengrenzwerte oder der Koeffizienten ist möglich. Dadurch können sprach- spezifische Merkmale berücksichtigt werden.
Mittels der Einrichtung 11 wird jede zeitliche Koeffizientenfolge c2 auf O-Folgen untersucht.
Bei Feststellung einer solchen wird erst nach Uberschreitung einer Mindestanzahl von zeitlich aufeinanderfolgenden und von 0 verschiedenen Koeffizienten c2V,ein Koeffizient c3'> am Ausgang einer Einrichtung 10 gleich dem zugeführten Signal c2'> gesetzt.
Diese Zeitfilterung des Koeffizienten c3'> ist beschreibbar durch die folgende Gleichung (3):

c2#

c3 =

0

sonst (3) ; # c2# # (#-#)#+0 mit p:Zeitindex und Ä:Zeitpunkt Ein weiterer Verfahrensschritt zur Signalverbesserung besteht in einer globalen Pausenabschaltung oder Pausenabschwächung. Dazu werden mittels Einrichtungen 12,13 bei Feststellung von langen, gleichzeitig auftretenden O-Folgen bei einer Mindestanzahl von Koeffizienten, z.B. c3 c3#-1, c3#, c3 c39+1 auch jene von 0 verschiedene Koeffizienten in anderen Kanälen, z.B. c39+6 für diesen Zeitraum nachträglich mit 12 der Wert 0 zugeordnet. Dieser Verfahrensschritt ist beschreibbar durch folgende Gleichung (4):

cm ; sonst

C49 = = i='> (4)

; , c3 v-i Dv

i=0

dabei bezeichnet D# einen Schwellenwert. Die erläuterten Verfahrensschritte können einzeln oder in Kombination angewandt werden. Bei Kombination aller vier Verfahrensschritte gemäß Gleichungen (1) bis (4) ist insbesondere zwischen den Worten (Sprachpause) und einzelnen Silben eine erhebliche Reduktion der Reststörung erreichbar. Durch Auswertung der ersten Koeffizienten CV und unter Berücksichtigung des Modells der Spracherzeugung kann ein einfach Zu realisierendes und wirksames Verfahren zur Signalverbesserung angegeben werden.

Claims

Patentansprüche 9 Verfahren zur Signalverbesserung von gestörten Sprachsignalen bei dem gestörte Sprachsignale mittels einer Filterbank in spektrale Teilsignale aufgespaltet werden, bei dem die spektralen Teilsignale kanalweise verarbeitet werden, indem diese mit Koeffizienten adaptiv gewichtet werden und bei dem die kanalweise verarbeiteten, spektralen Teilsignale zum Ausgangssignal zusammengefügt werden, dadurch gekennzeichnet, daß erste, zeitabhängige Koeffizienten (cv) kanalweise nach einer Gewichtungsregel gebildet werden und Vergleiche zwischen den ersten Koeffizienten (cv) und mindestens einem vorgebbaren Koeffizienten-Schwellenwert (cmin) und/oder Vergleiche kanalweise und gleichzeitig berechneter Koeffizienten (c2 miteinander und/oder Vergleiche zwischen zeitlich aufeinanderfolgenden Koeffizienten (c3 und c49) mindestens eines Kanals durchgeführt werden.
2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, daß ersten Koeffizienten (c ) kleiner dem vorgebbaren Koeffizienten-Schwellenwert (cmin) der Wert 0 zugeordnet wird,
3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß der Koeffizienten-Schwellenwert (cmin) bei 0,1 liegt.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Vergleich gleichzeitig berechneter Koeffizienten (clv) jeweils für Koeffizienten (cl benachbarter Kanäle durchgeführt wird und daß bei Feststellung, daß sich ein Koeffizient (c1#) von denen benachbarter höherer und tieferer Kanäle um ein Mindestmaß unterscheidet, eine nichtlineare Glättung vorgenommen wird,
5. Verfahren nach Anspruch 1 und 4, dadurch gekennzeichnet, daß bei der nichtlinearen Glättung dem Koeffizienten (c1#) ein Wert zugeordnet wird, welcher sich aus dem Mittelwert von Koeffizienten (z.B. cl clvl, clv 1) benachbarter Kanäle oder deren Linearkombination ergibt.
6. Verfahren nach Anspruch 1, 3 und 4, dadurch gekennzeichnet, daß das Mindestmaß auf einem Vergleich der Koeffizienten (z.B. cJ»+l, C1#-1) mit einer Schwelle (z.B. Wert. 0,2) oder auf einem Vergleich des Koeffizienten (c1#) mit der Linearkombination beruht.
7. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die zeitliche Koeffizientenfolge mindestens eines Kanals auf O-Folgen untersucht wird und daß bei Feststellung einer solchen erst für eine Mindestanzahl zeitlich aufeinanderfolgender und von 0 verschiedener Koeffizienten (c2»), der Koeffizienten (c39) selbst zur adaptiven Gewichtung verwendet wird.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß bei Feststellung von langen,'gleichzeitig auftretenden 0-Folgen der Koeffizienten (c39) in einer Mindestzahl von Kanälen auch jenen von 0 verschiedenen Koeffizienten (c3M) anderer Kanäle für diesen Zeitraum der Wert 0 zugeordnet wird.
9. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Koeffizienten (cv, cl9, C2w, c3 und c4M) innerhalb eines Zahlenintervalls von 0 bis 1 liegen.
10. Verfahren- nach Anspruch 1, dadurch gekennzeichnet, daß der erste Koeffizient (c#) eine Funktion von Langzeitmittelwert (E1) der Störung und Kurzzeitmittelwert (E2) des gestörten Signals und einer reellwertigen Konstante (K) ist.