DE3230391C2

DE3230391C2 -

Info

Publication number: DE3230391C2
Application number: DE19823230391
Authority: DE
Inventors: Peter Dr. 8522 Herzogenaurach De Vary; Wolfgang Dipl.-Ing. 8500 Nuernberg De Brox; Karl Dipl.-Ing. 8729 Wonfurt De Hellwig
Original assignee: Philips Kommunikations Industrie AG
Current assignee: Philips Intellectual Property and Standards GmbH
Priority date: 1982-08-14
Filing date: 1982-08-14
Publication date: 1991-01-10
Also published as: DE3230391A1

Description

Die Erfindung geht aus von einem Verfahren zur Signalverbesserung von gestörten Sprachsignalen gemäß dem Oberbegriff des Anspruches 1. Derartige Verfahren gehen z. B. aus der US-Patentschrift 34 21 141 oder aus der deutschen Auslegeschrift 20 51 443 hervor.

Die Kurzzeitspektralanalyse ist ein wichtiges Hilfsmittel zur Bestimmung spektraler Eigenschaften. Ein Wanderfenster gleitet über die zu analysierende Signalfolge, wobei laufend die Spektralkoeffizienten der ausgeblendeten und gewichteten Signalwerte an den interessierenden Frequenzpunkten bestimmt werden. Die zeitliche Veränderung des Kurzzeitspektrums kommt in der Abhängigkeit der Spektralkoeffizienten von der jeweiligen Position des Wanderfensters zum Ausdruck. Der Aufwand zur Durchführung der Kurzzeitspektralanalyse kann durch Verwendung einer Filterbank nach dem Polyphasenprinzip gegenüber einer Filterbank nach dem Prinzip des Wanderfensters erheblich reduziert werden. Insbesondere ist dabei keine zeitliche Begrenzung des Wanderfensters entsprechend einer nichtrekursiven Filterung erforderlich, d. h. es können rekursive Filter verwendet werden.

Es ist ein Verfahren zur Aufbereitung elektrischer Signale mittels einer adaptiven Filterbank unter Verwendung von Polyphasen-Netzwerken vorgeschlagen worden (P 31 18 473.1-35). Durch die Verwendung der Polyphasen-Netzwerke sind weniger Rechenschritte erforderlich als bei der Verwendung von äquivalenten, adaptiven, hochgradigen Transversalfiltern. Die vorgeschlagene adaptive Polyphasen-Filterbank (P 31 18 473.1-35) besteht aus einem Signal-Analyseteil, einem Signal- Verarbeitungsteil und einem Signal-Syntheseteil.

Der Signal-Analyseteil enthält ein Polyphasen-Netzwerk, das sich aus einzelnen Teilfiltern zusammensetzt, und einem diskreten Fourier-Transformations- Prozessor zur Fourier-Transformation. Das der adaptiven Polyphasen-Filterbank zugeführte Eingangssignal wird in spektrale Teilsignale (in der Form komplexwertiger Tiefpaßsignale) aufgespaltet. Wegen der damit verbundenen Taktreduktion (dezimierende Technik), ist der Rechenaufwand in den einzelnen Teilfiltern im Vergleich zu einer digitalen Filterbank ohne Taktreduktion erheblich geringer. Die Reduktion der Abtastfrequenz für das Eingangssignal kann durch einen am Eingang der adaptiven Polyphasen-Filterbank angeordneten, rotierenden Schalter verdeutlicht werden. Die Koeffizienten der einzelnen Teilfilter des Polyphasen- Netzwerkes können durch Transformation der Koeffizienten eines rekursiven oder nicht-rekursiven Prototyp-Tiefpasses gewonnen werden. Die gefilterten Teilsignale, d. h. die Ausgangssignale der Teilfilter, werden mit Hilfe des Rechenverfahrens der diskreten Fourier-Transformation im diskreten Fourier-Transformations- Prozessors in komplexwertige Tiefpaßsignale übergeführt. Die spektralen Teilsignale an den Ausgängen des diskreten Fourier-Transformations- Prozessors sind interpretierbar als komplexwertige Tiefpaßsignale gemäß einer Quadratur-Bandpaßfilterung mit Umsetzung in die Tiefpaßlage und gleichzeitiger Taktreduktion.

Um eine Signalverbesserung von z. B. gestörten Sprachsignalen zu erreichen, werden die spektralen Teilsignale einer adaptiven, komplexwertigen Verarbeitung (Filterung) unterzogen. Die spektralen Teilsignale liegen getrennt nach Real- und Imaginärteil vor. Zur adaptiven Gewichtung der zu verarbeitenden, spektralen Teilsignale nach einer Gewichtungsregel (adaptive Pegelsteuerung) wird der aus Real- und Imaginärteil ableitbare Betrag mit einem Koeffizienten multipliziert, der nach einer Gewichtungsregel gebildet wird. Zur Koeffizientenberechnung können beispielsweise Kurzzeitleistungen von Störsignalen in Sprachpausen herangezogen werden. Die Kurzzeitleistung eines spektralen Teilsignals, welches sich aus Signalanteil und Störanteil additiv zusammensetzt, kann beispielsweise durch gleitende Mittelwertbildung (Rechteckfenster mit evtl. unterschiedlichen Fensterlängen) berechnet werden. Unter der Voraussetzung einer stationären Störung kann für jedes spektrale Teilsignal der Koeffizient so berechnet werden, daß die Kurzzeitleistungen aller verarbeiteten, spektralen Teilsignale nach erfolgter Pegelsteuerung mit der Kurzzeitleistung des ungestörten Signalanteils übereinstimmen. Die Zeitkonstanten bei der Mittelwertbildung werden von einem Sprachpausendetektor gesteuert.

Die verarbeiteten, spektralen Teilsignale (komplexwertige Zeitsignale) werden im Syntheseteil durch inverse Transformation und inverse, interpolierende Polyphasenfilterung in ein reellwertiges Schätzsignal (Ausgangssignal) umgeformt, wobei die Taktfrequenz wieder auf das ursprüngliche Maß (interpolierende Technik) erhöht wird. Die in der adaptiven Polyphasen-Filterbank vorgenommene Taktfrequenzerhöhung kann durch einen Schalter, welcher mit Teilfiltern des inversen Polyphasen-Netzwerks verbunden ist, verdeutlicht werden.

Wie Untersuchungen gezeigt haben, verbleiben bei einer solchen Signalverarbeitung durch adaptive Gewichtung spektraler Teilsignale Reststörungen. Die verbleibende Reststörung ist akustisch beschreibbar als plätscherndes Geräusch, musikalische Töne, Sprachverzerrungen oder rauhe Sprachkomponenten.

Ein weiteres Verfahren zur Signalverbesserung unter Verwendung des Kurzzeitspektrums und Subtraktion des Störspektrums vom gestörten Signalspektrum ist aus einer Abhandlung in den IEEE Transactions, Band ASSP-27, Seiten 113 bis 120 bekannt. Es wird als das Verfahren der spektralen Subtraktion bezeichnet. Dabei wird mit Hilfe der Spektraltransformation das Kurzzeitspektrum für Blöcke des gestörten Signals nach Betrag und Phase ermittelt. Von den der Spektraltransformation unterworfenen Blöcken des gestörten Signals wird die Phaseninformation abgespaltet und ein Kurzzeit-Leistungsspektrum (Kurzzeit-Betragsspektrum) gebildet. Das in den Sprachpausen geschätzte Störspektrum, ein Betrag (Leistungs)-Spektrum, wird von diesem Kurzzeit- Leistungsspektrum subtrahiert. Dabei auftretende negative Resultate werden im Sinne einer Gleichrichtung korrigiert. Nach der Subtraktion wird das Betragsspektrum mit der Phase des gestörten Spektrums verknüpft und eine inverse Spektraltransformation ausgeführt. Nach Anwendung dieser Maßnahmen verbleibt ein störendes Restgeräusch.

Nach Durchführung der spektralen Subtraktion werden die zeitlichen Betragsverläufe der Kurzzeitspektren (Abtastwerte) für feste Frequenzen unabhängig voneinander verarbeitet. Liegt in der Sprachpause der einzelne Abtastwert unterhalb von Abtastwerten dieses Kanals, so wird der momentane Abtastwert durch einen lokalen Minimalwert ersetzt. Zur Bestimmung dieses Minimums werden die beiden zeitlich benachbarten Abtastwerte herangezogen.

Ein solches Verfahren weist den Nachteil auf, daß der lokale Minimalwert von der Aussteuerung abhängig ist. Daraus folgt eine Gesamtabschwächung des Schätzsignals. Ein weiterer Nachteil ist, bedingt durch die Auswertung eines mittleren Leistungskriteriums in Abhängigkeit von zeitlich benachbarten Abtastwerten, das Fehlen einer Kopplung benachbarter Spektrallinien bzw. benachbarter Kanäle. Auch der Aufwand bei der Realisierung eines solchen Verfahrens, insbesondere der Speicheraufwand und die Zahl der Rechenoperationen pro Abtastwert, ist relativ hoch.

Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren anzugeben, welches mit einem geringen Aufwand an Mitteln eine nach Signalverarbeitung von spektralen Teilsignalen durch adaptive Gewichtung noch verbleibende Reststörung annähernd beseitigt.

Diese Aufgabe wird erfindungsgemäß durch das Verfahren nach Anspruch 1 gelöst.

Bei dem vorgeschlagenen Verfahren (P 31 18 473.1-35) wird eine multiplikative Verknüpfung der Koeffizienten mit den spektralen Teilsignalen vorgenommen. Die zugrundeliegende Gewichtungsregel, evtl. in Kombination mit einer zeitlichen Mittelung der Betragssignale, ist zur Beseitigung stationärer Geräusche geeignet. Bei schwach instationären Störungen verbleiben infolge der statistischen Schwankungen der berechneten Kurzzeitmittelwerte Reststöranteile, die allein durch multiplikative Gewichtung nicht ohne Sprachverzerrungen zu beseitigen sind. Es läßt sich anhand eines statistischen Modells theoretisch zeigen, daß die unter der Annahme der Stationarität zu erzielende Geräuschreduktion prinzipiell begrenzt ist, sofern das Eingangssignal instationäre Komponenten enthält. Die Erfindung zeigt einen neuen Weg auf, indem bei der Vorgabe der Gewichtungsregel, hinsichtlich der psychoakustischen Komponente, das Ohr als Empfänger berücksichtigt und die Verarbeitung der Empfängercharakteristik angepaßt wird. Unter Berücksichtigung des Modells der Spracherzeugung ist die Verarbeitung auch auf die Sendercharakteristik abzustimmen, wozu eine Analyse der Merkmale einer Störung vorzunehmen ist.

Die Analyse verschiedener Störungen (Windgeräusch, Motorgeräusch) zeigt, daß in der Regel instationäre Störanteile auftreten, die sich charakteristisch vom Sprachsignal unterscheiden. Aus gezielten akustischen Experimenten mit synthetisierten Signalen, bestehend aus Sprachanteil und additiv überlagerten Störanteil, sind Adaptions-Algorithmen ableitbar, welche nach psychoakustischen Gesichtspunkten ausgelegt und für die Anwendung bei einer adaptiven Polyphasen-Filterbank oder einer Filterbank geeignet sind. Die Analyse der in den Sprachpausen unverdeckt auftretenden instationären Störanteile zeigt im Vergleich zum Sprachsignal das isolierte Auftreten von Frequenzlagen und die kurze zeitliche Dauer von energiereichen Störimpulsen. Derartig isolierte Komponenten treten in Sprachsignalen nicht auf, da der Sprachtrakt entweder durch ein rauschartiges oder ein sehr obertonreiches Signal angeregt wird. Außerdem sind wegen der nur relativ langsamen Veränderung der Sprachtrakt-Parameter keine extrem kurzen, impulsartigen Signalanteile festzustellen.

Das erfindungsgemäße Verfahren bietet eine einfache Möglichkeit aus der Betrachtung der Koeffizienten, welche den zu verarbeitenden spektralen Teilsignalen zugeordnet (kanalweise Zuordnung) sind, Regeln abzuleiten um die verbleibende Reststörung zu eliminieren. Zur Geräuschreduktion gestörter Sprachsignale kann vorzugsweise eine adaptive Polyphasen-Filterbank verwendet werden. Das erfindungsgemäße Verfahren ist nicht an diesem Anwendungsfall gebunden. Zur Signalanalyse kann auch eine Filterbank aus einzelnen, diskreten Bandpässen verwendet werden. Dann werden die Koeffizienten nicht aus den Beträgen der spektralen Teilsignale, sondern aus den Einhüllenden der reellen Bandpaßsignale abgeleitet. Die beschriebenen Vorteile ergeben sich für den Anwendungsfall adaptive Polyphasen- Filterbank. Ein erster Verfahrensschritt ist, unter Berücksichtigung der Wahrscheinlichkeitsrechnung, die Vorgabe eines Koeffizienten-Schwellenwerts. Dieser ergibt sich aus einem Kompromiß zwischen Störgeräuschreduktion und Sprachverzerrung. Diese nichtlineare Nachverarbeitung der Koeffizienten vermindert bereits die Reststörung. Ein weiterer Verfahrensschritt beruht auf dem Vergleich kanalweise und gleichzeitig berechneter Koeffizienten miteinander. Durch diese Maßnahme können isoliert auftretende Frequenzlagen eliminiert werden. Dabei ist bei der Festlegung der Mindestanzahl der zum Vergleich herangezogenen Koeffizienten die Eigenschaft von Sprachsignalen mit hoher Sprachgrundfrequenz (z. B. Frauen- und Kinderstimmen) zu berücksichtigen, wonach im Sprachsignal isolierte Frequenzlagen auftreten können, wenn die Grundfrequenz größer ist als der Kanalabstand der spektralen Teilsignale. Ein weiterer Verfahrensschritt besteht darin, in mindestens einen Kanal einen Vergleich zwischen zeitlich aufeinanderfolgenden Koeffizienten dieses Kanals durchzuführen. Dadurch können kurze Störanteile eliminiert werden.

Die einzelnen Verfahrensschritt werden auf die Betragssignale oder auf die Real- und Imaginärteilsignale angewandt, welche in gewissen Grenzen gemittelt werden, d. h. die gestörten Phasensignale können, wegen der relativ großen Unempfindlichkeit des Gehörs gegenüber Phasenstörungen, unverändert beibehalten werden.

Zweckmäßige Ausgestaltungen ergeben sich aus den Unteransprüchen.

Das erfindungsgemäße Verfahren wird nachfolgend anhand des in der Zeichnung dargestellten Ausführungsbeispiels näher beschrieben und erläutert.

Das Ausführungsbeispiel der Erfindung zeigt nur die für das Verständnis der Erfindung erforderlichen Einzelheiten. Die vorgeschlagene adaptive Polyphasen- Filterbank (P 31 18 473.1-35) besteht aus einem Signal-Analyseteil, einem Signal-Verarbeitungsteil zur adaptiven Signalverbesserung und einem Signal- Syntheseteil. Die Wirkung der Polyphasen-Netzwerke ist beschreibbar durch ein Ersatzmodell bestehend aus Demodulator, Tiefpaß und Unterabtaster. In Verbindung mit einem diskreten Fourier-Transformations-Prozessor zur Fast-Fourier-Transformation wird eine Kurzzeitspektralanalyse mit Taktreduktion eines zugeführten Eingangssignal erzielt. Die zeitliche und spektrale Auflösung wird durch einen Prototyp-Tiefpaß mit dessen Impulsantwort bestimmt. Wie der vorgeschlagenen digitalen Filteranordnung (P 31 18 473-38) zu entnehmen ist, ist die Signal-Synthese durch Anwendung inverser Operationen möglich.

Im Signal-Analyseteil der adaptiven Polyphasen-Filterbank, bestehend aus Polyphasen-Netzwerk und dem diskreten Fourier-Transformations-Prozessor zur Fast- Fourier-Transformation, wird eine Aufspaltung des Eingangssignals in spektrale Teilsignale durchgeführt. In der Zeichnung ist ein spektrales Teilsignal mit V_ν bezeichnet. Durch die Induzierung mit dem Index ν soll ein spektrales Teilsignal mit ν-ten Kanal bezeichnet werden. Zur Vereinfachung der Betrachtung ist in der Zeichnung das spektrale Teilsignal für den ν-ten Kanal dargestellt, wobei in den anderen Kanälen die gleiche Darstellung zutreffend ist. In der Zeichnung sind zum Erleichtern des Verständnisses der Signal-Analyse- und Signal-Syntheseteil der adaptiven Polyphasen-Filterbank weggelassen. Wie aus der Zeichnung ersichtlich ist, besteht die Verarbeitung nicht nur in einer multiplikativen Gewichtung der spektralen Teilsignale V_ν (P 31 18 473-38), sondern in zusätzlichen nichtlinearen Operationen. Die verarbeiteten spektralen Teilsignale _ν werden durch, in der Zeichnung nicht dargestellte, inverse, diskrete Fourier-Transformation und inverse, interpolierende Polyphasenfilterung umgeformt, wobei die Taktfrequenz wieder auf das ursprüngliche Maß erhöht wird.

Das Eingangssignal besteht aus einem Sprachsignal s_ν und einem additiv überlagerten Störsignal n_ν. Durch multiplikative Verknüpfung der zu verarbeitenden spektralen Teilsignale, z. B. V_ν mit ersten Koeffizienten c_ν und unter Anwendung des erfindungsgemäßen Verfahrens kann neben der Reduktion von stationären Störungen auch eine Reduktion von instationären Störungen erreicht werden.

Das zu verarbeitende, spektrale Teilsignal V_ν wird einer Einrichtung 1 zur Umwandlung der, getrennt in Real- und Imaginärteil vorliegenden, spektralen Teilsignale in Polarkoordinaten zugeführt. Das erfindungsgemäße Verfahren ist unabhängig davon, in welchem Koordinatensystem die spektralen Teilsignale darstellbar sind. Werden die Real- und Imaginärteile der spektralen Teilsignale V_ν nicht mittels der Einrichtung 1 in Polarkoordinaten umgewandelt, so erübrigt sich dann auch die Rückwandlung der verarbeiteten, spektralen Teilsignale _ν in kartesische Koordinaten mittels einer Einrichtung 17. Die spektralen Teilsignale (komplexwertige Zeitsignale) V_ν werden zur Ableitung der ersten Koeffizienten c_n verwendet, während die gestörten Phasensignale Φ_ν beibehalten werden. Da zur Ableitung der ersten Koeffizienten c_ν eine bestimmte Zeit erforderlich ist, wird Betrag |V_n| und Phase Φ_ν in Einrichtungen 14 und 16 verzögert. Diese zeitliche Verzögerung steht in einem Zusammenhang mit der Zeit für die Berechnung des ersten Koeffizienten c_ν in einer Einrichtung 6 gemäß einer Gewichtungsregel. Eine weitere Verzögerung ergibt sich aus der Bestimmung eines Koeffizienten c3_ν mittels einer Einrichtung 11.

In einer Einrichtung 2 werden Kurzzeitmittelwert E₂ des gestörten Signals, zum Beispiel der spektralen Teilsignale V_ν, berechnet. Die in der Einrichtung 2 berechneten Kurzzeitmittelwerte E₂ weichen aufgrund der kurzzeitigen Instationarität der spektralen Teilsignal V_ν (Instationarität des Störsignals n_ν) statistisch von einem in einer Einrichtung 5 berechneten Langzeitmittelwert E₁ ab. In der Einrichtung 5 kann der Langzeitmittelwert E₁ von n_ν berechnet werden, wozu eine Sprachpausenerkennung (Einrichtung 4) erforderlich ist. Unter Verwendung der Kurzzeitbetragssumme ist im Zeitbereich eine sichere Erkennung von Sprachpausen möglich. Wie der Zeichnung zu entnehmen ist, wird bei erkannter Sprachpause ein Schalter 3 geschlossen und in der Einrichtung 5 der Langzeitmittelwert E₁ der Störung n_ν berechnet. In der Einrichtung 6 wird aus dem zugeführten Langzeitmittelwert E₁ der Störung n_ν und den ermittelten Kurzzeitmittelwerten E₂ des gestörten Signals (s_ν+n_ν), gemäß einer Gewichtungsregel, der erste Koeffizient c_ν ermittelt. Die verwendete Gewichtungsregel ist eine Funktion von Langzeitmittelwert E₁ der Störung n_ν und Kurzzeitmittelwert E₂ des gestörten Signals (s_ν+n_ν) (eines lokalen Kurzzeit-Signal-Störabstands ρ) und einer reellwertigen Konstante K. Beispiel für eine solcher Gewichtungsregel ist

Die angegebene Gewichtungsregel G wurde aus einer großen Vielfalt von Kombinationsmöglichkeiten unter Zuhilfenahme umfangreicher objektiver und subjektiver Hörtests entwickelt. Das Problem der Vorgabe der Gewichtungsregel liegt in den teilweise sich widersprechenden Forderungen nach hoher Geräuschreduktion und guter Sprachverständlichkeit. Da die Pegelbewertung des Betrags |V_ν| gemäß der Gewichtungsregel die exakte Kenntnis der Kurzzeit-Signal-Störabstände ρ

voraussetzt, diese aber nur geschätzt werden können, verbleiben in den Sprachpausen Reststörungen.

Durch Anwendung des erfindungsgemäßen Verfahrens kann die, im Falle der Verwendung der Gewichtungsregel G, verbleibende Reststörung, welche sich akustisch als plätschernde Geräusche, musikalische Töne, Verzerrungen oder rauhe Sprachkomponente zeigt, reduziert werden.

Dazu werden als erster Verfahrensschritt für den Fall, das erste, zeitabhängige Koeffizienten c_ν kleiner einem vorgebbaren Koeffizienten-Schwellenwert c_min auftreten, einem Koeffizienten c1_ν (Ausgangssignal einer Einrichtung 7) der Wert 0 zugeordnet. Der Koeffizienten-Schwellenwert c_min wurde empirisch zu 0,1 ermittelt. Dieser Vergleich ist beschreibbar durch die Gleichung (1):

und wird mittels der Einrichtung 7 durchgeführt.

Zur weiteren Signalverbesserung wird das Ausgangssignal c1_ν der Einrichtung 7 hinsichtlich der einzelnen Kanäle ausgewertet. Dazu wird ein Koeffizientenvergleich jeweils für im Frequenzbereich benachbarte Koeffizienten, z. B. c1_ν ₊₁, c1_ν _-1 durchgeführt. Aufgrund dieses Koeffizientenvergleichs mittels einer Einrichtung 9 wird eine nichlineare Glättung über dem Kanalindex ν vorgenommen. Beispielsweise wird für den Fall, daß Koeffizienten c1_ν ₊₁, c1_n _-1 gleich 0 im höher und tiefer gelegenden Frequenzbereich auftreten, einem Koeffizienten c2_ν der Wert 0 zugeordnet (Einrichtung 8). Dies ist zur Beseitigung des additiv überlagerten Störsignals n_ν (sprachuntypische Merkmale) geeignet, ohne da Sprachsignal s_ν zu verzerren. Durch Verarbeitung von Koeffizienten ist diese unabhängig von der Aussteuerung in einer adaptiven Filterbank. Die Koeffizienten c_ν, c1_ν, c2_ν, c3_ν und c4_ν liegen innerhalb eines Zahlenintervalls von 0 bis 1. Die Verarbeitung in der Einrichtung 9 kann z. B gemäß der folgenden Gleichung (2) vorgenommen werden

wobei z. B. a₀=1; a_±1=a_±2=-0,25; A_ν=0,25;

Dabei bezeichnet A_ν einen Schwellenwert, während die a_i Gewichtungsfaktoren darstellen. Wie aus der Gleichung (2) ersichtlich ist, wird der Vergleich mit jeweils zwei im Frequenzbereich höher und tiefer gelegenen Koeffizienten c1_ν ₊₁, c1_ν ₊₂ und c1_n _-1, c1_ν _-2 vorgenommen. Eine Verallgemeinerung im Sinne eine Veränderung der Summengrenzwerte oder der Koeffizienten ist möglich. Dadurch können sprachspezifische Merkmale berücksichtigt werden.

Mittels der Einrichtung 11 wird jede zeitliche Koeffizientenfolge c2_ν auf 0-Folgen untersucht. Bei Feststellung einer solchen wird erst nach Überschreitung einer Mindestzahl von zeitlich aufeinanderfolgenden und von 0 verschiedenen Koeffizienten c2_ν, ein Koeffizient c3_ν am Ausgang einer Einrichtung 10 gleich dem zugeführten Signal c2_ν gesetzt. Diese Zeitfilterung des Koeffizienten c3_ν ist beschreibbar durch die folgende Gleichung (3):

mit ρ:Zeitindex und
λ:Zeitpunkt

Ein weiterer Verfahrensschritt zur Signalverbesserung besteht in einer globalen Pausenabschaltung oder Pausenabschwächung. Dazu werden mittels Einrichtungen 12, 13 bei Feststellung von langen, gleichzeitig auftretenden 0-Folgen bei einer Mindestanzahl von Koeffizienten, z. B. c3_ν _-1, c3_ν, c3_ν ₊₁ auch jene von 0 verschiedene Koeffizienten in anderen Kanälen, z. B. c3_ν ₊₆ für diesen Zeitraum nachträglich mit 12 oder Wert 0 zugeordnet. Dieser Verfahrensschritt ist beschreibbar durch folgende Gleichung (4):

dabei bezeichnet D_ν einen Schwellenwert. Die erläuterten Verfahrensschritte können einzeln oder in Kombination angewandt werden. Bei Kombination aller vier Verfahrensschritte gemäß Gleichungen (1) bis (4) ist insbesondere zwischen den Worten (Sprachpause) und einzelnen Silben eine erhebliche Reduktion der Reststörung erreichbar. Durch Auswertung der ersten Koeffizienten c_ν und unter Berücksichtigung des Modells der Spracherzeugung kann ein einfach zu realisierendes und wirksames Verfahren zur Signalverbesserung angegeben werden.

Claims

1. Verfahren zur Signalverbesserung von gestörten Sprachsignalen, bei dem gestörte Sprachsignale mittels einer Filterbank in spektrale Teilsignale aufgespalten werden und bei dem die spektralen Teilsignale kanalweise verarbeitet werden, indem diese mit Koeffizienten aktiv gewichtet werden, und bei dem die kanalweise verarbeiteten, spektralen Teilsignale zum Ausgangssignal zusammengefügt werden, dadurch gekennzeichnet,
daß erste, zeitabhängige Koeffizienten (c_ν) kanalweise nach einer Gewichtungsregel gebildet werden und Vergleiche zwischen den ersten Koeffizienten (c_ν) und mindestens einem vorgebbaren Koeffizienten-Schwellenwert (c_min) und/oder Vergleiche kanalweise und gleichzeitig berechneter Koeffizienten (c2_ν) miteinander und/oder Vergleiche zwischen zeitlich aufeinanderfolgenden Koeffizienten (c3_ν) und (c4_ν) mindestens eines Kanals durchgeführt werden,
daß den ersten Koeffizienten (c_ν) der Wert 0 zugeordnet wird, wenn sie kleiner als der vorgebbare Koeffizienten- Schwellwert (c_min) sind,
daß der Vergleich gleichzeitig berechneter Koeffizienten (c1_ν) jeweils für Koeffizienten (c1_ν) benachbarter Kanäle durchgeführt wird und
daß bei Feststellung, daß sich ein Koeffizient (c1_ν) von denen benachbarter höherer und tieferer Kanäle um ein Mindestmaß unterscheidet, eine nichtlineare Glättung vorgenommen wird.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Koeffizienten-Schwellenwert (c_min) bei 0,1 liegt.

3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß bei der nichtlinearen Glättung dem Koeffizienten (c1_n) ein Wert zugeordnet wird, welcher sich aus dem Mittelwert von Koeffizienten (z. B. c1_ν ₊₁, c1_ν _-1) benachbarter Kanäle oder deren Linearkombination ergibt.

4. Verfahren nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet, daß das Mindestmaß auf einem Vergleich der Koeffizienten (z. B. c1_ν ₊₁, c1_ν _-1) mit einer Schwelle (z. B. Wert 0,2) oder auf einem Vergleich des Koeffizienten (c1_ν) mit der Linearkombination beruht.

5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die zeitliche Koeffizientenfolge mindestens eines Kanals auf 0-Folgen untersucht wird und daß bei Feststellung einer solchen erst für eine Mindestanzahl zeitlich aufeinanderfolgender und von 0 verschiedener Koeffizienten (c2_ν) der Koeffizienten (c3_n) selbst zur adaptiven Gewichtung verwendet wird.

6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß bei Feststellung von langen, gleichzeitig auftretenden 0-Folgen der Koeffizienten (c3_ν) in einer Mindestzahl von Kanälen auch jenen von 0 verschiedenen Koeffizienten (c3_ν) anderer Kanäle für diesen Zeitraum der Wert 0 zugeordnet wird.

7. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Koeffizienten (c_ν, c1_ν, c3_ν und c4_ν) innerhalb eines Zahlenintervalls von 0 bis 1 liegen.

8. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der erste Koeffizient (d_ν) eine Funktion von Langzeitmittelwert (E₁) der Störung und Kurzzeitmittelwert (E₂) des gestörten Signals und einer reellwertigen Konstante (K) ist.