-
-
Verfahren zur Signalverbesserung von gestörten
-
Sprachsignalen Die Erfindung betrifft ein Verfahren zur Signalverbesserung
von gestörten Sprachsignalen bei dem gestörte Sprachsignale mittels einer Filterbank
in spektrale Teilsignale aufgespaltet werden, bei dem die spektralen Teilsignale
kanalweise verarbeitet werden, indem diese mit Koeffizienten adaptiv werden und
bei dem die kanalweise verarbeiteten, spektralen Teilsignale zum Ausgangssignal
zusammengefügt werden.
-
Die Kurzzeitspektralanalyse ist ein wichtiges Hilfsmittel zur Bestimmung
spektraler Eigenschaften, Ein Wanderfenster gleitet über die zu analysierende Signalfolge,
wobei laufend die Spektralkoeffizienten der ausgeblendeten und gewichteten Signalwerte
an den interessierenden Frequenzpunkten bestimmt werden. Die zeitliche Veränderung
des Kurzzeitspektrums kommt in der Abhängigkeit der Spektralkoeffizienten von der
jeweiligen Position des Wanderfensters zum Ausdruck. Der Aufwand zur Durchführung
der Kurzzeitspektralanalyse kann durch Verwendung einer Filterbank nach dem Polyphasenprinzip
gegenüber einer Filterbank nach dem Prinzip des Wanderfensters erheblich reduziert
werden. Insbesondere ist dabei keine zeitliche Begrenzung des Wanderfensters entsprechend
einer nichtrekursiven Filterung erforderlich, d.h. es können rekursive Filter verwendet
werden.
-
Es ist ein Verfahren zur Aufbereitung elektrischer Signale mittels
einer adaptiven Filterbank unter Verwendung von Polyphasen-Netzwerken vorgeschlagen
worden (P 31 18 473.1-35).
-
Durch die Verwendung der Polyphasen-Netzwerke sind weniger Rechenschritte
erforderlich als bei der Verwendung von äquivalenten, adaptiven, hochgradigen Transversalfiltern.
Die vorgeschlagene adaptive Polyphasen-Filterbank (P 31 18 473.1-35) besteht aus
einem Signal-Analyseteil, einem Signal-Verarbeitungsteil und einem Signal-Syntheseteil.
-
Der Signal-Analyseteil enthält ein Polyphasen-Netzwerk, das sich aus
einzelnen Teilfiltern zusammensetzt, und einem diskreten Fourier-Transformations-Prozessor
zur Fourier-Transformation. Das der adaptiven Polyphasen-Filterbank zugeführte Eingangssignal
wird in spektrale Teilsignale (in der Torm komplexwertiger Tiefpaßsignale) aufgespaltet.
-
Wegen der damit verbundenen Taktreduktion (dezimierende Technik),
ist der Rechenaufwand in den einzelnen Teilfiltern im Vergleich zu einer digitalen
Filterbank ohne Taktreduktion erheblich geringer. Die Reduktion der Abtastfrequenz
für das Eingangssignal kann durch einen am Eingang der adaptiven Polyphasen-Filterbank
angeordneten, rotierenden Schalter verdeutlicht werden. Die Koeffizienten der einzelnen
Teilfilter des Polyphasen-Netzwerkes können durch Transformation der Koeffizienten
eines rekursiven oder nicht-rekursiven Prototyp-Tiefpasses gewonnen werden. Die
gefilterten Teilsignale, d.h. die Ausgangssignale der Teilfilter, werden mit Hilfe
des Rechenverfahrens der diskreten Fourier-Transformation im diskreten Fourier-Transformations-Prozessors
in komplexwertige Tiefpaß-
signale übergeführt. Die spektralen Teilsignale
an den Ausgängen des diskreten Fourier-Transformations-Prozessors sind interpretierbar
als komplexwertige Tiefpaßsignale gemäß einer Quadratur-Bandpaßfilterung mit Umsetzung
in die Tiefpaßlage und gleichzeitiger Taktreduktion.
-
Um eine Signalverbesserung von z.B. gestörten Sprachsignalen zu erreichen,
werden die spektralen Teilsignale einer adaptiven, komplexwertigen Verarbeitung
(Filterung) unterzogen. Die spektralen Teilsignale liegen getrennt nach Real- und
Imaginärteil vor. Zur adaptiven Gewichtung der zu verarbeitenden, spektralen Teilsignale
nach einer Gewichtungsregel (adaptive Pegel steuerung) wird der aus Real- und Imaginärteil
ableitbare Betrag mit einem Koeffizienten multipliziert, der nach einer Gewichtungsregel
gebildet wird. Zur Koeffizientenberechnung können beispielsweise Kurzzeitleistungen
von Störsignalen in Sprachpausen herangezogen werden.
-
Die Kurzzeitleistung eines spektralen Teilsignals, welches sich aus
Signalanteil und Störanteil additiv zusammensetzt, kann beispielsweise durch gleitende
Mittelwertbildung (Rechteckfenster mit evtl. unterschiedlichen Fensterlängen) berechnet
werden.
-
Unter der Voraussetzung einer stationären Störung kann für jedes spektrale
Teilsignal der Koeffizient so berechnet werden, daß die Kurzzeitleistungen aller
verarbeiteten, spektralen Teilsignale nach erfolgter Pegelsteuerung mit der Kurzzeitleistung
des ungestörten Signalanteils übereinstimmen. Die Zeitkonstanten bei der Mittelwertbildung
werden von einem Sprachpausendetektor gesteuert.
-
Die verarbeiteten, spektralen Teilsignale (komplexwertige Zeitsignale)
werden im Syntheseteil durch inverse Transformation und inverse,interpolierende
Polyphasenfilterung in ein reellwertiges Schätzsignal (Ausgangssignal) umgeformt,
wobei die Taktfrequenz wieder auf das ursprüngliche Maß (interpolierende Technik)
erhöht wird. Die in der adaptiven Polyphasen-Filterbank vorgenommene Taktfrequenzerhöhung
kann durch einen Schalter, welcher mit Teilfiltern des inversen Polyphasen-Netzwerks
verbunden ist, verdeutlicht werden.
-
Wie Untersuchungen gezeigt haben, verbleiben bei einer solchen Signalverarbeitung
durch adaptive Gewichtung spektraler Teilsignale Reststörungen.
-
Die verbleibende Reststörung ist akustisch beschreibbar als plätscherndes
Geräusch, musikalische Töne, Sprachverzerrungen oder rauhe Sprachkomponenten.
-
Ein weiteres Verfahren zur Signalverbesserung unter Verwendung des
Kurzzeitspektrums und Subtraktion des Störspektrums vom gestörten Signalspektrum
ist aus einer Abhandlung in den IEEE Transactions, Band ASSP-27, Seiten 113 bis
120 bekannt. Es wird als das Verfahren der spektralen Subtraktion bezeichnet. Dabei
wird mit Hilfe der Spektraltransformation das Kurzzeitspektrum für Blöcke des gestörten
Signals nach Betrag und Phase ermittelt.
-
Von den der Spektraltransformation unterworfenen Blöcken des gestörten
Signals wird die Phaseninformation abgespaltet und ein Kurzzeit-Leistungsspektrum
(Kurzzeit-Betragsspektrum) gebildet. Das in den Sprachpausen geschätzte Störspektrum,
ein Betrag (Leistungs)-Spektrum, wird von diesem Kurzzeit-
Leistungsspektrum
subtrahiert. Dabei auftretende negative Resultate werden im Sinne einer Gleichrichtung
korrigiert. Nach der Subtraktion wird Betragsspektrum mit Phase des gestörten Spektrums
verknüpft und eine inverse Spektraltransformation ausgeführt. Nach Anwendung dieser
Maßnahmen verbleibt ein störendes Restgeräusch.
-
Nach Durchführung der spektralen Subtraktion werden die zeitlichen
Betragsverläufe der Kurzzeitspektren (Abtastwerte) für feste Frequenzen unabhängig
voneinander verarbeitet. Liegt in der Sprachpause der einzelne Abtastwert unterhalb
von Abtastwerten dieses Kanals, so wird der momentane Abtastwert durch einen lokalen
Minimalwert ersetzt. Zur Bestimmung dieses Minimums werden die beiden zeitlich benachbarten
Abtastwerte herangezogen.
-
Ein solches Verfahren weist den Nachteil auf, daß der lokale Minimalwert
von der Aussteuerung abhängig ist. Daraus folgt eine Gesamtabschwächung des Schätzsignals.
Ein weiterer Nachteil ist, bedingt durch die Auswertung eines mittleren Leistungskriteriums
in Abhängigkeit von zeitlich benachbarten Abtastwerten, das Fehlen einer Kopplung
benachbarter Spektrallinien bzw. benachbarter Kanäle. Auch der Aufwand bei der Realisierung
eines solchen Verfahrens, insbesondere der Speicheraufwand und die Zahl der Rechenoperationen
pro Abtastwert, ist relativ hoch.
-
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren anzugeben,
welches mit einem geringen Aufwand an Mitteln eine nach Signalverarbeitung von spektralen
Teilsignalen durch adaptive Gewichtung
noch verbleibende Reststörung
annähernd beseitigt.
-
Diese Aufgabe wird erfindungsgemäß dadurch gelöst, daß erste, zeitabhängige
Koeffizienten kanalweise nach einer Gewichtungsregel gebildet werden und Vergleiche-zwischen
den ersten Koeffizienten und mindestens einem vorgebbaren Koeffizienten-Schwellenwert
und/oder Vergleiche kanalweise und gleichzeitig berechneter Koeffizienten miteinander
und/oder Vergleiche zwischen zeitlich aufeinanderfolgenden Koeffizienten mindestens
eines Kanals durchgeführt werden.
-
Bei dem vorgeschlagenen Verfahren (P 31 18 473.1-35) wird eine multiplikative
Verknüpfung der Koeffizienten mit den spektralen Teilsignalen vorgenommen. Die zugrundeliegende
Gewichtungsregel, evtl. in Kombination mit einer zeitlichen Mittelung der Betragssignale,
ist zur Beseitigung stationärer Geräusche geeignet. Bei schwach instationären Störungen
verbleiben infolge der statistischen Schwankungen der berechneten Kurzzeitmittelwerte
Reststöranteile, die allein durch multiplikative Gewichtung nicht ohne Sprachverzerrungen
zu beseitigen sind. Es läßt sich anhand eines statistischen Modells theoretisch
zeigen, daß die unter der Annahme der Stationarität zu erzielende Geräuschreduktion
prinzipiell begrenzt ist, sofern das Eingangssignal instationäre Komponenten enthält.
Die Erfindung zeigt einen neuen Weg auf,indem bei der Vorgabe der Gewichtungsregel,
hinsichtlich der psychoakustischen Komponente, das Ohr als Empfänger berücksichtigt
und die Verarbeitung der Empfängercharakteristik angepaßt wird. Unter Berücksichtigung
des Modells der Spracherzeugung ist die Verarbeitung auch auf die Sendercharakteristik
abzustimmen, wozu eine Analyse der Merkmale einer Störung vorzunehmen ist.
-
Die Analyse verschiedener Störungen (Windgeräusch, Motorgeräusch)
zeigt, daß in der Regel instationäre Störanteile auftreten, die sich charakteristisch
vom Sprachsignal unterscheiden. Aus gezielten akustischen Experimenten mit synthetisierten
Signalen, bestehend aus Sprachanteil und additiv überlagerten Störanteil, sind Adaptions-Algorithmen
ableitbar, welche nach psychoakustischen Gesichtspunkten ausgelegt und für die Anwendung
bei einer adaptiven Polyphasen-Filterbank oder einer Filterbank geeignet sind. Die
Analyse der in den Sprachpausen unverdeckt auftretenden instationären Störanteile
zeigt im Vergleich zum Sprachsignal das isolierte Auftreten von Frequenzlagen und
die kurze zeitliche Dauer von energiereichen Störimpulsen. Derartig isolierte Komponenten
treten in Sprachsignalen nicht auf, da der Sprachtrakt entweder durch ein rauschartiges
oder ein sehr obertonreiches Signal angeregt wird. Außerdem sind wegen der nur relativ
langsamen Veränderung der Sprachtrakt-Parameter keine extrem kurzen, impulsartigen
Signalanteile festzustellen.
-
Das erfindungsgemäße Verfahren bietet eine einfache Möglichkeit aus
der Betrachtung der Koeffizienten, welche den zu verarbeitenden spektralen Teilsignalen
zugeordnet (kanalweise Zuordnung) sind, Regeln abzuleiten um die verbleibende Reststörung
zu eliminieren.
-
Zur Geräuschreduktion gestörter Sprachsignale kann vorzugsweise eine
adaptive Polyphasen-Filterbank verwendet werden. Das erfindungsgemäße Verfahren
ist nicht an diesen Anwendungsfall gebunden. Zur Signalanalyse kann auch eine Filterbank
aus einzelnen, diskreten Bandpässen verwendet werden. Dann werden die Koeffizienten
nicht aus den Beträgen der spektralen Teilsignale, sondern aus den Einhüllenden
der reellen Bandpaßsignale abgeleitet. Die beschriebenen Vorteile
ergeben
sich für den Anwendungsfall adaptive Polyphasen-Filterbank. Ein erster Verfahrensschritt
ist, unter Berücksichtigung der Wahrscheinlichkeitsrechnung, die Vorgabe eines Koeffizienten-Schwellenwerts.
-
Dieser ergibt sich aus einem Kompromiß zwischen Störgeräuschreduktion
und Sprachverzerrung, Diese nichtlineare Nachverarbeitung der Koeffizienten vermindert
bereits die Reststörung. Ein weiterer Verfahrensschritt beruht auf dem Vergleich
kanalweise und gleichzeitig berechneter Koeffizienten miteinander. Durch diese Maßnahme
können isoliert auf tretenCe Frequenzlagen eliminiert werden. Dabei ist bei der
Festlegung der Mindestanzahl der zum Vergleich herangezogenen Koeffizienten die
Eigenschaft von Sprachsignalen mit hoher Sprachgrundfrequenz (z.B. Frauen-und Kinderstimmen)
zu berücksichtigen, wonach im Sprachsignal isolierte Frequenz lagen auftreten können,
wenn die Grundfrequenz größer ist als der Kanalabstand der spektralen Teilsignale.Ein
weiterer Verfahrensschritt besteht darin, in mindestens einen Kanal einen Vergleich
zwischen zeitlich aufeinanderfolgenden Koeffizienten dieses Kanals durchzuführen.
-
Dadurch können kurze Störanteile eliminiert werden.
-
Die einzelnen Verfahrensschritte werden auf die Betragssignale oder
auf die Real- und Imaginärteilsignale angewandt, welche in gewissen Grenzen gemittelt
werden, d.h. die gestörten Phasensignale können, wegen der relativ großen Unempfindlichkeit
des Gehörs gegenüber Phasenstörungen, unverändert beibehalten werden.
-
Weiterhin wird vorgeschlagen, daß ersten Koeffizienten kleiner dem
vorgebbaren Koeffizienten-Schwellenwert der Wert 0 zugeordnet wird. Der Koeffizienten-Schwellenwert
liegt vorzugsweise bei 0,1. Der vorge-
gebene Koeffizienten-Schwellenwert
von 0,1 stellt einen Kompromiß zwischen Störgeräuschreduktion und Sprachverzerrung
dar.
-
Es hat sich als vorteilhaft erwiesen, den Vergleich gleichzeitig berechneter
Koeffizienten jeweils für Koeffizienten benachbarter Kanäle durchzuführen. Bei Feststellung,
daß sich ein Koeffizient von denen benachbarter höherer und tieferer Kanäle um ein
Mindestmaß unterscheidet, wird eine nichtlineare Glättung vorgenommen. Bei der nichtlinearen
Glättung wird dem Koeffizienten ein Wert zugeordnet, welcher sich aus dem Mittelwert
von Koeffizienten benachbarter Kanäle oder deren Linearkombination ergibt. Das Mindestmaß
beruht auf einem Vergleich der Koeffizienten benachbarter Kanäle mit einer Schwelle
oder auf einem Vergleich des Koeffizienten mit der Linearkombination.
-
Das erfindungsgemäße Verfahren bringt den Vorteil mit sich, daß durch
einfache Auswertung der Koeffizienten sprachuntypische Merkmale erkannt und somit
eine Reduktion des Störanteils erreichbar ist.
-
Weiterhin wird vorgeschlagen, daß die zeitliche Koeffizientenfolge
mindestens eines Kanals auf 0-Folgen untersucht wird. Wird eine solche festgestellt,
so wird erst für eine Mindestzahl von zeitlich aufeinanderfolgenden und von 0 verschiedenen
Kaeffizienten, der Koeffizient selbst zur adaptiven Gewichtung, insbesondere zur
multiplikativen Verknüpfung mit den spektralen Teilsignalen verwendet. Dadurch können
auf einfache Weise kurze zeitliche Störanteile eliminiert werden. Damit der Spracheinsatz
nicht verfälscht wird ist die Mindestanzahl, d.h. die Verzögerung der spektralen
Teilsignale, unter Berücksich-
tigung psychoakustischer Gesichtspunkte
festzulegen.
-
Vorzugsweise wird bei Feststellung von langen, gleich zeitig auftretenden
0-Folgen der Koeffizienten in einer Mindestanzahl von Kanälen auch jenen von 0 verschiedenen
Koeffizienten anderer Kanäle für diesen Zeitraum der Wert 0 zugeordnet. Diese Maßnahme
geht einher mit der Erkennung von Sprachpausen. Zur Sprachpausenerkennung kann es
sich als vorteilhaft erweisen nur einen bestimmten Spektralbereich auszuwählen,
d.h. nur einige Kanäle zu verwenden. Der zu analysierende Bereich liegt vorzugsweise
zwischen 300 und 1 kHz, da dort der größte Anteil der Sprachleistung liegt. Ist
eine Sprachpause, insbesondere eine Langzeitpause erkannt worden, so kann eine globale
Pausenabschaltung vorgenommen werden.
-
Schließlich wird vorgeschlagen, daß die Koeffizienten innerhalb eines
Zahlenintervalls von 0 bis 1 liegen und der erste Koeffizient eine Funktion von
Langzeitmittelwert der Störung und Kurzzeitmittelwert des gestörten Signals und
einer reellwertigen Konstante ist. Die Verwendung einer Gewichtungsregel, welche
auch eine Funktion von geschätzten Störabständen ist, bringt den Vorteil einer Verringerung
des erforderlichen Realisierungsaufwandes mit sich.
-
Es ist ein Kompromiß zwischen verbleibender Reststörung und Realisierungsaufwand
anzustreben. Nach Anwendung der Gewichtungsregel verbleibende Reststörung kann mittels
der geschilderten, erfindungsgemäßen Verfahrensschritte weitgehend unterdrückt werden.
-
Das erfindungsgemäße Verfahren wird nachfolgend anhand des in der
Zeichnung dargestellten Ausführungsbeispiels näher beschrieben und erläutert.
-
Das Ausführungsbeispiel der Erfindung zeigt nur die für das Verständnis
der Erfindung erforderlichen Einzelheiten. Die vorgeschlagene adaptive Polyphasen-Filterbank
(P 31 18 473.1-35) besteht aus einem Signal-Analyseteil, einem Signal-Verarbeitungsteil
zur adaptiven Signalverbesserung und einem Signal-Syntheseteil. Die Wirkung der
Polyphasen-Netzwerke ist beschreibbar durch ein Ersatzmodell bestehend aus Demodulator,
Tiefpaß und Unterabtaster. In Verbindung mit einem diskreten Fourier-Transformations-Prozessor
zur Fast-Fourier-Transformation wird eine Kurzzeitspektralanalyse mit Taktreduktion
eines zugeführten Eingangssignals erzielt. Die zeitliche und spektrale Auflösung
wird durch einen Prototyp-Tiefpaß mit dessen Impulsantwort bestimmt. Wie der vorgeschlagenen
digitalen Filteranordnung (P 31 18 473.1-38) zu entnehmen ist, ist die Signal-Synthese
durch Anwendung inverser Operationen möglich.
-
Im Signal-Analyseteil der adaptiven Polyphasen-Filterbank, bestehend
aus Polyphasen-Netzwerk und dem diskreten Fourier-Transformations-Prozessor zur
Fast-Fourier-Transformation, wird eine Aufspaltung des Eingangssignals in spektrale
Teilsignale durchgeführt.
-
In der Zeichnung ist ein spektrales Teilsignal mit bezeichnet. Durch
die Indizierung mit dem Index v soll ein spektrales Teilsignal im v-ten Kanal bezeichnet
werden. Zur Vereinfachung der Betrachtung ist in der Zeichnung das spektrale Teilsignal
für den v-ten Kanal dargestellt, wobei in den anderen Kanälen die gleiche Darstellung
zutreffend ist, In der Zeichnung sind zum Erleichtern des Verständnisses der Signal-Analyse-
und Signal-Syntheseteil der adaptiven Polyphasen-Filterbank weggelassen. Wie aus
der Zeichnung ersichtlich ist, besteht die Verarbeitung nicht nur in einer multiplikativen
Gewichtung der
spektralen Teilsignale V (P 31 18 473.1-38), sondern
in zusätzlichen nichtlinearen Operationen. Die verarbeiteten spektralen Teilsignale
ß werden durch, in der Zeichnung nicht dargestellte, inverse, diskrete Fourier-Transformation
und inverse, interpolierende Polyphasenfilterung- umgeformt, wobei die Taktfrequenz
wieder auf das ursprüngliche Maß erhöht wird.
-
Das Eingangssignal besteht aus einem Sprachsignal SV und einem additiv
überlagerten Störsignal nv. Durch multiplikative Verknüpfung der zu verarbeitenden
spektralen Teilsignale, z.B. Vy mit ersten Koeffizientenc und unter Anwendung des
erfindungsgemäßen Verfahrens kann neben der Reduktion von stationären Störungen
auch eine Reduktion von instationären Störungen erreicht werden.
-
Das zu verarbeitende, spektrale Teilsignal Vv wird einer Einrichtung
1 zur Umwandlung der, getrennt in Real- und Imaginärteil vorliegenden, spektralen
Teilsignale in Polarkoordinaten zugeführt. Das erfindungsgemäße Verfahren ist unabhängig
davon in welchem Koordinatensystem die spektralen Teilsignale darstellbar sind.
Werden die Real- und Imaginärteile der spektralen Teilsignale V nicht mittels der
Einrichtung 1 in Polarkoordinaten umgewandelt, so erübrigt sich dann auch die Rückwandlung
der verarbeiteten, spektralen Teilsignale S in kartesische Koordinaten mittels einer
Einrichtung 17. Die spektralen Teilsignale (komplexwertige Zeitsignale) V9 werden
zur Ableitung der ersten Koeffizienten verwendet, während die gestörten Phasensignale
v beibehalten werden. Da zur Ableitung der ersten Koeffizienten CV eine bestimmte
Zeit erforderlich ist, wird Betrag IV I und Phase tv in Einrichtungen 14 und 16
verzögert. Diese zeitliche Verzögerung steht
in einem Zusammenhang
mit der Zeit für die Berechnung des ersten Koeffizienten c in einer Einrichtung
6 gemäß einer Gewichtungsregel. Eine weitere Verzögerung ergibt sich aus der Bestimmung
eines Koeffizienten c3 mittels einer Einrichtung 11.
-
In einer Einrichtung 2 werden Kurzzeitmittelwert E2 des gestörten
Signals, zum Beispiel der spektralen Teilsignale Vvberechnet. Die in der Einrichtung
2 berechneten Kurzzeitmittelwerte E2 weichen aufgrund der kurzzeitigen Instationarität
der spektralen Teilsignale V9 (Instationarität des Störsignals ny) statistisch von
einem in. einer Einrichtung 5 berechneten Langzeitmittelwert E1 ab. In der Einrichtung
5 kann der Langzeitmittelwert E1 von nv berechnet werden wozu eine Sprachpausenerkennung
(Einrichtung 4) erforderlich ist. Unter Verwendung der Kurzzeitbetragssumme ist
im Zeitbereich eine sichere Erkennung von Sprachpausen möglich. Wie der Zeichnung
zu entnehmen ist, wird bei erkannter Sprachpause ein Schalter 3 geschlossen und
in der Einrichtung 5 der Langzeitmittelwert E1 der Störung nv berechnet. In der
Einrichtung 6 wird aus dem zugeführten Langzeitmit'telwert E1 der Störung nv und
den ermittelten Kurzzeitmittelwerten E2 des gestörten Signals (sV+nv), gemäß einer
Gewichtungsregel, der erste Koeffizient Cv ermittelt. Die verwendete Gewichtungsregel
ist eine Funktion von Langzeitmittelwert E1 der Störung ny und Kurzzeitmittelwert
E2 des gestörten Signals (s,+n (eines lokalen Kurzzeit-Signal-Störabstands p) und
einer reellwertigen Konstante K. Beispiel für eine solche Gewichtungsregel ist
Die angegebene Gewichtungsregel G wurde aus einer großen Vielfalt
von Kombinationsmöglichkeiten unter Zuhilfenahme umfangreicher objektiver und subjektiver
Hörtests entwickelt. Das Problem der Vorgabe der Gewichtungsregel liegt in den teilweise
sich widersprechenden Forderungen nach hoher Geräuschreduktion und guter Sprachverständlichkeit.
Da die Pegelbewertung des Betrags IV I gemäß der Gewichtungsregel die exakte Kenntnis
der Kurzzeit-Signal-Störabstände p E2 (p=E2 L -K) voraussetzt, diese aber nur geschätzt
werden können, verbleiben in den Sprachpausen Reststörungen.
-
Durch Anwendung des erfindungsgemäßen Verfahrens kann die, im Falle
der Verwendung der Gewichtungsregel G, verbleibende Reststörung, welche sich akustisch
als plätschernde Geräusche, musikalische Töne, Verzerrungen oder rauhe Sprachkomponente
zeigt, reduziert werden.
-
Dazu werden als erster Verfahrensschritt für den Fall, daß erste,
zeitabhängige Koeffizienten c kleiner einem vorgebbaren Koeffizienten-Schwellenwert
cmin auftreten, einem Koeffizienten cl (Ausgangssignal einer Einrichtung 7) der
Wert 0 zugeordnet. Der Koeffizienten-Schwellenwert cmin wurde empirisch zu 0,1 ermittelt.
Dieser Vergleich ist beschreibbar durch die Gleichung (1):
und wird mittels der Einrichtung 7 durchgeführt.
-
Zur weiteren Signalverbesserung wird das Ausgangssignal cl'> der
Einrichtung 7 hinsichtlich der einzelnen Kanäle ausgewertet, Dazu wird ein Koeffizientenvergleich
jeweils für im Frequenzbereich benachbarte Koeffizienten, z.B. c1#+1, c1#-1 durchgeführt.
Aufgrund dieses Koeffizientenvergleichs mittels einer Einrichtung 9 wird eine nichtlineare
Glättung über dem Kanalindex # vorgenommen. Beispielsweise wird für den Fall, daß
Koeffizienten c1#+1, c1#-1 gleich 0 im höher und tiefer gelegenen Frequenzbereich
auftreten, einem Koeffizienten c2v der Wert O zugeordnet (Einrichtung 8). Dies ist
zur Beseitigung des additiv überlagerten Störsignals n# (sprachuntypische Merkmale)
geeignet ohne das Sprachsignal sy zu verzerren. Durch Verarbeitung von Koeffizienten
ist diese unabhängig von der Aussteuerung in einer adaptiven Filterbank. Die Koeffizienten
c#, cl c2#, c3# und c4# liegen innerhalb eines Zahlenintervalls von 0 bis 1. Die
Verarbeitung in der Einrichtung 9 kann z.B. gemäß der folgenden Gleichung (2) vorgenommen
werden.
c19 ; sonst |
c29 = cl'> +2 (2) |
v 1 C a. C1v+ibAv |
i=-2 1 >+1 > |
wobei z.B. a=l; a+1=a+2= -0,25; A#=0, 25;
Dabei bezeichnet Ay einen Schwellenwert,während die a. Gewichtungsfaktoren darstellen,
Wie aus der Gleichung (2) ersichtlich ist, wird der Vergleich mit jeweils zwei im
Frequenzbereich höher und tiefer gelegenen Koeffizienten ci#+1, cl Cl9+e und cl
1, C19 2 vorgenommen. Eine Verallgemeinerung im Sinne einer Veränderung der Summengrenzwerte
oder der Koeffizienten ist möglich. Dadurch können sprach-
spezifische
Merkmale berücksichtigt werden.
-
Mittels der Einrichtung 11 wird jede zeitliche Koeffizientenfolge
c2 auf O-Folgen untersucht.
-
Bei Feststellung einer solchen wird erst nach Uberschreitung einer
Mindestanzahl von zeitlich aufeinanderfolgenden und von 0 verschiedenen Koeffizienten
c2V,ein Koeffizient c3'> am Ausgang einer Einrichtung 10 gleich dem zugeführten
Signal c2'> gesetzt.
-
Diese Zeitfilterung des Koeffizienten c3'> ist beschreibbar durch
die folgende Gleichung (3):
sonst (3) ; # c2# # (#-#)#+0 mit p:Zeitindex und Ä:Zeitpunkt Ein weiterer Verfahrensschritt
zur Signalverbesserung besteht in einer globalen Pausenabschaltung oder Pausenabschwächung.
Dazu werden mittels Einrichtungen 12,13 bei Feststellung von langen, gleichzeitig
auftretenden O-Folgen bei einer Mindestanzahl von Koeffizienten, z.B. c3 c3#-1,
c3#, c3 c39+1 auch jene von 0 verschiedene Koeffizienten in anderen Kanälen, z.B.
c39+6 für diesen Zeitraum nachträglich mit 12 der Wert 0 zugeordnet. Dieser Verfahrensschritt
ist beschreibbar durch folgende Gleichung (4):
cm ; sonst |
C49 = = i='> (4) |
; , c3 v-i Dv |
i=0 |
dabei bezeichnet D# einen Schwellenwert. Die erläuterten Verfahrensschritte können
einzeln oder in Kombination angewandt werden. Bei Kombination aller vier Verfahrensschritte
gemäß Gleichungen (1) bis (4)
ist insbesondere zwischen den Worten
(Sprachpause) und einzelnen Silben eine erhebliche Reduktion der Reststörung erreichbar.
Durch Auswertung der ersten Koeffizienten CV und unter Berücksichtigung des Modells
der Spracherzeugung kann ein einfach Zu realisierendes und wirksames Verfahren zur
Signalverbesserung angegeben werden.