DE3230391A1 - Verfahren zur signalverbesserung von gestoerten sprachsignalen - Google Patents

Verfahren zur signalverbesserung von gestoerten sprachsignalen

Info

Publication number
DE3230391A1
DE3230391A1 DE19823230391 DE3230391A DE3230391A1 DE 3230391 A1 DE3230391 A1 DE 3230391A1 DE 19823230391 DE19823230391 DE 19823230391 DE 3230391 A DE3230391 A DE 3230391A DE 3230391 A1 DE3230391 A1 DE 3230391A1
Authority
DE
Germany
Prior art keywords
coefficients
coefficient
signal
signals
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19823230391
Other languages
English (en)
Other versions
DE3230391C2 (de
Inventor
Wolfgang Dipl.-Ing. 8500 Nürnberg Brox
Karl Dipl.-Ing. 8729 Wonfurt Hellwig
Peter Dr. 8522 Herzogenaurach Vary
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Philips Intellectual Property and Standards GmbH
Original Assignee
Philips Kommunikations Industrie AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Kommunikations Industrie AG filed Critical Philips Kommunikations Industrie AG
Priority to DE19823230391 priority Critical patent/DE3230391A1/de
Publication of DE3230391A1 publication Critical patent/DE3230391A1/de
Application granted granted Critical
Publication of DE3230391C2 publication Critical patent/DE3230391C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)

Description

  • Verfahren zur Signalverbesserung von gestörten
  • Sprachsignalen Die Erfindung betrifft ein Verfahren zur Signalverbesserung von gestörten Sprachsignalen bei dem gestörte Sprachsignale mittels einer Filterbank in spektrale Teilsignale aufgespaltet werden, bei dem die spektralen Teilsignale kanalweise verarbeitet werden, indem diese mit Koeffizienten adaptiv werden und bei dem die kanalweise verarbeiteten, spektralen Teilsignale zum Ausgangssignal zusammengefügt werden.
  • Die Kurzzeitspektralanalyse ist ein wichtiges Hilfsmittel zur Bestimmung spektraler Eigenschaften, Ein Wanderfenster gleitet über die zu analysierende Signalfolge, wobei laufend die Spektralkoeffizienten der ausgeblendeten und gewichteten Signalwerte an den interessierenden Frequenzpunkten bestimmt werden. Die zeitliche Veränderung des Kurzzeitspektrums kommt in der Abhängigkeit der Spektralkoeffizienten von der jeweiligen Position des Wanderfensters zum Ausdruck. Der Aufwand zur Durchführung der Kurzzeitspektralanalyse kann durch Verwendung einer Filterbank nach dem Polyphasenprinzip gegenüber einer Filterbank nach dem Prinzip des Wanderfensters erheblich reduziert werden. Insbesondere ist dabei keine zeitliche Begrenzung des Wanderfensters entsprechend einer nichtrekursiven Filterung erforderlich, d.h. es können rekursive Filter verwendet werden.
  • Es ist ein Verfahren zur Aufbereitung elektrischer Signale mittels einer adaptiven Filterbank unter Verwendung von Polyphasen-Netzwerken vorgeschlagen worden (P 31 18 473.1-35).
  • Durch die Verwendung der Polyphasen-Netzwerke sind weniger Rechenschritte erforderlich als bei der Verwendung von äquivalenten, adaptiven, hochgradigen Transversalfiltern. Die vorgeschlagene adaptive Polyphasen-Filterbank (P 31 18 473.1-35) besteht aus einem Signal-Analyseteil, einem Signal-Verarbeitungsteil und einem Signal-Syntheseteil.
  • Der Signal-Analyseteil enthält ein Polyphasen-Netzwerk, das sich aus einzelnen Teilfiltern zusammensetzt, und einem diskreten Fourier-Transformations-Prozessor zur Fourier-Transformation. Das der adaptiven Polyphasen-Filterbank zugeführte Eingangssignal wird in spektrale Teilsignale (in der Torm komplexwertiger Tiefpaßsignale) aufgespaltet.
  • Wegen der damit verbundenen Taktreduktion (dezimierende Technik), ist der Rechenaufwand in den einzelnen Teilfiltern im Vergleich zu einer digitalen Filterbank ohne Taktreduktion erheblich geringer. Die Reduktion der Abtastfrequenz für das Eingangssignal kann durch einen am Eingang der adaptiven Polyphasen-Filterbank angeordneten, rotierenden Schalter verdeutlicht werden. Die Koeffizienten der einzelnen Teilfilter des Polyphasen-Netzwerkes können durch Transformation der Koeffizienten eines rekursiven oder nicht-rekursiven Prototyp-Tiefpasses gewonnen werden. Die gefilterten Teilsignale, d.h. die Ausgangssignale der Teilfilter, werden mit Hilfe des Rechenverfahrens der diskreten Fourier-Transformation im diskreten Fourier-Transformations-Prozessors in komplexwertige Tiefpaß- signale übergeführt. Die spektralen Teilsignale an den Ausgängen des diskreten Fourier-Transformations-Prozessors sind interpretierbar als komplexwertige Tiefpaßsignale gemäß einer Quadratur-Bandpaßfilterung mit Umsetzung in die Tiefpaßlage und gleichzeitiger Taktreduktion.
  • Um eine Signalverbesserung von z.B. gestörten Sprachsignalen zu erreichen, werden die spektralen Teilsignale einer adaptiven, komplexwertigen Verarbeitung (Filterung) unterzogen. Die spektralen Teilsignale liegen getrennt nach Real- und Imaginärteil vor. Zur adaptiven Gewichtung der zu verarbeitenden, spektralen Teilsignale nach einer Gewichtungsregel (adaptive Pegel steuerung) wird der aus Real- und Imaginärteil ableitbare Betrag mit einem Koeffizienten multipliziert, der nach einer Gewichtungsregel gebildet wird. Zur Koeffizientenberechnung können beispielsweise Kurzzeitleistungen von Störsignalen in Sprachpausen herangezogen werden.
  • Die Kurzzeitleistung eines spektralen Teilsignals, welches sich aus Signalanteil und Störanteil additiv zusammensetzt, kann beispielsweise durch gleitende Mittelwertbildung (Rechteckfenster mit evtl. unterschiedlichen Fensterlängen) berechnet werden.
  • Unter der Voraussetzung einer stationären Störung kann für jedes spektrale Teilsignal der Koeffizient so berechnet werden, daß die Kurzzeitleistungen aller verarbeiteten, spektralen Teilsignale nach erfolgter Pegelsteuerung mit der Kurzzeitleistung des ungestörten Signalanteils übereinstimmen. Die Zeitkonstanten bei der Mittelwertbildung werden von einem Sprachpausendetektor gesteuert.
  • Die verarbeiteten, spektralen Teilsignale (komplexwertige Zeitsignale) werden im Syntheseteil durch inverse Transformation und inverse,interpolierende Polyphasenfilterung in ein reellwertiges Schätzsignal (Ausgangssignal) umgeformt, wobei die Taktfrequenz wieder auf das ursprüngliche Maß (interpolierende Technik) erhöht wird. Die in der adaptiven Polyphasen-Filterbank vorgenommene Taktfrequenzerhöhung kann durch einen Schalter, welcher mit Teilfiltern des inversen Polyphasen-Netzwerks verbunden ist, verdeutlicht werden.
  • Wie Untersuchungen gezeigt haben, verbleiben bei einer solchen Signalverarbeitung durch adaptive Gewichtung spektraler Teilsignale Reststörungen.
  • Die verbleibende Reststörung ist akustisch beschreibbar als plätscherndes Geräusch, musikalische Töne, Sprachverzerrungen oder rauhe Sprachkomponenten.
  • Ein weiteres Verfahren zur Signalverbesserung unter Verwendung des Kurzzeitspektrums und Subtraktion des Störspektrums vom gestörten Signalspektrum ist aus einer Abhandlung in den IEEE Transactions, Band ASSP-27, Seiten 113 bis 120 bekannt. Es wird als das Verfahren der spektralen Subtraktion bezeichnet. Dabei wird mit Hilfe der Spektraltransformation das Kurzzeitspektrum für Blöcke des gestörten Signals nach Betrag und Phase ermittelt.
  • Von den der Spektraltransformation unterworfenen Blöcken des gestörten Signals wird die Phaseninformation abgespaltet und ein Kurzzeit-Leistungsspektrum (Kurzzeit-Betragsspektrum) gebildet. Das in den Sprachpausen geschätzte Störspektrum, ein Betrag (Leistungs)-Spektrum, wird von diesem Kurzzeit- Leistungsspektrum subtrahiert. Dabei auftretende negative Resultate werden im Sinne einer Gleichrichtung korrigiert. Nach der Subtraktion wird Betragsspektrum mit Phase des gestörten Spektrums verknüpft und eine inverse Spektraltransformation ausgeführt. Nach Anwendung dieser Maßnahmen verbleibt ein störendes Restgeräusch.
  • Nach Durchführung der spektralen Subtraktion werden die zeitlichen Betragsverläufe der Kurzzeitspektren (Abtastwerte) für feste Frequenzen unabhängig voneinander verarbeitet. Liegt in der Sprachpause der einzelne Abtastwert unterhalb von Abtastwerten dieses Kanals, so wird der momentane Abtastwert durch einen lokalen Minimalwert ersetzt. Zur Bestimmung dieses Minimums werden die beiden zeitlich benachbarten Abtastwerte herangezogen.
  • Ein solches Verfahren weist den Nachteil auf, daß der lokale Minimalwert von der Aussteuerung abhängig ist. Daraus folgt eine Gesamtabschwächung des Schätzsignals. Ein weiterer Nachteil ist, bedingt durch die Auswertung eines mittleren Leistungskriteriums in Abhängigkeit von zeitlich benachbarten Abtastwerten, das Fehlen einer Kopplung benachbarter Spektrallinien bzw. benachbarter Kanäle. Auch der Aufwand bei der Realisierung eines solchen Verfahrens, insbesondere der Speicheraufwand und die Zahl der Rechenoperationen pro Abtastwert, ist relativ hoch.
  • Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren anzugeben, welches mit einem geringen Aufwand an Mitteln eine nach Signalverarbeitung von spektralen Teilsignalen durch adaptive Gewichtung noch verbleibende Reststörung annähernd beseitigt.
  • Diese Aufgabe wird erfindungsgemäß dadurch gelöst, daß erste, zeitabhängige Koeffizienten kanalweise nach einer Gewichtungsregel gebildet werden und Vergleiche-zwischen den ersten Koeffizienten und mindestens einem vorgebbaren Koeffizienten-Schwellenwert und/oder Vergleiche kanalweise und gleichzeitig berechneter Koeffizienten miteinander und/oder Vergleiche zwischen zeitlich aufeinanderfolgenden Koeffizienten mindestens eines Kanals durchgeführt werden.
  • Bei dem vorgeschlagenen Verfahren (P 31 18 473.1-35) wird eine multiplikative Verknüpfung der Koeffizienten mit den spektralen Teilsignalen vorgenommen. Die zugrundeliegende Gewichtungsregel, evtl. in Kombination mit einer zeitlichen Mittelung der Betragssignale, ist zur Beseitigung stationärer Geräusche geeignet. Bei schwach instationären Störungen verbleiben infolge der statistischen Schwankungen der berechneten Kurzzeitmittelwerte Reststöranteile, die allein durch multiplikative Gewichtung nicht ohne Sprachverzerrungen zu beseitigen sind. Es läßt sich anhand eines statistischen Modells theoretisch zeigen, daß die unter der Annahme der Stationarität zu erzielende Geräuschreduktion prinzipiell begrenzt ist, sofern das Eingangssignal instationäre Komponenten enthält. Die Erfindung zeigt einen neuen Weg auf,indem bei der Vorgabe der Gewichtungsregel, hinsichtlich der psychoakustischen Komponente, das Ohr als Empfänger berücksichtigt und die Verarbeitung der Empfängercharakteristik angepaßt wird. Unter Berücksichtigung des Modells der Spracherzeugung ist die Verarbeitung auch auf die Sendercharakteristik abzustimmen, wozu eine Analyse der Merkmale einer Störung vorzunehmen ist.
  • Die Analyse verschiedener Störungen (Windgeräusch, Motorgeräusch) zeigt, daß in der Regel instationäre Störanteile auftreten, die sich charakteristisch vom Sprachsignal unterscheiden. Aus gezielten akustischen Experimenten mit synthetisierten Signalen, bestehend aus Sprachanteil und additiv überlagerten Störanteil, sind Adaptions-Algorithmen ableitbar, welche nach psychoakustischen Gesichtspunkten ausgelegt und für die Anwendung bei einer adaptiven Polyphasen-Filterbank oder einer Filterbank geeignet sind. Die Analyse der in den Sprachpausen unverdeckt auftretenden instationären Störanteile zeigt im Vergleich zum Sprachsignal das isolierte Auftreten von Frequenzlagen und die kurze zeitliche Dauer von energiereichen Störimpulsen. Derartig isolierte Komponenten treten in Sprachsignalen nicht auf, da der Sprachtrakt entweder durch ein rauschartiges oder ein sehr obertonreiches Signal angeregt wird. Außerdem sind wegen der nur relativ langsamen Veränderung der Sprachtrakt-Parameter keine extrem kurzen, impulsartigen Signalanteile festzustellen.
  • Das erfindungsgemäße Verfahren bietet eine einfache Möglichkeit aus der Betrachtung der Koeffizienten, welche den zu verarbeitenden spektralen Teilsignalen zugeordnet (kanalweise Zuordnung) sind, Regeln abzuleiten um die verbleibende Reststörung zu eliminieren.
  • Zur Geräuschreduktion gestörter Sprachsignale kann vorzugsweise eine adaptive Polyphasen-Filterbank verwendet werden. Das erfindungsgemäße Verfahren ist nicht an diesen Anwendungsfall gebunden. Zur Signalanalyse kann auch eine Filterbank aus einzelnen, diskreten Bandpässen verwendet werden. Dann werden die Koeffizienten nicht aus den Beträgen der spektralen Teilsignale, sondern aus den Einhüllenden der reellen Bandpaßsignale abgeleitet. Die beschriebenen Vorteile ergeben sich für den Anwendungsfall adaptive Polyphasen-Filterbank. Ein erster Verfahrensschritt ist, unter Berücksichtigung der Wahrscheinlichkeitsrechnung, die Vorgabe eines Koeffizienten-Schwellenwerts.
  • Dieser ergibt sich aus einem Kompromiß zwischen Störgeräuschreduktion und Sprachverzerrung, Diese nichtlineare Nachverarbeitung der Koeffizienten vermindert bereits die Reststörung. Ein weiterer Verfahrensschritt beruht auf dem Vergleich kanalweise und gleichzeitig berechneter Koeffizienten miteinander. Durch diese Maßnahme können isoliert auf tretenCe Frequenzlagen eliminiert werden. Dabei ist bei der Festlegung der Mindestanzahl der zum Vergleich herangezogenen Koeffizienten die Eigenschaft von Sprachsignalen mit hoher Sprachgrundfrequenz (z.B. Frauen-und Kinderstimmen) zu berücksichtigen, wonach im Sprachsignal isolierte Frequenz lagen auftreten können, wenn die Grundfrequenz größer ist als der Kanalabstand der spektralen Teilsignale.Ein weiterer Verfahrensschritt besteht darin, in mindestens einen Kanal einen Vergleich zwischen zeitlich aufeinanderfolgenden Koeffizienten dieses Kanals durchzuführen.
  • Dadurch können kurze Störanteile eliminiert werden.
  • Die einzelnen Verfahrensschritte werden auf die Betragssignale oder auf die Real- und Imaginärteilsignale angewandt, welche in gewissen Grenzen gemittelt werden, d.h. die gestörten Phasensignale können, wegen der relativ großen Unempfindlichkeit des Gehörs gegenüber Phasenstörungen, unverändert beibehalten werden.
  • Weiterhin wird vorgeschlagen, daß ersten Koeffizienten kleiner dem vorgebbaren Koeffizienten-Schwellenwert der Wert 0 zugeordnet wird. Der Koeffizienten-Schwellenwert liegt vorzugsweise bei 0,1. Der vorge- gebene Koeffizienten-Schwellenwert von 0,1 stellt einen Kompromiß zwischen Störgeräuschreduktion und Sprachverzerrung dar.
  • Es hat sich als vorteilhaft erwiesen, den Vergleich gleichzeitig berechneter Koeffizienten jeweils für Koeffizienten benachbarter Kanäle durchzuführen. Bei Feststellung, daß sich ein Koeffizient von denen benachbarter höherer und tieferer Kanäle um ein Mindestmaß unterscheidet, wird eine nichtlineare Glättung vorgenommen. Bei der nichtlinearen Glättung wird dem Koeffizienten ein Wert zugeordnet, welcher sich aus dem Mittelwert von Koeffizienten benachbarter Kanäle oder deren Linearkombination ergibt. Das Mindestmaß beruht auf einem Vergleich der Koeffizienten benachbarter Kanäle mit einer Schwelle oder auf einem Vergleich des Koeffizienten mit der Linearkombination.
  • Das erfindungsgemäße Verfahren bringt den Vorteil mit sich, daß durch einfache Auswertung der Koeffizienten sprachuntypische Merkmale erkannt und somit eine Reduktion des Störanteils erreichbar ist.
  • Weiterhin wird vorgeschlagen, daß die zeitliche Koeffizientenfolge mindestens eines Kanals auf 0-Folgen untersucht wird. Wird eine solche festgestellt, so wird erst für eine Mindestzahl von zeitlich aufeinanderfolgenden und von 0 verschiedenen Kaeffizienten, der Koeffizient selbst zur adaptiven Gewichtung, insbesondere zur multiplikativen Verknüpfung mit den spektralen Teilsignalen verwendet. Dadurch können auf einfache Weise kurze zeitliche Störanteile eliminiert werden. Damit der Spracheinsatz nicht verfälscht wird ist die Mindestanzahl, d.h. die Verzögerung der spektralen Teilsignale, unter Berücksich- tigung psychoakustischer Gesichtspunkte festzulegen.
  • Vorzugsweise wird bei Feststellung von langen, gleich zeitig auftretenden 0-Folgen der Koeffizienten in einer Mindestanzahl von Kanälen auch jenen von 0 verschiedenen Koeffizienten anderer Kanäle für diesen Zeitraum der Wert 0 zugeordnet. Diese Maßnahme geht einher mit der Erkennung von Sprachpausen. Zur Sprachpausenerkennung kann es sich als vorteilhaft erweisen nur einen bestimmten Spektralbereich auszuwählen, d.h. nur einige Kanäle zu verwenden. Der zu analysierende Bereich liegt vorzugsweise zwischen 300 und 1 kHz, da dort der größte Anteil der Sprachleistung liegt. Ist eine Sprachpause, insbesondere eine Langzeitpause erkannt worden, so kann eine globale Pausenabschaltung vorgenommen werden.
  • Schließlich wird vorgeschlagen, daß die Koeffizienten innerhalb eines Zahlenintervalls von 0 bis 1 liegen und der erste Koeffizient eine Funktion von Langzeitmittelwert der Störung und Kurzzeitmittelwert des gestörten Signals und einer reellwertigen Konstante ist. Die Verwendung einer Gewichtungsregel, welche auch eine Funktion von geschätzten Störabständen ist, bringt den Vorteil einer Verringerung des erforderlichen Realisierungsaufwandes mit sich.
  • Es ist ein Kompromiß zwischen verbleibender Reststörung und Realisierungsaufwand anzustreben. Nach Anwendung der Gewichtungsregel verbleibende Reststörung kann mittels der geschilderten, erfindungsgemäßen Verfahrensschritte weitgehend unterdrückt werden.
  • Das erfindungsgemäße Verfahren wird nachfolgend anhand des in der Zeichnung dargestellten Ausführungsbeispiels näher beschrieben und erläutert.
  • Das Ausführungsbeispiel der Erfindung zeigt nur die für das Verständnis der Erfindung erforderlichen Einzelheiten. Die vorgeschlagene adaptive Polyphasen-Filterbank (P 31 18 473.1-35) besteht aus einem Signal-Analyseteil, einem Signal-Verarbeitungsteil zur adaptiven Signalverbesserung und einem Signal-Syntheseteil. Die Wirkung der Polyphasen-Netzwerke ist beschreibbar durch ein Ersatzmodell bestehend aus Demodulator, Tiefpaß und Unterabtaster. In Verbindung mit einem diskreten Fourier-Transformations-Prozessor zur Fast-Fourier-Transformation wird eine Kurzzeitspektralanalyse mit Taktreduktion eines zugeführten Eingangssignals erzielt. Die zeitliche und spektrale Auflösung wird durch einen Prototyp-Tiefpaß mit dessen Impulsantwort bestimmt. Wie der vorgeschlagenen digitalen Filteranordnung (P 31 18 473.1-38) zu entnehmen ist, ist die Signal-Synthese durch Anwendung inverser Operationen möglich.
  • Im Signal-Analyseteil der adaptiven Polyphasen-Filterbank, bestehend aus Polyphasen-Netzwerk und dem diskreten Fourier-Transformations-Prozessor zur Fast-Fourier-Transformation, wird eine Aufspaltung des Eingangssignals in spektrale Teilsignale durchgeführt.
  • In der Zeichnung ist ein spektrales Teilsignal mit bezeichnet. Durch die Indizierung mit dem Index v soll ein spektrales Teilsignal im v-ten Kanal bezeichnet werden. Zur Vereinfachung der Betrachtung ist in der Zeichnung das spektrale Teilsignal für den v-ten Kanal dargestellt, wobei in den anderen Kanälen die gleiche Darstellung zutreffend ist, In der Zeichnung sind zum Erleichtern des Verständnisses der Signal-Analyse- und Signal-Syntheseteil der adaptiven Polyphasen-Filterbank weggelassen. Wie aus der Zeichnung ersichtlich ist, besteht die Verarbeitung nicht nur in einer multiplikativen Gewichtung der spektralen Teilsignale V (P 31 18 473.1-38), sondern in zusätzlichen nichtlinearen Operationen. Die verarbeiteten spektralen Teilsignale ß werden durch, in der Zeichnung nicht dargestellte, inverse, diskrete Fourier-Transformation und inverse, interpolierende Polyphasenfilterung- umgeformt, wobei die Taktfrequenz wieder auf das ursprüngliche Maß erhöht wird.
  • Das Eingangssignal besteht aus einem Sprachsignal SV und einem additiv überlagerten Störsignal nv. Durch multiplikative Verknüpfung der zu verarbeitenden spektralen Teilsignale, z.B. Vy mit ersten Koeffizientenc und unter Anwendung des erfindungsgemäßen Verfahrens kann neben der Reduktion von stationären Störungen auch eine Reduktion von instationären Störungen erreicht werden.
  • Das zu verarbeitende, spektrale Teilsignal Vv wird einer Einrichtung 1 zur Umwandlung der, getrennt in Real- und Imaginärteil vorliegenden, spektralen Teilsignale in Polarkoordinaten zugeführt. Das erfindungsgemäße Verfahren ist unabhängig davon in welchem Koordinatensystem die spektralen Teilsignale darstellbar sind. Werden die Real- und Imaginärteile der spektralen Teilsignale V nicht mittels der Einrichtung 1 in Polarkoordinaten umgewandelt, so erübrigt sich dann auch die Rückwandlung der verarbeiteten, spektralen Teilsignale S in kartesische Koordinaten mittels einer Einrichtung 17. Die spektralen Teilsignale (komplexwertige Zeitsignale) V9 werden zur Ableitung der ersten Koeffizienten verwendet, während die gestörten Phasensignale v beibehalten werden. Da zur Ableitung der ersten Koeffizienten CV eine bestimmte Zeit erforderlich ist, wird Betrag IV I und Phase tv in Einrichtungen 14 und 16 verzögert. Diese zeitliche Verzögerung steht in einem Zusammenhang mit der Zeit für die Berechnung des ersten Koeffizienten c in einer Einrichtung 6 gemäß einer Gewichtungsregel. Eine weitere Verzögerung ergibt sich aus der Bestimmung eines Koeffizienten c3 mittels einer Einrichtung 11.
  • In einer Einrichtung 2 werden Kurzzeitmittelwert E2 des gestörten Signals, zum Beispiel der spektralen Teilsignale Vvberechnet. Die in der Einrichtung 2 berechneten Kurzzeitmittelwerte E2 weichen aufgrund der kurzzeitigen Instationarität der spektralen Teilsignale V9 (Instationarität des Störsignals ny) statistisch von einem in. einer Einrichtung 5 berechneten Langzeitmittelwert E1 ab. In der Einrichtung 5 kann der Langzeitmittelwert E1 von nv berechnet werden wozu eine Sprachpausenerkennung (Einrichtung 4) erforderlich ist. Unter Verwendung der Kurzzeitbetragssumme ist im Zeitbereich eine sichere Erkennung von Sprachpausen möglich. Wie der Zeichnung zu entnehmen ist, wird bei erkannter Sprachpause ein Schalter 3 geschlossen und in der Einrichtung 5 der Langzeitmittelwert E1 der Störung nv berechnet. In der Einrichtung 6 wird aus dem zugeführten Langzeitmit'telwert E1 der Störung nv und den ermittelten Kurzzeitmittelwerten E2 des gestörten Signals (sV+nv), gemäß einer Gewichtungsregel, der erste Koeffizient Cv ermittelt. Die verwendete Gewichtungsregel ist eine Funktion von Langzeitmittelwert E1 der Störung ny und Kurzzeitmittelwert E2 des gestörten Signals (s,+n (eines lokalen Kurzzeit-Signal-Störabstands p) und einer reellwertigen Konstante K. Beispiel für eine solche Gewichtungsregel ist Die angegebene Gewichtungsregel G wurde aus einer großen Vielfalt von Kombinationsmöglichkeiten unter Zuhilfenahme umfangreicher objektiver und subjektiver Hörtests entwickelt. Das Problem der Vorgabe der Gewichtungsregel liegt in den teilweise sich widersprechenden Forderungen nach hoher Geräuschreduktion und guter Sprachverständlichkeit. Da die Pegelbewertung des Betrags IV I gemäß der Gewichtungsregel die exakte Kenntnis der Kurzzeit-Signal-Störabstände p E2 (p=E2 L -K) voraussetzt, diese aber nur geschätzt werden können, verbleiben in den Sprachpausen Reststörungen.
  • Durch Anwendung des erfindungsgemäßen Verfahrens kann die, im Falle der Verwendung der Gewichtungsregel G, verbleibende Reststörung, welche sich akustisch als plätschernde Geräusche, musikalische Töne, Verzerrungen oder rauhe Sprachkomponente zeigt, reduziert werden.
  • Dazu werden als erster Verfahrensschritt für den Fall, daß erste, zeitabhängige Koeffizienten c kleiner einem vorgebbaren Koeffizienten-Schwellenwert cmin auftreten, einem Koeffizienten cl (Ausgangssignal einer Einrichtung 7) der Wert 0 zugeordnet. Der Koeffizienten-Schwellenwert cmin wurde empirisch zu 0,1 ermittelt. Dieser Vergleich ist beschreibbar durch die Gleichung (1):
    ~Cv ; Cv > Cmin
    (1)
    cmin
    und wird mittels der Einrichtung 7 durchgeführt.
  • Zur weiteren Signalverbesserung wird das Ausgangssignal cl'> der Einrichtung 7 hinsichtlich der einzelnen Kanäle ausgewertet, Dazu wird ein Koeffizientenvergleich jeweils für im Frequenzbereich benachbarte Koeffizienten, z.B. c1#+1, c1#-1 durchgeführt. Aufgrund dieses Koeffizientenvergleichs mittels einer Einrichtung 9 wird eine nichtlineare Glättung über dem Kanalindex # vorgenommen. Beispielsweise wird für den Fall, daß Koeffizienten c1#+1, c1#-1 gleich 0 im höher und tiefer gelegenen Frequenzbereich auftreten, einem Koeffizienten c2v der Wert O zugeordnet (Einrichtung 8). Dies ist zur Beseitigung des additiv überlagerten Störsignals n# (sprachuntypische Merkmale) geeignet ohne das Sprachsignal sy zu verzerren. Durch Verarbeitung von Koeffizienten ist diese unabhängig von der Aussteuerung in einer adaptiven Filterbank. Die Koeffizienten c#, cl c2#, c3# und c4# liegen innerhalb eines Zahlenintervalls von 0 bis 1. Die Verarbeitung in der Einrichtung 9 kann z.B. gemäß der folgenden Gleichung (2) vorgenommen werden.
    c19 ; sonst
    c29 = cl'> +2 (2)
    v 1 C a. C1v+ibAv
    i=-2 1 >+1 >
    wobei z.B. a=l; a+1=a+2= -0,25; A#=0, 25; Dabei bezeichnet Ay einen Schwellenwert,während die a. Gewichtungsfaktoren darstellen, Wie aus der Gleichung (2) ersichtlich ist, wird der Vergleich mit jeweils zwei im Frequenzbereich höher und tiefer gelegenen Koeffizienten ci#+1, cl Cl9+e und cl 1, C19 2 vorgenommen. Eine Verallgemeinerung im Sinne einer Veränderung der Summengrenzwerte oder der Koeffizienten ist möglich. Dadurch können sprach- spezifische Merkmale berücksichtigt werden.
  • Mittels der Einrichtung 11 wird jede zeitliche Koeffizientenfolge c2 auf O-Folgen untersucht.
  • Bei Feststellung einer solchen wird erst nach Uberschreitung einer Mindestanzahl von zeitlich aufeinanderfolgenden und von 0 verschiedenen Koeffizienten c2V,ein Koeffizient c3'> am Ausgang einer Einrichtung 10 gleich dem zugeführten Signal c2'> gesetzt.
  • Diese Zeitfilterung des Koeffizienten c3'> ist beschreibbar durch die folgende Gleichung (3):
    c2#
    c3 =
    0
    sonst (3) ; # c2# # (#-#)#+0 mit p:Zeitindex und Ä:Zeitpunkt Ein weiterer Verfahrensschritt zur Signalverbesserung besteht in einer globalen Pausenabschaltung oder Pausenabschwächung. Dazu werden mittels Einrichtungen 12,13 bei Feststellung von langen, gleichzeitig auftretenden O-Folgen bei einer Mindestanzahl von Koeffizienten, z.B. c3 c3#-1, c3#, c3 c39+1 auch jene von 0 verschiedene Koeffizienten in anderen Kanälen, z.B. c39+6 für diesen Zeitraum nachträglich mit 12 der Wert 0 zugeordnet. Dieser Verfahrensschritt ist beschreibbar durch folgende Gleichung (4):
    cm ; sonst
    C49 = = i='> (4)
    ; , c3 v-i Dv
    i=0
    dabei bezeichnet D# einen Schwellenwert. Die erläuterten Verfahrensschritte können einzeln oder in Kombination angewandt werden. Bei Kombination aller vier Verfahrensschritte gemäß Gleichungen (1) bis (4) ist insbesondere zwischen den Worten (Sprachpause) und einzelnen Silben eine erhebliche Reduktion der Reststörung erreichbar. Durch Auswertung der ersten Koeffizienten CV und unter Berücksichtigung des Modells der Spracherzeugung kann ein einfach Zu realisierendes und wirksames Verfahren zur Signalverbesserung angegeben werden.

Claims (10)

  1. Patentansprüche 9 Verfahren zur Signalverbesserung von gestörten Sprachsignalen bei dem gestörte Sprachsignale mittels einer Filterbank in spektrale Teilsignale aufgespaltet werden, bei dem die spektralen Teilsignale kanalweise verarbeitet werden, indem diese mit Koeffizienten adaptiv gewichtet werden und bei dem die kanalweise verarbeiteten, spektralen Teilsignale zum Ausgangssignal zusammengefügt werden, dadurch gekennzeichnet, daß erste, zeitabhängige Koeffizienten (cv) kanalweise nach einer Gewichtungsregel gebildet werden und Vergleiche zwischen den ersten Koeffizienten (cv) und mindestens einem vorgebbaren Koeffizienten-Schwellenwert (cmin) und/oder Vergleiche kanalweise und gleichzeitig berechneter Koeffizienten (c2 miteinander und/oder Vergleiche zwischen zeitlich aufeinanderfolgenden Koeffizienten (c3 und c49) mindestens eines Kanals durchgeführt werden.
  2. 2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, daß ersten Koeffizienten (c ) kleiner dem vorgebbaren Koeffizienten-Schwellenwert (cmin) der Wert 0 zugeordnet wird,
  3. 3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß der Koeffizienten-Schwellenwert (cmin) bei 0,1 liegt.
  4. 4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Vergleich gleichzeitig berechneter Koeffizienten (clv) jeweils für Koeffizienten (cl benachbarter Kanäle durchgeführt wird und daß bei Feststellung, daß sich ein Koeffizient (c1#) von denen benachbarter höherer und tieferer Kanäle um ein Mindestmaß unterscheidet, eine nichtlineare Glättung vorgenommen wird,
  5. 5. Verfahren nach Anspruch 1 und 4, dadurch gekennzeichnet, daß bei der nichtlinearen Glättung dem Koeffizienten (c1#) ein Wert zugeordnet wird, welcher sich aus dem Mittelwert von Koeffizienten (z.B. cl clvl, clv 1) benachbarter Kanäle oder deren Linearkombination ergibt.
  6. 6. Verfahren nach Anspruch 1, 3 und 4, dadurch gekennzeichnet, daß das Mindestmaß auf einem Vergleich der Koeffizienten (z.B. cJ»+l, C1#-1) mit einer Schwelle (z.B. Wert. 0,2) oder auf einem Vergleich des Koeffizienten (c1#) mit der Linearkombination beruht.
  7. 7. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die zeitliche Koeffizientenfolge mindestens eines Kanals auf O-Folgen untersucht wird und daß bei Feststellung einer solchen erst für eine Mindestanzahl zeitlich aufeinanderfolgender und von 0 verschiedener Koeffizienten (c2»), der Koeffizienten (c39) selbst zur adaptiven Gewichtung verwendet wird.
  8. 8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß bei Feststellung von langen,'gleichzeitig auftretenden 0-Folgen der Koeffizienten (c39) in einer Mindestzahl von Kanälen auch jenen von 0 verschiedenen Koeffizienten (c3M) anderer Kanäle für diesen Zeitraum der Wert 0 zugeordnet wird.
  9. 9. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Koeffizienten (cv, cl9, C2w, c3 und c4M) innerhalb eines Zahlenintervalls von 0 bis 1 liegen.
  10. 10. Verfahren- nach Anspruch 1, dadurch gekennzeichnet, daß der erste Koeffizient (c#) eine Funktion von Langzeitmittelwert (E1) der Störung und Kurzzeitmittelwert (E2) des gestörten Signals und einer reellwertigen Konstante (K) ist.
DE19823230391 1982-08-14 1982-08-14 Verfahren zur signalverbesserung von gestoerten sprachsignalen Granted DE3230391A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19823230391 DE3230391A1 (de) 1982-08-14 1982-08-14 Verfahren zur signalverbesserung von gestoerten sprachsignalen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19823230391 DE3230391A1 (de) 1982-08-14 1982-08-14 Verfahren zur signalverbesserung von gestoerten sprachsignalen

Publications (2)

Publication Number Publication Date
DE3230391A1 true DE3230391A1 (de) 1984-02-16
DE3230391C2 DE3230391C2 (de) 1991-01-10

Family

ID=6170963

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19823230391 Granted DE3230391A1 (de) 1982-08-14 1982-08-14 Verfahren zur signalverbesserung von gestoerten sprachsignalen

Country Status (1)

Country Link
DE (1) DE3230391A1 (de)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3802903A1 (de) * 1988-02-01 1989-08-10 Siemens Ag Einrichtung zur uebertragung von sprache
WO1997022116A2 (en) * 1995-12-12 1997-06-19 Nokia Mobile Phones Limited A noise suppressor and method for suppressing background noise in noisy speech, and a mobile station
US5699480A (en) * 1995-07-07 1997-12-16 Siemens Aktiengesellschaft Apparatus for improving disturbed speech signals
DE19818609A1 (de) * 1998-04-20 1999-10-28 Deutsche Telekom Ag Verfahren und Vorrichtung zur Geräuschfilterung mit Bypass-Faktor
WO2003025905A1 (en) * 2001-09-20 2003-03-27 Honeywell, Inc. Active noise filtering for voice communication systems
CN112017683B (zh) * 2020-10-20 2021-01-05 南京南大电子智慧型服务机器人研究院有限公司 一种频域无次级路径有源噪声控制系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19854341A1 (de) 1998-11-25 2000-06-08 Alcatel Sa Verfahren und Schaltungsanordnung zur Sprachpegelmessung in einem Sprachsignalverarbeitungssystem

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3421141A (en) * 1967-10-16 1969-01-07 Huntec Ltd Self-adjusting filter
DE2051443B2 (de) * 1970-09-28 1978-06-08 Bbc Ag Brown, Boveri & Cie, Baden, Aargau (Schweiz) Elektrische Filterschaltung
DE3118473A1 (de) * 1981-05-09 1982-11-25 TE KA DE Felten & Guilleaume Fernmeldeanlagen GmbH, 8500 Nürnberg Verfahren zur aufbereitung elektrischer signale mit einer digitalen filteranordnung

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3421141A (en) * 1967-10-16 1969-01-07 Huntec Ltd Self-adjusting filter
DE2051443B2 (de) * 1970-09-28 1978-06-08 Bbc Ag Brown, Boveri & Cie, Baden, Aargau (Schweiz) Elektrische Filterschaltung
DE3118473A1 (de) * 1981-05-09 1982-11-25 TE KA DE Felten & Guilleaume Fernmeldeanlagen GmbH, 8500 Nürnberg Verfahren zur aufbereitung elektrischer signale mit einer digitalen filteranordnung

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BOLL, Steven F.: "Suppression of Acoustic Noise in Speech Using Spectral Suppression". In: IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-27, No. 2, April 1979, S. 113-120 *
MÖHRMANN, K.H.: "Adaptive Verfahren in der Übertragungstechnik" (Teil 1). In: FREQUENZ, 25 (1974) 5, S. 118-122 *
ROBERTS, P.D.: "Self-Adjusting Orthoyonal Digital Filter for Identifications of Unknown Processes". In: ELECTRONICS LETTERS, May 1966, Vol. 2, No. 5, S. 187, 188 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3802903A1 (de) * 1988-02-01 1989-08-10 Siemens Ag Einrichtung zur uebertragung von sprache
US5699480A (en) * 1995-07-07 1997-12-16 Siemens Aktiengesellschaft Apparatus for improving disturbed speech signals
WO1997022116A2 (en) * 1995-12-12 1997-06-19 Nokia Mobile Phones Limited A noise suppressor and method for suppressing background noise in noisy speech, and a mobile station
WO1997022116A3 (en) * 1995-12-12 1997-07-31 Nokia Mobile Phones Ltd A noise suppressor and method for suppressing background noise in noisy speech, and a mobile station
EP0790599A1 (de) * 1995-12-12 1997-08-20 Nokia Mobile Phones Ltd. Rauschenunterdrücker und Verfahren zur Unterdrückung des Hintergrundrauschens in einem verrauschten Sprachsignal und eine mobile Station
US5839101A (en) * 1995-12-12 1998-11-17 Nokia Mobile Phones Ltd. Noise suppressor and method for suppressing background noise in noisy speech, and a mobile station
DE19818609A1 (de) * 1998-04-20 1999-10-28 Deutsche Telekom Ag Verfahren und Vorrichtung zur Geräuschfilterung mit Bypass-Faktor
DE19818609C2 (de) * 1998-04-20 2000-06-15 Deutsche Telekom Ag Verfahren und Vorrichtung zur Geräuschfilterung
WO2003025905A1 (en) * 2001-09-20 2003-03-27 Honeywell, Inc. Active noise filtering for voice communication systems
CN112017683B (zh) * 2020-10-20 2021-01-05 南京南大电子智慧型服务机器人研究院有限公司 一种频域无次级路径有源噪声控制系统

Also Published As

Publication number Publication date
DE3230391C2 (de) 1991-01-10

Similar Documents

Publication Publication Date Title
DE69313480T2 (de) Rauschverminderungseinrichtung
DE69529328T2 (de) Verfahren und Apparat zur Geräuschunterdrückung in einem Sprachsignal und korrespondierendes System mit Echounterdrückung
EP0948237B1 (de) Verfahren zur Störbefreiung eines Mikrophonsignals
DE69531710T2 (de) Verfahren und Vorrichtung zur Verminderung von Rauschen bei Sprachsignalen
EP0912974B1 (de) Verfahren zur verringerung von störungen eines sprachsignals
DE3118473C2 (de) Verfahren zur Aufbereitung elektrischer Signale mit einer digitalen Filteranordnung
DE69803203T2 (de) Verfahren und vorrichtung zur rauschunterdrückung eines digitalen sprachsignals
DE69606978T2 (de) Verfahren zur rauschunterdrückung mittels spektraler subtraktion
DE112010005895B4 (de) Störungsunterdrückungsvorrichtung
DE2207141C3 (de) Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters
EP1386307B1 (de) Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals
WO1999023642A1 (de) Verfahren zur reduktion von störungen akustischer signale mittels der adaptiven filter-methode der spektralen subtraktion
DE112009000805T5 (de) Rauschreduktion
DE4330243A1 (de) Sprachverarbeitungseinrichtung
DE112012005855T5 (de) Störungsunterdrückungsvorrichtung
EP3089481B1 (de) Verfahren zur frequenzabhängigen rauschunterdrückung eines eingangssignals
DE112011106045B4 (de) Audiosignal-Wiederherstellungsvorrichtung und Audiosignal-Wiederherstellungsverfahren
DE68926930T2 (de) Geräuschunterdrückungsverfahren
DE102014221528B4 (de) Akkurate Vorwärts-SNR-Schätzung basierend auf MMSE-Sprachpräsenzwahrscheinlichkeit
EP0957471B1 (de) Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen
EP2080197B1 (de) Vorrichtung zur geräuschunterdrückung bei einem audiosignal
DE69511602T2 (de) Signalquellencharakterisiersystem
DE3230391A1 (de) Verfahren zur signalverbesserung von gestoerten sprachsignalen
DE10157535B4 (de) Verfahren und Vorrichtung zur Reduzierung zufälliger, kontinuierlicher, instationärer Störungen in Audiosignalen
EP1755110A2 (de) Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8125 Change of the main classification

Ipc: H03H 17/02

D2 Grant after examination
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: PHILIPS PATENTVERWALTUNG GMBH, 20097 HAMBURG, DE

8339 Ceased/non-payment of the annual fee