DE3230391C2 - - Google Patents

Info

Publication number
DE3230391C2
DE3230391C2 DE19823230391 DE3230391A DE3230391C2 DE 3230391 C2 DE3230391 C2 DE 3230391C2 DE 19823230391 DE19823230391 DE 19823230391 DE 3230391 A DE3230391 A DE 3230391A DE 3230391 C2 DE3230391 C2 DE 3230391C2
Authority
DE
Germany
Prior art keywords
coefficients
channel
coefficient
signal
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE19823230391
Other languages
English (en)
Other versions
DE3230391A1 (de
Inventor
Peter Dr. 8522 Herzogenaurach De Vary
Wolfgang Dipl.-Ing. 8500 Nuernberg De Brox
Karl Dipl.-Ing. 8729 Wonfurt De Hellwig
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Philips Intellectual Property and Standards GmbH
Original Assignee
Philips Kommunikations Industrie AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Kommunikations Industrie AG filed Critical Philips Kommunikations Industrie AG
Priority to DE19823230391 priority Critical patent/DE3230391A1/de
Publication of DE3230391A1 publication Critical patent/DE3230391A1/de
Application granted granted Critical
Publication of DE3230391C2 publication Critical patent/DE3230391C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)

Description

Die Erfindung geht aus von einem Verfahren zur Signalverbesserung von gestörten Sprachsignalen gemäß dem Oberbegriff des Anspruches 1. Derartige Verfahren gehen z. B. aus der US-Patentschrift 34 21 141 oder aus der deutschen Auslegeschrift 20 51 443 hervor.
Die Kurzzeitspektralanalyse ist ein wichtiges Hilfsmittel zur Bestimmung spektraler Eigenschaften. Ein Wanderfenster gleitet über die zu analysierende Signalfolge, wobei laufend die Spektralkoeffizienten der ausgeblendeten und gewichteten Signalwerte an den interessierenden Frequenzpunkten bestimmt werden. Die zeitliche Veränderung des Kurzzeitspektrums kommt in der Abhängigkeit der Spektralkoeffizienten von der jeweiligen Position des Wanderfensters zum Ausdruck. Der Aufwand zur Durchführung der Kurzzeitspektralanalyse kann durch Verwendung einer Filterbank nach dem Polyphasenprinzip gegenüber einer Filterbank nach dem Prinzip des Wanderfensters erheblich reduziert werden. Insbesondere ist dabei keine zeitliche Begrenzung des Wanderfensters entsprechend einer nichtrekursiven Filterung erforderlich, d. h. es können rekursive Filter verwendet werden.
Es ist ein Verfahren zur Aufbereitung elektrischer Signale mittels einer adaptiven Filterbank unter Verwendung von Polyphasen-Netzwerken vorgeschlagen worden (P 31 18 473.1-35). Durch die Verwendung der Polyphasen-Netzwerke sind weniger Rechenschritte erforderlich als bei der Verwendung von äquivalenten, adaptiven, hochgradigen Transversalfiltern. Die vorgeschlagene adaptive Polyphasen-Filterbank (P 31 18 473.1-35) besteht aus einem Signal-Analyseteil, einem Signal- Verarbeitungsteil und einem Signal-Syntheseteil.
Der Signal-Analyseteil enthält ein Polyphasen-Netzwerk, das sich aus einzelnen Teilfiltern zusammensetzt, und einem diskreten Fourier-Transformations- Prozessor zur Fourier-Transformation. Das der adaptiven Polyphasen-Filterbank zugeführte Eingangssignal wird in spektrale Teilsignale (in der Form komplexwertiger Tiefpaßsignale) aufgespaltet. Wegen der damit verbundenen Taktreduktion (dezimierende Technik), ist der Rechenaufwand in den einzelnen Teilfiltern im Vergleich zu einer digitalen Filterbank ohne Taktreduktion erheblich geringer. Die Reduktion der Abtastfrequenz für das Eingangssignal kann durch einen am Eingang der adaptiven Polyphasen-Filterbank angeordneten, rotierenden Schalter verdeutlicht werden. Die Koeffizienten der einzelnen Teilfilter des Polyphasen- Netzwerkes können durch Transformation der Koeffizienten eines rekursiven oder nicht-rekursiven Prototyp-Tiefpasses gewonnen werden. Die gefilterten Teilsignale, d. h. die Ausgangssignale der Teilfilter, werden mit Hilfe des Rechenverfahrens der diskreten Fourier-Transformation im diskreten Fourier-Transformations- Prozessors in komplexwertige Tiefpaßsignale übergeführt. Die spektralen Teilsignale an den Ausgängen des diskreten Fourier-Transformations- Prozessors sind interpretierbar als komplexwertige Tiefpaßsignale gemäß einer Quadratur-Bandpaßfilterung mit Umsetzung in die Tiefpaßlage und gleichzeitiger Taktreduktion.
Um eine Signalverbesserung von z. B. gestörten Sprachsignalen zu erreichen, werden die spektralen Teilsignale einer adaptiven, komplexwertigen Verarbeitung (Filterung) unterzogen. Die spektralen Teilsignale liegen getrennt nach Real- und Imaginärteil vor. Zur adaptiven Gewichtung der zu verarbeitenden, spektralen Teilsignale nach einer Gewichtungsregel (adaptive Pegelsteuerung) wird der aus Real- und Imaginärteil ableitbare Betrag mit einem Koeffizienten multipliziert, der nach einer Gewichtungsregel gebildet wird. Zur Koeffizientenberechnung können beispielsweise Kurzzeitleistungen von Störsignalen in Sprachpausen herangezogen werden. Die Kurzzeitleistung eines spektralen Teilsignals, welches sich aus Signalanteil und Störanteil additiv zusammensetzt, kann beispielsweise durch gleitende Mittelwertbildung (Rechteckfenster mit evtl. unterschiedlichen Fensterlängen) berechnet werden. Unter der Voraussetzung einer stationären Störung kann für jedes spektrale Teilsignal der Koeffizient so berechnet werden, daß die Kurzzeitleistungen aller verarbeiteten, spektralen Teilsignale nach erfolgter Pegelsteuerung mit der Kurzzeitleistung des ungestörten Signalanteils übereinstimmen. Die Zeitkonstanten bei der Mittelwertbildung werden von einem Sprachpausendetektor gesteuert.
Die verarbeiteten, spektralen Teilsignale (komplexwertige Zeitsignale) werden im Syntheseteil durch inverse Transformation und inverse, interpolierende Polyphasenfilterung in ein reellwertiges Schätzsignal (Ausgangssignal) umgeformt, wobei die Taktfrequenz wieder auf das ursprüngliche Maß (interpolierende Technik) erhöht wird. Die in der adaptiven Polyphasen-Filterbank vorgenommene Taktfrequenzerhöhung kann durch einen Schalter, welcher mit Teilfiltern des inversen Polyphasen-Netzwerks verbunden ist, verdeutlicht werden.
Wie Untersuchungen gezeigt haben, verbleiben bei einer solchen Signalverarbeitung durch adaptive Gewichtung spektraler Teilsignale Reststörungen. Die verbleibende Reststörung ist akustisch beschreibbar als plätscherndes Geräusch, musikalische Töne, Sprachverzerrungen oder rauhe Sprachkomponenten.
Ein weiteres Verfahren zur Signalverbesserung unter Verwendung des Kurzzeitspektrums und Subtraktion des Störspektrums vom gestörten Signalspektrum ist aus einer Abhandlung in den IEEE Transactions, Band ASSP-27, Seiten 113 bis 120 bekannt. Es wird als das Verfahren der spektralen Subtraktion bezeichnet. Dabei wird mit Hilfe der Spektraltransformation das Kurzzeitspektrum für Blöcke des gestörten Signals nach Betrag und Phase ermittelt. Von den der Spektraltransformation unterworfenen Blöcken des gestörten Signals wird die Phaseninformation abgespaltet und ein Kurzzeit-Leistungsspektrum (Kurzzeit-Betragsspektrum) gebildet. Das in den Sprachpausen geschätzte Störspektrum, ein Betrag (Leistungs)-Spektrum, wird von diesem Kurzzeit- Leistungsspektrum subtrahiert. Dabei auftretende negative Resultate werden im Sinne einer Gleichrichtung korrigiert. Nach der Subtraktion wird das Betragsspektrum mit der Phase des gestörten Spektrums verknüpft und eine inverse Spektraltransformation ausgeführt. Nach Anwendung dieser Maßnahmen verbleibt ein störendes Restgeräusch.
Nach Durchführung der spektralen Subtraktion werden die zeitlichen Betragsverläufe der Kurzzeitspektren (Abtastwerte) für feste Frequenzen unabhängig voneinander verarbeitet. Liegt in der Sprachpause der einzelne Abtastwert unterhalb von Abtastwerten dieses Kanals, so wird der momentane Abtastwert durch einen lokalen Minimalwert ersetzt. Zur Bestimmung dieses Minimums werden die beiden zeitlich benachbarten Abtastwerte herangezogen.
Ein solches Verfahren weist den Nachteil auf, daß der lokale Minimalwert von der Aussteuerung abhängig ist. Daraus folgt eine Gesamtabschwächung des Schätzsignals. Ein weiterer Nachteil ist, bedingt durch die Auswertung eines mittleren Leistungskriteriums in Abhängigkeit von zeitlich benachbarten Abtastwerten, das Fehlen einer Kopplung benachbarter Spektrallinien bzw. benachbarter Kanäle. Auch der Aufwand bei der Realisierung eines solchen Verfahrens, insbesondere der Speicheraufwand und die Zahl der Rechenoperationen pro Abtastwert, ist relativ hoch.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren anzugeben, welches mit einem geringen Aufwand an Mitteln eine nach Signalverarbeitung von spektralen Teilsignalen durch adaptive Gewichtung noch verbleibende Reststörung annähernd beseitigt.
Diese Aufgabe wird erfindungsgemäß durch das Verfahren nach Anspruch 1 gelöst.
Bei dem vorgeschlagenen Verfahren (P 31 18 473.1-35) wird eine multiplikative Verknüpfung der Koeffizienten mit den spektralen Teilsignalen vorgenommen. Die zugrundeliegende Gewichtungsregel, evtl. in Kombination mit einer zeitlichen Mittelung der Betragssignale, ist zur Beseitigung stationärer Geräusche geeignet. Bei schwach instationären Störungen verbleiben infolge der statistischen Schwankungen der berechneten Kurzzeitmittelwerte Reststöranteile, die allein durch multiplikative Gewichtung nicht ohne Sprachverzerrungen zu beseitigen sind. Es läßt sich anhand eines statistischen Modells theoretisch zeigen, daß die unter der Annahme der Stationarität zu erzielende Geräuschreduktion prinzipiell begrenzt ist, sofern das Eingangssignal instationäre Komponenten enthält. Die Erfindung zeigt einen neuen Weg auf, indem bei der Vorgabe der Gewichtungsregel, hinsichtlich der psychoakustischen Komponente, das Ohr als Empfänger berücksichtigt und die Verarbeitung der Empfängercharakteristik angepaßt wird. Unter Berücksichtigung des Modells der Spracherzeugung ist die Verarbeitung auch auf die Sendercharakteristik abzustimmen, wozu eine Analyse der Merkmale einer Störung vorzunehmen ist.
Die Analyse verschiedener Störungen (Windgeräusch, Motorgeräusch) zeigt, daß in der Regel instationäre Störanteile auftreten, die sich charakteristisch vom Sprachsignal unterscheiden. Aus gezielten akustischen Experimenten mit synthetisierten Signalen, bestehend aus Sprachanteil und additiv überlagerten Störanteil, sind Adaptions-Algorithmen ableitbar, welche nach psychoakustischen Gesichtspunkten ausgelegt und für die Anwendung bei einer adaptiven Polyphasen-Filterbank oder einer Filterbank geeignet sind. Die Analyse der in den Sprachpausen unverdeckt auftretenden instationären Störanteile zeigt im Vergleich zum Sprachsignal das isolierte Auftreten von Frequenzlagen und die kurze zeitliche Dauer von energiereichen Störimpulsen. Derartig isolierte Komponenten treten in Sprachsignalen nicht auf, da der Sprachtrakt entweder durch ein rauschartiges oder ein sehr obertonreiches Signal angeregt wird. Außerdem sind wegen der nur relativ langsamen Veränderung der Sprachtrakt-Parameter keine extrem kurzen, impulsartigen Signalanteile festzustellen.
Das erfindungsgemäße Verfahren bietet eine einfache Möglichkeit aus der Betrachtung der Koeffizienten, welche den zu verarbeitenden spektralen Teilsignalen zugeordnet (kanalweise Zuordnung) sind, Regeln abzuleiten um die verbleibende Reststörung zu eliminieren. Zur Geräuschreduktion gestörter Sprachsignale kann vorzugsweise eine adaptive Polyphasen-Filterbank verwendet werden. Das erfindungsgemäße Verfahren ist nicht an diesem Anwendungsfall gebunden. Zur Signalanalyse kann auch eine Filterbank aus einzelnen, diskreten Bandpässen verwendet werden. Dann werden die Koeffizienten nicht aus den Beträgen der spektralen Teilsignale, sondern aus den Einhüllenden der reellen Bandpaßsignale abgeleitet. Die beschriebenen Vorteile ergeben sich für den Anwendungsfall adaptive Polyphasen- Filterbank. Ein erster Verfahrensschritt ist, unter Berücksichtigung der Wahrscheinlichkeitsrechnung, die Vorgabe eines Koeffizienten-Schwellenwerts. Dieser ergibt sich aus einem Kompromiß zwischen Störgeräuschreduktion und Sprachverzerrung. Diese nichtlineare Nachverarbeitung der Koeffizienten vermindert bereits die Reststörung. Ein weiterer Verfahrensschritt beruht auf dem Vergleich kanalweise und gleichzeitig berechneter Koeffizienten miteinander. Durch diese Maßnahme können isoliert auftretende Frequenzlagen eliminiert werden. Dabei ist bei der Festlegung der Mindestanzahl der zum Vergleich herangezogenen Koeffizienten die Eigenschaft von Sprachsignalen mit hoher Sprachgrundfrequenz (z. B. Frauen- und Kinderstimmen) zu berücksichtigen, wonach im Sprachsignal isolierte Frequenzlagen auftreten können, wenn die Grundfrequenz größer ist als der Kanalabstand der spektralen Teilsignale. Ein weiterer Verfahrensschritt besteht darin, in mindestens einen Kanal einen Vergleich zwischen zeitlich aufeinanderfolgenden Koeffizienten dieses Kanals durchzuführen. Dadurch können kurze Störanteile eliminiert werden.
Die einzelnen Verfahrensschritt werden auf die Betragssignale oder auf die Real- und Imaginärteilsignale angewandt, welche in gewissen Grenzen gemittelt werden, d. h. die gestörten Phasensignale können, wegen der relativ großen Unempfindlichkeit des Gehörs gegenüber Phasenstörungen, unverändert beibehalten werden.
Zweckmäßige Ausgestaltungen ergeben sich aus den Unteransprüchen.
Das erfindungsgemäße Verfahren wird nachfolgend anhand des in der Zeichnung dargestellten Ausführungsbeispiels näher beschrieben und erläutert.
Das Ausführungsbeispiel der Erfindung zeigt nur die für das Verständnis der Erfindung erforderlichen Einzelheiten. Die vorgeschlagene adaptive Polyphasen- Filterbank (P 31 18 473.1-35) besteht aus einem Signal-Analyseteil, einem Signal-Verarbeitungsteil zur adaptiven Signalverbesserung und einem Signal- Syntheseteil. Die Wirkung der Polyphasen-Netzwerke ist beschreibbar durch ein Ersatzmodell bestehend aus Demodulator, Tiefpaß und Unterabtaster. In Verbindung mit einem diskreten Fourier-Transformations-Prozessor zur Fast-Fourier-Transformation wird eine Kurzzeitspektralanalyse mit Taktreduktion eines zugeführten Eingangssignal erzielt. Die zeitliche und spektrale Auflösung wird durch einen Prototyp-Tiefpaß mit dessen Impulsantwort bestimmt. Wie der vorgeschlagenen digitalen Filteranordnung (P 31 18 473-38) zu entnehmen ist, ist die Signal-Synthese durch Anwendung inverser Operationen möglich.
Im Signal-Analyseteil der adaptiven Polyphasen-Filterbank, bestehend aus Polyphasen-Netzwerk und dem diskreten Fourier-Transformations-Prozessor zur Fast- Fourier-Transformation, wird eine Aufspaltung des Eingangssignals in spektrale Teilsignale durchgeführt. In der Zeichnung ist ein spektrales Teilsignal mit Vν bezeichnet. Durch die Induzierung mit dem Index ν soll ein spektrales Teilsignal mit ν-ten Kanal bezeichnet werden. Zur Vereinfachung der Betrachtung ist in der Zeichnung das spektrale Teilsignal für den ν-ten Kanal dargestellt, wobei in den anderen Kanälen die gleiche Darstellung zutreffend ist. In der Zeichnung sind zum Erleichtern des Verständnisses der Signal-Analyse- und Signal-Syntheseteil der adaptiven Polyphasen-Filterbank weggelassen. Wie aus der Zeichnung ersichtlich ist, besteht die Verarbeitung nicht nur in einer multiplikativen Gewichtung der spektralen Teilsignale Vν (P 31 18 473-38), sondern in zusätzlichen nichtlinearen Operationen. Die verarbeiteten spektralen Teilsignale ν werden durch, in der Zeichnung nicht dargestellte, inverse, diskrete Fourier-Transformation und inverse, interpolierende Polyphasenfilterung umgeformt, wobei die Taktfrequenz wieder auf das ursprüngliche Maß erhöht wird.
Das Eingangssignal besteht aus einem Sprachsignal sν und einem additiv überlagerten Störsignal nν. Durch multiplikative Verknüpfung der zu verarbeitenden spektralen Teilsignale, z. B. Vν mit ersten Koeffizienten cν und unter Anwendung des erfindungsgemäßen Verfahrens kann neben der Reduktion von stationären Störungen auch eine Reduktion von instationären Störungen erreicht werden.
Das zu verarbeitende, spektrale Teilsignal Vν wird einer Einrichtung 1 zur Umwandlung der, getrennt in Real- und Imaginärteil vorliegenden, spektralen Teilsignale in Polarkoordinaten zugeführt. Das erfindungsgemäße Verfahren ist unabhängig davon, in welchem Koordinatensystem die spektralen Teilsignale darstellbar sind. Werden die Real- und Imaginärteile der spektralen Teilsignale Vν nicht mittels der Einrichtung 1 in Polarkoordinaten umgewandelt, so erübrigt sich dann auch die Rückwandlung der verarbeiteten, spektralen Teilsignale ν in kartesische Koordinaten mittels einer Einrichtung 17. Die spektralen Teilsignale (komplexwertige Zeitsignale) Vν werden zur Ableitung der ersten Koeffizienten cn verwendet, während die gestörten Phasensignale Φν beibehalten werden. Da zur Ableitung der ersten Koeffizienten cν eine bestimmte Zeit erforderlich ist, wird Betrag |Vn| und Phase Φν in Einrichtungen 14 und 16 verzögert. Diese zeitliche Verzögerung steht in einem Zusammenhang mit der Zeit für die Berechnung des ersten Koeffizienten cν in einer Einrichtung 6 gemäß einer Gewichtungsregel. Eine weitere Verzögerung ergibt sich aus der Bestimmung eines Koeffizienten c3ν mittels einer Einrichtung 11.
In einer Einrichtung 2 werden Kurzzeitmittelwert E₂ des gestörten Signals, zum Beispiel der spektralen Teilsignale Vν, berechnet. Die in der Einrichtung 2 berechneten Kurzzeitmittelwerte E₂ weichen aufgrund der kurzzeitigen Instationarität der spektralen Teilsignal Vν (Instationarität des Störsignals nν) statistisch von einem in einer Einrichtung 5 berechneten Langzeitmittelwert E₁ ab. In der Einrichtung 5 kann der Langzeitmittelwert E₁ von nν berechnet werden, wozu eine Sprachpausenerkennung (Einrichtung 4) erforderlich ist. Unter Verwendung der Kurzzeitbetragssumme ist im Zeitbereich eine sichere Erkennung von Sprachpausen möglich. Wie der Zeichnung zu entnehmen ist, wird bei erkannter Sprachpause ein Schalter 3 geschlossen und in der Einrichtung 5 der Langzeitmittelwert E₁ der Störung nν berechnet. In der Einrichtung 6 wird aus dem zugeführten Langzeitmittelwert E₁ der Störung nν und den ermittelten Kurzzeitmittelwerten E₂ des gestörten Signals (sν+nν), gemäß einer Gewichtungsregel, der erste Koeffizient cν ermittelt. Die verwendete Gewichtungsregel ist eine Funktion von Langzeitmittelwert E₁ der Störung nν und Kurzzeitmittelwert E₂ des gestörten Signals (sν+nν) (eines lokalen Kurzzeit-Signal-Störabstands ρ) und einer reellwertigen Konstante K. Beispiel für eine solcher Gewichtungsregel ist
Die angegebene Gewichtungsregel G wurde aus einer großen Vielfalt von Kombinationsmöglichkeiten unter Zuhilfenahme umfangreicher objektiver und subjektiver Hörtests entwickelt. Das Problem der Vorgabe der Gewichtungsregel liegt in den teilweise sich widersprechenden Forderungen nach hoher Geräuschreduktion und guter Sprachverständlichkeit. Da die Pegelbewertung des Betrags |Vν| gemäß der Gewichtungsregel die exakte Kenntnis der Kurzzeit-Signal-Störabstände ρ
voraussetzt, diese aber nur geschätzt werden können, verbleiben in den Sprachpausen Reststörungen.
Durch Anwendung des erfindungsgemäßen Verfahrens kann die, im Falle der Verwendung der Gewichtungsregel G, verbleibende Reststörung, welche sich akustisch als plätschernde Geräusche, musikalische Töne, Verzerrungen oder rauhe Sprachkomponente zeigt, reduziert werden.
Dazu werden als erster Verfahrensschritt für den Fall, das erste, zeitabhängige Koeffizienten cν kleiner einem vorgebbaren Koeffizienten-Schwellenwert cmin auftreten, einem Koeffizienten c1ν (Ausgangssignal einer Einrichtung 7) der Wert 0 zugeordnet. Der Koeffizienten-Schwellenwert cmin wurde empirisch zu 0,1 ermittelt. Dieser Vergleich ist beschreibbar durch die Gleichung (1):
und wird mittels der Einrichtung 7 durchgeführt.
Zur weiteren Signalverbesserung wird das Ausgangssignal c1ν der Einrichtung 7 hinsichtlich der einzelnen Kanäle ausgewertet. Dazu wird ein Koeffizientenvergleich jeweils für im Frequenzbereich benachbarte Koeffizienten, z. B. c1ν +1, c1ν -1 durchgeführt. Aufgrund dieses Koeffizientenvergleichs mittels einer Einrichtung 9 wird eine nichlineare Glättung über dem Kanalindex ν vorgenommen. Beispielsweise wird für den Fall, daß Koeffizienten c1ν +1, c1n -1 gleich 0 im höher und tiefer gelegenden Frequenzbereich auftreten, einem Koeffizienten c2ν der Wert 0 zugeordnet (Einrichtung 8). Dies ist zur Beseitigung des additiv überlagerten Störsignals nν (sprachuntypische Merkmale) geeignet, ohne da Sprachsignal sν zu verzerren. Durch Verarbeitung von Koeffizienten ist diese unabhängig von der Aussteuerung in einer adaptiven Filterbank. Die Koeffizienten cν, c1ν, c2ν, c3ν und c4ν liegen innerhalb eines Zahlenintervalls von 0 bis 1. Die Verarbeitung in der Einrichtung 9 kann z. B gemäß der folgenden Gleichung (2) vorgenommen werden
wobei z. B. a₀=1; a±1=a±2=-0,25; Aν=0,25;
Dabei bezeichnet Aν einen Schwellenwert, während die ai Gewichtungsfaktoren darstellen. Wie aus der Gleichung (2) ersichtlich ist, wird der Vergleich mit jeweils zwei im Frequenzbereich höher und tiefer gelegenen Koeffizienten c1ν +1, c1ν +2 und c1n -1, c1ν -2 vorgenommen. Eine Verallgemeinerung im Sinne eine Veränderung der Summengrenzwerte oder der Koeffizienten ist möglich. Dadurch können sprachspezifische Merkmale berücksichtigt werden.
Mittels der Einrichtung 11 wird jede zeitliche Koeffizientenfolge c2ν auf 0-Folgen untersucht. Bei Feststellung einer solchen wird erst nach Überschreitung einer Mindestzahl von zeitlich aufeinanderfolgenden und von 0 verschiedenen Koeffizienten c2ν, ein Koeffizient c3ν am Ausgang einer Einrichtung 10 gleich dem zugeführten Signal c2ν gesetzt. Diese Zeitfilterung des Koeffizienten c3ν ist beschreibbar durch die folgende Gleichung (3):
mit ρ:Zeitindex und
λ:Zeitpunkt
Ein weiterer Verfahrensschritt zur Signalverbesserung besteht in einer globalen Pausenabschaltung oder Pausenabschwächung. Dazu werden mittels Einrichtungen 12, 13 bei Feststellung von langen, gleichzeitig auftretenden 0-Folgen bei einer Mindestanzahl von Koeffizienten, z. B. c3ν -1, c3ν, c3ν +1 auch jene von 0 verschiedene Koeffizienten in anderen Kanälen, z. B. c3ν +6 für diesen Zeitraum nachträglich mit 12 oder Wert 0 zugeordnet. Dieser Verfahrensschritt ist beschreibbar durch folgende Gleichung (4):
dabei bezeichnet Dν einen Schwellenwert. Die erläuterten Verfahrensschritte können einzeln oder in Kombination angewandt werden. Bei Kombination aller vier Verfahrensschritte gemäß Gleichungen (1) bis (4) ist insbesondere zwischen den Worten (Sprachpause) und einzelnen Silben eine erhebliche Reduktion der Reststörung erreichbar. Durch Auswertung der ersten Koeffizienten cν und unter Berücksichtigung des Modells der Spracherzeugung kann ein einfach zu realisierendes und wirksames Verfahren zur Signalverbesserung angegeben werden.

Claims (8)

1. Verfahren zur Signalverbesserung von gestörten Sprachsignalen, bei dem gestörte Sprachsignale mittels einer Filterbank in spektrale Teilsignale aufgespalten werden und bei dem die spektralen Teilsignale kanalweise verarbeitet werden, indem diese mit Koeffizienten aktiv gewichtet werden, und bei dem die kanalweise verarbeiteten, spektralen Teilsignale zum Ausgangssignal zusammengefügt werden, dadurch gekennzeichnet,
daß erste, zeitabhängige Koeffizienten (cν) kanalweise nach einer Gewichtungsregel gebildet werden und Vergleiche zwischen den ersten Koeffizienten (cν) und mindestens einem vorgebbaren Koeffizienten-Schwellenwert (cmin) und/oder Vergleiche kanalweise und gleichzeitig berechneter Koeffizienten (c2ν) miteinander und/oder Vergleiche zwischen zeitlich aufeinanderfolgenden Koeffizienten (c3ν) und (c4ν) mindestens eines Kanals durchgeführt werden,
daß den ersten Koeffizienten (cν) der Wert 0 zugeordnet wird, wenn sie kleiner als der vorgebbare Koeffizienten- Schwellwert (cmin) sind,
daß der Vergleich gleichzeitig berechneter Koeffizienten (c1ν) jeweils für Koeffizienten (c1ν) benachbarter Kanäle durchgeführt wird und
daß bei Feststellung, daß sich ein Koeffizient (c1ν) von denen benachbarter höherer und tieferer Kanäle um ein Mindestmaß unterscheidet, eine nichtlineare Glättung vorgenommen wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Koeffizienten-Schwellenwert (cmin) bei 0,1 liegt.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß bei der nichtlinearen Glättung dem Koeffizienten (c1n) ein Wert zugeordnet wird, welcher sich aus dem Mittelwert von Koeffizienten (z. B. c1ν +1, c1ν -1) benachbarter Kanäle oder deren Linearkombination ergibt.
4. Verfahren nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet, daß das Mindestmaß auf einem Vergleich der Koeffizienten (z. B. c1ν +1, c1ν -1) mit einer Schwelle (z. B. Wert 0,2) oder auf einem Vergleich des Koeffizienten (c1ν) mit der Linearkombination beruht.
5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die zeitliche Koeffizientenfolge mindestens eines Kanals auf 0-Folgen untersucht wird und daß bei Feststellung einer solchen erst für eine Mindestanzahl zeitlich aufeinanderfolgender und von 0 verschiedener Koeffizienten (c2ν) der Koeffizienten (c3n) selbst zur adaptiven Gewichtung verwendet wird.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß bei Feststellung von langen, gleichzeitig auftretenden 0-Folgen der Koeffizienten (c3ν) in einer Mindestzahl von Kanälen auch jenen von 0 verschiedenen Koeffizienten (c3ν) anderer Kanäle für diesen Zeitraum der Wert 0 zugeordnet wird.
7. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Koeffizienten (cν, c1ν, c3ν und c4ν) innerhalb eines Zahlenintervalls von 0 bis 1 liegen.
8. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der erste Koeffizient (dν) eine Funktion von Langzeitmittelwert (E₁) der Störung und Kurzzeitmittelwert (E₂) des gestörten Signals und einer reellwertigen Konstante (K) ist.
DE19823230391 1982-08-14 1982-08-14 Verfahren zur signalverbesserung von gestoerten sprachsignalen Granted DE3230391A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19823230391 DE3230391A1 (de) 1982-08-14 1982-08-14 Verfahren zur signalverbesserung von gestoerten sprachsignalen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19823230391 DE3230391A1 (de) 1982-08-14 1982-08-14 Verfahren zur signalverbesserung von gestoerten sprachsignalen

Publications (2)

Publication Number Publication Date
DE3230391A1 DE3230391A1 (de) 1984-02-16
DE3230391C2 true DE3230391C2 (de) 1991-01-10

Family

ID=6170963

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19823230391 Granted DE3230391A1 (de) 1982-08-14 1982-08-14 Verfahren zur signalverbesserung von gestoerten sprachsignalen

Country Status (1)

Country Link
DE (1) DE3230391A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19524847C1 (de) * 1995-07-07 1997-02-13 Siemens Ag Vorrichtung zur Verbesserung gestörter Sprachsignale
DE19854341A1 (de) * 1998-11-25 2000-06-08 Alcatel Sa Verfahren und Schaltungsanordnung zur Sprachpegelmessung in einem Sprachsignalverarbeitungssystem

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3802903A1 (de) * 1988-02-01 1989-08-10 Siemens Ag Einrichtung zur uebertragung von sprache
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
DE19818609C2 (de) * 1998-04-20 2000-06-15 Deutsche Telekom Ag Verfahren und Vorrichtung zur Geräuschfilterung
EP1428354A2 (de) * 2001-09-20 2004-06-16 Honeywell International, Inc. Digital-audiosystem
CN112017683B (zh) * 2020-10-20 2021-01-05 南京南大电子智慧型服务机器人研究院有限公司 一种频域无次级路径有源噪声控制系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3421141A (en) * 1967-10-16 1969-01-07 Huntec Ltd Self-adjusting filter
CH522327A (de) * 1970-09-28 1972-06-15 Bbc Brown Boveri & Cie Elektrische Filterschaltung
DE3118473A1 (de) * 1981-05-09 1982-11-25 TE KA DE Felten & Guilleaume Fernmeldeanlagen GmbH, 8500 Nürnberg Verfahren zur aufbereitung elektrischer signale mit einer digitalen filteranordnung

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19524847C1 (de) * 1995-07-07 1997-02-13 Siemens Ag Vorrichtung zur Verbesserung gestörter Sprachsignale
DE19854341A1 (de) * 1998-11-25 2000-06-08 Alcatel Sa Verfahren und Schaltungsanordnung zur Sprachpegelmessung in einem Sprachsignalverarbeitungssystem
US6539350B1 (en) 1998-11-25 2003-03-25 Alcatel Method and circuit arrangement for speech level measurement in a speech signal processing system

Also Published As

Publication number Publication date
DE3230391A1 (de) 1984-02-16

Similar Documents

Publication Publication Date Title
DE112009000805B4 (de) Rauschreduktion
DE19747885B4 (de) Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
EP0912974B1 (de) Verfahren zur verringerung von störungen eines sprachsignals
DE69632626T2 (de) Adaptiver sprachsignalfilter
DE69531710T2 (de) Verfahren und Vorrichtung zur Verminderung von Rauschen bei Sprachsignalen
DE69105760T2 (de) Einrichtung zur Signalverarbeitung.
EP0065210B1 (de) Verfahren zur Aufbereitung elektrischer Signale mit einer digitalen Filteranordnung
EP0948237B1 (de) Verfahren zur Störbefreiung eines Mikrophonsignals
DE112011104737B4 (de) Geräuschunterdrückungsvorrichtung
DE69124005T2 (de) Sprachsignalverarbeitungsvorrichtung
EP1386307B1 (de) Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals
DE2207141C3 (de) Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters
DE2749132A1 (de) Rauschfilter-anordnung
DE4243831A1 (de) Verfahren zur Laufzeitschätzung an gestörten Sprachkanälen
EP3089481B1 (de) Verfahren zur frequenzabhängigen rauschunterdrückung eines eingangssignals
DE112007003674T5 (de) Methode und Apparat zur Einkanal-Sprachverbesserung basierend auf einem latenzzeitreduzierten Gehörmodell
DE102014221528B4 (de) Akkurate Vorwärts-SNR-Schätzung basierend auf MMSE-Sprachpräsenzwahrscheinlichkeit
DE3230391C2 (de)
DE102013011761A1 (de) Kraftfahrzeug mit einer Freisprecheinrichtung und Verfahren zur Erzeugung eines Frequenzganges für Freisprecheinrichtungen
DE10157535B4 (de) Verfahren und Vorrichtung zur Reduzierung zufälliger, kontinuierlicher, instationärer Störungen in Audiosignalen
EP1239455A2 (de) Verfahren und Anordnung zur Durchführung einer an die Übertragungsfunktion menschilcher Sinnesorgane angepassten Fourier Transformation sowie darauf basierende Vorrichtungen zur Geräuschreduktion und Spracherkennung
DE102015204010B4 (de) Verfahren zur Unterdrückung eines Störgeräusches in einem akustischen System
DE602005000897T2 (de) Eingangsschallprozessor
EP1755110A2 (de) Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
DE19729521B4 (de) Verfahren und Vorrichtung zur Störgeräusch- und Echounterdrückung

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8125 Change of the main classification

Ipc: H03H 17/02

D2 Grant after examination
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: PHILIPS PATENTVERWALTUNG GMBH, 20097 HAMBURG, DE

8339 Ceased/non-payment of the annual fee