DE3230391C2 - - Google Patents
Info
- Publication number
- DE3230391C2 DE3230391C2 DE19823230391 DE3230391A DE3230391C2 DE 3230391 C2 DE3230391 C2 DE 3230391C2 DE 19823230391 DE19823230391 DE 19823230391 DE 3230391 A DE3230391 A DE 3230391A DE 3230391 C2 DE3230391 C2 DE 3230391C2
- Authority
- DE
- Germany
- Prior art keywords
- coefficients
- channel
- coefficient
- signal
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000003595 spectral effect Effects 0.000 claims description 43
- 238000000034 method Methods 0.000 claims description 33
- 230000036961 partial effect Effects 0.000 claims description 33
- 230000003044 adaptive effect Effects 0.000 claims description 20
- 230000006872 improvement Effects 0.000 claims description 7
- 230000007774 longterm Effects 0.000 claims description 6
- 230000002123 temporal effect Effects 0.000 claims description 5
- 238000009499 grossing Methods 0.000 claims description 3
- 230000036962 time dependent Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 11
- 230000009467 reduction Effects 0.000 description 11
- 238000001228 spectrum Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 9
- 230000009466 transformation Effects 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000010183 spectrum analysis Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012074 hearing test Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
Description
Die Erfindung geht aus von einem Verfahren zur Signalverbesserung
von gestörten Sprachsignalen
gemäß dem Oberbegriff des Anspruches 1.
Derartige Verfahren gehen z. B. aus der US-Patentschrift 34 21 141
oder aus der deutschen Auslegeschrift 20 51 443 hervor.
Die Kurzzeitspektralanalyse ist ein wichtiges Hilfsmittel
zur Bestimmung spektraler Eigenschaften.
Ein Wanderfenster gleitet über die zu analysierende
Signalfolge, wobei laufend die Spektralkoeffizienten
der ausgeblendeten und gewichteten Signalwerte an
den interessierenden Frequenzpunkten bestimmt
werden. Die zeitliche Veränderung des Kurzzeitspektrums
kommt in der Abhängigkeit der Spektralkoeffizienten
von der jeweiligen Position des Wanderfensters
zum Ausdruck. Der Aufwand zur Durchführung
der Kurzzeitspektralanalyse kann durch Verwendung
einer Filterbank nach dem Polyphasenprinzip gegenüber
einer Filterbank nach dem Prinzip des Wanderfensters
erheblich reduziert werden. Insbesondere
ist dabei keine zeitliche Begrenzung des Wanderfensters
entsprechend einer nichtrekursiven Filterung
erforderlich, d. h. es können rekursive Filter
verwendet werden.
Es ist ein Verfahren zur Aufbereitung elektrischer
Signale mittels einer adaptiven
Filterbank unter Verwendung von Polyphasen-Netzwerken
vorgeschlagen worden (P 31 18 473.1-35).
Durch die Verwendung der Polyphasen-Netzwerke
sind weniger Rechenschritte erforderlich als bei
der Verwendung von äquivalenten, adaptiven, hochgradigen
Transversalfiltern. Die vorgeschlagene
adaptive Polyphasen-Filterbank (P 31 18 473.1-35)
besteht aus einem Signal-Analyseteil, einem Signal-
Verarbeitungsteil und einem Signal-Syntheseteil.
Der Signal-Analyseteil enthält ein Polyphasen-Netzwerk,
das sich aus einzelnen Teilfiltern zusammensetzt,
und einem diskreten Fourier-Transformations-
Prozessor zur Fourier-Transformation. Das der
adaptiven Polyphasen-Filterbank zugeführte Eingangssignal
wird in spektrale Teilsignale (in der Form
komplexwertiger Tiefpaßsignale) aufgespaltet.
Wegen der damit verbundenen Taktreduktion (dezimierende
Technik), ist der Rechenaufwand in den
einzelnen Teilfiltern im Vergleich zu einer digitalen
Filterbank ohne Taktreduktion erheblich geringer.
Die Reduktion der Abtastfrequenz für das
Eingangssignal kann durch einen am Eingang der
adaptiven Polyphasen-Filterbank angeordneten, rotierenden
Schalter verdeutlicht werden. Die Koeffizienten
der einzelnen Teilfilter des Polyphasen-
Netzwerkes können durch Transformation der Koeffizienten
eines rekursiven oder nicht-rekursiven
Prototyp-Tiefpasses gewonnen werden. Die gefilterten
Teilsignale, d. h. die Ausgangssignale der Teilfilter,
werden mit Hilfe des Rechenverfahrens der diskreten
Fourier-Transformation im diskreten Fourier-Transformations-
Prozessors in komplexwertige Tiefpaßsignale
übergeführt. Die spektralen Teilsignale an
den Ausgängen des diskreten Fourier-Transformations-
Prozessors sind interpretierbar als komplexwertige
Tiefpaßsignale gemäß einer Quadratur-Bandpaßfilterung
mit Umsetzung in die Tiefpaßlage und gleichzeitiger
Taktreduktion.
Um eine Signalverbesserung von z. B. gestörten
Sprachsignalen zu erreichen, werden die spektralen
Teilsignale einer adaptiven, komplexwertigen Verarbeitung
(Filterung) unterzogen. Die spektralen
Teilsignale liegen getrennt nach Real- und Imaginärteil
vor. Zur adaptiven Gewichtung der zu verarbeitenden,
spektralen Teilsignale nach einer Gewichtungsregel
(adaptive Pegelsteuerung) wird der
aus Real- und Imaginärteil ableitbare Betrag mit
einem Koeffizienten multipliziert, der nach einer
Gewichtungsregel gebildet wird. Zur Koeffizientenberechnung
können beispielsweise Kurzzeitleistungen
von Störsignalen in Sprachpausen herangezogen werden.
Die Kurzzeitleistung eines spektralen Teilsignals,
welches sich aus Signalanteil und Störanteil additiv
zusammensetzt, kann beispielsweise durch gleitende
Mittelwertbildung (Rechteckfenster mit evtl. unterschiedlichen
Fensterlängen) berechnet werden.
Unter der Voraussetzung einer stationären Störung
kann für jedes spektrale Teilsignal der Koeffizient
so berechnet werden, daß die Kurzzeitleistungen
aller verarbeiteten, spektralen Teilsignale nach
erfolgter Pegelsteuerung mit der Kurzzeitleistung
des ungestörten Signalanteils übereinstimmen. Die
Zeitkonstanten bei der Mittelwertbildung werden von
einem Sprachpausendetektor gesteuert.
Die verarbeiteten, spektralen Teilsignale (komplexwertige
Zeitsignale) werden im Syntheseteil durch
inverse Transformation und inverse, interpolierende
Polyphasenfilterung in ein reellwertiges Schätzsignal
(Ausgangssignal) umgeformt, wobei die Taktfrequenz
wieder auf das ursprüngliche Maß (interpolierende
Technik) erhöht wird. Die in der adaptiven
Polyphasen-Filterbank vorgenommene Taktfrequenzerhöhung
kann durch einen Schalter, welcher mit Teilfiltern
des inversen Polyphasen-Netzwerks verbunden
ist, verdeutlicht werden.
Wie Untersuchungen gezeigt haben, verbleiben bei
einer solchen Signalverarbeitung durch adaptive
Gewichtung spektraler Teilsignale Reststörungen.
Die verbleibende Reststörung ist akustisch beschreibbar
als plätscherndes Geräusch, musikalische Töne,
Sprachverzerrungen oder rauhe Sprachkomponenten.
Ein weiteres Verfahren zur Signalverbesserung unter
Verwendung des Kurzzeitspektrums und Subtraktion
des Störspektrums vom gestörten Signalspektrum ist
aus einer Abhandlung in den IEEE Transactions,
Band ASSP-27, Seiten 113 bis 120 bekannt. Es wird
als das Verfahren der spektralen Subtraktion bezeichnet.
Dabei wird mit Hilfe der Spektraltransformation
das Kurzzeitspektrum für Blöcke des gestörten
Signals nach Betrag und Phase ermittelt.
Von den der Spektraltransformation unterworfenen
Blöcken des gestörten Signals wird die Phaseninformation
abgespaltet und ein Kurzzeit-Leistungsspektrum
(Kurzzeit-Betragsspektrum) gebildet. Das in den
Sprachpausen geschätzte Störspektrum, ein Betrag
(Leistungs)-Spektrum, wird von diesem Kurzzeit-
Leistungsspektrum subtrahiert. Dabei auftretende
negative Resultate werden im Sinne einer Gleichrichtung
korrigiert. Nach der Subtraktion wird das Betragsspektrum
mit der Phase des gestörten Spektrums
verknüpft und eine inverse Spektraltransformation
ausgeführt. Nach Anwendung dieser Maßnahmen verbleibt
ein störendes Restgeräusch.
Nach Durchführung der spektralen Subtraktion werden
die zeitlichen Betragsverläufe der Kurzzeitspektren
(Abtastwerte) für feste Frequenzen unabhängig voneinander
verarbeitet. Liegt in der Sprachpause der
einzelne Abtastwert unterhalb von Abtastwerten dieses
Kanals, so wird der momentane Abtastwert durch einen
lokalen Minimalwert ersetzt. Zur Bestimmung dieses
Minimums werden die beiden zeitlich benachbarten
Abtastwerte herangezogen.
Ein solches Verfahren weist den Nachteil auf, daß
der lokale Minimalwert von der Aussteuerung abhängig
ist. Daraus folgt eine Gesamtabschwächung
des Schätzsignals. Ein weiterer Nachteil ist, bedingt
durch die Auswertung eines mittleren Leistungskriteriums
in Abhängigkeit von zeitlich benachbarten
Abtastwerten, das Fehlen einer Kopplung benachbarter
Spektrallinien bzw. benachbarter Kanäle. Auch der
Aufwand bei der Realisierung eines solchen Verfahrens,
insbesondere der Speicheraufwand und die Zahl der
Rechenoperationen pro Abtastwert, ist relativ hoch.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren
anzugeben, welches mit einem geringen Aufwand
an Mitteln eine nach Signalverarbeitung von
spektralen Teilsignalen durch adaptive Gewichtung
noch verbleibende Reststörung annähernd beseitigt.
Diese Aufgabe wird erfindungsgemäß durch das Verfahren nach Anspruch 1 gelöst.
Bei dem vorgeschlagenen Verfahren (P 31 18 473.1-35)
wird eine multiplikative Verknüpfung der Koeffizienten
mit den spektralen Teilsignalen vorgenommen.
Die zugrundeliegende Gewichtungsregel,
evtl. in Kombination mit einer zeitlichen Mittelung
der Betragssignale, ist zur Beseitigung stationärer
Geräusche geeignet. Bei schwach instationären
Störungen verbleiben infolge der statistischen
Schwankungen der berechneten Kurzzeitmittelwerte
Reststöranteile, die allein durch multiplikative
Gewichtung nicht ohne Sprachverzerrungen zu beseitigen
sind. Es läßt sich anhand eines statistischen Modells
theoretisch zeigen, daß die unter der Annahme der
Stationarität zu erzielende Geräuschreduktion prinzipiell
begrenzt ist, sofern das Eingangssignal instationäre
Komponenten enthält. Die Erfindung zeigt
einen neuen Weg auf, indem bei der Vorgabe der Gewichtungsregel,
hinsichtlich der psychoakustischen
Komponente, das Ohr als Empfänger berücksichtigt und
die Verarbeitung der Empfängercharakteristik angepaßt
wird. Unter Berücksichtigung des Modells der
Spracherzeugung ist die Verarbeitung auch auf die
Sendercharakteristik abzustimmen, wozu eine Analyse
der Merkmale einer Störung vorzunehmen ist.
Die Analyse verschiedener Störungen (Windgeräusch,
Motorgeräusch) zeigt, daß in der Regel instationäre
Störanteile auftreten, die sich charakteristisch vom
Sprachsignal unterscheiden. Aus gezielten akustischen
Experimenten mit synthetisierten Signalen, bestehend
aus Sprachanteil und additiv überlagerten Störanteil,
sind Adaptions-Algorithmen ableitbar, welche nach
psychoakustischen Gesichtspunkten ausgelegt und für
die Anwendung bei einer adaptiven Polyphasen-Filterbank
oder einer Filterbank geeignet sind. Die Analyse
der in den Sprachpausen unverdeckt auftretenden instationären
Störanteile zeigt im Vergleich zum
Sprachsignal das isolierte Auftreten von Frequenzlagen
und die kurze zeitliche Dauer von energiereichen
Störimpulsen. Derartig isolierte Komponenten
treten in Sprachsignalen nicht auf, da der Sprachtrakt
entweder durch ein rauschartiges oder ein sehr
obertonreiches Signal angeregt wird. Außerdem sind
wegen der nur relativ langsamen Veränderung der
Sprachtrakt-Parameter keine extrem kurzen, impulsartigen
Signalanteile festzustellen.
Das erfindungsgemäße Verfahren bietet eine einfache
Möglichkeit aus der Betrachtung der Koeffizienten,
welche den zu verarbeitenden spektralen Teilsignalen
zugeordnet (kanalweise Zuordnung) sind, Regeln abzuleiten
um die verbleibende Reststörung zu eliminieren.
Zur Geräuschreduktion gestörter Sprachsignale kann
vorzugsweise eine adaptive Polyphasen-Filterbank verwendet
werden. Das erfindungsgemäße Verfahren ist
nicht an diesem Anwendungsfall gebunden. Zur Signalanalyse
kann auch eine Filterbank aus einzelnen, diskreten
Bandpässen verwendet werden. Dann werden die
Koeffizienten nicht aus den Beträgen der spektralen
Teilsignale, sondern aus den Einhüllenden der reellen
Bandpaßsignale abgeleitet. Die beschriebenen Vorteile
ergeben sich für den Anwendungsfall adaptive Polyphasen-
Filterbank. Ein erster Verfahrensschritt ist,
unter Berücksichtigung der Wahrscheinlichkeitsrechnung,
die Vorgabe eines Koeffizienten-Schwellenwerts.
Dieser ergibt sich aus einem Kompromiß zwischen
Störgeräuschreduktion und Sprachverzerrung. Diese
nichtlineare Nachverarbeitung der Koeffizienten vermindert
bereits die Reststörung. Ein weiterer Verfahrensschritt
beruht auf dem Vergleich kanalweise
und gleichzeitig berechneter Koeffizienten miteinander.
Durch diese Maßnahme können isoliert auftretende
Frequenzlagen eliminiert werden. Dabei ist bei der
Festlegung der Mindestanzahl der zum Vergleich herangezogenen
Koeffizienten die Eigenschaft von Sprachsignalen
mit hoher Sprachgrundfrequenz (z. B. Frauen-
und Kinderstimmen) zu berücksichtigen, wonach im
Sprachsignal isolierte Frequenzlagen auftreten können,
wenn die Grundfrequenz größer ist als der Kanalabstand
der spektralen Teilsignale. Ein weiterer Verfahrensschritt
besteht darin, in mindestens einen
Kanal einen Vergleich zwischen zeitlich aufeinanderfolgenden
Koeffizienten dieses Kanals durchzuführen.
Dadurch können kurze Störanteile eliminiert werden.
Die einzelnen Verfahrensschritt werden auf die Betragssignale
oder auf die Real- und Imaginärteilsignale
angewandt, welche in gewissen Grenzen gemittelt
werden, d. h. die gestörten Phasensignale
können, wegen der relativ großen Unempfindlichkeit
des Gehörs gegenüber Phasenstörungen, unverändert
beibehalten werden.
Zweckmäßige Ausgestaltungen ergeben sich aus den Unteransprüchen.
Das erfindungsgemäße Verfahren wird nachfolgend anhand
des in der Zeichnung dargestellten Ausführungsbeispiels
näher beschrieben und erläutert.
Das Ausführungsbeispiel der Erfindung zeigt nur die
für das Verständnis der Erfindung erforderlichen
Einzelheiten. Die vorgeschlagene adaptive Polyphasen-
Filterbank (P 31 18 473.1-35) besteht aus einem
Signal-Analyseteil, einem Signal-Verarbeitungsteil
zur adaptiven Signalverbesserung und einem Signal-
Syntheseteil. Die Wirkung der Polyphasen-Netzwerke
ist beschreibbar durch ein Ersatzmodell bestehend aus
Demodulator, Tiefpaß und Unterabtaster. In Verbindung
mit einem diskreten Fourier-Transformations-Prozessor
zur Fast-Fourier-Transformation wird eine Kurzzeitspektralanalyse
mit Taktreduktion eines zugeführten
Eingangssignal erzielt. Die zeitliche und spektrale
Auflösung wird durch einen Prototyp-Tiefpaß mit
dessen Impulsantwort bestimmt. Wie der vorgeschlagenen
digitalen Filteranordnung (P 31 18 473-38) zu entnehmen
ist, ist die Signal-Synthese durch Anwendung
inverser Operationen möglich.
Im Signal-Analyseteil der adaptiven Polyphasen-Filterbank,
bestehend aus Polyphasen-Netzwerk und dem diskreten
Fourier-Transformations-Prozessor zur Fast-
Fourier-Transformation, wird eine Aufspaltung des
Eingangssignals in spektrale Teilsignale durchgeführt.
In der Zeichnung ist ein spektrales Teilsignal mit Vν
bezeichnet. Durch die Induzierung mit dem Index ν
soll ein spektrales Teilsignal mit ν-ten Kanal bezeichnet
werden. Zur Vereinfachung der Betrachtung ist
in der Zeichnung das spektrale Teilsignal für den
ν-ten Kanal dargestellt, wobei in den anderen Kanälen
die gleiche Darstellung zutreffend ist. In der
Zeichnung sind zum Erleichtern des Verständnisses der
Signal-Analyse- und Signal-Syntheseteil der adaptiven
Polyphasen-Filterbank weggelassen. Wie aus der
Zeichnung ersichtlich ist, besteht die Verarbeitung
nicht nur in einer multiplikativen Gewichtung der
spektralen Teilsignale Vν (P 31 18 473-38), sondern
in zusätzlichen nichtlinearen Operationen. Die verarbeiteten
spektralen Teilsignale ν werden durch,
in der Zeichnung nicht dargestellte, inverse, diskrete
Fourier-Transformation und inverse, interpolierende
Polyphasenfilterung umgeformt, wobei die Taktfrequenz
wieder auf das ursprüngliche Maß erhöht wird.
Das Eingangssignal besteht aus einem Sprachsignal sν
und einem additiv überlagerten Störsignal nν. Durch
multiplikative Verknüpfung der zu verarbeitenden
spektralen Teilsignale, z. B. Vν mit ersten Koeffizienten
cν und unter Anwendung des erfindungsgemäßen
Verfahrens kann neben der Reduktion von stationären
Störungen auch eine Reduktion von instationären
Störungen erreicht werden.
Das zu verarbeitende, spektrale Teilsignal Vν wird
einer Einrichtung 1 zur Umwandlung der, getrennt in
Real- und Imaginärteil vorliegenden, spektralen Teilsignale
in Polarkoordinaten zugeführt. Das erfindungsgemäße
Verfahren ist unabhängig davon, in welchem
Koordinatensystem die spektralen Teilsignale darstellbar
sind. Werden die Real- und Imaginärteile der
spektralen Teilsignale Vν nicht mittels der Einrichtung
1 in Polarkoordinaten umgewandelt, so erübrigt
sich dann auch die Rückwandlung der verarbeiteten,
spektralen Teilsignale ν in kartesische
Koordinaten mittels einer Einrichtung 17. Die spektralen
Teilsignale (komplexwertige Zeitsignale) Vν
werden zur Ableitung der ersten Koeffizienten cn
verwendet, während die gestörten Phasensignale Φν
beibehalten werden. Da zur Ableitung der ersten
Koeffizienten cν eine bestimmte Zeit erforderlich
ist, wird Betrag |Vn| und Phase Φν in Einrichtungen 14
und 16 verzögert. Diese zeitliche Verzögerung steht
in einem Zusammenhang mit der Zeit für die Berechnung
des ersten Koeffizienten cν in einer Einrichtung 6
gemäß einer Gewichtungsregel. Eine weitere Verzögerung
ergibt sich aus der Bestimmung eines Koeffizienten c3ν
mittels einer Einrichtung 11.
In einer Einrichtung 2 werden Kurzzeitmittelwert E₂
des gestörten Signals, zum Beispiel der spektralen
Teilsignale Vν, berechnet. Die in der Einrichtung 2
berechneten Kurzzeitmittelwerte E₂ weichen aufgrund
der kurzzeitigen Instationarität der spektralen Teilsignal
Vν (Instationarität des Störsignals nν) statistisch
von einem in einer Einrichtung 5 berechneten
Langzeitmittelwert E₁ ab. In der Einrichtung 5 kann
der Langzeitmittelwert E₁ von nν berechnet werden,
wozu eine Sprachpausenerkennung (Einrichtung 4) erforderlich
ist. Unter Verwendung der Kurzzeitbetragssumme
ist im Zeitbereich eine sichere Erkennung von
Sprachpausen möglich. Wie der Zeichnung zu entnehmen
ist, wird bei erkannter Sprachpause ein Schalter 3
geschlossen und in der Einrichtung 5 der Langzeitmittelwert
E₁ der Störung nν berechnet. In der Einrichtung
6 wird aus dem zugeführten Langzeitmittelwert
E₁ der Störung nν und den ermittelten Kurzzeitmittelwerten
E₂ des gestörten Signals (sν+nν), gemäß
einer Gewichtungsregel, der erste Koeffizient cν ermittelt.
Die verwendete Gewichtungsregel ist eine
Funktion von Langzeitmittelwert E₁ der Störung nν und
Kurzzeitmittelwert E₂ des gestörten Signals (sν+nν)
(eines lokalen Kurzzeit-Signal-Störabstands ρ) und
einer reellwertigen Konstante K. Beispiel für eine
solcher Gewichtungsregel ist
Die angegebene Gewichtungsregel G wurde aus einer
großen Vielfalt von Kombinationsmöglichkeiten unter
Zuhilfenahme umfangreicher objektiver und subjektiver
Hörtests entwickelt. Das Problem der Vorgabe der Gewichtungsregel
liegt in den teilweise sich widersprechenden
Forderungen nach hoher Geräuschreduktion
und guter Sprachverständlichkeit. Da die Pegelbewertung
des Betrags |Vν| gemäß der Gewichtungsregel
die exakte Kenntnis der Kurzzeit-Signal-Störabstände ρ
voraussetzt, diese aber nur geschätzt werden
können, verbleiben in den Sprachpausen Reststörungen.
Durch Anwendung des erfindungsgemäßen Verfahrens kann
die, im Falle der Verwendung der Gewichtungsregel G,
verbleibende Reststörung, welche sich akustisch als
plätschernde Geräusche, musikalische Töne, Verzerrungen
oder rauhe Sprachkomponente zeigt, reduziert
werden.
Dazu werden als erster Verfahrensschritt für den Fall,
das erste, zeitabhängige Koeffizienten cν kleiner
einem vorgebbaren Koeffizienten-Schwellenwert cmin
auftreten, einem Koeffizienten c1ν (Ausgangssignal
einer Einrichtung 7) der Wert 0 zugeordnet. Der
Koeffizienten-Schwellenwert cmin wurde empirisch
zu 0,1 ermittelt. Dieser Vergleich ist beschreibbar
durch die Gleichung (1):
und wird mittels der Einrichtung 7 durchgeführt.
Zur weiteren Signalverbesserung wird das Ausgangssignal
c1ν der Einrichtung 7 hinsichtlich der einzelnen
Kanäle ausgewertet. Dazu wird ein Koeffizientenvergleich
jeweils für im Frequenzbereich benachbarte
Koeffizienten, z. B. c1ν +1, c1ν -1 durchgeführt. Aufgrund
dieses Koeffizientenvergleichs mittels einer
Einrichtung 9 wird eine nichlineare Glättung über
dem Kanalindex ν vorgenommen. Beispielsweise wird
für den Fall, daß Koeffizienten c1ν +1, c1n -1
gleich 0 im höher und tiefer gelegenden Frequenzbereich
auftreten, einem Koeffizienten c2ν der Wert 0
zugeordnet (Einrichtung 8). Dies ist zur Beseitigung
des additiv überlagerten Störsignals nν (sprachuntypische
Merkmale) geeignet, ohne da Sprachsignal sν
zu verzerren. Durch Verarbeitung von Koeffizienten
ist diese unabhängig von der Aussteuerung in einer
adaptiven Filterbank. Die Koeffizienten cν, c1ν, c2ν,
c3ν und c4ν liegen innerhalb eines Zahlenintervalls
von 0 bis 1. Die Verarbeitung in der Einrichtung 9
kann z. B gemäß der folgenden Gleichung (2) vorgenommen
werden
wobei z. B. a₀=1; a±1=a±2=-0,25; Aν=0,25;
Dabei bezeichnet Aν einen Schwellenwert,
während die ai Gewichtungsfaktoren darstellen.
Wie aus der Gleichung (2) ersichtlich ist, wird der
Vergleich mit jeweils zwei im Frequenzbereich höher
und tiefer gelegenen Koeffizienten c1ν +1, c1ν +2 und
c1n -1, c1ν -2 vorgenommen. Eine Verallgemeinerung im Sinne
eine Veränderung der Summengrenzwerte oder der
Koeffizienten ist möglich. Dadurch können sprachspezifische
Merkmale berücksichtigt werden.
Mittels der Einrichtung 11 wird jede zeitliche
Koeffizientenfolge c2ν auf 0-Folgen untersucht.
Bei Feststellung einer solchen wird erst nach Überschreitung
einer Mindestzahl von zeitlich aufeinanderfolgenden
und von 0 verschiedenen Koeffizienten
c2ν, ein Koeffizient c3ν am Ausgang einer Einrichtung
10 gleich dem zugeführten Signal c2ν gesetzt.
Diese Zeitfilterung des Koeffizienten c3ν ist beschreibbar
durch die folgende Gleichung (3):
mit ρ:Zeitindex und
λ:Zeitpunkt
λ:Zeitpunkt
Ein weiterer Verfahrensschritt zur Signalverbesserung
besteht in einer globalen Pausenabschaltung oder
Pausenabschwächung. Dazu werden mittels Einrichtungen
12, 13 bei Feststellung von langen, gleichzeitig
auftretenden 0-Folgen bei einer Mindestanzahl von
Koeffizienten, z. B. c3ν -1, c3ν, c3ν +1 auch jene von
0 verschiedene Koeffizienten in anderen Kanälen,
z. B. c3ν +6 für diesen Zeitraum nachträglich mit 12 oder
Wert 0 zugeordnet. Dieser Verfahrensschritt ist beschreibbar
durch folgende Gleichung (4):
dabei bezeichnet Dν einen Schwellenwert. Die erläuterten
Verfahrensschritte können einzeln oder in
Kombination angewandt werden. Bei Kombination aller
vier Verfahrensschritte gemäß Gleichungen (1) bis (4)
ist insbesondere zwischen den Worten (Sprachpause)
und einzelnen Silben eine erhebliche Reduktion der
Reststörung erreichbar. Durch Auswertung der ersten
Koeffizienten cν und unter Berücksichtigung des
Modells der Spracherzeugung kann ein einfach zu realisierendes
und wirksames Verfahren zur Signalverbesserung
angegeben werden.
Claims (8)
1. Verfahren zur Signalverbesserung von gestörten Sprachsignalen,
bei dem gestörte Sprachsignale mittels einer
Filterbank in spektrale Teilsignale aufgespalten werden
und bei dem die spektralen Teilsignale kanalweise verarbeitet
werden, indem diese mit Koeffizienten aktiv gewichtet
werden, und bei dem die kanalweise verarbeiteten,
spektralen Teilsignale zum Ausgangssignal zusammengefügt
werden,
dadurch gekennzeichnet,
daß erste, zeitabhängige Koeffizienten (cν) kanalweise nach einer Gewichtungsregel gebildet werden und Vergleiche zwischen den ersten Koeffizienten (cν) und mindestens einem vorgebbaren Koeffizienten-Schwellenwert (cmin) und/oder Vergleiche kanalweise und gleichzeitig berechneter Koeffizienten (c2ν) miteinander und/oder Vergleiche zwischen zeitlich aufeinanderfolgenden Koeffizienten (c3ν) und (c4ν) mindestens eines Kanals durchgeführt werden,
daß den ersten Koeffizienten (cν) der Wert 0 zugeordnet wird, wenn sie kleiner als der vorgebbare Koeffizienten- Schwellwert (cmin) sind,
daß der Vergleich gleichzeitig berechneter Koeffizienten (c1ν) jeweils für Koeffizienten (c1ν) benachbarter Kanäle durchgeführt wird und
daß bei Feststellung, daß sich ein Koeffizient (c1ν) von denen benachbarter höherer und tieferer Kanäle um ein Mindestmaß unterscheidet, eine nichtlineare Glättung vorgenommen wird.
daß erste, zeitabhängige Koeffizienten (cν) kanalweise nach einer Gewichtungsregel gebildet werden und Vergleiche zwischen den ersten Koeffizienten (cν) und mindestens einem vorgebbaren Koeffizienten-Schwellenwert (cmin) und/oder Vergleiche kanalweise und gleichzeitig berechneter Koeffizienten (c2ν) miteinander und/oder Vergleiche zwischen zeitlich aufeinanderfolgenden Koeffizienten (c3ν) und (c4ν) mindestens eines Kanals durchgeführt werden,
daß den ersten Koeffizienten (cν) der Wert 0 zugeordnet wird, wenn sie kleiner als der vorgebbare Koeffizienten- Schwellwert (cmin) sind,
daß der Vergleich gleichzeitig berechneter Koeffizienten (c1ν) jeweils für Koeffizienten (c1ν) benachbarter Kanäle durchgeführt wird und
daß bei Feststellung, daß sich ein Koeffizient (c1ν) von denen benachbarter höherer und tieferer Kanäle um ein Mindestmaß unterscheidet, eine nichtlineare Glättung vorgenommen wird.
2. Verfahren nach Anspruch 1,
dadurch gekennzeichnet,
daß der Koeffizienten-Schwellenwert (cmin) bei 0,1 liegt.
3. Verfahren nach Anspruch 1,
dadurch gekennzeichnet,
daß bei der nichtlinearen Glättung dem Koeffizienten
(c1n) ein Wert zugeordnet wird, welcher sich aus dem
Mittelwert von Koeffizienten (z. B. c1ν +1, c1ν -1) benachbarter
Kanäle oder deren Linearkombination ergibt.
4. Verfahren nach Anspruch 1, 2 oder 3,
dadurch gekennzeichnet,
daß das Mindestmaß auf einem Vergleich der Koeffizienten
(z. B. c1ν +1, c1ν -1) mit einer Schwelle (z. B.
Wert 0,2) oder auf einem Vergleich des Koeffizienten
(c1ν) mit der Linearkombination beruht.
5. Verfahren nach Anspruch 1,
dadurch gekennzeichnet,
daß die zeitliche Koeffizientenfolge mindestens eines Kanals
auf 0-Folgen untersucht wird und daß bei Feststellung
einer solchen erst für eine Mindestanzahl zeitlich
aufeinanderfolgender und von 0 verschiedener Koeffizienten
(c2ν) der Koeffizienten (c3n) selbst zur adaptiven
Gewichtung verwendet wird.
6. Verfahren nach Anspruch 5,
dadurch gekennzeichnet,
daß bei Feststellung von langen, gleichzeitig auftretenden
0-Folgen der Koeffizienten (c3ν) in einer Mindestzahl
von Kanälen auch jenen von 0 verschiedenen Koeffizienten
(c3ν) anderer Kanäle für diesen Zeitraum der Wert 0
zugeordnet wird.
7. Verfahren nach Anspruch 1,
dadurch gekennzeichnet,
daß die Koeffizienten (cν, c1ν, c3ν und c4ν) innerhalb
eines Zahlenintervalls von 0 bis 1 liegen.
8. Verfahren nach Anspruch 1,
dadurch gekennzeichnet,
daß der erste Koeffizient (dν) eine Funktion von Langzeitmittelwert
(E₁) der Störung und Kurzzeitmittelwert
(E₂) des gestörten Signals und einer reellwertigen
Konstante (K) ist.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19823230391 DE3230391A1 (de) | 1982-08-14 | 1982-08-14 | Verfahren zur signalverbesserung von gestoerten sprachsignalen |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19823230391 DE3230391A1 (de) | 1982-08-14 | 1982-08-14 | Verfahren zur signalverbesserung von gestoerten sprachsignalen |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3230391A1 DE3230391A1 (de) | 1984-02-16 |
DE3230391C2 true DE3230391C2 (de) | 1991-01-10 |
Family
ID=6170963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19823230391 Granted DE3230391A1 (de) | 1982-08-14 | 1982-08-14 | Verfahren zur signalverbesserung von gestoerten sprachsignalen |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE3230391A1 (de) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19524847C1 (de) * | 1995-07-07 | 1997-02-13 | Siemens Ag | Vorrichtung zur Verbesserung gestörter Sprachsignale |
DE19854341A1 (de) * | 1998-11-25 | 2000-06-08 | Alcatel Sa | Verfahren und Schaltungsanordnung zur Sprachpegelmessung in einem Sprachsignalverarbeitungssystem |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3802903A1 (de) * | 1988-02-01 | 1989-08-10 | Siemens Ag | Einrichtung zur uebertragung von sprache |
FI100840B (fi) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
DE19818609C2 (de) * | 1998-04-20 | 2000-06-15 | Deutsche Telekom Ag | Verfahren und Vorrichtung zur Geräuschfilterung |
EP1428354A2 (de) * | 2001-09-20 | 2004-06-16 | Honeywell International, Inc. | Digital-audiosystem |
CN112017683B (zh) * | 2020-10-20 | 2021-01-05 | 南京南大电子智慧型服务机器人研究院有限公司 | 一种频域无次级路径有源噪声控制系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3421141A (en) * | 1967-10-16 | 1969-01-07 | Huntec Ltd | Self-adjusting filter |
CH522327A (de) * | 1970-09-28 | 1972-06-15 | Bbc Brown Boveri & Cie | Elektrische Filterschaltung |
DE3118473A1 (de) * | 1981-05-09 | 1982-11-25 | TE KA DE Felten & Guilleaume Fernmeldeanlagen GmbH, 8500 Nürnberg | Verfahren zur aufbereitung elektrischer signale mit einer digitalen filteranordnung |
-
1982
- 1982-08-14 DE DE19823230391 patent/DE3230391A1/de active Granted
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19524847C1 (de) * | 1995-07-07 | 1997-02-13 | Siemens Ag | Vorrichtung zur Verbesserung gestörter Sprachsignale |
DE19854341A1 (de) * | 1998-11-25 | 2000-06-08 | Alcatel Sa | Verfahren und Schaltungsanordnung zur Sprachpegelmessung in einem Sprachsignalverarbeitungssystem |
US6539350B1 (en) | 1998-11-25 | 2003-03-25 | Alcatel | Method and circuit arrangement for speech level measurement in a speech signal processing system |
Also Published As
Publication number | Publication date |
---|---|
DE3230391A1 (de) | 1984-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE112009000805B4 (de) | Rauschreduktion | |
DE19747885B4 (de) | Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion | |
EP0912974B1 (de) | Verfahren zur verringerung von störungen eines sprachsignals | |
DE69632626T2 (de) | Adaptiver sprachsignalfilter | |
DE69531710T2 (de) | Verfahren und Vorrichtung zur Verminderung von Rauschen bei Sprachsignalen | |
DE69105760T2 (de) | Einrichtung zur Signalverarbeitung. | |
EP0065210B1 (de) | Verfahren zur Aufbereitung elektrischer Signale mit einer digitalen Filteranordnung | |
EP0948237B1 (de) | Verfahren zur Störbefreiung eines Mikrophonsignals | |
DE112011104737B4 (de) | Geräuschunterdrückungsvorrichtung | |
DE69124005T2 (de) | Sprachsignalverarbeitungsvorrichtung | |
EP1386307B1 (de) | Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals | |
DE2207141C3 (de) | Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters | |
DE2749132A1 (de) | Rauschfilter-anordnung | |
DE4243831A1 (de) | Verfahren zur Laufzeitschätzung an gestörten Sprachkanälen | |
EP3089481B1 (de) | Verfahren zur frequenzabhängigen rauschunterdrückung eines eingangssignals | |
DE112007003674T5 (de) | Methode und Apparat zur Einkanal-Sprachverbesserung basierend auf einem latenzzeitreduzierten Gehörmodell | |
DE102014221528B4 (de) | Akkurate Vorwärts-SNR-Schätzung basierend auf MMSE-Sprachpräsenzwahrscheinlichkeit | |
DE3230391C2 (de) | ||
DE102013011761A1 (de) | Kraftfahrzeug mit einer Freisprecheinrichtung und Verfahren zur Erzeugung eines Frequenzganges für Freisprecheinrichtungen | |
DE10157535B4 (de) | Verfahren und Vorrichtung zur Reduzierung zufälliger, kontinuierlicher, instationärer Störungen in Audiosignalen | |
EP1239455A2 (de) | Verfahren und Anordnung zur Durchführung einer an die Übertragungsfunktion menschilcher Sinnesorgane angepassten Fourier Transformation sowie darauf basierende Vorrichtungen zur Geräuschreduktion und Spracherkennung | |
DE102015204010B4 (de) | Verfahren zur Unterdrückung eines Störgeräusches in einem akustischen System | |
DE602005000897T2 (de) | Eingangsschallprozessor | |
EP1755110A2 (de) | Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System | |
DE19729521B4 (de) | Verfahren und Vorrichtung zur Störgeräusch- und Echounterdrückung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8125 | Change of the main classification |
Ipc: H03H 17/02 |
|
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: PHILIPS PATENTVERWALTUNG GMBH, 20097 HAMBURG, DE |
|
8339 | Ceased/non-payment of the annual fee |