AT504164B1

AT504164B1 - Vorrichtung zur gerauschunterdruckung bei einem audiosignal

Info

Publication number: AT504164B1
Application number: AT0154706A
Authority: AT
Inventors: Erhard Dipl Ing Dr Techn Rank; Gernot Dipl Ing Dr Techn Kubin
Original assignee: Tech Universit T Graz
Priority date: 2006-09-15
Filing date: 2006-09-15
Publication date: 2009-04-15
Also published as: AT504164A1; US20100049507A1; EP2080197A1; EP2080197B1; ATE495523T1; DE502007006264D1; WO2008031124A1

Description

2 AT 504 164 B1

Die Erfindung bezieht sich auf eine Vorrichtung zur Geräuschunterdrückung mit einer linearen Prädiktions-Analysierschaltung mit einem LP-Fehler-Filter (LFF), das auf Basis eines ersten, von Geräusch überlagerten Sprachsignals y(n) = x(n) + ε(η) ein LP-Fehler-Filter Ausgangssignal e(n) erzeugt, einer Koeffizientenberechnungseinheit, welche die Koeffizienten des LP-Fehler-Filters auf Basis der internen Signale (inklusive des Ein- und Ausgangssignals y(n) und e(n)) des LP-Fehler-Filters aktualisiert, und einer Subtrahiereinheit, welche das LP-Fehler-Filter Ausgangssignal e(n) von dem ersten Sprachsignal y(n) in einem Subtrahierer subtrahiert und nach der Subtraktion den Rest als zweites Sprachsignal x{n)=y(n)-e(n) ausgibt, in welchem das Geräusch unterdrückt ist.

Die Geräuschunterdrückung bei Audiosignalen, insbesondere auch bei Sprachsignalen gewinnt immer mehr an Bedeutung, so in der Telephonie, der automatischen Spracherkennung oder, als nur eines von vielen weiteren Beispielen, bei digitalen Hörgeräten. Geräusche, die es zu unterdrücken gilt, sind in erster Linie nicht-weißes Rauschen, nichtstationäre Geräusche und stark impulsartige Geräusche.

Verfahren zur Geräuschunterdrückung für Audiosignale sind in einer großen Vielfalt bekannt geworden und als Beispiele seien genannt: Verfahren, bei welchen leise Audiosignale zunächst angehoben und später wieder abgesenkt werden, wie Pre-/Deemphase für den Rundfunk oder die Dolby-Rauschunterdrückungsverfahren für Tonträgeraufzeichnungen. Weiters Verfahren der spektralen Subtraktion, bei welchen z.B. in Gesprächspausen das Geräusch geschätzt und dann von dem Eingangssignal abgezogen wird. Zu den letztgenannten Verfahren zählen auch Wiener-Filter sowie Ephraim-Malah Filter mit adaptiver Verstärkung für in mehrere Transformationskanäle aufgespaltete Signale. Die bekannten Verfahren sind zum Teil nicht sehr wirkungsvoll, da sie von einem sehr vereinfachten Modell des Geräuschsignals ausgehen, oder sie führen auf Grund einer blockweisen Verarbeitung des Eingangssignals zu Artefakten, die sich als unangenehme Nebengeräusche bemerkbar machen, als so genannte Musical Tones, die im Signal nach der Geräuschreduktion verbleiben. Viele Verfahren führen auch zu einer relativ großen Verzögerung des Ausgangssignals.

Der Stand der Technik, von welchem die vorliegende Erfindung ausgeht, sind lineare Prädiktionsfilter (LP Filter), in direkter oder in Lattice-Form (Kreuzglied Kettenfilter), bei welchen Eigenschaften des gesamten Eingangssignals zur Einstellung der Filterkoeffizienten herangezogen werden. Eine entsprechende Vorrichtung, wie z.B. in der US 2001/0005822 A1 geoffenbart, besteht aus einem Lattice Filter, dem ein Eingangssignal y(n) zugeführt ist, welches eine Sprach/Audiokomponente sowie eine Geräuschkomponente aufweist. Für die Einstellung der Komponenten ist eine Koeffizientenberechnungseinheit KBE vorgesehen, welcher die Vorwärts-und Rückwärtsfehlersignale, diese beinhalten in der ersten Stufe auch das Eingangssignal, zugeführt werden. Die Koeffizientenberechnungeinheit liefert dem Filter sodann immer im Sinne einer Minimierung des Prädiktionsfehlers aktualisierte Filterkoeffizienten. Eine Geräuschreduktion unter Verwendung linearer Prädiktionsfilter ist unter anderem auch in der GB 1 520 148 A oder in der US 4, 587, 620 geoffenbart. Die Verfahren bzw. Vorrichtungen nach dem Stand der Technik gehen immer von dem Eingangssignal aus, ohne dass die besonderen Eigenschaften des Sprachsignals einerseits und des Geräusches andererseits Berücksichtigung finden.

Bei der Vorrichtung nach der US 7, 065,468 wird dort das Eingangssignal dazu herangezogen, die Koeffizienten für das Prädiktionsfilter zu bestimmen (Einheit 212 bzw. 312 und 318) und aufgrund dieser Koeffizienten erfolgt dann eine Schätzung des Sprachsignals wobei - unter Verwendung einer zusätzlichen Sprachaktivitätsschätzungseinheit (VAD, Einheit 232 bzw. 332) eine Schätzung des Geräuschsignals, nämlich in einer Einheit 234 bzw. 334 dazu erfolgt, mittels eines weiteren zweiten Filters (Einheit 240 bzw. 340) eine Geräuschunterdrückung vorzunehmen.

Wesentliche Merkmale sind dabei, dass die Schätzung der Koeffizienten des linearen Prädiktionsfilters (Einheit 214) bzw. der linearen Prädiktionsfilter (Einheit 314 und 320 in Fig. 3) nur 3 AT 504 164 B1 unter Verwendung des Eingangssignals (bzw. des Fehlersignals des ersten Prädiktionsfilters e ST(n) (Pfad 316)) vorgenommen wird. Ein weiterer wesentlicher Unterschied zur Erfindung liegt darin, dass eine Sprachaktivitätsschätzung unabhängig vom linearen Prädiktionsfilter 214 von den linearen Prädiktionsfiltern 314 und 320 ausgeführt wird, sowie, dass das eigentliche Filter zur Geräuschunterdrückung (Einheit 240 bzw. 340) selbst kein lineares Prädiktionsfilter darstellt. Dabei erfolgt die Geräuschschätzung („Update Noise Model“) nur auf der Basis des Prädiktionsfehlers (vgl. Anspruch 1 der US 7, 065,468), wogegen, wie weiter unten beschrieben, bei der Erfindung die Geräuschschätzung anhand der internen Signale des LP-Fehler-Filters durchgeführt wird. Dieser Unterschied ist auch an Hand der Fig. 2 der US 7, 065,468 ersichtlich.

Insgesamt zeigt die US 7, 065,468 eine Struktur, die sich bereits von dem Stand der Technik nach der US 2001/0005822 A1 unterscheidet und die noch dazu - verglichen mit der Erfindung -aufwändiger ist. In der US 7, 065,468 wird letztlich ein anderer Weg beschriften, der den Fachmann, dem die US 2001/0005822 A1 bekannt ist und der sich die der Erfindung zugrunde liegende Aufgabe gestellt hat, in eine andere Richtung als jene der Erfindung führen würde.

Als Publikationen auf diesem Gebiet seien weiters nachstehend genannt: [1] J. D. Markei and A. H. Gray, Jr., Linear Prediction of Speech. Berlin, Heidelberg, New York: Springer, 1976.

[2] J. I. Makhoul and L.K. Cosell, "Adaptive lattice analysis of speech," IEEE Transactions on Acoustics, Speech, and Signal Processing, vol. 29, pp.654-659, June 1981.

[3] M. L. Honig and D. G. Messerschmitt, Adaptive Filters: Structures, Algorithms, and Applications. Boston-The Hague-London-Lancaster: Kluwer Academic Publishers, 1984.

[4] A. Kawamura, K. Fujii, Y. Itoh, and Y. Fukui, "A noise reduction method based on linear prediction analysis," Electronics and Communications in Japan, Part 3, vol. 86, no. 3, pp. 1-10, 2003.

[5] Μ. H. Savoji, "Effective noise reduction of speech Signals using adaptive lattice filtering, Segmentation and soft decision," in IEE Colloquium on New Directions in Adaptive Signal Processing, pp. 7/1-7/5, Feb. 1993.

Eine Aufgabe der Erfindung liegt in der Schaffung einer Vorrichtung bzw. eines Verfahrens zur Geräuschunterdrückung für Audiosignale, insbesondere für Sprachsignale, welche ein praktisch unverzögertes Ausgangs-Audiosignal liefert, das auch keine störenden Artefakte mit sich führt.

Diese Aufgabe wird mit einer Vorrichtung der eingangs genannten Art gelöst, bei welcher erfindungsgemäß eine Geräuschschätzungseinheit vorgesehen ist, welche auf Basis der internen Signale des LP-Fehler-Filters ein Geräuschleistungssignal und ein Sprachleistungssignal erzeugt, diese Signale der Koeffizientenberechnungseinheit zugeführt sind und von dieser im Sinne einer Optimierung der Geräuschunterdrückung berücksichtigt wird und/oder eine Sprach-aktivitätsschätzungseinheit vorgesehen ist, welche auf Basis der internen Signale des LP-Fehler-Filters ein Sprachaktivitätssignal erzeugt, das der Koeffizientenberechnungseinheit zugeführt ist und von dieser im Sinne einer Optimierung der Geräuschunterdrückung berücksichtigt werden.

Bei einer zweckmäßigen Weiterbildung der Erfindung ist vorgesehen, dass die Sprachaktivi-tätsschätzungseinheit einen Geräuschunterdrückungsfaktor kn bildet, welcher einem Eingang eines ersten Multiplizierers zugeführt ist und dessen anderem Eingang das Ausgangssignal des LP-Fehler-Filters zugeführt ist und der vor dem Subtrahierer liegt.

Es kann weiters vorteilhaft sein, wenn die Sprachaktivitätsschätzungseinheit einen Gesamtsig- 4 AT504164B1 nalfaktor kg bildet, welcher einem Eingang eines zweiten Multiplizierers zugeführt ist dessen anderem Eingang das Ausgangssignal des Subtrahierers zugeführt ist.

Bei einer praxisgerechten Variante kann man vorsehen, dass das LP-Fehler-Filter aus einem Lattice Filter (Fig. 1) besteht, wobei die Vorwärts- und Rückwärtsfehler Signale die internen Signale des LP-Fehler-Filters darstellen.

Andererseits ist es mit Vorteil auch möglich, dass das LP-Fehler-Filter als Filter in direkter Filterform aus dem Eingangssignal ein Prädiktionssignal an seinem Ausgang erzeugt, und ein Subtrahierer das Prädiktionssignal vom Eingangssignal abzieht und somit das Ausgangssignal des LP-Fehler-Filters e(n) erzeugt; wobei die verzögerten Abtastwerte des Eingangssignals (vgl. Gleichung 1) sowie das Ausgangssignal des Subtrahierers e(n) den internen Signalen des LP-Fehler-Filters entsprechen.

Bei einer anderen vorteilhaften Variante ist vorgesehen, dass die Koeffizientenberechnungseinheit dazu eingerichtet ist, die korrigierte Fehlervarianz q0 gemäß <7o =q0 ~ση und den korrigierten Reflexionskoeffizienten k gemäß

Qo <70 ~ση zu ermitteln.

Wieder eine weitere zweckmäßige Variante zeichnet sich dadurch aus, dass die Koeffizientenberechnungseinheit dazu eingerichtet ist, die Fehlerkorrelation gemäß rm (n)=Ärrm (n-l)+fm {n)bm (n-1) und die Fehlervarianz gemäß qm (n)=*qqm {n)b* (n-1)) zu ermitteln.

Bei einer günstigen Ausführung kann für die Leistungsschätzung von q (n) ein einpoliger Tiefpass und ein für die Korrelationsschätzung r(n) zweipoliger Tiefpass vorgesehen sein.

Zur Verbesserung der Geräuschunterdrückung bei entsprechend erhöhtem Aufwand sieht eine weitere Variante der Erfindung eine Kaskade vor, die aus zumindest zwei hintereinander geschalteten Vorrichtungen besteht, welche entsprechen der oben genannten Erfindungsmerkmale ausgebildet sind.

Die Erfindung samt weiteren Vorteile ist im folgenden an Hand beispielsweiser Ausführungsformen näher erläutert, die in der Zeichnung veranschaulicht sind. In dieser zeigen

Fig. 1 ein Lattice-Filter nach dem Stand der Technik,

Fig. 2 aus dem geräuschbehafteten Signal ohne Korrektur berechnete Werte des Reflexionskoeffizienten in einem Diagramm,

Fig. 3 a und b den Frequenzgang von im Rahmen der Erfindung verwendeten Tiefpässen,

Fig. 4 an Hand des zeitlichen Verlaufes sowie des Spektrogramms eines geräuschbehafteten 5 AT 504 164 B1

Eingangssignal (oben) und dessen Geräuschbefreiung (unten) nach der Erfindung,

Fig. 5 das Blockschaltbild einer prinzipiellen Vorrichtung zur Geräuschbefreiung nach dem Stand der Technik

Fig. 6 das Blockschaltbild einer ersten Ausführungsform einer Vorrichtung nach der Erfindung, Fig. 7 das Blockschaltbild einer zweiten Ausführungsform einer Vorrichtung nach der Erfindung und

Fig. 8 das Blockschaltbild einer dritten Ausführungsform einer Vorrichtung nach der Erfindung.

Lineare Prädiktion wird üblicherweise auf ein Sprachsignal x(n) angewendet, beispielsweise um die Varianz eines Sprachsignals für dessen Übertragung zu reduzieren. Um einen Signalwert vorher zu sagen, werden langsam zeitveränderliche FIR-Filter (finite impulse response filter, Filter mit endlicher Impulsantwort) niedriger Ordnung verwendet:

M *(Ό=Σbi in)x{n-i)· (1)

Hier bedeuten M die Ordnung des LP-Filters und b{n) die Filterkoeffizienten, die auf Basis der Signaleigenschaften geschätzt und rahmenweise, z.B. alle 10 ms, aufgefrischt werden. Algorithmen welche die Koeffizienten b{ri) für das Filter direkt ergeben sind das so genannte „Auto-korrelationsverfahren“ oder das „Kovarianzverfahren“. Die zur Modellierung der spektralen Hüllkurve üblicherweise verwendete Filterordnung liegt, abhängig von der Abtastrate, bei M- 10...20.

Ein dem eben beschriebenen direkten FIR-Filter, auf welches sich z.B. Patentanspruch 7 bezieht, ebenbürtiges ist das bereits genannte Lattice-Filter, welches einen unmittelbaren Bezug zum menschlichen Stimmtrakt besitzt [1].

Charakterisiert ist ein solches Filter durch die Gleichungen fo(n) = b0{n) = x(n), fm(n) = fm-i(n) + km{n)b^ (n - 1), (2) bm{n) = bm.1{n - 1) + k^ny^ri). (3) welche zu jedem Zeitpunkt n für alle Gliederstufen m = 1 ...A4 berechnete werden. Dabei bedeuten fm(n) und bm(n) den Vorwärts- bzw. Rückwärts-Fehler in der Stufe m zur Zeit n und km(n) die Reflexionskoeffizienten des Filters. Hier sei angemerkt, dass bei einer verallgemeinerten Darstellung die Reflexionskoeffizienten in (2) und (3) unterschiedlich sind, hier jedoch gleiche Reflexionskoeffizienten für vorwärts und rückwärts verwendet werden. In Fig. 1 ist ein Lattice-Filter wie eben beschrieben schematisch dargestellt. Auf ein solches Filter bezieht sich beispielsweise Patentanspruch 6.

Der Vorwärtsfehler in der Stufe M ist das Vorhersage-Fehlersignal des LP-Filters: (4) fM (n)=e{n)=x(n)-x(n).

Optimale Reflexionskoeffizienten km zur Minimierung des quadratischen Mittelwertes des Vorhersagefehlers eines unverzerrten Signals ergeben sich als:

(5) 6 AT 504 164 B1 mit den erwarteten Werten für Vorwärts- und Rückwärts- Fehlerkorrelation bzw. Leistung zu: rm{n)=E{fm{n)bm{n-1)}, (6)

Qm in)=lE{fm {n)+b2m (n-1)}. (7) Üblicherweise werden die Erwartungswertoperatoren E in (6) und (7) unter Verwendung Tief-pass-gefilterter Augenblickswerte von fjn)bm(n-1) bzw. f2(n)+b2(n-1) ausgewertet, beispielsweise mit Hilfe einpoliger rekursiver Tiefpassfilter („lossy Integration“, verlustbehaftete Integration, siehe weiter unten).

Somit erfolgt das Adaptieren des Lattice-Filters zur Formung des sich langsam ändernden Eingangs-Sprachsignals durch Berechnung der Gleichungen (6), (7) und (5) für jeden Zeitpunkt n nach dem Filtern - im Gegensatz zur dem rahmenweisen Aktualisieren der Koeffizienten bei der direkten Form des LP-Filters entsprechend Gleichung (1).

Was die Geräuschverminderung betrifft, sei angenommen, dass ein beobachtetes Signal y(n) eines additiven linearen Geräuschmodells vorliege: y[n) = x(n) + ε(η), (8) wobei x(n) die Sprachkomponente und ε(η) eine additive Hintergrund-Geräuschkomponente sei. Gegenstand der Geräuschreduktion ist es, eine gute Schätzung für die Sprachsignal-Komponente x(n) zu liefern. Für den vorliegenden einkanaligen Fall beruht diese Schätzung ausschließlich auf der Beobachtung des geräuschbehafteten Signals y(n) d.h. es wird keine zusätzliche Information verwendet, wie beispielsweise ein zweites Signal eines Mikrophons, welches lediglich die Hintergrundgeräusche aufnimmt.

Eine Verringerung des Hintergrundgeräusches in Sprachsignalen unter Verwendung linearer Prädiktionsfilterung kann auf der Annahme basieren, dass die Sprachsignalkomponente gut vorhersagbar ist, wogegen die Geräuschkomponente diese Eigenschaft nicht besitzt. Somit kann das vorher gesagte Signal x(n) als Schätzung für die Sprachkomponente genommen werden. Während bei den Prädiktionsfiltern in der direkten Form in Gleichung (1) der Ausgang unmittelbar das vorhergesagte Signal ist, wird bei den Lattice-Filtern x(n) wirksam als die Differenz zwischen dem Eingangssignal und dem Ausgang des Vorwärts-Prädiktionspfades berechnet: x(n)=y(n)-e(n) (9) x(n) ist die Schätzung der Sprachkomponente mit e(n) =fM (n). Vergleiche Gleichung (4).

Wenn man ein Lattice-LP-Filter für die Geräuschverminderung nach A. Kawamura et al. verwendet, wo ein Filter hoher Ordnung (N = 256) benutzt wird, um die spektrale Feinstruktur der Sprache zu modellieren, kann man beobachten, dass rm(n) eine große Varianz aufgrund der Geräuschsignalkomponente in den höheren Filterstufen aufweist. Es wird vorgeschlagen, die entsprechende Varianz der Reflektionskoeffizienten dadurch zu reduzieren, dass man einen festen (großen) Wert für die Leistungsschätzungen qm(n) = G verwendet. Die Verringerung des Betrags der Reflektionskoeffizienten oder die Verringerung der Radien der Nullstellen der LP Filterübertragungsfunktion wurde auch für andere Zwecke vorgeschlagen, z.B. für die Modellierung der spektralen Hüllkurve oder für eine genauere Schätzung der Formanten.

Eine Verringerung des Betrags der Reflektionskoeffizienten kann durch die Herleitung von Schätzern für rm und qm erfolgen, die den mittleren quadratischen Schätzfehler minimieren. Zur 7 AT 504 164 B1

Berechnung der Reflektionskoeffizienten für das Lattice Filter oder der partiellen Korrelationen, welche gleich -km sind und auf den Schätzungen von einem Geräuschsignal beruhen, sei für das zusätzliche Geräuschsignal weißes Rauschen mit der Varianz ση2 angenommen, das auch mit x(n) nicht korreliert sein soll. Dies stellt das am wenigsten informierte Modell {maximale Entropie) dar.

Es ist zwar diese Annahme für das Umgebungsgeräusch im Allgemeinen nicht realistisch, doch beweist sie die Notwendigkeit einer Korrektur der Reflektionskoeffizienten.

Die Schätzungen für die Korrelation in Gleichung (6) und die Leistung in Gleichung (7) aus der Berechung der Reflektionskoeffizienten in Gleichung (5) beruhen nun auf dem geräuschbehafteten beobachteten Signal y(n) und man kann die Notwendigkeit eines Korrekturterms zeigen, um die Schätzungen für die Reflektionskoeffizienten km bezogen auf das geräuschfreie Signal x(n) zu gewinnen.

In besonderen erhält man für die Schätzung der Reflektionskoeffizienten in der ersten Filterstufe m = 1 den folgenden Erwartungswert für r0: r0=E{f0 (n)b0 {n-1)} =E{y(n)y{n-1)} =E {(x(n)+£ (η))(χ(η-ΐ)+£·(/ι-ΐ))} (10) =E{x(n)x(r?-l)} Für die Fehlervarianz q0 in der ersten Filterstufe erhält man <7o =~E{f02 {n)+b2 (n-1)} =^E{y2(n)+y2{n-1)} (11) =τ,Ε{{χ(η)+ε(η))2 +(*(n-l)+4n-l))2 } =1Ε{χ2 (n)+x2 (n-1)}+<72

Der resultierende Fehler in den Werten der Reflektionsfaktoren ist in Fig. 2 dargestellt. Genauer gesagt sind hier aus dem geräuschbehafteten Signal ohne Korrektur berechnete Werte des Reflexionskoeffizienten ki als Funktion eines a priori Signal/Geräusch-Abstandes für unterschiedliche Werte der Autokorrelation pxx(1) des ungestörten Signals x(n) veranschaulicht.

Was die auf das geräuschfreie Signal x(n) bezogenen Reflektionskoeffizienten betrifft, kann die Korrelationsschätzung aus der geräuschbehafteten Beobachtung unverändert verwendet werden, das heißt r0 =rQ wogegen die berechnete Fehlerleistungsschätzung zu korrigieren ist als

Qo=Po (12) und der korrigierte Reflektionskoeffizient berechnet wird als (13)

Qo Qo ~σn

Wenn man einführt: y = E{y2} wobei χ-1 = E{y2}-a2 der a posteriori bestimmte Signalstör- 8 AT 504 164 B1 kann man diese Gleichung er- abstand ist und beachtet wird dass q0 =-E{f2 (n)+b2 (n—1)} neut anschreiben als ^

7 (14)

Das bedeutet eine Skalierung des Reflektionskoeffizienten ki, der ursprünglich für das gestörte Signal y(n) berechnet wurde unter Verwendung der Gleichungen (5), (6) und (7) mit einem 1

Faktor —- 1-i r

Eine Schätzung der Geräuschleistung σ„2 kann erfolgen anhand der Leistung des Ausgangssignals e(n) des LP-Fehler-Filters, ση =E{e(n)}, für das Lattice Filter ist eine möglich Auswertung des Erwartungswerts gegeben durch die Leistungsschätzung in der letzten Stufe des Lattice Filters qM.i(n): =qM-1 (n), oder, bei Verwendung der Sprachaktivitätsschätzung (siehe unten) anhand der Leistungsschätzung des Gesamteingangssignales bei fehlender Sprachaktivität:

σ2 =q0 (n), wenn »'«O Für die höheren Lattice Stufen m = 2, 3......kann die Gleichung (14) verallgemeinert werden, wodurch sich eine Korrektur der übrigen Reflektionskoeffizienten km ergibt.

Dessen ungeachtet kann man aus dem obigen schließen, dass eine Verminderung der Größe der Reflektionskoeffizienten, das heißt eine Verringerung des Verhältnisses zwischen Korrelation und Leistungsschätzung für die Vorhersage eines Signals x(n) bei Beobachtung eines Signal y(n), welches zusätzliches Geräusch enthält, zweckmäßig ist. Das Auffinden der Korrekturgrößen setzt eine verlässliche Schätzung der Geräuschleistung ση2 voraus. Weiters berücksichtigt das Modell bis jetzt nicht irgendwelche Kenntnisse bezüglich der Eigenschaften der Sprache und des zu erwartenden Geräuschsignals.

Die Erfindung schafft nun ein Verfahren bzw. eine Vorrichtung, mit welcher man, basierend auf einfachen Annahmen über die Änderung der Korrelation und der Leistung der Sprach- und Geräuschsignale nach der Zeit eine Korrektur der Reflektionsfaktoren erhält.

Wie oben ausgeführt, beruhen die Schätzungen der Fehlerkorrelation (6) und der Fehlervarianz (7) üblicherweise auf einer Tiefpassfilterung der Augenblickswerte. Oft wird auch eine einpolige Tiefpassfilterung (verlustbehaftet Integration) verwendet: rm {n)=*r7m (n-l)+7m {n)bm (n-1), (15) (16)

Qm in)=*qqm {η-ΐ)+ψϊ> {n)+b2m (n-1)), 9 AT 504 164 B1 mit den gleichen Polen bzw. Integrationsfaktoren Xr = Xq sowohl für die Korrelations- als auch die Leistungsschätzung.

In Einklang mit der Erfindung sind verschiedene Pollagen Äq > λΓ erlaubt. Die resultierenden Filterfunktionen (17)

Hr (2)=---, Hg (z)=--- ' 1-λrz-1 } 1-X„z~1 für Xr = 0,99608 und Xq = 0,99843 und eine Abtastrate von 16 kHz sind in Fig. 3a dargestellt. Man kann sehen, dass das Verhältnis von 7m {n) und qm (n) bei geringeren Frequenzen beeinflusst wird, das heißt für langsam sich ändernde Korrelation und Leistung, wogegen für raschere Änderungen (über * 10Hz) das Verhältnis verglichen mit den Schätzungen mit Xr = Xq unge-ändert bleibt. Unter der Annahme, dass diese Parameter sich für das Sprachsignal rascher ändern (unter der Annahme beispielsweise einer Phonemrate von 10 pro Sekunde) als für das Geräuschsignal (stationäres oder langsam sich mit der Zeit änderndes Geräusch) wird das sich ergebende Lattice Prädiktionsfilter die Sprachsignalkomponente gut Vorhersagen, wogegen die Geräuschkomponente unterdrückt wird.

Was impulsartige Geräusche betrifft, kann man vorsehen, das Verhältnis zwischen Korrelation und Leistungsschätzung auch für hohe Frequenzen zu reduzieren, was beispielsweise durch Verwendung eines zweiten Pols in dem Tiefpassfilter für die Korrelation H(z) erfolgen kann. Eine entsprechende Übertragungsfunktion ist in Fig. 3b dargestellt.

Im Einzelnen zeigen die Figuren 3a und b die Frequenzgänge eines Tiefpassfilters für eine Fehlerkorrelation H^z) (ausgezogene Linien) und die Varianz Hq{z) (punktierte Linien) für in Fig. a zwei einpolige Tiefpassfilter mit Xr = 0,99608 und Xq = 0,99843 bzw. Figur 3b einen einpoligen Tiefpass für die Leistungsschätzung von q(n) mit Xq = 0,99843 und einen zweipoligen Tiefpass für die Korrelationsschätzung 7(n) mit in = 0,99608 und Xa - 0,9. Je größer der Abstand zwischen den beiden Übertragungsfunktionen umso stärker ist die Geräuschunterdrückung.

Um eine gute Reduzierung des Geräusches zu erreichen, kann unter diesen Umständen die Ordnung M des LP Filters überraschend niedrig gewählt werden, sogar niedriger als die üblicherweise zur Modellierung der spektralen Hüllkurve von Sprachsignalen verwendete Ordnung. Beispielsweise wurde in dem in Fig. 4a gezeigten Beispiel ein Prädiktor mit der Ordnung M = 10 für ein Signal mit einer Abtastrate von 16 kHz verwendet. Dieses Beispiel enthält ein mehrmaliges Auftreten von starken, nicht stationären Geräuschbursts, die dank der Erfindung gut beseitigt werden. Das gezeigte Geräusch stammt aus einer Fabrikhallen-Umgebung, das heißt einer äußerst ungünstigen akustischen Umgebung.

Die Wirksamkeit der Geräuschunterdrückung kann gesteuert werden durch die Einstellung unterschiedlicher Werte für Xr (bzw. Xr1 und Xr2) und Xq. Wobei diese in Abhängigkeit von der Signalleistung und der Geräuschleistung gewählt werden: (Xr ,Xq )=f(a2x ,σ2 ),bzw.(/lr1 ,Xr2 ,Xq )=g(a2 ,σ2 ). (18)

Weiters ist es zweckmäßig, die Wirksamkeit der Geräuschunterdrückung anhand einer Schätzung der Sprachaktivität zu steuern. Bei der Verwendung eines LP-Fehler-Filters bietet sich (vgl. auch [5]) die Schätzung der wahrscheinlichen Sprachaktivität als reeller Zahl im Wertebereich von 0 bis 1 anhand der Leistungen des Filtereingangssignals und des Filterausgangssignals an:

Claims

1 0 AT 504 164 B1 E{y2{n)}-E{e2[n)} E{e2 (n)} für ein Lattice Filter ist eine mögliche Auswertung der Erwartungswerte gegeben durch γ_?0 (Ό~<7μ-1 in) Qm-1 (n) Zur Steuerung der Geräuschunterdrückung kann dann ein Faktor kn ~ 1 K für das Ausgangssignal des Lattice Filters e(n), und/oder ein Faktor kg = K für das Ausgangssignal verwendet werden. Das LP-Fehler-Filter kann als Filter in direkter Filterform (DFF) ausgebildet sein, welches aus dem Eingangssignal ein Prädiktionssignal an seinem Ausgang erzeugt, wobei ein Subtrahierer das Prädiktionssignal vom Eingangssignal abzieht und somit das Ausgangssignal des LP-Fehler-Filters e(n) erzeugt. Die verzögerten Abtastwerte des Eingangssignals (vgl. Gleichung 1) sowie das Ausgangssignal des Subtrahierers e(n) entsprechen den internen Signalen des LP-Fehler-Filters. Ein wichtiges Merkmal der erfindungsgemäßen Geräuschunterdrückung besteht in der an die Eigenschaften des Sprach- und des Geräuschsignales angepassten Auswertung der Erwartungswertoperatoren und damit der optimalen Einstellung der Filterkoeffizienten für das lineare Prädiktionsfilter, sowie in der Sprachaktivitätsschätzung und deren Verwendung bei der Schätzung des Geräuschsignals, und zur Steuerung der Wirksamkeit der Geräuschunterdrückung und der Amplitude des Ausgangssignales. Wenngleich es klar sein sollte, dass der Rechenaufwand mit der gewählten Filterordnung steigt und daher der Rechenaufwand unter Umständen größer sein kann, als jener bei Verwendung einer schnellen Fouriertransformation, liegt ein wesentlicher Vorteil der Erfindung darin, dass sie eine Geräuschreduktion ohne Verzögerung des Sprachsignals ermöglicht, was ein besonderer Vorteil ist, vor allem beim Einsatz in Hörgeräten. Patentansprüche: 1. Vorrichtung zur Geräuschunterdrückung mit einer linearen Prädiktions-Analysierschaltung mit einem LP-Fehler-Filter (LFF), das auf Basis eines ersten, von Geräusch überlagerten Sprachsignals y(n) = x(ri) + ε(η) ein LP-Fehler-Filter Ausgangssignal e{n) erzeugt, einer Koeffizientenberechnungseinheit (KBE), welche die Koeffizienten des LP-Fehler-Filters auf Basis der internen Signale (inklusive des Ein- und Ausgangssignals y{n) und e(n)) des LP-Fehler-Filters aktualisiert, und einer Subtrahiereinheit, welche das LP-Fehler-Filter Ausgangssignal e{n) von dem ersten Sprachsignal y{n) in einem Subtrahierer subtrahiert und nach der Subtraktion den Rest als zweites Sprachsignal x(n)=y(n)-e(n) ausgibt, in welchem das Geräusch unterdrückt ist, dadurch gekennzeichnet, dass eine Geräuschschätzungseinheit (GSE) vorgesehen ist, welche auf Basis der internen Signale des LP-Fehler-Filters ein Geräuschleistungssignal σ2 und ein Sprachleistungssignal 1 1 AT 504 164 B1 σχ2, erzeugt, diese Signale der Koeffizientenberechnungseinheit (KBE) zugeführt sind und von dieser im Sinne einer Optimierung der Geräuschunterdrückung berücksichtigt werden.

2. Vorrichtung zur Geräuschunterdrückung mit einer linearen Prädiktions-Analysierschaltung mit einem LP-Fehler-Filter, das auf Basis eines ersten, von Geräusch überlagerten Sprachsignals y(n) = x(n) + ε(η) ein LP-Fehler-Filter Ausgangssignal e(n) erzeugt, einer Koeffizientenberechnungseinheit, welche die Koeffizienten des LP-Fehler-Filters auf Basis der internen Signale des LP-Fehler-Filters aktualisiert, und einer Subtrahiereinheit, welche das LP-Fehler-Filter Ausgangssignal von dem ersten Sprachsignal subtrahiert und nach der Subtraktion den Rest als zweites Sprachsignal ausgibt, x(n)=y(n)-e(n) in welchem das Geräusch unterdrückt ist, dadurch gekennzeichnet, dass eine Sprachaktivitätsschätzungseinheit (SAE) vorgesehen ist, welche auf Basis der internen Signale des LP-Fehler-Filters ein Sprachaktivitätssignal v erzeugt, das der Koeffizientenberechnungseinheit (KBE) zugeführt ist und von dieser im Sinne einer Optimierung der Geräuschunterdrückung berücksichtigt wird.

3. Vorrichtung zur Geräuschunterdrückung mit einer linearen Prädiktions-Analysierschaltung mit einem LP-Fehler-Filter, das auf Basis eines ersten, von Geräusch überlagerten Sprachsignals ein LP-Fehler-Filter Ausgangssignal erzeugt, einer Koeffizientenberechnungseinheit, welche die Koeffizienten des LP-Fehler-Filters auf Basis der internen Signale des LP-Fehler-Filters aktualisiert, und einer Subtrahiereinheit, welche das LP-Fehler-Filter Ausgangssignal von dem ersten Sprachsignal subtrahiert und nach der Subtraktion den Rest als zweites Sprachsignal ausgibt, in welchem das Geräusch unterdrückt ist, dadurch gekennzeichnet, dass eine Geräuschschätzungseinheit (GSE) sowie eine Sprachaktivitätsschätzungseinheit (SAE) vorgesehen sind, beiden Einheiten die internen Signale des LP-Fehler-Filters zugeführt sind und die Einheiten auf deren Basis ein Geräuschleistungssignal σ„, ein Sprach-leistungssignal σχ2, und ein Sprachaktivitätssignal »/erzeugen, welche der Koeffizientenberechnungseinheit (KBE) zugeführt sind und von dieser im Sinne einer Optimierung der Geräuschunterdrückung berücksichtigt werden.

4. Vorrichtung nach Anspruch 2 oder 3, dadurch gekennzeichnet, dass die Sprachaktivitäts-schätzungseinheit (SAE) einen Geräuschunterdrückungsfaktor (kn) bildet, welcher einem Eingang eines ersten Multiplizierers (MU1) zugeführt ist und dessen anderem Eingang das Ausgangssignal des LP-Fehler-Filters zugeführt ist und der vor dem Subtrahierer (SUB) liegt.

5. Vorrichtung nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, dass die Sprach-aktivitätsschätzungseinheit (SAE) einen Gesamtsignalfaktor (kg) bildet, welcher einem Eingang eines zweiten Multiplizierers (MU2) zugeführt ist dessen anderem Eingang das Ausgangssignal des Subtrahierers (SUB) zugeführt ist.

6. Vorrichtung nach Anspruch 1 bis 5, dadurch gekennzeichnet, dass das LP-Fehler-Filter aus einem Lattice Filter (Fig. 1) besteht; wobei die Vorwärts- und Rückwärtsfehlersignale die internen Signale des LP-Fehler-Filters darstellen.

7. Vorrichtung nach Anspruch 1 bis 5, dadurch gekennzeichnet, dass das LP-Fehler-Filter als Filter in direkter Filterform (DFF) aus dem Eingangssignal ein Prädiktionssignal an seinem Ausgang erzeugt, und ein Subtrahierer das Prädiktionssignal vom Eingangssignal abzieht und somit das Ausgangssignal des LP-Fehler-Filters e(n) erzeugt; wobei die verzögerten Abtastwerte des Eingangssignals (vgl. Gleichung 1) sowie das Ausgangssignal des Subtrahierers e(n) den internen Signalen des LP-Fehler-Filters entsprechen.

8. Vorrichtung nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass die Koeffi- 1 2 AT 504 164 B1 zientenberechnungseinheit (KBE) dazu eingerichtet ist, die korrigierte Fehlervarianz q0 gemäß <7o =do ~σπ und den korrigierten Reflexionskoeffizienten k gemäß

zu ermitteln.

9. Vorrichtung nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass die Koeffizientenberechnungseinheit (KBE) dazu eingerichtet ist, die Fehlerkorrelation gemäß rm {η)=λΓ7„, (n-l)+fm {n)bm (n-1) und die Fehlervarianz gemäß dm {nhÄqdm in)+bm (""1)) zu ermitteln.

10. Vorrichtung nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass für die Leistungsschätzung von q(n) ein einpoliger Tiefpass und ein für die Korrelationsschätzung r{n) zweipoliger Tiefpass vorgesehen ist.

11. Kaskade, bestehend aus zumindest zwei hintereinander geschalteten Vorrichtungen nach einem der Ansprüche 1 bis 9. Hiezu 3 Blatt Zeichnungen