EP0912974B1 - Verfahren zur verringerung von störungen eines sprachsignals - Google Patents

Verfahren zur verringerung von störungen eines sprachsignals Download PDF

Info

Publication number
EP0912974B1
EP0912974B1 EP97930489A EP97930489A EP0912974B1 EP 0912974 B1 EP0912974 B1 EP 0912974B1 EP 97930489 A EP97930489 A EP 97930489A EP 97930489 A EP97930489 A EP 97930489A EP 0912974 B1 EP0912974 B1 EP 0912974B1
Authority
EP
European Patent Office
Prior art keywords
masking curve
noise
signal
spectral
masking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
EP97930489A
Other languages
English (en)
French (fr)
Other versions
EP0912974A1 (de
Inventor
Peter SCHRÖGMEIER
Tim Haulick
Klaus Linhard
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daimler AG
Original Assignee
DaimlerChrysler AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DaimlerChrysler AG filed Critical DaimlerChrysler AG
Publication of EP0912974A1 publication Critical patent/EP0912974A1/de
Application granted granted Critical
Publication of EP0912974B1 publication Critical patent/EP0912974B1/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Definitions

  • the invention relates to a method for reducing Interference with a speech signal.
  • Measures to suppress "musical tones" at the spectral subtraction are the overestimation of the interference power overcompensation of the disturbance with the disadvantage the increased speech distortion or allowing one relatively high noise level with the disadvantage of only one low noise reduction (e.g. "Enhancement of Speech Corrupted by Acoustic Noise "by Berouti, M .; Schwartz, R .; Makhoul, J .; in Proceedings on ICASSP, pp. 208-211, 1979).
  • Methods for linear or non-linear smoothing and thus to suppress the "musical tones” e.g. in “Suppression of Acoustic Noise in Speech Using Spectral Subtraction "by S.F. Boll in IEEE Vol. ASSP-27, No. 2, pp. 113-120.
  • An effective non-linear Smoothing with median filtering is in the DE 44 05 723 A1 specified.
  • the object of the present invention is an improved Method of reducing speech signal interference specify.
  • the invention is essentially based on the fact that signal components, which can only be heard individually through noise reduction appear, recognized as disturbances and afterwards reduced or eliminated by selective damping become.
  • the audibility criterion is in is known to exceed a masking curve (masking threshold).
  • fl as the predeterminable basic value (also spectral floor), which represents a lower bound for the filter coefficients and is usually 0.1 ⁇ fl ⁇ 0.25. He decides one in the output signal of the spectral subtraction remaining amount of residual noise that the lowering of the Listening threshold limited and so narrowband portions in noise-reduced output signal of the spectral subtraction partially covered. Compliance with a core value fl improves the subjective hearing impression.
  • a characteristic used in the method according to the invention is that they in the output signal of the noise reduction process for that human ear perceptible as a disturbance in appearance to step.
  • the second concealment curve makes it noticeable quantified for this output signal become.
  • the level threshold of second concealment curve exceeding language useful portions in the output signal, which is already in the input signal as exceeding the level of the first masking curve
  • the musical tones can be perceived by comparison the perceptible signal components in the output signal and input signal noise reduction as new audible components distinguished and in a subsequent processing step be selectively damped selectively.
  • the invention is not for spectral subtraction Noise reduction limited.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Description

Die Erfindung betrifft ein Verfahren zur Verringerung von Störungen eines Sprachsignals.
Ein derartiges Verfahren kann vorteilhaft Anwendung zur Störbefreiung von Sprachsignalen für sprachliche Kommunikation, insbesondere Freisprechanlagen z.B. in Kraftfahrzeugen, Spracherkennungssystemen und ähnlichem finden.
Ein häufig verwandtes Verfahren zur Reduktion des Geräuschanteils in störungsbehafteten Sprachsignalen ist die sogenannte spektrale Subtraktion. Dieses Verfahren hat den Vorteil der einfachen aufwandsarmen Implementierung und einer deutlichen Geräuschreduktion.
Eine unangenehme Begleiterscheinung der Geräuschreduktion mittels spektraler Subtraktion ist das Auftreten von kurzzeitig hörbaren tonalen Geräuschanteilen, die aufgrund des vermittelten Höreindrucks als "musical tones" oder "musical noise" bezeichnet werden.
Maßnahmen zur Unterdrückung von "musical tones" bei der spektralen Subtraktion sind die Überschätzung der Störleistung also die Überkompensation der Störung mit dem Nachteil der erhöhten Sprachverzerrung oder das Zulassen eines relativ hohen Geräuschsockels mit dem Nachteil einer nur geringen Geräuschreduktion (z.B. "Enhancement of Speech Corrupted by Acoustic Noise" von Berouti, M.; Schwartz, R.; Makhoul, J.; in Proceedings on ICASSP, pp. 208-211, 1979). Verfahren zur linearen oder nichtlinearen Glättung und damit zur Unterdrückung der "musical tones" werden z.B. in "Suppression of Acoustic Noise in Speech Using Spectral Subtraction" von S.F. Boll in IEEE Vol. ASSP-27, Nr. 2, pp. 113-120 beschrieben. Ein effektives nichtlineares Glättungsverfahren mit Medianfilterung ist in der DE 44 05 723 A1 angegeben.
Bekannt sind auch Verfahren welche zusätzlich zu der spektralen Subtraktion die psychoakustische Wahrnehmung mitberücksichtigen (z.B. T. Petersen und S. Boll, "Acoustic Noise Suppression in a Peceptual Model" in Proc. on ICASSP, pp. 1086-1088, 1981). Die Signale werden in den Bereich der psychoakustischen Lautheit transformiert um so eine gehörgerechtere Verarbeitung durchzuführen. Von D.
Tsoukalas, P. Paraskevas und M. Mourjopoulos wird in "Speech Enhancement Using Psychoacoustic Criteria", Proc. on ICASSP, pp. II359-II362, 1993 und von G. Virag in "Speech Enhancement Based on Masking Properties of the Auditory System", Proc. on ICASSP, pp. 796-799, 1995, wird die errechnete Verdeckungskurve dazu benutzt, festzustellen, welche Spektrallinien vom Nutzsignal verdeckt sind und somit nicht gedämpft werden müssen. Die Qualität des Sprachsignals wird damit verbessert. Die störenden "musical tones" werden damit aber nicht verringert.
Aufgabe der vorliegenden Erfindung ist es, ein verbessertes Verfahren zur Verringerung von Störungen eines Sprachsignals anzugeben.
Die Erfindung ist im Patentanspruch 1 beschrieben. Die Unteransprüche enthalten vorteilhafte Ausgestaltungen und Weiterbildungen der Erfindung.
Die Erfindung basiert im wesentlichen darauf, daß Signalanteile, die erst durch die Geräuschreduktion einzeln hörbar in Erscheinung treten, als Störungen erkannt und nachträglich durch selektive Dämpfung verringert oder beseitigt werden. Als Hörbarkeitskriterium wird dabei in an sich bekannter Weise das Überschreiten einer Verdeckungskurve (masking threshold) herangezogen.
Die Bestimmung von Verdeckungskurven ist z.B. aus Teilen des eingangs genannten Standes der Technik, in ausführlicher allgemeiner Form auch z.B. aus Sound Engineering, Kap. 2., Psychoakustik und Geräuschbeurteilung (S. 10-33), Expert Verlag 1994 bekannt. Die Bestimmung der Verdeckungskurven kann sowohl auf der Basis der aktuellen Sprachsignale als auch auf der Basis eines Geräuschsignals in Sprachpausen erfolgen, wobei verschiedene psychoakustische Effekte mit berücksichtigt werden können. Die Verdeckungskurven, die auch als Maskierungskurven, Mithörschwellen, masking threshold und ähnlich in der Fachliteratur bezeichnet sind, können als eine frequenzabhängige Pegelschwelle für die Wahrnehmbarkeit eines schmalbandigen Tons angesehen werden.
Derartige Verdeckungskurven werden neben den Anwendungen zur Störbefreiung z.B. auch zur Datenreduktion bei der Kodierung von Audiosignalen eingesetzt. Eine ausführliche Vorgehensweise zur Bestimmung einer Verdeckungskurve ist neben den bereits genannten Veröffentlichungen auch z.B. aus "Transform Coding of Audio Signals Using Perceptual Noise Criteria" von J. Johnston in IEEE Journal on Select Areas Commun., Vol. 6, pp. 314-323, Febr. 1988 entnehmbar. Wesentliche Schritte eines typischen Verfahrens zur Bestimmung einer Verdeckungskurve aus dem Kurzzeitspektrum eines gestörten Sprachsignals sind insbesondere
  • Kritische Bandanalyse, bei welcher das Spektrum eines Signals in sogenannte kritische Bänder aufgeteilt und aus dem Leistungsspektrum P(i) durch Aufsummierung innerhalb der kritischen Bänder ein kritisches Band-Spektrum B(n) (auch Bark-Spektrum, mit n als Bandindex) gewonnen wird
  • Faltung des Bark-Spektrums mit einer Verbreiterungsfunktion (Spreading-Funktion) zur Berücksichtigung der Verdeckungseffekte über mehrere kritische Bänder hinweg; man erhält ein modifiziertes Bark-Spektrum
  • evtl. zusätzliche Berücksichtigung der unterschiedlichen Verdeckungseigenschaften von rauschhaften und tonhaften Anteilen durch einen aus der Zusammensetzung des Signals bestimmten Offsetfaktor
  • Nach Renormierung im Verhältnis zur jeweiligen Energie in den kritischen Bändern und ggf. Anhebung tieferliegender Werte auf die Werte der Ruhehörschwelle ergibt sich eine barkbezogene Verdeckungskurve T(n) und daraus eine frequenzbezogene Verdeckungskurve V(i) mit V(i) = T(n) für alle Frequenzen i innerhalb des jeweiligen kritischen Bandes n
Mit der bestimmten Verdeckungskurve V(i) können die Spektralanteile des Signales durch Vergleich des Leistungsspektrums P(i) mit der Verdeckungskurve V(i) in hörbare, (P(i) > V(i)) und verdeckte (P(i) < V(i)) Anteile unterschieden werden.
Die Erfindung ist nachfolgend anhand von Beispielen unter Bezugnahme auf die Abbildungen noch eingehend veranschaulicht. Dabei zeigt
FIG. 1
ein Blockschaltbild eines Standardverfahrens zur spektralen Subtraktion
FIG. 2
ein Blockschaltbild zu einem Verfahren nach der Erfindung
FIG. 3
ein Sprachsignal in verschiedenen Stufen des erfindungsgemäßen Signalverarbeitungsverfahrens.
Die Verfahren zur spektralen Subtraktion beruhen auf der Verarbeitung des Kurzzeitbetragsspektrums des gestörten Eingangssignals. In Sprachpausen wird das Störleistungsspektrum geschätzt und anschließend gleichphasig vom gestörten Eingangssignal subtrahiert. Diese Subtraktion wird üblicherweise als Filterung durchgeführt. Durch die Filterung erfolgt eine Gewichtung der gestörten Spektralkomponenten mit einem reellen Faktor, in Abhängigkeit vom geschätzten Signal-zu-Rauschverhältnis des jeweiligen Spektralbandes. Die Geräuschreduktion ergibt sich demnach dadurch, daß gestörte spektrale Bereiche des Nutzungssignals im Verhältnis ihres Störanteils gedämpft werden. Ein vereinfachtes Blockdiagram in FIG. 1 zeigt eine typische Realisierung des Spektralsubtraktionsalgorithmus. In einer Analysestufe erfolgt die Zerlegung des gestörten Sprachsignals, beispielsweise durch eine diskrete Fourier Transformation (DFT), in eine Reihe von Kurzzeitspektren Y(i). Aus den Fourier-Koeffizienten bildet die Einheit KM einen Kurzzeitmittelwert, der einen Schätzwert für die mittlere Leistung Y2(1) mit i als diskretem Frequenzindex des gestörten Eingangssignals darstellt. In einer Einheit LM erfolgt, gesteuert durch den Sprachpausendetektor SP, die Schätzung eines mittleren Störleistungsspektrums N2(1) in den sprachsignalfreien Abschnitten. Jede Spektrallinie Y(i) des Eingangssignals wird anschließend mit einem reellen Filterkoeffizienten H(i) multipliziert, der aus dem Kurzzeitmittelwert Y2(1) und dem Störleistungsmittelwert N2(1) in der Einheit FK berechnet wird. Der Verfahrensschritt der Geräuschreduktion ist als Multiplikationsstufe GR eingezeichnet. Durch eine inverse diskrete Fourier Transformation (IDFT) ergibt sich am Ausgang der Synthesestufe das geräuschreduzierte Sprachsignal.
Die Berechnung der Filterkoeffizienten H(i) kann nach unterschiedlichen, an sich bekannten Gewichtungsregeln erfolgten. Typisch ist die Schätzung der Koeffizienten nach H(i) = max { (1- N2(i)/Y2(i)), fl }
Mit fl als vorgebbarem Grundwert (auch spectral floor), der eine untere Schranke für die Filterkoeffizienten darstellt und üblicherweise 0,1 < fl < 0,25 beträgt. Er bestimmt einen im Ausgangssignal der spektralen Subtraktion verbleibenden Restgeräuschanteil, der das Absenken der Mithörschwelle begrenzt und so schmalbandige Anteile im geräuschreduzierten Ausgangssignal der spektralen Subtraktion teilweise verdeckt. Die Einhaltung eines Grundwerts fl verbessert den subjektiven Höreindruck.
Zur Verdeckung aller Reststörungen der Art der "musical tones" müßte ein Grundwert von ca. 0,5 gewählt werden, wodurch die maximal erreichbare Geräuschreduktion auf etwa 6dB beschränkt wäre.
Ein bei dem erfindungsgemäßen Verfahren genutztes charakteristisches Merkmal von musical tones ist, daß sie erst im Ausgangssignal des Geräuschreduktionsverfahrens für das menschliche Ohr wahrnehmbar als Störung in Erscheinung treten. Die Wahrnehmbarkeit kann durch die zweite Verdeckungskurve für dieses Ausgangssignal quantitativ erfaßt werden. Gegenüber den gleichfalls die Pegelschwelle der zweiten Verdeckungskurve überschreitenden Sprach-Nutzanteilen im Ausgangssignal, die auch bereits im Eingangssignal als Pegelüberschreitung der ersten Verdeckungskurve wahrnehmbar sind, können die musical tones durch Vergleich der wahrnehmbaren Signalanteile im Ausgangssignal und Eingangssignal der Geräuschreduktion als neue hörbare Anteile unterschieden und in einem nachfolgenden Verarbeitungsschritt gezielt selektiv gedämpft werden.
Das erfindungsgemäße Verfahren zur Detektion und Unterdrückung von schmalbandigen Störungen wie musical tones ist anhand des Blockschaltbildes in FIG. 2 erläutert. Es stellt eine Erweiterung des in FIG. 1 dargestellten Standardverfahrens zur spektralen Subtraktion dar. Soweit das skizzierte Verfahren in FIG. 2 mit dem in FIG. 1 skizzierten bekannten Verfahren übereinstimmt, sind gleiche Bezugszeichen verwandt. Aus den Eingangssignalen Y(i) der Geräuschreduktion GR wird in einer Einheit VE eine erste Verdeckungskurve V1(i) bestimmt. Aus den Ausgangssignalen Y'(i) der Geräuschreduktion wird in VA eine zweite Verdeckungskurve V2(i) bestimmt.
Alternativ dazu kann die erste Verdeckungskurve V1(i) auch aus dem mittleren Störleistungsspektrum am Eingang der Geräuschreduktion in Sprachpausen bestimmt werden. Die zweite Verdeckungskurve kann auch aus der ersten Verdeckungskurve abgeleitet werden, z.B. durch Multiplikation mit dem Grundwert fl, V2(i) = fl° Vl(i).
Der Vorteil der Bestimmung der Verdeckungskurven aus den aktuellen Eingangs- und Ausgangssignalen der Geräuschreduktion besteht insbesondere darin, daß auch instationäre Geräuschanteile sowie die verdeckende Wirkung der Sprachanteile mitberücksichtigt werden. Wird dagegen die erste Verdeckungskurve aus dem mittleren Störleistungsspektrum ermittelt und die zweite Verdeckungskurve näherungsweise nach V2(i) = fl·V1(1) bestimmt, so ergibt sich eine erhebliche Verringerung der Rechenaufwands. Der Rechenaufwand kann weiter dadurch verringert werden, daß die Verdeckungskurve wesentlich weniger oft aktualisiert werden muß, da das mittlere Störleistungsspektrum in der Regel nur langsam zeitveränderlich ist. Das qualitativ bessere synthetisierte Sprachsignal wird aber mit der Bestimmung der Verdeckungskurven aus den aktuellen Signalen Y(i), Y'(i) erzielt.
Eine vorteilhafte Weiterbildung der Erfindung sieht eine weitere Verbesserung durch Detektion von stationären Signalanteilen, die von der selektiven Dämpfung ausgenommen werden, auch wenn sie das Kriterium nur im Ausgangssignal Y'(i) wahrnehmbar zu sein, erfüllen. In FIG. 2 ist hierfür ein Stationaritätsdetektor STAT eingezeichnet.
Er kann auf verschiedene Arten realisiert werden, beispielsweise durch die zeitliche Verfolgung einzelner Spektrallinien oder auch der Filterkoeffizienten. Eine einfache Realisierungsform ergibt sich mit der Forderung, daß mehrere zeitlich aufeinanderfolgende Filterkoeffizienten jeweils einen bestimmten Schwellwert thrstat überschreiten müssen, so daß gilt: Hk-n(i),..., Hk-l(i), Hk(i) > thrstat, mit z.B. n=2 und thrstat= 0,35.
Im Entscheider ENT werden zunächst mit Hilfe der zweiten Verdeckungskurve V2(i) hörbare tonale Komponenten im Ausgangssignal des Geräuschreduktionsystems ermittelt. Handelt es sich hierbei nicht um eine stationäre Komponente, wird untersucht, ob der Spektralanteil schon vor der Filterung (Geräuschreduktion) hörbar war. Dies erfolgt unter Verwendung der ersten Verdeckungskurve Vl(i). Wird der Frequenzanteil im Eingangssignal Y(i) als verdeckt festgestellt, wird die Spektralkomponente im Ausgangssignal als musical tone angenommen und in einer Nachverarbeitungsstufe NV gedämpft. Im anderen Fall, d.h. bei Nichtverdeckung im Eingangssignal wird auf Sprache entschieden und keine zusätzliche Dämpfung vorgenommen.
Die zusätzliche Dämpfung in der Nachverarbeitung kann auf verschiedene Weise erfolgen. So kann z.B. für eine als Störung erkannte neu hörbare spektrale Komponente der Pegelwert auf den Wert der zweiten Verdeckungskurve gesetzt werden. Vorzugsweise wird der detektierte Pegelwert der störenden spektralen Komponente auf einen korrigierten Wert gesetzt, der sich aus der Filterung der spektral entsprechenden Eingangssignalkomponente mit dem Grundwert fl als Filterkoeffizient ergibt.
In FIG. 3 sind verschiedene Stadien der Signalverarbeitung für ein gestörtes Sprachsignal nach dem erfindungsgemäßen Verfahren skizziert.
FIG. 3A zeigt ein Leistungsspektrum P(i) eines gestörten Signals am Eingang der Geräuschreduktion sowie eine daraus bestimmte erste Verdeckungskurve V1(i) mit der Verdeckungskurve übersteigenden Signalanteilen s. Nach Durchführung der spektralen Subtraktion ergibt sich ein geräuschreduziertes Leistungsspektrum P'(i) = Y'2(i) mit einer daraus bestimmten zweiten Verdeckungskurve V2(i) in welcher neben den auch in FIG. 3A die Verdeckungskurve V1(i) überschreitenden Signalanteilen s weitere Signalanteile m als die zweite Verdeckungsschwelle überschreitend auftreten, die als nicht verdeckte und somit neu hörbare Signalanteile nach Art der musical tones erscheinen. Diese neu hörbaren Signalanteile können detektiert und durch selektive Dämpfung ohne Beeinträchtigung der Sprachanteile s unterdrückt werden. Das sich bei der selektiven Dämpfung ergebende Leistungsspektrum P"(i) ist in FIG. 3C skizziert. Nur die als Sprachsignale bewerteten Signalanteile s übersteigen die Verdeckungskurve, wobei diese Signale nunmehr um ein weit größeres Maß über der Verdeckungskurve V2(i) liegen als die entsprechenden Anteile im Eingangssignal über der dort geltenden Verdeckungskurve V1(i) (FIG. 3A) und somit deutlicher hörbar sind. Die musical tones m aus FIG. 3B sind im Pegel unter die Verdeckungskurve V2(i) gedrückt und somit nicht mehr als individuelle Töne wahrnehmbar.
Die Erfindung ist nicht auf die spektrale Subtraktion zur Geräuschreduktion beschränkt. Das Verfahren, die Verdeckungskurven am Eingang und am Ausgang einer Geräuschreduktion zu ermitteln und aufgrund neu hörbarer Anteile am Ausgang Störungen zu detektieren und zu unterdrücken, läßt sich auch auf andere Signalverarbeitungssysteme, z.B. zur Signalkodierung übertragen.

Claims (9)

  1. Verfahren zur Verringerung von Störungen eines Sprachsignals, bei welchem ein Geräuschreduktionsverfahren eingesetzt und die spektrale psychoakustische Verdeckung mit berücksichtigt wird, dadurch gekennzeichnet, daß eine erste spektrale Verdeckungskurve für das Eingangssignal und eine zweite spektrale Verdeckungskurve für das Ausgangssignal des Geräuschreduktionsverfahrens bestimmt werden, daß die zweite Verdeckungskurve übersteigende neu hörbare Anteile des Ausgangssignals des Geräuschreduktionsverfahrens, denen keine spektral entsprechenden, die erste Verdeckungskurve übersteigenden Anteile des Eingangssignals gegenüberstehen, zusätzlich selektiv gedämpft werden.
  2. Verfahren nach Anspruch 1, gekennzeichnet durch ein spektrales Subtraktionsverfahren als Geräuschreduktionsverfahren.
  3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß die neu hörbaren Anteile auf ihren Grundwert der spektralen Subtraktion reduziert werden.
  4. Verfahren nach Anspruch 1 oder Anspruch 2, dadurch gekennzeichnet, daß die neu hörbaren Anteile auf ihren Wert der spektralen Verdeckungskurve reduziert werden.
  5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß über ein vorgebbares Zeitintervall statische neu hörbare Anteile des Ausgangssignals von der zusätzlichen selektiven Dämpfung ausgenommen werden.
  6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die zweite Verdeckungskurve aus dem Ausgangssignal der Geräuschreduktionsverfahrens bestimmt wird.
  7. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die zweite Verdeckungskurve aus der ersten Verdeckungskurve abgeleitet wird.
  8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß die erste Verdeckungskurve aus dem Eingangssignal des Geräuschreduktionsverfahrens bestimmt wird.
  9. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß die erste Verdeckungskurve aus Geräuschsignalen in Sprachpausen bestimmt wird.
EP97930489A 1996-07-19 1997-07-02 Verfahren zur verringerung von störungen eines sprachsignals Expired - Lifetime EP0912974B1 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE19629132A DE19629132A1 (de) 1996-07-19 1996-07-19 Verfahren zur Verringerung von Störungen eines Sprachsignals
DE19629132 1996-07-19
PCT/EP1997/003482 WO1998003965A1 (de) 1996-07-19 1997-07-02 Verfahren zur verringerung von störungen eines sprachsignals

Publications (2)

Publication Number Publication Date
EP0912974A1 EP0912974A1 (de) 1999-05-06
EP0912974B1 true EP0912974B1 (de) 2000-04-12

Family

ID=7800259

Family Applications (1)

Application Number Title Priority Date Filing Date
EP97930489A Expired - Lifetime EP0912974B1 (de) 1996-07-19 1997-07-02 Verfahren zur verringerung von störungen eines sprachsignals

Country Status (8)

Country Link
US (1) US6687669B1 (de)
EP (1) EP0912974B1 (de)
JP (1) JP4187795B2 (de)
AT (1) ATE191806T1 (de)
CA (1) CA2260893C (de)
DE (2) DE19629132A1 (de)
ES (1) ES2146107T3 (de)
WO (1) WO1998003965A1 (de)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7062039B1 (en) 1999-05-27 2006-06-13 Telefonaktiebolaget Lm Ericsson Methods and apparatus for improving adaptive filter performance by inclusion of inaudible information
US7117149B1 (en) * 1999-08-30 2006-10-03 Harman Becker Automotive Systems-Wavemakers, Inc. Sound source classification
DE19957220A1 (de) * 1999-11-27 2001-06-21 Alcatel Sa An den aktuellen Geräuschpegel adaptierte Geräuschunterdrückung
US6473733B1 (en) * 1999-12-01 2002-10-29 Research In Motion Limited Signal enhancement for voice coding
JP3566197B2 (ja) * 2000-08-31 2004-09-15 松下電器産業株式会社 雑音抑圧装置及び雑音抑圧方法
US7457750B2 (en) 2000-10-13 2008-11-25 At&T Corp. Systems and methods for dynamic re-configurable speech recognition
US20040078199A1 (en) * 2002-08-20 2004-04-22 Hanoh Kremer Method for auditory based noise reduction and an apparatus for auditory based noise reduction
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7725315B2 (en) * 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7949522B2 (en) * 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US8073689B2 (en) 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US7895036B2 (en) * 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US7406412B2 (en) * 2004-04-20 2008-07-29 Dolby Laboratories Licensing Corporation Reduced computational complexity of bit allocation for perceptual coding
US7680652B2 (en) 2004-10-26 2010-03-16 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US8170879B2 (en) * 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US8543390B2 (en) * 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US8306821B2 (en) * 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
US7949520B2 (en) * 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US7716046B2 (en) * 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US7610196B2 (en) * 2004-10-26 2009-10-27 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
DE102005001345B4 (de) * 2004-11-10 2013-01-31 Ask Industries Gmbh Verfahren und Vorrichtung zur Verarbeitung und Wiedergabe von Audiosignalen
US8284947B2 (en) * 2004-12-01 2012-10-09 Qnx Software Systems Limited Reverberation estimation and suppression system
US8027833B2 (en) 2005-05-09 2011-09-27 Qnx Software Systems Co. System for suppressing passing tire hiss
US8170875B2 (en) 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
US8311819B2 (en) * 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
JP4738213B2 (ja) * 2006-03-09 2011-08-03 富士通株式会社 利得調整方法及び利得調整装置
US7844453B2 (en) 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
US8326620B2 (en) 2008-04-30 2012-12-04 Qnx Software Systems Limited Robust downlink speech and noise detector
US8335685B2 (en) * 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
US20080231557A1 (en) * 2007-03-20 2008-09-25 Leadis Technology, Inc. Emission control in aged active matrix oled display using voltage ratio or current ratio
DE102007030209A1 (de) * 2007-06-27 2009-01-08 Siemens Audiologische Technik Gmbh Glättungsverfahren
US8904400B2 (en) * 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
US8850154B2 (en) 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8694310B2 (en) 2007-09-17 2014-04-08 Qnx Software Systems Limited Remote control server protocol system
US8209514B2 (en) * 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
US8135140B2 (en) 2008-11-20 2012-03-13 Harman International Industries, Incorporated System for active noise control with audio signal compensation
US9020158B2 (en) * 2008-11-20 2015-04-28 Harman International Industries, Incorporated Quiet zone control system
US8718289B2 (en) * 2009-01-12 2014-05-06 Harman International Industries, Incorporated System for active noise control with parallel adaptive filter configuration
US8189799B2 (en) * 2009-04-09 2012-05-29 Harman International Industries, Incorporated System for active noise control based on audio system output
US8199924B2 (en) * 2009-04-17 2012-06-12 Harman International Industries, Incorporated System for active noise control with an infinite impulse response filter
US8077873B2 (en) * 2009-05-14 2011-12-13 Harman International Industries, Incorporated System for active noise control with adaptive speaker selection
US9280964B2 (en) * 2013-03-14 2016-03-08 Fishman Transducers, Inc. Device and method for processing signals associated with sound

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
DE3805946A1 (de) * 1988-02-25 1989-09-07 Fraunhofer Ges Forschung Vorrichtung zur ermittlung von charakteristischen parametern aus den eingangs- und ausgangssignalen eines systems fuer die audiosignalverarbeitung
US5400409A (en) * 1992-12-23 1995-03-21 Daimler-Benz Ag Noise-reduction method for noise-affected voice channels
DE4307688A1 (de) * 1993-03-11 1994-09-15 Daimler Benz Ag Verfahren zur Geräuschreduktion für gestörte Sprachkanäle
ES2137355T3 (es) * 1993-02-12 1999-12-16 British Telecomm Reduccion de ruido.
EP0707763B1 (de) * 1993-07-07 2001-08-29 Picturetel Corporation Verringerung des hintergrundrauschens zur sprachverbesserung
JP3131542B2 (ja) * 1993-11-25 2001-02-05 シャープ株式会社 符号化復号化装置
WO1995016259A1 (en) * 1993-12-06 1995-06-15 Philips Electronics N.V. A noise reduction system and device, and a mobile radio station
DE4405723A1 (de) * 1994-02-23 1995-08-24 Daimler Benz Ag Verfahren zur Geräuschreduktion eines gestörten Sprachsignals

Also Published As

Publication number Publication date
WO1998003965A1 (de) 1998-01-29
EP0912974A1 (de) 1999-05-06
CA2260893C (en) 2005-05-17
ATE191806T1 (de) 2000-04-15
JP2002509620A (ja) 2002-03-26
US6687669B1 (en) 2004-02-03
JP4187795B2 (ja) 2008-11-26
DE19629132A1 (de) 1998-01-22
DE59701446D1 (de) 2000-05-18
ES2146107T3 (es) 2000-07-16
CA2260893A1 (en) 1998-01-29

Similar Documents

Publication Publication Date Title
EP0912974B1 (de) Verfahren zur verringerung von störungen eines sprachsignals
DE69428119T2 (de) Verringerung des hintergrundrauschens zur sprachverbesserung
EP1143416B1 (de) Geräuschunterdrückung im Zeitbereich
DE69420027T2 (de) Rauschverminderung
DE69803203T2 (de) Verfahren und vorrichtung zur rauschunterdrückung eines digitalen sprachsignals
DE112012000052B4 (de) Verfahren und Vorrichtung zum Ausblenden von Windgeräuschen
DE60131639T2 (de) Vorrichtungen und Verfahren zur Bestimmung von Leistungswerten für die Geräuschunterdrückung für ein Sprachkommunikationssystem
DE69630580T2 (de) Rauschunterdrücker und Verfahren zur Unterdrückung des Hintergrundrauschens in einem verrauschten Sprachsignal und eine Mobilstation
DE19747885B4 (de) Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
DE102014100407B4 (de) Geräuschminderungsvorrichtungen und Geräuschminderungsverfahren
DE112009000805B4 (de) Rauschreduktion
DE69738288T2 (de) Einrichtung zur unterdrückung einer störenden komponente eines eingangssignals
DE60116255T2 (de) Rauschunterdückungsvorrichtung und -verfahren
DE69531710T2 (de) Verfahren und Vorrichtung zur Verminderung von Rauschen bei Sprachsignalen
DE602004008973T2 (de) Rauschminderung für die automatische spracherkennung
DE69124005T2 (de) Sprachsignalverarbeitungsvorrichtung
EP1088300B1 (de) Verfahren zur durchführung einer maschinengestützten beurteilung der übertragungsqualität von audiosignalen
DE102013011761A1 (de) Kraftfahrzeug mit einer Freisprecheinrichtung und Verfahren zur Erzeugung eines Frequenzganges für Freisprecheinrichtungen
DE10157535B4 (de) Verfahren und Vorrichtung zur Reduzierung zufälliger, kontinuierlicher, instationärer Störungen in Audiosignalen
DE102019102414B4 (de) Verfahren und System zur Detektion von Reibelauten in Sprachsignalen
EP0669606B1 (de) Verfahren zur Geräuschreduktion eines gestörten Sprachsignals
DE10137348A1 (de) Verfahren und Schaltungsanordnung zur Geräuschreduktion bei der Sprachübertragung in Kommunikationssystemen
DE69804329T2 (de) Verfahren und vorrichtung zur rauschunterdrückung eines digitalen sprachsignals
DE3230391C2 (de)
DE4445983C2 (de) Verfahren zur Rauschunterdrückung und Vorrichtungen zur Durchführung der Verfahren

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 19981205

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT CH DE ES FR GB IT LI

GRAG Despatch of communication of intention to grant

Free format text: ORIGINAL CODE: EPIDOS AGRA

17Q First examination report despatched

Effective date: 19990722

GRAG Despatch of communication of intention to grant

Free format text: ORIGINAL CODE: EPIDOS AGRA

GRAH Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOS IGRA

GRAH Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOS IGRA

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

ITF It: translation for a ep patent filed
AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AT CH DE ES FR GB IT LI

REF Corresponds to:

Ref document number: 191806

Country of ref document: AT

Date of ref document: 20000415

Kind code of ref document: T

RIC1 Information provided on ipc code assigned before grant

Free format text: 7G 10L 21/02 A, 7G 10L 11/00 B

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

REG Reference to a national code

Ref country code: CH

Ref legal event code: NV

Representative=s name: KIRKER & CIE SA

REF Corresponds to:

Ref document number: 59701446

Country of ref document: DE

Date of ref document: 20000518

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 20000522

REG Reference to a national code

Ref country code: ES

Ref legal event code: FG2A

Ref document number: 2146107

Country of ref document: ES

Kind code of ref document: T3

ET Fr: translation filed
PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed
REG Reference to a national code

Ref country code: GB

Ref legal event code: IF02

REG Reference to a national code

Ref country code: CH

Ref legal event code: PUE

Owner name: HARMAN BECKER AUTOMOTIVE SYSTEMS GMBH

Free format text: DAIMLERCHRYSLER AG#EPPLESTRASSE 225#70567 STUTTGART (DE) -TRANSFER TO- HARMAN BECKER AUTOMOTIVE SYSTEMS GMBH#BECKER-GOERING-STRASSE 16#76307 KARLSBAD (DE)

REG Reference to a national code

Ref country code: FR

Ref legal event code: TP

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: ES

Payment date: 20090727

Year of fee payment: 13

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: CH

Payment date: 20090728

Year of fee payment: 13

Ref country code: AT

Payment date: 20090721

Year of fee payment: 13

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: IT

Payment date: 20090729

Year of fee payment: 13

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20100731

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20100731

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: AT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20100702

Ref country code: IT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20100702

REG Reference to a national code

Ref country code: ES

Ref legal event code: FD2A

Effective date: 20110818

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: ES

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20100703

REG Reference to a national code

Ref country code: DE

Ref legal event code: R082

Ref document number: 59701446

Country of ref document: DE

Representative=s name: GRUENECKER, KINKELDEY, STOCKMAIR & SCHWANHAEUS, DE

REG Reference to a national code

Ref country code: DE

Ref legal event code: R082

Ref document number: 59701446

Country of ref document: DE

Representative=s name: GRUENECKER PATENT- UND RECHTSANWAELTE PARTG MB, DE

Effective date: 20120411

Ref country code: DE

Ref legal event code: R082

Ref document number: 59701446

Country of ref document: DE

Representative=s name: GRUENECKER, KINKELDEY, STOCKMAIR & SCHWANHAEUS, DE

Effective date: 20120411

Ref country code: DE

Ref legal event code: R081

Ref document number: 59701446

Country of ref document: DE

Owner name: NUANCE COMMUNICATIONS, INC. (N.D.GES.D. STAATE, US

Free format text: FORMER OWNER: HARMAN BECKER AUTOMOTIVE SYSTEMS GMBH, 76307 KARLSBAD, DE

Effective date: 20120411

REG Reference to a national code

Ref country code: FR

Ref legal event code: TP

Owner name: NUANCE COMMUNICATIONS, INC., US

Effective date: 20120924

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20160729

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20160727

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20160930

Year of fee payment: 20

REG Reference to a national code

Ref country code: DE

Ref legal event code: R071

Ref document number: 59701446

Country of ref document: DE

REG Reference to a national code

Ref country code: GB

Ref legal event code: PE20

Expiry date: 20170701

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION

Effective date: 20170701