WO2008031124A1 - Vorrichtung zur geräuschunterdrückung bei einem audiosignal - Google Patents

Vorrichtung zur geräuschunterdrückung bei einem audiosignal Download PDF

Info

Publication number
WO2008031124A1
WO2008031124A1 PCT/AT2007/000424 AT2007000424W WO2008031124A1 WO 2008031124 A1 WO2008031124 A1 WO 2008031124A1 AT 2007000424 W AT2007000424 W AT 2007000424W WO 2008031124 A1 WO2008031124 A1 WO 2008031124A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
noise
filter
error filter
error
Prior art date
Application number
PCT/AT2007/000424
Other languages
English (en)
French (fr)
Inventor
Erhard Rank
Gernot Kubin
Original Assignee
Technische Universität Graz
Forschungsholding Tu Graz Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Technische Universität Graz, Forschungsholding Tu Graz Gmbh filed Critical Technische Universität Graz
Priority to US12/440,952 priority Critical patent/US20100049507A1/en
Priority to AT07800169T priority patent/ATE495523T1/de
Priority to EP07800169A priority patent/EP2080197B1/de
Priority to DE502007006264T priority patent/DE502007006264D1/de
Publication of WO2008031124A1 publication Critical patent/WO2008031124A1/de

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Definitions

  • LFF linear prediction analyzing circuit with an LP error filter
  • noise suppression in audio signals is becoming increasingly important, such as in the telephony, the automatic speech recognition or, as just one of many other examples, in digital hearing aids.
  • Sounds to be suppressed are primarily non-white noise, nonstationary sounds, and strong impulsive noises.
  • Noise suppression methods for audio signals have become known in a wide variety, and examples include: methods in which quiet audio signals are first raised and later lowered again, such as pre-demo phase for broadcasting or Dolby noise suppression methods for sound carrier recordings. Further, spectral subtraction method in which e.g. in pauses in the conversation the noise is estimated and then subtracted from the input signal.
  • the latter methods also include Wiener filters as well as Ephraim-Malah filters with adaptive amplification for signals split into several transformation channels.
  • Wiener filters as well as Ephraim-Malah filters with adaptive amplification for signals split into several transformation channels.
  • the known methods are in part not very effective because they emanate from a very simplified model of the noise signal, or they result due to a block-wise processing of the input signal to artifacts, which are noticeable as unpleasant noise, as so-called Music Tones, in the Signal remain after noise reduction. Many methods also result in a relatively large delay in the output signal.
  • the prior art from which the present invention is based is linear prediction filters (LP filters), in direct or in lattice form, in which properties of the entire input signal are used to adjust the filter coefficients.
  • a corresponding device as disclosed, for example, in US 2001/0005822 A1, consists of a lattice filter to which an input signal y (n) is fed, which has a voice / audio component and a noise component.
  • a coefficient calculation unit KBE is provided, which feeds the forward and reverse error signals, which in the first stage also contain the input signal.
  • the coefficient calculation unit then always provides the filter with updated filter coefficients in order to minimize the prediction error.
  • Noise reduction using linear prediction filters is also disclosed, inter alia, in GB 1 520 148 A or in US Pat. No. 4,587,620.
  • the methods and devices of the prior art always start from the input signal without the special characteristics of the speech signal on the one hand and the noise on the other hand being taken into account.
  • the input signal is used there to determine the coefficients for the prediction filter (units 212 or 312 and 318) and, on the basis of these coefficients, an estimate of the speech signal is then carried out, using an additional voice activity estimation unit (FIG. VAD, unit 232 or 332), an estimate of the noise signal, namely in a unit 234 or 334, takes place by means of a further second filter (unit 240 or 340) to perform a noise suppression.
  • FOG. VAD additional voice activity estimation unit
  • the essential features are that the estimation of the coefficients of the linear prediction filter (unit 214) or of the linear prediction filters (units 314 and 320 in FIG. 3) can only be realized by using the input signal (or the error signal of the first prediction filter e ST (FIG. n) (path 316)).
  • a speech activity estimation is performed independently of the linear prediction filter 214 from the linear prediction filters 314 and 320, and that the actual noise suppression filter (units 240 and 340, respectively) is not itself a linear prediction filter.
  • the noise estimate (“update noise model”) is based only on the prediction error (see claim 1 of US Pat. No. 7,065,468), whereas, as described below, in the invention the noise estimation is based on the internal signals of the LP error signal. This difference can also be seen with reference to Fig. 2 of US 7,065,468.
  • US Pat. No. 7,065,468 shows a structure which already differs from the state of the art according to US 2001/0005822 A1 and which, moreover, is more complex compared to the invention.
  • US Pat. No. 7,065,468 is used to shade another route which would lead the person skilled in the art, to whom US 2001/0005822 A1 is known and who has set himself the task underlying the invention, in a direction other than that of the invention.
  • AIs publications in this area are further mentioned below:
  • An object of the invention is to provide a device or a method for noise suppression for audio signals, in particular for voice signals, which provides a virtually instantaneous output audio signal, which also carries no annoying artifacts.
  • a noise estimation unit which generates a noise power signal and a voice power signal on the basis of the internal signals of the LP error filter, these signals are fed to the coefficient calculation unit and from there is taken into account in the sense of optimizing the noise suppression and / or a voice activity estimation unit is provided which generates a voice activity signal based on the internal signals of the LP error filter, which is supplied to the coefficient calculation unit and are considered by this in the sense of optimizing the noise suppression.
  • the voice activity estimation unit forms a noise suppression factor k n , which is supplied to an input of a first multiplier and to whose other input the output signal of the LP error filter is fed and which lies before the subtractor. It may also be advantageous if the voice activity estimation unit forms a total signal factor k g which is supplied to an input of a second multiplier whose other input is supplied with the output signal of the subtractor.
  • the LP error filter consists of a lattice filter (FIG. 1), the forward and backward error signals representing the internal signals of the LP error filter.
  • the LP error filter to generate a prediction signal at its output as a filter in direct filter form from the input signal, and a subtractor subtracts the prediction signal from the input signal and thus output the output signal of the LP error filter e (FIG. n) generated; wherein the delayed samples of the input signal (see Equation 1) and the output of the subtracter (1) correspond to the internal signals of the LP error filter.
  • the coefficient calculation unit is set up in accordance with the corrected error variance ⁇ 0
  • a single-pole low-pass filter and a two-pole low-pass filter for the correlation estimation r (yn) may be provided for the power estimation of q (n).
  • another variant of the invention provides a cascade which consists of at least two devices connected in series, which are designed in accordance with the abovementioned inventive features.
  • Fig. 5 is a block diagram of a basic device for noise relief according to the prior art
  • FIG. 6 is a block diagram of a first embodiment of a device according to the invention.
  • Fig. 7 is a block diagram of a second embodiment of a device according to the invention.
  • Fig. 8 is a block diagram of a third embodiment of a device according to the invention.
  • Linear prediction is usually applied to a speech signal x (n), for example to reduce the variance of a speech signal for its transmission.
  • x n
  • FIR finite impulse response
  • M means the order of the LP filter and h (n) the filter coefficients estimated on the basis of the signal characteristics and frame by frame, e.g. refreshed every 10 ms.
  • Algorithms which directly yield the coefficients bi (n) for the filter are the so-called “autocorrelation method” or the "co-variant method”.
  • a direct FIR filter just described which is e.g. Claim equal, is the already mentioned lattice filter, which has a direct relation to the human vocal tract [I].
  • f m (n) and b m (n) denote the forward and backward errors in the stage m at time n and k, n (n) the reflection coefficients of the filter.
  • the reflection coefficients in (2) and (3) are different, but here identical reflection coefficients are used for forward and backward.
  • a lattice filter as just described is shown schematically.
  • claim 6 refers to such a filter.
  • the forward error in stage M is the prediction error signal of the LP filter:
  • Optimal reflection coefficients k m for minimizing the root mean square of the prediction error of an undistorted signal are given as:
  • the expected value operators E in (6) and (7) are evaluated using low-pass filtered instantaneous values of f m (n) b m (n - ⁇ ) and f "+) + b ⁇ n ⁇ n-1, for example using single-pole recursive low pass filter ("lossy integration", lossy integration, see below).
  • x (n) is the speech component and ⁇ (n) is an additive background noise component.
  • the object of the noise reduction is to provide a good estimate for the speech signal component x ( ⁇ ). For the present single-channel case, this estimation is based solely on the observation of the noisy signal y ( ⁇ ) i. no additional information is used, such as a second signal from a microphone which only picks up the background noise.
  • x (n) is the estimate of the speech component mite (n) (N). Compare equation (4).
  • a reduction in the amount of reflection coefficients can be made by deriving estimators for r m and q m which minimize the mean square estimation error.
  • estimators for r m and q m which minimize the mean square estimation error.
  • the additional noise signal be white noise with the variance ⁇ " 2 , which is also valid with x (n) should not be correlated. This represents the least informed model (maximum entropy).
  • the resulting error in the values of the reflection factors is shown in FIG. More specifically, values of the reflection coefficient / ci calculated from the noisy signal without correction are illustrated as a function of an a priori signal / noise ratio for different values of the autocorrelation p xx (l) of the undisturbed signal x (n).
  • An estimate of the noise power ⁇ n 2 can be made on the basis of the power of the output signal e (n) of the LP error filter,
  • the invention now provides a method and a device with which, based on simple assumptions about the change in the correlation and the power of the speech and noise signals after the time receives a correction of the Reflekomsf actuators.
  • the estimates of the error correlation (6) and the error variance (7) are usually based on a low-pass filtering of the instantaneous values. Often a single-pole low-pass filtering (lossy integration) is also used:
  • the order M of the LP filter can be chosen to be surprisingly low, even lower than the order usually used to model the spectral envelope of speech signals.
  • This example contains a repeated occurrence of strong, non-stationary noise bursts, which are well eliminated by the invention.
  • the noise shown comes from a factory hall environment, that is a very unfavorable acoustic environment.
  • the effectiveness of the noise suppression can be controlled by setting different values for ⁇ r (or ⁇ r i and ⁇ fi) and ⁇ ⁇ . These are selected depending on the signal power and the noise power:
  • the LP error filter may be formed as a filter in direct filter form (DFF), which generates from the input signal a prediction signal at its output, wherein a subtractor subtracts the prediction signal from the input signal and thus the output of the LP error filter e (n ) generated.
  • DFF direct filter form
  • An important feature of the noise suppression according to the invention consists in the evaluation of the expectation operators adapted to the characteristics of the speech and the noise signal and thus the optimal adjustment of the filter coefficients for the linear prediction filter, as well as in the voice activity estimation and their use in the estimation of the noise signal, and for control the effectiveness of the noise cancellation and the amplitude of the output signal.
  • a significant advantage of the invention is that it allows a noise reduction without delay of the speech signal, which is a particular advantage, especially when used in hearing aids.

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Noise Elimination (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Eine Vorrichtung zur Geräuschunterdrückung mit einer linearen Prädiktions- Analysierschaltung mit einem LP-Fehler-Filter (LFF), das auf Basis eines ersten, von Geräusch überlagerten Sprachsignals y(n) = x(n) + ε(n) ein LP-Fehler-Filter-Ausgangssignal e(n) erzeugt, einer Koeffizientenberechnungseinheit (KBE), welche die Koeffizienten des LP-Fehler-Filters auf Basis der internen Signale (inklusive des Ein- und Ausgangssignals y(n) und e(n)) des LP-Fehler- Filters aktualisiert, und einer Subtrahiereinheit, welche das LP-Fehler-Filter-Ausgangssignal e(n) von dem ersten Sprachsignal y(n) in einem Subtrahierer subtrahiert und nach der Subtraktion den Rest als zweites Sprachsignal x(n) = y(n) - e(n) ausgibt, in welchem das Geräusch unterdrückt ist, wobei eine Geräuschschätzungseinheit (GSE) vorgesehen ist, welche auf Basis der internen Signale des LP-Fehler-Filters ein Geräuschleistungssignal σn2 und ein Sprachleistungssignal σx2 erzeugt, diese Signale der Koeffizientenberechnungseinheit (KBE) zugeführt sind und von dieser im Sinne einer Optimierung der Geräuschunterdrückung berücksichtigt werden.

Description

VORRICHTUNG ZUR GERÄUSCHUNTERDRÜCKUNG BEI EINEM AUDIOSIGNAL
Die Erfindung bezieht sich auf eine Vorrichtung zur Geräuschunterdrückung mit einer linearen Prädiktions-Analysierschaltung mit einem LP-Fehler-Filter (LFF), das auf Basis eines ersten, von Geräusch überlagerten Sprachsignals 1/(71) = x(ή) + ε(n) ein LP-Fehler-Filter Ausgangssignal e(n) erzeugt, einer Koeffizientenberechnungseinheit, welche die Koeffizienten des LP-Fehler-Filters auf Basis der internen Signale (inklusive des Ein- und Ausgangssignals y(n) und ein)) des LP-Fehler-Filters aktualisiert, und einer Subtrahiereinheit, welche das LP-Fehler-Filter Ausgangssignal e(n) von dem ersten Sprachsignal y(n) in einem Subtrahierer subtrahiert und nach der Subtraktion den Rest als zweites Sprachsignal xΛ(n) = y(n) - e(n) ausgibt, in welchem das Geräusch unterdrückt ist.
Die Geräuschunterdrückung bei Audiosignalen, insbesondere auch bei Sprachsignalen gewinnt immer mehr an Bedeutung, so in der Telephonie, der automatischen Spracherkennung oder, als nur eines von vielen weiteren Beispielen, bei digitalen Hörgeräten. Geräusche, die es zu unterdrücken gilt, sind in erster Linie nicht-weißes Rauschen, nichtstationäre Geräusche und stark irnpulsartige Geräusche.
Verfahren zur Geräuschunterdrückung für Audiosignale sind in einer großen Vielfalt bekannt geworden und als Beispiele seien genannt: Verfahren, bei welchen leise Audiosignale zunächst angehoben und später wieder abgesenkt werden, wie Pre-/Deemphase für den Rundfunk oder die Dolby-Rauschunterdrückungsverfahren für Tonträgeraufzeichnungen. Weiters Verfahren der spektralen Subtraktion, bei welchen z.B. in Gesprächspausen das Geräusch geschätzt und dann von dem Eingangssignal abgezogen wird. Zu den letztgenannten Verfahren zählen auch Wiener-Filter sowie Ephraim-Malah Filter mit adaptiver Verstärkung für in mehrere Transformationskanäle aufgespaltete Signale. Die bekannten Verfahren sind zum Teil nicht sehr wirkungsvoll, da sie von einem sehr vereinfachten Modell des Geräuschsignals ausgehen, oder sie führen auf Grund einer blockweisen Verarbeitung des Eingangssignals zu Artefakten, die sich als unangenehme Nebengeräusche bemerkbar machen, als so genannte Musical Tones, die im Signal nach der Geräuschreduktion verbleiben. Viele Verfahren führen auch zu einer relativ großen Verzögerung des Ausgangssignals.
Der Stand der Technik, von welchem die vorliegende Erfindung ausgeht, sind lineare Prädiktionsfilter (LP Filter), in direkter oder in Lattice-Form (Kreuzglied Kettenfilter), bei welchen Eigenschaften des gesamten Eingangssignals zur Einstellung der Filterkoeffizienten herangezogen werden. Eine entsprechende Vorrichtung, wie z.B. in der US 2001/0005822 Al geoffenbart, besteht aus einem Lattice Filter, dem ein Eingangssignal y(n) zugeführt ist, welches eine Sprach/ Audiokomponente sowie eine Geräuschkomponente aufweist. Für die Einstellung der Komponenten ist eine Koeffizientenberechnungseinheit KBE vorgesehen, welcher die Vorwärts- und Rückwärtsfehlersignale, diese beinhalten in der ersten Stufe auch das Eingangssignal, zugeführt werden. Die Koeffizienteriberechnungeinheit liefert dem Filter sodann immer im Sinne einer Minimierung des Prädiktionsfehlers aktualisierte Filterkoeffi- zienten. Eine Geräuschreduktion unter Verwendung linearer Prädiktionsfilter ist unter anderem auch in der GB 1 520 148 A oder in der US 4, 587, 620 geoffenbart. Die Verfahren bzw. Vorrichtungen nach dem Stand der Technik gehen immer von dem Eingangssignal aus, ohne dass die besonderen Eigenschaften des Sprachsignals einerseits und des Geräusches andererseits Berücksichtigung finden.
Bei der Vorrichtung nach der US 7, 065,468 wird dort das Eingangssignal dazu herangezogen, die Koeffizienten für das Prädiktionsfilter zu bestimmen (Einheit 212 bzw. 312 und 318) und aufgrund dieser Koeffizienten erfolgt dann eine Schätzung des Sprachsignals wobei - unter Verwendung einer zusätzlichen Sprachaktivitätsschätzungseinheit (VAD, Einheit 232 bzw. 332) eine Schätzung des Geräuschsignals, nämlich in einer Einheit 234 bzw. 334 dazu erfolgt, mittels eines weiteren zweiten Filters (Einheit 240 bzw. 340) eine Geräuschunterdrückung vorzunehmen.
Wesentliche Merkmale sind dabei, dass die Schätzung der Koeffizienten des linearen Prädik- tionsfilters (Einheit 214) bzw. der linearen Prädiktionsfilter (Einheit 314 und 320 in Fig.3) nur unter Verwendung des Eingangssignals (bzw. des Fehlersignals des ersten Prädiktionsfilters e ST(n) (Pfad 316)) vorgenommen wird. Ein weiterer wesentlicher Unterschied zur Erfindung liegt darin, dass eine Sprachaktivitätsschätzung unabhängig vom linearen Prädiktionsfilter 214 von den linearen Prädiktionsfiltern 314 und 320 ausgeführt wird, sowie, dass das eigentliche Filter zur Geräuschunterdrückung (Einheit 240 bzw. 340) selbst kein lineares Prädiktionsfilter darstellt. Dabei erfolgt die Geräuschschätzung („Update Noise Model") nur auf der Basis des Prädiktionsfehlers (vgl. Anspruch 1 der US 7, 065,468), wogegen, wie weiter unten beschrieben, bei der Erfindung die Geräuschschätzung anhand der internen Signale des LP-Fehler-Filters durchgeführt wird. Dieser Unterschied ist auch an Hand der Fig. 2 der US 7, 065,468 ersichtlich.
Insgesamt zeigt die US 7, 065,468 eine Struktur, die sich bereits von dem Stand der Technik nach der US 2001/0005822 Al unterscheidet und die noch dazu - verglichen mit der Erfindung - aufwändiger ist. In der US 7, 065,468 wird letztlich ein anderer Weg beschatten, der den Fachmann, dem die US 2001/0005822 Al bekannt ist und der sich die der Erfindung zugrunde liegende Aufgabe gestellt hat, in eine andere Richtung als jene der Erfindung führen würde. AIs Publikationen auf diesem Gebiet seien weiters nachstehend genannt:
[1] J. D. Markel and A. H. Gray, Jr., Linear Prediction of Speech. Berlin, Heidelberg, New York: Springer, 1976.
[2] J. I. Makhoul and L.K. Cosell, "Adaptive lattice analysis of Speech," IEEE Transactions on Acoustics, Speech, and Signal Processing, vol. 29, pp.654— 659, June 1981.
[3] M. L. Honig and D. G. Messerschmitt, Adaptive Filters: Structures, Algorithms, and Applications. Boston-The Hague-London-Lancaster: Kluwer Academic Publishers, 1984.
[4] A. Kawamura, K. Fujii, Y. Itoh, and Y. Fukui, "A noise reduction method based on linear prediction analysis," Electronics and Communications in Japan, Part 3, vol. 86, no. 3, pp. I- 10, 2003.
[5] M. H. Sävoji, "Effective noise reduction of Speech signals using adaptive lattice filtering, segmentation and soft decision," in ZEE Colloquium on New Directions in Adaptive Signal Processing, pp. 7/1-7/5, Feb. 1993.
Eine Aufgabe der Erfindung liegt in der Schaffung einer Vorrichtung bzw. eines Verfahrens zur Geräuschunterdrückung für Audiosignale, insbesondere für Sprachsignale, welche ein praktisch unverzögertes Ausgangs-Audiosignal liefert, das auch keine störenden Artefakte mit sich führt.
Diese Aufgabe wird mit einer Vorrichtung der eingangs genannten Art gelöst, bei welcher erfindungsgemäß eine Geräuschschätzungseinheit vorgesehen ist, welche auf Basis der internen Signale des LP-Fehler-Filters ein Geräuschleistungssignal und ein Sprachleistungs- signal erzeugt, diese Signale der Koeffizientenberechnungseinheit zugeführt sind und von dieser im Sinne einer Optimierung der Geräuschunterdrückung berücksichtigt wird und/ oder eine Sprachaktivitätsschätzungseinheit vorgesehen ist, welche auf Basis der internen Signale des LP-Fehler-Filters ein Sprachaktivitätssignal erzeugt, das der Koeffizientenberechnungseinheit zugeführt ist und von dieser im Sinne einer Optimierung der Geräuschunterdrückung berücksichtigt werden.
Bei einer zweckmäßigen Weiterbildung der Erfindung ist vorgesehen, dass die Sprachaktivi- tätsschätzungseinheit einen Geräuschunterdrückungsfaktor kn bildet, welcher einem Eingang eines ersten Multiplizierers zugeführt ist und dessen anderem Eingang das Ausgangssignal des LP-Fehler-Filters zugeführt ist und der vor dem Subtrahierer liegt. Es kann weiters vorteilhaft sein, wenn die Sprachaktivitätsschätzungseinheit einen Gesamtsignalfaktor kg bildet, welcher einem Eingang eines zweiten Multiplizierers zugeführt ist dessen anderem Eingang das Ausgangssignal des Subtrahierers zugeführt ist.
Bei einer praxisgerechten Variante kann man vorsehen, dass das LP-Fehler-Filter aus einem Lattice Filter (Fig. 1) besteht, wobei die Vorwärts- und Rückwärtsfehlersignale die internen Signale des LP-Fehler-Filters darstellen.
Andererseits ist es mit Vorteil auch möglich, dass das LP-Fehler-Filter als Filter in direkter Filterform aus dem Eingangssignal ein Prädiktionssignal an seinem Ausgang erzeugt, und ein Subtrahierer das Prädiktionssignal vom Eingangssignal abzieht und somit das Ausgangssignal des LP-Fehler-Filters e(n) erzeugt; wobei die verzögerten Abtastwerte des Eingangssignals (vgl. Gleichung 1) sowie das Ausgangssignal des Subtrahierers ein) den internen Signalen des LP-Fehler-Filters entsprechen.
Bei einer anderen vorteilhaften Variante ist vorgesehen, dass die Koeffizientenberechnungseinheit dazu eingerichtet ist, die korrigierte Fehlervarianz ^0 gemäß
und den korrigierten Reflexionskoeffizienten k gemäß
= _IL = r 0
- <
zu ermitteln.
Wieder eine weitere zweckmäßige Variante zeichnet sich dadurch aus, dass die Koeffizientenberechnungseinheit dazu eingerichtet ist, die Fehlerkorrelation gemäß
Un) = λrrm{n-l) + fM(n)bm{n-l)
und die Fehlervarianz gemäß
Un) = λ9qm(n-l) + fa(n) + bM >(n-l))
zu ermitteln. Bei einer günstigen Ausführung kann für die Leistungsschätzung von q(n) ein einpoliger Tiefpass und ein für die Korrelationsschätzung r^yn) zweipoliger Tiefpass vorgesehen sein.
Zur Verbesserung der Geräuschunterdrückung bei entsprechend erhöhtem Aufwand sieht eine weitere Variante der Erfindung eine Kaskade vor, die aus zumindest zwei hintereinander geschalteten Vorrichtungen besteht, welche entsprechen der oben genannten Erfindungsmerkmale ausgebildet sind.
Die Erfindung samt weiteren Vorteile ist im folgenden an Hand beispielsweiser Ausführungsformen näher erläutert, die in der Zeichnung veranschaulicht sind. Ln dieser zeigen
Fig. 1 ein Lattice-Filter nach dem Stand der Technik,
Fig. 2 aus dem geräuschbehafteten Signal ohne Korrektur berechnete Werte des Reflexionskoeffizienten in einem Diagramm,
Fig. 3 a und b den Frequenzgang von im Rahmen der Erfindung verwendeten Tiefpässen,
Fig. 4 an Hand des zeitlichen Verlaufes sowie des Spektrogramms eines geräuschbehafteten Eingangssignal (oben) und dessen Geräuschbefreiung (unten) nach der Erfindung,
Fig. 5 das Blockschaltbild einer prinzipiellen Vorrichtung zur Geräuschbefreiung nach dem Stand der Technik
Fig. 6 das Blockschaltbild einer ersten Ausführungsform einer Vorrichtung nach der Erfindung,
Fig. 7 das Blockschaltbild einer zweiten Ausführungsform einer Vorrichtung nach der Erfindung und
Fig. 8 das Blockschaltbild einer dritten Ausführungsform einer Vorrichtung nach der Erfindung.
Lineare Prädiktion wird üblicherweise auf ein Sprachsignal x(n) angewendet, beispielsweise um die Varianz eines Sprachsignals für dessen Übertragung zu reduzieren. Um einen Signalwert vorher zu sagen, werden langsam zeitveränderliche FIR-Filter (finite impulse response filter, Filter mit endlicher Impulsantwort) niedriger Ordnung verwendet:
Figure imgf000008_0001
Hier bedeuten M die Ordnung des LP-Filters und h(n) die Filterkoeffizienten, die auf Basis der Signaleigenschaften geschätzt und rahmenweise, z.B. alle 10 ms, aufgefrischt werden. Algorithmen welche die Koeffizienten bi(n) für das Filter direkt ergeben sind das so genannte „Autokorrelationsverfahren" oder das „Ko varianzverfahren". Die zur Modellierung der spektralen Hüllkurve üblicherweise verwendete Filterordnung liegt, abhängig von der Abtastrate, bei M = 10...20.
Ein dem eben beschriebenen direkten FIR-Filter, auf welches sich z.B. Patentanspruch 7 bezieht, ebenbürtiges ist das bereits genannte Lattice-Filter, welches einen unmittelbaren Bezug zum menschlichen Stimmtrakt besitzt [I].
Charakterisiert ist ein solches Filter durch die Gleichungen
Figure imgf000008_0002
/.(») = L-An) + *■»_,-. M), (2)
*■(«) = C(»-1) + *.W/*-i W • (3)
welche zu jedem Zeitpunkt n für alle Gliederstufen m = 1...M berechnete werden. Dabei bedeuten fm(n) und bm(n) den Vorwärts- bzw. Rückwärts-Fehler in der Stufe m zur Zeit n und k,n(n) die Reflexionskoeffizienten des Filters. Hier sei angemerkt, dass bei einer verallgemeinerten Darstellung die Reflexionskoeffizienten in (2) und (3) unterschiedlich sind, hier jedoch gleiche Reflexionskoeffizienten für vorwärts und rückwärts verwendet werden. In Fig. 1 ist ein Lattice-Filter wie eben beschrieben schematisch dargestellt. Auf ein solches Filter bezieht sich beispielsweise Patentanspruch 6.
Der Vorwärtsfehler in der Stufe M ist das Vorhersage-Fehlersignal des LP-Filters:
Figure imgf000008_0003
Optimale Reflexionskoeffizienten km zur Minimierung des quadratischen Mittelwertes des Vorhersagefehlers eines unverzerrten Signals ergeben sich als:
Figure imgf000009_0001
mit den erwarteten Werten für Vorwärts- und Rückwärts- Fehlerkorrelation bzw. Leistung zu:
r,M = E{fm(n) bm (n -1)}, (6)
Figure imgf000009_0002
Üblicherweise werden die Erwartungswertoperatoren E in (6) und (7) unter Verwendung Tiefpass-gefilterter Augenblickswerte von fm(n)bm(n — \) bzw. f„ ψ) + b^n\n -l) ausgewertet, beispielsweise mit Hilfe einpoliger rekursiver Tiefpassfilter („lossy Integration", verlustbehaftete Integration, siehe weiter unten).
Somit erfolgt das Adaptieren des Lattice-Filters zur Formung des sich langsam ändernden Eingangs-Sprachsignals durch Berechnung der Gleichungen (6), (7) und (5) für jeden Zeitpunkt H nach dem Filtern - im Gegensatz zur dem rahmenweisen Aktualisieren der Koeffizienten bei der direkten Form des LP-Filters entsprechend Gleichung (1).
Was die Geräuschverminderung betrifft, sei angenommen, dass ein beobachtetes Signal y(n) eines additiven linearen Geräuschmodells vorliege:
y(n) = x(n) + ε(n), (8)
wobei x(n) die Sprachkomponente und ε(n) eine additive Hintergrund-Geräuschkomponente sei. Gegenstand der Geräuschreduktion ist es, eine gute Schätzung für die Sprachsignal- Komponente x(ή) zu liefern. Für den vorliegenden einkanaligen Fall beruht diese Schätzung ausschließlich auf der Beobachtung des geräuschbehafteten Signals y(ή) d.h. es wird keine zusätzliche Information verwendet, wie beispielsweise ein zweites Signal eines Mikrophons, welches lediglich die Hintergrundgeräusche aufnimmt.
Eine Verringerung des Hintergrundgeräusches in Sprachsignalen unter Verwendung linearer Prädiktionsfilterung kann auf der Annahme basieren, dass die Sprachsignalkomponente gut vorhersagbar ist, wogegen die Geräuschkomponente diese Eigenschaft nicht besitzt. Somit kann das vorher gesagte Signal xψ) als Schätzung für die Sprachkomponente genommen werden. Während bei den Prädiktionsfiltern in der direkten Form in Gleichung (1) der Ausgang unmittelbar das vorhergesagte Signal ist, wird bei den Lattice-Filtern x{n) wirksam, als die Differenz zwischen dem Eingangssignal und dem Ausgang des Vorwärts- Prädiktionspfades berechnet:
x{n) = y(n) - e(n) (9)
x(n)ist die Schätzung der Sprachkomponente mite (n)
Figure imgf000010_0001
(n). Vergleiche Gleichung (4).
Wenn man ein Lattice-LP-Filter für die Geräuschverminderung nach A. Kawamura et al. verwendet, wo ein Filter hoher Ordnung (N = 256) benutzt wird, um die spektrale Feinstruktur der Sprache zu modellieren, kann man beobachten, dass rm(n) eine große Varianz aufgrund der Geräuschsignalkomponente in den höheren Filterstufen aufweist. Es wird vorgeschlagen, die entsprechende Varianz der Reflektionskoeffizienten dadurch zu reduzieren, dass man einen festen (großen) Wert für die Leistungsschätzungen qm{n) = G verwendet. Die Verringerung des Betrags der Reflektionskoeffizienten oder die Verringerung der Radien der Nullstellen der LP Filterübertragungsfunktion wurde auch für andere Zwecke vorgeschlagen, z.B. für die Modellierung der spektralen Hüllkurve oder für eine genauere Schätzung der Formanten.
Eine Verringerung des Betrags der Reflektionskoeffizienten kann durch die Herleitung von Schätzern für rm und qm erfolgen, die den mittleren quadratischen Schätzfehler minimieren. Zur Berechnung der Reflektionskoeffizienten für das Lattice Filter oder der partiellen Korrelationen, welche gleich -km sind und auf den Schätzungen von einem Geräuschsignal beruhen, sei für das zusätzliche Geräuschsignal weißes Rauschen mit der Varianz σ„2 angenommen, das auch mit x(n) nicht korreliert sein soll. Dies stellt das am wenigsten informierte Modell (maximale Entropie) dar.
Es ist zwar diese Annahme für das Umgebungsgeräusch im Allgemeinen nicht realistisch, doch beweist sie die Notwendigkeit einer Korrektur der Reflektionskoeffizienten.
Die Schätzungen für die Korrelation in Gleichung (6) und die Leistung in Gleichung (7) aus der Berechung der Reflektionskoeffizienten in Gleichung (5) beruhen nun auf dem geräuschbehafteten beobachteten Signal y(ή) und man kann die Notwendigkeit eines Korrekturterms zeigen, um die Schätzungen für die Reflektionskoeffizienten £m bezogen auf das geräuschfreie Signal x(n) zu gewinnen.
In besonderen erhält man für die Schätzung der Reflektionskoeffizienten in der ersten Filterstufe m = 1 den folgenden Erwartungswert für ro: r0 = E{fo(n)\(n-\)}
= E{y{n)y{n-l)}
= E{{x{n)+ε{n)){x(n-l)+s(n -\))} K '
= E{x{n) x(n -l)}
Für die Fehlervarianz qo in der ersten Filterstufe erhält man
Figure imgf000011_0001
= !E{(xW + ε(n))2 + (x(„ -l) + e(n -l)Y}
Figure imgf000011_0002
Der resultierende Fehler in den Werten der Reflektionsfaktoren ist in Fig. 2 dargestellt. Genauer gesagt sind hier aus dem geräuschbehafteten Signal ohne Korrektur berechnete Werte des Reflexionskoeffizienten /ci als Funktion eines a priori Signal/ Geräusch- Abstandes für unterschiedliche Werte der Autokorrelation pxx(l) des ungestörten Signals x(n) veranschaulicht.
Was die auf das geräuschfreie Signal x(n) bezogenen Reflektionskoeffizienten betrifft, kann die Korrelationsschätzung aus der geräuschbehafteten Beobachtung unverändert verwendet werden, das heißt r0 = r0 wogegen die berechnete Fehlerleistungsschätzung zu korrigieren ist als
qo = qp - σn 2 (12)
und der korrigierte Reflektionskoeffizient berechnet wird als
K = J-h = ^-T - (13)
Wenn man einführt: ^ 2 wobei V ~~ ^ 2 der a posteriori bestirnrrite n <J n„
Signalstörabstand ist und beachtet wird dass q0 = {n — l)} kann man
Figure imgf000011_0003
diese Gleichung erneut anschreiben als
Figure imgf000012_0001
Das bedeutet eine Skalierung des Reflektionskoeffizienten /ci, der ursprünglich für das gestörte Signal y(n) berechnet wurde unter Verwendung der Gleichungen (5), (6) und (7) mit 1 einem Faktor \ - L
7
Eine Schätzung der Geräuschleistung σn 2 kann erfolgen anhand der Leistung des Ausgangssignals e(n) des LP-Fehler-Filters,
Figure imgf000012_0002
für das Latti.ee Filter ist eine möglich Auswertung des Erwartungswerts gegeben durch die Leistungsschätzung in der letzten Stufe des Lattice Filters cjM-i(n):
Figure imgf000012_0003
oder, bei Verwendung der Sprachaktivitätsschätzung (siehe unten) anhand der Leistungsschätzung des Gesamteingangssignales bei fehlender Sprachaktivität:
Figure imgf000012_0004
Für die höheren Latti.ce Stufen m = 2, 3, kann die Gleichung (14) verallgemeinert werden, wodurch sich eine Korrektur der übrigen Reflektionskoeffizienten km ergibt.
Dessen ungeachtet kann man aus dem obigen schließen, dass eine Verminderung der Größe der Reflektionskoeffizienten, das heißt eine Verringerung des Verhältnisses zwischen Korrelation und Leistungsschätzung für die Vorhersage eines Signals x(n) bei Beobachtung eines Signal y(n), welches zusätzliches Geräusch enthält, zweckmäßig ist. Das Auffinden der Korrektur großen setzt eine verlässliche Schätzung der Geräuschleistung σ„2 voraus. Weiters berücksichtigt das Modell bis jetzt nicht irgendwelche Kenntnisse bezüglich der Eigenschaften der Sprache und des zu erwartenden Geräuschsignals.
Die Erfindung schafft nun eine Verfahren bzw. eine Vorrichtung, mit welcher man, basierend auf einfachen Annahmen über die Änderung der Korrelation und der Leistung der Sprach- und Geräuschsignale nach der Zeit eine Korrektur der Reflektionsf aktoren erhält. Wie oben ausgeführt, beruhen die Schätzungen der Fehlerkorrelation (6) und der Fehlervarianz (7) üblicherweise auf einer Tiefpassfilterung der Augenblickswerte. Oft wird auch eine einpolige Tiefpassfilterung (verlustbehaftet Integration) verwendet:
rm(») = λrrm(n -\) + /»*„(« -l), (15)
Figure imgf000013_0001
mit den gleichen Polen bzw. Integrationsfaktoren λr = λq sowohl für die Korrelations- als auch die Leistungsschätzung.
hi Einklang mit der Erfindung sind verschiedene Pollagen λq ≥ λr erlaubt. Die resultierenden Filterfunktionen
Hr{z) = — l τ, Hg(z) = L— 5-, (17)
1 — λrz I — A z
für λr = 0,99608 und λq ~ 0,99843 und eine Abtastrate von 16 kHz sind in Fig.3a dargestellt. Man kann sehen, dass das Verhältnis von rm \n) und qmψ) bei geringeren Frequenzen beeinflusst wird, das heißt für langsam sich ändernde Korrelation und Leistung, wogegen für raschere Änderungen (über « 10Hz) das Verhältnis verglichen mit den Schätzungen mit λr = λq ungeändert bleibt. Unter der Annahme, dass diese Parameter sich für das Sprachsignal rascher ändern (unter der Annahme beispielsweise einer Phonemrate von 10 pro Sekunde) als für das Geräuschsignal (stationäres oder langsam sich mit der Zeit änderndes Geräusch) wird das sich ergebende Lattice Prädiktionsfilter die Sprachsignalkomponente gut vorhersagen, wogegen die Geräuschkomponente unterdrückt wird.
Was impulsartige Geräusche betrifft, kann man vorsehen, das Verhältnis zwischen Korrelation und Leistungsschätzung auch für hohe Frequenzen zu reduzieren, was beispielsweise durch Verwendung eines zweiten Pols in dem Tiefpassfilter für die Korrelation Hr(z) erfolgen kann. Eine entsprechende Übertragungsfunktion ist in Fig.3b dargestellt.
Im Einzelnen zeigen die Figuren 3a und b die Frequenzgänge eines Tiefpassfilters für eine Fehlerkorrelation Hr(z) (ausgezogene Linien) und die Varianz Hq(z) (punktierte Linien) für in Fig. a zwei einpolige Tiefpassfilter mit λr = 0,99608 und λη = 0,99843 bzw. Figur 3b einen einpoligen Tiefpass für die Leistungsschätzung von q{n) mit λη = 0,99843 und einen zweipoligen Tiefpass für die Korrelationsschätzung F(«) mit λrl - 0,99608 und Xa = 0,9. Je größer der Abstand zwischen den beiden Übertragungsfunktionen umso stärker ist die Geräuschunterdrückung.
Um eine gute Reduzierung des Geräusches zu erreichen, kann unter diesen Umständen die Ordnung M des LP Filters überraschend niedrig gewählt werden, sogar niedriger als die üblicherweise zur Modellierung der spektralen Hüllkurve von Sprachsignalen verwendete Ordnung. Beispielsweise wurde in dem in Fig. 4a gezeigten Beispiel ein Prädiktor mit der Ordnung M = 10 für ein Signal mit einer Abtastrate von 16 kHz verwendet. Dieses Beispiel enthält ein mehrmaliges Auftreten von starken, nicht stationären Geräuschbursts, die dank der Erfindung gut beseitigt werden. Das gezeigte Geräusch stammt aus einer Fabrikhallen- Umgebung, das heißt einer äußerst ungünstigen akustischen Umgebung.
Die Wirksamkeit der Geräuschunterdrückung kann gesteuert werden durch die Einstellung unterschiedlicher Werte für λr (bzw. λri und λfi) und λη . Wobei diese in Abhängigkeit von der Signalleistung und der Geräuschleistung gewählt werden:
rq) = f(σx 2 >σn 2), bzw. (λrlr2>λq) = g{σχ 2 )σl). (18)
Weiters ist es zweckmäßig, die Wirksamkeit der Geräuschunterdrückung anhand einer Schätzung der Sprachaktivität zu steuern. Bei der Verwendung eines LP-Fehler-Filters bietet sich (vgl. auch [5]) die Schätzung der wahrscheinlichen Sprachaktivität als reeller Zahl im Wertebereich von 0 bis 1 anhand der Leistungen des Filtereingangssignals und des Filterausgangssignals an:
Figure imgf000014_0001
für ein Lattice Filter ist eine mögliche Auswertung der Erwartungswerte gegeben durch
Figure imgf000014_0002
Zur Steuerung der Geräuschunterdrückung kann dann ein Faktor
K = 1 - v für das Ausgangssignal des Lattice Filters β(ή), und/oder ein Faktor
kz =
für das Ausgangssignal verwendet werden.
Das LP-Fehler-Filter kann als Filter in direkter Filterform (DFF) ausgebildet sein, welches aus dem Eingangssignal ein Prädiktionssignal an seinem Ausgang erzeugt, wobei ein Subtrahierer das Prädiktionssignal vom Eingangssignal abzieht und somit das Ausgangssignal des LP- Fehler-Filters e(n) erzeugt. Die verzögerten Abtastwerte des Eingangssignals (vgl. Gleichung 1) sowie das Ausgangssignal des Subtrahierers e(ή) entsprechen den internen Signalen des LP-Fehler-Filters.
Ein wichtiges Merkmal der erfindungsgemäßen Geräuschunterdrückung besteht in der an die Eigenschaften des Sprach- und des Geräuschsignales angepassten Auswertung der Erwartungswertoperatoren und damit der optimalen Einstellung der Filterkoeffizienten für das lineare Prädiktionsfilter, sowie in der Sprachaktivitätsschätzung und deren Verwendung bei der Schätzung des Geräuschsignals, und zur Steuerung der Wirksamkeit der Geräuschunterdrückung und der Amplitude des Ausgangssignales.
Wenngleich es klar sein sollte, dass der Rechenaufwand mit der gewählten Filterordnung steigt und daher der Rechenaufwand unter Umständen größer sein kann, als jener bei Verwendung einer schnellen Fouriertransformation, liegt ein wesentlicher Vorteil der Erfindung darin, dass sie eine Geräuschreduktion ohne Verzögerung des Sprachsignals ermöglicht, was ein besonderer Vorteil ist, vor allem beim Einsatz in Hörgeräten.

Claims

ANSPRÜCHE
1. Vorrichtung zur Geräuschunter drückung mit einer linearen Prädiktions- Analysierschaltung mit einem LP-Fehler-Filter (LFF), das auf Basis eines ersten, von Geräusch überlagerten Sprachsignals y(n) - x(n) + ε(ή) ein LP-Fehler-Filter Ausgangssignal e(π) erzeugt, einer Koeffizientenberechnungseinheit (KBE), welche die Koeffizienten des LP- Fehler-Filters auf Basis der internen Signale (inklusive des Ein- und Ausgangssignals y(n) und ein)) des LP-Fehler-Filters aktualisiert, und einer Subτrahiereinheit, welche das LP- Fehler-Filter Ausgangssignal e(n) von dem ersten Sprachsignal y(n) in einem Subtrahierer subtrahiert und nach der Subtraktion den Rest als zweites Sprachsignal x{n) = y\n) — e{n) ausgibt, in welchem das Geräusch unterdrückt ist,
dadurch gekennzeichnet, dass
eine Geräuschschätzungseinheit (GSE) vorgesehen ist, welche auf Basis der internen Signale des LP-Fehler-Filters ein Geräuschleistungssignal σ„2 und ein Sprachleistungssignal σx 2, erzeugt, diese Signale der Koeffizientenberechnungseinheit (KBE) zugeführt sind und von dieser im Sinne einer Optimierung der Geräuschunterdrückung berücksichtigt werden.
2. Vorrichtung zur Geräuschunterdrückung mit einer linearen Prädiktions- Analysierschaltung mit einem LP-Fehler-Filter, das auf Basis eines ersten, von Geräusch überlagerten Sprachsignals y(n) = x(n) + ε(ή) ein LP-Fehler-Filter Ausgangssignal ein) erzeugt, einer Koeffizientenberechnungseinheit, welche die Koeffizienten des LP-Fehler-Filters auf Basis der internen Signale des LP-Fehler-Filters aktualisiert, und einer Subtrahiereinheit, welche das LP-Fehler-Filter Ausgangssignal von dem ersten Sprachsignal subtrahiert und nach der Subtraktion den Rest als zweites Sprachsignal ausgibt, x(n)= y{n) — e{n) in welchem das Geräusch unterdrückt ist,
dadurch gekennzeichnet, dass
eine Sprachaktivitätsschätzungseinheit (SAE) vorgesehen ist, welche auf Basis der internen Signale des LP-Fehler-Filters ein Sprachaktivitätssignal v erzeugt, das der Koeffizientenberechnungseinheit (KBE) zugeführt ist und von dieser im Sinne einer Optimierung der Geräuschunterdrückung berücksichtigt wird.
3. Vorrichtung zur Geräuschunterdrückung mit einer linearen Prädiktions- Analysierschaltung mit einem LP-Fehler-Filter, das auf Basis eines ersten, von Geräusch überlagerten Sprachsignals ein LP-Fehler-Filter Ausgangssignal erzeugt, einer Koeffizien- tenberechnungseinheit, welche die Koeffizienten des LP-Fehler-Filters auf Basis der internen Signale des LP-Fehler-Filters aktualisiert, und einer Subtrahiereinheit, welche das LP-Fehler- Filter Ausgangssignal von dem ersten Sprachsignal subtrahiert und nach der Subtraktion den Rest als zweites Sprachsignal ausgibt, in welchem das Geräusch unterdrückt ist,
dadurch gekennzeichnet, dass
eine Geräuschschätzungseinheit (GSE) sowie eine Sprachaktivitätsschätzungsernheit (SAE) vorgesehen sind, beiden Einheiten die internen Signale des LP-Fehler-Filters zugeführt sind und die Einheiten auf deren Basis ein Geräuschleistungssignal σ„2, ein Sprachleistungssignal σx 2, und ein Sprachaktivitätssignal v erzeugen, welche der Koeffizientenberechnungseinheit (KBE) zugeführt sind und von dieser im Sinne einer Optimierung der Geräuschunterdrückung berücksichtigt werden.
4. Vorrichtung nach Anspruch 2 oder 3, dadurch gekennzeichnet, dass die Sprachaktivitäts- schätzungseinheit (SAE) einen Geräuschunterdrückungsfaktor (Icn) bildet, welcher einem Eingang eines ersten Multiplizierers (MUl) zugeführt ist und dessen anderem Eingang das Ausgangssignal des LP-Fehler-Filters zugeführt ist und der vor dem Subtrahierer (SUB) liegt.
5. Vorrichtung nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, dass die Sprachaktivitätsschätzungseinheit (SAE) einen Gesamtsignalfaktor (ks) bildet, welcher einem Eingang eines zweiten Multiplizierers (MU2) zugeführt ist dessen anderem Eingang das Ausgangssignal des Subtrahierers (SUB) zugeführt ist.
6. Vorrichtung nach Anspruch 1 bis 5, dadurch gekennzeichnet, dass das LP-Fehler-Filter aus einem Lattice Filter (Fig. 1) besteht; wobei die Vorwärts- und Rückwärtsfehlersignale die internen Signale des LP-Fehler-Filters darstellen.
7. Vorrichtung nach Anspruch 1 bis 5, dadurch gekennzeichnet, dass das LP-Fehler-Filter als Filter in direkter Filterform (DFF) aus dem Eingangssignal ein Prädiktionssignal an seinem Ausgang erzeugt, und ein Subtrahierer das Prädiktionssignal vom Eingangssignal abzieht und somit das Ausgangssignal des LP-Fehler-Filters e(n) erzeugt; wobei die verzögerten Abtastwerte des Eingangssignals (vgl. Gleichung 1) sowie das Ausgangssignal des Subtrahierers e(n) den internen Signalen des LP-Fehler-Filters entsprechen.
8. Vorrichtung nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass die Koeffi- zientenberechnungseinheit (KBE) dazu eingerichtet ist, die korrigierte Fehlervarianz ^0 gemäß
und den korrigierten Reflexionskoeffizienten k gemäß
K ro
Io —
ZU ermitteki.
9. Vorrichtung nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass die Koeffizientenberechnungseinheit (KBE) dazu eingerichtet ist, die Fehlerkorrelation gemäß
rm(n) = λrrm(n -l) + fm(n)bm(n -l)
und die Fehlervarianz gemäß
Figure imgf000018_0001
zu ermitteln.
10. Vorrichtung nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass für die Leistungsschätzung von q(n) ein einpoliger Tiefpass und ein für die Korrelationsschätzung 7\n) zweipoliger Tiefpass vorgesehen ist.
11. Kaskade, bestehend aus zumindest zwei hintereinander geschalteten Vorrichtungen nach einem der Ansprüche 1 bis 9.
PCT/AT2007/000424 2006-09-15 2007-09-06 Vorrichtung zur geräuschunterdrückung bei einem audiosignal WO2008031124A1 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US12/440,952 US20100049507A1 (en) 2006-09-15 2007-09-06 Apparatus for noise suppression in an audio signal
AT07800169T ATE495523T1 (de) 2006-09-15 2007-09-06 Vorrichtung zur geräuschunterdrückung bei einem audiosignal
EP07800169A EP2080197B1 (de) 2006-09-15 2007-09-06 Vorrichtung zur geräuschunterdrückung bei einem audiosignal
DE502007006264T DE502007006264D1 (de) 2006-09-15 2007-09-06 Vorrichtung zur geräuschunterdrückung bei einem audiosignal

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ATA1547/2006 2006-09-15
AT0154706A AT504164B1 (de) 2006-09-15 2006-09-15 Vorrichtung zur gerauschunterdruckung bei einem audiosignal

Publications (1)

Publication Number Publication Date
WO2008031124A1 true WO2008031124A1 (de) 2008-03-20

Family

ID=38626580

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/AT2007/000424 WO2008031124A1 (de) 2006-09-15 2007-09-06 Vorrichtung zur geräuschunterdrückung bei einem audiosignal

Country Status (5)

Country Link
US (1) US20100049507A1 (de)
EP (1) EP2080197B1 (de)
AT (2) AT504164B1 (de)
DE (1) DE502007006264D1 (de)
WO (1) WO2008031124A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2363853A1 (de) * 2010-03-04 2011-09-07 Österreichische Akademie der Wissenschaften Verfahren zur Schätzung des rauschfreien Spektrums eines Signals
CN117350099A (zh) * 2023-09-11 2024-01-05 北京五瑞美阳医疗器械有限责任公司 基于有限元分析的呼吸机降噪结构优化方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150081495A1 (en) * 2013-09-19 2015-03-19 Barclays Bank Plc System and Method for Account Succession
US10251002B2 (en) 2016-03-21 2019-04-02 Starkey Laboratories, Inc. Noise characterization and attenuation using linear predictive coding
CN110047529B (zh) * 2019-05-15 2024-02-20 中国人民解放军海军潜艇学院 一种信号自适应放大的多路音频记录设备及方法
CN117037837B (zh) * 2023-10-09 2023-12-12 广州伏羲智能科技有限公司 基于音轨分离技术的噪声分离方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1520148A (en) 1975-10-09 1978-08-02 Standard Telephones Cables Ltd Adaptive lattice filter
US4587620A (en) 1981-05-09 1986-05-06 Nippon Gakki Seizo Kabushiki Kaisha Noise elimination device
US20010005822A1 (en) 1999-12-13 2001-06-28 Fujitsu Limited Noise suppression apparatus realized by linear prediction analyzing circuit
US7065468B2 (en) 2003-02-28 2006-06-20 General Electric Company Methods and apparatus for assessing gas turbine engine damage

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4720802A (en) * 1983-07-26 1988-01-19 Lear Siegler Noise compensation arrangement
US5913187A (en) * 1997-08-29 1999-06-15 Nortel Networks Corporation Nonlinear filter for noise suppression in linear prediction speech processing devices
US6925435B1 (en) * 2000-11-27 2005-08-02 Mindspeed Technologies, Inc. Method and apparatus for improved noise reduction in a speech encoder
US7065486B1 (en) * 2002-04-11 2006-06-20 Mindspeed Technologies, Inc. Linear prediction based noise suppression
DE602004004242T2 (de) * 2004-03-19 2008-06-05 Harman Becker Automotive Systems Gmbh System und Verfahren zur Verbesserung eines Audiosignals
US7716046B2 (en) * 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
CN101501761B (zh) * 2006-08-15 2012-02-08 杜比实验室特许公司 无需边信息对时域噪声包络的任意整形

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1520148A (en) 1975-10-09 1978-08-02 Standard Telephones Cables Ltd Adaptive lattice filter
US4587620A (en) 1981-05-09 1986-05-06 Nippon Gakki Seizo Kabushiki Kaisha Noise elimination device
US20010005822A1 (en) 1999-12-13 2001-06-28 Fujitsu Limited Noise suppression apparatus realized by linear prediction analyzing circuit
US7065468B2 (en) 2003-02-28 2006-06-20 General Electric Company Methods and apparatus for assessing gas turbine engine damage

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KAWAMURA A ET AL: "A NOISE REDUCTION METHOD BASED ON LINEAR PREDICTION ANALYSIS", ELECTRONICS & COMMUNICATIONS IN JAPAN, PART III - FUNDAMENTAL ELECTRONIC SCIENCE, WILEY, HOBOKEN, NJ, US, vol. 3,part-3, no. 86, 2003, pages 1 - 10, XP001141501, ISSN: 1042-0967 *
MAKHOUL J I & COSELL L K: "Adaptive lattice analysis of speech", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS, vol. CAS-28, no. 6, June 1981 (1981-06-01), Bolt Beranek & Newman Inc., Cambridge, MA; USA, pages 494 - 499, XP002457971, ISSN: 0098-4094 *
RANK E & KUBIN G: "Lattice LP Filtering for Noise Reduction in Speech Signals", PROC. INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING (INTERSPEECH - ICSLP), 21 September 2006 (2006-09-21), pages 265 - 268, XP001536700 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2363853A1 (de) * 2010-03-04 2011-09-07 Österreichische Akademie der Wissenschaften Verfahren zur Schätzung des rauschfreien Spektrums eines Signals
CN117350099A (zh) * 2023-09-11 2024-01-05 北京五瑞美阳医疗器械有限责任公司 基于有限元分析的呼吸机降噪结构优化方法
CN117350099B (zh) * 2023-09-11 2024-04-16 北京五瑞美阳医疗器械有限责任公司 基于有限元分析的呼吸机降噪结构优化方法

Also Published As

Publication number Publication date
DE502007006264D1 (de) 2011-02-24
AT504164A1 (de) 2008-03-15
EP2080197A1 (de) 2009-07-22
AT504164B1 (de) 2009-04-15
ATE495523T1 (de) 2011-01-15
EP2080197B1 (de) 2011-01-12
US20100049507A1 (en) 2010-02-25

Similar Documents

Publication Publication Date Title
DE69531710T2 (de) Verfahren und Vorrichtung zur Verminderung von Rauschen bei Sprachsignalen
DE112009000805B4 (de) Rauschreduktion
DE60131639T2 (de) Vorrichtungen und Verfahren zur Bestimmung von Leistungswerten für die Geräuschunterdrückung für ein Sprachkommunikationssystem
DE60120949T2 (de) Eine hörprothese mit automatischer hörumgebungsklassifizierung
EP0948237B1 (de) Verfahren zur Störbefreiung eines Mikrophonsignals
DE2207141C3 (de) Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters
DE69634841T2 (de) Verfahren und Vorrichtung zur Echokompensation
EP2080197B1 (de) Vorrichtung zur geräuschunterdrückung bei einem audiosignal
DE102007030209A1 (de) Glättungsverfahren
AT509570B1 (de) Methode und apparat zur einkanal-sprachverbesserung basierend auf einem latenzzeitreduzierten gehörmodell
EP0668007A1 (de) Mobilfunkgerät mit freisprecheinrichtung
EP3089481B1 (de) Verfahren zur frequenzabhängigen rauschunterdrückung eines eingangssignals
EP1103956B1 (de) Exponentielle Echo- und Geräuschabsenkung in Sprachpausen
DE112011106045T5 (de) Audiosignal-Wiederherstellungsvorrichtung und Audiosignal-Wiederherstellungsverfahren
EP1189419B1 (de) Verfahren und Vorrichtung zur Elimination Lautsprecherinterferenzen aus Mikrofonsignalen
DE102014221810A1 (de) Sprachpräsenzwahrscheinlichkeits-Modifizierer, der Log-MMSE-basierte Rauschunterdrückungsleistung verbessert
EP3065417B1 (de) Verfahren zur unterdrückung eines störgeräusches in einem akustischen system
DE102014221528B4 (de) Akkurate Vorwärts-SNR-Schätzung basierend auf MMSE-Sprachpräsenzwahrscheinlichkeit
DE102013011761A1 (de) Kraftfahrzeug mit einer Freisprecheinrichtung und Verfahren zur Erzeugung eines Frequenzganges für Freisprecheinrichtungen
DE102018117557B4 (de) Adaptives nachfiltern
EP0623995A1 (de) Anordnung zur geräuschabhängigen Regelung der Lautstärke eines Autoradios
DE602004006912T2 (de) Verfahren zur Verarbeitung eines akustischen Signals und ein Hörgerät
DE60304147T2 (de) Virtuelle Mikrophonanordnung
EP1453355B1 (de) Signalverarbeitung in einem Hörgerät
DE102018117558A1 (de) Adaptives nachfiltern

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 07800169

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 12440952

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2007800169

Country of ref document: EP