EP0612059A2 - Verfahren zur Laufzeitschätzung an gestörten Sprachkanälen - Google Patents
Verfahren zur Laufzeitschätzung an gestörten Sprachkanälen Download PDFInfo
- Publication number
- EP0612059A2 EP0612059A2 EP93120010A EP93120010A EP0612059A2 EP 0612059 A2 EP0612059 A2 EP 0612059A2 EP 93120010 A EP93120010 A EP 93120010A EP 93120010 A EP93120010 A EP 93120010A EP 0612059 A2 EP0612059 A2 EP 0612059A2
- Authority
- EP
- European Patent Office
- Prior art keywords
- phase
- determined
- signals
- estimated
- maxima
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000001052 transient effect Effects 0.000 claims abstract description 6
- 238000009499 grossing Methods 0.000 claims description 13
- 230000003595 spectral effect Effects 0.000 claims description 4
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 230000010363 phase shift Effects 0.000 claims 1
- 238000001228 spectrum Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
Definitions
- An important aspect of multi-channel processing is the estimation of the runtime difference between the individual channels. If the time difference is known, the direction of the sound event (speaker) can be determined. The signals of the individual channels can be corrected accordingly and processed further. E.g. If uncorrected signals are combined to form a sum signal, individual spectral components of the signal can be amplified, attenuated or canceled by interference.
- the runtime is determined in the frequency domain. This enables a simple runtime correction by multiplying the spectrum by the new phase and leads to a low computing effort.
- the microphone signals x and y are transformed into the frequency range (FFT, Fast Fourier Transformation).
- the transformed segments X l (i) and Y l (i) resulted.
- the segments are half overlapped and weighted with a hanning window. (The sampling rate of the signals x and y is 12 kHz.)
- a "simulated impulse response" S I is calculated via an impulse monitor.
- the smoothing of the phase value "from the beginning of the word into the word" can be adjusted with ⁇ .
- S I, 1 (l - ⁇ ) S I, l-1 + ⁇ S B, l (7)
- an adaptive smoothing constant h is calculated using a noise monitor. This smoothing constant results in an estimate S N for the disturbance. If spectral subtraction (SPS) was carried out beforehand, S N is an estimate of the residual interference.
- SPS spectral subtraction
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Noise Elimination (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
Description
- Die Erfindung betrifft ein Verfahren nach dem Oberbegriff des Patentanspruchs 1.
- Ein derartiges Verfahren findet Verwendung bei automatischen Spracherkennungssystemen oder für Freisprechanlagen z.B. in Büroräumen, Kraftfahrzeugen etc..
- Gestörte Sprache ist besser erfaßbar, wenn sie mit zwei oder mehreren Kanälen aufgezeichnet wird. Der Mensch benutzt zwei Kanäle, seine beiden Ohren. Durch eine psychoakustische Nachverarbeitung wird bei ihm die Richtung des Sprechers ermittelt und die Hintergrundstörung ausgeblendet. Bei technischen Geräten können zwei oder mehrere Kanäle zur Aufzeichnung verwendet werden. Diese Signale können dann mit einer digitalen Signalverarbeitung aufbereitet werden.
- Ein wesentlicher Aspekt der mehrkanaligen Verarbeitung ist die Schätzung des Laufzeitunterschiedes der einzelnen Kanäle. Ist der Laufzeitunterschied bekannnt, kann die Richtung des Schallereignisses (Sprecher) ermittelt werden. Die Signale der einzelnen Kanäle können entsprechend laufzeitkorrigiert und weiterverarbeitet werden. Werden z.B. nicht korrigierte Signale zu einem Summensignal zusammengefaßt, können sich einzelne spektrale Anteile des Signals durch Interferenz verstärken, dämpfen oder auslöschen.
- Ein Verfahren zur automatischen Ermittlung der Laufzeitunterschiede zweier Mikrofone ist aus einer Veröffentlichung von M. Schlang, ITG-Fachtagung 1988, Bad Nauheim S. 69-73 bekannt. Es arbeitet im Zeitbereich. Jedoch ist dieses Verfahren bei starken Störungen nicht anwendbar.
- Der Erfindung liegt deshalb die Aufgabe zugrunde ein Verfahren zur Laufzeitschätzung für ein Spracherkennungssystem anzugeben, das auch bei starken Hintergrundgeräuschen anwendbar ist, für ein Mehrkanalübertragungssystem geeignet ist und zeit- und kostensparend arbeitet.
- Die Aufgabe wird gelöst durch die im kennzeichnenden Teil des Patentanspruchs 1 angegebenen Merkmale. Vorteilhafte Ausgestaltungen und/oder Weiterbildungen sind den Unteransprüchen zu entnehmen.
- Die Erfindung wird anhand eines Ausführungsbeispiels beschrieben unter Bezugnahme auf schematische Zeichnungen.
- In FIG. 1 wird anhand eines Blockschaltbilds die Phasenschätzung erläutert.
- FIG. 2 gibt für ein Fahrgeräusch von 140km/h eine Darstellung der Größen SB, SI, SN und g in Abhängigkeit von der Zeit an.
- In der vorliegenden Erfindung wird ein 2-kanaliger Laufzeitausgleich vorgestellt. Die Erweiterung auf mehrere Kanäle ist mit dem entsprechenden Mehraufwand leicht möglich. Der Laufzeitausgleich ist ein Teil der Signalvorverarbeitung einer mehrkanaligen Geräuschreduktion, die z.B. für einen Spracherkenner im Fahrzeug verwendet werden kann.
- Die Laufzeit wird im Frequenzbereich ermittelt. Dies ermöglicht eine einfache Laufzeitkorrektur durch die Multiplikation des Spektrums mit der neuen Phase und führt zu einem geringen Rechenaufwand.
- Die Sprach- und Geräuschaufnahmen zur Entwicklung und Bewertung des vorliegenden Verfahrens wurden in einem Fahrzeug mit zwei Mikrofonen durchgeführt. Die Störung ist das Fahrgeräusch bei verschiedenen Fahrsituationen.
- Mit dem erfindungsgemäßen Verfahren werden im Frequenzbereich die Phasen an einer Anzahl von Maxima der Kreuzkorrelation bestimmt. Die Hintergrundstörung und das Einschwingverhalten des Raumes werden ständig mitgeschätzt. Die einzelnen Phasenwerte werden nur zu Beginn eines Einschwingvorgangs verarbeitet und wenn das Hintergrundgeräusch um einen gewissen Faktor überschritten wird. Bei der Weiterverarbeitung der Phasenwerte wird eine lineare Phasenbeziehung vorausgesetzt und die Varianz der Schätzung wird bei der Glättung der Werte mitberücksichtigt. Die Berücksichtigung des Einschwingvorgangs des Raumes fuhrt dazu, daß nur bei starken Energieanstiegen der Sprache eine Phasenschätzung stattfindet. Sofort zu Beginn des Wortes steht ein neuer Phasenschätzwert zur Verfügung. Der Einfluß von Reflexionen wird vermindert. Durch die Berücksichtigung des Hintergrundgeräuschs ist das Verfahren für den praktischen Einsatz z.B. im Fahrzeug gut geeignet. Anhand eines Blockschaltbildes in FIG. 1 wird der Verfahrensablauf der Phasenschätzung näher erläutert.
- Die Mikrofonsignale x und y werden in den Frequenzbereich transformiert (FFT, Fast Fourier Transformation). Die Transformationslänge wird zu N = 256 gewählt. Es ergaben sich die transformierten Segment Xl (i) und Yl (i). l bezeichnet den Blockindex der Segmente, i die diskrete Frequenz (i = 0,1,2,...,N-1). Die Segmente sind halb überlappt und werden mit einem Hanning Fenster gewichtet. (Die Abtastrate der Signale x und y beträgt 12 kHz.)
- Im Frequenzbereich wird der Langzeitmittelwert des Betragsspektrums subtrahiert (SPS, spektrale Substraktion). Die Phase der Signale wird nicht verändert. Das Störgeräusch wird reduziert. Es ergeben sich die Schätzwerte X̂ und Ŷ. Die SPS ist ein Standardverfahren und kann hier in einer einfachen Version eingesetzt werden. Sind nur geringe Störungen vorhanden, kann auf die SPS ganz verzichtet werden.
-
-
- Mit einer Präemphase können höhere Frequenzen angehoben werden. Dies ist dann vorteilhaft, wenn das Sprachsignal und das Störsignal bei höheren Frequenzen eine geringere Leistung aufweisen. Die Werte der Kreuzleistung Bxy (i) können z.B. im Bereich 300 bis 1500 Hz um 10dB linear an-steigend angehoben werden. Die Präemphase kann aber auch schon durch die Mikrofoncharakteristik vorgegeben sein.
-
- Über einen Impulsmonitor wird eine "simulierte Impulsantwort" SI berechnet. Das Einschwingverhalten des umgebenden Raumes auf plötzliche energiestarke Schallereignisse (Sprache) wird hiermit grob simuliert (z.B. wird γ = 0.l gewählt). Die Glättung des Phasenwerts "vom Wortanfang in das Wort hinein" ist mit γ einstellbar.
Außerdem wird über einen Geräuschmonitor eine adaptive Glättungskonstante h berechnet. Mit dieser Glättungskonstanten ergibt sich ein Schätzwert SN für die Störung. Wurde zuvor eine spektrale Substraktion (SPS) durchgeführt, ist SN ein Schätzwert für die Reststörung. Für die Glättungskonstante ho gilt z.B. ho = 0.03
Die Phase der gestörten Signale wird aus den Real- und Imaginärteilen von Sxy berechnet. Die Phase wird nur an den M zuvor bestimmten Maxima berechnet.
und
Daraus ergibt sich der Phasenanstieg:
Mit der Länge der Fouriertransformation N und der max. zulässigen Verschiebung um n Taps ergibt sich (N = 256):
Übersteigt der Phasenanstieg |φ'| an einem der Maxima |φ'|max, so wird dieser Wert φ' nicht weiterverwendet. Es wird eine adaptive Glättungskonstante g berechnet:
Der aktuelle Wert SB muß um den Faktor c größer sein als die simulierte Impulsantwort SI
sonst gilt:
Der aktuelle Wert SB muß um den Faktor d größer sein als das Restrauschen SN
sonst gilt ebenfalls
Ist Gl. (17) oder Gl. (19) nicht erfüllt, d.h. gilt - Für alle
gilt:
Von den ursprünglichen M Maxima werden wegen Gl. (21) nur M' für die Gl. (22, 23) verwendet. Ist die Anzahl M' der für die Summen gültigen Werte φ kleiner als Mmin, gilt der geschätzte Phasenanstieg als zu unsicher oder außerhalb des Nutzbereichs (z.B. Mmin = 6, bei M = 8). Die Phasenschätzung wird dann nicht aktualisiert und das Verfahren hier abgebrochen. Es gilt der alte Phasenschätzwert. -
- Entsprechend der Varianz wird die Glättungskonstante g gewichtet. Bei einer großen Streuung gilt:
Bei einer mittleren Streuung gilt:
Bei sehr geringer Streuung gilt:
Entsprechend den Gl. 19 - 22 wird g in der Regel nur am Wortanfang größer Null sein. Dabei muß die Energie des Wortes größer sein als die Energie des Restgeräusches und der simulierten Impulsantwort. Mit der Variablen j wird die aufeinanderfolgende Anzahl für g > 0 gezählt. Entsprechend gilt für die Glättung:
Wird z.B. infolge einer Störung die Bedingung g > 0 nur einmal in Folge erfüllt, wird die Phasenschätzung nicht aktualisiert. Eine Aktualisierung der Phasenschätzung erfolgt nur dann, wenn g > 0 mindestens 2-mal in Folge erfüllt wird. - Ein Beispiel für die Zwischengrößen SB, SI, SN' und g und die daraus abgeleitete Phasenschätzung zeigt, FIG. 2. Dabei wird das Wort "Senderwahl" gesprochen und das Fahrgeräusch bei 140km/h addiert. Das Verfahren wird, wie oben angegeben, verwendet. Der Phasenschätzwert ist in Abtastwerten n angegeben. Mit der Größe SI wird der "Sprachimpuls" teilweise verdeckt und so nur bei starken Energieanstiegen eine Schätzung erlaubt (SB muß SI um den Faktor 2 übersteigen). Die Schätzung der Reststörung SN ermöglicht eine größere Robustheit gegenüber Geräuschen (SB muß SN um den Faktor 3 übersteigen).
Claims (11)
- Verfahren zur Laufzeitschätzung bei dem Laufzeitunterschiede von geräuschgestörten Signalen von zumindest zwei Sprachkanälen mittels einer Kreuzkorrelation bestimmt werden, dadurch qekennzeichnet,- daß im Frequenzbereich die Phasenwerte von zumindest zwei Signalen über eine bestimmte Anzahl von Maxima der Kreuzleistungsdichte ermittelt werden und deren Phasenverschiebung bestimmt wird, und- daß der erforderliche Phasenausgleich ebenfalls im Frequenzbereich durchgeführt wird.
- Verfahren nach Anspruch l, dadurch gekennzeichnet, daß Hintergrundstörungen und das Einschwingverhalten des Raumes bei der Bestimmung der Phasenwerte ständig mitgeschätzt werden.
- Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß das Hintergrundgeräusch über einen Geräuschmonitor geschätzt wird, und daß ein neuer Phasenwert lediglich dann ermittelt wird, wenn der Schätzwert des Hintergrundgeräusches um einen bestimmten Faktor überschritten wird.
- Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß das Einschwingverhalten des umgebenden Raumes über einen Impulsmonitor derart geschätzt wird, daß lediglich bei starkem Energieanstieg in den Signalen ein neuer Phasenschätzwert ermittelt wird.
- Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß eine lineare Laufzeitverschiebung der Signale angenommen wird.
- Verfahren nach einem der vorhergehenden Ansprüche, da-durch gekennzeichnet, daß eine Glättung des Phasenwertes vom Wortanfang in das gesprochene Wort hinein durchgeführt wird, und daß die Varianz der Schätzung bei der Glättung der Phasenwerte mitberücksichtigt wird.
- Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet,- daß zumindest zwei Mikrofonsignale x, y mittels einer FFT (Fast Fourier Tansformation) in den Frequenzbereich transformiert werden,- daß durch spektrale Substraktion aus den transformierten Signalen die Schätzwerte X̂, Ŷ bestimmt werden,- daß aus den geschätzten Werten X̂, Ŷ der Betrag der Kreuzleistungsdichte Bxy bestimmt wird,- daß die Maxima der Kreuzleistungsdichte bestimmt werden, und daß aus einer bestimmten Anzahl Maxima der Kreuzleistungsdichte Bxy ein aktueller Wert SB für die gestörten Signale ermittelt wird, daß abhängig vom aktuellen Wert SB die Phasen φ der gestörten Signale ermittelt werden und damit der Phasenanstieg φ' bestimmt wird,- daß der Phasenanstieg φ'geglättet wird, indem über einen Impulsmonitor ein simulierter Sprachimpuls SI mit dem aktuellen Wert SB der gestörten Signale gekoppelt wird, derart, daß eine erneute Phasenschätzung lediglich dann durchgeführt wird, wenn ein starker Energieanstieg des Mikrofonsignals registriert wird, und- daß mit einem Geräuschmonitor ein Schätzwert SN für die Hintergrundgeräuschstörung ermittelt wird und mit dem aktuellen Wert SB der gestörten Signale gekoppelt wird, derart, daß eine erneute Phasenschätzung lediglich dann durch geführt wird, wenn vom Signal die Hintergrundstörung deutlich überschritten wird.
- Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß ein maximaler Phasenanstieg |φ'|max für die Phase an den einzelnen Maxima vorgebbar ist und eine erneute Phasenschätzung lediglich dann durchgeführt wird, wenn der Phasenanstieg um mindestens M' der M Maxima den maximalen Anstieg |φ'|max nicht überschreitet.
- Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß die Varianz der Phasenanstiege an den einzelnen Maxima bei der zeitlichen Glättung des Phasenanstiegs berücksichtigt wird.
- Verfahren nach den Ansprüchen 7 bis 9, dadurch gekennzeichnet, daß eine erneute Phasenschätzung lediglich dann durchgeführt wird, wenn die Bedingungen für einen gültigen Phasenanstieg zeitlich mehrfach in Folge auftreten.
- Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die gestörte Sprache auf mehr als zwei Sprachkanälen aufgenommen wird und daß die Laufzeitunterschiede der einzelnen Kanäle geschätzt werden.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE4243831A DE4243831A1 (de) | 1992-12-23 | 1992-12-23 | Verfahren zur Laufzeitschätzung an gestörten Sprachkanälen |
DE4243831 | 1992-12-23 |
Publications (3)
Publication Number | Publication Date |
---|---|
EP0612059A2 true EP0612059A2 (de) | 1994-08-24 |
EP0612059A3 EP0612059A3 (en) | 1995-08-16 |
EP0612059B1 EP0612059B1 (de) | 1999-03-17 |
Family
ID=6476383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP93120010A Expired - Lifetime EP0612059B1 (de) | 1992-12-23 | 1993-12-11 | Verfahren zur Laufzeitschätzung an gestörten Sprachkanälen |
Country Status (3)
Country | Link |
---|---|
US (1) | US5479517A (de) |
EP (1) | EP0612059B1 (de) |
DE (2) | DE4243831A1 (de) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09212196A (ja) * | 1996-01-31 | 1997-08-15 | Nippon Telegr & Teleph Corp <Ntt> | 雑音抑圧装置 |
DE19813285B4 (de) * | 1998-03-26 | 2005-12-01 | Bayerische Motoren Werke Ag | Verfahren zur automatischen Messung der Sprachverständlichkeit in Kraftfahrzeugen |
US7117149B1 (en) * | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
DE19942868A1 (de) * | 1999-09-08 | 2001-03-15 | Volkswagen Ag | Verfahren zum Betrieb einer Mehrfachmikrofonanordnung in einem Kraftfahrzeug sowie Mehrfachmikrofonanordnung selbst |
DE19955156A1 (de) * | 1999-11-17 | 2001-06-21 | Univ Karlsruhe | Verfahren und Vorrichtung zur Unterdrückung eines Störsignalanteils im Ausgangssignal eines Schallwandlermittels |
DE10118653C2 (de) * | 2001-04-14 | 2003-03-27 | Daimler Chrysler Ag | Verfahren zur Geräuschreduktion |
GB2391322B (en) * | 2002-07-31 | 2005-12-14 | British Broadcasting Corp | Signal comparison method and apparatus |
US8073689B2 (en) | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
US7949522B2 (en) * | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7885420B2 (en) | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US7725315B2 (en) | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US7895036B2 (en) | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
EP1736965B1 (de) * | 2004-04-28 | 2008-07-30 | Matsushita Electric Industrial Co., Ltd. | Hierarchische kodierungsanordnung und hierarchisches kodierungsverfahren |
US8170879B2 (en) | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US8543390B2 (en) | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US7680652B2 (en) | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8306821B2 (en) | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US7716046B2 (en) | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US7610196B2 (en) | 2004-10-26 | 2009-10-27 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US7949520B2 (en) | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US8284947B2 (en) * | 2004-12-01 | 2012-10-09 | Qnx Software Systems Limited | Reverberation estimation and suppression system |
US8027833B2 (en) | 2005-05-09 | 2011-09-27 | Qnx Software Systems Co. | System for suppressing passing tire hiss |
US8311819B2 (en) | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
US8170875B2 (en) | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
US7844453B2 (en) | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US8326620B2 (en) | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
US8335685B2 (en) * | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8904400B2 (en) | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
US8209514B2 (en) | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
EP2249333B1 (de) * | 2009-05-06 | 2014-08-27 | Nuance Communications, Inc. | Verfahren und Vorrichtung zur Schätzung einer Grundfrequenz eines Sprachsignals |
CN114859308A (zh) * | 2022-07-11 | 2022-08-05 | 陕西昱琛航空设备股份有限公司 | 一种雷达目标模拟器及其校准方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4112430A (en) * | 1977-06-01 | 1978-09-05 | The United States Of America As Represented By The Secretary Of The Navy | Beamformer for wideband signals |
US4254417A (en) * | 1979-08-20 | 1981-03-03 | The United States Of America As Represented By The Secretary Of The Navy | Beamformer for arrays with rotational symmetry |
US4333170A (en) * | 1977-11-21 | 1982-06-01 | Northrop Corporation | Acoustical detection and tracking system |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4017859A (en) * | 1975-12-22 | 1977-04-12 | The United States Of America As Represented By The Secretary Of The Navy | Multi-path signal enhancing apparatus |
DE3531230A1 (de) * | 1985-08-31 | 1987-03-05 | Krupp Gmbh | Verfahren zur detektion von fahrzeugen |
US4912767A (en) * | 1988-03-14 | 1990-03-27 | International Business Machines Corporation | Distributed noise cancellation system |
JP2791036B2 (ja) * | 1988-04-23 | 1998-08-27 | キヤノン株式会社 | 音声処理装置 |
JPH0272398A (ja) * | 1988-09-07 | 1990-03-12 | Hitachi Ltd | 音声信号用前処理装置 |
US4982375A (en) * | 1989-11-13 | 1991-01-01 | The United States Of America As Represented By The Secretary Of The Navy | Acoustic intensity probe |
-
1992
- 1992-12-23 DE DE4243831A patent/DE4243831A1/de not_active Withdrawn
-
1993
- 1993-12-11 DE DE59309463T patent/DE59309463D1/de not_active Expired - Lifetime
- 1993-12-11 EP EP93120010A patent/EP0612059B1/de not_active Expired - Lifetime
- 1993-12-23 US US08/171,472 patent/US5479517A/en not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4112430A (en) * | 1977-06-01 | 1978-09-05 | The United States Of America As Represented By The Secretary Of The Navy | Beamformer for wideband signals |
US4333170A (en) * | 1977-11-21 | 1982-06-01 | Northrop Corporation | Acoustical detection and tracking system |
US4254417A (en) * | 1979-08-20 | 1981-03-03 | The United States Of America As Represented By The Secretary Of The Navy | Beamformer for arrays with rotational symmetry |
Non-Patent Citations (2)
Title |
---|
INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 1988, Bd. 5, 11.April 1988 - 14.April 1988 NEW YORK, NY, US, Seiten 2578-2581, ZELINSKI 'A microphone array with adaptive post-filtering for noise reduction in reverberant rooms' * |
ITG-FACHTAGUNG: DIGITALE SPRACHVERARBEITUNG, 26.August 1988 - 28.August 1988 BAD NAUHEIM, Seiten 69-73, SCHLANG 'Ein Verfahren zur automatischen Ermittlung der Sprecherposition bei Freisprechen' * |
Also Published As
Publication number | Publication date |
---|---|
EP0612059A3 (en) | 1995-08-16 |
DE4243831A1 (de) | 1994-06-30 |
DE59309463D1 (de) | 1999-04-22 |
US5479517A (en) | 1995-12-26 |
EP0612059B1 (de) | 1999-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0612059B1 (de) | Verfahren zur Laufzeitschätzung an gestörten Sprachkanälen | |
DE69131883T2 (de) | Vorrichtung zur Rauschreduzierung | |
EP0586996B1 (de) | Verfahren zur Spracherkennung mit dem eine Anpassung der Sprachcharakteristiken erreicht wird | |
DE69611421T2 (de) | Verfahren zur Reduzierung von Audioaufzeichnung beeinflussenden Vor- und Nachechos | |
DE69412913T2 (de) | Verfahren und Vorrichtung für digitale Sprachkodierung mit Sprachsignalhöhenabschätzung und Klassifikation in digitalen Sprachkodierern | |
DE69612701T2 (de) | Echokompensation mit adaptivem filter im frequenzbereich | |
EP0747880B1 (de) | Spracherkennungssystem | |
EP0065210A2 (de) | Verfahren zur Aufbereitung elektrischer Signale mit einer digitalen Filteranordnung | |
EP1143416A2 (de) | Geräuschunterdrückung im Zeitbereich | |
EP0742664A2 (de) | Freisprechverfahren für ein mehrkanaliges Übertragungssystem | |
DE102008027848A1 (de) | Echounterdrücker, Echounterdrückungsverfahren und computerlesbares Speichermedium | |
EP0585976A2 (de) | Hörhilfegerät mit Unterdrückung der akustischen Rückkopplung | |
DE69616724T2 (de) | Verfahren und System für die Spracherkennung | |
DE19538996C2 (de) | Vorrichtung und Verfahren zum Schätzen von Filterkoeffizienten | |
DE60124192T2 (de) | HMM-basierte Erkennung von verrauschter Sprache | |
DE19821273B4 (de) | Meßverfahren zur gehörrichtigen Qualitätsbewertung von codierten Audiosignalen | |
DE602005000897T2 (de) | Eingangsschallprozessor | |
DE69801493T2 (de) | Sprachanalysessystem | |
EP0615226B1 (de) | Verfahren zur Geräuschreduktion für gestörte Sprachkanäle | |
EP0695045A2 (de) | Echokompensator unter Verwendung von Kurzzeitspektralanalyse | |
EP0669606B1 (de) | Verfahren zur Geräuschreduktion eines gestörten Sprachsignals | |
DE69802431T2 (de) | Verfahren und vorrichtung zur verbesserung eines digitalen sprachsignals | |
DE3230391C2 (de) | ||
DE19818608C2 (de) | Verfahren und Vorrichtung zur Sprachdetektion und Geräuschparameterschätzung | |
DE102019105458B4 (de) | System und Verfahren zur Zeitverzögerungsschätzung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
AK | Designated contracting states |
Kind code of ref document: A2 Designated state(s): DE FR GB |
|
PUAL | Search report despatched |
Free format text: ORIGINAL CODE: 0009013 |
|
AK | Designated contracting states |
Kind code of ref document: A3 Designated state(s): DE FR GB |
|
17P | Request for examination filed |
Effective date: 19950920 |
|
GRAG | Despatch of communication of intention to grant |
Free format text: ORIGINAL CODE: EPIDOS AGRA |
|
17Q | First examination report despatched |
Effective date: 19980603 |
|
GRAG | Despatch of communication of intention to grant |
Free format text: ORIGINAL CODE: EPIDOS AGRA |
|
GRAH | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOS IGRA |
|
GRAH | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOS IGRA |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): DE FR GB |
|
RAP2 | Party data changed (patent owner data changed or rights of a patent transferred) |
Owner name: DAIMLERCHRYSLER AG |
|
GBT | Gb: translation of ep patent filed (gb section 77(6)(a)/1977) |
Effective date: 19990329 |
|
REF | Corresponds to: |
Ref document number: 59309463 Country of ref document: DE Date of ref document: 19990422 |
|
ET | Fr: translation filed | ||
REG | Reference to a national code |
Ref country code: GB Ref legal event code: 732E |
|
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
26N | No opposition filed | ||
REG | Reference to a national code |
Ref country code: GB Ref legal event code: IF02 |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: 732E |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: TP |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R082 Ref document number: 59309463 Country of ref document: DE Representative=s name: GRUENECKER, KINKELDEY, STOCKMAIR & SCHWANHAEUS, DE |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R082 Ref document number: 59309463 Country of ref document: DE Representative=s name: GRUENECKER, KINKELDEY, STOCKMAIR & SCHWANHAEUS, DE Effective date: 20120411 Ref country code: DE Ref legal event code: R081 Ref document number: 59309463 Country of ref document: DE Owner name: NUANCE COMMUNICATIONS, INC. (N.D.GES.D. STAATE, US Free format text: FORMER OWNER: HARMAN BECKER AUTOMOTIVE SYSTEMS GMBH, 76307 KARLSBAD, DE Effective date: 20120411 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: TP Owner name: NUANCE COMMUNICATIONS, INC., US Effective date: 20120924 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: DE Payment date: 20121205 Year of fee payment: 20 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: GB Payment date: 20121205 Year of fee payment: 20 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: FR Payment date: 20130107 Year of fee payment: 20 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R071 Ref document number: 59309463 Country of ref document: DE |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: PE20 Expiry date: 20131210 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: GB Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION Effective date: 20131210 Ref country code: DE Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION Effective date: 20131212 |