DE102004005998B3 - Verfahren und Vorrichtung zur Separierung von Schallsignalen - Google Patents

Verfahren und Vorrichtung zur Separierung von Schallsignalen Download PDF

Info

Publication number
DE102004005998B3
DE102004005998B3 DE102004005998A DE102004005998A DE102004005998B3 DE 102004005998 B3 DE102004005998 B3 DE 102004005998B3 DE 102004005998 A DE102004005998 A DE 102004005998A DE 102004005998 A DE102004005998 A DE 102004005998A DE 102004005998 B3 DE102004005998 B3 DE 102004005998B3
Authority
DE
Germany
Prior art keywords
sound
angle
signal
frequency
incidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE102004005998A
Other languages
English (en)
Inventor
Dietmar Ruwisch
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE102004005998A priority Critical patent/DE102004005998B3/de
Priority to AT05707893T priority patent/ATE348492T1/de
Priority to US10/557,754 priority patent/US7327852B2/en
Priority to DE502005000226T priority patent/DE502005000226D1/de
Priority to PCT/EP2005/050386 priority patent/WO2005076659A1/de
Priority to EP05707893A priority patent/EP1595427B1/de
Application granted granted Critical
Publication of DE102004005998B3 publication Critical patent/DE102004005998B3/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

Bei einem Verfahren zur Separierung von Schallsignalen von einer Mehrzahl von Schallquellen, umfassend die Schritte DOLLAR A - Anordnen von zwei Mikrofonen (MIK1, MIK2) in einem vorbestimmten Abstand (d) zueinander; DOLLAR A - Erfassen der Schallsignale mit beiden Mikrofonen (MIK1, MIK2) und Erzeugen zugeordneter Mikrofonsignale (m1, m2) und DOLLAR A - Separieren des Schallsignals einer der Schallquellen (S1) von den Schallsignalen der anderen Schallquellen (S2), basierend auf den Mikrofonausgangssignalen (m1, m2), DOLLAR A wird vorgeschlagen, dass der Schritt des Separierens umfasst: DOLLAR A - Fourier-Transformieren der Mikrofonausgangssignale zur Ermittlung ihrer Frequenzspektren (M1, M2); DOLLAR A - Bestimmen der Phasendifferenz (phi) zwischen den beiden Mikrofonausgangssignalen (m1, m2) für jede Frequenzkomponente ihrer Frequenzspektren (M1, M2); DOLLAR A - Bestimmen des Einfallswinkel (theta) jedes einer Frequenz der Frequenzspektren (M1, M2) zugeordneten Schallsignals, basierend auf dem relativen Phasenwinkel (phi) und der Frequenz; DOLLAR A - Erzeugen eines Signalspektrums (S) eines auszugebenden Signals durch Verknüpfen eines der beiden Frequenzspektren (M1, M2) mit einer Filterfunktion (F¶theta0¶), die derart gewählt ist, dass Schallsignale aus einer Umgebung (gamma¶3dB¶) um einen bevorzugten Einfallswinkel (theta¶0¶) herum relativ zu Schallsignalen von außerhalb dieser Umgebung (gamma¶3dB¶) verstärkt werden; und DOLLAR A - inverses Fourier-Transformieren des derart erzeugten Signalspektrums.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zur Separierung von Schallsignalen.
  • Die Erfindung liegt auf dem Gebiet der digitalen Signalverarbeitung zum Entmischen verschiedener akustischer Signale aus unterschiedlichen Raumrichtungen, welche mit zwei Mikrofonen in bekanntem Abstand stereo aufgenommen werden.
  • Das Gebiet der Quellentrennung, auch „beam forming" genannt, erfährt wachsende Bedeutung durch die Zunahme der mobilen Kommunikation sowie der automatischen Verarbeitung menschlicher Sprache. In sehr vielen Anwendungen tritt das Problem auf, dass das gewünschte Sprachsignal (Nutzsignal) durch verschiedene Störeinflüsse beeinträchtigt ist. Hier sind hauptsächlich Störungen durch Hintergrundgeräusche, Störungen durch andere Sprecher sowie Störungen durch Lautsprecherausgaben von Musik oder Sprache zu nennen. Die verschiedenen Störeinflusse erfordern je nach Ihrer Art und nach der Vorkenntnis über das Nutzsignal unterschiedliche Behandlungen.
  • Beispielhafte Anwendungen der Erfindung finden sich also in Kommunikationseinrichtungen, in denen die Position eines Sprechers bekannt ist, und in denen Störungen durch Hintergrundgeräusche oder andere Sprecher sowie Lautsprecherausgaben vorhanden sind. Anwendungsbeispiele sind Kfz-Freisprecheinrichtungen, in denen die Mikrofone z.B. im Rückspiegel untergebracht sind und eine sogenannte Richthyperbel auf den Fahrer gerichtet wird. In dieser Anwendung kann eine zweite Richthyperbel auf den Beifahrer gerichtet werden, so dass während eines Telefongesprächs gezielt zwischen Fahrer und Beifahrer hin- und hergeschaltet werden kann.
  • In Fällen, in denen die geometrische Position der Nutzsignalquelle zu den aufnehmenden Mikrofonen bekannt ist, ist die geometrische Quellenseparation ein mächtiges Werkzeug. Das Standardverfahren dieser Klasse von „beam forming"- Algorithmen ist das sog. „shift and add" Verfahren, bei welchem auf eines der Mikrofonsignale ein Filter angewendet wird, und das gefilterte Signal sodann zum zweiten Mikrofonsignal hinzuaddiert wird (siehe z.B. Haddad und Benoit, „Capabilities of a beamforming technique for acoustic measurements inside a moving car", The 2002 International Congress and Exposition On Noise Control Engineering, Deaborn, Mi, USA, August 19-21, 2002).
  • Eine Erweiterung dieses Verfahrens beschäftigt sich mit „adaptiven beam forming" bzw. „adaptiver Quellenseparation", wo die Lage der Quellen im Raum a priori unbekannt ist und durch die Algorithmen erst ermittelt werden muss (WO 02/06173 A1, US 6,654,719 B1 ). Hier ist es das Ziel, die Lage der Quellen im Raum aus den Mikrofonsignalen zu bestimmen und nicht, wie beim „geometrischen" beam forming, fest vorzugeben. Adaptive Verfahren erweisen sich zwar als nützlich, allerdings ist auch hier gewöhnlich a-priori-Information erforderlich, da ein Algorithmus in der Regel nicht entscheiden kann, welche der detektierten Sprachquellen Nutz- und welche Störsignal ist. Nachteilig bei allen bekannten adaptiven Verfahren ist die Tatsache, dass die Algorithmen eine gewisse Adaptionszeit benötigen, bevor ausreichende Konvergenz besteht und die Quellentrennung gelingt. Außerdem sind adaptive Verfahren prinzipiell anfälliger für diffuse Hintergrundstörungen, da diese die Konvergenz erheblich beeinträchtigen können. Ein gravierender Nachteil beim klassischen „shift and add"-Verfahren ist die Tatsache, dass sich mit zwei Mikrofonen lediglich zwei Signalquellen voneinander separieren lassen und die Dämpfung von diffusem Hintergrundschall in der Regel nicht in ausreichendem Maße gelingt.
  • Aus der DE 69314514 T2 ist ein Verfahren zur Separierung von Schallsignalen gemäß dem Oberbegriff von Anspruch 1 bekannt. Das in diesem Dokument vorgeschlagene Verfahren führt eine Separation der Schallsignale dergestalt durch, dass ein gewünschtes Nutzschallsignal von Umgebungsrauschen befreit wird, und nennt als Anwendungsbeispiele die Sprachsignale eines Fahrzeuginsassen, die auf Grund des allgemeinen und nicht lokalisierten Fahrzeuglärms nur schwer verständlich sind.
  • Zum Herausfiltern des Sprachsignals schlägt dieses Dokument des Stands der Technik vor, mit Hilfe von zwei Mikrophonen jeweils ein Gesamtschallsignal zu messen, jedes der beiden Mikrophonsignale zur Ermittlung seines Frequenzspektrums einer Fouriertransformation zu unterziehen, in mehreren Frequenzbändern basierend auf der jeweiligen Phasendifferenz einen Einfallswinkel des jeweiligen Signals zu bestimmen, und schließlich die eigentliche "Filterung" vorzunehmen. Hierzu wird ein bevorzugter Einfallswinkel bestimmt, und dann eine Filterfunktion, nämlich ein Rauschspektrum, von einem der beiden Frequenzspektren subtrahiert, wobei dieses Rauschspektrum derart gewählt ist, dass Schallsignale aus der Umgebung des bevorzugten Einfallswinkels, der dem Sprecher zugeordnet ist, relativ zu den anderen Schallsignalen, die im wesentlichen Hintergrundlärm des Fahrzeugs darstellen, verstärkt werden. Das derart gefilterte Frequenzspektrum wird anschließend einer inversen Fourier-Transformation unterzogen und als gefiltertes Schallsignal ausgegeben.
  • Das in der DE 69314514 T2 offenbarte Verfahren leidet an mehreren Nachteilen:
    • a) Die Schallsignalseparation gemäß diesem Dokument des Stands der Technik basiert auf dem vollständigen Entfernen eines Anteils des ursprünglich gemessenen Gesamtschallsignals, nämlich demjenigen Anteil, der als Rauschen bezeichnet wird. Dieses Dokument geht nämlich von einem akustischen Szenario aus, bei dem nur eine einzige Nutzschallquelle vorhanden ist, deren Signale gleichsam eingebettet sind in Störsignale von nicht beziehungsweise weniger lokalisierten Quellen, insbesondere Fahrzeuglärm. Das Verfahren gemäß diesem Dokument des Stands der Technik erlaubt daher ausschließlich das Herausfiltern dieses einen Nutzsignals durch vollständiges Eliminieren aller Rauschsignale. In Fällen mit einem einzigen Nutzschallsignal mag das Verfahren gemäß dieses Dokuments zufriedenstellende Ergebnisse liefern. Es kann jedoch auf Grund seines Grundprinzips nicht sinnvoll in Situationen eingesetzt werden, in denen nicht nur eine Nutzschallquelle, sondern mehrere derartige Quellen zum Gesamtschallsignal beitragen. Dies liegt insbesondere daran, dass gemäß dieser Lehre nur ein einziger sog. dominanter Ankunftswinkel verarbeitet werden kann, nämlich derjenige Einfallswinkel, unter dem das energiereichste Schallsignal einfällt. Alle Signale, die unter anderen Ankunftswinkeln auf die Mikrophone fallen, werden zwangsläufig als Rauschen behandelt.
    • b) Darüber hinaus scheint dieses Dokument selbst davon auszugehen, dass die dort vorgeschlagene Filterung in Form einer Subtraktion des Rauschspektrums von einem der beiden Frequenzspektren noch keine zufriedenstellenden Ergebnisse liefert. Daher sieht dieses Dokument zusätzlich, nämlich unmittelbar vor dieser eigentlichen Filterung, noch eine weitere Signalverarbeitung vor: Es werden nämlich in allen Frequenzbändern, nachdem der dominante Einfallswinkel bestimmt worden ist, durch entsprechende Phasenverschiebung eines der beiden fourier-transformierten Schallsignale in diesem Frequenzband die Rauschanteile im jeweiligen Frequenzband relativ zu den in diesem Frequenzband möglicherweise ebenfalls enthaltenen Nutzschallsignalen abgeschwächt. Somit sieht dieses Dokument die in ihr offenbarte Filterung in Form einer Subtraktion des Rauschspektrums offenbar selbst als ungenügend an, so dass sie selbst weitere, nämlich unmittelbar vorhergehende Signalverarbeitungsschritte vorschlägt, die durch hierfür gesondert bereitgestellte Bauteile vorgenommen werden. Insbesondere benötigt das System zusätzlich zu einer Rauschspektrumsubtraktionsvorrichtung (Vorrichtung 24 in der einzigen Figur dieses Dokuments) vorgeschaltete Mittel 20 zur Phasenverschiebung sowie Mittel 21 zur phasenrichtigen Addition von Spektren in den einzelnen Frequenzbändern (vergleiche die entsprechenden Bauteile in der einzigen Figur dieses Dokuments).
  • Hierdurch werden das Verfahren und die zu seiner Durchführung erforderliche Vorrichtung aufwendig.
  • Es ist daher Aufgabe der vorliegenden Erfindung, ein Verfahren zur Separierung von Schallsignalen von einer Mehrzahl von Schallquellen sowie eine entsprechende Vorrichtung vorzuschlagen, die durch den reinen Filterschritt eine ausreichende Qualität der Ausgangssignale erzeugen, ohne zuvor eine phasenrichtige Addition von Schallspektren in verschiedenen Frequenzbändern durchführen zu müssen, um eine zufriedenstellende Separierung zu erzielen, und die es ferner erlaubt, nicht nur Signale einer einzigen Nutzschallquelle von allen anderen Schallsignalen zu befreien, sondern grundsätzlich in der Lage ist, Schallsignale von einer Mehrzahl von Schallquellen ohne Eliminierung separat auszugeben.
  • Erfindungsgemäß wird diese Aufgabe durch ein Verfahren nach Anspruch 1 bzw. eine Vorrichtung nach Anspruch 7 gelöst. Vorteilhafte Weiterbildungen der Erfindung sind in den jeweiligen Unteransprüchen definiert.
  • Das erfindungsgemäße Verfahren benötigt keine Konvergenzzeit und kann mit zwei Mikrofonen mehr als zwei Schallquellen im Raum separierbaren, sofern diese in ausreichendem Maße räumlich getrennt sind. Das Verfahren stellt nur geringe Anforderungen an Speicherbedarf und Rechenleistung, und es ist sehr stabil gegenüber diffusen Störsignalen. Anders als beim herkömmlichen beam forming lassen sich solche diffusen Störungen effektiv dämpfen. Wie bei allen Zwei-Mikrofon-Verfahren sind die Raumbereiche, zwischen denen das Verfahren differenzieren kann, rotationssymmetrisch zur Mikrofon-Achse, d.h. zu der Geraden, welche durch die beiden Mikrofonpositionen definiert ist. In einem Schnitt durch den Raum, welcher die Symmetrieachse enthält, entspricht der Raumbereich, in dem sich eine Schallquelle befinden muss um als Nutzsignal betrachtet zu werden, einer Hyperbel. Der Winkel ϑ0, den der Scheitel der Hyperbel zur Symmetrieachse einnimmt, ist frei wählbar, und die Breite der Hyperbel, welche durch einen Winkel γ3db bestimmt wird, ist ebenfalls ein wählbarer Parameter. Mit nur zwei Mikrofonen lassen sich gleichzeitig Ausgangssignale zu beliebigen, verschiedenen Winkeln ϑ0 erzeugen, wobei die Trennschärfe zwischen den Bereichen mit dem Überlappungsgrad der entsprechenden Hyperbeln abnimmt. Schallquellen innerhalb einer Hyperbel werden als Nutzsignale betrachtet und mit weniger als 3 db gedämpft. Störsignale werden in Abhängigkeit ihres Einfallswinkels ϑ eliminiert, wobei eine Dämpfung von >25db für Einfallswinkel ϑ außerhalb der Akzeptanzhyperbel erreichbar ist.
  • Das Verfahren arbeitet im Frequenzbereich. Das einer Richthyperbel zuzuordnende Signalspektrum entsteht durch Multiplikation einer Korrekturfunktion K2(x1) sowie einer Filterfunktion F(f,T) mit dem Signalspektrum M(f,T) eines der Mikrofone. Die Filterfunktion entsteht durch spektrale Glättung (z.B. durch Diffusion) einer Zuordnungsfunktion Z(ϑ-ϑ0), wobei im Argument der Zuordnungsfunktion der berechnete Einfallswinkel ϑ einer spektralen Signalkomponente steht. Dieser Einfallswinkel ϑ wird aus dem Phasenwinkel φ des komplexen Quotienten der Spektren der beiden Mikrofonsignale, M2(f,T)/M1(f,T), ermittelt, indem man φ mit der Schallgeschwindigkeit c multipliziert und durch 2πfd dividiert, wobei d den Mikrofonabstand bezeichnet. Das Ergebnis x1 = φc/2πfd, welches zugleich das Argument der Korrekturfunktion K2(x1) ist, liefert nach Beschränkung x=K1(x1) auf einen Betrag kleiner oder gleich eins den Kosinus des Einfallswinkels ϑ, welcher im Argument der Zuordnungsfunktion Z(ϑ-ϑ0) steht; K1(x1) bezeichnet dabei eine weitere Korrekturfunktion.
  • Kurzbeschreibung der Abbildungen:
  • 1 zeigt die Definition des Einfallswinkels ϑ durch die Positionen beiden Mikrofone, deren Signale verarbeitet werden.
  • 2 zeigt beispielhaft eine Zuordnungsfunktion Z(ϑ) mit Halbwertsbreite 2γ3db aus welcher eine Hyperbel mit Scheitel bei ϑ=0 resultiert.
  • 3 zeigt eine Hyperbel mit Scheitel bei ϑ=ϑ0, die die Richtcharakteristik der Quellenseparation bestimmt. Signale innerhalb des durch die Hyperbel definierten Raumbereichs werden mit einer Dämpfung <3db als Nutzsignal ausgegeben
  • 4 zeigt den Aufbau des Quellenseparators, in welchem die Zeitsignale zweier Mikrofone, m1(t) und m2(t), in einer Stereo-Abstast- und -Fourier-Transformator-Einheit (20) zu Spektren M1(f,T) und M2(f,T) transformiert werden, wobei T den Zeitpunkt der Entstehung der Spektren bezeichnet. Aus den Spektren wird in der ϑ-Berechnungseinheit (30) der frequenzabhängige Einfallswinkel ϑ(f,T) sowie das korrigierte Mikrofonspektrum M(f,T) berechnet, woraus in Signalgeneratoren (40) für verschiedene Richtwinkel ϑ0 Ausgangssignale sϑ0(t) entstehen.
  • 5 zeigt den Aufbau der ϑ-Berechnungseinheit (30), in welcher der Phasenwinkel φ(f,T) einer spektralen Komponenten des komplexen Quotienten der beiden Mikrofonspektren M1(f,T) und M2(f,T) berechnet wird, welcher sodann mit der Schallgeschwindigkeit c zu multiplizieren und durch 2πfd zu dividieren ist, wobei d den Mikrofonabstand bezeichnet. Bei dieser Operation entsteht die Größe x1(f,T), welche das Argument der beiden Korrekturfunktionen K2 und K1 darstellt. Mit diesen Korrekturfunktionen entsteht das korrigierte Mikrofonspektrum M(f,T)=M1(f,T)·K2(x1(f,T)) sowie die Größe x(f,T)=K1(x1(f,T)), aus welcher durch Anwendung der Arcuskosinus-Funktion der Einfallswinkel ϑ(f,T) zu berechnen ist.
  • 6 zeigt einen Signalgenerator, in welcher eine Zuordnungsfunktion Z(ϑ-ϑ0) mit einem einstellbaren Winkel ϑ0 durch spektrale Diffusion zu einer Filterfunktion F(f,T) geglättet wird, welche mit dem korrigierten Mikrofonspektrum M(f,T) zu multiplizieren ist. Daraus resultiert ein Ausgangsspektrum Sϑ0 (f,T), aus welchem durch inverse Fouriertransformation ein Ausgangssignal sϑ0(t) entsteht, welches die Schallsignale innerhalb des durch die Zuordnungsfunktion Z und den Winkel ϑ0 festgelegten Raumbereichs enthält.
  • 7 zeigt exemplarisch die beiden Korrekturfunktionen K2(x1) und K1(x1).
  • Ein Grundgedanke der Erfindung ist es, jeder spektralen Komponente des einfallenden Signals zu jedem Zeitpunkt T einen Einfallswinkel ϑ zuzuordnen und allein anhand des berechneten Einfallswinkels zu entscheiden, ob die entsprechende Schallquelle innerhalb einer gewünschten Richthyperbel liegt, oder nicht. Um die Zugehörigkeitsentscheidung etwas abzumildern, wird anstatt einer harten Ja/Nein-Entscheidung eine „weiche" Zuordnungsfunktion Z(ϑ) (2) benutzt, die einen kontinuierlichen Übergang zwischen erwünschten und unerwünschten Einfallsrichtungen erlaubt, was sich vorteilhaft auf die Integrität der Signale auswirkt. Die Breite der Zuordnungsfunktion entspricht dann der Breite der Richthyperbel ( 3). Durch Division der komplexen Spektren der beiden Mikrofonsignale wird zunächst für jede Frequenz f zu einem Zeitpunkt T die Phasendifferenz φ berechnet. Mit Hilfe der Schallgeschwindigkeit c und der Frequenz f der entsprechenden Signalkomponente lässt sich aus der Phasendifferenz ein Wegunterschied berechnen, der zwischen den beiden Mikrofonen liegt, wenn das Signal von einer Punktquelle ausgesandt wurde. Ist der Mikrofonabstand d bekannt, ergibt eine einfache geometrische Überlegung, dass der Quotient x1 aus Wegunterschied und Mikrofonabstand dem Kosinus des gesuchten Einfallswinkels entspricht. In der Praxis ist aufgrund von Störungen wie diffusem Störschall oder Raumhall die Annahme einer Punktquelle selten erfüllt, weshalb x1 gewöhnlich nicht auf den erwarteten Wertebereich [–1,1] beschränkt ist. Bevor der Einfallswinkel ϑ berechnetet werden kann, ist daher noch eine Korrektur erforderlich, die x1 auf das genannte Intervall beschränkt. Wurde zum Zeitpunkt T für jede Frequenz f der Einfallswinkel ϑ(f,T) bestimmt, ergibt sich das Spektrum des gewünschten Signals innerhalb einer Richthyperbel mit Scheitel beim Winkel ϑ=ϑ0 durch einfache frequenzweise Multiplikation mit dem Spektrum eines der Mikrofone, also M1(f,T)K(ϑ(f,T)-ϑ0). Unter Umständen ist es vorteilhaft, K(ϑ(f,T)-ϑ0) vor Ausführung der Multiplikation spektral zu glätten. Eine Glättung, deren Ergebnis als Fϑ0(f,T) bezeichnet sei, erhält man z.B. durch Anwendung eines Diffusionsoperators. In Fällen, in denen durch Störeinflüsse die Größe x, die zur Berechnung des Einfallswinkels dient, außerhalb ihres Wertebereichs liegt, ist es vorteilhaft, die entsprechende spektrale Komponente des Mikrofonsignals abzuschwächen, da zu vermuten ist, dass sich Störsignale überlagert haben. Dies geschieht z.B. durch Anwendung einer Korrekturfunktion, deren Argument die Größe x1 ist. Sei M(f,T) das korrigierte Mikrofonsignal, dann schreibt sich die Erzeugung des gewünschten Signalspektrums inklusive spektraler Glättung und Korrektur als Sϑ0(f,T)=Fϑ0(f,T)M(f,T). Aus Sϑ0(f,T) ensteht durch inverse Fouriertransformation das Zeitsignal sϑ0(t) für die entsprechende Richthyperbel mit Scheitelwinkel ϑ0.
  • Anders ausgedrückt ist es eine Grundidee der Erfindung, verschiedene Schallquellen, beispielsweise den Fahrer und den Beifahrer in einem Kraftfahrzeug, räumlich voneinander zu unterscheiden und somit beispielsweise das Nutz-Sprachsignal des Fahrers vom Stör-Sprachsignal des Beifahrers zu separieren, indem man die Tatsache ausnutzt, dass diese beiden Sprachsignale, also Schallsignale, in der Regel auch bei unterschiedlichen Frequenzen vorliegen. Die erfindungsgemäß vorgesehene Frequenzanalyse erlaubt also zunächst, das Gesamt-Schallsignal in die zwei Einzel-Schallsignale (nämlich vom Fahrer und vom Beifahrer) aufzuspalten. Es muß dann "nur noch" mit Hilfe geometrischer Überlegungen anhand der jeweiligen Frequenz jedes der beiden Schallsignale und der zu ermittelnden Phasendifferenz zwischen dem Ausgangssignal des Mikrofons 1 und des Mikrofons 2, die jeweils diesem Schallsignal zugeordnet sind, die Einfallsrichtung jedes der beiden Schallsignale berechnet werden. Da die Geometrie zwischen beispielsweise der Position des Fahrers, der Position des Beifahrers und der Position der Mikrofone, etwa in einer Freisprecheinrichtung im Kraftfahrzeug, bekannt ist, kann dann das weiter zu verarbeitende Nutz-Schallsignal aufgrund seines anderen Einfallswinkels vom Stör-Schallsignal separiert werden.
  • Es folgt ein detailliertes Ausführungsbeispiel der Erfindung, das anhand der Abbildungen beschrieben wird.
  • Die Zeitsignale m1(t) und m2(t) zweier Mikrofone, die einen festen Abstand d zueinander haben, werden einem Rechenwerk (10) zugeführt (4), wo sie in einer Stereo-Abtast- und -Fourier-Transformator-Einheit (20) mit einer Abtastrate fA diskretisiert und digitalisiert werden. Eine Folge von a Abtastwerten jeweils eines der Mikrofonsignale m1(t) und m2(t) wird durch Fourier-Transformation zum komplexwertigen Spektrum M1(f,T) bzw. M2(f,T) transformiert, wobei f die Frequenz der jeweiligen Signalkomponente bezeichnet, und T den Zeitpunkt der Entstehung eines Spektrums angibt. Für die praktische Anwendung ist folgende Parameterwahl geeignet: fA = 11025 Hz, a=256, T a/2=t. Wenn Rechenleitung und Speicherplatz es erlauben, ist jedoch a=1024 zu bevorzugen. Der Mikrofonabstand d sollte kleiner sein als die halbe Wellenlänge der höchsten zu verarbeitenden Frequenz, welche sich aus der Abtastfrequenz ergibt, d.h. d < c/4fA. Für die oben angegebene Parameterwahl eignet sich ein Mikrofonabstand d = 20 mm.
  • Die Spektren M1(f,T) und M2(f,T) werden einer ϑ-Berechnungseinheit mit Spektrum-Korrektur (30) zugeführt, die aus den Spektren M1(f,T) und M2(f,T) einen Einfallswinkel ϑ(f,T) berechnet, der angibt, aus welcher Richtung relativ zur Mikrofonachse eine Signalkomponente mit Frequenz f zum Zeitpunkt T in die Mikrofone einfällt (1). Dazu wird M2(f,T) durch M1(f,T) komplex dividiert. φ(f,T) bezeichne den Phasenwinkel dieses Quotienten. Wo Verwechslungen ausgeschlossen sind, wird im folgenden das Argument (f,T) der zeit- und frequenzabhängigen Größen fortgelassen. Die genaue Rechenvorschrift zur Bestimmung von φ lautet gemäß der Eulerschen Formel und den Rechenregeln für komplexe Zahlen: φ=arctan((Re1·Im2-Im1·Re2)/(Re1·Re2+Im1·Im2)),wobei Re1 und Re2 die Realteile und Im1 und Im2 die Imaginärteile von M1 bzw. M2 bezeichnen. Die Größe x1=φc/2πfd entsteht mit Hilfe der Schallgeschwindigkeit c aus dem Winkel φ, auch x1 ist frequenz- und zeitabhängig: x1=x1(f,T). Der Wertebereich von x1 muss in der Praxis mit Hilfe einer Korrekturfunktion x=K1(x1) (7) auf das Intervall [–1,1] beschränkt werden. Auf die so berechnete Größe x wird durch Anwendung der Arcuskosinus-Funktion ein Einfallswinkel ϑ der betrachteten Signalkomponente errechnet, welcher von der Mikrofonachse zu messen ist, d.h. von der durch die Positionen der beiden Mikrofone definierten Geraden (1). Unter Berücksichtigung aller Abhängigkeiten lautet damit der Einfallswinkel einer Signalkomponente mit Frequenz f zum Zeitpunkt T: ϑ(f,t)=arccos(x(f,T)). Des weiteren wird mit Hilfe einer zweiten Korrekturfunktion K2(x1) das Mikrofonspektrum korrigiert (7): M(f,T)=K2(x1)M1(f,T). Diese Korrektur dient dazu, in Fällen, in denen die erste Korrekturfunktion greift, die entsprechende Signalkomponente zu reduzieren, da zu vermuten ist, dass sich Störungen überlagert haben, die das Signal verfälschen. Die zweite Korrektur ist optional, alternativ kann auch M(f,T)=M1(f,T) gewählt werden; M(f,T)=M2(f,T) ist ebenfalls möglich.
  • Das Spektrum M(f,T) wird zusammen mit dem Winkel ϑ(f,T) einem oder mehreren Signalgeneratoren (40) zugeführt, wo mit Hilfe einer Zuordnungsfunktion Z(ϑ) (2) und einem wählbaren Winkel ϑ0 jeweils ein auszugebendes Signal sϑ0(t) entsteht. Dies geschieht, indem zu einem Zeitpunkt T jede spektrale Komponente des Spektrums M(f,T) mit der entsprechenden Komponente eines ϑ0-spezifischen Filters Fϑ0(f,T) multipliziert wird. Fϑ0(f,T) entsteht durch spektrale Glättung von Z(ϑ-ϑ0). Diese Glättung erfolgt z.B. durch spektrale Diffusion: Fϑ0(f,T) = Z(ϑ(f,T)-ϑ0) + DΔ2 fZ(ϑ(f,T)-ϑ0).
  • Dabei bezeichnet D die Diffusionskonstante, welche ein frei wählbarer Parameter größer oder gleich null ist. Der diskrete Diffusionsoperators Δ2 f ist eine Abkürzung für Δ2 fZ(ϑ(f,T)-ϑ0)) = (Z(ϑ(f-fA/a),T)-ϑ0)-2Z(ϑ(f,T)-ϑ0))+Z(ϑ(f+ fA/a,T)-ϑ0))/(fA/a)2.
  • Der auftretende Quotient fA/a aus Abtastrate fA und Anzahl a der Abtastwerte entspricht dem Abstand zweier Frequenzen im diskreten Spektrum. Durch Anwendung des so erzeugten Filters Fϑ0(f,T) entsteht ein Spektrum Sϑ0(f,T)=Fϑ0(f,T)M(f,T), welches durch inverse Fouriertransformation in das Zeitsignal sϑ0(t) übergeht.
  • Das von einem Signalgenerator (40) auszugebene Signal sϑ0(t) entspricht dem Schallsignal innerhalb desjenigen Raumbereichs, der durch die Zuordnungsfunktion Z(ϑ) und den Winkel ϑ0 definiert ist. Der Einfachheit halber wird in der gewählten Nomenklatur für verschiedene Signalgeneratoren nur von einer Zuordnungsfunktion Z(ϑ) ausgegangen, verschiedene Signalgeneratoren benutzen lediglich verschiedene Winkel ϑ0. Praktisch spricht natürlich nichts dagegen, in jedem Signalgenerator auch eine eigene Form der Zuordnungsfunktion zu wählen. Die Anwendung von Zuordnungsfunktionen, welche über die Zugehörigkeit von Signalkomponenten zu verschiedenen Raumbereichen entscheiden, ist einer der zentralen Gedanken der Erfindung. Eine Zuordnungsfunktion muss eine gerade Funktion sein, geeignete Funktionen sind z.B. Z(ϑ)=((1+cosϑ)/2)n mit einem Parameter n>0. Der Raumbereich, in welchem Signale mit weniger als 3db gedämpft werden, entspricht einer Hyperbel mit Öffnungswinkel 2γ3db (3) und Scheitel bei dem Winkel ϑ0. Hierbei entspricht 2γ3db dem Halbwertswinkel der Zuordnungsfunktion Z(ϑ) (2), mit der angegebenen Formel für die Zuordnungsfunktion gilt γ3db=arc cos(21-1/n-1). Bei diesen zweidimensionalen geometrischen Überlegungen ist zu beachten, dass der tatsächliche Bereich des dreidimensionalen Raums, aus welchem mit dem beschriebenen Verfahren Schallsignale extrahiert werden, ein Rotationshyperboloid ist, der durch Rotation der beschriebene Hyperbel um die Mikrofonachse entsteht.
  • Selbstverständlich ist die vorliegende Erfindung nicht auf den Einsatz in Kraftfahrzeugen und Freisprecheinrichtungen beschränkt: Weitere Anwendungen sind Konferenz-Telefonanlagen, bei denen mehrere Richthyperbeln in verschiedene Raumrichtungen gelegt werden, um die Sprachsignale einzelner Personen zu extrahieren und Rückkopplungen bzw. Echo-Effekte zu vermeiden. Des weiteren lässt sich das Verfahren mit einer Kamera kombinieren, wobei die Richthyperbel stets in die gleiche Richtung blickt wie die Kamera, und so nur aus dem Bildbereich kommende Schallsignale aufgezeichnet werden. In Bildtelefonsystemen ist mit der Kamera zugleich ein Monitor verbunden, in den die Mikrofonanordnung ebenfalls eingebaut werden kann, um eine Richthyperbel senkrecht zur Monitor-Oberfläche zu generieren, denn es ist zu erwarten, dass sich der Sprecher vor dem Monitor befindet.
  • Eine ganz andere Klasse von Anwendungen ergibt sich, wenn man anstatt des auszugebenden Signals den ermittelten Einfallswinkel ϑ auswertet, indem man z.B. zu einem Zeitpunkt T über Frequenzen f mittelt. Ein solche ϑ(T)-Auswertung kann zu Überwachungszwecken benutzt werden, wenn innerhalb eines ansonsten ruhigen Raums die Position einer Schallquelle geortet werden soll.
  • Das richtige "Ausschneiden" des gewünschten Bereichs entsprechend dem zu separierenden Nutz-Schallsignal aus einem Mikrofonspektrum muss nicht, wie in 6 beispielhaft gezeigt, durch Multiplikation mit einer Filterfunktion erfolgen, deren Zuordnungsfunktion den in 2 gezeigten beispielhaften Verlauf hat. Jede andere Art der Verknüpfung des Mikrofonspektrums mit einer Filterfunktion ist geeignet, solange diese Filterfunktion und diese Verknüpfung dazu führen, dass Werte im Mikrofonspektrum umso stärker "gedämpft" werden, je weiter ihr zugeordneter Einfallswinkel ϑ vom bevorzugten Einfallswinkel ϑ0 (beispielsweise der Richtung des Fahrers im Kraftfahrzeug) entfernt ist.
  • 10
    Rechenwerk zur Durchführung der erfindungsgemäßen
    Verfahrensschritte
    20
    Stereo-Abtast- und -Fourier-Transformator-Einheit
    30
    ϑ-Berechnungseinheit
    40
    Signalgenerator
    a
    Anzahl der Abtastwerte, die zu Spektren M1 bzw. M2 transformiert
    werden
    d
    Mikrofonabstand
    D
    Diffusionskonstante, wählbarer Parameter größer oder gleich Null
    Δ2 f
    Diffusionsoperator
    f
    Frequenz
    fA
    Abtastrate
    K1
    erste Korrekturfunktion
    K2
    zweite Korrekturfunktion
    m1(t)
    Zeitsignal des ersten Mikrofons
    m2(t)
    Zeitsignal des zweiten Mikrofons
    M1(f,T)
    Spektrum zum Zeitpunkt T des ersten Mikrofonsignals
    M2(f,T)
    Spektrum zum Zeitpunkt T des zweiten Mikrofonsignals
    M(f,t)
    Spektrum zum Zeitpunkt T des korrigierten Mikrofonsignals
    sϑ0(t)
    erzeugtes Zeitsignal, entsprechend einem Winkel ϑ0 der
    Richthyperbel
    Sϑ0(f,T)
    Spektrum des Signals sϑ0(t)
    γ3db
    Winkel, welcher die Halbwertsbreite einer Zuordnungsfunktion
    Z(ϑ) bestimmt
    φ
    Phasenwinkel des komplexen Quotienten M2/M1
    ϑ(f,T)
    Einfallswinkel einer Signalkomponente, gemessen von der
    Mikrofonachse
    ϑ0
    Winkel des Scheitels einer Richthyperbel, Parameter in Z(ϑ-ϑ0)
    x, x1
    Zwischengrößen bei der ϑ-Berechnung
    t
    Zeitbasis der Signalabtastung
    T
    Zeitbasis der Spektrumerzeugung
    Z(ϑ)
    Zuordnungsfunktion

Claims (9)

  1. Verfahren zur Separierung von Schallsignalen von einer Mehrzahl von Schallquellen (S1, S2), umfassend die Schritte: – Anordnen von zwei Mikrofonen (MIK1, MIK2) in einem vorbestimmten Abstand (d) zueinander; – Erfassen der Schallsignale mit beiden Mikrofonen (MIK1, MIK2) und Erzeugen zugeordneter Mikrofonsignale (m1, m2); und – Separieren des Schallsignals einer der Schallquellen (S1) von den Schallsignalen der anderen Schallquellen (S2) basierend auf den Mikrofonsignalen (m1, m2), wobei der Schritt des Separierens die Schritte umfaßt: – Fourier-Transformieren der Mikrofonsignale zur Ermittlung ihrer Frequenzspektren (M1, M2); – Bestimmen der Phasendifferenz (φ) zwischen den beiden Mikrofonsignalen (m1, m2) für jede Frequenzkomponente ihrer Frequenzspektren (M1, M2); – Bestimmen des Einfallswinkels (ϑ) jedes einer Frequenz der Frequenzspektren (M1, M2) zugeordneten Schallsignals basierend auf der Phasendifferenz (φ) und der Frequenz; – Erzeugen eines Signalspektrums (S) eines auszugebenden Signals durch Verknüpfen eines der beiden Frequenzspektren (M1, M2) mit einer Filterfunktion (Fϑ0), die derart gewählt ist, dass Schallsignale aus einer Umgebung (γ3db) um einen bevorzugten Einfallswinkel (ϑ0) herum relativ zu Schallsignalen von außerhalb dieser Umgebung (γ3db) verstärkt werden; und – inverses Fourier-Transformieren des derart erzeugten Signalspektrums, dadurch gekennzeichnet, dass die Filterfunktion (Fϑ0) ϑ-abhängig ist und unter Variation von ϑ ein Maximum bei dem bevorzugten Einfallswinkel (ϑ0) aufweist, und die Verknüpfung der Filterfunktion (Fϑ0) mit einem der beiden Frequenzspektren eine Multiplikation derselben umfasst.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Filterfunktion (Fϑ0) die Form aufweist: Fϑ0(f,T)=Z(ϑ-ϑ0)+ DΔ2 fZ(ϑ-ϑ0)wobei f die jeweilige Frequenz T der Zeitpunkt der Ermittlung der Frequenzspektren (M1, M2) Z(ϑ-ϑ0) eine Zuordnungsfunktion mit Maximum bei ϑ0 D ≥ 0 eine Diffusionskonstante, und Δ2 f ein diskreter Diffusionsoperator ist.
  3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass die Zuordnungsfunktion (Z) die Form aufweist:
    Figure 00170001
    wobei n > 0 ist.
  4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die Bestimmung des Einfallswinkels ϑ über die Beziehung ϑ=arc cos(x(f,T))erfolgt mit x(f,T)= φc/2πfdwobei φ die Phasendifferenz zwischen den beiden Mikrofonsignalkomponenten (m1, m2) c die Schallgeschwindigkeit f die Frequenz der Schallsignalkomponente und d der vorbestimmte Abstand der beiden Mikrofone (MIK1, MIK2) ist.
  5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass es ferner den Schritt umfasst: Begrenzen des Werts von x(f,T) auf das Intervall [–1, 1].
  6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass es ferner den Schritt umfasst: Reduzieren von Signalkomponenten, für die der Wert von x(f,T) vor der Begrenzung außerhalb des Intervalls [–1, 1] lag.
  7. Vorrichtung zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 6, umfassend: – zwei Mikrofone (MIK1, MIK2); – eine an die Mikrofone angeschlossene Abtast- und Fourier-Transformationseinheit (20) zum Diskretisieren, Digitalisieren und Fourier-Transformieren der Mikrofonsignale (m1, m2); – eine an die Abtast- und Fourier-Transformationseinheit (20) angeschlossene Berechnungseinheit (30) zur Berechnung des Einfallswinkels (ϑ) jeder Schallsignalkomponente; und – wenigstens einen an die Berechnungseinheit (30) angeschlossenen Signalgenerator (40) zur Ausgabe des separierten Schallsignals, wobei der wenigstens eine Signalgenerator (40) Mittel zum Multiplizieren einer der Fourier-Transformierten (M1, M2) mit einer Filterfunktion (Fϑ0) umfasst, die ϑ-abhängig ist und unter Variation von ϑ ein Maximum bei einem bevorzugten Einfallswinkel (ϑ0) aufweist.
  8. Vorrichtung nach Anspruch 7, dadurch gekennzeichnet, dass der Abstand (d) zwischen den Mikrofonen der Relation genügt: d<c/4fA wobei c die Schallgeschwindigkeit und fA die Abtastfrequenz der Abtast- und Fourier-Transformationseinheit (20) ist.
  9. Vorrichtung nach Anspruch 7 oder 8, dadurch gekennzeichnet, dass die Vorrichtung für jede zu separierende Schallquelle (S1, S2) einen Signalgenerator (40) umfaßt.
DE102004005998A 2004-02-06 2004-02-06 Verfahren und Vorrichtung zur Separierung von Schallsignalen Expired - Fee Related DE102004005998B3 (de)

Priority Applications (6)

Application Number Priority Date Filing Date Title
DE102004005998A DE102004005998B3 (de) 2004-02-06 2004-02-06 Verfahren und Vorrichtung zur Separierung von Schallsignalen
AT05707893T ATE348492T1 (de) 2004-02-06 2005-01-31 Verfahren und vorrichtung zur separierung von schallsignalen
US10/557,754 US7327852B2 (en) 2004-02-06 2005-01-31 Method and device for separating acoustic signals
DE502005000226T DE502005000226D1 (de) 2004-02-06 2005-01-31 Verfahren und vorrichtung zur separierung von schallsignalen
PCT/EP2005/050386 WO2005076659A1 (de) 2004-02-06 2005-01-31 Verfahren und vorrichtung zur separierung von schallsignalen
EP05707893A EP1595427B1 (de) 2004-02-06 2005-01-31 Verfahren und vorrichtung zur separierung von schallsignalen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102004005998A DE102004005998B3 (de) 2004-02-06 2004-02-06 Verfahren und Vorrichtung zur Separierung von Schallsignalen

Publications (1)

Publication Number Publication Date
DE102004005998B3 true DE102004005998B3 (de) 2005-05-25

Family

ID=34485667

Family Applications (2)

Application Number Title Priority Date Filing Date
DE102004005998A Expired - Fee Related DE102004005998B3 (de) 2004-02-06 2004-02-06 Verfahren und Vorrichtung zur Separierung von Schallsignalen
DE502005000226T Active DE502005000226D1 (de) 2004-02-06 2005-01-31 Verfahren und vorrichtung zur separierung von schallsignalen

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE502005000226T Active DE502005000226D1 (de) 2004-02-06 2005-01-31 Verfahren und vorrichtung zur separierung von schallsignalen

Country Status (5)

Country Link
US (1) US7327852B2 (de)
EP (1) EP1595427B1 (de)
AT (1) ATE348492T1 (de)
DE (2) DE102004005998B3 (de)
WO (1) WO2005076659A1 (de)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102010001935A1 (de) * 2010-02-15 2012-01-26 Dietmar Ruwisch Verfahren und Vorrichtung zum phasenabhängigen Verarbeiten von Schallsignalen
EP2590165A1 (de) 2011-11-07 2013-05-08 Dietmar Ruwisch Verfahren und Vorrichtung zur Erzeugung eines rauschreduzierten Audiosignals
EP2752848A1 (de) 2013-01-07 2014-07-09 Dietmar Ruwisch Verfahren und Vorrichtung zur Erzeugung eines rauschreduzierten Audiosignals mithilfe einer Mikrofonanordnung
EP3764359A1 (de) 2019-07-10 2021-01-13 Analog Devices International Unlimited Company Signalverarbeitungsverfahren und systeme für mehrfokusstrahlformung
EP3764358A1 (de) 2019-07-10 2021-01-13 Analog Devices International Unlimited Company Signalverarbeitungsverfahren und -systeme zur strahlformung mit windblasschutz
EP3764664A1 (de) 2019-07-10 2021-01-13 Analog Devices International Unlimited Company Signalverarbeitungsverfahren und systeme zur strahlformung mit mikrofontoleranzkompensation
EP3764360A1 (de) 2019-07-10 2021-01-13 Analog Devices International Unlimited Company Signalverarbeitungsverfahren und -systeme zur strahlformung mit verbessertem signal/rauschen-verhältnis
EP3764660A1 (de) 2019-07-10 2021-01-13 Analog Devices International Unlimited Company Signalverarbeitungsverfahren und systeme für adaptive strahlenformung
CN113449255A (zh) * 2021-06-15 2021-09-28 电子科技大学 一种改进的稀疏约束下环境分量相位角估计方法、设备及存储介质
CN117935837A (zh) * 2024-03-25 2024-04-26 中国空气动力研究与发展中心计算空气动力研究所 一种时域多声源定位及噪声处理方法
CN117935837B (zh) * 2024-03-25 2024-05-24 中国空气动力研究与发展中心计算空气动力研究所 一种时域多声源定位及噪声处理方法

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101238511B (zh) * 2005-08-11 2011-09-07 旭化成株式会社 声源分离装置、音频识别装置、移动电话机、声源分离方法
US7415372B2 (en) 2005-08-26 2008-08-19 Step Communications Corporation Method and apparatus for improving noise discrimination in multiple sensor pairs
US20070047743A1 (en) * 2005-08-26 2007-03-01 Step Communications Corporation, A Nevada Corporation Method and apparatus for improving noise discrimination using enhanced phase difference value
US20070047742A1 (en) * 2005-08-26 2007-03-01 Step Communications Corporation, A Nevada Corporation Method and system for enhancing regional sensitivity noise discrimination
US7472041B2 (en) 2005-08-26 2008-12-30 Step Communications Corporation Method and apparatus for accommodating device and/or signal mismatch in a sensor array
US7619563B2 (en) * 2005-08-26 2009-11-17 Step Communications Corporation Beam former using phase difference enhancement
US20070050441A1 (en) * 2005-08-26 2007-03-01 Step Communications Corporation,A Nevada Corporati Method and apparatus for improving noise discrimination using attenuation factor
JP4912036B2 (ja) * 2006-05-26 2012-04-04 富士通株式会社 指向性集音装置、指向性集音方法、及びコンピュータプログラム
US20080001809A1 (en) * 2006-06-30 2008-01-03 Walter Gordon Woodington Detecting signal interference in a vehicle system
WO2010061506A1 (ja) * 2008-11-27 2010-06-03 日本電気株式会社 信号補正装置
DE202008016880U1 (de) 2008-12-19 2009-03-12 Hörfabric GmbH Digitales Hörgerät mit getrennter Ohrhörer-Mikrofon-Einheit
DK2236076T3 (da) 2009-03-30 2018-01-15 Hoffmann La Roche Fremgangsmåde og system til bestemmelse af differencen mellem præ- og postprandiale blodsukkerværdier
FR2948484B1 (fr) * 2009-07-23 2011-07-29 Parrot Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
DE102009029367B4 (de) * 2009-09-11 2012-01-12 Dietmar Ruwisch Verfahren und Vorrichtung zur Analyse und Abstimmung akustischer Eigenschaften einer Kfz-Freisprecheinrichtung
FR2950461B1 (fr) * 2009-09-22 2011-10-21 Parrot Procede de filtrage optimise des bruits non stationnaires captes par un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
US9310503B2 (en) * 2009-10-23 2016-04-12 Westerngeco L.L.C. Methods to process seismic data contaminated by coherent energy radiated from more than one source
DE102009052992B3 (de) * 2009-11-12 2011-03-17 Institut für Rundfunktechnik GmbH Verfahren zum Abmischen von Mikrofonsignalen einer Tonaufnahme mit mehreren Mikrofonen
US9182596B2 (en) 2010-02-28 2015-11-10 Microsoft Technology Licensing, Llc See-through near-eye display glasses with the optical assembly including absorptive polarizers or anti-reflective coatings to reduce stray light
US9223134B2 (en) 2010-02-28 2015-12-29 Microsoft Technology Licensing, Llc Optical imperfections in a light transmissive illumination system for see-through near-eye display glasses
US9097890B2 (en) 2010-02-28 2015-08-04 Microsoft Technology Licensing, Llc Grating in a light transmissive illumination system for see-through near-eye display glasses
US9759917B2 (en) 2010-02-28 2017-09-12 Microsoft Technology Licensing, Llc AR glasses with event and sensor triggered AR eyepiece interface to external devices
US20150309316A1 (en) 2011-04-06 2015-10-29 Microsoft Technology Licensing, Llc Ar glasses with predictive control of external device based on event input
US9097891B2 (en) 2010-02-28 2015-08-04 Microsoft Technology Licensing, Llc See-through near-eye display glasses including an auto-brightness control for the display brightness based on the brightness in the environment
US9129295B2 (en) 2010-02-28 2015-09-08 Microsoft Technology Licensing, Llc See-through near-eye display glasses with a fast response photochromic film system for quick transition from dark to clear
US20120249797A1 (en) 2010-02-28 2012-10-04 Osterhout Group, Inc. Head-worn adaptive display
US8482859B2 (en) 2010-02-28 2013-07-09 Osterhout Group, Inc. See-through near-eye display glasses wherein image light is transmitted to and reflected from an optically flat film
US10180572B2 (en) 2010-02-28 2019-01-15 Microsoft Technology Licensing, Llc AR glasses with event and user action control of external applications
US9341843B2 (en) 2010-02-28 2016-05-17 Microsoft Technology Licensing, Llc See-through near-eye display glasses with a small scale image source
US9091851B2 (en) 2010-02-28 2015-07-28 Microsoft Technology Licensing, Llc Light control in head mounted displays
US9285589B2 (en) 2010-02-28 2016-03-15 Microsoft Technology Licensing, Llc AR glasses with event and sensor triggered control of AR eyepiece applications
US8477425B2 (en) 2010-02-28 2013-07-02 Osterhout Group, Inc. See-through near-eye display glasses including a partially reflective, partially transmitting optical element
US9366862B2 (en) 2010-02-28 2016-06-14 Microsoft Technology Licensing, Llc System and method for delivering content to a group of see-through near eye display eyepieces
US8488246B2 (en) 2010-02-28 2013-07-16 Osterhout Group, Inc. See-through near-eye display glasses including a curved polarizing film in the image source, a partially reflective, partially transmitting optical element and an optically flat film
US9128281B2 (en) 2010-09-14 2015-09-08 Microsoft Technology Licensing, Llc Eyepiece with uniformly illuminated reflective display
US9134534B2 (en) 2010-02-28 2015-09-15 Microsoft Technology Licensing, Llc See-through near-eye display glasses including a modular image source
US8467133B2 (en) 2010-02-28 2013-06-18 Osterhout Group, Inc. See-through display with an optical assembly including a wedge-shaped illumination system
AU2011220382A1 (en) 2010-02-28 2012-10-18 Microsoft Corporation Local advertising content on an interactive head-mounted eyepiece
US20110214082A1 (en) * 2010-02-28 2011-09-01 Osterhout Group, Inc. Projection triggering through an external marker in an augmented reality eyepiece
US9229227B2 (en) 2010-02-28 2016-01-05 Microsoft Technology Licensing, Llc See-through near-eye display glasses with a light transmissive wedge shaped illumination system
US8472120B2 (en) 2010-02-28 2013-06-25 Osterhout Group, Inc. See-through near-eye display glasses with a small scale image source
DE202010013508U1 (de) 2010-09-22 2010-12-09 Hörfabric GmbH Software-definiertes Hörgerät
US9031256B2 (en) 2010-10-25 2015-05-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control
US9552840B2 (en) 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
US8855341B2 (en) 2010-10-25 2014-10-07 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals
US8175297B1 (en) 2011-07-06 2012-05-08 Google Inc. Ad hoc sensor arrays
US9497528B2 (en) * 2013-11-07 2016-11-15 Continental Automotive Systems, Inc. Cotalker nulling based on multi super directional beamformer
US9431013B2 (en) * 2013-11-07 2016-08-30 Continental Automotive Systems, Inc. Co-talker nulling for automatic speech recognition systems
EP2928211A1 (de) * 2014-04-04 2015-10-07 Oticon A/s Selbstkalibrierung eines Multimikrofongeräuschunterdrückungssystems für Hörgeräte mit einer zusätzlichen Vorrichtung
JP2015222847A (ja) * 2014-05-22 2015-12-10 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム
CN107785028B (zh) * 2016-08-25 2021-06-18 上海英波声学工程技术股份有限公司 基于信号自相关的语音降噪方法及装置
DE102019134541A1 (de) * 2019-12-16 2021-06-17 Sennheiser Electronic Gmbh & Co. Kg Verfahren zur Steuerung eines Mikrofonarrays und Vorrichtung zur Steuerung eines Mikrofonarrays
US11546689B2 (en) 2020-10-02 2023-01-03 Ford Global Technologies, Llc Systems and methods for audio processing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69314514T2 (de) * 1992-02-18 1998-02-12 Alsthom Cge Alcatel Rauchverminderungsverfahren in einem Sprachsignal
WO2002061732A1 (en) * 2001-01-30 2002-08-08 Thomson Licensing S.A. Geometric source separation signal processing technique
US6654719B1 (en) * 2000-03-14 2003-11-25 Lucent Technologies Inc. Method and system for blind separation of independent source signals

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774562A (en) * 1996-03-25 1998-06-30 Nippon Telegraph And Telephone Corp. Method and apparatus for dereverberation
US6130949A (en) * 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
AUPR141200A0 (en) * 2000-11-13 2000-12-07 Symons, Ian Robert Directional microphone

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69314514T2 (de) * 1992-02-18 1998-02-12 Alsthom Cge Alcatel Rauchverminderungsverfahren in einem Sprachsignal
US6654719B1 (en) * 2000-03-14 2003-11-25 Lucent Technologies Inc. Method and system for blind separation of independent source signals
WO2002061732A1 (en) * 2001-01-30 2002-08-08 Thomson Licensing S.A. Geometric source separation signal processing technique

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HADDAD BENOIT et al: "Capabilities of a beamforming technique for acoustic measurements inside a moving car" In: The 2002 International Congress and Exposition on Noise Control Engineering, Dearborn, Mi, USA, August 19-21, 2002 *
HADDAD; BENOIT: "Capabilities of a beamforming technique for acoustic measurements inside a moving car" In: The 2002 International Congress and Exposition on Noise Control Engineering, Dearborn, Mi, USA, August 19-21, 2002

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102010001935A1 (de) * 2010-02-15 2012-01-26 Dietmar Ruwisch Verfahren und Vorrichtung zum phasenabhängigen Verarbeiten von Schallsignalen
US8340321B2 (en) 2010-02-15 2012-12-25 Dietmar Ruwisch Method and device for phase-sensitive processing of sound signals
US8477964B2 (en) 2010-02-15 2013-07-02 Dietmar Ruwisch Method and device for phase-sensitive processing of sound signals
EP2590165A1 (de) 2011-11-07 2013-05-08 Dietmar Ruwisch Verfahren und Vorrichtung zur Erzeugung eines rauschreduzierten Audiosignals
US9406309B2 (en) 2011-11-07 2016-08-02 Dietmar Ruwisch Method and an apparatus for generating a noise reduced audio signal
EP2752848A1 (de) 2013-01-07 2014-07-09 Dietmar Ruwisch Verfahren und Vorrichtung zur Erzeugung eines rauschreduzierten Audiosignals mithilfe einer Mikrofonanordnung
EP3764660A1 (de) 2019-07-10 2021-01-13 Analog Devices International Unlimited Company Signalverarbeitungsverfahren und systeme für adaptive strahlenformung
WO2021005225A1 (en) 2019-07-10 2021-01-14 Ruwisch Patent Gmbh Signal processing methods and systems for beam forming with microphone tolerance compensation
EP3764664A1 (de) 2019-07-10 2021-01-13 Analog Devices International Unlimited Company Signalverarbeitungsverfahren und systeme zur strahlformung mit mikrofontoleranzkompensation
EP3764360A1 (de) 2019-07-10 2021-01-13 Analog Devices International Unlimited Company Signalverarbeitungsverfahren und -systeme zur strahlformung mit verbessertem signal/rauschen-verhältnis
EP3764359A1 (de) 2019-07-10 2021-01-13 Analog Devices International Unlimited Company Signalverarbeitungsverfahren und systeme für mehrfokusstrahlformung
WO2021005221A1 (en) 2019-07-10 2021-01-14 Ruwisch Patent Gmbh Signal processing methods and systems for beam forming with wind buffeting protection
WO2021005227A1 (en) 2019-07-10 2021-01-14 Ruwisch Patent Gmbh Signal processing methods and systems for adaptive beam forming
EP3764358A1 (de) 2019-07-10 2021-01-13 Analog Devices International Unlimited Company Signalverarbeitungsverfahren und -systeme zur strahlformung mit windblasschutz
WO2021005219A1 (en) 2019-07-10 2021-01-14 Ruwisch Patent Gmbh Signal processing methods and systems for beam forming with improved signal to noise ratio
WO2021005217A1 (en) 2019-07-10 2021-01-14 Analog Devices International Unlimited Company Signal processing methods and systems for multi-focus beam-forming
CN113449255A (zh) * 2021-06-15 2021-09-28 电子科技大学 一种改进的稀疏约束下环境分量相位角估计方法、设备及存储介质
CN113449255B (zh) * 2021-06-15 2022-11-11 电子科技大学 一种改进的稀疏约束下环境分量相位角估计方法、设备及存储介质
CN117935837A (zh) * 2024-03-25 2024-04-26 中国空气动力研究与发展中心计算空气动力研究所 一种时域多声源定位及噪声处理方法
CN117935837B (zh) * 2024-03-25 2024-05-24 中国空气动力研究与发展中心计算空气动力研究所 一种时域多声源定位及噪声处理方法

Also Published As

Publication number Publication date
US7327852B2 (en) 2008-02-05
ATE348492T1 (de) 2007-01-15
DE502005000226D1 (de) 2007-01-25
WO2005076659A1 (de) 2005-08-18
EP1595427A1 (de) 2005-11-16
US20070003074A1 (en) 2007-01-04
EP1595427B1 (de) 2006-12-13

Similar Documents

Publication Publication Date Title
DE102004005998B3 (de) Verfahren und Vorrichtung zur Separierung von Schallsignalen
DE60125553T2 (de) Verfahren zur interferenzunterdrückung
EP2362681B1 (de) Verfahren und Vorrichtung zum phasenabhängigen Verarbeiten von Schallsignalen
DE102006027673A1 (de) Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm
EP1771034A2 (de) Mikrofonkalibrierung bei einem RGSC-Beamformer
EP2537351B1 (de) Verfahren zur binauralen seitenwahrnehmung für hörinstrumente
DE102010026884B4 (de) Verfahren zum Betreiben einer Hörvorrichtung mit zweistufiger Transformation
EP3375204B1 (de) Audiosignalverarbeitung in einem fahrzeug
DE102014002899A1 (de) Verfahren, Vorrichtung und Herstellung zur Zwei-Mikrofon-Array-Sprachverbesserung für eine Kraftfahrzeugumgebung
EP2919485B1 (de) Übertragung eines windreduzierten Signals mit verminderter Latenzzeit
WO2015049334A1 (de) Verfahren und vorrichtung zum downmixen eines multikanalsignals und zum upmixen eines downmixsignals
DE10327890A1 (de) Verfahren zum Betrieb eines Hörhilfegerätes sowie Hörhilfegerät mit einem Mikrofonsystem, bei dem unterschiedliche Richtcharakteristiken einstellbar sind
DE112012006780T5 (de) Strahlformungsvorrichtung
DE102004053790A1 (de) Verfahren zur Erzeugung von Stereosignalen für getrennte Quellen und entsprechendes Akustiksystem
DE102008004674A1 (de) Signalaufnahme mit variabler Richtcharakteristik
WO2000068703A2 (de) Verfahren zur richtungsortung und ortungsanordnung
EP3926982A2 (de) Verfahren zur richtungsabhängigen rauschunterdrückung für ein hörsystem, welches eine hörvorrichtung umfasst
WO2015049332A1 (de) Ableitung von multikanalsignalen aus zwei oder mehreren grundsignalen
DE102013201043B4 (de) Verfahren und Vorrichtung zum Bestimmen eines Verstärkungsfaktors eines Hörhilfegeräts
DE102008017550A1 (de) Mehrstufiges Schätzverfahren zur Störgeräuschreduktion und Hörvorrichtung
DE102015204253B4 (de) Verfahren zur frequenzabhängigen Rauschunterdrückung eines Eingangssignals sowie Hörgerät
EP2161949A2 (de) Verfahren zum Betrieb einer Hörvorrichtung mit Richtwirkung und zugehörige Hörvorrichtung
DE102018117558A1 (de) Adaptives nachfiltern
EP2219389B1 (de) Vorrichtung und Verfahren zur Störgeräuschschätzung bei einer binauralen Hörgeräteversorgung
WO2007036443A1 (de) Verfahren zur aktiven geräuschverminderung und eine vorrichtung zur durchführung des verfahrens

Legal Events

Date Code Title Description
8100 Publication of patent without earlier publication of application
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee