-
Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zum Verarbeiten von Schallsignalen zumindest einer Schallquelle. Die Erfindung liegt auf dem Gebiet der digitalen Verarbeitung von Schallsignalen, die mit einem Mikrofonarray aufgenommen werden. Insbesondere betrifft die Erfindung ein Verfahren und eine Vorrichtung zum phasenabhängigen bzw. phasenempfindlichen Verarbeiten von mit einem Mikrofonarray aufgenommenen Schallsignalen.
-
Von einem Mikrofonarray wird gesprochen, wenn zwei oder mehr beabstandete Mikrofone zur Aufnahme von Schallsignalen verwendet werden (Mehr-Mikrofon-Technik). Damit ist es möglich, eine Richtungsempfindlichkeit in der digitalen Signalverarbeitung zu erreichen. Hier sind zunächst die klassischen „Shift and add” bzw. „Filter and add” Verfahren zu nennen, bei denen ein Mikrofonsignal gegenüber dem zweiten zeitlich verschoben oder gefiltert wird, bevor die so manipulierten Signale addiert werden. Auf diese Weise ist es möglich, eine Schallauslöschung („destruktive Interferenz”) für Signale zu erreichen, die aus einer bestimmten Richtung eintreffen. Da die zugrundeliegende Wellengeometrie formal identisch mit der Erzeugung einer Richtwirkung in Funkanwendungen bei Verwendung mehrer Antennen ist, spricht man hier auch von „Beam Forming”, wobei der Strahl” der Radiowellen durch die Dämpfungsrichtung bei der Mehr-Mikrofon-Technik ersetzt wird. Die Bezeichnung „Beam Forming” hat sich für Mikrofonarray-Anwendungen als Gattungsbezeichnung durchgesetzt, obwohl hier von einem „Strahl” eigentlich keine Rede sein kann. Irreführender Weise wird der Begriff nicht nur für die soeben beschriebene klassische Zwei- oder Mehr-Mikrofon-Technik benutzt, sondern auch für fortschrittlichere, nicht-lineare Array-Techniken, für die die Analogie mit der Antennentechnik so nicht mehr gilt.
-
In vielen Anwendungen verfehlt das klassische Verfahren das eigentlich gewünschte Ziel. Es hilft oft wenig, Schallsignale zu dämpfen, die aus einer bestimmten Richtung eintreffen. Vielmehr ist es wünschenswert, möglichst nur die von einer (oder mehreren) bestimmten Signalquelle(n) stammenden Signale weiterzuleiten bzw. weiterzuverarbeiten, wie beispielsweise die von einem erwünschten Sprecher.
-
Aus der
EP 1595427 B1 ist ein Verfahren zur Separierung von Schallsignalen bekannt. Gemäß dem darin beschriebenen Verfahren, können der Winkel und die Breite des „Richtkegels” für die gewünschten Signale (eigentlich kein Kegel sondern ein Rotationshyperboloid) sowie die Dämpfung für unerwünschte Signale außerhalb des Richtkegels mittels Parameter gesteuert werden. Das geschilderte Verfahren berechnet dabei eine signalabhängige Filterfunktion, wobei die spektralen Filterkoeffizienten mithilfe einer vorgegebenen Filterfunktion berechnet werden, deren Argument der Einfallswinkel einer spektralen Signalkomponente ist. Der Einfallswinkel wird mithilfe trigonometrischer Funktionen bzw. deren Umkehrfunktionen aus dem Phasenwinkel bestimmt, der zwischen den beiden Mikrofonsignalkomponenten vorliegt; diese Berechnung erfolgt ebenfalls spektral aufgelöst, also separat für jede darstellbare Frequenz. Winkel und Breite des Richtkegels sowie die maximale Dämpfung sind dabei Parameter der Filterfunktion.
-
Das in der
EP 1595427 B1 offenbarte Verfahren leidet an mehreren Nachteilen. Die mit dem Verfahren erzielbaren Ergebnisse entsprechen nur im Freifeld und im Nahfeld dem gewünschten Ziel, Schallsignale einer bestimmten Schallquelle zu separieren. Außerdem ist eine sehr geringe Toleranz der verwendeten Bauteile und insbesondere der eingesetzten Mikrofone erforderlich, da sich Störungen in den Phasen der Mirkofonsignale negativ auf die Wirksamkeit des Verfahrens auswirken. Die benötigten engen Bauteiltoleranzen lassen sich zumindest teilweise mit Hilfe geeigneter Herstellungstechnologien realisieren. Jedoch gehen damit oft höhere Herstellungskosten einher. Schwieriger lassen sich Nahfeld/Freifeld-Einschränkungen umgehen. Von einem Freifeld spricht man, wenn die Schallwelle ungehindert an den Mikrofonen
10,
11 eintrifft, also ohne auf dem Signalweg
12 von der Schallquelle
13 reflektiert, gedämpft, oder sonst wie verändert worden zu sein, wie dies in
1a dargestellt ist. Im Nahfeld zeigt sich im Gegensatz zum Fernfeld, bei dem das Schallsignal als ebene Welle eintrifft, die Krümmung der Wellenfront noch deutlich. Auch wenn dies eigentlich eine unerwünschte Abweichung von den auf ebenen Wellen basierenden Geometrieüberlegungen des Verfahrens ist, besteht normalerweise in einem wesentlichen Punkte große Ähnlichkeit zum Freifeld. Da die Signal- bzw. Schallquelle
13 so nah ist, sind die Phasenstörungen durch Reflexionen o. ä. im Vergleich zum Nutzsignal normalerweise eher gering.
1b zeigt die Verwendung der Mikrofone
10,
11 und der Schallquelle
13 in einem engen Raum
14, wie z. B. einem Kfz-Innenraum. Im Einsatz in engen Räumen, sind die Phaseneffekte jedoch erheblich, da die Reflektionen der Schallwellen an insbesondere glatten Oberflächen, wie z. B. Front- oder Seitenscheiben, dazu führen, dass die Schallwellen sich auf verschiedenen Schallwegen
12 ausbreiten und in der Nähe der Mikrofone die Phasenbeziehung zwischen den Signalen der beiden Mikrofone so stark stören, dass das Ergebnis der Signalverarbeitung nach dem oben bezeichnetem Verfahren unbefriedigend ist.
-
Die Phasenstörungen aufgrund der Reflexionen, wie sie in 1b dargestellt sind, führen dazu, dass die spektralen Komponenten des Schallsignals einer Signalquelle 13 scheinbar aus verschiedenen Richtungen auf die Mikrofone 10, 11 treffen. 2 zeigt hierzu im Vergleich die Einfallsrichtungen im Freifeld (2a) und bei Reflexionen (2b). Im Freifeld kommen alle spektralen Komponenten des Schallsignals 15f1, 15f2, ..., 15fn aus der Richtung der Schallquelle (in 2 nicht dargestellt). Gemäß 2b treffen die spektralen Komponenten des Schallsignals 16f1, 16f2, ..., 16fn aufgrund der frequenzabhängigen Reflexionen jeweils mit ganz unterschiedlichen scheinbaren Einfallswinkeln ϑf1, ϑf2, ..., ϑfn auf die Mikrofone 10, 11, obwohl das Schallsignal von der einen Schallquelle 13 erzeugt wurde. Eine Verarbeitung der Schallsignale in engeren Räumen, bei der nur Schallsignale aus einem bestimmten Einfallswinkel berücksichtigt werden, führt zu unbefriedigenden Ergebnissen, da dadurch bestimmte spektrale Komponenten des Schallsignals nicht oder nur unzureichend verarbeitet werden, was insbesondere Einbußen in der Signalqualität zur Folge hat.
-
Ein weiterer Nachteil des bekannten Verfahrens liegt darin, dass der Einfallswinkel als Raumwinkelvektor zunächst mithilfe trigonometrischer Funktionen bzw. deren Umkehrfunktionen aus dem Phasenwinkel, der zwischen den beiden Mikrofonsignalkomponenten vorliegt, berechnet werden muss. Diese Berechnung ist aufwendig, und die u. a. benötigte trigonometrische Funktion Arkuskosinus (arccos) ist nur im Bereich [–1, 1] definiert, so dass ggf. zusätzlich eine entsprechende Korrekturfunktion notwendig ist.
-
Es ist daher Aufgabe der vorliegenden Erfindung, ein Verfahren und eine Vorrichtung zum Verarbeiten von Schallsignalen vorzuschlagen, die die Nachteile des Standes der Technik möglichst vermeiden und insbesondere ein Kompensieren von Phasenstörungen oder -effekten, mit denen die Signale behaftet sind, ermöglichen. Ferner ist es Ziel der Erfindung, ein Verfahren und eine Vorrichtung zum phasenabhängigen Verarbeiten von Schallsignalen vorzuschlagen, die es erlauben, systematische Fehler in den Mikrofonsignalen, beispielsweise aufgrund von Bauteiltoleranzen, zu kompensieren und/oder ein Kalibrieren von einzelnen Bauteilen, wie z. B. den Mikrofonen oder der gesamten Vorrichtung zu ermöglichen.
-
Erfindungsgemäß wird hierzu ein Verfahren nach Anspruch 1 bzw. eine Vorrichtung nach Anspruch 10 vorgeschlagen. Weiterhin stellt die Erfindung ein Computerprogramm gemäß Anspruch 12 bereit. Vorteilhafte Weiterbildungen der Erfindung sind in den jeweiligen Unteransprüchen definiert.
-
Das erfindungsgemäße Verfahren zum phasenabhängigen Verarbeiten von Schaltsignalen zumindest einer Schallquelle umfasst dabei grundsätzlich die Schritte: Anordnen von zumindest zwei Mikrofonen MIK1, MIK2 in einem jeweils vorbestimmten Abstand d zueinander, Erfassen von Schallsignalen mit beiden Mikrofonen und Erzeugen zugeordneter Mikrofonsignale sowie ein Verarbeiten der Mikrofonsignale. In einem Einmessmodus werden dabei folgende Schritte ausgeführt: Festlegen zumindest einer Einmessposition einer Schallquelle, separates Erfassen der Schallsignale für die Einmessposition mit jeweils beiden Mikrofonen und Erzeugen von dem jeweiligen Mikrofon zugeordneten Einmessmikrofonsignalen für die Einmessposition, Ermitteln der Frequenzspektren der zugeordneten Einmessmikrofonsignale, und Berechnen eines einmesspositionsspezifischen frequenzabhängigen Phasendifferenzvektors φ0(f) zwischen den zugeordneten Einmessmikrofonsignalen aus deren Frequenzspektren für die Einmessposition. Während eines Betriebsmodus werden dann die folgenden Schritte ausgeführt: Erfassen der aktuellen Schallsignale mit beiden Mikrofonen und Erzeugen zugeordneter aktueller Mikrofonsignale, Ermitteln der aktuellen Frequenzspektren der zugeordneten aktuellen Mikrofonsignale, Berechnen eines aktuellen frequenzabhängigen Phasendifferenzvektors φ(f) zwischen den zugeordneten aktuellen Mikrofonsignalen aus deren Frequenzspektren, Auswählen zumindest einer der festgelegten Einmesspositionen, Berechnen einer spektralen Filterfunktion F in Abhängigkeit von dem aktuellen frequenzabhängigen Phasendifferenzvektor φ(f) sowie dem jeweiligen einmesspositionsspezifischen frequenzabhängigen Phasendifferenzvektor φ0(f) der ausgewählten Einmessposition, Erzeugen jeweils eines Signalspektrums S eines auszugebenden Signals durch multiplikative Verknüpfung mindestens eines der beiden Frequenzspektren der aktuellen Mikrofonsignale mit der spektralen Filterfunktion F der jeweiligen ausgewählten Einmessposition, wobei die Filterfunktion derart gewählt ist, dass spektrale Komponenten von Schallsignalen umso weniger gedämpft werden, je geringer der Differenzbetrag zwischen aktueller und einmesspositionsspezifischer Phasendifferenz für die entsprechende Frequenz ist, und Erhalten des jeweils auszugebenden Signals für die jeweilige ausgewählte Einmessposition durch inverses Transformieren des erzeugten Signalspektrums.
-
Auf diese Weise stellt das erfindungsgemäße Verfahren bzw. die erfindungsgemäße Vorrichtung eine Kalibrierungsprozedur bereit, gemäß der für zumindest eine Position der erwarteten Nutzsignalquelle als sogenannte Einmessposition während des Einmessmodus Schaltsignale, die beispielsweise durch Abspielen eines Testsignals erzeugt werden, mit ihren Phaseneffekten und -störungen von den Mikrofonen aufgenommen werden. Aus den aufgenommenen Mikrofonsignalen wird dann der frequenzabhängige Phasendifferenzvektor φ0(f) zwischen diesen Mikrofonsignalen aus deren Frequenzspektren für die Einmessposition berechnet. In der sich anschließenden Signalverarbeitung im Betriebsmodus wird dieser frequenzabhängige Phasendifferenzvektor φ0(f) dann verwendet, um die Filterfunktion zur Erzeugung des Signalspektrums des auszugebenden Signals zu kalibrieren, wodurch sich Phasenstörungen und -effekte in den Schallsignalen kompensieren lassen. Durch die anschließende Anwendung der so kalibrierten Filterfunktion auf zumindest eines der aktuellen Mikrofonsignale durch multiplikative Verknüpfung des Spektrums des aktuellen Mikrofonsignals mit der Filterfunktion, wird ein Signalspektrum des auszugebenden Signals erzeugt, welches im Wesentlichen nur noch Signale von der ausgewählten Einmessposition enthält. Die Filterfunktion wird dabei so gewählt, dass spektrale Komponenten von Schallsignalen, die gemäß ihrer Phasendifferenz den Einmessmikrofonsignalen und damit den vermeintlichen Nutzsignalen entsprechen, nicht oder weniger stark gedämpft werden, als spektrale Komponenten von Schallsignalen, deren Phasendifferenz sich von der einmesspositionsspezifischen Phasendifferenz unterscheidet. Weiterhin wird die Filterfunktion so gewählt, dass spektrale Komponenten von Schallsignalen umso stärker gedämpft werden, je größer der Differenzbetrag zwischen aktueller und einmesspositionsspezifischer Phasendifferenz für die entsprechende Frequenz ist.
-
Wird die Kalibrierung nicht nur modellspezifisch angewandt, sondern gemäß einer Ausführungsform für jede Vorrichtung, wie beispielsweise für jedes einzelne Mikrofonarray-Gerät in seiner Betriebsumgebung durchgeführt, lässt sich auf diese Art und Weise nicht nur die modelltypischen oder umgebungsbedingten, sondern auch die durch Bauteiltoleranzen und die Betriebsumgebung verursachten Phaseneffekte und -störungen des spezifischen Geräts im Betrieb kompensieren. Diese Ausführungsform ist daher geeignet, Bauteiltoleranzen der Mikrofone, wie beispielsweise deren Phasenlage und Empfindlichkeit auf einfache und sichere Art und Weise zu kompensieren. Dabei können auch Effekte, die nicht durch das Ändern der Raumposition der Nutzsignalquelle selbst, sondern durch Änderungen in der Umgebung der Nutzsignalquelle, beispielsweise durch das Öffnen eines Seitenfensters eines Kfz, verursacht werden, berücksichtigt werden. Die Einmessposition wird dabei als Zustandsraumposition definiert, die als zusätzliche Dimension bspw. den Zustand des Raumes umfasst. Treten solche Änderungen oder Schwankungen der Einmessposition während des Betriebs auf, lassen sich diese durch eine einmalige Kalibrierung prinzipiell nicht beherrschen. Hierfür wird das erfindungsgemäße Verfahren dann als adaptives Verfahren ausgestaltet, bei dem der einmesspositionsspezifische frequenzabhängige Phasendifferenzvektor φ0(f) nicht lediglich aus einmalig während des Einmessmodus erfassten Mikrofonsignalen, sondern aus den Mikrofonsignalen der tattsächlichen Nutzsignale während des Betriebs berechnet bzw. aktualisiert wird.
-
Gemäß einer Weiterbildung der Erfindung arbeitet das Verfahren bzw. die Vorrichtung zunächst im Betriebsmodus. Der einmesspositionsspezifische frequenzabhängige Phasendifferenzvektor φ0(f) wird dabei für alle Frequenzen f auf φ(f) = 0 gesetzt. Erst zu einem späteren Zeitpunkt schaltet das Verfahren bzw. die Vorrichtung in den Einmessmodus und berechnet den einmesspositionsspezifischen frequenzabhängigen Phasendifferenzvektor φ0(f), wobei beispielsweise ein Nutzer Testsignale spricht und diese von den Mikrofonen erfasst werden, um daraus zugeordnete Einmessmikrofonsignale zu erzeugen. Aus den zugeordneten Einmessmikrofonsignalen wird dann der einmesspositionsspezifische frequenzabhängige Phasendifferenzvektor φ0(f) berechnet. Anschließend wird wiederum in den Betriebsmodus geschaltet. In dem die spektralen Filterfunktionen F für jeden aktuellen frequenzabhängigen Phasendifferenzvektor in Abhängigkeit von dem vorher bestimmten jeweiligen einmesspositionsspezifischen frequenzabhängigen Phasendifferenzvektor berechnet werden.
-
Auf diese Weise ist zunächst ein Einsatz ohne Kalibrierung unter Standardeinstellungen möglich. Sobald dann in den Einmessmodus geschaltet wird, lässt sich eine Kalibrierung nicht nur bspw. hinsichtlich der Bautentoleranzen sondern auch der aktuellen Betriebsumgebung, der konkreten Einsatzbedingungen und des Nutzers erreichen.
-
In anderen Worten erlaubt die Erfindung insbesondere eine phasenabhängige und zugleich frequenzabhängige Verarbeitung von Schallsignalen, ohne dass es dabei notwendig ist, den Einfallswinkel der Schallsignale zu bestimmen, indem zumindest eine spektrale Komponente des aktuellen Schallsignals in Abhängigkeit der Differenz zwischen ihrer Phasendifferenz und einer einmesspositionsspezifischen Phasendifferenz der entsprechenden Frequenz gedämpft wird.
-
Kurzbeschreibung der Abbildungen:
-
1 zeigt schematisch die Ausbreitung von Schallsignalen einer Schallquelle im Freifeld (a) und bei Reflexionen im Nahfeld (b).
-
2 zeigt schematisch die scheinbaren Einfallsrichtungen von Schallsignalen einer Schallquelle im Freifeld (a) und bei Reflexionen im Nahfeld (b).
-
3 zeigt ein Ablaufdiagramm zur Bestimmung der Kalibrierungsdaten im Einmessmodus gemäß einer Ausführungsform der Erfindung.
-
4 zeigt ein Ablaufdiagramm zur raumwinkelabhängigen Bestimmung der Filterfunktion gemäß einer Ausführungsform der Erfindung.
-
5 zeigt ein Ablaufdiagramm zur phasenwinkelabhängigen Bestimmung der Filterfunktion gemäß einer Ausführungsform der Erfindung.
-
Ein Grundgedanke der Erfindung ist es, in einer Einmessprozedur für gewünschte Schallsignale phasenabhängige Kalibrierungsdaten zu bestimmen, welche die anwendungsbedingten Phaseneffekte berücksichtigen, und diese Kalibrierungsdaten anschließend bei der Signalverarbeitung zur Kompensation von Phasenstörungen und -effekten einzusetzen.
-
Das Verfahren stellt hierzu eine Anordnung von zumindest zwei Mikrofonen MIK1, MIK2 in einem vorbestimmten Abstand d zueinander bereit. Um eine Mehrdeutigkeit von Phasendifferenzen zu vermeiden, ist dieser Abstand kleiner als die halbe Wellenlänge der höchsten vorkommenden Frequenz zu wählen, d. h. kleiner als der Quotient Schallgeschwindigkeit/Abtastrate der Mikrofonsignale. Ein in der Praxis für Sprachverarbeitung gut geeigneter Wert für den Mikrofonabstand d ist beispielsweise 1 cm. Mit jedem Mikrofon werden dann die Schallsignale, die von einer in einer Einmessposition angeordneten Schallquelle erzeugt werden, jeweils separat erfasst. Jedes Mikrofon erzeugt aus den mit diesem Mikrofon erfassten Schallsignalen diesem Mikrofon zugeordnete Einmessmikrofonsignale. Aus den ermittelten Frequenzspektren der zugeordneten Einmessmikrofonsignale wird dann ein einmesspositionsspezifischer frequenzabhängiger Phasendifferenzvektor φ0(f) berechnet. Die so zwischen den zugeordneten Einmessmikrofonsignalen aus deren Frequenzspektren bestimmten Phasendifferenzen dienen dann im Betriebsmodus als Kalibrierungsdaten zur Kompensation der entsprechenden Phasenstörungen bzw. -effekte.
-
Gemäß einer Ausführungsform werden die Kalibrierungsdaten dabei durch die Abfolge der Schritte erzeugt, wie sie in dem in 3 dargestellten Ablaufdiagramm aufgeführt sind. Zunächst erfolgt in Schritt 310 das Abspielen eines Testsignals, wie z. B. weißes Rauschen, von der Einmessposition als der Position der erwarteten Nutzsignalquelle und die Aufnahme der entsprechenden Einmessmikrofonsignale mit den Mikrofonen MIK1 und MIK2 durch separates Erfassen der Schallsignale mit den beiden Mikrofonen und Erzeugen der zugeordneten Einmessmikrofonsignale für diese Einmessposition. Anschließend werden die Fouriertransformierten M1(f, T) und M2(f, T) der Einmessmikrofonsignale zum Zeitpunkt T und die Real- und Imaginärteile Re1, Im1, Re2, Im2 der Fouriertransformierten M1(f, T) und M2(f, T) in Schritt 320 berechnet, um daraus wiederum in Schritt 330 die frequenzabhängigen Phasen φ(f, T) zur Zeit T zwischen den Einmessmikrofonsignalen gemäß der Formel: φ(f, T) = arctan((Re1·Im2 – Im1·Re2)/(Re1·Re2 + Im1·Im2)) zu berechnen.
-
In einem nächsten Schritt 340 werden dann die frequenzabhängigen Phasen φ(f, T) zeitlich über T zum einmesspositionsspezifischen frequenzabhängigen Phasendifferenzvektor φ0(f) gemittelt, der die Kalibrierungsdaten enthält.
-
Für eine raumwinkelabhängige Filterbestimmung, wie sie nachfolgend mit Bezug auf 4 beschrieben wird, erfolgt optional in Schritt 350 die Berechnung eines Kalibrierungs-Winkelvektors ϑ0(f) = arccos(φ0(f)c/2πfd) nach Korrektur des Arguments auf den erlaubten Wertebereich [–1...1].
-
Bei einer raumwinkelabhängigen Filterbestimmung zur Erzeugung eines Ausgangssignals s(t) im Betriebsmodus gemäß 4 wird zunächst das aktuelle Schallsignal mit den zwei Mikrofonen MIK1 und MIK2 in Schritt 410 aufgenommen. In Schritt 420 werden wiederum die Fouriertransformierten M1(f, T) und M2(f, T) der Mikrofonsignale 1 und 2 zum Zeitpunkt T sowie deren Real- und Imaginärteile Re1, Im1, Re2, Im2 berechnet. Anschließend werden im Schritt 430 die frequenzabhängigen Phasen zur Zeit T φ(f, T) = arctan((Re1·Im2 – Im1·Re2)/(Re1·Re2 + Im1·Im2)) und daraus wiederum im Schritt 440 ein Raumwinkelvektor ϑ(f) = arccos(φ(f)c/2πfd) einschließlich entsprechender Korrektur des Arguments auf den erlaubten Wertebereich [–1...1] für alle Frequenzen f berechnet. Im Schritt 450 wird dann die spektrale Filterfunktion, die die
-
Dämpfungswerte für jede Frequenz f zum Zeitpunkt T enthält und wie folgt definiert ist: F(f, T) = Z(ϑ(f, T) – ϑ0(f)), mit einer unimodalen Zuordnungsfunktion wie z. B. Z(ϑ) = ((1 + cosϑ)/2)n mit n > 0 in Abhängigkeit des Kalibrierungs-Winkelvektors ϑ0(f) berechnet, wobei der Winkel ϑ so definiert ist dass –π ≤ ϑ ≤ π gilt. Der Wert n stellt dabei einen sogenannten Breitenparameter dar, der die einstellbare Breite des Richtkegels festlegt. Die so bestimmte Filterfunktion F(f, T) mit einem Wertebereich 0 ≤ F(f, T) ≤ 1 wird dann in Schritt 460 auf ein Spektrum der Mikrofonsignale 1 oder 2 in Form einer Multiplikation: S(f, T) = M1(f, T)F(f, T) angewandt. Aus dem so gefilterten Spektrum S(f, T) wird dann durch inverse Fouriertransformation das Ausgangssignals s(t) im Schritt 470 erzeugt. Obige Definition der Filterfunktion F(f, T) ist examplarisch zu verstehen, andere Zuordnungsfunktionen mit ähnlicher Charakteristik erfüllen denselben Zweck. Der hier gewählte weiche Übergang zwischen den Extremwerten der Filterfunktion (null und eins) wirkt sich günstig auf die Qualität des Ausgangssignals aus, insbesondere im Hinblick auf unerwünschte Artefakte der Signalverarbeitung.
-
Gemäß einer Weiterbildung der Erfindung wird auf die Bestimmung des Raumwinkels verzichtet und stattdessen während der Einmessprozedur lediglich der einmesspositionsspezifischen frequenzabhängigen Phasendifferenzvektor φ(f) bestimmt, der bereits die Kalibrierungsinformation enthält. In dieser Ausführungsform entfällt damit bei der Bestimmung der Kalibrierungsdaten die Berechnung des Raumwinkelvektors ϑ0(f) in Schritt 350 und damit die ggf. notwendige Korrektur des Wertebereichs des Arguments für die arccos-Berechnung. Während des Betriebsmodus umfasst das Verfahren dabei die in 5 dargestellten Schritte. Zunächst wird wiederum das aktuelle Schallsignal mit den zwei Mikrofonen MIK1 und MIK2 im Schritt 510 erfasst. Aus den daraus erzeugten Mikrofonsignalen 1 und 2 werden die aktuellen Frequenzspektren durch Berechnen der Fouriertransformierten M1(f, T) und M2(f, T) zum Zeitpunkt T sowie deren Real- und Imaginärteile Re1, Im1, Re2, Im2 im Schritt 520 ermittelt. Anschließend wird im Schott 530 der aktuelle frequenzabhängige Phasendifferenzvektor aus deren Frequenzspektren gemäß φ(f, T) = arctan((Re1·Im2 – Im1·Re2)/(Re1·Re2 + Im1·Im2)) berechnet. Die spektrale Filterfunktion wird nun gemäß der Formel F(φ(f, T)) = (1 – ((φ(f, T) – φ0(f))c/2πfd)2)n mit n > 0, im Hinblick auf den einmesspositionsspezifischen frequenzabhängigen Phasendifferenzvektor φ0(f) in Schritt 540 berechnet, wobei c die Schallgeschwindigkeit, f die Frequenz der Schallsignalkomponenten, T die Zeitbasis der Spektrumserzeugung, d der vorbestimmte Abstand der beiden Mikrofone, und n der Breitenparameter für den Richtkegel ist. Beim Betrachten der Formel, welche wie zuvor exemplarisch zu verstehen ist, wird klar, dass die Filterfunktion im Idealfall, d. h. bei Phasengleichheit zwischen aktuell im Betriebsmodus gemessenem und einmesspositionsspezifischem Phasendifferenzvektor, gleich Eins wird, so dass die auf das Signalspektrum S angewandte Filterfunktion das auszugebende Signal nicht dämpft. Bei zunehmender Abweichung des aktuellen vom einmesspositionsspezifischen Phasendifferenzvektor geht die Filterfunktion gegen Null, was zu einer entsprechenden Dämpfung des auszugebenden Signals führt.
-
Falls im Einmessmodus mehrere Phasendifferenzvektoren für bspw. verschiedene Einmesspositionen bestimmt wurden, besteht die Möglichkeit, die Filterfunktion für eine dieser Einmesspositionen und damit eine gewünschte Position des Nutzsignals zu bestimmen.
-
Im Schritt 550 wird dann das Signalspektrum S des kalibrierten Signals durch Anwenden der Filterfunktion F(f, T) auf eines der Mikrofonspektren M1 oder M2 in Form einer Multiplikation gemäß der Formel (hier für Mikrofonspektrum M1): S(f, T) = M1(f, T)F(f, T) erzeugt, woraus dann wiederum im Schritt 560 das auszugebende Signal s(t) durch inverse Fouriertransformation von S(f, T) bestimmt wird.
-
Gemäß einer Weiterbildung der Erfindung arbeitet das Verfahren zunächst im Betriebsmodus und der einmesspositionsspezifische frequenzabhängige Phasendifferenzvektor φ0(f) wird für alle Frequenzen f auf φ0(f) gleich Null gesetzt. Das entspricht einer sogenannten „Broadview”-Geometrie ohne Einmessen. Soll die Vorrichtung zum Verarbeiten von Schallsignalen nun kalibriert werden, wird die Vorrichtung in den Einmessmodus geschaltet. Unter der Annahme, dass nun ein entsprechendes Nutzsignal generiert wird, indem z. B. lediglich der gewünschte Nutzer spricht, wird der einmesspositionsspezifische frequenzabhängige Phasendifferenzvektor φ0(f) berechnet. Hierbei spricht der Nutzer beispielsweise vorgegebene Testsätze, die von den Mikrofonen erfasst und aus denen zugeordnete Einmessmikrofonsignale erzeugt werden. Beispielsweise geht das System oder die Vorrichtung durch ein Kommando von außen in den Kalibier-Modus, in welchem es die φ0(f) bestimmt. Dazu spricht der Nutzer Testlaute, z. B. „sch sch sch”, bis das System ausreichende Kalibrierungsdaten gesammelt hat, was optional z. B. durch eine LED angezeigt werden kann. Danach wechselt das System in den Betriebsmodus, in welchem die Kalibrierdaten benutzt werden.
-
Anschließend wird in den Betriebsmodus geschaltet und die spektrale Filterfunktion F wird für jeden aktuellen frequenzabhängigen Phasendifferenzvektor in Abhängigkeit von dem vorher bestimmten jeweiligen einmesspositionsspezifischen frequenzabhängigen Phasendifferenzvektor berechnet. Somit ist es z. B. möglich, die Vorrichtung, wie z. B. ein Mobiltelefon zunächst in einer Grundeinstellung auszuliefern und dann die Kalibrierung mit der Stimme des tatsächlichen Nutzers in der vom Nutzer bevorzugten Einsatzumgebung und -anordnung, d. h. wie hält der Nutzer das Mobiltelefon im Verhältnis zum Mund des Nutzers o. ä., durchzuführen.
-
Gemäß einer Weiterbildung der Erfindung wird im Betriebsmodus mit dem vorher berechneten jeweiligen einmesspositionsspezifischen frequenzabhängigen Phasendifferenzvektor gegenüber dem zunächst eingenommenen Betriebsmodus der Breitenparameter n kleiner gewählt als im uneingemessenen Betriebszustand, in dem sich die Vorrichtung in einer Grundeinstellung befindet. Ein zunächst kleinerer Breitenparameter bedeutet einen breiteren Richtkegel, so dass tendenziell zunächst Schallsignale aus einem größeren Richtkegel weniger stark gedämpft werden. Erst wenn die Kalibrierung erfolgt ist, wird der Breitenparameter größer gewählt, weil nun die Filterfunktion in der Lage ist, die an den Mikrofonen ankommenden Schallsignale auch unter Berücksichtigung der im Nahfeld auftretenden (Phasen-)Störungen gemäß eines kleineren Richtkegels entsprechend richtig zu dämpfen. Die Richtkegelbreite, die durch den Parameter n in der Zuordnungsfunktion festgelegt ist, wird z. B. im Betrieb mit Kalibrierdaten kleiner gewählt als im unkalibrierten Fall. Durch die Kalibrierung kennt das Verfahren die Position der Signalquelle ja sehr genau, so dass man dann mit einem „schärferen” Beam-Forming und daher mit einem schmaleren Richtkegel arbeiten kann als im unkalibrierten Fall, wo die Position der Quelle höchstens ungefähr bekannt ist.
-
Gemäß einer Weiterbildung der Erfindung wird im Einmessmodus ferner die Einmessposition in einem Raum- und/oder Zustandsbereich variiert, in dem der Nutzer im Betriebsmodus erwartet wird. Anschließend wird der einmesspositionsspezifische frequenzabhängige Phasendifferenzvektor φ0(f) für diese variierten Einmesspositionen berechnet. Hierdurch lassen sich dann neben unterschiedlichen Raumpositionen auch andere Effekte, die z. B. durch ein geöffnetes Seitenfenster eines Kfz verursacht werden, bei der Kalibrierung berücksichtigen, da nicht nur die Position des Nutzers, bspw. die Sitzposition des Fahrers des Kfz, sondern auch der Umgebungszustand, d. h. ob z. B. das Seitenfenster geöffnet oder geschlossen ist, berücksichtigen.
-
Während des Betriebs auftretende Schwankungen lassen sich durch eine einmalige Kalibrierung prinzipiell nicht beherrschen. Hierfür kommt gemäß einer Weiterbildung der Erfindung ein adaptives Verfahren zum Einsatz, das anstelle von Einmess-Signalen die tatsächlichen Nutzsignale während des Betriebs auswertet. Gemäß einer solchen Ausführungsform wird die „adaptive Nachkalibrierung” nur in solchen Situation durchgeführt, in denen außer dem Nutzsignal keine anderen Störgeräuschsignale von den Mikrofonen aufgenommen werden.
-
Gemäß einer Weiterbildung der Erfindung wird auf diese Weise auf einen Einmessmodus sogar ganz verzichtet, und die Berücksichtigung der Phaseneffekte vollständig dem adaptiven Verfahren überlassen. Gemäß einer Ausführungsform ist das Verfahren daher als adaptives Verfahren ausgestaltet, das gleich in den Betriebsmodus schaltet. Der einmesspositionsspezifische frequenzabhängige Phasendifferenzvektor φ0(f) wird dabei anfänglich entweder für alle Frequenzen f auf φ0(f) gleich Null gesetzt oder es werden beispielsweise gespeicherte Werte für alle Frequenzen des einmesspositionsspezfischen frequenzabhängigen Phasendifferenzvektors φ0(f) aus früheren Einmess- oder Betriebsmodi verwendet. Alternativ wird nach einem anfänglichen Durchlaufen des Einmessmodus zum Berechnen des aktuellen einmesspositionsspezifischen frequenzabhängigen Phasendifferenzvektors φ0(f) in den Betriebsmodus geschaltet. Im weiteren Betrieb wird der einmesspositionsspezifische frequenzabhängige Phasendifferenzvektor φ0(f) dann durch das adaptive Verfahren aktualisiert, indem die aktuellen Schallsignale einer Schallquelle im Betriebsmodus als Schallsignale der ausgewählten Einmessposition interpretiert und für die Kalbrierung verwendet werden. Es kommt somit eine für den Nutzer unbemerkte Aktualisierung der Kalibrierungsdaten zur Anwendung, wobei die Aktualisierung immer dann stattfindet, wenn davon ausgegangen wird, dass die aktuellen Schallsignale störgeräuschunbehaftete Nutzsignale im Sinne der jeweiligen Anwendung bzw. der aktuellen Konfiguration der Vorrichtung sind, so dass aus diesen Schallsignalen dann der einmesspositionsspezfische frequenzabhängige Phasendifferenzvektor φ0(f) bestimmt wird. Ein ansonsten möglicherweise durch die Vorrichtung vorbestimmtes Umschalten zwischen Einmess- und Betriebsmodus kann somit entfallen. Vielmehr erfolgt das Einmessen „unterschwellig” während des Betriebes immer dann, wenn es die Signalqualität zulässt. Ein Kriterium für die Signalqualität kann beispielsweise der Signal-Rauschabstand der Mikrofonsignale sein.
-
Die Auswirkung auf das auszugebende Signal einer während des Betriebs heruntergelassenen Scheibe kann auf diese Weise aber weiterhin nur unzureichend oder gar nicht kompensiert werden, denn die Randbedingung der Störgeräuschfreiheit bei der Erfassung der Schallsignale zur Bestimmung der Kalibrierungsdaten lässt sich in diesem Fall kaum realisieren. Um die Adaption störgeräuschfest zu machen, wird gemäß einer Weiterbildung der Erfindung daher ein ebenfalls mitlaufendes, phasenempfindliches Geräuschmodell bereitgestellt, mit dessen Hilfe die Störsignale für den Adaptionsprozess aus den Mikrofonsignalen herausrechnet werden, bevor die eigentliche Kompensation der Phaseneffekte durchgeführt wird. Gemäß einer Ausführungsform umfasst das Verfahren daher weiterhin, dass aus den Mikrofonsignalen der aktuellen Schallsignale im Betriebsmodus zunächst mit Hilfe eines mitlaufenden, phasenempfindlichen Geräuschmodells Störsignale herausrechnet werden, bevor der einmesspositionsspezifische frequenzabhängige Phasendifferenzvektor φ0(f) aktualisiert wird.
-
Gemäß einer Weiterbildung der Erfindung umfasst der Schritt des Festlegens von zumindest einer Einmessposition weiterhin das Anordnen einer Testsignalquelle in der Einmessposition bzw. in deren Nähe, das Aussenden eines kalibrierten Testsignals durch die Schallsignalquelle, das Erfassen des Testsignals mit den beiden Mikrofonen und das Erzeugen der zugeordneten Einmessmikrofonsignale allein aus dem Testsignal. Bisher wurde davon ausgegangen, dass der Phasenwinkel φ0 spektral aufgelöst, also frequenzabhängig ist, und der entsprechende Vektor φ0(f) während der Einmessprozedur anhand der aufgenommenen Testsignale bestimmt wird, wohingegen der breitenbestimmende Parameter n skalar, also für alle Frequenzen gleich ist. Definiert man eine Halbwertsphasendifferenz φ½(f), bei der die Filterfunktion F(φ(f, T)) auf den Wert 1/2 abgefallen ist, so hängt der Breitenparameter n mit φ½(f) bei obiger Definition der Filterfunktion F(φ(f, T)) wie folgt zusammen: n = –1/log2(1 – (cφ½(f)/2πfd)2), φ½(f) ist dabei ein Parametervektor, der zunächst für jede Frequenz f vorgegeben ist.
-
Für eine erweiterte Einmessprozedur wird nun die Quelle der Testsignale, beispielsweise ein sogenannter künstliche Mund, nicht mehr nur am Ort der erwarteten Nutzsignalquelle positioniert, sondern über einen Raumbereich variiert, in dem bei normalem Betrieb auch eine Variation der Position der Nutzsignalquelle zu erwarten ist. In einer Kfz-Anwendung soll damit beispielsweise die Schwankungsbreite abgedeckt werden, die durch natürliche Kopfbewegungen, variable Sitzeinstellungen und unterschiedliche Körpergrößen eines Fahrers bewirkt werden. Für jede Messung mit verschiedenen Orten der Testsignalquelle wird nun wie zuvor beschrieben ein Vektor φ0(f) bestimmt. Anschließend werden aus diesen Messungen für jede Frequenz die arithmetischen Mittelwerte μ(f) und die Standardabweichungen σ(f) für jede Frequenz f über die berechneten einmesspositionsspezifischen frequenzabhängigen Phasendifferenzvektoren φ0(f) berechnet. Hierbei ist zu beachten, dass es sich bei den Mittelwerten μ(f) um arithmetische Mittelwerte von zuvor bereits zeitlich gemittelten Variablen handelt; μ(f) wird nun anstelle von φ0(f) verwendet. Der zuvor skalare Parameter n wird nun ebenfalls frequenzabhängig gemacht und durch die Kalibrierung bestimmt. Dazu wird die Halbwertsphasendifferenz φ(f) über eine Konstante k mit der Standardabweichung verknüpft φ½(f) = kσ(f). Wird nun für die Messwerte φ0(f) eine Normalverteilung angenommen, was nicht notwendigerweise der Fall ist, mangels besseren Wissens gemäß dem Verfahren aber dennoch angenommen wird, lägen 95% aller Messergebnisse innerhalb des Bereichs ± φ½(f), wenn man k = 2 wählt. Für den breitenbestimmenden Parameter n(f) gilt dann: n(f) = –1/log2(1 – (cσ(f)/πfd)2).
-
Mit dieser Erweiterung des Einmessvorgangs trägt man der Tatsache Rechnung, dass nicht nur die Einfalls- bzw. Phasenwinkel durch Reflexionen frequenzabhängig verändert werden, sondern dass auch die Stärke dieser Veränderung frequenzabhängig sein kann, was durch eine spektral aufgelöste „Beam-Breite° gemäß dem Verfahren kompensierbar ist.
-
Weiterhin sei noch erwähnt, dass alle beschriebenen Vorrichtungen, Verfahren und Verfahrensbestandteile natürlich nicht auf den Einsatz beispielsweise in einem Kfz beschränkt sind. Auf dieselbe Weise kann z. B. auch ein Mobiltelefon oder jedes andere (Sprach-)Signalverarbeitungsgerät kalibriert werden, dass eine Mikrofonarraytechnologie verwendet.
-
Das erfindungsgemäße Verfahren und die erfindungsgemäße Vorrichtung sind zweckmäßigerweise mithilfe bzw. in Form eines Signalverarbeitungssystems z. B. mit einem digitalen Signalprozessor (DSP-System) oder als Softwarekomponente eines Computerprogramms, das beispielsweise auf einem PC oder DSP-System oder jeder anderen Hardwareplattform läuft, realisierbar.
-
Bezugszeichenliste:
-
-
- MIK1, MIK2
- beabstandete Mikrofone;
- M1(f, T), M2(f, T)
- Fouriertransformierte der Mikrofonsignale;
- d
- Abstand zwischen Mikrofonen MIK1 und MIK2;
- f
- Frequenz;
- T
- Zeitpunkt der Bestimmung eines Spektrums bzw. eines Ausgangssignals
- φ0(f)
- zeitlich gemittelter frequenzabhängiger Phasendifferenzvektor im Einmessmodus;
- φ(f, T)
- frequenzabhängiger Phasendifferenzvektor der Mikrofonsignale während des Betriebs;
- Re1(f), Im1(f)
- Real- und Imaginärteile der spektralen Komponenten des ersten Freisprechmikrofonsignals (Mikrofon 1);
- Re2(f), Im2(f)
- Real- und Imaginärteile der spektralen Komponenten des zweiten Freisprechmikrofonsignals (Mikrofon 2);
- ϑ0(f)
- zeitlich gemittelter frequenzabhängiger Einfallswinkel des ersten Test-Audiosignals im Einmessmodus;
- ϑ(f, T)
- frequenzabhängiger Einfallswinkel der Mikrofonsignale während des Betriebs;
- μ(f)
- arithmetische Mittelwerte für jede Frequenz f über die φ0(f);
- σ(f)
- Standardabweichungen für jede Frequenz f über die φ0(f);
- n
- Breitenparameter;
- n(f)
- frequenzabhängiger Breitenparameter, mit φ½(f) = kσ(f), wobei φ½(f) die frequenzabhängige Phasendifferenz ist, bei der die Filterfunktion F bei der Frequenz f den Wert 1/2 annimmt;
- F(f, T)
- Filterfunktion;
- Z
- unimodale Zuordnungsfunktion;
- S(f, T)
- Signalspektrum des auszugebenden Signals;
- s(t)
- auszugebendes Signal.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- EP 1595427 B1 [0004, 0005]