DE102018201605A1 - Verfahren und Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen - Google Patents

Verfahren und Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen Download PDF

Info

Publication number
DE102018201605A1
DE102018201605A1 DE102018201605.4A DE102018201605A DE102018201605A1 DE 102018201605 A1 DE102018201605 A1 DE 102018201605A1 DE 102018201605 A DE102018201605 A DE 102018201605A DE 102018201605 A1 DE102018201605 A1 DE 102018201605A1
Authority
DE
Germany
Prior art keywords
sound signals
source
active
estimated
test statistic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102018201605.4A
Other languages
English (en)
Inventor
Michael Fauß
Dominik Reinhard
Michael Wahlig
Abdelhak Zoubir
Chen Zhang
Sighard Schräbler
Patrick Merzoug
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Continental Teves AG and Co OHG
Original Assignee
Continental Teves AG and Co OHG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Continental Teves AG and Co OHG filed Critical Continental Teves AG and Co OHG
Priority to DE102018201605.4A priority Critical patent/DE102018201605A1/de
Priority to DE112019000196.5T priority patent/DE112019000196A5/de
Priority to PCT/DE2019/200004 priority patent/WO2019149323A1/de
Publication of DE102018201605A1 publication Critical patent/DE102018201605A1/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/20Position of source determined by a plurality of spaced direction-finders
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/808Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
    • G01S3/8083Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems determining direction of source
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

Die Erfindung betrifft ein Verfahren (1) und eine Vorrichtung (10) zum Lokalisieren und Verfolgen akustischer aktiver Quellen (11) bzw. akustischer Signale (15). Insbesondere sind das erfindungsgemäße Verfahren (1) und die erfindungsgemäße Vorrichtung (10) zum Lokalisieren und Verfolgen akustischer aktiver Quellen (11) im Straßenverkehr geeignet. Das Verfahren (1) umfasst insbesondere die Schritte:Schätzen von Phasenversätzen mit Hilfe von transformierten Schallsignalen und von Quellenfrequenzen, um für jede aktive Quelle einen geschätzten Einfallswinkel zu erhalten; und gemeinsames Schätzen einer Position und einer Geschwindigkeit zumindest einer der aktiven Quellen einer Quellenstatistik im Zustandsraum, wobei ein lineares Bewegungsmodell der aktiven Quelle angenommen wird und eine nichtlineare Funktion, welche geschätzte Einfallswinkelspektren sowie Positionen und Geschwindigkeiten ins Verhältnis setzt, verwendet wird.

Description

  • Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen bzw. akustischer Signale. Insbesondere sind das erfindungsgemäße Verfahren und die erfindungsgemäße Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen im Straßenverkehr geeignet.
  • In Fahrzeugen kommen vermehrt Fahrerassistenzsysteme zum Einsatz und autonomes Fahren ist ein Entwicklungsschwerpunkt. Um solchen Fahrerassistenzsystemen, wie automatischer Kollisionswarnung, automatischem Bremsen oder automatischem Ausweichen und ähnlichen, aber auch Systemen für autonomes Fahren Daten über Position und/oder Geschwindigkeit von Objekten in der Umgebung eines Fahrzeugs bereitstellen zu können, werden Sensoren wie Kameras, LiDAR, Ultraschallsensoren und der gleichen eingesetzt.
  • Insbesondere die Verarbeitung von Bilddaten und die Ermittlung von Position und/oder Geschwindigkeit von Objekten daraus, sind sehr kompliziert und rechenaufwendig. Allgemein sind für die Bereitstellung und Verarbeitung von Daten bezüglich der Position und/oder Geschwindigkeit von Objekten insbesondere in Fahrzeugen im Straßenverkehr die Echtzeitfähigkeit und möglichst geringe vorbestimmte Annahmen von großer Bedeutung. Es muss möglich sein, das Verfahren echtzeitfähig auf gegebener Hardware von Fahrzeugen zu implementieren bzw. in bestehende Fahrzeuge zu integrieren. Daher darf zum einen das Verfahren keine zu rechenaufwändigen Algorithmen, wie z. B. maschinelles Lernen, beinhalten. Zum anderen dürfen keine Algorithmen verwendet werden, welche den gesamten Datensatz (alle Daten einer längeren Signalaufnahme) benötigen, um eine erfolgreiche Detektion oder Lokalisation durchzuführen. Zudem gilt, dass akustische Quellen, welche im Straßenverkehr auftreten, verschiedenste spezifische Eigenschaften besitzen. Zum Beispiel handelt es sich bei einer Sirene (Feuerwehr, Polizei, Krankenwagen)um ein schmalbandiges Signal. Das Motorengeräusch eines vorbeifahrenden Autos hat jedoch eine breitbandige Charakteristik. Bei dem Aufprall eines Autos hingegen handelt es sich um ein impulsives Geräusch. Diese Beispiele dienen nur der Veranschaulichung, wie divers die Eigenschaften der zu detektierenden und zu lokalisierenden Quellen sind. Weiterhin können sich diese Eigenschaften auch über die Zeit verändern. Aus diesen Gründen sollten keine Annahmen über die Eigenschaften der Quelle gemacht, sondern alle Informationen aus den aufgenommenen Daten inferiert werden. Genauso wie die Eigenschaften der Quellen sind auch die Eigenschaften der Störgeräusche sehr divers und können deshalb nicht ohne weiteres a priori modelliert werden. Besonders das Frequenzverhalten der Störungen hängt sehr stark von der konkreten Situation ab. Aus demselben Grund wie bei den Eigenschaften der Quellen sollten hier alle notwendigen Informationen direkt aus den Daten geschätzt werden.
  • Die vorliegende Erfindung löst daher die Aufgabe, ein Verfahren und eine Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen bzw. akustischer Signale bereitzustellen, die zuvor genannte Probleme löst oder zumindest abschwächt.
  • Diese Aufgabe wird durch das Verfahren gemäß Patentanspruch 1 sowie die Vorrichtung gemäß dem weiteren unabhängigen Anspruch gelöst. Vorteilhafte Weiterbildungen und Ausführungsformen der vorliegenden Erfindung sind Gegenstand der abhängigen Patentansprüche.
  • Die vorliegende Erfindung stellt ein Verfahren und eine Vorrichtung zur passiv akustischen Ortung von anderen Teilnehmern im Straßenverkehr bereit, wobei mehrere Mikrofone in mehreren Gruppen (Mikrofonarrays) planar in der Ebene angeordnet sind. Zudem ermöglicht die vorliegende Erfindung die Detektion von Zielen bzw. aktiven Quellen gegenüber Hintergrundgeräuschen durch eine spektrale Signatur und ein Mehrschwellenverfahren in Frequenz- und Zeitbereich.
  • Das erfindungsgemäße Verfahren zum Lokalisieren und Verfolgen akustischer aktiver Quellen, umfasst die folgenden Schritte:
    1. a) Aufnehmen von Schallsignalen mit mindestens zwei Mikrofonarrays bestehend aus jeweils mindestens zwei Mikrofonen, um aufgenommene Schallsignale zu erhalten.
    2. b) Transformieren der aufgenommenen Schallsignale in den Zeit-Frequenz-Bereich, um transformierte Schallsignale zu erhalten.
    3. c) Ermitteln von Detektionen in den transformierten Schallsignalen mittels eines Hypothesentests, um eine Teststatistik zu erhalten.
    4. d) Ermitteln von aktiven Quellen in der Teststatistik mittels eines binären Hypothesentests im Zeitbereich.
    5. e) Auswählen von Frequenzen in den transformierten Schallsignalen basierend auf der Amplitude der jeweiligen Frequenzen, um Quellenfrequenzen der aktiven Quellen zu erhalten.
    6. f) Schätzen von Phasenversätzen mit Hilfe der transformierten Schallsignale und der Quellenfrequenzen, um für jede aktive Quelle einen geschätzten Einfallswinkel zu erhalten.
    7. g) Gemeinsames Schätzen einer Position und einer Geschwindigkeit zumindest einer der aktiven Quellen der Quellenstatistik im Zustandsraum, wobei ein lineares Bewegungsmodell der aktiven Quelle angenommen wird und eine nichtlineare Funktion, welche die geschätzten Einfallswinkelspektren sowie Positionen und Geschwindigkeiten ins Verhältnis setzt, verwendet wird.
  • Das Verfahren ist insbesondere vorteilhaft für die Ermittlung von Gegenständen und Gefahren (wie z. B. Fußgänger, Fahrräder, Kraftfahrzeuge und weitere aktive oder passive Verkehrsteilnehmer) im Straßenverkehr anhand ihrer Schallsignale (Betriebsgeräusche, Warnsignale und dergleichen). Vor allem in Fahrerassistenzsystemen, wie Kollisionswarnung, automatischem Bremsassistenten, autonomem Fahren und dergleichen, von Fahrzeugen können die Informationen über ermittelte Gegenstände und Gefahren aus dem erfindungsgemäßen Verfahren verwendet werden.
  • Die mindestens zwei Mikrofonarrays sind in einem Abstand zueinander angeordnet. Dabei sind die Mikrofonarrays bevorzugt planar in einer Ebene angeordnet, die bevorzugt eine horizontale Ebene sein kann. Weiter können die Mikrofonarrays bevorzugt parallel zueinander ausgerichtet sein. Weiterhin bevorzugt sind die Mikrofonarrays in einem Abstand von 70 Zentimetern ([cm]) bis 90 [cm] und besonders bevorzugt in einem Abstand von 80 [cm] +/- 1 [cm] angeordnet. Durch den Abstand zwischen den Mikrofonarrays erreichen Schallwellen je nach der Position der Quelle, von der die Schallwellen ausgesendet wurden, zu unterschiedlichen Zeiten die einzelnen Mikrofonarrays. Aus diesem Laufzeitunterschied zwischen den Schallsignalen an den einzelnen Mikrofonen lässt sich der Einfallswinkel der Schallsignale von der Quelle relativ zu den Mikrofonarrays ermitteln. Hieraus lässt sich über das Prinzip der Triangulation die Position der Quelle ermitteln. Jedes Mikrofonarray muss aus mehreren Mikrofonen gebildet werden. Der Abstand der einzelnen Mikrofone eines Mikrofonarrays zueinander kann bevorzugt 4 [cm] +/- 0,5 [cm] betragen. Die einzelnen Mikrophone eines Mikrofonarrays können weiter bevorzugt in eine Ebene angeordnet und/oder parallel zueinander ausgerichtet sein. Die Anzahl der Mikrofone trägt zu der Präzision der Schallortung bei, wobei mit steigender Anzahl der Mikrophone eines Mikrofonarrays die Präzision der Ortung der Quelle der Schallsignale steigt.
  • Die aufgenommenen Schallsignale werden für die weitere Signalverarbeitung in den Zeit-Frequenz-Bereich transformiert. Die Transformation der aufgenommenen Schallsignale in den Zeit-Frequenz-Bereich erfolgt bevorzugt mittels einer schnellen Fourier-Transformation (Fast Fourier Transformation, FFT) .
  • Zur Diskriminierung der Detektionen der Schallquellen von Hintergrundgeräuschen wird eine Hypothese aufgestellt. Je nachdem, ob ein Schallsignal im Zeit-Frequenz-Bereich aufgrund seiner Frequenz den Hypothesentest besteht, wird eine Detektion erkannt. Der Hypothesentest wird mithilfe einer Teststatistik im Zeit-Frequenz-Bereich durchgeführt.
  • Die aktiven Quellen werden aus den Detektionen in der Teststatistik mit einem binären Hypothesentest ermittelt. Dabei werden zeitliche Häufungen von Detektionen als eine aktive Quelle identifiziert.
  • Aus den transformierten Schallsignalen wird basierend auf der Amplitude der jeweiligen Frequenzen jeweils nur die mindestens eine stärkste Frequenz jeder einzelnen der aktiven Quellen als deren mindestens eine Quellenfrequenz ausgewählt. Basierend auf den transformierten Schallsignalen und den ausgewählten Quellenfrequenzen wird der Phasenversatz bzw. der Laufzeitunterschied der Schallsignale der aktiven Quellen an den Mikrofonarrays abgeschätzt. Basierend auf dem geschätzten Phasenversatz bzw. Laufzeitunterschied wird für jede Quellenfrequenz und somit für jede aktive Quelle ein Einfallswinkel bezüglich jedem der Mikrofonarrays bestimmt.
  • Im Zustandsraum wird gemeinsam die Position und Geschwindigkeit (Zustand) jeder aktiven Quelle geschätzt, in dem für jede aktive Quelle ein lineares Bewegungsmodell angenommen wird. Diese linearen Bewegungsmodelle sind bei abhängig von der Abtastrate des Verfahrens hinreichend genau. Bevorzugt beträgt die Abtastrate mindestens 8000 Hertz ([Hz]). Es wird bevorzugt eine nichtlineare Funktion verwendet, um die Einfallswinkel der aktiven Quellen und die Zustände (Position und Geschwindigkeit) der einzelnen aktiven Quellen ins Verhältnis zu setzen. Somit kann für jeden Zeitschritt nur aus den aktuellen Daten und den Daten aus dem Zeitschritt davor gemeinsam die Position und die Geschwindigkeit, also der zustand jeder einzelnen aktiven Quelle geschätzt werden.
  • Es kann auch eine Aussage über die Unsicherheit der Schätzung der Position und der Geschwindigkeit (des Zustands) jeder aktiven Quelle getroffen werden. Diese Aussage kann für die weitere Verarbeitung in einem Fahrerassistenzsystem eines Fahrzeugs wie dem autonomen Fahren wichtig sein.
  • Gemäß einer vorteilhaften Weiterbildung des erfindungsgemäßen Verfahrens umfasst der Schritt des Ermittelns von Detektionen folgende Schritte:
    • c1) Schätzen der spektralen Leistungsdichte von Hintergrundgeräuschen in den transformierten Schallsignalen, um eine geschätzte spektrale Leistungsdichte zu erhalten.
    • c2) Dividieren der transformierten Schallsignale durch die geschätzte spektrale Leistungsdichte, um die Teststatistik zu erhalten.
  • In einem Zeitraum ohne aktive Quellen wird aus den aufgenommenen Schallsignalen über eine vorgegebene Dauer die spektrale Leistungsdichte der Hintergrundgeräusche ermittelt und somit geschätzt. Die geschätzte spektrale Leistungsdichte wird abgespeichert und in den nachfolgenden Schritten weiterverwendet.
  • Die transformierten Schallsignale werden in die Teststatistik umgewandelt, indem die Schallsignale durch die geschätzte spektrale Leistungsdichte der Hintergrundgeräusche dividiert werden.
  • Gemäß einer vorteilhaften Weiterbildung des erfindungsgemäßen Verfahrens wird im Schritt des Ermittelns von Detektionen eine maskierte Teststatistik ermittelt und dieser Schritt umfasst die die folgenden Schritte:
    • c3) Schätzen eines Schwellwertes anhand der geschätzten spektralen Leistungsdichte, um einen ersten Schwellwert zu erhalten;
    • c4) Ermitteln von Detektionen in der Teststatistik, wobei nur Amplitudenwerte in der Teststatistik, die größer oder gleich dem ersten Schwellwert sind, als Detektion gewertet werden und die übrigen Amplitudenwerte zu null gesetzt werden, um eine Binärmaske zu erhalten;
    • c5) Durchführen einer morphologischen Filterung (S3.5) der ermittelten Detektionen der Binärmaske, um eine gefilterte Binärmaske zu erhalten;
    • c6) Multiplizieren der Teststatistik mit der gefilterten Binärmaske (S3.6), um eine maskierte Teststatistik zu erhalten.
  • Basierend auf der geschätzten spektralen Leistungsdichte wird ein erster Schwellwert für Amplitudenwerte abgeschätzt und gespeichert.
  • In der Teststatistik werden nur Amplitudenwerte die größer oder gleich dem ersten Schwellwert sind als ermittelte Detektionen gewertet bzw. markiert woraus sich die Binärmaske ergibt. Die übrigen Amplitudenwerte werden zu null gesetzt.
  • Durch die morphologische Filterung oder ein Soft-Max-Verfahren werden nur Häufungen von Amplitudenwerten in der Binärmaske zu eins und alle anderen Amplitudenwerte, die nicht in Häufungen auftreten, gleich null gesetzt, sodass eine gefilterte Binärmaske entsteht. Dies dient der Vermeidung von Fehlern 1. Art und Fehlern 2. Art.
  • Die Teststatistik wird mit der Binärmaske multipliziert wodurch eine maskierte Teststatistik erhalten wird in der nur die Amplitudenwerte der Detektionen enthalten sind.
  • Zum einen wird dadurch die Teststatistik an Zeit-Frequenz-Punkten, welche sicher keine aktive Quelle darstellen, zu null gesetzt. Zum anderen wird bei Zeit-Frequenz-Punkten, welche potentiell zu einer aktiven Quelle gehören der Grad der Sicherheit erhalten ob es sich um eine Quelle handelt oder nicht. Diese Information ist für die nachfolgenden Schritte essentiell.
  • Gemäß einer vorteilhaften Weiterbildung des erfindungsgemäßen Verfahrens umfasst der Schritt des Durchführens einer morphologischen Filterung mindestens einen der folgenden Schritte:
    • c5.1) Durchführen einer morphologischen Öffnung, wobei Amplitudenwerte der ermittelten Detektionen der Binärmaske, die keine ermittelte Detektion in benachbarten Zeit-Frequenz-Punkten aufweisen, zu null gesetzt werden, um „morphologisch geöffnete Detektionen“ zu erhalten.
    • c5.2) Durchführen einer morphologischen Schließung, wobei Amplitudenwerte der ermittelten Detektionen der Binärmaske, die ermittelte Detektionen in benachbarten Zeit-Frequenz-Punkten aufweisen, zu eins gesetzt werden, um „morphologisch geschlossene Detektionen“ zu erhalten.
  • Nur ermittelte Detektionen, die in einer gewissen Häufung bzw. über eine gewisse Zeitdauer hinweg, also mit einer gewissen Anzahl an benachbarten ermittelten Detektionen auftreten werden zu eins gesetzt. Vereinzelte ermittelte Detektionen werden zu null gesetzt. Somit können Störgeräusche und Artefakte vermieden werden. Dies hängt zum einen mit der Art der morphologischen Filterung zusammen. Zum anderen hängt es auch mit der Art des detektierten Schallsignals zusammen. Ein impulsives Signal (wie z. B. ein Klatschen) würde, obwohl es eine kurze Zeitdauer hat, nicht entfernt werden da es eine große Ausdehnung im Frequenzbereich besitzt. Ein reines Sinussignal, welches nur aus einer einzelnen Frequenz besteht, würde auch nicht zu null gesetzt werden, da es über eine lange Zeit aktiv ist.
  • Gemäß einer vorteilhaften Weiterbildung des erfindungsgemäßen Verfahrens umfasst der Schritt des Ermittelns von aktiven Quellen folgende Schritte:
    • d1) Projizieren der Teststatistik in den Zeitbereich, um eine projizierte Teststatistik zu erhalten.
    • d2) Schätzen eines Schwellwerts anhand der projizierten Teststatistik, um einen zweiten Schwellwert zu erhalten.
    • d3) Ermitteln von aktiven Quellen in der projizierten Teststatistik, wobei nur Werte in der projizierten Teststatistik, die größer oder gleich dem zweiten Schwellwert sind, als aktive Quellen gewertet werden und die übrigen Werte zu null gesetzt werden, um die aktiven Quellen zu erhalten.
  • Die Teststatistik bzw. die maskierte Teststatistik wird zurück in den Zeit-Bereich projiziert. Die Projektion in den Zeitbereich erfolgt indem die maskierte Teststatistik über die Frequenz summiert wird um eine Summenstatistik zu erhalten.
  • In der projizierten Teststatistik wird ein zweiter Schwellwert abgeschätzt und gespeichert. Der Schwellwert wird dabei so bestimmt, dass eine vorgegebene Schranke für eine Falschalarmrate eingehalten (d.h. nicht überschritten) wird.
  • Die Werte bzw. Amplitudenwerte in der projizierten Teststatistik, die nicht größer oder gleich dem zweiten Schwellwert sind, werden nicht als aktive Quellen gewertet und zu null gesetzt, so dass die Falschalarmrate die vorgegebenen Schranke nicht überschreitet.
  • Nach diesem Schritt ist es nun möglich zu ermitteln zu welchen Zeitpunkten mindestens eine akustische Quelle aktiv ist. Diese Information ist für die Lokalisation und Zielverfolgung notwendig, da nur eine Position und später eine Geschwindigkeit inferiert werden soll, falls auch eine akustische Quelle aktiv ist.
  • Gemäß einer vorteilhaften Weiterbildung des erfindungsgemäßen Verfahrens umfasst der Schritt des Auswählens von Frequenzen folgende Schritte:
    • e1) Multiplizieren der transformierten Schallsignale mit der Binärmaske, um maskierte Schallsignale zu erhalten.
    • e2) Anwenden eines Peak-Detection-Verfahrens auf die maskierten Schallsignale, um die Quellenfrequenzen der aktiven Quellen zu erhalten.
  • Die transformierten Schallsignale werden in maskierte Schallsignale verarbeitet, indem die Binärmaske mit den transformierten Schallsignalen multipliziert wird.
  • Auf die maskierten Schallsignale wird ein Peak-Detection-Verfahren angewendet. Damit werden nur die Frequenzen mit den stärksten Amplituden herausgefiltert. Diese stellen jeweils zumindest eine der Quellenfrequenzen einer der aktiven Quellen dar.
  • Basierend auf den Quellenfrequenzen können die Richtungen, aus welcher Schallsignale der aktiven Quellen auf den Mikrofonarrays auftreffen, über Zeitverzögerungen (Laufzeitunterschiede) zwischen den einzelnen Mikrofonarrays geschätzt werden.
  • Gemäß einer vorteilhaften Weiterbildung des erfindungsgemäßen Verfahrens umfasst der Schritt des Schätzens von Phasenversätzen folgende Schritte:
    • f1) Schätzen einer räumlichen Kovarianz für jede Quellenfrequenz, um geschätzte räumliche Kovarianzen zu erhalten.
    • f2) Schätzen eines Einfallswinkelspektrums für jede Quellenfrequenz aus den geschätzten räumlichen Kovarianzen, um geschätzte Einfallswinkelspektren zu erhalten.
    • f3) Bilden eines geometrischen Mittelwerts zwischen den geschätzten Einfallswinkelspektren, um jeweils ein einzelnes Einfallswinkelspektrum für jedes Mikrofonarray zu erhalten.
    • f4) Extrahieren der stärksten Peaks aus den einzelnen Einfallswinkelspektren, um für jede aktive Quelle den geschätzten Einfallswinkel zu erhalten.
  • Es wird eine räumliche Kovarianz-Matrix, welche die Korrelation der einzelnen im Raum verteilten Mikrofone beschreibt (in Analogie zur zeitlichen Kovarianz, welche die Korrelation eines Signals über die Zeit beschreibt), für jede Quellenfrequenz geschätzt. Zur Schätzung der Kovarianz-Matrix wird die Stichprobenvarianz verwendet. Dies ist notwendig um die späteren Einfallswinkel der Quelle zu schätzen.
  • Basierend auf den geschätzten räumlichen Kovarianzen werden Einfallswinkelspektren für die aktiven Quellen geschätzt. Zum Schätzen der Einfallswinkel wird der MUSIC Algorithmus (Schmidt 1979) verwendet.
  • Aus den einzelnen Einfallswinkelspektren wird jeweils ein Einfallswinkelspektrum für jedes Mikrofonarray erzeugt, indem jeweils ein geometrischer Mittelwert aus den einzelnen Einfallswinkelspektren erzeugt wird.
  • Aus den einzelnen Einfallswinkelspektren, welche die Verteilung der Leistung über den Raumwinkel darstellen (in Analogie zum Spektrum, bei dem die Leistung über die Frequenz ermittelt wird, werden nur die stärksten Peaks, d.h. die Einfallswinkel mit der höchsten Leistungsdichte, herausgenommen. Aus den stärksten Peaks wird für jede aktive Quelle der geschätzten Einfallswinkel ermittelt.
  • Diese Schritte stellen die Grundvoraussetzung für die folgenden Schritte da, da die Einfallswinkel für die spätere Zielortung und -verfolgung notwendig sind.
  • Mit der vorliegenden Erfindung ist somit eine Richtungserkennung und Zielverfolgung dadurch möglich, dass der MUSIC-Algorithmus mit einem Kalman- oder Partikelfilter kombiniert wird.
  • Die verwendeten Verfahren wurden an die Anforderung zugeschnitten. Die geschieht insbesondere durch die Vorverarbeitung, welche im Gegensatz zu etablierten Verfahren, keinerlei Modellannahmen voraussetzt. Insbesondere betrifft dies die Detektion von aktiven Quellen, sowie die Ermittlung der aktiven Frequenzen, welche nicht a priori bekannt sein müssen, aber Grundlage für die weitere Verarbeitung sind.
  • Die erfindungsgemäße Vorrichtung zum Lokalisieren und Verfolgen von akustischen aktiven Quellen umfasst als Module mindestens zwei Mikrofonarrays, ein Zeit-Frequenz-Analyse-Modul, ein Detektionsmodul, ein Quellenmodul, ein Frequenzmodul, ein Winkelmodul und ein Verfolgungsmodul. Die mindestens zwei Mikrofonarrays bestehen aus jeweils mindestens einem Mikrofon und sind eingerichtet, um Schallsignale aufzunehmen. Das Zeit-Frequenz-Analyse-Modul ist eingerichtet, um die aufgenommenen Schallsignale in den Zeit-Frequenz-Bereich zu transformieren. Das Detektionsmodul ist eingerichtet, um Detektionen in den transformierten Schallsignalen mittels eines Hypothesentests zu ermitteln und um eine Teststatistik basierend auf den Detektionen zu erhalten. Das Quellenmodul ist eingerichtet, um aktive Quellen in der Teststatistik mittels eines binären Hypothesentests im Zeitbereich zu ermitteln. Das Frequenzmodul ist eingerichtet, um Frequenzen in den transformierten Schallsignalen basierend auf der Amplitude der jeweiligen Frequenzen auszuwählen und um Quellenfrequenzen der aktiven Quellen basierend auf den ausgewählten Frequenzen zu erhalten. Das Winkelmodul ist eingerichtet, um Phasenversätze mit Hilfe der transformierten Schallsignale und der Quellenfrequenzen zu schätzen und um für jede aktive Quelle einen geschätzten Einfallswinkel basierend auf den Phasenversätzen zu erhalten. Das Verfolgungsmodul ist eingerichtet, um eine Position und eine Geschwindigkeit zumindest einer der aktiven Quellen der Quellenstatistik im Zustandsraum gemeinsam zu schätzen, wobei ein lineares Bewegungsmodell der aktiven Quelle angenommen wird und eine nichtlineare Funktion, welche die geschätzten Einfallswinkelspektren sowie Positionen und Geschwindigkeiten ins Verhältnis setzt, verwendet wird.
  • Die Vorrichtung ist insbesondere vorteilhaft für die Ermittlung von Gegenständen und Gefahren (wie z. B. Fußgänger, Fahrräder, Kraftfahrzeuge und weitere aktive oder passive Verkehrsteilnehmer) im Straßenverkehr anhand ihrer Schallsignale (Betriebsgeräusche, Warnsignale und dergleichen). Vor allem in Fahrerassistenzsystemen, wie Kollisionswarnung, automatischem Bremsassistenten, autonomem Fahren und dergleichen, von Fahrzeugen können die Informationen über ermittelte Gegenstände und Gefahren aus dem erfindungsgemäßen Verfahren verwendet werden.
  • Die mindestens zwei Mikrofonarrays sind in einem Abstand zueinander angeordnet. Dabei sind die Mikrofonarrays bevorzugt planar in einer Ebene angeordnet, die bevorzugt eine horizontale Ebene sein kann. Weiter können die Mikrofonarrays bevorzugt parallel zueinander ausgerichtet sein. Weiterhin bevorzugt sind die Mikrofonarrays in einem Abstand von 70 Zentimetern ([cm]) bis 90 [cm] und besonders bevorzugt in einem Abstand von 80 [cm] +/- 1 [cm] angeordnet. Durch den Abstand zwischen den Mikrofonarrays erreichen Schallwellen je nach der Position der Quelle, von der die Schallwellen ausgesendet wurden, zu unterschiedlichen Zeiten die einzelnen Mikrofonarrays. Aus diesem Laufzeitunterschied zwischen den Schallsignalen an den einzelnen Mikrofonen lässt sich der Einfallswinkel Schallsignale von der Quelle relativ zu den Mikrofonarrays ermitteln. Hieraus lässt sich über das Prinzip der Triangulation die Position der Quelle ermitteln. Jedes Mikrofonarray muss aus mehreren Mikrofonen gebildet werden. Der Abstand der einzelnen Mikrofone eines Mikrofonarrays zueinander kann bevorzugt 4 [cm] +/- 0,5 [cm] betragen. Die einzelnen Mikrophone eines Mikrofonarrays können weiter bevorzugt in eine Ebene angeordnet und/oder parallel zueinander ausgerichtet sein. Die Anzahl der Mikrofone trägt zu der Präzision der Schallortung bei, wobei mit steigender Anzahl der Mikrophone eines Mikrofonarrays die Präzision der Ortung der Quelle der Schallsignale steigt.
  • Die aufgenommenen Schallsignale werden für die weitere Signalverarbeitung von dem Zeit-Frequenz-Analyse-Modul in den Zeit-Frequenz-Bereich transformiert. Die Transformation der aufgenommenen Schallsignale in den Zeit-Frequenz-Bereich erfolgt bevorzugt mittels einer FFT.
  • Zur Diskriminierung der Detektionen der Schallquellen von Hintergrundgeräuschen durch das Detektionsmodul wird eine Hypothese aufgestellt. Je nachdem, ob ein Schallsignal im Zeit-Frequenz-Bereich aufgrund seiner Frequenz den Hypothesentest besteht, wird eine Detektion erkannt. Aus den Detektionen wird eine Teststatistik im Zeit-Frequenz-Bereich erstellt.
  • Die aktiven Quellen werden von dem Quellenmodul aus den Detektionen in der Teststatistik mit einem binären Hypothesentest ermittelt. Dabei werden zeitliche Häufungen von Detektionen als eine aktive Quelle identifiziert.
  • Aus den transformierten Schallsignalen wird von dem Frequenzmodul basierend auf der Amplitude der jeweiligen Frequenzen jeweils nur die mindestens eine stärkste Frequenz jeder einzelnen der aktiven Quellen als deren mindestens eine Quellenfrequenz ausgewählt.
  • Basierend auf den transformierten Schallsignalen und den ausgewählten Quellenfrequenzen wird von dem Winkelmodul der Phasenversatz bzw. der Laufzeitunterschied der Schallsignale der aktiven Quellen an den Mikrofonarrays abgeschätzt. Basierend auf dem geschätzten Phasenversatz bzw. Laufzeitunterschied wird für jede Quellenfrequenz und somit für jede aktive Quelle ein Einfallswinkel bezüglich jedem der Mikrofonarrays bestimmt.
  • Im Zustandsraum wird gemeinsam die Position und Geschwindigkeit (Zustand) jeder aktiven Quelle von dem Verfolgungsmodul geschätzt, in dem für jede aktive Quelle ein lineares Bewegungsmodell angenommen wird. Diese linearen Bewegungsmodelle sind bei abhängig von der Abtastrate des Verfahrens hinreichend genau. Bevorzugt beträgt die Abtastrate mindestens 8000 Hertz ([Hz]). Es wird bevorzugt eine nichtlineare Funktion verwendet, um die Einfallswinkel der aktiven Quellen und die Zustände (Position und Geschwindigkeit) der einzelnen aktiven Quellen ins Verhältnis zu setzen. Somit kann für jeden Zeitschritt nur aus den aktuellen Daten und den Daten aus dem Zeitschritt davor gemeinsam die Position und die Geschwindigkeit, also der zustand jeder einzelnen aktiven Quelle geschätzt werden.
  • Es kann auch eine Aussage über die Unsicherheit der Schätzung der Position und der Geschwindigkeit (des Zustands) jeder aktiven Quelle getroffen werden. Diese Aussage kann für die weitere Verarbeitung in einem Fahrerassistenzsystem eines Fahrzeugs wie dem autonomen Fahren wichtig sein.
  • Die einzelnen Module der erfindungsgemäßen Vorrichtung können separate Datenverarbeitungseinrichtungen, wie z. B. Mikrocontroller (pC), integrierte Schaltungen, anwendungsspezifische integrierte Schaltungen (Application-Specific Integrated Circuit, ASIC), anwendungsspezifisches Standardprodukte (Application-Specific Standard Products, ASSP), digitale Signalprozessoren (DSP), im Feld programmierbare (Logik-)Gatter-Anordnung (Field Programmable Gate Arrays, FPGA) und dergleichen sein. Sie können gemeinsam auf einem oder auf mehreren solcher Datenverarbeitungseinrichtungen implementiert werden. Dabei können die einzelnen Module als Module eines Softwareprogramms ausgestaltet sein.
  • Die zuvor dargestellten Ausführungen bezüglich des erfindungsgemäßen Verfahrens gelten auch für die erfindungsgemäße Vorrichtung. So können alle Schritte des Verfahrens und der vorteilhaften Weiterbildungen des erfindungsgemäßen Verfahrens durch die erfindungsgemäße Vorrichtung bzw. durch die entsprechenden Module der erfindungsgemäßen Vorrichtung ausgeführt werden.
  • Die Erfindung betrifft ferner ein Fahrzeug das eine Vorrichtung wie zuvor beschrieben und zumindest ein Fahrerassistenzsystem umfasst. Die zumindest eine geschätzte Position und Geschwindigkeit zumindest einer der aktiven Quellen von der Vorrichtung wird an das Fahrerassistenzsystem übertragen.
  • Das Fahrerassistenzsystem, wie Kollisionswarnung, automatischer Bremsassistent, autonomes Fahren und dergleichen, kann aus den geschätzten Positionen und Geschwindigkeiten der aktiven Quellen Entscheidungen über die Unterstützung des Fahrers des Fahrzeugs treffen. So kann z. B. eine Warnung für den Fahrer oder ein automatisches Bremsen ausgelöst werden, wenn das Fahrzeug mit einer gewissen Geschwindigkeit einer aktiven Quelle zu nahe kommt.
  • Figurenliste
    • 1 zeigt ein Ablaufdiagramm des erfindungsgemäßen Verfahrens.
    • 2 zeigt eine schematische Darstellung der erfindungsgemäßen Vorrichtung in einem Fahrzeug.
  • AUSFÜHRLICHE BESCHREIBUNG DER FIGUREN
  • Die in den Figuren und deren Beschreibung dargestellten bevorzugten Ausführungsformen der vorliegenden Erfindung dienen lediglich dem besseren Verständnis der Erfindung, sind jedoch keinesfalls einschränkend auszulegen.
  • In 1 ist ein Verfahren 1 zum Lokalisieren und Verfolgen akustischer aktiver Quellen als Ablaufdiagramm dargestellt. Nach einer optionalen Initialisierung S0 des Verfahrens 1 erfolgt eine kontinuierliche Aufnahme S1 von Schallsignalen mit mindestens zwei Mikrofonarrays. Darauf erfolgt ein Transformieren der aufgenommenen Schallsignale S2 in den Zeit-Frequenz-Bereich und ein Ermitteln von Detektionen S3 in den transformierten Schallsignalen mittels eines Hypothesentests, wobei eine Teststatistik erstellt wird. In der Teststatistik erfolgt ein Ermitteln von aktiven Quellen S4 mittels eines binären Hypothesentests im Zeitbereich. Anschließend erfolgt ein Auswählen von Frequenzen S5 in den transformierten Schallsignalen basierend auf der Amplitude der jeweiligen Frequenzen. Daraus resultieren Quellenfrequenzen der aktiven Quellen. Mit Hilfe der transformierten Schallsignale und der Quellenfrequenzen erfolgt ein Schätzen von Phasenversätzen S6, um für jede aktive Quelle einen geschätzten Einfallswinkel zu erhalten. Schließlich erfolgt im Zustandsraum ein gemeinsames Schätzen einer Position und einer Geschwindigkeit (Zustand) S7 zumindest einer der aktiven Quellen der Quellenstatistik. Es wird dazu ein lineares Bewegungsmodell der aktiven Quelle angenommen und eine nichtlineare Funktion, welche die geschätzten Einfallswinkelspektren sowie Positionen und Geschwindigkeiten ins Verhältnis setzt, verwendet.
  • In 2 ist eine Vorrichtung 10 zum Lokalisieren und Verfolgen akustischer aktiver Quellen schematisch dargestellt. Von einer akustischen aktiven Quelle 11 in der Umgebung eines Fahrzeugs 12 mit zwei Mikrofonarrays 13 umfassend jeweils vier Mikrofone 14 werden Schallsignale 15 (z. B. Betriebsgeräusche, Warnsignale und dergleichen) ausgesendet. Die Schallsignale 15 werden von den Mikrofonen 14 der zwei Mikrofonarrays 13 aufgenommen. Die aufgenommenen Schallsignale werden in einem Lokalisierungs- und Verfolgungsmodul 16 des Fahrzeugs 12 ausgewertet. Das Lokalisierungs- und Verfolgungsmodul 16 kann in einer Datenverarbeitungsanlage des Fahrzeugs 12 wie z. B. in dem Steuergerät ausgeführt sein. In dem Lokalisierungs- und Verfolgungsmodul ist ein Zeit-Frequenz-Analyse-Modul 16.1, das die aufgenommenen Schallsignale der zwei Mikrofonarrays 13 empfängt, mit einem Detektionsmodul 16.2 verbunden. Das Detektionsmodul 16.2 ist mit einem Quellenmodul 16.3 verbunden, welches wiederum mit einem Frequenzmodul 16.4 verbunden ist. An das Frequenzmodul ist ein Winkelmodul 16.5 und an dieses ein Verfolgungsmodul 16.6 angeschlossen. Von den Modulen 16.1 bis 16.6 werden aus den aufgenommenen Schallsignalen eine Position und eine Geschwindigkeit der aktiven Quelle 11 ermittelt und an ein Fahrerassistenzsystem 17 weitergeleitet. Das Fahrerassistenzsystem 17 kann aus der geschätzten Position und Geschwindigkeit der aktiven Quelle 11 eine Entscheidung über die Unterstützung eines Fahrers des Fahrzeugs treffen. Es kann eine Warnung für den Fahrer oder ein automatisches Bremsen auslösen, wenn das Fahrzeug 12 mit einer gewissen Geschwindigkeit der aktiven Quelle 11 zu nahe kommt.
  • Bezugszeichenliste
  • 1
    Verfahren
    10
    Vorrichtung
    11
    aktive Quellen
    12
    Fahrzeug
    13
    Mikrofonarray
    14
    Mikrofon
    15
    Schallsignale
    16
    Lokalisierungs- und Verfolgungsmodul
    16.1
    Zeit-Frequenz-Analyse-Modul
    16.2
    Detektionsmodul
    16.3
    Quellenmodul
    16.4
    Frequenzmodul
    16.5
    Winkelmodul
    16.6
    Verfolgungsmodul
    17
    Fahrerassistenzsystem
    S1
    Aufnehmen
    S2
    Transformieren der aufgenommenen Schallsignale
    S3
    Ermitteln von Detektionen
    S3.1
    Schätzen der spektralen Leistungsdichte
    S3.2
    Dividieren der transformierten Schallsignale
    S3.3
    Schätzen eines Schwellwertes
    S3.4
    Ermitteln von Detektionen
    S3.5
    Durchführen einer morphologischen Filterung
    S3.6
    Multiplizieren der Teststatistik mit der morphologisch gefilterten Binärmaske
    S4
    Ermitteln von aktiven Quellen
    S4.1
    Projizieren der Teststatistik
    S4.2
    Schätzen eines Schwellwerts
    S4.3
    Ermitteln von aktiven Quellen
    S5
    Auswählen von Frequenzen
    S5.1
    Multiplizieren der transformierten Schallsignale mit der Binärmaske
    S5.2
    Anwenden eines Peak-Detection-Verfahrens
    S6
    Schätzen von Phasenversätzen
    S6.1
    Schätzen einer räumlichen Kovarianz
    S6.2
    Schätzen eines Einfallswinkelspektrums
    S6.3
    Bilden eines geometrischen Mittelwerts
    S6.4
    Extrahieren der stärksten Peaks aus den einzelnen Einfallswinkelspektren
    S7
    Gemeinsames Schätzen einer Position und einer Geschwindigkeit

Claims (15)

  1. Verfahren (1) zum Lokalisieren und Verfolgen akustischer aktiver Quellen (11), umfassend die folgenden Schritte: a) Aufnehmen (S1) von Schallsignalen (15) mit mindestens zwei Mikrofonarrays (13) bestehend aus jeweils mindestens zwei Mikrofonen (14), um aufgenommene Schallsignale zu erhalten; b) Transformieren der aufgenommenen Schallsignale (S2) in den Zeit-Frequenz-Bereich, um transformierte Schallsignale zu erhalten; c) Ermitteln von Detektionen (S3) in den transformierten Schallsignalen mittels eines Hypothesentests, um eine Teststatistik zu erhalten; d) Ermitteln von aktiven Quellen (S4) in der Teststatistik mittels eines binären Hypothesentests im Zeitbereich; e) Auswählen von Frequenzen (S5) in den transformierten Schallsignalen basierend auf der Amplitude der jeweiligen Frequenzen, um Quellenfrequenzen der aktiven Quellen zu erhalten; f) Schätzen S6 von Phasenversätzen mit Hilfe der transformierten Schallsignale und der Quellenfrequenzen, um für jede aktive Quelle einen geschätzten Einfallswinkel zu erhalten; g) Gemeinsames Schätzen (S7) einer Position und einer Geschwindigkeit zumindest einer der aktiven Quellen der Quellenstatistik im Zustandsraum, wobei ein lineares Bewegungsmodell der aktiven Quelle angenommen wird und eine nichtlineare Funktion, welche die geschätzten Einfallswinkelspektren sowie Positionen und Geschwindigkeiten ins Verhältnis setzt, verwendet wird.
  2. Verfahren (1) nach Anspruch 1, wobei der Schritt des Ermittelns von Detektionen (S3) folgende Schritte umfasst: c1) Schätzen der spektralen Leistungsdichte (S3.1) von Hintergrundgeräuschen in den transformierten Schallsignalen, um eine geschätzte spektrale Leistungsdichte zu erhalten; c2) Dividieren der transformierten Schallsignale (S3.2) durch die geschätzte spektrale Leistungsdichte, um die Teststatistik zu erhalten.
  3. Verfahren (1) nach Anspruch 2, wobei im Schritt des Ermittelns von Detektionen (S3) eine maskierte Teststatistik ermittelt wird, umfassend die folgenden Schritte: c3) Schätzen eines Schwellwertes (S3.3) anhand der geschätzten spektralen Leistungsdichte, um einen ersten Schwellwert zu erhalten; c4) Ermitteln von Detektionen (S3.4) in der Teststatistik, wobei nur Amplitudenwerte in der Teststatistik, die größer oder gleich dem ersten Schwellwert sind, als Detektion gewertet werden und die übrigen Amplitudenwerte zu null gesetzt werden, um eine Binärmaske zu erhalten; c5) Durchführen einer morphologischen Filterung oder eines Soft-Max-verfahrens (S3.5) der ermittelten Detektionen der Binärmaske, um eine gefilterte Binärmaske zu erhalten; c6) Multiplizieren der Teststatistik mit der gefilterten Binärmaske (S3.6), um eine maskierte Teststatistik zu erhalten.
  4. Verfahren (1) nach Anspruch 3, wobei der Schritt des Durchführens einer morphologischen Filterung (S3.5) mindestens einen der folgenden Schritte umfasst: c5.1) Durchführen einer morphologischen Öffnung, wobei Amplitudenwerte der ermittelten Detektionen in der Binärmaske, die keine ermittelte Detektion in benachbarten Zeit-Frequenz-Punkten aufweisen, zu null gesetzt werden, um „morphologisch geöffnete Detektionen“ zu erhalten; c5.2) Durchführen einer morphologischen Schließung, wobei Amplitudenwerte der ermittelten Detektionen der Binärmaske, die ermittelte Detektionen in benachbarten Zeit-Frequenz-Punkten aufweisen, zu eins gesetzt werden, um „morphologisch geschlossene Detektionen“ zu erhalten.
  5. Verfahren (1) nach einem der vorherigen Ansprüche, wobei der Schritt des Ermittelns von aktiven Quellen (S4) folgende Schritte umfasst: d1) Projizieren der Teststatistik (S4.1) in den Zeitbereich, um eine projizierte Teststatistik zu erhalten; d2) Schätzen eines Schwellwerts (S4.2) anhand der projizierten Teststatistik, um einen zweiten Schwellwert zu erhalten; d3) Ermitteln von aktiven Quellen (S4.3) in der projizierten Teststatistik, wobei nur Werte in der projizierten Teststatistik, die größer oder gleich dem zweiten Schwellwert sind, als aktive Quellen gewertet werden und die übrigen Werte zu null gesetzt werden, um die aktiven Quellen zu erhalten.
  6. Verfahren (1) nach einem der Ansprüche 3 oder 4 bis 5, sofern diese Anspruch 3 umfassen, wobei der Schritt des Auswählens von Frequenzen (S5) folgende Schritte umfasst: e1) Multiplizieren der transformierten Schallsignale mit der Binärmaske (S5.1), um maskierte Schallsignale zu erhalten; e2) Anwenden eines Peak-Detection-Verfahrens (S5.2) auf die maskierten Schallsignale, um die Quellenfrequenzen der aktiven Quellen zu erhalten.
  7. Verfahren (1) nach einem der vorherigen Ansprüche, wobei der Schritt des Schätzens von Phasenversätzen (S6) folgende Schritte umfasst: f1) Schätzen einer räumlichen Kovarianz (S6.1) für jede Quellenfrequenz, um geschätzte räumliche Kovarianzen zu erhalten; f2) Schätzen eines Einfallswinkelspektrums (S6.2) für jede Quellenfrequenz aus den geschätzten räumlichen Kovarianzen, um geschätzte Einfallswinkelspektren zu erhalten; f3) Bilden eines geometrischen Mittelwerts (S6.3) zwischen den geschätzten Einfallswinkelspektren, um jeweils ein einzelnes Einfallswinkelspektrum für jedes Mikrofonarray zu erhalten; f4) Extrahieren der stärksten Peaks aus den einzelnen Einfallswinkelspektren (S6.4), um für jede aktive Quelle den geschätzten Einfallswinkel zu erhalten.
  8. Vorrichtung (10) zum Lokalisieren und Verfolgen von akustischen aktiven Quellen (11), umfassend: - mindestens zwei Mikrofonarrays (13) bestehend aus jeweils mindestens zwei Mikrofonen (14), die eingerichtet sind, um Schallsignale (15) aufzunehmen; - ein Zeit-Frequenz-Analyse-Modul (16.1), das eingerichtet ist, um die aufgenommenen Schallsignale in den Zeit-Frequenz-Bereich zu transformieren; - ein Detektionsmodul (16.2), das eingerichtet ist, um Detektionen in den transformierten Schallsignalen mittels eines Hypothesentests zu ermitteln und um eine Teststatistik basierend auf den Detektionen zu erhalten; - ein Quellenmodul (16.3), das eingerichtet ist, um aktive Quellen in der Teststatistik mittels eines binären Hypothesentests im Zeitbereich zu ermitteln; - ein Frequenzmodul (16.4), das eingerichtet ist, um Frequenzen in den transformierten Schallsignalen basierend auf der Amplitude der jeweiligen Frequenzen auszuwählen und um Quellenfrequenzen der aktiven Quellen basierend auf den ausgewählten Frequenzen zu erhalten; - ein Winkelmodul (16.5), das eingerichtet ist, um Phasenversätze mit Hilfe der transformierten Schallsignale und der Quellenfrequenzen zu schätzen und um für jede aktive Quelle einen geschätzten Einfallswinkel basierend auf den Phasenversätzen zu erhalten; - ein Verfolgungsmodul (16.6), das eingerichtet ist, um eine Position und eine Geschwindigkeit zumindest einer der aktiven Quellen der Quellenstatistik im Zustandsraum gemeinsam zu schätzen, wobei ein lineares Bewegungsmodell der aktiven Quelle angenommen wird und eine nichtlineare Funktion, welche die geschätzten Einfallswinkelspektren sowie Positionen und Geschwindigkeiten ins Verhältnis setzt, verwendet wird.
  9. Vorrichtung (10) nach Anspruch 8, wobei das Detektionsmodul (16.2) ferner eingerichtet ist, - um die spektrale Leistungsdichte von Hintergrundgeräuschen in den transformierten Schallsignalen zu schätzen; - um die transformierten Schallsignale durch die geschätzte spektrale Leistungsdichte zu dividieren, um die Teststatistik zu erhalten.
  10. Vorrichtung (10) nach Anspruch 9, wobei das Detektionsmodul (16.2), um eine maskierte Teststatistik zu ermitteln, ferner eingerichtet ist, - um einen Schwellwert anhand der geschätzten spektralen Leistungsdichte zu schätzen, um einen ersten Schwellwert zu erhalten; - um Detektionen in der Teststatistik zu ermitteln, wobei nur Amplitudenwerte in der Teststatistik, die größer oder gleich dem ersten Schwellwert sind, als Detektion gewertet werden und die übrigen Amplitudenwerte zu null gesetzt werden, um eine Binärmaske zu erhalten; - um eine morphologischen Filterung oder ein Soft-Max-Verfahren der ermittelten Detektionen der Binärmaske durchzuführen, um eine gefilterte Binärmaske zu erhalten; - um die Teststatistik mit der gefilterten Binärmaske zu multiplizieren, um eine maskierte Teststatistik zu erhalten.
  11. Vorrichtung (10) nach Anspruch 10, wobei das Detektionsmodul (16.2) ferner eingerichtet ist, - um eine morphologischen Öffnung durchzuführen, wobei Amplitudenwerte der ermittelten Detektionen der Binärmaske, die keine ermittelte Detektion in benachbarten Zeit-Frequenz-Punkten aufweisen, zu null gesetzt werden, um „morphologisch geöffnete Detektionen“ zu erhalten und/oder - um eine morphologischen Schließung durchzuführen, wobei Amplitudenwerte der ermittelten Detektionen der Binärmaske, die ermittelte Detektionen in benachbarten Zeit-Frequenz-Punkten aufweisen, zu eins gesetzt werden, um „morphologisch geschlossene Detektionen“ zu erhalten.
  12. Vorrichtung (10) nach einem der Ansprüche 8 bis 11, wobei das Quellenmodul (16.3) ferner eingerichtet ist, - um die Teststatistik in den Zeitbereich zu projizieren; - um einen Schwellwert anhand der projizierten Teststatistik zu schätzen, um einen zweiten Schwellwert zu erhalten; - um aktive Quellen in der projizierten Teststatistik zu ermitteln, wobei nur Werte in der projizierten Teststatistik, die größer oder gleich dem zweiten Schwellwert sind, als aktive Quellen gewertet werden und die übrigen Werte zu null gesetzt werden, um die aktiven Quellen zu erhalten.
  13. Vorrichtung (10) nach einem der Ansprüche 10 oder 11 bis 12, sofern diese Anspruch 10 umfassen, wobei das Frequenzmodul (16.4) ferner eingerichtet ist, - um die transformierten Schallsignale mit der Binärmaske zu multiplizieren, um maskierte Schallsignale zu erhalten; - um ein Peak-Detection-Verfahren auf die maskierten Schallsignale anzuwenden, um die Quellenfrequenzen der aktiven Quellen zu erhalten.
  14. Vorrichtung (10) nach einem der vorherigen Ansprüche, wobei das Winkelmodul (16.5) ferner eingerichtet ist, - um eine räumlichen Kovarianz für jede Quellenfrequenz zu schätzen, um geschätzte räumliche Kovarianzen zu erhalten; - ein Einfallswinkelspektrum für jede Quellenfrequenz aus den geschätzten räumlichen Kovarianzen zu schätzen, um geschätzte Einfallswinkelspektren zu erhalten; - um einen geometrischen Mittelwert zwischen den geschätzten Einfallswinkelspektren zu bilden, um jeweils ein einzelnes Einfallswinkelspektrum für jedes Mikrofonarray zu erhalten; - um die stärksten Peaks aus den einzelnen Einfallswinkelspektren zu extrahieren, um für jede aktive Quelle den geschätzten Einfallswinkel zu erhalten.
  15. Fahrzeug (12) umfassend eine Vorrichtung (10) gemäß einem der vorherigen Ansprüche 8 bis 14 und zumindest ein Fahrerassistenzsystem (17), wobei die zumindest eine geschätzte Position und Geschwindigkeit zumindest einer der aktiven Quellen von der Vorrichtung (10) an das Fahrerassistenzsystem (17) übertragen wird.
DE102018201605.4A 2018-02-02 2018-02-02 Verfahren und Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen Withdrawn DE102018201605A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE102018201605.4A DE102018201605A1 (de) 2018-02-02 2018-02-02 Verfahren und Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen
DE112019000196.5T DE112019000196A5 (de) 2018-02-02 2019-01-31 Verfahren und Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen
PCT/DE2019/200004 WO2019149323A1 (de) 2018-02-02 2019-01-31 Verfahren und vorrichtung zum lokalisieren und verfolgen akustischer aktiver quellen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102018201605.4A DE102018201605A1 (de) 2018-02-02 2018-02-02 Verfahren und Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen

Publications (1)

Publication Number Publication Date
DE102018201605A1 true DE102018201605A1 (de) 2019-08-08

Family

ID=65763233

Family Applications (2)

Application Number Title Priority Date Filing Date
DE102018201605.4A Withdrawn DE102018201605A1 (de) 2018-02-02 2018-02-02 Verfahren und Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen
DE112019000196.5T Pending DE112019000196A5 (de) 2018-02-02 2019-01-31 Verfahren und Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE112019000196.5T Pending DE112019000196A5 (de) 2018-02-02 2019-01-31 Verfahren und Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen

Country Status (2)

Country Link
DE (2) DE102018201605A1 (de)
WO (1) WO2019149323A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102021214178A1 (de) 2021-12-13 2023-06-15 Robert Bosch Gesellschaft mit beschränkter Haftung Lokalisierung von externen Schallquellen durch Ultraschallsensorarrays

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111965408A (zh) * 2020-07-06 2020-11-20 国网江苏省电力有限公司淮安供电分公司 一种基于形态滤波器的交直流混合电网故障零序电压幅值检测方法
CN113317781B (zh) * 2021-04-12 2023-07-21 中国人民解放军总医院第六医学中心 一种用于测试声源定位能力的测听系统及其方法
CN113406645B (zh) * 2021-05-10 2022-08-05 山东科技大学 一种平均声速水下声呐定位方法
CN113917434B (zh) * 2021-10-08 2024-05-28 陕西科技大学 一种基于代价参考粒子滤波器组的检测前跟踪方法
CN115460526B (zh) * 2022-11-11 2023-03-28 荣耀终端有限公司 一种听力模型的确定方法、电子设备及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5867351B2 (ja) * 2012-09-24 2016-02-24 トヨタ自動車株式会社 走行音を用いた車両検出装置
CN106772246B (zh) * 2017-01-20 2019-04-05 浙江大学 基于声阵列的无人机实时检测和定位系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102021214178A1 (de) 2021-12-13 2023-06-15 Robert Bosch Gesellschaft mit beschränkter Haftung Lokalisierung von externen Schallquellen durch Ultraschallsensorarrays

Also Published As

Publication number Publication date
WO2019149323A1 (de) 2019-08-08
DE112019000196A5 (de) 2020-07-30

Similar Documents

Publication Publication Date Title
DE102018201605A1 (de) Verfahren und Vorrichtung zum Lokalisieren und Verfolgen akustischer aktiver Quellen
EP3175256B1 (de) Verfahren zum klassifizieren eines objektes in einem umgebungsbereich eines kraftfahrzeugs, fahrerassistenzsystem und kraftfahrzeug
EP2504718B1 (de) Verfahren zur erfassung von objekten
DE102014217681B4 (de) Sirenensignalquellenerfassung, -Erkennung und -Lokalisation
DE102016118902A1 (de) Kollisionsvermeidung mit durch Kartendaten erweiterten auditorischen Daten
DE102017112992A1 (de) Trainingsalgorithmus zur kollisionsvermeidung unter verwenden von auditiven daten
DE102017102506B4 (de) Verfahren zum erfassen anderer fahrzeuge relativ zu einem trägerfahrzeug mittels raderfassung
DE102014001258A1 (de) Vorrichtung und Verfahren zur Erfassung mindestens eines Körperschallsignals
DE102021201968B4 (de) Verfahren zum Betreiben einer Ultrabreitbandvorrichtung, Ultrabreitbandvorrichtung und Fahrzeug umfassend eine Ultrabreitbandvorrichtung
DE102017103275A1 (de) Verfahren zum Erfassen eines Objekts in einem Umgebungsbereich eines Kraftfahrzeugs mithilfe eines Ultraschallsensors mit verbesserter Filterung von Bodenreflexionen, Steuergerät, Ultraschallsensorvorrichtung sowie Kraftfahrzeug
DE102013021845A1 (de) Verfahren zum Detektieren von Zielechos in einem Empfangssignal eines Ultraschallsensors eines Kraftfahrzeugs, Ultraschallsensoreinrichtung und Kraftfahrzeug
DE102017204496A1 (de) Verfahren und Radarvorrichtung zum Ermitteln von radialer relativer Beschleunigung mindestens eines Zieles
DE102018104243B3 (de) Verfahren und System zur Erkennung von für ein Fahrzeug geeigneten Parklücken
DE102018120685A1 (de) Mehrfachauflösungs-dopplerverarbeitung
DE102019200141A1 (de) Verfahren zum Erfassen von Teilbereichen eines Objekts
DE112018003126T5 (de) Umgebungsüberwachungsradarvorrichtung
WO2019162317A1 (de) Verfahren zur erzeugung von sensordaten für sicherheitskritische automobil-steuergeräte
DE19649618A1 (de) Verfahren und Vorrichtung zur automatischen Klassifikation von Objekten
DE102015119658A1 (de) Verfahren zum Erfassen eines Umgebungsbereichs eines Kraftfahrzeugs mit Objektklassifizierung, Steuereinrichtung, Fahrerassistenzsystem sowie Kraftfahrzeug
EP1352375B1 (de) Verfahren und vorrichtung zur schätzung von bewegungsparametern von zielen
DE102019216152A1 (de) Adaptiver Hochpunkt-Nachbarschaftsbereich
DE112019006419T5 (de) Messungseinrichtung, messungsverfahren und messungsprogramm
DE102019128686A1 (de) Verfahren und Vorrichtung zur Ermittlung von Bewegungsinformation in Bezug auf ein Objekt
DE10238896B4 (de) Verfahren zur Auswertung von Radardaten
EP3141928A1 (de) Verfahren zum ermitteln einer lage eines objektes mittels akustischer sensoren

Legal Events

Date Code Title Description
R118 Application deemed withdrawn due to claim for domestic priority