-
Die Erfindung betrifft eine Vorrichtung und ein Verfahren zu Ermittlung akustischer Sprachsignale, die von einer Anzahl N von akustischen Signalquellen ausgehen. Weiterhin betrifft die Erfindung ein Fahrzeug, insbesondere ein Kraftfahrzeug, einen Bus, einen Lkw, ein Luftfahrzeug, ein Wasserfahrzeug, ein Raumfahrzeug oder ein Schienenfahrzeug mit einer ebensolchen Vorrichtung.
-
Akustische Spracheingabe- bzw. Steuerungssysteme sind im Stand der Technik hinreichend bekannt. Derartige Systeme weisen typischerweise zumindest ein Mikrofon zur Aufnahme akustischer Signale auf. Die vom Mikrofon aufgenommenen Signale werden analysiert mit einem vorgegebenen Satz an Sprachbefehlen verglichen. Entspricht ein aufgenommenes akustisches Signal einem Sprachbefehl aus dem vorgegebenen Satz, dann wird der zu diesem Sprachbefehl hinterlegte Steuerbefehl ausgeführt.
-
Problematisch bei den bekannten akustischen Spracheingabe- bzw. Steuerungssystemen sind gleichzeitig erteilte unterschiedliche Sprachsteuerbefehle durch verschiedene Personen.
-
Aufgabe der Erfindung ist es, eine Vorrichtung sowie ein Verfahren anzugeben, das in der Lage ist, gleichzeitig erteilte unterschiedliche Sprachsteuerbefehle von verschiedenen Personen zu erfassen und zu verarbeiten.
-
Die Erfindung ergibt sich aus den Merkmalen der unabhängigen Ansprüche. Vorteilhafte Weiterbildungen und Ausgestaltungen sind Gegenstand der abhängigen Ansprüche.
-
Ein erster Aspekt der Erfindung betrifft eine Vorrichtung zur Ermittlung akustischer Sprachsignale SSn, die von einer Anzahl N relativ zueinander angeordneter akustischer Signalquellen SQn ausgehen, mit n = 1, 2, ..., N, und N >1. Vorteilhaft ist die relative Anordnung der Signalquellen SQn während der Ausgabe der Sprachsignale SSn konstant.
-
Die vorgeschlagene Vorrichtung umfasst eine Anzahl M relativ zueinander und relativ zu den Signalquellen SQn angeordnete akustische Sensoren MIQm zur Erfassung von akustischen Signalen SIGn, mit m = 1, 2, ..., M und M ≥ N. Vorteilhaft ist die relative Anordnung der akustischen Sensoren MIQm zeitlich konstant. Die Sensoren MIQm sind vorteilhaft elektroakustische Wandler, insbesondere Mikrofone, die die empfangenen akustische Signale SIGm in elektrische Signale SIGm umwandeln, umso eine elektronische Analyse und Verarbeitung der Signale SIGm zu ermöglichen. Die von den Sensoren MIQn erfassten akustischen Signale SIGm umfassen vorliegend vorteilhaft Sprachsignale SSn und beispielsweise Umgebungsgeräusche oder andere akustische Signale.
-
Die vorgeschlagene Vorrichtung umfasst weiterhin eine Anzahl M von Analyseeinheiten AEm, wobei jede der Analyseeinheiten AEm mit einem zugeordneten Sensor MIQm verbunden und dazu ausgeführt und eingerichtet ist, aus den von dem zugeordneten Sensor MIQm erfassten akustischen Signalen SIGm diejenigen Sprachsignale SSn,m mit dem höchsten Empfangspegel als Sprachsignale SSHn,m zu ermitteln und an einer Ausgangsschnittstelle bereitzustellen. Die Analyseeinheiten AEm umfassen daher vorteilhaft entsprechende Algorithmen, beispielsweise Filteralgorithmen, die erforderlich sind aus dem empfangenen akustischen Gesamtsignal SIGm einzelne Sprachsignale SSn herauszufiltern und dann dasjenige Sprachsignal SSHn,m zu ermitteln, welches den höchsten Empfangspegel im jeweiligen Empfangskanal m (Sensor MIQm und Analyseeinheit AEm) aufweist. Die ermittelten Sprachsignale SSHn,m werden vorteilhaft an der Ausgangsschnittstelle als digitale elektrische Signale bereitgestellt, die die Sprachsignale SSHn,m kodieren. Durch eine entsprechende Kodierung kann einem erkannten Sprachsignal SSHn,m beispielsweise ein bestimmter Befehl (Ändern des von einem Radio eines Fahrzeugs empfangenen Senders S1 auf einen Sender S2, ändern eines Kartenmaßstabs eines auf einem Navigationsdisplay dargestellten Kartenausschnitts, etc.) zugeordnet sein.
-
Vorteilhaft umfassen die Analyseeinheiten AEm jeweils einen Prozessor sowie ein auf dem Prozessor laufendes Analyseprogramm zu Ermittlung der Sprachsignale SSHn,m. Die Indizes n beziehen sich auf die von akustischen Signalquellen SQn ausgegebenen akustischen Sprachsignale SSn Die Indizes m beziehen sich auf die Sensoren MIQm bzw. die damit verbundenen Analyseeinheiten AEm.
-
Wesentliches Merkmal der Erfindung ist es, dass für die Anzahl N der Signalquellen SQn und die Anzahl M der verfügbaren Sensoren MIQm gilt: M ≥ N. Dies ermöglicht insbesondere die Erfassung, Auftrennung und anschließende getrennte Verarbeitung von von der Vorrichtung gleichzeitig erfassten akustischen Sprachsignale SSn, die von verschiedenen Signalquellen SQn ausgegeben wurden.
-
Eine vorteilhafte Weiterbildung der vorgeschlagenen Vorrichtung zeichnet sich dadurch aus, dass jede der Analyseeinheiten AEm die von ihr ermittelten Sprachsignale SSHn,m und/oder deren Charakteristika CAR(SSHn,m) an die jeweils anderen Analyseeinheiten AEk übermittelt, mit k≠ m und k ∈ {1, 2, ..., M}, wobei alle Analyseeinheiten AEk dazu ausgeführt und eingerichtet sind, bei der Ermittlung der Sprachsignale SSHn,k aus den jeweils erfassten akustischen Signalen SIGk zumindest ein Sprachsignal SSHn,m und/oder dessen Charakteristika CAR(SSHn,m) zu berücksichtigen. Unter dem Begriff „Charakteristika“ werden vorliegend ein oder mehrere Parameter verstanden, die ein Sprachsignal SSHn,m charakterisieren, beispielsweise ein Frequenz-Zeitverlauf und/oder ein Amplituden-Zeitverlauf des Sprachsignals SSHn,m und/oder eine von diesen Zeitverläufen abhängige Größe etc.
-
In dieser Weiterbildung werden demzufolge von einer Analyseeinheit AEk die von anderen Analyseeinheiten AEm ermittelten Sprachsignale SSHn,m und/oder deren Charakteristika CAR(SSHn,m) bei der Auswertung bzw. Analyse der vom zugeordneten Sensor MIQm erfassten Signale SIGm berücksichtigt. Damit findet neben der Anwendung eines Filters in der jeweiligen Analyseeinheit AEm, der diejenigen Sprachsignale SSn,m mit dem höchsten Empfangspegel als Sprachsignale SSHn,m herausfiltert bzw. ermittelt zudem noch eine gezielte Ausblendung von Signalanteilen statt, die von den anderen Analyseeinheiten AEk als Sprachsignale SSHn,k bzw. deren Charakteristika CAR(SSHn,k) ermittelt wurden.
-
Eine vorteilhafte Weiterbildung der vorgeschlagenen Vorrichtung zeichnet sich dadurch aus, dass jede der Analyseeinheiten AEm zur Ermittlung der Sprachsignale SSHn,m auf eine Datenbank zugreift, die eine Anzahl E von erlaubten Sprachsignalen SSEe, bereitstellt, wobei für die von den Analyseeinheiten AEm ermittelten Sprachsignale gilt: SSHn,m ∈ {SSEe}, mit e = 1, 2, ..., E und E ≥ 1. Vorteilhaft greifen alle Analyseeinheiten AEm auf ein und dieselbe Datenbank zu.
-
Eine vorteilhafte Weiterbildung der vorgeschlagenen Vorrichtung zeichnet sich dadurch aus, dass die Analyseeinheiten AEm als eine Einheit mit zumindest einem Prozessor realisiert sind. Die vorstehend genannten Verarbeitungsprozesse werden auf dem Prozessor dabei durch eine entsprechende Software realisiert.
-
Ein weiterer Aspekt der Erfindung betrifft ein Fahrzeug mit einer Vorrichtung, wie sie vorstehend beschrieben ist. Vorteilhaft ist das Fahrzeug ein Kraftfahrzeug, insbesondere ein Elektrofahrzeug. Das Fahrzeug ist vorteilhaft insbesondere zum autonomen Fahren ausgeführt.
-
Eine vorteilhafte Weiterbildung des vorgeschlagenen Fahrzeugs zeichnet sich dadurch aus, dass die Signalquellen SQn N Insassen des Fahrzeugs sind, jeder der Sensoren MIQm einem potentiellen Sitzplatz im Fahrzeug zugeordnet ist, und die an der Ausgangsschnittstelle ausgegebenen Sprachsignale SSHn,m zur Steuerung zumindest eines Fahrzeugsystems dienen.
-
Ein weiterer Aspekt der Erfindung betrifft ein Verfahren zur Ermittlung akustischer Sprachsignale SSn, die von einer Anzahl N relativ zueinander angeordneter akustischer Signalquellen SQn ausgehen, mit n = 1, 2, ..., N, und N >1. Das vorgeschlagene Verfahren umfasst folgende Schritte. In einem Schritt erfolgt mittels einer Anzahl M relativ zueinander und relativ zu den Signalquellen SQn angeordneter akustischer Sensoren MIQm ein Erfassen von akustischen Signalen SIGm, mit m = 1, 2, ..., M und M ≥ N. In einem weiteren Schritt erfolgt mittels einer Anzahl M Analyseeinheiten AEm, wobei jede der Analyseeinheiten AEm mit einem zugeordneten Sensor MIQm verbunden ist, aus den von dem zugeordneten Sensor MIQm erfassten akustischen Signalen SIGm ein Ermitteln derjenigen Sprachsignale SSn,m mit dem höchsten Empfangspegel als Sprachsignale SSHn,m. In einem weiteren Schritt erfolgt ein Ausgeben der Sprachsignale SSHn,m an einer Ausgangsschnittstelle.
-
Vorteilhafte Weiterbildungen und dadurch erzielbare Vorteile ergeben sich durch eianaloge und sinngemäße Übertragung der vorstehend zur vorgeschlagenen Vorrichtung gemachten Ausführungen.
-
Es zeigen:
- 1: eine schematisierte Darstellung einer erfindungsgemäßen Vorrichtung, und
- 2: eine schematisierte Darstellung eines erfindungsgemäßen Verfahrens.
-
1 zeigt eine schematisierte Darstellung einer erfindungsgemäßen Vorrichtung zur Ermittlung akustischer Sprachsignale SSn, die von einer Anzahl N = 4 relativ zueinander angeordneter akustischer Signalquellen (Personen) SQn 101 ausgehen, mit n = 1, 2, 3, 4. Die Vorrichtung umfasst eine Anzahl M = 4 relativ zueinander und relativ zu den Signalquellen (Personen) SQn 101 angeordnete Mikrophone MIQm 102 zur Erfassung von akustischen Signalen SIGm, mit m = 1, 2, 3, 4. Die von den Mikrophonen erfassten akustischen Signale SIGm umfassen vorliegend den Personen jeweils ausgesandte Sprachsignale SSn und ggf. weitere akustische Signale und/oder Störgeräusche.
-
Für den Sonderfall, dass verschiedene Sprachsignale SSn von verschiedenen der vier Personen SQn gleichzeitig oder nahezu gleichzeitig ausgesandt werden, bzw. von den vier Mikrofonen MIQn gleichzeitig oder nahezu gleichzeitig empfangen werden, werden die Sprachsignale SSn aufgrund der unterschiedlichen Entfernung zwischen jeweiliger Signalquelle SQn (Person) und den jeweiligen Mikrofonen MIQn, von den Mikrophonen MIQn typischerweise mit jeweils mit unterschiedlicher Empfangspegeln empfangen. Der höchste Empfangspegel eines Sprachsignals SSn wird typischerweise von demjenigen Mikrofon MIQn aufgenommen, das der aussendenden Signalquelle (Person) SQn nächstliegend angeordnet ist.
-
Weiterhin umfasst die Vorrichtung eine Anzahl M = 4 von Analyseeinheiten AEm 103, wobei jede der Analyseeinheiten AEm mit einem zugeordneten Mikrophon MIQm 102 verbunden und dazu ausgeführt und eingerichtet ist, aus den von dem zugeordneten Mikrophon MIQm 102 erfassten akustischen Signalen SIGm diejenigen Sprachsignale SSn,m mit dem höchsten Empfangspegel als Sprachsignale SSHn,m zu ermitteln und an einer Ausgangsschnittstelle 104 bereitzustellen. Dabei werden die ermittelten Sprachsignale SSHn,m in kodierter digitaler Form an der Ausgangsschnittstelle 104 bereitgestellt.
-
Werden beispielsweise von dem vierten Mikrofon MIQ4 von den vier Personen SQn=1,2,3,4 ausgehende unterschiedliche Sprachsignale SSn=1,2,3,4 gleichzeitig als SIG4 empfangen, so weist vorliegend das darin enthaltene Sprachsignal SSn=4 den höchsten Empfangspegel auf und wird somit als Sprachsignal SSHn=4,m=4 = SSn=4 ermittelt, wobei SIG4 das empfangene akustische Summensignal ist.
-
Zur Ermittlung der Sprachsignale SSHn,m greift in diesem Ausführungsbeispiel jede der Analyseeinheiten AEm 103 auf eine Datenbank 105 zu, die vorliegend eine Anzahl E = 50 von erlaubten Sprachsignalen SSEe, bereitstellt, wobei für die von den Analyseeinheiten AEm 103 ermittelten Sprachsignale gilt: SSHn,m ∈ {SSEe}, mit e = 1, 2, ..., 50. Damit wird sichergestellt, dass an der Ausgangsschnittstelle 104 nur erlaubte Sprachsignale bzw. deren kodierte digitale Form bereitgestellt werden.
-
Weiterhin werden von jeder der Analyseeinheiten AEm 103 die von ihr ermittelten Charakteristika CAR(SSHn,m) der Sprachsignale SSHn,m an die jeweils anderen Analyseeinheiten AEk 103 übermittelt, mit k ≠ m und k ∈ {1, 2, 3, 4}, wobei alle Analyseeinheiten AEk 103 dazu ausgeführt und eingerichtet sind, bei der Ermittlung der Sprachsignale SSHn,k aus den jeweils erfassten akustischen Signalen SIGk zumindest ein Sprachsignal SSHn,m und/oder dessen Charakteristika CAR(SSHn,m) zu berücksichtigen. So berücksichtigt beispielsweise die Analyseeinheit AE1 zur Ermittlung des Sprachsignals SSHn,1 die Charakteristika CAR(SSHn,m=2,3,4) der ermittelten Sprachsignale SSHn,m=2,3,4, die von den anderen Analyseeinheit AEm=2,3,4 ermittelt wurden. Damit jede der Analyseeinheiten AEm in der Lage ist gleichzeitig bzw. nahezu gleichzeitig bei den anderen Analyseeinheiten AEm eingehende akustische Signale SIGm und die daraus ermittelten Sprachsignals SSHn,m, bzw. die Charakteristika CAR(SSHn,m) übermittelt zu bekommen und zur weiteren Analyse zu verwenden, wird vorteilhaft von allen Analyseeinheiten AEm zunächst das Sprachsignal SSHn,m, bzw. die Charakteristika CAR(SSHn,m) basierend auf den Eingangspegeln ermittelt und an die anderen Analyseeinheiten AEk übermittelt. Basierend auf den übermittelten Sprachsignal SSHn,m, bzw. die Charakteristika CAR(SSHn,m) erfolgt ein weiteres Ausblenden von anderen Sprachsignalen SSn und/oder Hintergrundgeräuschen. Letzteres dient somit dazu Signalanteile zu unterdrücken oder herauszufiltern, die Sprachsignale SSn betreffen, deren Empfangspegel geringer ist, als dasjenige vom Mikrophon MIQm empfangene Sprachsignal mit dem relativ höchsten Empfangspegel.
-
Vorteilhaft wird die vorgeschlagene Vorrichtung für Spracheingaben zur Sprachsteuerung von Fahrzeugsystemen genutzt. Mit der vorgeschlagenen Vorrichtung ist es möglich, auf gleichzeitig ausgegebene sprachliche, sich inhaltlich unterscheidende Anweisungen/Befehle mehrere Personen gleichzeitig zu reagieren. Hierzu wird beispielsweise für jeden potentiellen Sitzplatz in einem Fahrzeug (beispielsweise eines PKWs) ein Mikrofon in Sitzplatznähe installiert. Mit der vorgeschlagenen Vorrichtung ist es beispielsweise möglich, dass ein Beifahrer durch eine Spracheingabe das Radio des Fahrzeugs veranlasst den Musiksender zu wechseln, während der Fahrer gleichzeitig durch Spracheingabe eine Navigationskartenansicht des Navigationssystems einstellt. Das vorgeschlagene System ermöglicht mithin gleichzeitig abgesetzte bzw. von den Mikrofonen gleichzeitig bzw. nahezu gleichzeitig empfangene Sprachanweisungen zu erkennen und entsprechend zu verarbeiten.
-
2 zeigt eine schematisierte Darstellung eines erfindungsgemäßen Verfahrens zur Ermittlung akustischer Sprachsignale SSn, die von einer Anzahl N relativ zueinander angeordneter akustischer Signalquellen SQn 101 ausgehen, mit n = 1, 2, ..., N, und N >1, umfassend folgende Schritte. In einem Schritt erfolgt mittels einer Anzahl M relativ zueinander und relativ zu den Signalquellen SQn 101 angeordneter akustischer Sensoren MIQm 102 ein Erfassen 201 von akustischen Signalen SIGm, mit m = 1, 2, ..., M und M ≥ N. In einem weiteren Schritt erfolgt mittels einer Anzahl M von Analyseeinheiten AEm, 103 wobei jede der Analyseeinheiten AEm 103 mit einem zugeordneten Sensor MIQm 102 verbunden ist, aus den von dem zugeordneten Sensor MIQm 102 erfassten akustischen Signalen SIGm ein Ermitteln 202 derjenigen Sprachsignale SSn,m mit dem höchsten Empfangspegel als Sprachsignale SSHn,m. In einem weiteren Schritt erfolgt ein Ausgeben 203 der Sprachsignale SSHn,m an einer Ausgangsschnittstelle 104.
-
Obwohl die Erfindung im Detail durch bevorzugte Ausführungsbeispiele näher illustriert und erläutert wurde, so ist die Erfindung nicht durch die offenbarten Beispiele eingeschränkt und andere Variationen können vom Fachmann hieraus abgeleitet werden, ohne den Schutzumfang der Erfindung zu verlassen. Es ist daher klar, dass eine Vielzahl von Variationsmöglichkeiten existiert. Es ist ebenfalls klar, dass beispielhaft genannte Ausführungsformen wirklich nur Beispiele darstellen, die nicht in irgendeiner Weise als Begrenzung etwa des Schutzbereichs, der Anwendungsmöglichkeiten oder der Konfiguration der Erfindung aufzufassen sind. Vielmehr versetzen die vorhergehende Beschreibung und die Figurenbeschreibung den Fachmann in die Lage, die beispielhaften Ausführungsformen konkret umzusetzen, wobei der Fachmann in Kenntnis des offenbarten Erfindungsgedankens vielfältige Änderungen, beispielsweise hinsichtlich der Funktion oder der Anordnung einzelner, in einer beispielhaften Ausführungsform genannter Elemente, vornehmen kann, ohne den Schutzbereich zu verlassen, der durch die Ansprüche und deren rechtliche Entsprechungen, wie etwa weitergehenden Erläuterungen in der Beschreibung, definiert wird.
-
Bezugszeichenliste
-
- 101
- Signalquellen
- 102
- akustische Sensoren
- 103
- Analyseeinheiten
- 104
- Ausgangsschnittstelle
- 105
- Datenbank
- 201-203
- Verfahrensschritte