DE102016003401A1 - Erfassungsvorrichtung und Verfahren zum Erfassen einer Sprachäußerung einer sprechenden Person in einem Kraftfahrzeug - Google Patents

Erfassungsvorrichtung und Verfahren zum Erfassen einer Sprachäußerung einer sprechenden Person in einem Kraftfahrzeug Download PDF

Info

Publication number
DE102016003401A1
DE102016003401A1 DE102016003401.7A DE102016003401A DE102016003401A1 DE 102016003401 A1 DE102016003401 A1 DE 102016003401A1 DE 102016003401 A DE102016003401 A DE 102016003401A DE 102016003401 A1 DE102016003401 A1 DE 102016003401A1
Authority
DE
Germany
Prior art keywords
signal
motor vehicle
person
speech
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102016003401.7A
Other languages
English (en)
Other versions
DE102016003401B4 (de
Inventor
Felix Schröder
Volker Kaese
Til Fabio Schäfer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Audi AG
Original Assignee
Audi AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Audi AG filed Critical Audi AG
Priority to DE102016003401.7A priority Critical patent/DE102016003401B4/de
Publication of DE102016003401A1 publication Critical patent/DE102016003401A1/de
Application granted granted Critical
Publication of DE102016003401B4 publication Critical patent/DE102016003401B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • G06V20/597Recognising the driver's state or behaviour, e.g. attention or drowsiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Abstract

Die Erfindung betrifft eine Erfassungsvorrichtung (7) und ein Verfahren zum Erfassen einer Sprachäußerung (4) einer sprechenden Person (2) in einem Kraftfahrzeug (1). Die Erfassung der Sprachäußerung (4) soll auch bei lauten Umgebungsgeräuschen (6) störungsarm erfolgen. Die Erfindung sieht vor, dass in der Erfassungsvorrichtung (7) durch ein Sensorelement (10) ein Abstandssignal (17) erzeugt wird, welches von einem Abstand (D) zwischen dem Sensorelement (10) und einer Körperoberfläche (14) der Person (2) abhängig ist, und durch eine Steuereinrichtung (11) auf der Grundlage eines zeitlichen Verlaufs (17') des Abstandssignals (17) ein die Sprachäußerung (4) repräsentierendes Audiosignal (18) erzeugt wird.

Description

  • Die Erfindung betrifft ein Verfahren zum Erfassen einer Sprachäußerung einer sprechenden Person in einem Kraftfahrzeug. Die Sprachäußerung soll insbesondere bei ungünstigen akustischen Verhältnissen, beispielsweise lauten Fahrgeräuschen, möglich sein. Zu der Erfindung gehören auch eine Erfassungsvorrichtung zum Durchführen des Verfahrens sowie ein Kraftfahrzeug mit der erfindungsgemäßen Erfassungsvorrichtung.
  • Durch hohe Nebengeräusche kann die Kommunikation zwischen Personen in einem Kraftfahrzeug und auch bei einem Telefonat auch zwischen einer Person im Kraftfahrzeug und dem fahrzeugexternen Gesprächspartner sehr schwierig sein. Bei der Kommunikation zwischen Personen im Kraftfahrzeug ist insbesondere ein Gespräch zwischen Passagieren im Fond und Passagieren auf den Vordersitzen aufgrund der Sitzposition und Kopfhaltung schwierig. Vor allem bei einer Fahrt bei hoher Geschwindigkeit und/oder bei einer Fahrt mit einem offenen Cabriodach können die Nebengeräusche sehr laut sein. Die vorhandene Elektronik, wie beispielsweise eine Freisprecheinrichtung und Lautsprecher der Audio-Anlage (Radio, Medienwiedergabegerät) kann zur Unterstützung eines Gesprächs innerhalb des Kraftfahrzeugs genutzt werden.
  • Hierzu ist beispielsweise aus der DE 199 38 171 A1 bekannt, für eine gute Kommunikation zwischen allen Insassen die Freisprechanlage des Kraftfahrzeugs zu nutzen, sodass mittels Mikrofonen der Freisprechanlage personennah eine jeweilige Sprachäußerung erfasst und diese dann über einen Lautsprecher für die übrigen Personen ausgegeben werden kann.
  • Aus der WO 2008/061205 A2 ist hierzu bekannt, dies insbesondere für eine Kommunikation zwischen Personen auf dem Vordersitz einerseits und Personen auf dem Rücksitz andererseits zu nutzen. Zudem wird das System auch zur Sprachsteuerung von Geräten genutzt, wozu eine Spracherkennungseinrichtung in dem Kraftfahrzeug bereitgestellt sein kann.
  • Das Erfassen einer Sprachäußerung mittels Mikrofonen weist allerdings den Nachteil auf, dass bei hohen Nebengeräuschen ein Mikrofon auch in Sprachpausen ein Mikrofonsignal mit einem Pegel erzeugt, der ähnlich dem Pegel bei erfasster Sprachäußerung ist. Aus der DE 10 2010 009 888 A1 ist hierzu eine Erkennung bekannt, die überprüft, ob der aufgefangene Schall eine Sprachäußerung enthält oder lediglich die Nebengeräusche darstellt.
  • Die aus dem Stand der Technik bekannten Lösungen verlassen sich vollständig auf die Erfassung der Sprachäußerung mittels eines akustischen Mikrofons. Dies birgt prinzipiell den Nachteil, dass auch die im Kraftfahrzeug vorhandenen Nebengeräusche oder Umgebungsgeräusche stets miterfasst werden.
  • Der Erfindung liegt die Aufgabe zugrunde, in einem Kraftfahrzeug eine Sprachäußerung einer sprechenden Person zu erfassen, um insbesondere eine Kommunikation zwischen Personen im Kraftfahrzeug zu unterstützen.
  • Die Aufgabe wird durch die Gegenstände der unabhängigen Patentansprüche gelöst. Vorteilhafte Weiterbildungen der Erfindung sind durch die Merkmale der abhängigen Patentansprüche, die folgende Beschreibung sowie die Figur offenbart.
  • Durch die Erfindung ist ein Verfahren zum Erfassen einer Sprachäußerung einer sprechenden Person in einem Kraftfahrzeug bereitgestellt. Das Verfahren wird durch eine Erfassungsvorrichtung durchgeführt, die ebenfalls Bestandteil der Erfindung ist.
  • Durch zumindest ein Sensorelement der Erfassungsvorrichtung wird jeweils ein Abstandssignal erzeugt, welches von einem Abstand zwischen dem Sensorelement und einer Körperoberfläche der Person abhängig ist. Die Abstandsmessung ist dabei insbesondere derart genau, dass eine Abstandsänderung kleiner als 1 Millimeter durch das Abstandssignal repräsentiert oder wiedergegeben wird. Des Weiteren erfolgt die Abstandsmessung insbesondere mit einer Abtastrate oder Messrate, die größer als 1 Kilohertz, insbesondere größer als 2 Kilohertz ist. Mit anderen Worten werden also Vibrationen an der Körperoberfläche durch das Abstandssignal repräsentiert oder abgebildet. Es kann aber auch vorgesehen sein, dass das Abstandssignal beispielsweise eine Lippenbewegung der Person repräsentiert.
  • Durch eine Steuereinrichtung der Erfassungsvorrichtung wird auf der Grundlage eines zeitlichen Verlaufs des Abstandssignals ein Audiosignal erzeugt, welches die Sprachäußerung repräsentiert. Das Audiosignal kann beispielsweise ein elektrisches, analoges Signal oder ein digitales Signal sein. Mit Audiosignal ist insbesondere ein Signal gemeint, das Frequenzanteile oder spektrale Anteile in einem Frequenzbereich von 0 Hertz bis 20 Kilohertz, insbesondere von 0 Hertz bis 15 Kilohertz umfasst.
  • Durch die Erfindung ergibt sich der Vorteil, dass das Audiosignal nicht akustisch erfasst oder erzeugt wird, sondern durch eine Abstandsmessung und damit unabhängig von einem Geräuschpegel eines Umgebungsgeräuschs in dem Kraftfahrzeug, z. B. unabhängig von einem Fahrgeräusch und/oder Windgeräusch und/oder Motorgeräusch. Die Sprachäußerung lässt sich aus dem Abstandssignal rekonstruieren oder ermitteln, auf welches das Umgebungsgeräusch in dem Kraftfahrzeug keinen Einfluss hat.
  • Zu der Erfindung gehört auch die Erfassungsvorrichtung zum Erzeugen des Audiosignals. Die Erfassungsvorrichtung umfasst in der beschriebenen Weise das zumindest eine Sensorelement zum Erzeugen des Abstandssignals in Abhängigkeit von dem Abstand zwischen dem Sensorelement und der Körperoberfläche der Person sowie die Steuereinrichtung zum Erzeugen des die Sprachäußerung repräsentierenden oder enthaltenden Audiosignals auf der Grundlage eines zeitlichen Verlaufs des Abstandssignals. Die Erfassungsvorrichtung ist dazu eingerichtet, eine Ausführungsform des erfindungsgemäßen Verfahrens durchzuführen.
  • Zu der Erfindung gehören auch optionale Weiterbildungen, durch deren Merkmale sich zusätzliche Vorteile ergeben.
  • Um das Abstandssignal zu erzeugen, das heißt den Abstand zu messen, kann als Sensorelement beispielsweise eine Time-of-Flight-Kamera (TOF-Kamera) genutzt werden, die in bekannter Weise zum Erfassen eines jeweiligen Abstands zwischen einzelnen Pixelsensoren des TOF-Sensors einerseits und Objekten in der Umgebung der Kamera andererseits ausgelegt ist. Um allerdings mit hoher Abtastrate auch kleine Abstandsänderungen zu erfassen, sieht eine Weiterbildung vor, dass das Abstandssignal durch ein Laservibrometer als das Sensorelement erzeugt wird. Hierdurch ergibt sich der Vorteil, dass Vibrationen beispielsweise auf einer Haut der Person durch das Abstandssignal beschrieben oder wiedergegeben werden können. Solche Vibrationen entstehen beim Sprechen, wenn der Stimmapparat der Person die Haut durch Körperschall in Schwingung oder Vibration versetzt.
  • Eine Weiterbildung sieht vor, dass das Sensorelement den Abstand zu einer Gesichtshaut der Person erfasst. Diese wird aufgrund von Resonanzeffekten im Mund- und Rachenraum der Person besonders deutlich zu Schwingungen angeregt, wenn die Person spricht. Besonders bevorzugt ist es, mittels des Sensorelements den Abstand zu einer Nase der Person zu erfassen. Die Nase einer Person ist ein besonders schwingungsfähiges Organ, an welchem sich ein besonders ausgeprägtes Abstandssignal erfassen lässt.
  • Um eine jeweilige Sprachäußerung von mehreren Personen erfassen zu können, sieht eine Weiterbildung vor, dass durch die Erfassungsvorrichtung zumindest zwei auswählbare Sensorelemente für unterschiedliche Sitzplätze in dem Kraftfahrzeug bereitgestellt werden. Nun werden aber nicht beide Sensorelemente zugleich genutzt, sondern zum Erzeugen des Abstandssignals wird aus den auswählbaren Sensorelementen eines in Abhängigkeit von einem Aktivitätssignal ausgewählt. Dieses Aktivitätssignal kann beispielsweise durch eine Taste erzeugt werden, welche eine Person betätigen kann, um einen Sprechwunsch zu signalisieren.
  • Eine Weiterbildung sieht jedoch vor, dass das Auswählen des Sensorelements automatisiert erfolgt. Bei dieser Weiterbildung umfasst das besagte Aktivitätssignal ein Sitzbelegungssignal einer Belegungserkennungseinrichtung der Sitzplätze. Hierdurch werden prinzipiell nur solche Sensorelemente ausgewählt, die auch zu tatsächlich belegten Sitzplätzen gehören. Um bei mehreren belegten Sitzplätzen die gerade sprechende Person zu detektieren, sieht eine Weiterbildung vor, dass zusätzlich oder alternativ zur Sitzplatzbelegung ein Gestiksignal und/oder ein Mimiksignal einer Erkennungseinrichtung als Aktivitätssignal vorgesehen ist. Die Erkennungseinrichtung überwacht bevorzugt auf der Grundlage von Kamerabildern einer Kamera die Sitzplätze auf sprechende Personen hin. Es werden also mittels einer Bildverarbeitungseinrichtung beispielsweise Gesichtszüge und/oder Bewegungen der jeweils auf dem Sitzplatz befindlichen Person auf ein Sprechkriterium hin überprüft. Ist das Sprechkriterium erfüllt, also beispielsweise eine Lippenbewegung erkannt, so wird das Sensorelement, welches auf diese Person gerichtet ist, ausgewählt, um das Audiosignal zu erzeugen.
  • Das besagte Audiosignal kann beispielsweise über eine Telefonverbindung an den besagten fahrzeugexternen Gesprächspartner eines Telefonats ausgesendet werden. Eine Weiterbildung betrifft allerdings die Nutzung der Erfassungsvorrichtung zum Unterstützen einer Kommunikation innerhalb des Kraftfahrzeugs. Bei dieser Weiterbildung wird das erzeugte Audiosignal über zumindest einen Lautsprecher in dem Kraftfahrzeug wiedergegeben. So kann eine andere Person, die dem Lautsprecher näher sitzt als der sprechenden Person, die sprechende Person z. B. besser verstehen.
  • Allerdings bleibt bei der Ausgabe über Lautsprecher das Problem, dass das Verständnis der Sprachäußerung weiterhin durch Nebengeräusche beeinträchtigt sein kann, die ja auch dem Lautsprecherschall überlagert sind. Eine Weiterbildung sieht deshalb vor, dass durch eine Spracherkennungseinrichtung der Erfassungsvorrichtung auf der Grundlage des Audiosignals eine Spracherkennung zum Umwandeln der Sprachäußerung in eine Textform durchgeführt und die Sprachäußerung in Textform auf einer Anzeigeeinrichtung in dem Kraftfahrzeug angezeigt wird. Hierdurch wird die Sprachäußerung also optisch oder lesbar dargestellt. Damit kann eine Person sie visuell erfassen, was unabhängig von einem Geräuschpegel in dem Kraftfahrzeug möglich ist. Als Spracherkennungseinrichtung kann eine an sich aus dem Stand der Technik bekannte Variante verwendet werden, die beispielsweise auf der Grundlage von Hidden-Markov-Modellen (HMMs) bereitgestellt sein kann.
  • Eine Weiterbildung ermöglicht es, dennoch auch ein Mikrofon zu nutzen. Bei dieser Weiterbildung wird mittels des Audiosignals eine Gatingeinrichtung für zumindest ein Mikrofon gesteuert. Eine Gatingeinrichtung blockiert ein Mikrofonsignal des zumindest einen Mikrofons, falls das Audiosignal eine Sprachpause signalisiert, und leitet das Mikrofonsignal dagegen durch, falls das Audiosignal eine Sprachaktivität signalisiert. Hierdurch ergibt sich der Vorteil, dass die Sprachäußerung auch mittels zumindest eines Mikrofons erfasst werden kann, wodurch die erfassten Sprachfrequenzen, wie sie tatsächlich im Sprachschall enthalten sind, unverfälscht empfangen werden können. Um hierbei möglichst wenig von dem Umgebungsgeräusch mitzuerfassen, wird mittels der Gating-Einrichtung das Mikrofonsignal blockiert, das heißt verworfen oder nicht genutzt, falls gar keine Sprachaktivität vorliegt, das heißt eine Sprachpause erkannt wird. Das Erkennen einer Sprachpause kann mit einer Methode für die Sprachpausenerkennung oder Sprachaktivitätserkennung (VAD – voice activity detection) durchgeführt werden, wie sie an sich im Stand der Technik verfügbar ist. Diese Methoden sind auch auf das Audiosignal anwendbar, obwohl dieses auf der Grundlage einer Abstandsmessung gebildet ist. Da das Audiosignal prinzipiell frei von dem Umgebungsgeräusch ist, kann zur Sprachpausendetektion als Detektionskriterium festgelegt sein, dass bei einem Pegel oder bei einer Energie des Audiosignals kleiner als ein vorbestimmter Schwellenwert eine Sprachpause signalisiert oder erkannt wird.
  • Zu der Erfindung gehört auch ein Kraftfahrzeug, welches eine Ausführungsform der erfindungsgemäßen Erfassungsvorrichtung aufweist. Insbesondere ist für zumindest zwei Sitzplätze des Kraftfahrzeugs jeweils ein auswählbares Sensorelement bereitgestellt. Das erfindungsgemäße Kraftfahrzeug ist bevorzugt als Kraftwagen, insbesondere als Personenkraftwagen, ausgestaltet.
  • Im Folgenden ist ein Ausführungsbeispiel der Erfindung beschrieben. Hierzu zeigt die einzige Figur (Fig.) eine schematische Darstellung einer Ausführungsform des erfindungsgemäßen Kraftfahrzeugs.
  • Bei dem im Folgenden erläuterten Ausführungsbeispiel handelt es sich um eine bevorzugte Ausführungsform der Erfindung. Bei dem Ausführungsbeispiel stellen die beschriebenen Komponenten der Ausführungsform jeweils einzelne, unabhängig voneinander zu betrachtende Merkmale der Erfindung dar, welche die Erfindung jeweils auch unabhängig voneinander weiterbilden und damit auch einzeln oder in einer anderen als der gezeigten Kombination als Bestandteil der Erfindung anzusehen sind. Des Weiteren ist die beschriebene Ausführungsform auch durch weitere der bereits beschriebenen Merkmale der Erfindung ergänzbar.
  • Die Figur zeigt ein Kraftfahrzeug 1, bei dem es sich beispielsweise um einen Kraftwagen, insbesondere einen Personenkraftwagen handeln kann. In dem Kraftfahrzeug 1 können sich beispielsweise zwei Personen 2, 3 befinden. Beispielsweise kann die Person 3 ein Fahrer des Kraftfahrzeugs 1 sein und die Person 2 auf einem Rücksitz des Kraftfahrzeugs 1 sitzen, also im Fond. Für die folgende Erläuterung sei angenommen, dass die Person 2 der Person 3 etwas mitteilen möchte. Hierzu spricht die Person 2, um eine Sprachäußerung 4 zu machen. Ein Sprachschall 5 der Person 2, der beim Sprechen von dieser erzeugt wird, wird durch ein Umgebungsgeräusch 6 überlagert, das beispielsweise ein Motorengeräusch und/oder Windgeräusch sein kann. Der Fahrer 3 hört somit nur eine Überlagerung des Sprachschalls 5 mit dem Umgebungsgeräusch 6. Ist das Umgebungsgeräusch 6 lauter als der Sprachschall 5, so kann die Person 3 die Person 2 allein durch Hören nur schlecht verstehen.
  • Bei dem Kraftfahrzeug 1 wird allerdings die Kommunikation der Personen 2, 3 durch eine Erfassungsvorrichtung 7 unterstützt, welche die Sprachäußerung 4 der Person 3 beispielsweise auf einer Anzeigeeinrichtung 8 als geschriebenen Text 9 anzeigen kann, sodass die Person 3 die Sprachäußerung 4 lesen und damit visuell unabhängig vom Umgebungsgeräusch 6 erfassen kann.
  • Die Erfassungsvorrichtung 7 kann ein Sensorelement 10, eine Steuereinrichtung 11 und optional eine Spracherkennungseinrichtung 12 umfassen. Bei der Sensoreinrichtung 10 handelt es sich insbesondere um ein Laservibrometer. Als Laservibrometer kann das Sensorelement 10 mittels eines Laserstrahls 13 einen Abstand D des Sensorelements 10 zu einer Hautoberfläche 14 der Person 2 erfassen. Das Sensorelement 10 kann hierzu beispielsweise in einem Dachhimmel des Kraftfahrzeugs 1 angeordnet sein. Bevorzugt wird der Abstand D zu einer Nase 15 der Person 2 erfasst. In der Haut der Nase 15 wird durch die Person 2 beim Sprechen der Sprachäußerung 4 eine Vibration 16 erzeugt. Grund dafür ist, dass der Sprechapparat (Mundraum, Rachenraum) der Person 2 auch einen Körperschall im Körper der Person 2 erzeugt, welcher die Vibration 16 der Nase 15 hervorruft. Ein mit dem Abstand D korreliertes Abstandssignal 17 des Sensorelements 10 weist somit über der Zeit t einen Verlauf 17' auf, welcher sich gemäß der Bewegung der Hautoberfläche 14 durch die Vibration 16 verändert.
  • Durch die Steuereinrichtung 11 kann aus dem zeitlichen Verlauf 17' des Abstandssignals 17 ein Audioanteil als Audiosignal 18 beispielsweise als Amplitudenverlauf A ermittelt werden. Beispielsweise kann durch eine Tiefpassfilterung des Abstandssignals 17 ein Grundwert oder Offset 19 entfernt werden, welcher dem sprachunabhängigen Grundabstand der Person 2 zum Sensorelement 10 entspricht. Die Steuereinrichtung 11 kann beispielsweise auf der Grundlage einer Prozessoreinrichtung, wie beispielsweise eines Mikrocontrollers oder eines Mikroprozessors, realisiert sein.
  • Auf Grundlage des Audiosignals 18 kann durch die Spracherkennungseinrichtung 12 (beispielsweise mittels Hidden-Markov-Modellen 20) die Sprachäußerung 4 in dem Audiosignal erkannt und in eine Textform 21 umgewandelt oder als Textform 21 ausgegeben werden. Es steht somit durch die Textform 21 eine Zeichenfolge oder Buchstabenfolge bereit, die beispielsweise auf der Anzeigeeinrichtung 8 angezeigt werden kann.
  • Bei dem Kraftfahrzeug 1 können mehrere Sensorelemente 10 bereitgestellt sein, beispielsweise für zwei oder mehr Fahrzeugsitze jeweils ein Sensorelement. Durch eine Detektionseinrichtung 22 kann jeweils ein Aktivitätssignal 23 für die gerade sprechende Person 2 erzeugt werden, sodass nur das jeweils zugeordnete Sensorelement 10 den zeitlichen Verlauf 17' des Abstandssignals 17 der Steuereinrichtung 11 bereitstellt. Die Detektionseinrichtung 22 kann beispielsweise eine Belegungserkennungseinrichtung für Sitzplätze des Kraftfahrzeugs und/oder eine Gestenerkennung und/oder Mimikerkennung mittels der bereits beschriebenen Erkennungseinrichtung durchführen.
  • Der Sprachschall 5 kann auch mittels eines Mikrofons 24, beispielsweise eines Elektretmikrofons, erfasst werden, wobei eine Gatingeinrichtung 25 vorgesehen sein kann, welche mittels des Audiosignals 18 dahingehend gesteuert werden kann, dass durch einen Lautsprecher 28 nur dann ein Mikrofonsignal 29 wieder als Lautsprecherschall ausgegeben wird, falls anhand des Audiosignals 18 erkannt wird, dass die Person 2 gerade spricht, also Sprachaktivität und damit keine Sprachpause vorliegt.
  • Über den Lautsprecher 28 kann optional auch direkt das Audiosignal 18 ausgegeben werden.
  • Ist also durch hohe Nebengeräusche die Kommunikation in dem Kraftfahrzeug 1, beispielsweise zwischen einerseits Fahrer oder Beifahrer und andererseits Fond-Passagieren gestört, so kann beispielsweise durch die Anzeigeeinrichtung 8 oder mittels eines Lautsprechers 28 beispielsweise einer Freisprecheinrichtung und Radioanlage die Kommunikation zwischen den Personen 2, 3 gefördert oder unterstützt werden.
  • Hierzu werden Gespräche durch die im Kraftfahrzeug bereitgestellte Erfassungsvorrichtung 7 selektiv gefiltert und anschließend beispielsweise über den Lautsprecher 28 wiedergegeben oder als Text in der Anzeigeeinrichtung 8 angezeigt. Als Mikrofon wird hier ein Laservibrometer verwendet, das durch ein weiteres Akustikmikrofon 24 unterstützt werden kann. Das Mikrofon 24 kann beispielsweise Bestandteil in dem Kraftfahrzeug 1 bereitgestellten Freisprecheinrichtung sein.
  • Somit ergibt sich ein Mehrwert für die vorhandene Freisprecheinrichtung und die Audioanlage mit Lautsprechern 28 und die Anzeigeeinrichtung 8 für die Im-Fahrzeug-Kommunikation bei dem Kraftfahrzeug 1.
  • Insgesamt zeigt das Beispiel, wie durch die Erfindung eine vereinfachte Kommunikation innerhalb eines Kraftfahrzeugs bei hohen Nebengeräuschen ermöglicht werden kann.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • DE 19938171 A1 [0003]
    • WO 2008/061205 A2 [0004]
    • DE 102010009888 A1 [0005]

Claims (10)

  1. Verfahren zum Erfassen einer Sprachäußerung (4) einer sprechenden Person (2) in einem Kraftfahrzeug (1), wobei in einer Erfassungsvorrichtung (7): – durch zumindest ein Sensorelement (10) jeweils ein Abstandssignal (17) erzeugt wird, welches von einem Abstand (D) zwischen dem Sensorelement (10) und einer Körperoberfläche (14) der Person (2) abhängig ist, und – durch eine Steuereinrichtung (11) auf der Grundlage eines zeitlichen Verlaufs (17') des Abstandssignals (17) ein die Sprachäußerung (4) repräsentierendes Audiosignal (18) erzeugt wird.
  2. Verfahren nach Anspruch 1, wobei das Abstandssignal (17) durch ein Laservibrometer als Sensorelement (10) erzeugt wird.
  3. Verfahren nach einem der vorhergehenden Ansprüche, wobei durch das Sensorelement (10) der Abstand zu einer Gesichtshaut der Person (2), insbesondere zu einer Nase (15) der Person (2), erfasst wird.
  4. Verfahren nach einem der vorhergehenden Ansprüche, wobei durch die Erfassungsvorrichtung (7) zumindest zwei auswählbare Sensorelemente (10) für unterschiedliche Sitzplätze in dem Kraftfahrzeug (1) bereitgestellt werden und zum Erzeugen des Abstandssignals (17) aus den auswählbaren Sensorelementen (10) eines in Abhängigkeit von einem Aktivitätssignal (23) ausgewählt wird.
  5. Verfahren nach Anspruch 4, wobei das Aktivitätssignal (23) ein Sitzbelegungssignal einer Belegungserkennungseinrichtung (22) der Sitzplätze und/oder ein Gestiksignal und/oder Mimiksignal einer Erkennungseinrichtung (22), welche auf der Grundlage von Kamerabildern einer Kamera die Sitzplätze auf sprechende Personen (2) hin überwacht, umfasst.
  6. Verfahren nach einem der vorhergehenden Ansprüche, wobei das erzeugte Audiosignal (18) über zumindest einen Lautsprecher (28) in dem Kraftfahrzeug (1) wiedergegeben wird.
  7. Verfahren nach einem der vorhergehenden Ansprüche, wobei durch eine Spracherkennungseinrichtung (12) der Erfassungsvorrichtung (7) auf der Grundlage des Audiosignals (18) eine Spracherkennung zum Umwandeln der Sprachäußerung (4) in eine Textform (21) durchgeführt wird und die Sprachäußerung (4) in Textform (21) auf einer Anzeigeeinrichtung (8) in dem Kraftfahrzeug (1) angezeigt wird.
  8. Verfahren nach einem der vorhergehenden Ansprüche, wobei mittels des Audiosignals (18) eine Gatingeinrichtung (25) für zumindest ein Mikrofon (24) gesteuert wird, wobei durch die Gatingeinrichtung (25) ein Mikrofonsignal (29) des zumindest einen Mikrofons (24) blockiert wird, falls das Audiosignal (18) eine Sprachpause signalisiert, und das Mikrofonsignal (29) durchgeleitet wird, falls das Audiosignal (18) eine Sprachaktivität signalisiert.
  9. Erfassungsvorrichtung (7) zum Erfassen einer Sprachäußerung (4) einer sprechenden Person (2) in einem Kraftfahrzeug (1), aufweisend: – zumindest ein Sensorelement (10) zum Erzeugen eines Abstandssignals (17) in Abhängigkeit von einem Abstand (D) zwischen dem Sensorelement (10) und einer Körperoberfläche (14) der Person (2) und – eine Steuereinrichtung (11) zum Erzeugen eines die Sprachäußerung (4) repräsentierenden Audiosignals (18) auf der Grundlage eines zeitlichen Verlaufs (17') des Abstandssignals (17), wobei die Erfassungsvorrichtung (7) dazu eingerichtet ist, ein Verfahren nach einem der vorhergehenden Ansprüche durchzuführen.
  10. Kraftfahrzeug mit einer Erfassungsvorrichtung nach Anspruch 9.
DE102016003401.7A 2016-03-19 2016-03-19 Erfassungsvorrichtung und Verfahren zum Erfassen einer Sprachäußerung einer sprechenden Person in einem Kraftfahrzeug Active DE102016003401B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102016003401.7A DE102016003401B4 (de) 2016-03-19 2016-03-19 Erfassungsvorrichtung und Verfahren zum Erfassen einer Sprachäußerung einer sprechenden Person in einem Kraftfahrzeug

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102016003401.7A DE102016003401B4 (de) 2016-03-19 2016-03-19 Erfassungsvorrichtung und Verfahren zum Erfassen einer Sprachäußerung einer sprechenden Person in einem Kraftfahrzeug

Publications (2)

Publication Number Publication Date
DE102016003401A1 true DE102016003401A1 (de) 2017-10-05
DE102016003401B4 DE102016003401B4 (de) 2021-06-10

Family

ID=59885279

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102016003401.7A Active DE102016003401B4 (de) 2016-03-19 2016-03-19 Erfassungsvorrichtung und Verfahren zum Erfassen einer Sprachäußerung einer sprechenden Person in einem Kraftfahrzeug

Country Status (1)

Country Link
DE (1) DE102016003401B4 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3111005A1 (fr) 2020-06-02 2021-12-03 Renault Procede de controle du volume sonore
CN113785355A (zh) * 2019-05-03 2021-12-10 奥迪股份公司 用于人员的语音信号的检测设备以及用于通过这种检测设备检测人员的语音信号的方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19938171A1 (de) 1999-08-16 2001-03-01 Daimler Chrysler Ag Verfahren zur Verarbeitung von akustischen Signalen und Kommunikationsanlage für Insassen in einem Fahrzeug
DE19962218A1 (de) * 1999-12-22 2001-07-05 Siemens Ag Verfahren und System zum Autorisieren von Sprachbefehlen
US20040133421A1 (en) * 2000-07-19 2004-07-08 Burnett Gregory C. Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression
WO2008061205A2 (en) 2006-11-16 2008-05-22 Johnson Controls Technology Company Integrated vehicle communication system
DE102010009888A1 (de) 2010-03-02 2011-09-08 GM Global Technology Operations LLC , (n. d. Ges. d. Staates Delaware) Kommunikationsverbesserung in Fahrzeugen
US20130202132A1 (en) * 2012-02-03 2013-08-08 Motorola Mobilitity, Inc. Motion Based Compensation of Downlinked Audio
US20140343945A1 (en) * 2013-05-15 2014-11-20 Parrot Method of visual voice recognition by following-up the local deformations of a set of points of interest of the speaker's mouth
US20140379351A1 (en) * 2013-06-24 2014-12-25 Sundeep Raniwala Speech detection based upon facial movements

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9230556B2 (en) * 2012-06-05 2016-01-05 Apple Inc. Voice instructions during navigation

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19938171A1 (de) 1999-08-16 2001-03-01 Daimler Chrysler Ag Verfahren zur Verarbeitung von akustischen Signalen und Kommunikationsanlage für Insassen in einem Fahrzeug
DE19962218A1 (de) * 1999-12-22 2001-07-05 Siemens Ag Verfahren und System zum Autorisieren von Sprachbefehlen
US20040133421A1 (en) * 2000-07-19 2004-07-08 Burnett Gregory C. Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression
WO2008061205A2 (en) 2006-11-16 2008-05-22 Johnson Controls Technology Company Integrated vehicle communication system
DE102010009888A1 (de) 2010-03-02 2011-09-08 GM Global Technology Operations LLC , (n. d. Ges. d. Staates Delaware) Kommunikationsverbesserung in Fahrzeugen
US20130202132A1 (en) * 2012-02-03 2013-08-08 Motorola Mobilitity, Inc. Motion Based Compensation of Downlinked Audio
US20140343945A1 (en) * 2013-05-15 2014-11-20 Parrot Method of visual voice recognition by following-up the local deformations of a set of points of interest of the speaker's mouth
US20140379351A1 (en) * 2013-06-24 2014-12-25 Sundeep Raniwala Speech detection based upon facial movements

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113785355A (zh) * 2019-05-03 2021-12-10 奥迪股份公司 用于人员的语音信号的检测设备以及用于通过这种检测设备检测人员的语音信号的方法
FR3111005A1 (fr) 2020-06-02 2021-12-03 Renault Procede de controle du volume sonore
WO2021244826A1 (fr) 2020-06-02 2021-12-09 Renault S.A.S Procede de controle du volume sonore

Also Published As

Publication number Publication date
DE102016003401B4 (de) 2021-06-10

Similar Documents

Publication Publication Date Title
DE102014017384B4 (de) Kraftfahrzeug-Bedienvorrichtung mit Korrekturstrategie für Spracherkennung
DE102007051261A1 (de) Verfahren und Vorrichtung zur akustischen Beurteilung eines Kraftfahrzeuges
EP3661797B1 (de) Verfahren, vorrichtung, mobiles anwendergerät, computerprogramm zur steuerung eines audiosystems eines fahrzeugs
EP3430615B1 (de) Fortbewegungsmittel, system und verfahren zur anpassung einer länge einer erlaubten sprechpause im rahmen einer spracheingabe
DE102018107326A1 (de) Adaptives Insassengespräch-Frühwarnsystem
DE102013222645A1 (de) Erkennungssystem in einem Fahrzeug zur Erfassung der Sprachaktivität eines Fahrzeuginsassen
WO2018172231A1 (de) Verfahren und vorrichtung zum unterhalten eines nutzers eines fahrzeugs
DE102017209585A1 (de) System und verfahren zur selektiven verstärkung eines akustischen signals
DE102015116989A1 (de) Akustische Impulsantwortsimulation
DE112018007847T5 (de) Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm
DE102016217026A1 (de) Sprachsteuerung eines Kraftfahrzeugs
DE102016003401B4 (de) Erfassungsvorrichtung und Verfahren zum Erfassen einer Sprachäußerung einer sprechenden Person in einem Kraftfahrzeug
DE112017008305T5 (de) Spracherkennungsvorrichtung, Spracherkennungssystem und Spracherkennungsverfahren
DE102017213249A1 (de) Verfahren und System zum Erzeugen einer auditiven Meldung in einem Innenraum eines Fahrzeugs
DE102021004970A1 (de) Verfahren und Vorrichtung zur individuellen Erzeugung von Sound-Signaturen eines Fahrzeuges
DE102013013695B4 (de) Kraftfahrzeug mit Spracherkennung
WO2020064281A1 (de) Bereitstellen eines interaktiven feedbacks zu einer sprachansage für fahrzeuginsassen
WO2023016924A1 (de) Verfahren und system zum erzeugen von geräuschen in einem innenraum basierend auf extrahierten und klassifizierten realen geräuschquellen und für spezifische zielgeräusche akustisch transparentes fahrzeug umfassend ein derartiges system
DE102013002680B3 (de) Verfahren zum Betreiben einer Vorrichtung, insbesondere eines Kraftwagens oder eines mobilen Endgeräts, mittels Gestensteuerung sowie Vorrichtung
DE112019007580B4 (de) Schallfeld-Steuerungsvorrichtung und Schallfeld-Steuerungsverfahren
DE102020111224A1 (de) System zur Bereitstellung von Schallzonen in einem Fahrzeug
DE102012019994A1 (de) Kraftwagen mit einem Sprachübersetzungssystem
DE102006058758B4 (de) Verfahren und Vorrichtung zum Steuern einer Telekommunikationsendeinrichtung
DE102022213029A1 (de) Fahrzeug und steuerungsverfahren dafür
DE102017011415A1 (de) Vorrichtung und Verfahren zur Ermittlung akustischer Sprachsignale

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final