DE102016004287A1 - Verfahren zur Spracherkennung in einem Kraftfahrzeug - Google Patents

Verfahren zur Spracherkennung in einem Kraftfahrzeug Download PDF

Info

Publication number
DE102016004287A1
DE102016004287A1 DE102016004287.7A DE102016004287A DE102016004287A1 DE 102016004287 A1 DE102016004287 A1 DE 102016004287A1 DE 102016004287 A DE102016004287 A DE 102016004287A DE 102016004287 A1 DE102016004287 A1 DE 102016004287A1
Authority
DE
Germany
Prior art keywords
speech recognition
user
recognition device
motor vehicle
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102016004287.7A
Other languages
English (en)
Inventor
Ute Ehrlich
Sven Reichel
Andre Berton
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mercedes Benz Group AG
Original Assignee
Daimler AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daimler AG filed Critical Daimler AG
Priority to DE102016004287.7A priority Critical patent/DE102016004287A1/de
Publication of DE102016004287A1 publication Critical patent/DE102016004287A1/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Erzeugung einer Antwort auf eine von einem Nutzer eines Kraftfahrzeugs (1) mittels Spracheingabe formulierte Frage unter Verwendung einer im Kraftfahrzeug (1) vorhandenen Spracherkennungseinrichtung (2), umfassend die folgenden Schritte: S1) Bereitstellen einer wenigstens eine Fragestellung enthaltenden Spracheingabe vom Nutzer an die Spracherkennungseinrichtung (2), S2) Erkennen und Interpretieren der in der Spracheingabe vorhandenen Fragestellung durch die Spracherkennungseinrichtung (2), S3) Dynamisches Erzeugen einer Antwort auf die vom Benutzer gestellte Frage durch die Spracherkennungseinrichtung (2) unter Verwendung von dynamisch erzeugten und aktualisierten Daten.

Description

  • Die Erfindung betrifft ein Verfahren zur Spracherkennung in einem Kraftfahrzeug sowie ein Kraftfahrzeug mit einer fahrzeuginternen Spracherkennungseinrichtung, die zur Durchführung dieses Verfahrens eingerichtet/programmiert ist.
  • Moderne, in Kraftfahrzeugen verbaute Assistenzeinrichtungen verwenden Systeme zur automatisierten Spracherkennung, um etwa Spracheingaben von dem Fahrer des Kraftfahrzeugs anzunehmen. Dies ermöglicht es dem Fahrer, verschiedene Komponenten des Kraftfahrzeugs mithilfe von Spracheingaben auf komfortable Weise zu steuern.
  • Aus dem Stand der Technik ist es auch bekannt, Spracherkennungssysteme zu nutzen, um dem Fahrer einer Hilfestellung bei der Bedienung von Fahrzeugkomponenten bereitzustellen. So behandelt etwa die DE 10 2008 028 477 A1 ein Verfahren zur Hilfestellung eines Nutzers bei der Benutzung eines Sprachbediensystems, Das Sprachbediensystem umfasst einen Speicher, in welchem Hilfe-Erläuterungen zur Bedienung des Sprachbediensystems abgelegt sind. Die Hilfe-Erläuterungen sind jeweils in mehrere Teil-Erläuterungen zerlegt. Durch Eingabe eines Sprachkommandos wird aus dem Speicher eine kontextabhängige Hilfe-Erläuterung ausgewählt, und die erste Teil-Erläuterung der kontextabhängigen Hilfe-Erläuterung wird ausgegeben.
  • Es ist eine Aufgabe der vorliegenden Erfindung, eine verbesserte Ausführungsform für ein Verfahren zur Spracherkennung in einem Kraftfahrzeug zu schaffen.
  • Diese Aufgabe wird durch den Gegenstand der unabhängigen Patentansprüche gelöst. Bevorzugte Ausführungsformen sind Gegenstand der abhängigen Patentansprüche.
  • Grundgedanke der Erfindung ist demnach, für die Antworterzeugung für eine vom Benutzer getätigte Spracheingabe durch eine Spracherkennungseinrichtung dynamisch generierte und aktualisierte Daten zu verwenden.
  • Unter ”dynamisch” ist vorliegend zu verstehen, dass von einer Spracherkennungseinrichtung eine zu erzeugende Antwort, die typischerweise in Form eines Erklärungstextes generiert wird, nicht nur unter Verwendung von statischem Wissen erzeugen wird, welches beispielsweise in Form einer Bedienungsanleitung – statisch im Kraftfahrzeug gespeichert sein mag. Vielmehr werden beim hier vorgestellten Verfahren sich dynamisch ändernde Daten verwendet. Besagte dynamische Daten können insbesondere auf den Nutzer der Spracherkennungseinrichtung – dies ist typischerweise der Fahrer des Kraftfahrzeugs – betreffen. Solche dynamischen Nutzerdaten können beispielsweise dem jeweiligen Nutzer zugeordnete Präferenzen bei der Steuerung bzw. Bedienung der Fahrzeugkomponenten sowie den sich dynamisch ändernden Wissenstand des Nutzers enthalten. In jedem Fall können die verwendeten dynamischen Daten dabei kontinuierlich angepasst und somit verbessert werden.
  • Im Ergebnis ermöglicht das hier vorgestellte, erfindungsgemäße Verfahren eine gegenüber herkömmlichen Systemen verbesserte Erkennungsquote. Wird das erfindungsgemäße Verfahren dazu herangezogen, vom Nutzer gestellte Fragen in Bezug auf verschiedenen Fahrzeugfunktionen zu beantworten, so führt dies zu einer verbesserten Benutzerfreundlichkeit bei der Bedienung der Fahrzeugkomponenten.
  • Ein erfindungsgemäße Verfahren zur Erzeugung einer Antwort auf eine von einem Nutzer eines Kraftfahrzeugs mittels Spracheingabe formulierte Frage unter Verwendung einer im Kraftfahrzeug vorhandenen Spracherkennungseinrichtung umfasst einen ersten Schritt S1), gemäß welchem einer in einem Kraftfahrzeug vorhandenen Spracherkennungseinrichtung von einem Nutzer eine Spracheingabe bereitgestellt wird, welche wenigstens eine zu beantwortenden Fragestellung enthält.
  • Diese in der Spracheingabe enthaltende Fragestellung wird in einem weiteren Schritt S2 durch die Spracherkennungseinrichtung erkannt und interpretiert, was z. B. unter Zuhilfenahme einer syntaktisch/semantischen Grammatik geschehen kann. Mittels einer solchen einer syntaktisch/semantischen Grammatik kann beispielsweise die seitens des Nutzers formulierte Frage: „Warum soll ich über die Autobahn A81 fahren?”, dahingehend interpretiert werden, dass bezüglich des Vorgangs ”Ziel anfahren” eine vorgeschlagene Routenwahl hinterfragt wird.
  • In einem weiteren Verfahrensschritt S3 wird eine Antwort auf die vom Benutzer gestellte Frage unter Verwendung von dynamisch erzeugten und aktualisierten Daten erzeugt.
  • Bei einer bevorzugten Ausführungsform wird die in Schritt S3 erzeugte Antwort in einem Verfahrensschritt S4 mittels akustischer Sprachausgabe ausgegeben. Dies kann mit Hilfe einer im Kraftfahrzeug vorhandenen Audioanlage geschehen.
  • Die Erfindung betrifft weiterhin ein Kraftfahrzeug mit einer vorangehend vorgestellten Spracherkennungseinrichtung, die zur Ausführung des Verfahrens nach einem der vorhergehenden Ansprüche eingerichtet/programmiert ist. Die vorangehend erläuterten Vorteile des erfindungsgemäßen Verfahrens übertragen sich daher auch auf das erfindungsgemäße Kraftfahrzeug.
  • Weitere wichtige Merkmale und Vorteile der Erfindung ergeben sich aus den Unteransprüchen, aus den Zeichnungen und aus der zugehörigen Figurenbeschreibung anhand der Zeichnungen.
  • Es versteht sich, dass die vorstehend genannten und die nachstehend noch zu erläuternden Merkmale nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder in Alleinstellung verwendbar sind, ohne den Rahmen der vorliegenden Erfindung zu verlassen.
  • Bevorzugte Ausführungsbeispiele der Erfindung sind in den Zeichnungen dargestellt und werden in der nachfolgenden Beschreibung näher erläutert, wobei sich gleiche Bezugszeichen auf gleiche oder ähnliche oder funktional gleiche Bauteile beziehen.
  • Dabei zeigen, jeweils schematisch:
  • 1 ein Beispiel eines erfindungsgemäßen Kraftfahrzeugs,
  • 2 ein das erfindungsgemäße Verfahren illustrierendes Ablaufdiagramm.
  • Die 1 zeigt ein Beispiel eines erfindungsgemäßen Kraftfahrzeugs 1, in welchem das hier vorgestellte, erfindungsgemäße Verfahren durchgeführt werden kann. Hierzu ist im Kraftfahrzeug 1 eine Spracherkennungseinrichtung 2 vorhanden. Des Weiteren sind im Kraftfahrzeug 1 mehrere, in Figur schematisch dargestellte Fahrzeugkomponenten 4 vorhanden. Rein beispielhaft sind in 1 grobschematisch ein Gebläse 5 zur Belüftung des Fahrzeuginnenraums des Kraftfahrzeugs 1, ein Müdigkeitsassistent 6 sowie ein Navigationssystem 7 angedeutet. Die Spracherkennungseinrichtung 2, das Steuergerät 3 sowie die Fahrzeugkomponenten 4 können über einen gemeinsamen Feldbus 5, beispielsweise einen LIN- oder CAN-Bus, miteinander kommunizieren.
  • Die 2 zeigt nun ein Ablaufdiagramm des erfindungsgemäßen Verfahrens. In einem ersten Schritt S1 des Verfahrens wird von einem Nutzer eine Spracheingabe in Form einer Frage getätigt. Hierzu kann im Kraftfahrzeug 1 (vgl. 1) ein Mikrofon 3 angeordnet sein, welches mit der Spracherkennungseinrichtung 2 zusammenwirkt. Die vom Nutzer gestellte Frage kann sie auf die Funktion einer der Fahrzeugkomponenten 4, beziehen. Beispiele für typische, vom Nutzer gestellte Fragen sind Fragen sind etwa.
    • 1. „Wie kann ich das Gebläse verstellen?”,
    • 2. „Wie funktioniert der Müdigkeitsassistent?”,
    • 3. „Warum soll ich über die Autobahn A81 fahren?”
  • In einem zweiten Schritt S2 des Verfahrens wird die als Frage formulierte Spracheingabe von der Spracherkennungseinrichtung 2 erkannt. Die von der Spracherkennungseinrichtung 2 erkannte Wortfolge wird dabei nicht nur sprachlich erkannt, sondern auch semantisch und syntaktisch interpretiert. Im Fall des erstgenannten Beispiels bedeutet dies beispielsweise, dass von der Spracherkennungseinrichtung 2 erkannt wird, dass vom Nutzer eine Frage bezüglich der Funktionalität des Gebläses 5 gestellt wurde.
  • In einem weiteren Schritt S3 wird zur Beantwortung der vom Benutzer gestellten und von der Spracherkennungseinrichtung erkannten Frage dynamisch eine Antwort erzeugt.
  • Unter ”dynamisch” ist vorliegend zu verstehen, dass besagte Antwort, die typischerweise in Form eines Erklärungstextes erzeugt wird, nicht nur unter Verwendung von statischem Wissen generiert wird, welches – beispielsweise in Form einer Bedienungsanleitung o. ä. – statisch im Kraftfahrzeug gespeichert ist; vielmehr werden beim hier vorgestellten Verfahren sich dynamisch ändernde Daten herangezogen. Diese Daten können insbesondere den Nutzer der Spracherkennungseinrichtung betreffen. Solche dynamischen Nutzerdaten können beispielsweise in Bezug auf den aktuellen Nutzer gespeicherte Präferenzen bei der Steuerung bzw. Bedienung der Fahrzeugkomponenten sowie den sich dynamisch ändernden Wissenstand des Nutzers. Mit anderen Worten, bei der Erzeugung der Antwort wird berücksichtigt, welcher Nutzer die gestellte Frage formuliert hat. Denkbar ist es beispielsweise, dass Nutzerdaten zu verschiedene Nutzern in einer im Kraftfahrzeug 1 vorhandenen Datenbank 11, auf welche die Spracherkennungseinrichtung 2 zugreifen kann, gespeichert werden und dynamisch aktualisiert werden.
  • Vorstellbar ist weiterhin eine Berücksichtigung von bereits mittels des erfindungsgemäßen Verfahrens beantworteten Fragestellungen bei der Beantwortung einer neuen, vom Nutzer gestellten und mittels des hier vorgestellten Verfahrens zu beantwortenden Frage. Insofern kann unter dem erfindungswesentlichen, dynamischen Erzeugen einer Antwort auch ein „Lernen” durch die Spracherkennungseinrichtung 2 verstanden werden.
  • In analoger Weise zu sich dynamisch ändernden Nutzerdaten können dynamische Daten über das Systemverhalten bei der Erzeugung einer Antwort auf vom Nutzer gestellte Frage wie beispielsweise „Gibt es an der nächsten Raststätte auch Pizza?” herangezogen werden. Schließlich können auch sich dynamisch ändernde Daten über die Umwelt, die momentan vorliegende Situation (Frage: „Warum überholst du nicht?” – Antwort: „Der Verkehr ist zu dicht für einen Überholvorgang”) oder allgemeines Weltwissen verwendet werden.
  • In einem vierten Verfahrensschritt S4 kann die auf diese Weise erzeugte Antwort auf die vom Nutzer gestellte Frage ausgegeben werden. Dies kann optisch, unter Verwendung einer im Fahrzeug verbauten Anzeigeeinrichtung 9, und/oder unter Verwendung einer akustischen Ausgabeeinheit, beispielsweise eines im Fahrt Kraftfahrzeug 1 verbauten Audiosystems 10, erfolgen.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • DE 102008028477 A1 [0003]

Claims (4)

  1. Verfahren zur Erzeugung einer Antwort auf eine von einem Nutzer eines Kraftfahrzeugs (1) mittels Spracheingabe formulierte Frage unter Verwendung einer im Kraftfahrzeug (1) vorhandenen Spracherkennungseinrichtung (2), umfassend die folgenden Schritte: S1) Bereitstellen einer wenigstens eine Fragestellung enthaltenden Spracheingabe vom Nutzer an die Spracherkennungseinrichtung (2), S2) Erkennen und Interpretieren der in der Spracheingabe vorhandenen Fragestellung durch die Spracherkennungseinrichtung (2), S3) Dynamisches Erzeugen einer Antwort auf die vom Benutzer gestellte Frage durch die Spracherkennungseinrichtung (2) unter Verwendung von dynamisch erzeugten und aktualisierten Daten.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das Interpretieren der Spracheingabe in Schritt S2 unter Verwendung einer syntaktisch/semantischen Grammatik erfolgt.
  3. Verfahren nach Anspruch 1 oder 2, umfassend einen auf Schritt S3) folgenden, zusätzlichen Verfahrensschritt S4: S4) Ausgeben der Antwort mittels akustischer Sprachausgabe.
  4. Kraftfahrzeug (1), – mit einer Spracherkennungseinrichtung (2), die zur Ausführung des Verfahrens nach einem der vorhergehenden Ansprüche eingerichtet/programmiert ist.
DE102016004287.7A 2016-04-07 2016-04-07 Verfahren zur Spracherkennung in einem Kraftfahrzeug Withdrawn DE102016004287A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102016004287.7A DE102016004287A1 (de) 2016-04-07 2016-04-07 Verfahren zur Spracherkennung in einem Kraftfahrzeug

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102016004287.7A DE102016004287A1 (de) 2016-04-07 2016-04-07 Verfahren zur Spracherkennung in einem Kraftfahrzeug

Publications (1)

Publication Number Publication Date
DE102016004287A1 true DE102016004287A1 (de) 2017-02-09

Family

ID=57853461

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102016004287.7A Withdrawn DE102016004287A1 (de) 2016-04-07 2016-04-07 Verfahren zur Spracherkennung in einem Kraftfahrzeug

Country Status (1)

Country Link
DE (1) DE102016004287A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018206015A1 (de) 2018-04-19 2019-10-24 Bayerische Motoren Werke Aktiengesellschaft Benutzerkommunikation an Bord eines Kraftfahrzeugs

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008028477A1 (de) 2008-06-13 2009-12-17 Volkswagen Ag Verfahren zur Hilfestellung eines Nutzers bei der Benutzung eines Sprachbediensystems und Sprachbediensystem

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008028477A1 (de) 2008-06-13 2009-12-17 Volkswagen Ag Verfahren zur Hilfestellung eines Nutzers bei der Benutzung eines Sprachbediensystems und Sprachbediensystem

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018206015A1 (de) 2018-04-19 2019-10-24 Bayerische Motoren Werke Aktiengesellschaft Benutzerkommunikation an Bord eines Kraftfahrzeugs
WO2019202056A1 (de) 2018-04-19 2019-10-24 Bayerische Motoren Werke Aktiengesellschaft Benutzerkommunikation an bord eines kraftfahrzeugs

Similar Documents

Publication Publication Date Title
DE102017220266B3 (de) Verfahren zum Überprüfen eines Onboard-Spracherkenners eines Kraftfahrzeugs sowie Steuervorrichtung und Kraftfahrzeug
DE102009017176A1 (de) Navigationsanordnung für ein Kraftfahrzeug
EP1927980A2 (de) Verfahren zur Klassifizierung der gesprochenen Sprache in Sprachdialogsystemen
DE102012008260A1 (de) Verfahren zum interaktiven Erlernen eines in einem Fahrzeug vorhandenen Fahrerassistenzsystems im Fahrbetrieb
DE102007037567A1 (de) Verfahren zur multimodalen Bedienung mindestens eines Gerätes in einem Kraftfahrzeug
DE102011121110A1 (de) Verfahren zum Betreiben eines Sprachdialogsystems in einem Fahrzeug und dazugehöriges Sprachdialogsystem
DE102016212681A1 (de) Steuervorrichtung und Verfahren zum sprachbasierten Betreiben eines Kraftfahrzeugs
EP3115886B1 (de) Verfahren zum betreiben eines sprachsteuerungssystems und sprachsteuerungssystem
DE102016004287A1 (de) Verfahren zur Spracherkennung in einem Kraftfahrzeug
EP3469581B1 (de) Verfahren zum betreiben eines kraftfahrzeugs mit einer bedienvorrichtung
DE102017211447B4 (de) Verfahren zum Auswählen eines Listeneintrags aus einer Auswahlliste einer Bedienvorrichtung mittels Sprachbedienung sowie Bedienvorrichtung
DE102016003903A1 (de) Verfahren zur Spracherkennung in einem Kraftfahrzeug
DE102018200088B3 (de) Verfahren, Vorrichtung und computerlesbares Speichermedium mit Instruktionen zum Verarbeiten einer Spracheingabe, Kraftfahrzeug und Nutzerendgerät mit einer Sprachverarbeitung
DE102008028477B4 (de) Verfahren zur Hilfestellung eines Nutzers bei der Benutzung eines Sprachbediensystems und Sprachbediensystem
DE102008025532B4 (de) Kommunikationssystem und Verfahren zum Durchführen einer Kommunikation zwischen einem Nutzer und einer Kommunikationseinrichtung
DE102015119730A1 (de) Verfahren und Vorrichtung zum Unterstützen eines Fahrzeugführers
DE102014224794B4 (de) Sprachassistenzverfahren für ein Kraftfahrzeug
EP3301531A1 (de) Verfahren zum automatisierten führen eines kraftfahrzeugs
DE102016002463A1 (de) Verfahren zum Betrieb einer Sprachsteuerung
DE102016005731B4 (de) Verfahren zum Betreiben mehrerer Spracherkenner
DE102021006023B3 (de) Verfahren zum Betreiben eines Sprachdialogsystems und Sprachdialogsystem
DE102013019208A1 (de) Kraftfahrzeug-Sprachbedienung
DE102020107619A1 (de) Verfahren, Vorrichtung sowie Computerprogramm zur Spracherkennung
DE102022003532A1 (de) Sprachdialogsystem und Verfahren zu dessen Betrieb sowie Fahrzeug
DE102015007361B3 (de) Verfahren zum Betreiben wenigstens einer Funktionseinrichtung eines Kraftfahrzeugs

Legal Events

Date Code Title Description
R230 Request for early publication
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee