DE102009025530A1 - Verfahren zur Bedienung eines Fahrzeugs mittels eines automatisierten Sprachdialogs sowie entsprechend ausgestaltetes Sprachdialogsystem und Fahrzeug - Google Patents

Verfahren zur Bedienung eines Fahrzeugs mittels eines automatisierten Sprachdialogs sowie entsprechend ausgestaltetes Sprachdialogsystem und Fahrzeug Download PDF

Info

Publication number
DE102009025530A1
DE102009025530A1 DE102009025530A DE102009025530A DE102009025530A1 DE 102009025530 A1 DE102009025530 A1 DE 102009025530A1 DE 102009025530 A DE102009025530 A DE 102009025530A DE 102009025530 A DE102009025530 A DE 102009025530A DE 102009025530 A1 DE102009025530 A1 DE 102009025530A1
Authority
DE
Germany
Prior art keywords
speech
list
speech dialogue
dialogue system
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102009025530A
Other languages
English (en)
Other versions
DE102009025530B4 (de
Inventor
Christoph WÄLLER
Michael Mischke
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen AG
Original Assignee
Volkswagen AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Volkswagen AG filed Critical Volkswagen AG
Priority to DE102009025530.3A priority Critical patent/DE102009025530B4/de
Publication of DE102009025530A1 publication Critical patent/DE102009025530A1/de
Application granted granted Critical
Publication of DE102009025530B4 publication Critical patent/DE102009025530B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Abstract

Ein Verfahren zur Bedienung eines Fahrzeugs (10) mittels eines automatisierten Sprachdialogs wird offenbart. Dabei werden von einem Sprachdialogsystem (12) des Fahrzeugs (10) automatisiert mehrere Bedieninformationen (13) von einem Benutzer in Form einer logisch aufeinander aufbauenden Reihe von Sprachdialogelementen (13-15) abgefragt. Eine Liste (9) mit den einzelnen Sprachdialogelementen (13-15) wird auf einer Anzeige dargestellt, wobei innerhalb dieser Liste (9) die einzelnen Sprachdialogelemente (13-15) selektierbar sind. Dabei ist eine einem in der Liste (9) selektierten Sprachdialogelement (13-15) entsprechende Bedieninformation (13) korrigierbar oder wiederholbar.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren, um über einen automatisierten Sprachdialog ein Fahrzeug zu bedienen, sowie ein entsprechend ausgestaltetes Sprachdialogsystem und ein entsprechend ausgestaltetes Fahrzeug.
  • Die DE 10 2007 037 567 A1 betrifft ein Verfahren zur automatischen Ansteuerung eines Gerätes.
  • Die DE 603 09 822 T2 beschreibt ein Verfahren und eine Vorrichtung zum Verbessern der Leistungsfähigkeit bei der Spracherkennung.
  • Die Bedienung von Fahrzeugen über Spracheingaben hat sich als wesentliches Merkmal aktueller Benutzerschnittstellen im Fahrzeug etabliert. Zur Eingabe komplexer Sachverhalte wird eine entsprechende Information von einem Sprachdialogsystem sequenziell vom Benutzer abgefragt. Dies geschieht durch einen von dem Sprachdialogsystem geführten Dialog, welcher sich dem Benutzer als eine logisch aufeinander aufbauende Reihe von Fragen darstellt. Die Fragen dienen dabei insbesondere zur Eingrenzung eines Sachverhalts, bis das Sprachdialogsystem zu einer eindeutigen Reaktion in der Lage ist. Dabei wird der Dialog primär sprachlich bzw. akustisch zwischen dem Sprachdialogsystem und dem Benutzer geführt. Bei einigen nach dem Stand der Technik bekannten Sprachdialogsystemen wird die akustische Ausgabe das Sprachdialogsystems zusätzlich als Text auf einer Anzeige dargestellt. Dabei muss der Benutzer bei den heute bekannten Sprachdialogsystemen bei jeder Spracheingabe auf eine bestimmte Taste („Push to Talk”-Taste) drücken, welche einen Spracherkenner öffnet, um die Eingabe des Benutzers aufzuzeichnen.
  • Die nach dem Stand der Technik bekannten Sprachdialogsysteme weisen dabei folgende Nachteile auf:
    • • Es ist dem Benutzer nicht möglich, in dem Dialog zu einer beliebigen Stelle zurück zu springen, um eine bereits bestätigte Aussage abzuändern. Dies ist jedoch in der Praxis wünschenswert, da in einigen Fällen erst nach der entsprechenden Reaktion des Sprachdialogsystems auf eine Eingabe des Benutzers der Sinn oder die semantische Wirkung der Eingabe von dem Benutzer eingeschätzt werden kann.
    • • Ein Sprachdialog, welcher einem bereits durchgeführten Sprachdialog ähnlich ist, muss nach dem Stand der Technik komplett von vorn begonnen werden. Es ist nicht möglich, den bereits bestehenden Dialog entsprechend abzuändern, um somit die Interaktion zwischen dem Sprachdialogsystem und dem Benutzer abzukürzen.
  • Daher ist es die Aufgabe der vorliegenden Erfindung, die nach dem Stand der Technik bekannten Probleme zumindest teilweise zu lösen oder abzumildern.
  • Erfindungsgemäß wird diese Aufgabe durch ein Verfahren zur Bedienung eines Fahrzeugs mittels eines automatisierten Sprachdialogsystems nach Anspruch 1, ein Sprachdialogsystem für ein Fahrzeug nach Anspruch 11 und ein Fahrzeug nach Anspruch 13 gelöst. Die abhängigen Ansprüche definieren bevorzugte und vorteilhafte Ausführungsformen der vorliegenden Erfindung.
  • Im Rahmen der vorliegenden Erfindung wird ein Verfahren zur Bedienung eines Fahrzeugs mittels eines automatisierten Sprachdialogs bereitgestellt. Dabei werden von einem Sprachdialogsystem des Fahrzeugs automatisiert mehrere Bedieninformationen von einem Benutzer in Form einer logisch aufeinander aufbauenden Reihe von Sprachdialogelementen abgefragt. Eine insbesondere chronologisch geordnete Liste mit den einzelnen Sprachdialogelementen wird auf einer Anzeige dargestellt. Dabei sind die einzelnen Sprachdialogelemente in der Liste selektierbar, so dass ein beliebiges Sprachdialogelement, welches einer von dem Benutzer per Spracheingabe eingegebenen Bedieninformation entspricht und in der Liste selektiert ist, korrigiert oder wiederholt werden kann.
  • Mit dem erfindungsgemäßen Verfahren werden die Bedieninformationen demnach eingegeben, indem von dem Sprachdialogsystem dem Benutzer pro Bedieninformation eine Frage in akustischer Form gestellt und über eine Spracheingabe von dem Benutzer eine entsprechende Antwort gegeben wird, welche dann mittels einer Spracherkennung erfasst wird.
  • Indem in der Liste der Sprachdialogelemente jedes einzelne Sprachdialogelement selektierbar ist, kann vorteilhafterweise in dem Dialog zwischen dem Sprachdialogsystem und dem Benutzer, welcher in Form dieser Liste dargestellt wird, eine beliebige bereits bestätigte Aussage oder Bedieninformation korrigiert werden. Dadurch wird vermieden, dass der Benutzer alle Bedieninformationen neu eingeben muss, wie es nach dem Stand der Technik der Fall ist.
  • Jedes Sprachdialogelement besteht dabei insbesondere aus einer Ausgabe des Sprachdialogsystems oder einer Bedieninformation des Benutzers. Bei der Ausgabe des Sprachdialogsystem handelt es sich entweder um eine Frage, welche von dem Sprachdialogsystem an den Benutzer gestellt wird, oder um eine Angabe über eine Aktion des Sprachdialogsystems.
  • Die Ausgaben des Sprachdialogsystems sind dabei von den vorher von dem Benutzer eingegebenen Bedieninformationen abhängig. Mit anderen Worten hängen die weitergehenden Fragen oder Aktionen des Sprachdialogsystems von den vorher gegebenen Antworten oder Bedieninformationen des Benutzers ab.
  • Bei der Darstellung der Sprachdialogelemente auf der Anzeige, werden die Ausgaben des Sprachdialogsystems und die Bedieninformationen gemäß einer erfindungsgemäßen Ausführungsform dialogartig angeordnet so dass auf eine Frage die zugehörige Antwort oder Bedieninformation direkt folgt. Dabei werden die Ausgaben derart dargestellt, dass sie von den Bedieninformationen für den Benutzer unterscheidbar sind.
  • Selektiert der Benutzer eine Frage des Sprachdialogsystems als ein Sprachdialogelement, wird vorteilhafterweise die diesem Sprachdialogelement entsprechende Frage von dem Sprachdialogsystem in akustischer Form wiederholt gestellt und alle auf diese Frage folgenden Ausgaben des Sprachdialogsystems und vorher eingegebenen Bedieninformationen werden gelöscht. Mit anderen Worten wird der Dialog zwischen dem Sprachdialogsystem und dem Benutzer an der der wiederholten Frage entsprechenden Stelle wieder aufgesetzt, wobei die vor dieser Frage eingegebenen Bedieninformationen erhalten bleiben.
  • Mit einer bestimmten Taste (z. B. PTT („Push To Talk”)) kann der Sprachdialog eingeleitet werden. Ob die Spracherkennung anschließend im Verlauf des Sprachdialogs manuell (z. B. wiederum über die bestimmte Taste oder über eine andere Handhabung) gestartet werden muss oder automatisch aktiv ist, hängt von dem Ablauf des Sprachdialogs ab.
  • Selektiert der Benutzer eine Angabe einer Aktion des Sprachdialogsystems als ein Sprachdialogelement, wird die entsprechende Aktion von dem Sprachdialogsystem nochmals ausgeführt.
  • Die Bedieninformation, welche einem in der Liste selektierten Sprachdialogelement entspricht, kann korrigiert werden, indem die entsprechende Bedieninformation von dem Benutzer nochmals über eine Spracheingabe eingegeben und von einer Spracherkennung erfasst wird. Darüber hinaus ist es möglich, dass eine Liste der besten Treffer derjenigen Spracheingabe dargestellt wird, welche vorher zu der entsprechenden zu korrigierenden Bedieninformation geführt hat. Dabei kann der Benutzer in dieser Liste der besten Treffer denjenigen Treffer auswählen, welcher mit der von dem Benutzer gewünschten Bedieninformation übereinstimmt.
  • Dadurch ist es möglich, eine Bedieninformation für den Fall zu korrigieren, dass die Spracherkennung die von dem Benutzer vorgenommene Spracheingabe nicht richtig erfasst hat. Die Korrektur kann dabei sofort nach der Spracheingabe bzw. sofort nach dem Erkennen der fehlerhaften Umsetzung der Spracheingabe erfolgen oder zu einer beliebig späteren Zeit, wobei es unerheblich ist, ob bereits weitere Spracheingaben erfolgt sind und damit weitere Bedieninformationen vorliegen.
  • Die Darstellung einer Bedieninformation erfolgt entweder als ein Text, welcher mit Hilfe einer Spracherkennung als bester Treffer ausgehend von der mittels einer Spracheingabe eingegebenen Bedieninformation erfasst wird, wenn ein Konfidenzmaß der Spracherkennung bei dieser Spracheingabe über einem vorbestimmten Schwellenwert liegt. Es ist aber auch möglich, dass die Darstellung der Bedieninformationen in Form einer Liste von mehreren besten Treffern, welche jeweils als Text dargestellt werden, erfolgt. Diese besten Treffer sind dabei mittels der Spracherkennung ausgehend von der über die Spracheingabe eingegebenen Bedieninformation erfasst. Die Darstellung der Liste wird gewählt, wenn das Konfidenzmaß der Spracherkennung für den besten Treffer bei der entsprechenden Spracheingabe nicht über dem vorbestimmten Schwellenwert liegt. In diesem Fall wählt der Benutzer denjenigen Treffer aus der Liste aus, welcher der von ihm gemeinten Bedieninformation entspricht, wobei dieser Treffer als Text auf der Anzeige für das entsprechende Sprachdialogelement dargestellt wird.
  • Darüber hinaus wird auf der Anzeige dargestellt, ob die Spracherkennung gerade aktiv ist, um eine Bedieninformation von dem Benutzer zu erfassen, oder ob die Spracherkennung beispielsweise über einen speziellen Knopf erst aktiviert werden muss.
  • Bei der vorliegenden Erfindung werden Spracheingaben des Benutzers von einem Spracherkenner in Form eines erkannten Begriffs (für die Spracheingabe) als Bedieninformation beispielsweise in der Form einer Sprechblase des Benutzers in das entsprechende Sprachdialogelement eingetragen. Der Benutzer wird also gewissermaßen von dem Sprachdialogsystem zitiert. Dabei wird insbesondere derjenige von dem Spracherkenner ermittelte Begriff mit der höchsten Konfidenz, also mit der höchsten Ähnlichkeit mit dem phonetischen Eingabesignal (entspricht der Spracheingabe) des Benutzers ausgewählt. Dabei werden von dem Spracherkenner alternative Begriffe mit einer ähnlich hohen Ähnlichkeit zum Eingabesignal ermittelt und in Form einer Liste der besten Treffer zusammen mit dem Begriff mit der höchsten Konfidenz abgespeichert, wobei die Liste der besten Treffer zunächst nicht angezeigt wird. Wenn das Konfidenzmaß für eine Spracheingabe jedoch unterhalb eines vorbestimmten Schwellenwerts liegt, so dass automatisch kein eindeutiger ”Favorit” (bester Treffer) ermittelt werden kann oder sollte, stellt das erfindungsgemäße Sprachdialogsystem automatisch die Liste der besten Treffer innerhalb der Sprechblase des Benutzers dar, so dass der Benutzer gezwungen ist, eine Auswahl innerhalb dieser Liste der besten Treffer vorzunehmen oder den Begriff neu einzusprechen.
  • Im Rahmen der vorliegenden Erfindung wird auch ein Sprachdialogsystem für ein Fahrzeug bereitgestellt, wobei das Sprachdialogsystem ein Mikrofon und einen Lautsprecher umfasst. Dabei werden einem Benutzer über den Lautsprecher mehrere Fragen gestellt, welche der Benutzer über das Mikrofon beantwortet und damit dem Sprachdialogsystem mehrere Bedieninformationen eingibt. Die Bedieninformationen werden dabei von dem Benutzer in Form einer logisch aufeinander aufbauenden Reihe von Sprachdialogelementen, also in Form einer Benutzerführung, abgefragt. Das Sprachdialogsystem umfasst auch eine Anzeige, auf welcher eine Liste mit den einzelnen Sprachdialogelementen dargestellt wird. Die in dieser Liste dargestellten einzelnen Sprachdialogelemente sind selektierbar, wodurch eine beliebige einem selektierten Sprachdialogelement entsprechende Bedieninformation durch den Benutzer korrigierbar oder wiederholbar ist.
  • Die Vorteile des erfindungsgemäßen Sprachdialogsystems entsprechen dabei im Wesentlichen den Vorteilen des erfindungsgemäßen Verfahrens, weshalb hier auf eine Wiederholung verzichtet wird.
  • Schließlich wird im Rahmen der vorliegenden Erfindung ein Fahrzeug bereitgestellt, welches ein erfindungsgemäßes Sprachdialogsystem umfasst.
  • Die vorliegende Erfindung bietet folgende Vorteile gegenüber dem Stand der Technik:
    • • Es wird eine Zeitersparnis bei der Eingabe ähnlicher Informationen über zueinander ähnliche Sprachdialoge erzielt. Indem ein vorhandener Sprachdialog nur an den unterschiedlichen Stellen abgeändert wird, um ihn entsprechend der Wünsche des Benutzers abzuändern, muss der Benutzer die sich nicht ändernden Sprachdialogelemente nicht nochmals eingeben.
    • • Es wird eine Zeitersparnis durch eine von einem Konfidenzmaß abhängige Darstellung der Liste der besten Treffer für eine Spracheingabe und durch eine multimodale Interaktion mit den in einer Liste dargestellten Sprachdialogelementen erzielt.
    • • Eine effiziente Korrektur bereits bestätigter Spracheingaben bzw. Bedieninformationen ist möglich, ohne dass alle Bedieninformationen nochmals eingegeben werden müssen.
    • • Mittels der Liste der Sprachdialogelemente werden so genannte Shortcuts für Befehle und Dialogsituationen (z. B. wiederholte Durchführung einer Aktion, Wiederholen einer Frage) bereitgestellt.
    • • Durch die erfindungsgemäße Inszenierung des Sprachdialogs, insbesondere durch die grafische Darstellung des Sprachdialogs zwischen Mensch und Maschine, wird die Sprachbedienung des Fahrzeugs positiv inszeniert.
  • Die vorliegende Erfindung ist insbesondere zur Bedienung bestimmter Systeme für ein Fahrzeug geeignet. Selbstverständlich ist die vorliegende Erfindung nicht auf diesen bevorzugten Anwendungsbereich beschränkt, sondern kann auch allgemein zur Bedienung eines Systems eingesetzt werden, welches keinen Berührungspunkt mit einem Fahrzeug aufweist. Darüber hinaus kann die vorliegende Erfindung auch bei Flugzeugen, Schiffen oder gleisgebundenen Fahrzeugen eingesetzt werden.
  • Im Folgenden wird die vorliegende Erfindung durch erfindungsgemäße Ausführungsformen mit Bezug zu den Figuren im Detail beschrieben.
  • In 1 ist ein exemplarischer Ablauf eines Sprachdialogs in Form einer chronologisch sortierten Reihe von Sprechblasen dargestellt.
  • In 2 ist schematisch ein erfindungsgemäßes Fahrzeug mit einem erfindungsgemäßen Sprachdialogsystem dargestellt.
  • Zu Beginn eines in 1a dargestellten Sprachdialogs ist eine Liste 9 von Sprachdialogelementen, welche auf einer Anzeige 3 dargestellt ist, leer. Durch ein Drücken der PTT-Taste („Push To Talk”-Taste) 1 wird ein Sprachdialog (oder Chat Widget des Sprachdialogsystems) gestartet, wobei auch eine Spracherkennungssoftware aktiv geschaltet wird, um eine gesprochene Eingabe von einem Benutzer über ein Mikrofon zu erfassen.
  • Bei einem Einstieg über die PTT-Taste 1 ist ein erstes Sprachdialogelement 13 sofort aktiv und die Spracherkennungssoftware oder der Spracherkenner sind bereit, die gesprochene Eingabe von dem Benutzer zu verarbeiten, wie es in 1b dargestellt ist. Es ist auch möglich, über ein Menü das erste Sprachdialogelement 13 zu aktivieren. Nachdem der Benutzer den Begriff ”Nach Berlin” in das Mikrofon gesprochen hat, wird diese Spracheingabe als Text in Form einer Dialog-Blase als erstes Sprachdialogelement 13 dargestellt. Ein kleines Dreieck 4 oben rechts in dem Sprachdialogelement 13 signalisiert die Möglichkeit, ein Drop-Down-Menü für eine Liste der besten Treffer zu öffnen, welche für die Spracheingabe von dem Spracherkenner ermittelt worden ist. Diese Liste der besten Treffer kann aktiviert werden, indem auf die Mitte einer Wippe 2 gedrückt wird.
  • Im anschließenden in 1c dargestellten Dialog stellt das Sprachdialogsystem die Frage ”Welche Straße”, worauf der Benutzer ”Kirchweg” antwortet. Ein mit dem Sprachdialogsystem verbundenes Navigationssystem kann nun aufgrund der vorliegenden Bedieninformationen gestartet werden, was über das Sprachdialogelement 15 mit der Dialog-Blase ”Navi wird gestartet” dem Benutzer auch auf der Anzeige 3 mitgeteilt wird.
  • Durch eine spezielle Darstellung des letzten Sprachdialogelements der Liste 9 (beispielsweise durch einen roten Rand dieses Sprachdialogelements) wird dem Benutzer signalisiert, dass der Spracherkenner aktiviert ist, so dass eine Spracheingabe des Benutzers ohne eine weitere Betätigung von dem Spracherkenner erfasst wird. Wenn diese spezielle Darstellung des letzten Sprachdialogelements nicht vorhanden ist, muss der Spracherkenner manuell (beispielsweise durch Drücken der PTT-Taste 1) aktiviert werden.
  • Wenn der Benutzer die Angabe des Straßennamens korrigieren möchte, selektiert er mittels der Wippe 2 das der Bedieninformation ”Kirchweg” entsprechende Sprachdialogelement 13, wobei das vorher selektierte Sprachdialogelement deaktiv (d. h. nicht aktiv) abgelegt wird.
  • Durch Drücken der Mitte der Wippe 2 wird die Liste 5 der besten Treffer für diejenige Spracheingabe des Benutzers in 1e dargestellt, welche mittels der Spracherkennung zu dem Ergebnis ”Kirchweg” geführt hat. Der Benutzer ist nun in der Lage aus dieser Liste 5 der besten Treffer mit Hilfe der Wippe 2 denjenigen Treffer auszuwählen, welcher dem gewünschten Straßennamen entspricht. Anstelle eines Drückens auf die Wippe 2 hätte der Benutzer auch mittels einer Spracheingabe einen neuen Straßennamen eingeben können.
  • Nach erfolgter Korrektur (bei diesem Beispiel wird ”Kirchweg” durch ”Kunstweg” korrigiert) aktualisiert das Sprachdialogsystem die logisch abhängigen Schritte oder Sprachdialogelemente 13, 14 und selektiert das unterste Sprachdialogelement in der Liste 9.
  • Gemäß der vorliegenden Erfindung wird bei einer manuellen Aktivierung eines Sprachdialogelements 1315 eine damit verknüpfte Aktion ausgeführt. Dabei existieren folgende Möglichkeiten:
    • • Bei dem Sprachdialogelement handelt es sich um eine Frage 14. In diesem Fall wird als verknüpfte Aktion die entsprechende Frage nochmals wiederholt. Die ursprünglich darauf folgenden Antworten, Aktionen und Fragen werden gelöscht.
    • • Bei dem Sprachdialogelement handelt es sich um eine Angabe 15 über eine ausgeführte Aktion. In diesem Fall wird als verknüpfte Aktion die bereits ausgeführte Aktion nochmals ausgeführt, wobei die ursprünglich darauf folgenden Antworten und Aktionen erhalten bleiben.
    • • Bei dem Sprachdialogelement handelt es sich um eine von dem Benutzer per Spracheingabe eingegebene Bedieninformation 13. In diesem Fall wird als verknüpfte Aktion entweder die Liste der besten Treffer geöffnet oder der Benutzer kann eine neue Bedieninformation mittels Spracheingabe vornehmen. Wenn die Bedieninformation 13 durch den Benutzer verändert wurde, werden der folgende Teil des Sprachdialogs und die damit verbundenen Aktionen des Sprachdialogsystems der neuen Bedieninformation angepasst. Mit anderen Worten werden alle Sprachdialogelemente, welche logisch mit der geänderten Bedieninformation in Verbindung stehen, entsprechend der neuen Bedieninformation überarbeitet.
  • Um die jeweils verknüpfte Aktion durchführen zu können, benötigt das erfindungsgemäße Sprachdialogsystem bestimmte Zusatzdaten, wie es in der nachfolgenden Tabelle beschrieben ist.
    Typ des Sprachdialogelements Zusatzdaten
    Frage des Sprachdialogsystems Sprachdialogkontext, in welchem die Frage gestellt wurde: insbesondere Zielpplikation und bisher vorhandene Bedieninformationen)
    Angabe über ausgeführte Aktion Daten aus dem Sprachdialog, welche zur Spezifikation der ausgeführten Aktion notwendig sind (z. B. bei einer Aktivierung eines Navigationssystems die Zieladresse und bestimmte Routenoptionen)
    Bedieninformation Liste der besten Treffer bezüglich der mittels Spracheingabe eingegebenen Bedieninformation, vorherige Fragestellung des Sprachdialogsystems (d. h. Dialogkontext)
    Tabelle Zusatzdaten für jeweiligen Typ des Sprachdialogelements
  • Über den Sprachdialog können grundsätzlich alle Funktionen zur Bedienung eines Fahrzeugs adressiert werden. Dabei kann die interaktive Darstellung des Sprachdialogs als so genannte Chat-History in einem Gesamtsystem entweder als eine globale Instanz (beispielsweise parallel zu einem Hauptmenü) oder als eine Anwendung, welche innerhalb eines Hauptmenüs angesprochen werden kann (wie beispielsweise ein Navigationssystem), existieren.
  • Ein Drücken der PTT-Taste 1 kann dementsprechend wahlweise entweder
    • • das Sprachdialogsystem initiieren, ohne dass der Sprachdialog angezeigt wird, welcher separat von dem Benutzer aktiviert werden kann, oder
    • • das Sprachdialogsystem initiieren, wobei automatisch der Sprachdialog angezeigt wird.
  • In 2 ist schematisch ein erfindungsgemäßes Fahrzeug 10 mit einem erfindungsgemäßen Sprachdialogsystem 12 dargestellt. Das Sprachdialogsystem umfasst Steuermittel 11, eine Wippe 2, eine Anzeige 3, ein Mikrofon 6, einen Speicher 7 und einen Lautsprecher 8. Das Sprachdialogsystem 12 wird über die Steuermittel 11 gesteuert. Zur Bedienung des Fahrzeugs 10 werden einem Benutzer zu einer speziellen Bedienung des Fahrzeugs 10 gehörende Fragen mittels des Lautsprechers 8 gestellt. Abhängig von den auf die jeweilige Frage gegebenen Antworten ermitteln die Steuermittel 11 eine weitere Frage aus dem Speicher 7 oder starten ein bestimmtes Programm (z. B. ein Navigationssystem), wenn die über die Spracheingabe vorgegebenen Bedieninformationen zum Starten dieses Programms ausreichen.
  • 1
    PTT-Taste
    2
    Wippe
    3
    Anzeige
    4
    Drop-Down-Menue-Indikation
    5
    Liste bester Treffer
    6
    Mikrophon
    7
    Speicher
    8
    Lautsprecher
    9
    Liste der Sprachdialogelemente
    10
    Fahrzeug
    11
    Steuermittel
    12
    Sprachdialogsystem
    13
    Bedieninformation
    14
    Frage
    15
    Angabe über Aktion
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • - DE 102007037567 A1 [0002]
    • - DE 60309822 T2 [0003]

Claims (13)

  1. Verfahren zur Bedienung eines Fahrzeugs mittels eines automatisierten Sprachdialogs, wobei von einem Sprachdialogsystem (12) des Fahrzeugs (10) automatisiert mehrere Bedieninformationen (13) von einem Benutzer in Form einer logisch aufeinander aufbauenden Reihe von Sprachdialogelementen (1315) abgefragt werden, dadurch gekennzeichnet, dass eine Liste (9) mit den einzelnen Sprachdialogelementen (1315) auf einer Anzeige (3) dargestellt wird, und dass in der Liste (9) die einzelnen Sprachdialogelemente (1315) selektierbar sind, wobei eine einem in der Liste (9) selektierten Sprachdialogelement (1315) entsprechende Bedieninformation (13) korrigierbar oder wiederholbar ist.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Sprachdialogelemente (1315) chronologisch geordnet dargestellt werden.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass jedes der Sprachdialogelemente eine Ausgabe (14, 15) des Sprachdialogsystems (12) oder eine Bedieninformation (13) des Benutzers umfasst, und dass die Ausgabe des Sprachdialogsystems (12) eine Frage (14) an den Benutzer oder eine Angabe (15) über eine Aktion des Sprachdialogsystems (12) umfasst.
  4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die Ausgaben (14, 15) des Sprachdialogsystems (12) von den vorher eingegebenen Bedieninformationen (13) des Benutzers abhängen.
  5. Verfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, dass die Ausgaben (14, 15) und die Bedieninformationen (13) dialogartig geordnet derart dargestellt werden, • dass auf eine der Fragen (14) die zugehörige der Bedieninformationen (13) direkt folgt, und • dass die Ausgaben (14, 15) von den Bedieninformationen (13) unterscheidbar dargestellt werden.
  6. Verfahren nach einem der Ansprüche 3–5, dadurch gekennzeichnet, dass bei einer Selektion eines Sprachdialogelements (14), welches eine Frage (14) an den Benutzer umfasst, die entsprechende Frage (14) von dem Sprachdialogsystem (12) in akustischer Form wiederholt ausgegeben wird und alle auf diese Frage (14) folgenden Ausgaben (1415) und Bedieninformationen (13) gelöscht werden.
  7. Verfahren nach einem der Ansprüche 3–6, dadurch gekennzeichnet, dass bei einer Selektion eines Sprachdialogelements, welches eine Angabe einer Aktion des Sprachdialogsystems umfasst, die entsprechende Aktion von dem Sprachdialogsystem (12) nochmals ausgeführt wird.
  8. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die dem in der Liste (9) selektierten Sprachdialogelement entsprechende Bedieninformation (13) korrigierbar ist, • indem die Bedieninformation (13) nochmals über eine Spracheingabe eingegeben wird oder • indem eine Liste der besten Treffer (5) der Spracheingabe der entsprechenden zu korrigierenden Bedieninformation auf der Anzeige (3) dargestellt wird und in dieser Liste (5) einer der Treffer ausgewählt wird.
  9. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Bedieninformation (13) jeweils • entweder als ein Text dargestellt wird, welcher mittels einer Spracherkennung als bester Treffer ausgehend von der über die Spracheingabe eingegebenen Bedieninformation ermittelt wird, wenn ein Konfidenzmaß der Spracherkennung über einem Schwellenwert liegt, • oder als eine Liste von mehreren besten Treffern (5) jeweils als Text dargestellt wird, welche mittels der Spracherkennung ausgehend von der über die Spracheingabe eingegebenen Bedieninformation ermittelt werden, wenn das Konfidenzmaß der Spracherkennung nicht über dem Schwellenwert liegt, wobei der beste Treffer aus der Liste (5) von dem Benutzer ausgewählt und als ein Text dargestellt wird.
  10. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass auf der Anzeige (3) dargestellt wird, ob die Spracherkennung aktuell aktiv ist, um eine Bedieninformation (13) von dem Benutzer zu erfassen.
  11. Sprachdialogsystem für ein Fahrzeug, welches ein Mikrophon (6) und einen Lautsprecher (8) umfasst, wobei das Sprachdialogsystem (12) derart ausgestaltet ist, dass das Sprachdialogsystem (12) über das Mikrophon (6) und den Lautsprecher (8) mehrere Bedieninformationen (13) von einem Benutzer in Form einer logisch aufeinander aufbauenden Reihe von Sprachdialogelementen (1315) abfragt, dadurch gekennzeichnet, dass das Sprachdialogsystem (12) darüber hinaus eine Anzeige (3) umfasst, und dass das Sprachdialogsystem (12) derart ausgestaltet ist, dass das Sprachdialogsystem (12) eine Liste (9) mit den einzelnen Sprachdialogelementen (1315) auf der Anzeige (3) derart darstellt, dass in der Liste (9) die einzelnen Sprachdialogelemente (1315) selektierbar sind und dass eine einem in der Liste (9) selektierten Sprachdialogelement entsprechende Bedieninformation (13) korrigierbar oder wiederholbar ist.
  12. Sprachdialogsystem nach Anspruch 11, dadurch gekennzeichnet, dass das Sprachdialogsystem (12) zur Durchführung des Verfahrens nach einem der Ansprüche 1–10 ausgestaltet ist.
  13. Fahrzeug (10) mit einem Sprachdialogsystem (12) nach Anspruch 11 oder 12.
DE102009025530.3A 2009-06-19 2009-06-19 Verfahren zur Bedienung eines Fahrzeugs mittels eines automatisierten Sprachdialogs sowie entsprechend ausgestaltetes Sprachdialogsystem und Fahrzeug Active DE102009025530B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102009025530.3A DE102009025530B4 (de) 2009-06-19 2009-06-19 Verfahren zur Bedienung eines Fahrzeugs mittels eines automatisierten Sprachdialogs sowie entsprechend ausgestaltetes Sprachdialogsystem und Fahrzeug

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102009025530.3A DE102009025530B4 (de) 2009-06-19 2009-06-19 Verfahren zur Bedienung eines Fahrzeugs mittels eines automatisierten Sprachdialogs sowie entsprechend ausgestaltetes Sprachdialogsystem und Fahrzeug

Publications (2)

Publication Number Publication Date
DE102009025530A1 true DE102009025530A1 (de) 2010-12-23
DE102009025530B4 DE102009025530B4 (de) 2019-05-23

Family

ID=43122976

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102009025530.3A Active DE102009025530B4 (de) 2009-06-19 2009-06-19 Verfahren zur Bedienung eines Fahrzeugs mittels eines automatisierten Sprachdialogs sowie entsprechend ausgestaltetes Sprachdialogsystem und Fahrzeug

Country Status (1)

Country Link
DE (1) DE102009025530B4 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019025120A1 (de) 2017-08-01 2019-02-07 Audi Ag Verfahren zum ermitteln eines benutzerfeedbacks bei einer benutzung eines geräts durch einen benutzer sowie steuervorrichtung zum durchführen des verfahrens

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19533541C1 (de) * 1995-09-11 1997-03-27 Daimler Benz Aerospace Ag Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens
DE19709518C1 (de) * 1997-03-10 1998-03-05 Daimler Benz Aerospace Ag Verfahren und Vorrichtung zur Spracheingabe einer Zieladresse in ein Zielführungssystem im Echtzeitbetrieb
US20030117365A1 (en) * 2001-12-13 2003-06-26 Koninklijke Philips Electronics N.V. UI with graphics-assisted voice control system
DE69634474T2 (de) * 1996-01-31 2006-04-27 Nokia Corp. Interaktives Verfahren zur Sprachsteuerung zwischen einem Telefon und einem Benutzer
DE102004055230B3 (de) * 2004-11-16 2006-07-20 Siemens Ag Verfahren zur Spracherkennung aus einem vorgebbaren Vokabular
DE102005018174A1 (de) * 2005-04-19 2006-11-02 Daimlerchrysler Ag Verfahren zur gezielten Ermittlung eines vollständigen Eingabedatensatzes in einem Sprachdialog 11
DE60309822T2 (de) 2002-12-31 2007-10-11 Samsung Electro-Mechanics Co., Ltd., Suwon Verfahren und Vorrichtung zur Spracherkennung
DE102007037567A1 (de) 2007-08-09 2009-02-12 Volkswagen Ag Verfahren zur multimodalen Bedienung mindestens eines Gerätes in einem Kraftfahrzeug
DE102008008948A1 (de) * 2008-02-13 2009-08-20 Volkswagen Ag Systemarchitektur und Verfahren zur multimodalen Informationseingabe
DE102008027958A1 (de) * 2008-03-03 2009-10-08 Navigon Ag Verfahren zum Betrieb eines Navigationssystems

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19533541C1 (de) * 1995-09-11 1997-03-27 Daimler Benz Aerospace Ag Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens
DE69634474T2 (de) * 1996-01-31 2006-04-27 Nokia Corp. Interaktives Verfahren zur Sprachsteuerung zwischen einem Telefon und einem Benutzer
DE19709518C1 (de) * 1997-03-10 1998-03-05 Daimler Benz Aerospace Ag Verfahren und Vorrichtung zur Spracheingabe einer Zieladresse in ein Zielführungssystem im Echtzeitbetrieb
US20030117365A1 (en) * 2001-12-13 2003-06-26 Koninklijke Philips Electronics N.V. UI with graphics-assisted voice control system
DE60309822T2 (de) 2002-12-31 2007-10-11 Samsung Electro-Mechanics Co., Ltd., Suwon Verfahren und Vorrichtung zur Spracherkennung
DE102004055230B3 (de) * 2004-11-16 2006-07-20 Siemens Ag Verfahren zur Spracherkennung aus einem vorgebbaren Vokabular
DE102005018174A1 (de) * 2005-04-19 2006-11-02 Daimlerchrysler Ag Verfahren zur gezielten Ermittlung eines vollständigen Eingabedatensatzes in einem Sprachdialog 11
DE102007037567A1 (de) 2007-08-09 2009-02-12 Volkswagen Ag Verfahren zur multimodalen Bedienung mindestens eines Gerätes in einem Kraftfahrzeug
DE102008008948A1 (de) * 2008-02-13 2009-08-20 Volkswagen Ag Systemarchitektur und Verfahren zur multimodalen Informationseingabe
DE102008027958A1 (de) * 2008-03-03 2009-10-08 Navigon Ag Verfahren zum Betrieb eines Navigationssystems

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019025120A1 (de) 2017-08-01 2019-02-07 Audi Ag Verfahren zum ermitteln eines benutzerfeedbacks bei einer benutzung eines geräts durch einen benutzer sowie steuervorrichtung zum durchführen des verfahrens
DE102017213235A1 (de) 2017-08-01 2019-02-07 Audi Ag Verfahren zum Ermitteln eines Benutzerfeedbacks bei einer Benutzung eines Geräts durch einen Benutzer sowie Steuervorrichtung zum Durchführen des Verfahrens

Also Published As

Publication number Publication date
DE102009025530B4 (de) 2019-05-23

Similar Documents

Publication Publication Date Title
EP1927980B1 (de) Verfahren zur Klassifizierung der gesprochenen Sprache in Sprachdialogsystemen
DE69814589T2 (de) Spracherkennung unter verwendung mehrerer spracherkenner
DE69725091T2 (de) Verfahren und System zum Editieren von Sätzen während der kontinuierlichen Spracherkennung
EP3224830B1 (de) Kraftfahrzeug-gerätebedienung mit bedienkorrektur
DE112007002665B4 (de) Spracherkennungssystem
EP0994461A2 (de) Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äusserung
DE112015003382T5 (de) Spracherkennungseinrichtung und Spracherkennungsverfahren
DE102006036338A1 (de) Verfahren zum Erzeugen einer kontextbasierten Sprachdialogausgabe in einem Sprachdialogsystem
EP1739655A2 (de) Verfahren zur Ermittlung einer Hypothesenliste aus einem Vokabular eines Spracherkennungssystems
WO2018069027A1 (de) Multimodaler dialog in einem kraftfahrzeug
DE102007037567A1 (de) Verfahren zur multimodalen Bedienung mindestens eines Gerätes in einem Kraftfahrzeug
EP3152753B1 (de) Assistenzsystem, das mittels spracheingaben steuerbar ist, mit einer funktionseinrichtung und mehreren spracherkennungsmodulen
DE102018132160A1 (de) System und verfahren zum verstehen von standardsprache und dialekten
DE19532114C2 (de) Sprachdialog-System zur automatisierten Ausgabe von Informationen
DE102018215293A1 (de) Multimodale Kommunikation mit einem Fahrzeug
DE102009025530A1 (de) Verfahren zur Bedienung eines Fahrzeugs mittels eines automatisierten Sprachdialogs sowie entsprechend ausgestaltetes Sprachdialogsystem und Fahrzeug
DE102017211447B4 (de) Verfahren zum Auswählen eines Listeneintrags aus einer Auswahlliste einer Bedienvorrichtung mittels Sprachbedienung sowie Bedienvorrichtung
DE102007042583A1 (de) Verfahren zur Kommunikation zwischen einer natürlichen Person und einem künstlichen Sprachsystem sowie Kommunikationssystem
EP3115886B1 (de) Verfahren zum betreiben eines sprachsteuerungssystems und sprachsteuerungssystem
DE10129005B4 (de) Verfahren zur Spracherkennung und Spracherkennungssystem
EP3576084B1 (de) Effiziente dialoggestaltung
DE102006035780B4 (de) Verfahren zur Unterstützung des Bedieners eines Spracheingabesystems
DE102008025532B4 (de) Kommunikationssystem und Verfahren zum Durchführen einer Kommunikation zwischen einem Nutzer und einer Kommunikationseinrichtung
DE102008024257A1 (de) Verfahren zur Sprecheridentifikation bei einer Spracherkennung
DE102015007361B3 (de) Verfahren zum Betreiben wenigstens einer Funktionseinrichtung eines Kraftfahrzeugs

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R082 Change of representative
R020 Patent grant now final