-
Die Erfindung betrifft eine Dialogführungsvorrichtung für ein Fahrzeug, die einen Dialog zwischen Menschen und Maschine bereitstellt. Des Weiteren betrifft die Erfindung ein Fahrzeug mit einer derartigen Kommunikationsvorrichtung und ein System zur Verarbeitung eines Dialogs.
-
Es gibt zahlreiche Anwendungen, bei denen eine Kommunikation zwischen Mensch und Maschine über einen Dialog erfolgt. Dazu gehören beispielsweise Infotainment-Systeme in Fahrzeugen. Ein Infotainment-System kann eine Dialogführungsvorrichtung zum Erzeugen und Ausgeben eines Dialogs, der mit einem Fahrer geführt wird, umfassen. Der Dialog kann sprach- oder textgesteuert ablaufen. Beispielsweise erzeugt die Dialogführungsvorrichtung auf einem Bildschirm eine Meldung oder gibt ein Sprachsignal durch einen Lautsprecher aus. Der Fahrer seinerseits kann durch Antworten in ein Mikrofon oder durch Eingabe von Text mit dem Infotainment-System kommunizieren.
-
In Abhängigkeit von der zur Verfügung stehenden Rechnerhardware können die Dialogführungsvorrichtungen, die für einen Nutzer einen Sprachdialog bereitstellen, je nach Plattform, beispielsweise einer eingebetteten (embedded) Plattform oder einer Server gestützten Plattform, unterschiedlich komplexe Dialoge führen. Da ein Dialog, der auf einer Plattform begonnen wurde, üblicherweise auch komplett dort abgearbeitet wird, entscheidet letztendlich die Wahl der Ausführungsplattform über die Mächtigkeit beziehungsweise die Fähigkeiten des Dialogs.
-
Sollte das primär gewählte Dialogsystem, zum Beispiel ein im Fahrzeug eingebettetes System, nicht für den Dialog geeignet sein, so müssen vor Beginn des Dialogflusses der Kontext und bereits vorhandene Eingaben an eine alternative Plattform mit erweiterten Dialogfähigkeiten übergeben werden. Wenn sich erst im Laufe des Dialogs zwischen Mensch und Dialogführungsvorrichtung, beispielsweise durch komplexe oder unvorhergesehene Nutzereingaben oder sonstigen Ereignisse, herausstellt, dass das verwendete Dialogsystem nicht zum Führen des Dialogs geeignet ist, muss der Dialog abgebrochen und eventuell auf einer anderen Plattform wieder von neuem begonnen werden. Je nach Fähigkeit der Plattform kann innerhalb des Dialogs nicht mehr auf unerwartete beziehungsweise komplexe Eingaben des Nutzers reagiert werden und der Dialog führt entsprechend nicht zum gewünschten Ergebnis.
-
Es ist wünschenswert, eine Dialogführungsvorrichtung für ein Fahrzeug anzugeben, durch die es ermöglicht wird, einen Dialogablauf derart zu steuern, dass der Dialog auch bei zunehmender Komplexität nicht von der Dialogführungsvorrichtung abgebrochen werden muss, sondern zum gewünschten Ergebnis führt. Des Weiteren soll ein System zur Verarbeitung eines Dialogs angegeben werden, bei dem der Ablauf des Dialogs derart gesteuert wird, dass der Dialog auch bei zunehmender Komplexität nicht von einer der im System vorhandenen Dialogführungsvorrichtungen abgebrochen werden muss, sondern zum gewünschten Ergebnis führt.
-
Eine Ausführungsform einer derartigen Dialogführungsvorrichtung für ein Fahrzeug ist im Patentanspruch 1 angegeben. Weitere vorteilhafte Ausgestaltungsformen der Dialogführungsvorrichtung sind in den Unteransprüchen angegeben.
-
Gemäß einer möglichen Ausführungsform umfasst eine Dialogführungsvorrichtung für ein Fahrzeug eine Steuereinrichtung zur Steuerung eines Ablaufs des Dialogs, eine Speichereinrichtung zur Speicherung eines Programms mit Kommandos, die den Ablauf des Dialogs in der Dialogführungsvorrichtung definieren und eine Ausgabeeinrichtung zur Ausgabe des Dialogs. Die Steuereinrichtung ist dazu ausgebildet, wahlweise alle Kommandos des Programms selbst auszuführen oder mindestens einen Teil der Kommandos des Programms von einer weiteren Dialogführungsvorrichtung ausführen zu lassen. Die Steuereinrichtung ist dazu ausgebildet, den Dialog in Abhängigkeit von den von der Steuereinrichtung ausgeführten Kommandos und in Abhängigkeit von den von der weiteren Dialogführungsvorrichtung ausgeführten Kommandos auf der Ausgabeeinrichtung auszugeben.
-
Die weitere Dialogführungsvorrichtung kann entfernt zu der im Fahrzeug angeordneten Dialogführungsvorrichtung angeordnet sein. Sie kann sich beispielsweise in einer Zentrale oder einem Backend eines Fahrzeugherstellers des Fahrzeugs oder einer Dienstanbieters befinden. Die lokal im Fahrzeug vorgesehene Dialogführungsvorrichtung und die externe Dialogführungsvorrichtung können Daten über eine Funkschnittstelle austauschen.
-
Eine Ausführungsform eines Systems zum Verarbeiten eines Dialogs umfasst die für das Fahrzeug vorgesehene lokale Dialogführungsvorrichtung nach der oben angegebenen Ausführungsform und die weitere dazu extern angeordnete Dialogführungsvorrichtung. Die weitere Dialogführungsvorrichtung umfasst eine Steuereinrichtung, die dazu ausgebildet ist, den ihr übertragenen mindestens einen Teil der Kommandos des Programms auszuführen und in Abhängigkeit von den ausgeführten Kommandos Daten für den Dialog zu erzeugen und die Daten an die Dialogführungsvorrichtung im Fahrzeug zu übertragen. Die Steuereinrichtung der lokalen Dialogführungsvorrichtung ist dazu ausgebildet, in Abhängigkeit von den übertragenen Daten den Dialog auf der Ausgabeeinrichtung im Fahrzeug auszugeben.
-
Die Dialogführungsvorrichtung für das Fahrzeug erlaubt eine Hybridisierung des oben angegebenen Systems zum Verarbeiten eines Dialogs mit der Möglichkeit einen Sub-Dialog einschließlich dem internen Zustand des bisher von der Dialogführungsvorrichtung im Fahrzeug selbst geführten Dialogs und dem entsprechenden Kontext an die weitere, entfernte Dialogführungsvorrichtung zu transferieren. Die weitere, entfernte Dialogführungsvorrichtung, die beispielsweise in einer Zentrale beziehungsweise einem Backend eines Fahrzeugherstellers, lokalisiert ist, hat oftmals Zugriff auf einen erweiterten Speicher und auf mehr Rechenleistung als die lokale Dialogführungsvorrichtung in dem Fahrzeug. Durch die Übergabe eines bereits begonnenen Dialogs an die weitere Dialogführungsvorrichtung wird eine entfernte Nutzung von Ressourcen zwischen assoziierten Dialogsystemen ermöglicht. Insbesondere kann dadurch die Nutzung einer leistungsstärkeren CPU und eines größeren beziehungsweise schnelleren Speichers sowie die Nutzung von besseren Ein-/Ausgabegeräten, von Logik-Anteilen, beispielsweise von Sprachanalyse- und Sprachsynthese-Komponenten/Algorithmen, oder einer größeren Datenbasis ermöglicht werden.
-
Im Falle einer Dialogführung mit Sprachein- und -ausgabe können in der weiteren Dialogführungsvorrichtung beispielsweise mehrere Spracherkennungskomponenten mit unterschiedlichen Eignungen/Qualitäten für verschiedenste Anwendungen vorhanden sein. Die Steuereinrichtung der weiteren Dialogführungsvorrichtung kann je nach Anwendungsfall in Abhängigkeit von der Eignung beziehungsweise Qualität der Software für die Spracherkennung zwischen verschiedenen Algorithmen dynamisch wechseln. Dadurch kann in vielen Fällen, in denen ein Spracherkennungssystem im Fahrzeug aufgrund der geringeren Ressourcen keine Spracherkennung mehr ermöglicht, eine Nutzerintention zuverlässig und mit hoher Qualität erkannt werden.
-
Ein auf einer Plattform, beispielsweise der lokalen Dialogführungsvorrichtung, bereits begonnener Dialog kann auf einer alternativen Plattform, beispielweise der weiteren, externen Dialogführungsvorrichtung weiter verarbeitet werden. Der gesamte Dialog kann in mehrere Teildialoge umfassen, die jeweils durch Kommandos eines Programms einer Dialogsprache definiert sind. Eine Möglichkeit besteht darin, denjenigen Programmteil, der den auszulagernden Teildialog definiert, von der lokalen Dialogführungsvorrichtung im Fahrzeug an die entfernte Dialogführungsvorrichtung zur weiteren Ausführung zu übertragen. Wenn das Programm, das den auszulagernden Teildialog definiert, bereits in der externen Dialogführungsvorrichtung vorhanden ist, besteht eine weitere Möglichkeit um den Teildialogs in die entfernte Dialogführungsvorrichtung auslagern, darin, dass die lokale Dialogführungsvorrichtung auf den Teildialog in der entfernten Dialogführungsvorrichtung referenziert. Es braucht somit nicht das Dialogprogramm, das den auszulagernden Teildialog definiert, an die entfernte Dialogfürhungsvorrichtung übertragen zu werden.
-
Die entfernte Dialogführungsvorrichtung kann zusätzliche Ressourcen zur Erfüllung der Nutzerintention bereitstellen. Die weitere Dialogführungsvorrichtung kann auch weitere Ressourcen bei der Dialogführungsvorrichtung, die den Dialog begonnen hat, anfordern. Des Weiteren kann der ausgelagerte Teildialog beziehungsweise die weiteren während des Ablaufs des ausgelagerten Teildialogs gesammelten Daten wieder an die lokale Dialogführungsvorrichtung im Fahrzeug zurück transferiert werden. Dadurch wird die Abbildung komplexer Nutzerinteraktionen unter Verwendung der jeweils geeigneten Plattform ermöglicht. Letztendlich kann durch die erweiterten Fähigkeiten des Gesamtsystems eine große Anzahl von Anwendungsfällen über Sprachbedienung abgebildet werden.
-
Die Erfindung wird im Folgenden anhand von Figuren, die Ausführungsbeispiele der vorliegenden Erfindung zeigen, näher erläutert. Es zeigen:
-
1 eine Ausführungsform einer Dialogführungsvorrichtung in einem Fahrzeug,
-
2 ein System mit jeweils einer Dialogführungsvorrichtung in einem Fahrzeug und einer Zentrale,
-
3 eine Ausführungsform eines Systems zur Verarbeitung eines Dialogs,
-
4 ein Ausführungsbeispiel einer Verarbeitung eines Dialogs zwischen verschiedenen Dialogführungsvorrichtungen.
-
1 zeigt das Innere eines Fahrzeugs 1 mit einer als Infotainment-System ausgebildeten Dialogführungsvorrichtung 10. Die Dialogführungsvorrichtung 10 ist zur Verarbeitung eines Dialogs mit einem Fahrzeuginsassen ausgebildet. Sie umfasst eine Steuereinrichtung 110 zur Steuerung eines Ablaufs des Dialogs. Der Dialog ist in Form eines Programms mit Kommandos, die den Ablauf des Dialogs in der Dialogführungsvorrichtung 10 definieren, in einer Speichereinrichtung 120 der Dialogführungsvorrichtung 10 gespeichert. Die Dialogführungsvorrichtung 10 umfasst des Weiteren eine Ausgabeeinrichtung 130 zur Ausgabe des Dialogs. Die Ausgabeeinrichtung 130 kann einen Bildschirm 131 zur Ausgabe von Meldungen in Form von Text und einen Lautsprecher 132 zur Ausgabe von Meldungen in Form von Sprache umfassen. Des Weiteren kann die Dialogführungsvorrichtung 10 eine Eingabeeinrichtung 150 zum Eingeben von Daten in den Dialog aufweisen. Zur Eingabe von Sprachdaten kann der Nutzer der Dialogführungsvorrichtung beispielsweise einen Schalter 170 betätigen und in eine Eingabeeinrichtung 150, beispielsweise ein Mikrofon, sprechen. Weitere Komponenten der Dialogführungsvorrichtung 10 werden weiter unten anhand von 3 näher erläutert.
-
2 zeigt ein Fahrzeug 1 mit einer Dialogführungsvorrichtung 10 und einer Sende-/Empfangsvorrichtung 11. Die Dialogführungsvorrichtung 10 ist dazu ausgebildet, den Dialog in Abhängigkeit von den in der Speichereinrichtung 120 gespeicherten Kommandos selbst auszuführen oder einen Teil des Dialogs an eine entfernte Dialogführungsvorrichtung zu übertragen und von der entfernten Dialogführungsvorrichtung ausführen zu lassen. Im Ausführungsbeispiel der 2 befindet sich eine entfernte Dialogführungsvorrichtung 20 in einer Zentrale 2, beispielsweise einem Backend, des Fahrzeugherstellers. Die Dialogführungsvorrichtung 10 im Fahrzeug 1 ist dazu ausgebildet, einen Teildialog eines bereits begonnenen Dialogs zur weiteren Verarbeitung in die Dialogführungsvorrichtung 20 auszulagern.
-
Dies bedeutet beispielsweise, dass ein erster Teil des Dialogs in Abhängigkeit von dem Programm, das in der Speichereinrichtung 120 gespeichert ist, von der Steuereinrichtung 110 der Dialogführungsvorrichtung 10 lokal im Fahrzeug ausgeführt wird. Danach kann ein sich an den ersten Teil des Dialogs anschließender zweiter Teildialog an die Dialogführungsvorrichtung 20 übertragen werden. Dazu kann derjenige Teil des Programms, der den zweiten Teildialog definiert, mittels der Sende-/Empfangsvorrichtung 11 an die Zentrale 2 über einen Kommunikationskanal, beispielsweise über ein Hypertext Transfer Protokoll (http), übertragen werden. Die entfernte Dialogführungsvorrichtung 20 kann anhand der ihr übertragenen Kommandos des Programms den zweiten Teil des Dialogs ausführen.
-
Alternativ dazu können in der Zentrale 2 eine Vielzahl von Dialogprogrammen, die den Ablauf eines Dialoges definieren, gespeichert sein. Zur Ausführung des zweiten Teildialogs durch die Dialogführungsvorrichtung 20 überträgt die Dialogführungsvorrichtung 10 beispielsweise den Namen eines der Dialogprogramme, die in der Zentrale 2 gespeichert sind, mittels der Sende-/Empfangseinrichtung 11 an die Dialogführungsvorrichtung 20. Die Dialogführungsvorrichtung 20 ruft das ausgewählte Dialogprogramm, das den ausgelagerten zweiten Teildialog definiert, auf und führt den zweiten Teildialog aus.
-
Daten, die beim Verarbeiten des zweiten Teildialogs von der Dialogführungsvorrichtung 20 erzeugt werden, können beispielsweise über eine Funkübertragungsstrecke zu der Sende-/Empfangsvorrichtung 11 im Fahrzeug und von dort an die lokale Dialogführungsvorrichtung 10 zurück übertragen werden. Die entfernte Dialogführungsvorrichtung 20 kann die Daten beispielsweise in Form von Sprach-/Textdateien erzeugen und die Sprach-/Textdateien zur Ausgabe auf der Ausgabeeinrichtung 130 an die Dialogführungsvorrichtung 10 des Fahrzeugs übertragen.
-
Nach der Beendigung des zweiten Teildialogs erzeugt die Dialogführungsvorrichtung 20 ein Steuersignal, dass die Beendigung des zweiten Teildialogs anzeigt. Das Steuersignal wird von der Zentrale 2 an die Sende-/Empfangseinrichtung 11 des Fahrzeugs übertragen. Die Sende-/Empfangseinrichtung 11 übermittelt das Steuersignal an die Dialogführungsvorrichtung 10, die die Beendigung des zweiten Teildialogs durch die entfernte Dialogführungsvorrichtung 20 erkennt. Falls das in der Speichereinrichtung 110 gespeicherte Programm Kommandos, die zu einem dritten Teil des Dialogs gehören, enthält und dieser dritte Teildialog wieder von der Dialogführungsvorrichtung 10 ausgeführt werden soll, setzt die Dialogführungsvorrichtung 10 den Dialog fort.
-
Indem von der lokalen Dialogführungsvorrichtung 10 im Fahrzeug ein Dialog gestartet wird und dieser zu einem bestimmten Zeitpunkt an das entfernte Dialogführungssystem 20 übertragen wird und dort weiterverarbeitet wird, kann die Dialogführungsvorrichtung 10 im Fahrzeug entlastet werden. Die Dialogführungsvorrichtung 10 wartet lediglich auf die Beendigung des übertragen Dialogs, um eventuelle Rückgabeparameter, die bei der Verarbeitung des zweiten Teildialogs von der Dialogführungsvorrichtung 20 erzeugt worden sind und bei Beendigung des zweiten Teildialogs an die Dialogführungsvorrichtung 10 übertragen worden sind, weiter zu verarbeiten. Zusätzlich dient die Dialogführungsvorrichtung im Fahrzeug auch dazu zwischenzeitlich von der entfernten Dialogführungsvorrichtung visuelle und akustische Ausgaben über Bildschirm oder Lautsprecher vorzunehmen und mithilfe des Mikrofons die weiteren Äußerungen des Nutzers aufzuzeichnen und diese anschließend an die entfernte Dialogführungsvorrichtung weiterzuleiten.
-
3 zeigt eine Ausführungsform eines Systems zur Verarbeitung eines Dialogs. Dargestellt ist die lokale Dialogführungsvorrichtung 10 des Fahrzeugs 1 und die entfernte Dialogführungsvorrichtung 20, die beispielsweise zur Infrastruktur des Fahrzeugherstellers des Fahrzeugs 1 gehören kann.
-
Die Dialogführungsvorrichtung 10 umfasst die Steuereinrichtung 110 zur Steuerung des Ablaufs des Dialogs mit einem Fahrzeuginsassen, beispielsweise dem Fahrer. Die Dialogführungsvorrichtung 10 umfasst des Weiteren die Speichereinrichtung 120 zur Speicherung eines Programms 121 mit Kommandos, die einen Ablauf des Dialogs definieren. Zur Beschreibung des Dialogablaufes kann das Dialogprogramm 121 Kommandos einer Dialogbeschreibungssprache, beispielsweise Kommandos in der Dialogbeschreibungssprache VoiceXML, enthalten. Des Weiteren umfasst die Dialogführungsvorrichtung 10 die Ausgabeeinrichtung 130 zur Ausgabe des Dialogs. Die Ausgabeeinrichtung 130 kann beispielsweise einen Monitor 131 zur Ausgabe von Zeichen, Wörtern und Texten und einen Lautsprecher 132 zur Ausgabe von Tonsignalen, beispielsweise von Sprache, aufweisen. Zur Eingabe von Daten durch einen Dialogpartner, beispielsweise den Fahrer, ist eine Eingabeeinrichtung 150 vorgesehen. Die Eingabeeinrichtung 150 kann beispielsweise ein Mikrofon oder eine Einheit zur Eingabe von Zeichen umfassen.
-
Die Dialogführungsvorrichtung 10 weist weiterhin eine Speichereinrichtung 160 zur Speicherung von Software auf. In der Speichereinrichtung 160 kann beispielsweise ein Programm zur automatischen Spracherkennung 161 gespeichert sein. Die automatische Spracherkennung ist dazu ausgebildet, ein kontinuierliches Sprachsignal zu analysieren und in diskrete Wortketten zu transformieren. Des Weiteren kann in der Speichereinrichtung 160 ein Programm 162 zur Sprachsynthese gespeichert sein. Das Sprachsynthese-Programm wandelt orthografischen Text in Sprachsignale um. Darüber hinaus umfasst die Dialogführungsvorrichtung 10 eine Schnittstelleneinrichtung 140 zur Kopplung der Dialogführungsvorrichtung 10 mit der entfernten Dialogführungsvorrichtung 20. Die Schnittstelleneinrichtung 140 ist insbesondere derart ausgebildet, dass sie einen Teil der Kommandos des Dialogprogramms zur Ausführung durch die entfernte Dialogführungsvorrichtung 20 an diese überträgt.
-
Die entfernte Dialogführungsvorrichtung 20 umfasst eine Steuereinrichtung 210 und eine Schnittstelleneinrichtung 220. Über die Schnittstelleneinrichtung 220 kann die Dialogführungsvorrichtung 20 mit der Dialogführungsvorrichtung 10 zum Austausch von Daten gekoppelt werden. Die Dialogführungsvorrichtung 20 umfasst des Weiteren eine Speichereinrichtung 230 zur Speicherung eines weiteren Dialogprogramms mit weiteren Kommandos, die einen Ablauf des Dialogs definieren. In der Speichereinrichtung 230 können somit ähnlich zur Speichereinrichtung 120 der Dialogführungsvorrichtung 10 Kommandos einer Dialogsprache, beispielsweise der Dialogsprache VoiceXML, gespeichert sein. Das in der Speichereinrichtung 230 gespeicherte Programm kann einen kompletten Dialog oder einen Teildialog definieren.
-
Wenn die Steuereinrichtung 110 einen Dialog zur weiteren Verarbeitung durch die Steuereinrichtung 210 ausgelagert, kann die Steuereinrichtung 110 einen kompletten Dialog oder einen Teildialog mit seinen bisher erbrachten kontextuellen Parametern zur weiteren Verarbeitung durch die Steuereinrichtung 210 an die Dialogführungsvorrichtung 20 übertragen. Des Weiteren besteht die Möglichkeit, dass die Steuereinrichtung 110 auf einen Gesamt- oder Teildialog referenziert, der in der Speichereinrichtung 230 gespeichert ist. In diesem Fall führt die Steuereinrichtung 210 den in der Speichereinrichtung 230 gespeicherte Dialog aus und überträgt die Daten des Dialogs zur Ausgabe an die lokale Dialogführungsvorrichtung 10.
-
Die Dialogführungsvorrichtung 20 umfasst weiter eine Speichereinrichtung 240 zur Speicherung mindestens einer Software 241 zur automatischen Spracherkennung, das heißt zur Umwandlung von Sprache in Text, und/oder zur Speicherung mindestens einer Software 242 zur Sprachsynthese, das heißt zur Umwandlung von Text in Sprache. Vorzugsweise sind in der Speichereinrichtung 240 mehrere Software-Programme mit unterschiedlichen Algorithmen zur automatischen Spracherkennung und zur Sprachsynthese gespeichert. Die Software-Programme können beispielsweise von verschiedenen Herstellern stammen. Die Software-Programme der verschiedenen Hersteller weisen unterschiedliche Qualitäten auf. Beispielsweise ist die Software eines Herstellers besonders gut zur Freitext-Umwandlung in adäquate Sprache und eine andere Software besonders gut zur Umwandlung von Navigationszielen in Sprache geeignet. Die Steuereinrichtung 210 ist dazu ausgebildet, in Abhängigkeit von dem auszuführenden Dialog aus der Vielzahl der Software-Programme zur Umwandlung von Text in Sprache und/oder Sprache in Text eines der Software-Programme auszuwählen. Somit lässt sich in dem ausgelagerten Dialog diejenige Softwarekomponente auswählen die für die vorgegebene Anwendung am geeignetsten erscheint.
-
Gemäß einer weiteren Ausführungsform kann die Steuereinrichtung 210 über eine weitere Schnittstelleneinrichtung 250 mit einer externen Einrichtung 3 zum Bereistellen von unterschiedlichen Algorithmen zur Sprachanalyse beziehungsweise Sprachsynthese kommunizieren. Die externe Einrichtung 3 kann ein Dienstleister sein, der über eine Vielzahl von Algorithmen zur Umwandlung von Text in Sprache und/oder Sprache in Text, die jeweils unterschiedliche Qualitäten aufweisen, verfügt. Die Steuereinrichtung 210 kann von dem externen Dienstleister 3 einen geeigneten Algorithmus über die Schnittstelleneinrichtung 250 beziehen oder Daten zur Umwandlung von Text in Sprache und/oder Sprache in Text an die externe Einrichtung übertragen.
-
Zum Führen eines Dialogs in einem Fahrzeug zwischen der Dialogführungsvorrichtung 10 und einem Fahrer liest die Steuereinrichtung 110 die Kommandos des Programms 121 aus der Speichereinrichtung 120 ein und arbeitet diese entsprechend ab. In dem Programm kann definiert sein, dass der komplette Dialog von der lokalen Dialogführungsvorrichtung 10 geführt wird. Des Weiteren kann in dem Dialogprogramm 121 definiert sein, dass der gesamte Dialog oder mindestens ein Teil des Dialogs von der entfernten Dialogführungsvorrichtung 20 verarbeitet wird. Das Programm enthält dazu beispielsweise ein Kommando, das der Steuereinrichtung 110 anzeigt, dass der komplette Dialog oder ein Teildialog von der entfernten Dialogführungsvorrichtung 20 verarbeitet werden soll.
-
Wenn der gesamte Dialog oder zumindest ein Teil des Dialogs von der Dialogführungsvorrichtung 10 verarbeitet wird, werden im Falle einer Sprachausgabe durch Verwendung der Sprachsynthese-Software 162 von der Steuereinrichtung 110 Sprachsignale erzeugt, die an einen Lautsprechereinheit 132 zur Wiedergabe der Sprache übertragen werden. Spracheingaben des Dialogpartners der Dialogführungsvorrichtung 10 werden nach Betätigung des Schalters 170 über das Mikrofon 150 in das Dialogsystem 10 eingegeben.
-
Wenn nach Verarbeitung eines ersten Teildialogs durch die Steuereinrichtung 110 ein zweiter Teildialog zur weiteren Verarbeitung an die entfernte Dialogführungsvorrichtung 20 ausgelagert wird, kann der den zweiten Teildialog definierende Programmteil des Programms 121 über die Schnittstelleneinrichtung 140 an die Schnittstelleneinrichtung 220 der Dialogführungsvorrichtung 20 transferiert werden. Der zweite Teildialog wird dann von der Steuereinrichtung 210 verarbeitet.
-
Alternativ dazu kann der von der Dialogführungsvorrichtung 20 abzuarbeitende zweite Teildialog bereits in der Speichereinrichtung 230 gespeichert sein. In diesem Fall ist es nicht erforderlich, dass die Dialogführungsvorrichtung 10 das gesamte Programm betreffend den zweiten Teildialog an die Dialogführungsvorrichtung 20 überträgt, sondern die Dialogführungsvorrichtung 10 referenziert auf ein in der Speichereinrichtung 230 des Dialogsystems 20 gespeichertes Programm, das den zweiten Teildialog definiert und kann trotz der Referenzierung auch bereits erarbeitete Parameter für den Teildialog mitsenden.
-
Wenn der komplette Dialog von dem entfernten Dialogsystem 20 gesteuert werden soll, kann ebenfalls entweder das gesamte zugehörige Dialogprogramm 121 mit den Kommandos, die den Dialogablauf definieren, an das Dialogsystem 20 übertragen werden. Falls der Dialog bereits in der Speichereinrichtung 230 gespeichert ist, kann die Dialogführungsvorrichtung 10 lediglich auf den Dialog in der Speichereinrichtung 230 verweisen, der dann von der Steuereinrichtung 210 abgearbeitet wird.
-
Wenn beim Verarbeiten der Befehle des Programms betreffend den Dialog/Teildialog durch die Dialogführungsvorrichtung 20 Textdateien aus Sprachdaten zu erzeugen sind, verwendet die Steuereinrichtung 210 eine geeignete Spracherkennungssoftware 241. Wenn während des Dialogs/Teildialogs aus Textdaten Sprachdateien zu erzeugen sind, verwendet die Steuereinrichtung 210 eines der Software-Programme 242 zur Sprachsynthese. Diese Spracherkennungs- und Sprachsynthesesoftware kann sowohl im Onboard beziehungsweise im Fahrzeug als auch im Offboard beziehungsweise bei dem entfernten Server der Dialogführungsvorrichtung 20 genutzt werden. Dies kann die entfernte Dialogführungsvorrichtung entscheiden.
-
Text- und/oder Sprachdateien, die bei der Verarbeitung des Dialogs/Teildialogs in der Dialogführungsvorrichtung 20 erzeugt werden, werden über die Schnittstelleneinrichtung 220 zurück zur Schnittstelleneinrichtung 140 übertragen. In der Dialogführungsvorrichtung 10 werden die in der entfernten Dialogführungsvorrichtung 20 erzeugten Daten an die Ausgabeeinrichtung 130 zur Ausgabe von Systemäußerungen oder visuellen Änderungen auf HMI (Human Maschine Interface) 130, 150 übertragen.
-
Wenn der von der Dialogführungsvorrichtung 20 abzuarbeitende Dialogteil beendet ist, wird von der Steuereinrichtung 210 ein Steuersignal, dass das Ende des Dialogs/Teildialogs kennzeichnet, erzeugt und an die Dialogführungsvorrichtung 10 im Fahrzeug übertragen. Zusätzlich werden am Ende des entfernten Dialogs noch Parameter/Kontextwissen zurück an den Dialog im Fahrzeug übermittelt. Wenn in der Speichereinrichtung 120 kein weiterer Teildialog mehr gespeichert ist, ist der Dialog beendet und die von dem Dialogpartner der Dialogführungsvorrichtung 10 während des gesamten Dialogs eingegebenen Daten können von der Steuereinrichtung 110 an eine Datenverarbeitungseinheit, beispielsweise eine Navigationseinheit, zur weiteren Prozessierung übergeben werden.
-
Wenn hingegen das in der Speichereinrichtung 120 gespeicherte Programm noch einen dritten Dialogteil definiert, der von der Dialogführungsvorrichtung 10 zu verarbeiten ist, setzt die Dialogführungsvorrichtung 10, die Verarbeitung des Dialogs durch Abarbeiten des dritten Teildialogs fort.
-
4 zeigt ein Ausführungsbeispiel einer Verarbeitung eines Dialogs von dem lokalen Dialogsystem 10 im Fahrzeug 1 und einem entfernten Dialogsystem 20, beispielsweise in der Zentrale 2 des Fahrzeugsherstellers. Der Dialogablauf wird am Beispiel eines Navigationsdialogs mit Übergabe des Parameters für ein Zwischenziel beschrieben. Der gesamte Dialog umfasst einen ersten, zweiten und dritten Teildialog. Nach Verarbeitung von Kommandos, die den ersten Teildialog definieren, durch die Dialogführungsvorrichtung 10 wird zur Verarbeitung des zweiten Teildialogs die Dialogführungsvorrichtung 20 als ”Cloud” verwendet. Der zweite Teildialog wird zur Verarbeitung von der Dialogführungsvorrichtung 10 auf die entfernte Dialogführungsvorrichtung 20 ausgelagert. Nach Abarbeiten des zweiten Teildialogs durch die Dialogführungsvorrichtung 20 setzt die Kommunikationsvorrichtung den Dialog durch Verarbeiten des dritten Teildialogs fort bis der gesamte Dialog beendet ist.
-
Zum Aktivieren des Mikrofons für Spracheingaben kann der Fahrer den Schalter 170 einmalig betätigen. Zunächst wird der Dialog in einem Schritt A anhand der Kommandos des in der Speichereinrichtung 120 gespeicherten Programms 121 von der Dialogführungsvorrichtung 10 gesteuert. In diesem ersten Dialogteil erfragt das Dialogsystem 10 beispielsweise ein Navigationsziel von dem Fahrer. Die Ausgabe der entsprechenden Fragen an den Fahrer kann beispielsweise sprachgesteuert mittels der Sprachsynthese-Software 162 erfolgen. Entsprechende Eingaben des Dialogpartners, beispielsweise des Fahrers, erfolgen durch Sprechen in das Mikrofon 150. Die Sprachdaten werden zur weiteren Verarbeitung durch die Steuereinrichtung 110 von der Spracherkennungs-Software 161 in Textdaten umgewandelt.
-
Nachdem im ersten Dialogteil beispielsweise ein Ort, eine Straße und eine Hausnummer von dem Dialogsystem 10 erfragt worden sind, erhält die Steuereinrichtung 110 durch ein Kommando im Programm 121 den Befehl den weiteren Dialog an das entfernte Dialogsystem 20 auszulagern. In diesem zweiten Teildialog wird der Dialogpartner beispielsweise danach gefragt, ob er ein Zwischenziel in die Navigationsroute einfügen möchte. In einem Schritt B kann ein Teil des Programms 121, das den zweiten Teildialog definiert, an die Schnittstelleneinrichtung 140 übergeben werden. In einem Schritt C wird dieser Programmteil an die Schnittstelleneinrichtung 220 übertragen. Alternativ kann die Dialogführungsvorrichtung 10 lediglich auf ein Programm, das in der Speichereinrichtung 230 im entfernten Dialogsystem 20 gespeichert ist, referenzieren, indem beispielsweise im Schritt B ein Einsprungpunkt in das Programm oder der Programmname des auszuführenden Programms an die Schnittstelleneinrichtung 140 übergeben und in dem Schritt C an die Schnittstelleneinrichtung 220 übertragen wird.
-
Im Schritt D wird das Programm betreffend den zweiten Teildialog oder der Name des Programms, das den zweiten Teildialog definiert und in der Speichereinrichtung 230 gespeichert ist, an die Steuereinrichtung 210 übergeben. Im Schritt E wird der zweite Teildialog anhand des Programms von der Steuereinrichtung 210 verarbeitet. Im Schritt F wählt die Steuereinrichtung 210 beispielsweise eine geeignete Software 241 zur Umwandlung von Text in eine Sprachdatei aus und erzeugt eine Audio-Datei. Die Audio-Datei wird im Schritt G an die Schnittstelleneinrichtung 220 und im Schritt H von der Dialogführungsvorrichtung 20 an die Schnittstelleneinrichtung 140 der Dialogführungsvorrichtung 10 übertragen. Im Schritt I wird die Audio-Datei vom Dialogsystem 10 direkt an die Ausgabeeinrichtung 130 weitergeleitet und abgespielt. Beispielsweise wird der Fahrer gefragt, ob er die Eingabe eines Zwischenziels wünscht.
-
Im Schritt J erfolgt eine Spracheingabe des Fahrers. Im Ausführungsbeispiel wird angenommen, dass der Fahrer die Eingabe eines Zwischenziels ablehnt. Die Spracheingabe des Fahrers wird im Schritt J in eine Audio-Datei umgewandelt und zum Versenden an die Schnittstelleneinrichtung 140 übergeben. Im Schritt K wird die Audio-Datei an die Schnittstelleneinrichtung 220 transferiert. Der Transfer kann über eine zwischen der Dialogführungsvorrichtung 10 und der Dialogführungsvorrichtung 20 existierende Funkverbindung erfolgen. Zur weiteren Verarbeitung der Eingabe des Fahrers wählt die Steuereinrichtung 210 im Schritt L eine geeignete Software 242 zur Spracherkennung aus, die die Audio-Daten in Textdaten wandelt. Im Schritt M werden die Textdaten an die Steuereinrichtung 210 übergeben und von dieser im Schritt N analysiert.
-
Nachdem die Steuereinrichtung 210 erkannt hat, dass die Eingabe eines Zwischenziels nicht gewünscht ist, kann der zweite Teildialog beendet und die weitere Steuerung des Dialogs wieder an die Dialogführungsvorrichtung 10 übergeben werden. Im Schritt O wird von der Steuereinrichtung 210 ein Steuersignal erzeugt, das die Beendigung des zweiten Teildialogs durch die Dialogführungsvorrichtung 20 anzeigt. Das Steuersignal wird in dem Schritt O von der Steuereinrichtung 210 an die Schnittstelleneinrichtung 220 übergeben und im Schritt P an die Schnittstelleneinrichtung 140 übertragen. Im Schritt Q wird das empfangene Steuersignal zur Auswertung an die Steuereinrichtung 110 übergeben.
-
Nachdem die Steuereinrichtung 110 durch Auswertung des Steuersignals erkannt hat, dass der zweite Teildialog beendet ist, werden die in der Speichereinrichtung 120 enthaltenen Kommandos, die den dritten Teildialog definieren, von der Steuereinrichtung 110 weiter abgearbeitet. Die Weiterverarbeitung des Dialogs durch Abarbeiten der Kommandos, die den dritten Teildialog definieren, wird nun im Schritt R wieder weiter durch die Dialogführungsvorrichtung 10 fortgesetzt.
-
Bezugszeichenliste
-
- 1
- Fahrzeug
- 2
- Zentrale
- 10
- lokale Dialogführungsvorrichtung
- 20
- entfernte Dialogführungsvorrichtung
- 110
- Steuereinrichtung
- 120
- Speichereinrichtung für Dialogprogramm
- 130
- Ausgabeeinrichtung
- 140
- Schnittstelleneinrichtung
- 150
- Eingabeeinrichtung
- 160
- Speichereinrichtung für Software zur Spracherkennung/Sprachsynthese
- 170
- Schalter
- 210
- Steuereinrichtung
- 220
- Schnittstelleneinrichtung
- 230
- Speichereinrichtung für Dialogprogramm
- 240
- Speichereinrichtung für Software zur Spracherkennung/Sprachsynthese