DE10338512A1

DE10338512A1 - Unterstützungsverfahren für Sprachdialoge zur Bedienung von Kraftfahrzeugfunktionen

Info

Publication number: DE10338512A1
Application number: DE10338512A
Authority: DE
Inventors: Matthias Dipl.-Inf. Hammler; Florian Dipl.-Phys. Hanisch; Steffen Dr. Klein; Hans Josef Dr.-Phil. Küting; Roland Dipl.-Ing. Stiegler
Original assignee: DaimlerChrysler AG
Current assignee: Mercedes Benz Group AG
Priority date: 2003-08-22
Filing date: 2003-08-22
Publication date: 2005-03-17
Also published as: US20070073543A1; JP2007503599A; WO2005022511A1

Abstract

Die Erfindung betrifft ein Unterstützungsverfahren für Sprachdialoge zur Bedienung von Kraftfahrzeugfunktionen mittels eines Sprachdialogsystems für Kraftfahrzeuge, bei dem zusätzlich zur Sprachausgabe ein nicht-sprachliches Signal ausgegeben wird. DOLLAR A Sprachdialogsysteme bilden eine Schnittstelle zur Kommunikation von Mensch und Maschine, wobei im Vergleich zur zwischenmenschlichen Kommunikation nachteilig ist, dass neben dem primären Informationsinhalt des Sprachdialoges zusätzliche Informationen über den Zustand des "Gesprächspartners" fehlen, die bei zwischenmenschlicher Kommunikation visuell vermittelt werden. Die Aufgabe der Erfindung besteht darin, diesen Nachteil bei einem Sprachdialogsystem zu überwinden, indem erfindungsgemäß in Abhängigkeit des Zustandes des Sprachdialogsystems nicht-sprachliche Signale als auditives Signal an den Benutzer ausgegeben werden. DOLLAR A Das erfindungsgemäße Unterstützungsverfahren ist mit Vorteil zum Führen von Kraftfahrzeugen und Bedienen deren Kraftfahrzeugfunktionen geeignet, da hierdurch der Informationsgehalt für den Fahrer gesteigert wird, ohne gleichzeitig den Fahrer vom Verkehrsgeschehen abzulenken.

Description

Die Erfindung betrifft ein Unterstützungsverfahren für Sprachdialoge zur Bedienung von Kraftfahrzeugfunktionen mittels eines Sprachbediensystems für Kraftfahrzeuge, bei dem zusätzlich zur Sprachausgabe nicht-sprachliche Signale ausgegeben werden, sowie ein Sprachbediensystem zur Durchführung dieses Unterstützungsverfahrens.

Sprachbediensysteme zur sprachgesteuerten Bedienung von Kraftfahrzeugfunktionen sind vielfach bekannt. Sie dienen dazu, dem Fahrer die Bedienung unterschiedlichster Funktionen im Kraftfahrzeug dadurch zu erleichtern, dass die Notwendigkeit einer Tastenbedienung während des Fahrbetriebes entfällt und er damit weniger vom Verkehrsgeschehen abgelenkt wird.

Ein solches Sprachdialogsystem besteht im Wesentlichen aus folgenden Komponenten:

• einer Spracherkennungseinheit, welche eine Spracheingabe („Sprachkommando") mit in einer Sprachmuster-Datenbank abgelegten Sprachkommandos vergleicht und eine Entscheidung trifft, welches Kommando aller Wahrscheinlichkeit nach gesprochen wurde,
• einer Spracherzeugungseinheit, welche die zur Benutzerführung erforderlichen Sprachbefehle und Signalisierungstöne ausgibt und ggf. das erkannte Sprachkommando zurückmeldet,
• einer Dialog- und Ablaufsteuerung, welche den Benutzer durch den Dialog führt, insbesondere um zu prüfen, ob die Spracheingabe korrekt ist und um die einem erkannten Sprachkommando entsprechende Aktion bzw. Applikation zu veranlassen und
• den Applikationseinheiten, die unterschiedlichste Hard- und Softwaremodule darstellen, wie beispielsweise Audio-Geräte, Video, Klimaanlage, Sitzverstellung, Telefon, Navigationsgerät, Spiegelverstellung und Fahrzeugassistenzsysteme.

Es sind verschiedene Verfahren zur Spracherkennung bekannt. So können beispielsweise festgelegte Einzelworte als Befehle in einer Sprachmuster-Datenbank abgelegt werden, so dass durch Mustervergleich eine entsprechende Kraftfahrzeugfunktion zugeordnet werden kann.

Die Phonem-Erkennung geht von der Erkennung einzelner Laute aus, wobei hierzu sogenannte Phonem-Segmente in einer Sprachmuster-Datenbank abgelegt sind und mit aus dem Sprachsignal abgeleiteten Merkmalsfaktoren, die für die Spracherkennung wichtige Informationen des Sprachsignals beinhalten, verglichen werden.

Ein gattungsbildendes Verfahren ist aus der DE 100 08 226 C2 bekannt, bei dem die Sprachausgaben durch bildhafte Hinweise in nicht verbaler Art unterstützt werden. Diese bildhaften Hinweise sollen zu einer schnellen Erfassung der Information durch den Nutzer führen, wodurch auch die Akzeptanz des Nutzers für ein solches System wachsen soll. Diese bildhaften Hinweise werden in Abhängigkeit von Sprachausgaben ausgege ben, so dass beispielsweise, wenn das Sprachdialogsystem eine Eingabe erwartet, symbolhaft wartende Hände dargestellt werden, eine erfolgreiche Eingabe durch ein Gesicht mit entsprechender Mimik und klatschende Hände oder im Fall einer Warnung ebenfalls durch ein Gesicht mit entsprechender Mimik und erhobenen symbolhaften Händen symbolisiert werden.

Dieses bekannte Verfahren zur Sprachsteuerung, bei dem die Sprachausgaben von einer visuellen Ausgabe begleitet werden, hat den Nachteil, dass der Fahrer eines Kraftfahrzeuges durch diese visuelle Ausgabe vom Verkehrsgeschehen abgelenkt werden kann.

Die Aufgabe der Erfindung besteht daher darin, das eingangs genannte Verfahren dahingehend weiterzubilden, dass der durch die Sprachausgabe dem Fahrer vermittelte Informationsgehalt dennoch gesteigert wird, ohne ihn jedoch dabei vom Verkehrsgeschehen abzulenken. Eine weitere Aufgabe besteht darin, ein Sprachdialogsystem zur Durchführung eines solchen Verfahrens anzugeben.

Die erstgenannte Aufgabe wird durch die kennzeichnenden Merkmale des Patentanspruches 1 gelöst, wonach in Abhängigkeit des Zustandes des Sprachdialogsystems das nicht-sprachliche Signal als auditives Signal ausgegeben wird. Damit wird neben den primären Informationselementen des Sprachdialoges, der Sprache selbst, zusätzliche Informationen über den Zustand des Sprachdialogsystems gegeben. Damit fällt es dem Nutzer anhand dieser sekundären Elemente des Sprachdialoges leichter zu erkennen, ob das System bereit zur Eingabe ist, gerade Arbeitsanweisungen verarbeitet oder eine Dialogausgabe abgeschlossen ist. Selbst Dialog-Beginn als auch Dialog-Ende lassen sich mit einem solchen nicht-sprachlichen Signal markieren. Auch die Unterscheidung der unterschiedlichen bedienba ren Kraftfahrzeugfunktionen können mit einem solchen nicht-sprachlichen Signal markiert werden, d. h. die vom Nutzer aufgerufene Funktion wird mit einem speziellen nicht-sprachlichen Signal unterlegt, so dass daran der Fahrer das entsprechende Thema erkennt. Darauf aufbauend können sogenannte proaktive Meldungen, d. h. vom System automatisch ausgegebene Initiativmeldungen generiert werden, so dass der Benutzer die Art der Information an der entsprechenden Markierung sofort erkennt.

Als Zustand des Sprachdialogsystems werden Phasen der Spracheingabe, der Sprachausgabe und Zeiten der Verarbeitung der sprachlichen Eingabe erkannt. Hierzu wird jeweils ein entsprechendes Zeitfenster erzeugt, währenddessen das nicht-sprachliche auditive Signal ausgegeben, also zeitsynchron mit den entsprechenden sprachdialogischen Zuständen über den auditiven Kanal wiedergegeben wird.

Bei einer besonders vorteilhaften Weiterbildung der Erfindung wird das markierende, nicht-sprachliche auditive Signal in Abhängigkeit der bedienbaren Kraftfahrzeugfunktionen, also in Abhängigkeit des vom Benutzer aufgerufenen Themas bzw. der vom Benutzer ausgewählten Funktion ausgegeben. Eine solche Strukturierung eines Sprachdialoges ermöglicht insbesondere die Verwendung von sogenannten pro-aktiven Meldungen, die vom Sprachdialogsystem automatisch als Initiativmeldungen, also auch bei nicht-aktivem Sprachdialog, generiert werden. In Verbindung mit der Markierung der speziellen Funktionen bzw. Themen ist es dem Nutzer möglich, anhand des unterlegten charakteristischen Signals die Art der Meldung zu erkennen.

Besonderes vorteilhaft ist es auch, die Stelle eines aktuellen Listenelementes innerhalb einer angezeigten Liste als auch deren absoluten Anzahl an Einträgen durch ein nicht- sprachliches, auditives Signal dem Nutzer anzuzeigen, indem beispielsweise diese Information durch entsprechende Tonhöhen und/oder Tonlagen vermittelt wird. So kann beispielsweise bei der Navigation innerhalb einer solchen Liste eine Kombination aus akustischer Entsprechung der Gesamtzahl und der Entsprechung der Stelle des aktuellen Elementes wiedergegeben werden.

Charakteristische, nicht-sprachliche auditive Ausgaben im Sinne der Erfindung können sowohl als diskrete Klangereignisse als auch als Variationen eines kontinuierlichen Grundmusters wiedergegeben werden. Als Variationen kommen dabei die Klangfarbe bzw. Instrumentierung, die Tonhöhe bzw. Tonlage, die Lautstärke bzw. Dynamik, die Geschwindigkeit bzw. die Rhythmik und/oder die Tonfolge bzw. die Melodie in Frage.

Die zweitgenannte Aufgabe wird durch die Merkmale des Patentanspruches 13 gelöst, wonach neben den für ein Sprachdialogsystem notwendigen Funktionsgruppen eine Klangmuster-Datenbank vorgesehen ist, in der unterschiedlichste nicht-sprachliche Signale abgespeichert werden, die von einer Sprachunterlegungseinheit in Abhängigkeit des Zustandes des Sprachdialogsystems ausgewählt, ausgegeben bzw. einem Sprachsignal beigemischt werden. Damit lässt sich dieses Verfahren ohne großen zusätzlichen hardwaremäßigen Aufwand in ein übliches Sprachdialogsystem integrieren. Vorteilhafte Ausführungen sind mit den Merkmalen der Ansprüche 14 und 15 gegeben.

Im Folgenden soll die Erfindung anhand von einem Ausführungsbeispiel im Zusammenhang mit den Figuren dargestellt und erläutert werden. Dabei zeigen:
1 ein Blockschaltbild eines erfindungsgemäßen Sprachdialogsystems,
2 ein Blockschaltbild zur Erklärung des Ablaufs eines Sprachdialoges und
3 ein Ablaufdiagramm zur Erläuterung des erfindungsgemäßen Verfahrens.
Einem Sprachdialogsystem 1 gemäß 1 wird über ein Mikrofon 2 eine Spracheingabe zugeführt, die von einer Spracherkennungseinheit 11 des Sprachdialogsystems 1 dadurch ausgewertet wird, dass das Sprachsignal durch Vergleich mit in einer Sprachmuster-Datenbank 15 abgelegten Sprachmustern verglichen und ein Sprachbefehl zugeordnet wird. Mittels einer Dialog- und Ablaufsteuereinheit 16 des Sprachdialogsystems 1 wird entsprechend dem erkannten Sprachbefehl der weitere Sprachdialog gesteuert oder die Durchführung der diesem Sprachbefehl entsprechenden Funktion über eine Schnittstelleneinheit 18 veranlasst.
Diese Schnittstelleneinheit 18 des Sprachdialogsystems 1 ist mit einem Zentraldisplay 4, mit Applikationseinheiten 5 und einer manuellen Befehlseingabeeinheit 6 verbunden. Die Applikationseinheiten 5 können Audio/Video-Geräte, eine Klimasteuerung, eine Sitzverstellung, ein Telefon, ein Navigationssystem, eine Spiegelverstellung oder ein Assistenzsystem, wie beispielsweise ein Abstandswarnsystem, ein Spurwechselassistent, ein automatisches Bremssystem, ein Einparkhilfesystem, ein Spurassistent oder ein Stop-and-Go-Assistent darstellen.
Entsprechend der aktivierten Applikation werden die zugehörigen Bedien- und Fahrzeugzustandsdaten bzw. Fahrzeugumgebungsdaten auf dem Zentraldisplay 4 dem Fahrer angezeigt.
Neben der schon erwähnten akustischen Bedienung mittels des Mikrofons 2 ist es dem Fahrer auch möglich, eine entsprechen de Applikation über die manuelle Befehlseingabeeinheit 6 auszuwählen und zu bedienen.
Erkennt dagegen die Dialog- und Ablaufsteuereinheit 16 keinen gültigen Sprachbefehl, wird der Dialog durch eine Sprachausgabe weitergeführt, indem ein sprechendes Sprachsignal über eine Spracherzeugungseinheit 12 des Sprachdialogsystems 1 über einen Lautsprecher 3 akustisch ausgegeben wird.
Ein Sprachdialog verläuft in einer in 2 dargestellten Weise ab, wobei der gesamte Sprachdialog aus einzelnen, auch ständig wiederkehrenden Phasen besteht. Der Sprachdialog beginnt einer Dialog-Initiation, die entweder manuell, beispielweise mittels eines Schalters, oder automatisch ausgelöst werden kann. Daneben ist es auch möglich, den Sprachdialog mit einer Sprachausgabe seitens des Sprachdialogsystems 1 beginnen zu lassen, wobei das entsprechende Sprachsignal synthetisch oder mittels einer Aufzeichnung erzeugt werden kann. Nach dieser Phase der Sprachausgabe schließt sich eine Phase der Spracheingabe an, deren Sprachsignal in einer anschließenden Verarbeitungsphase bearbeitet wird. Danach wird entweder der Sprachdialog mit einer Sprachausgabe seitens des Sprachdialogsystems weitergeführt oder das Dialogende erreicht, das entweder wieder manuell oder automatisch bewirkt wird, indem beispielsweise eine bestimmte Applikation aufgerufen wird. Für die genannten Phasen eines Sprachdialoges, wie die Phase der Sprachausgabe, der Spracheingabe und der Verarbeitung, werden Zeitfenster bestimmter Länge zur Verfügung gestellt, während durch den Dialogbeginn und das Dialogende nur ein Zeitpunkt markiert wird. Wie in 2 dargestellt, können sich die Phasen von Sprachausgabe, Spracheingabe und Verarbeitung beliebig oft wiederholen.
Ein solches Sprachdialogsystem weist jedoch als Schnittstelle zur Kommunikation von Mensch und Maschine gegenüber einer üblichen zwischenmenschlichen Kommunikation gewisse Nachteile auf, da zusätzliche Informationen über den Zustand des „Gesprächspartners" neben den primären Informationselementen des Sprachdialoges fehlen und bei einer rein menschlichen Kommunikation visuell vermittelt werden. Bei einem Sprachdialogsystem betreffen diese zusätzlichen Informationen den Zustand des Systems, also ob beispielsweise das Sprachdialogsystem bereit zur Eingabe ist, ob es sich also gerade im Zustand der „Spracheingabe" sich befindet, oder ob es gerade Arbeitsanweisungen verarbeitet, d. h. es befindet sich im Zustand der „Verarbeitung" oder wann eine längere Sprachausgabe abgeschlossen ist, das also den Zustand „Sprachausgabe" betrifft. Zur Kennzeichnung bzw. Markierung dieser unterschiedlichen Zustände des Sprachdialogsystems werden nicht-sprachliche akustische Ausgaben zeitsynchron mit diesen sprachdialogischen Zuständen über den auditiven Kanal, also mittels des Lautsprechers 3, an den Nutzer ausgegeben.
Diese nicht-sprachliche Unterlegung der sprachdialogischen Zustände des Sprachdialogsystems 1 ist in 3 dargestellt, bei der die erste Zeile die bereits anhand der 2 beschriebenen Zustände eines Sprachdialoges in ihrem zeitlichen Ablauf zeigt. Der dabei dargestellte Sprachdialog beginnt zum Zeitpunkt t = 0 und endet zum Zeitpunkt t₅ und besteht aus den die Sprachbedienzustände kennzeichnenden Phasen des Sprachdialoges, nämlich dem durch die Phase „Sprachausgabe" bestimmten Zustand A, der bis zum Zeitpunkt t₁ dauert, dem sich daran anschließenden durch die Phase „Spracheingabe" gekennzeichneten Zustand E, der zum Zeitpunkt t₂ abgeschlossen ist, dem sich daran anschließenden durch die Phase „Verarbeitung" gekennzeichneten Zustand V, der zum Zeitpunkt t₃ abgeschlossen ist, und die sich daran wiederholend anschlie ßenden Zustände A und E, die jeweils zum Zeitpunkt t₄ bzw. t₅ abgeschlossen sind. Hieraus ergeben sich entsprechende Zeitdauern T₁ bis T₅ für den jeweiligen Zustand.
Zur Kennzeichnung des Zustandes A wird während der zugehörigen Zeitdauer T₁ bzw. T₄ die Sprachausgabe akustisch mit einem nicht-sprachlichen Signal unterlegt und zwar mit einem Klangelement 1. Dagegen wird dem Zustand E, währenddessen sprachliche Eingaben vom Benutzer möglich sind – das Mikrofon also „offen" ist –, ein Klangelement 2 während des Zeitraumes T₂ bzw. T₅ mittels des Lautsprechers 3 ausgegeben. Damit wird für den Benutzer die Ausgabe von der Eingabe differenziert, was insbesondere bei Ausgaben über mehrere Sätze von Vorteil ist, bei denen manche Nutzer dazu neigen, die kurzen Pausen nach einem ausgegebenen Satz bereits mit der nächsten Eingabe füllen zu wollen.
Schließlich wird mit einem Klangelement 3 der Zustand V, bei dem das Sprachdialogsystem sich in der Verarbeitungsphase befindet, für den Benutzer markiert, so dass er darüber informiert wird, wann das System die Spracheingaben des Nutzers verarbeitet und er weder mit einer Sprachausgabe rechnen kann noch selbst eine Spracheingabe eingeben darf. Bei sehr kurzen Verarbeitungszeiträumen, beispielsweise im μs-Bereich, kann die Markierung des Zustandes V entfallen, jedoch bei längeren Zeitdauern ist es notwendig, da ansonsten die Gefahr besteht, dass der Benutzer irrtümlich annimmt, dass der Dialog beendet sei. Gemäß der dritten Reihe der 3 erfolgt eine diskrete Zuordnung der Klangmusterelemente 1, 2 und 3 zu den jeweiligen Zuständen.
Jedoch kann der Sprachdialog vom Zeitpunkt t = 0 bis zum Abschluss des Dialoges zum Zeitpunkt t₅ mit einem kontinuierlichen Klangelement in der Art eines Grundmusters unterlegt werden, wobei jedoch zur Kennzeichnung bzw. Markierung von einzelnen Zuständen dieses Grundelement variiert, so dass beispielsweise dem Zustand E eine Variation 1, dem Zustand V eine sich davon unterscheidende Variation 2 zugeordnet wird, wie dies in den Zeilen 4 und 5 der 3 dargestellt ist.
Gemäß 1 wird die Markierung bzw. Kennzeichnung der beschriebenen unterschiedlichen Zustände des Sprachdialogsystems mittels einer, von der Dialog- und Ablaufsteuerungseinheit 16 angesteuerten Sprachunterlegungseinheit 13 realisiert, indem dieser entsprechend von der Dialog- und Ablaufsteuerungseinheit 16 festgestellten Zustandes das entsprechende Klangelement bzw. Grundelement mit ggf. einer bestimmten Variation aus einer Klangmuster-Datenbank 17 auswählt und einem Mischer 14 zuführt. Neben diesem nicht-sprachlichen Signal wird diesem Mischer 14 auch das von der Spracherzeugungseinheit 12 erzeugte Sprachsignal zugeführt, gemischt und das mit dem nicht-sprachlichen Signal unterlegte Sprachsignal mittels des Lautsprechers 3 ausgegeben.
Als nicht-sprachliche akustische Signale können unterschiedlichste Klangmuster in diesem Speicher 17 abgelegt werden, wobei bei einem kontinuierlichen Grundelement als mögliche Variationen die Klangfarbe bzw. Instrumentierung, die Tonhöhe bzw. die Tonlage, die Lautstärke bzw. Dynamik, die Geschwindigkeit bzw. die Rhythmik oder die Tonfolge bzw. die Melodie denkbar sind.
Ferner kann der Dialog-Beginn und das Dialog-Ende mittels eines nicht-sprachlichen akustischen Signals markiert werden, wobei hierzu die entsprechende Ansteuerung der Sprachunterlegungseinheit 13 ebenfalls durch die Dialog- und Ablaufsteuereinheit 16 durchgeführt wird, so dass zu den entsprechenden Zeitpunkten nur eine kurzzeitige auditive Ausgabe erfolgt.
Schließlich weist das Sprachdialogsystem 1 eine Transkriptionseinheit 19 auf, die einerseits mit der Dialog- und Ablaufsteuereinheit 16 und andererseits mit der Schnittstelleneinheit 18 und den Applikationseinheiten 5 verbunden ist. Diese Transkriptionseinheit 19 dient dazu, entsprechend der aktivierten Applikation, beispielsweise des Navigationssystems, dieser ein bestimmtes nicht-sprachliches Signal zuzuordnen, weshalb die Klangmuster-Datenbank 17 mit dieser Transkriptionseinheit 19 verbunden ist, um dieses ausgewählte Klangmuster dem Mischer 14 zuzuführen, um dadurch die entsprechende zugehörige Sprachausgabe mit diesem Klangmuster zu unterlegen. Damit wird jeder Applikation ein bestimmtes Klangmuster zugeordnet, so dass bei deren Aktivierung entweder durch Aufruf des Bedieners oder durch automatische Aktivierung das entsprechende Klangmuster erzeugt wird. Der Benutzer erkennt hierdurch an dieser nicht-sprachlichen Ausgabe sofort das Thema, d. h. die Applikation. Insbesondere bei der Ausgabe pro-aktiver Meldungen, d. h. solchen Meldungen, die durch das System auch bei nicht-aktivem Sprachdialog generiert werden (Initiativmeldungen), erkennt der Benutzer sofort anhand dieser charakteristischen Klangmuster die Art der Meldung.
Die Transkriptionseinheit 19 dient auch ferner dazu, die Stellung eines aktuellen Listenelementes sowie der absoluten Anzahl von Einträgen in einer ausgegebenen Liste zu kennzeichnen bzw. zu markieren, da dynamisch erzeugte Listen in der Anzahl ihrer Einträge variieren und damit dem Nutzer eine Abschätzung der Gesamtanzahl sowie der Stellung des ausgewählten Elementes innerhalb der Liste ermöglicht wird. Diese Information hinsichtlich der Länge einer Liste bzw. der Stellung eines Listenelementes innerhalb dieser Liste kann durch entsprechende Tonhöhen und/oder Tonlagen markiert werden. Bei einer Navigation innerhalb der Liste wird eine Kombination aus akustischer Entsprechung der Gesamtzahl und der Entsprechung der Stellung des aktuellen Elementes innerhalb der Liste wiedergegeben.

Claims

Unterstützungsverfahren für Sprachdialoge zur Bedienung von Kraftfahrzeugfunktionen mittels eines Sprachdialogsystems für Kraftfahrzeuge, bei dem zusätzlich zur Sprachausgabe ein nicht-sprachliches Signal ausgegeben wird, dadurch gekennzeichnet, dass das nicht-sprachliche Signal in Abhängigkeit des Zustandes des Sprachdialogsystems als auditives Signal ausgegeben wird.
Unterstützungsverfahren nach Anspruch 1, dadurch gekennzeichnet, dass als Zustand vom Sprachdialogsystem Phasen des Sprachdialoges, insbesondere Phasen der Spracheingabe und der Sprachausgabe, erkannt werden und jeder dieser Phasen ein spezielles nicht-sprachliches auditives Signal zugeordnet wird.
Unterstützungsverfahren nach Anspruch 2, dadurch gekennzeichnet, dass ein Erkennungszeitfenster als Zeitraum, währenddessen sprachliche Eingaben möglich sind, erzeugt wird, und das nicht-sprachliche auditive Signal während dieses Erkennungszeitfensters ausgegeben wird.
Unterstützungsverfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, dass ein Wiedergabezeitfenster als Zeitraum, währenddessen sprachliche Ausgaben ausgegeben werden, erzeugt wird, und das nicht-sprachliche auditive Signal während dieses Wiedergabezeitfensters der sprachlichen Ausgabe überlagert ausgegeben wird.
Unterstützungsverfahren nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, dass während der Verarbeitungszeit der sprachlichen Eingaben durch das Sprachverarbeitungssystem das nicht-sprachliche, auditive Signal ausgegeben wird.
Unterstützungsverfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass zur Markierung eines Sprachdialoges bei Dialogbeginn und bei Dialogende das nicht-sprachliche, auditive Signal ausgegeben wird.
Unterstützungsverfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass in Abhängigkeit der durch einen Sprachbefehl spezifizierten Bedienfunktion ein diese Bedienfunktion kennzeichnendes nicht-sprachliches auditives Signal ausgegeben wird.
Unterstützungsverfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass vom Sprachdialogsystem eine einer Bedienfunktion zuordenbare Initiativmeldung erzeugt wird, die in Abhängig keit des Fahrzeugzustandes und/oder der Fahrzeugumgebung automatisch zusammen mit dem die zugeordnete Bedienfunktion kennzeichnenden nicht-sprachlichen, auditiven Signale ausgegeben wird.
Unterstützungsverfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass bei der Auswahl einer Option aus einer aufgrund eines Sprachbefehls ausgegebenen Liste die einzelnen Listenpunkte in Abhängigkeit der Anzahl der Listenpunkte und/oder in Abhängigkeit der Listenstelle des jeweiligen Listenpunktes ein nicht-sprachliches auditives Signal ausgegeben wird.
Unterstützungsverfahren nach Anspruch 9, dadurch gekennzeichnet, dass das nicht-sprachliche auditive Signal als Klangsignal mit entsprechend der Anzahl der Listenpunkte und/oder der Stelle des jeweiligen Listenpunktes die Tonhöhe und/oder die Tonlage variiert wird.
Unterstützungsverfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass als nicht-sprachliches auditives Signal für jeden Sprachbediensystemzustand ein diskretes Klangssignal erzeugt und ausgegeben wird.
Unterstützungsverfahren nach einem der Anspruch 1 bis 10, dadurch gekennzeichnet, dass als nicht-sprachliches auditives Signal für jeden Sprachbediensystemzustand ein aus einem kontinuierlichen Grundmuster abgeleitetes Klangssignal erzeugt wird.
Sprachdialogsystem (1) für Kraftfahrzeuge zur Bedienung von Kraftfahrzeugfunktionen, bei dem zur Unterstützung von Sprachdialogen zusätzlich zur Sprachausgabe ein nicht-sprachliches Signal ausgegeben wird, dadurch gekennzeichnet, dass a) ein Spracheingabemittel (2) mit einer Spracherkennungseinheit (11) verbunden ist, wobei die Spracherkennungseinheit (11) mittels einer Sprachmuster-Datenbank (15) die Spracheingabe auswertet, b) eine Dialog- und Ablaufsteuereinheit (16) vorgesehen ist, die in Abhängigkeit der Auswertung der Spracheingabe eine zur Steuerung von Kraftfahrzeugfunktionen vorgesehene Applikationseinheit (5) und/oder eine Spracherzeugungseinheit (12) ansteuert, c) eine Sprachunterlegungseinheit (13) vorgesehen ist, die in Abhängigkeit des Sprachdialogsystemzustandes ein diesen Zustand kennzeichnendes, nicht-sprachliches auditives Signal ausgibt, wobei dieses Signal von einer Klangmuster-Datenbank (17) bereitgestellt wird, und d) einem Mischer (14) das Signal der Spracherzeugungseinheit (12) als auch das Signal der Sprachunterlegungseinheit (13) zugeführt wird, wobei dieser Mischer (14) eine Sprachausgabeeinheit (3) ansteuert.
Sprachdialogsystem nach Anspruch 13, dadurch gekennzeichnet, dass eine Transkriptionseinheit (19) vorgesehen ist, die zur Zuordnung eines nicht-sprachlichen auditiven Signals zu einer aktivierten Kraftfahrzeugfunktion mit der Dialog- und Ablaufsteuereinheit (16), der Klangmuster-Datenbank (17) und der Applikationseinheit (5) verbunden ist.
Sprachdialogsystem nach Anspruch 13 oder 14, dadurch gekennzeichnet, dass die Applikationseinheit (5) über eine Schnittstelleneinheit (18) mit der Dialog- und Ablaufsteuereinheit (16) verbunden ist, wobei neben der Applikationseinheit (5) auch weitere Applikationseinheiten (5), ein Zentraldisplay und eine manuelle Befehlseingabeeinheit (6) mit der Schnittstelleneinheit (18) verbunden sind.