-
Die Erfindung betrifft ein Telefonsystem für ein Kraftfahrzeug zur akustischen Eingabe einer zu wählenden Telefonnummer durch einen Bediener des Telefonsystems, zur Identifikation von akustisch eingegebenen Ziffern der Telefonnummer und zur Identifikation von zumindest einer durch den Bediener des Telefonsystems eingehaltenen Eingabepause zwischen zwei Ziffern der Telefonnummer.
-
Ein derartiges Telefonsystem ist z.B. aus der
EP 0 389 514 B1 (=
DE 3855164 T2 ) und der
DE 42 25 475 A1 bekannt. So offenbart die
DE 42 25 475 A1 z.B. ein Telefon mit einer Einrichtung zur Spracherkennung mit einer Spracheingabeeinheit zur Eingabe von Ziffern, Buchstaben und/oder Steuerworten, mit einer Spracherkennungseinrichtung zur Detektion der eingebbaren Ziffern und/oder Buchstaben, Pausen und Steuerwörter, mit einer Speichereinheit zur Speicherung der von der Spracherkennungseinheit detektierten Ziffern und/oder Buchstaben und mit einer mit einem Lautsprecher verbundenen Spracherzeugungseinheit zur Ausgabe der von der Spracherkennungseinrichtung detektierten Ziffern und/oder Buchstaben, wobei die Spracherkennungseinrichtung eine Steuereinrichtung aufweist, die vorgesehen ist, nach Eingabe mindestens einer aus Ziffern und/oder Buchstaben sowie einer Pause zusammengesetzten bzw. Buchstabengruppe durch ein erstes Steuerwort jeweils die zuletzt detektierte Ziffer und/oder den zuletzt detektierten Buchstaben zu löschen oder zu korrigieren, nach Eingabe eines zweiten Steuerwortes die jeweils zuletzt detektierte Ziffern- bzw. Buchstabengruppe zu löschen und/oder nach Eingabe eines dritten Steuerwortes die gesamten detektierten Ziffern und Ziffer- bzw. Buchstabengruppen zu löschen.
-
Die
DE 197 09 990 A1 offenbart ein System zur Erkennung gesprochener Ziffernfolgen mit einer Steueranordnung zur Erkennung einer Ziffernfolge und zur Ausgabe der erkannten Ziffern der Ziffernfolge. Bei diesem System wird eine Verifikation der Spracheingaben durch den Benutzer vorgenommen. Dazu werden gezielt die Ziffern korrigiert, die nicht verstanden worden sind. Die Spracherkennung kann dabei nach dem aus der Veröffentlichung „Hermann Ney, Volker Steinbiß, Xavier Aubert, Reinhold Haeb-Umbach: Progress in Large Vocabulary, Continuous Speech Recognition, in: H. Niemann, R. de Mori, G. Hanrieder: Progress and Prospects of Speech Research and Technology, 1994, Seiten 75 bis 92“ bekannten Verfahren entnommen werden. Nachdem eine eingegebene Ziffernkette zu dem Zweck der Verifikation ausgegeben worden ist, hat der Benutzer die Möglichkeit, die erkannte Ziffernfolge zu akzeptieren oder zurückzuweisen und anschließend bestimmte Ziffern nochmals einzugeben. Die Ausgabe der Ziffern erfolgt durch die Steueranordnung entweder durch Sprachsynthese oder durch Ausgabe vorab aufgezeichneter und gespeicherter Einzelziffern.
-
Das in der
DE 197 09 990 A1 offenbarte System markiert Ziffern einer Ziffernfolge mit einer ungeraden Position mit einem „b“ und Ziffern der Ziffernfolge mit einer geraden Position mit einem „e“. Die letzte Ziffer der Ziffernfolge wird unabhängig davon, ob es eine gerade oder ungerade Position der Ziffernfolge ist, mit einem „e“ markiert. Das bedeutet, dass die Ziffern an der ersten, dritten, fünften Position usw. der Ziffernfolge mit einem „b“ und die Ziffenr an der zweiten, vierten, sechsten Position usw. der Ziffernfolge mit einem „e“ gekennzeichnet werden. Hiermit wird für die Ausgabe eine paarweise Prosodie erzeugt, so dass beispielsweise die Ziffernfolge „3
8 7 4 2 1 6“ in „3b 8e 7b 4e 2b 1e 6e“ konvertiert wird. Bei der Ausgabe der Ziffernfolge werden zwei Phrasenvarianten verwendet. Eine Ziffer wird entweder mit steigendem oder mit fallendem Akzent ausgegeben. Für die Ziffern, die mit „b“ markiert sind, werden Phrasen mit steigendem Akzent verwendet und für die Ziffern, die mit „e“ markiert sind, werden Phrasen mit fallendem Akzent mit dem Ziel verwendet, dass sich bei der Sprachausgabe ein paarweiser Prosodieverlauf ergibt, der dem natürlichen Sprechverhalten von Menschen entspricht.
-
Die
WO 03/054856 A1 offenbart ein Verfahren zur Erkennung von Worten und Pausen aus einem Sprachsignal, wobei die in einer Reihe gesprochenen Worte und Pausen als zu einer Wortgruppe gehörend zusammengefasst werden, sobald eine der Pausen einen Grenzwert überschreitet, wobei dem Sprachsignal der Wortgruppe gespeicherte Referenzen zugeordnet werden, und nach Überschreiten des Grenzwertes eine Anzeige des Ergebnisses der Zuordnung erfolgt, wobei Parameter aus dem Sprachsignal bestimmt werden, die Zeitpunkten der Übergänge zwischen Bereichen mit Sprache und Nichtsprache entsprechen, und wobei der Grenzwert abhängig von diesen Parametern verändert wird.
-
Die
DE 3855164 T2 offenbart ein Verfahren zum Steuern eines elektronischen Gerätes mit folgenden Schritten:
- - Erkennen von Schlüsselworten, die durch einen Benutzer deutlich gesprochen werden, und in einer oder mehreren Sprachäußerungskette(n) mit einer variablen Anzahl von Schlüsselworten enthalten sind, wobei die Anzahl von deutlich gesprochenen Schlüsselworten bei Sprachäußerungsketten durch den Benutzer während des Aussprechens dieser Schlüsselworte bestimmt wird und jede Sprachäußerungskette gefolgt ist von einem Pausenzeitraum;
- - Schaffen eines Pausensignals, nachdem eine Sprachäußerungskette für die Dauer eines vorbestimmten Pausenzeitraums aufgehört hat;
- - Schaffen einer Anzeige von bestimmten erkannten Schlüsselworten für den Benutzer in Reaktion auf das Pausensignal, welche Anzeige der vor dem Pausensignal aufgetretenen Sprachäußerungskette entspricht; und
- - Korrigieren bestimmter Schlüsselworte in Reaktion auf das Pausensignal und in Reaktion auf das Erkennen eines vorbestimmten Fehlerbefehl-Schlüsselwortes, das in einer nach dem Pausensignal auftretenden Sprachäußerungskette enthalten ist.
-
Die
EP 0 877 518 A2 beschreibt ein Verfahren zum Wählen einer Telefonnummer mittels Sprachbefehlen, wobei die Telefonnummer, die gewählt werden soll, entweder als ein String ausgestaltet oder in mehrere Zahlenstrings unterteilt sein kann.
-
Es ist Aufgabe der Erfindung, ein verbessertes Telefonsystem für ein Kraftfahrzeug anzugeben.
-
Vorgenannte Aufgabe wird durch ein Telefonsystem für ein Kraftfahrzeug zur akustischen Eingabe einer zu wählenden Telefonnummer durch einen Bediener des Telefonsystems, zur Identifikation von akustisch eingegebenen Ziffern der Telefonnummer und zur Identifikation von zumindest einer durch den Bediener des Telefonsystems eingehaltenen Eingabepause zwischen zwei Ziffern der Telefonnummer gemäß Anspruch 1 gelöst, wobei u.a. die Telefonnummer und/oder ein Teil der Telefonnummer mittels des Telefonsystems akustisch mit einer der Eingabepause entsprechenden Ausgabepause zwischen den zwei Ziffern ausgebbar ist, und wobei die Länge der Ausgabepause unabhängig von der Länge der Eingabepause gewählt wird. Geeignete Spracherkennungssysteme zur Identifikation von akustisch eingegebenen Ziffern der Telefonnummer und zur Identifikation von zumindest einer durch den Bediener des Telefonsystems eingehaltenen Eingabepause zwischen zwei Ziffern der Telefonnummer können den eingangs genannten Dokumenten entnommen werden. Eine Ausgabepause entspricht einer Eingabepause im Sinne der Erfindung dann, wenn sie der selben Position zugeordnet ist, d.h. wenn sie zwischen den selben Ziffern vorgesehen ist. Es kann dabei vorgesehen sein, dass die Länge der Ausgabepause unabhängig von der Länge der Eingabepause gewählt wird. Eine Eingabepause kann im Sinne der Erfindung eine Pause im engen Sinne oder - wie z.B. in dem Beispiel gemäß 5 beschrieben - eine, ggf. durch einem Befehl bedingte, Unterbrechung sein. Eine Ausgabepause im Sinne der Erfindung ist dagegen vorteilhafterweise eine Pause im engen Sinne.
-
In vorteilhafter Ausgestaltung der Erfindung beträgt die Ausgabepause zumindest 250ms, insbesondere zumindest 400ms. In weiterhin vorteilhafter Ausgestaltung der Erfindung beträgt die Ausgabepause höchstens 2s, insbesondere höchstens 1s.
-
Vorgenannte Aufgabe wird zudem durch ein Verfahren zum Betrieb eines - insbesondere eines oder mehrere der vorgenannten Merkmalen umfassenden - Telefonsystems für ein Kraftfahrzeug zur akustischen Eingabe einer zu wählenden Telefonnummer durch einen Bediener des Telefonsystems, zur Identifikation von akustisch eingegebenen Ziffern der Telefonnummer und zur Identifikation von zumindest einer durch den Bediener des Telefonsystems eingehaltenen Eingabepause zwischen zwei Ziffern der Telefonnummer gemäß Anspruch 4 gelöst, wobei u. a. vorgesehen ist, dass die Telefonnummer oder ein Teil der Telefonnummer automatisch mit einer der Eingabepause entsprechenden Ausgabepause zwischen den zwei Ziffern angesagt wird, wobei die Länge der Ausgabepause unabhängig von der Länge der Eingabepause gewählt wird.
-
In vorteilhafter Ausgestaltung der Erfindung wird nach dem automatischen Ansagen der Telefonnummer mit der der Eingabepause entsprechenden Ausgabepause zwischen den zwei Ziffern überwacht wird, ob ein Befehl zum Wählen der angesagten Telefonnummer eingegeben.
-
In weiterhin vorteilhafter Ausgestaltung der Erfindung wird die angesagte Telefonnummer nach Eingabe eines Befehls zum Wählen der angesagten Telefonnummer gewählt.
-
Kraftfahrzeug im Sinne der Erfindung ist insbesondere ein individuell im Straßenverkehr benutzbares Landfahrzeug. Kraftfahrzeuge im Sinne der Erfindung sind insbesondere nicht auf Landfahrzeuge mit Verbrennungsmotor beschränkt.
-
Weitere Vorteile und Einzelheiten ergeben sich aus der nachfolgenden Beschreibung von Ausführungsbeispielen. Dabei zeigen:
- 1 ein Ausführungsbeispiel eines Kraftfahrzeuges in einer Prinzipdarstellung,
- 2 ein Ausführungsbeispiel einer gespeicherten Telefonnummer,
- 3 ein weiteres Ausführungsbeispiel eines Kraftfahrzeuges in einer Prinzipdarstellung,
- 4 ein Ausführungsbeispiel eines in einem Telefonsystem bzw. einem Mensch-Telefon-Interfacemodul implementierten Verfahrens und
- 5 einen beispielhaften Dialog zwischen einem Telefonsystem und einem Bediener des Telefonsystems.
-
1 zeigt ein Ausführungsbeispiel eines Kraftfahrzeuges 1 in einer Prinzipdarstellung. Das Kraftfahrzeug 1 umfasst ein Telefonsystem 20 mit einem Mikrofon 2 zur akustischen Eingabe einer zu wählenden Telefonnummer durch einen Bediener des Telefonsystems 20 sowie ein Mensch-Telefon-Interfacemodul 5 mit einem Spracherkennungssystem zur Identifikation von akustisch eingegebenen Ziffern der Telefonnummer und zur Identifikation von zumindest einer durch den Bediener des Telefonsystems 20 eingehaltenen Eingabepause zwischen zwei Ziffern der Telefonnummer. Spracherkennungssysteme zur Identifikation von akustisch eingegebenen Ziffern der Telefonnummer und zur Identifikation von zumindest einer durch einen Bediener eingehaltenen Eingabepause zwischen zwei Ziffern der Telefonnummer können den eingangs genannten Dokumenten entnommen werden. Das Telefonsystem 20 umfasst zudem ein Telefonmodul 6, mittels dessen eine Mobilfunk-Verbindung zu einem Kommunikationsteilnehmer mit der eingegebenen Telefonnummer hergestellt werden kann.
-
Das Mensch-Telefon-Interfacemodul 5 umfasst einen Speicher 16 zum - wie in 2 am Beispiel einer mit Bezugszeichen T bezeichneten Telefonnummer 1 2 3 4 5 6 7 8 9 dargestellt - Speichern der Ziffern der akustisch eingegebenen Telefonnummer T zusammen mit einem Symbol P zur Charakterisierung der Position der Eingabepause bzw. der Ausgabepause.
-
Das Telefonsystem 20 umfasst zudem einen mit dem Mensch-Telefon-Interfacemodul 5 verbundenen Lautsprecher 3, mittels dessen die (gespeicherte) Telefonnummer T und/oder ein Teil der (gespeicherten) Telefonnummer T akustisch mit einer der Eingabepause entsprechenden Ausgabepause zwischen den zwei Ziffern ausgebbar ist. Selbstverständlich können in einer Telefonnummer T dabei mehr als eine Eingabepause bzw. Ausgabepause vorgesehen sein. Die Ausgabepause beträgt zumindest 250ms, insbesondere zumindest 400ms, jedoch höchstens 2s, insbesondere höchstens 1s.
-
3 zeigt ein alternatives Ausführungsbeispiel eines Kraftfahrzeuges 10 in einer Prinzipdarstellung, wobei gleiche Bezugszeichen wie in 1 gleiche oder vergleichbare Gegenstände bezeichnen. Das Kraftfahrzeug 10 umfasst ein Telefonsystem 21 mit einem Mikrofon 2 zur akustischen Eingabe einer zu wählenden Telefonnummer durch einen Bediener des Telefonsystems 20 sowie ein Mensch-Telefon-Interfacemodul 5 mit einem Speicher 16. Das in 3 dargestellte Mensch-Telefon-Interfacemodul 5 umfasst eine Schnittstelle 15 für eine drahtlose Kommunikationsverbindung 8, z.B. Bluetooth, zwischen dem Mensch-Telefon-Interfacemodul 5 und einem Mobiltelefon 7, wobei das Mobiltelefon 7 über die drahtlose Kommunikationsverbindung 8 mittels des Mensch-Telefon-Interfacemoduls 5 bedienbar ist.
-
4 zeigt ein Ausführungsbeispiel eines in dem Mensch-Telefon-Interfacemodul 5 gemäß 1 bzw. 3 implementierten Verfahrens zum Betrieb des Telefonsystems 20 bzw. 21. Der Ablauf beginnt mit einer Abfrage 30, ob eine Spracheingabe erfolgt. Erfolgt eine Spracheingabe, folgt der Abfrage 30 ein Schritt 31, in dem die Spracheingabe ausgewertet und ihr Ende bzw. eine Eingabepause erkannt wird. Andernfalls wird die Abfrage 30 wiederholt.
-
Dem Schritt 31 folgt eine Abfrage 32, ob Ziffern bzw. eine Ziffer mittels Spracheingabe eingegeben worden sind bzw. ist. Sind Ziffern mittels Spracheingabe eingegeben worden bzw. ist eine Ziffer mittels Spracheingabe eingegeben worden, so folgt der Abfrage 32 ein Schritt 33, in dem die Ziffern bzw. die Ziffer gefolgt von dem Symbol P zur Charakterisierung der Position der Eingabepause bzw. der Ausgabepause in dem Speicher 16 abgespeichert werden bzw. wird. Dem Schritt 33 folgt ein Schritt 34, in dem die Ziffern bzw. die Ziffer mittels des Lautsprechers 3 akustisch ausgegeben werden bzw. wird.
-
Sind mittels Spracheingabe keine Ziffern eingegeben worden, so folgt der Abfrage 32 eine Abfrage 35, ob mittels Spracheingabe ein (dem Mensch-Telefon-Interfacemodul 5 bekannter) Befehl eingegeben worden ist. Ist mittels der Spracheingabe ein (dem Mensch-Telefon-Interfacemodul 5 bekannter) Befehl eingegeben worden, so wird dieser Befehl in einem Schritt 36 ausgeführt, andernfalls folgt der Abfrage 35 die Abfrage 30. Dem Schritt 36 eine Abfrage, ob die Spracheingabe fortgesetzt werden soll. Soll die Spracheingabe fortgesetzt werden, folgt der Abfrage 37 die Abfrage 30, andernfalls wird das Verfahren beendet.
-
5 zeigt einen beispielhaften Dialog zwischen dem Telefonsystem 20 bzw. 21 und einem Bediener des Telefonsystems 20 bzw. 21, wie er sich aufgrund der Implementierung des Mensch-Telefon-Interfacemoduls 5 gemäß dem in 4 dargestellten Verfahrensablauf abspielen kann. Dabei bezeichnen Bezugszeichen 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54 und 55 Dialoganteile des Bedieners bzw. des Telefonsystems 20 bzw. 21, wobei mit geraden Bezugszeichen 40, 42, 44, 46, 48, 50, 52, 54 Dialoganteile des Bedieners und mit ungeraden Bezugszeichen 41, 43, 45, 47, 49, 51, 53, 55 Dialoganteile des Telefonsystems 20 bzw. 21 bezeichnet sind. Mit t ist die Zeit bezeichnet.
-
Der Dialog beginnt mit der Anforderung (Dialoganteil 40) des Bedieners zu Telefonieren. Es kann auch vorgesehen sein, dass diese Anforderung ggf. mittels eines in 1 bzw. 3 nicht dargestellten Bedienelementes erfolgen kann. Das Telefonsystem 20 bzw. 21 antwortet auf diese Aufforderung mit der folgenden Aufforderung, eine Nummer einzugeben: „Die Nummer bitte.“ (Dialoganteil 41). Antwortet der Bediener mit „1 2 3“ (Dialoganteil 42) gefolgt von einer Pause, die das Telefonsystem 20 bzw. 21 als Eingabeende interpretiert (und entsprechend die Eingabe unterbricht), antwortet das Telefonsystem 20 bzw. 21 mit der folgenden Aufforderung, weitere Ziffern einzugeben: „1 2 3, und weiter?“ (Dialoganteil 43). Diese Pause, die das Telefonsystem 20 bzw. 21 als Eingabeende interpretiert, und damit die Eingabemöglichkeit zunächst unterbricht, ist ein Beispiel für eine Ausgabepause im Sinne der Erfindung.
-
Antwortet der Bediener mit „4 5 6“ (Dialoganteil 44) gefolgt von einer Pause, die das Telefonsystem 20 bzw. 21 als Eingabeende interpretiert, antwortet das Telefonsystem 20 bzw. 21 mit der folgenden Aufforderung, weitere Ziffern einzugeben: „4 5 6, und weiter?“ (Dialoganteil 45).
-
Antwortet der Bediener nun mit „7 8 9“ (Dialoganteil 46) gefolgt von einer Pause, die das Telefonsystem 20 bzw. 21 als Eingabeende interpretiert, antwortet das Telefonsystem 20 bzw. 21, das in diesem Beispiel die letzten beiden Ziffern falsch verstanden hat, mit der folgenden Aufforderung, weitere Ziffern einzugeben: „7 1 1, und weiter?“ (Dialoganteil 47).
-
Antwortet der Bediener nun mit dem Befehl „Korrektur“ (Dialoganteil 48), so wiederholt das Telefonsystem 20 bzw. 21 den Teil der Telefonnummer, der akzeptiert wurde: „1 2 3 □ 4 5 6, und weiter?“ (Dialoganteil 49). Dabei bezeichnet das Symbol ,□‘ eine Ausgabepause zwischen den beiden Ziffern ,3' und ,4'. Antwortet der Bediener nun erneut mit „7 8 9“ (Dialoganteil 50) gefolgt von einer Pause, die das Telefonsystem 20 bzw. 21 als Eingabeende interpretiert, antwortet das Telefonsystem 20 bzw. 21 mit der folgenden Aufforderung, weitere Ziffern einzugeben: „7 8 9, und weiter?“ (Dialoganteil 51).
-
Antwortet der Bediener mit dem Befehl „Wiederholen“ (Dialoganteil 52), so wiederholt das Telefonsystem 20 bzw. 21 den Teil der Telefonnummer, der akzeptiert wurde, d.h. für das zugrunde liegende Beispiel die vollständige Telefonnummer: „1 2 3 □ 4 5 6 □ 7 8 9, und weiter?“ (Dialoganteil 53). Dabei bezeichnet das Symbol ‚□‘ eine Ausgabepause zwischen den beiden Ziffern ,3' und ,4' sowie eine Ausgabepause zwischen den beiden Ziffern ,6' und ,7'.
-
Antwortet der Bediener daraufhin mit dem Befehl „Wählen“ (Dialoganteil 54), veranlasst das Telefonsystem 20 bzw. 21, dass die Telefonnummer 1 2 3 4 5 6 7 8 9 von dem Telefonmodul 6 bzw. dem Mobiltelefon 8 gewählt wird, und antwortet mit dem Dialoganteil 55 „Die Nummer wird gewählt“.
-
Die Elemente in den 1 und 3 sind unter Berücksichtigung von Einfachheit und Klarheit und nicht notwendigerweise maßstabsgetreu gezeichnet. So sind z.B. die Größenordnungen einiger Elemente übertrieben gegenüber anderen Elementen dargestellt, um das Verständnis der Ausführungsbeispiele der vorliegenden Erfindung zu verbessern.
-
Bezugszeichenliste
-
- 1, 10
- Kraftfahrzeug
- 2
- Mikrofon
- 3
- Lautsprecher
- 5
- Mensch-Telefon-Interfacemodul
- 6
- Telefonmodul
- 7
- Mobiltelefon
- 8
- drahtlose Kommunikationsverbindung
- 15
- Schnittstelle
- 16
- Speicher
- 20,21
- Telefonsystem
- 30, 32, 35, 37
- Abfrage
- 31, 33, 34, 36
- Schritt
- 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55
- Dialoganteil
- P
- Symbol zur Charakterisierung der Position einer Eingabepause bzw. einer Ausgabepause
- t
- Zeit
- T
- Telefonnummer