-
Die
Erfindung betrifft ein Telefonsystem für ein Kraftfahrzeug zur akustischen
Eingabe einer zu wählenden
Telefonnummer durch einen Bediener des Telefonsystems, zur Identifikation
von akustisch eingegebenen Ziffern der Telefonnummer und zur Identifikation
von zumindest einer durch den Bediener des Telefonsystems eingehaltenen
Eingabepause zwischen zwei Ziffern der Telefonnummer.
-
Ein
derartiges Telefonsystem ist z.B. aus der
EP 0 389 514 B1 und der
DE 42 25 475 A1 bekannt. So
offenbart die
DE 42
25 475 A1 z.B. ein Telefon mit einer Einrichtung zur Spracherkennung
mit einer Spracheingabeeinheit zur Eingabe von Ziffern, Buchstaben
und/oder Steuerworten, mit einer Spracherkennungseinrichtung zur
Detektion der eingebbaren Ziffern und/oder Buchstaben, Pausen und
Steuerwörter,
mit einer Speichereinheit zur Speicherung der von der Spracherkennungseinheit
detektierten Ziffern und/oder Buchstaben und mit einer mit einem Lautsprecher
verbundenen Spracherzeugungseinheit zur Ausgabe der von der Spracherkennungseinrichtung
detektierten Ziffern und/oder Buchstaben, wobei die Spracherkennungseinrichtung
eine Steuereinrichtung aufweist, die vorgesehen ist, nach Eingabe
mindestens einer aus Ziffern und/oder Buchstaben sowie einer Pause
zusammengesetzten bzw. Buchstabengruppe durch ein erstes Steuerwort
jeweils die zuletzt detektierte Ziffer und/oder den zuletzt detektierten
Buchstaben zu löschen
oder zu korrigieren, nach Eingabe eines zweiten Steuerwortes die
jeweils zuletzt detektierte Ziffern- bzw. Buchstabengruppe zu löschen und/oder
nach Eingabe eines dritten Steuerwortes die gesamten detektierten
Ziffern und Ziffer- bzw. Buchstabengruppen zu löschen.
-
Die
DE 197 09 990 C2 offenbart
ein System zur Erkennung gesprochener Ziffernfolgen mit einer Steueranordnung
zur Erkennung einer Ziffernfolge und zur Ausgabe der erkannten Ziffern
der Ziffernfolge. Bei diesem System wird eine Verifikation der Spracheingaben
durch den Benutzer vorgenommen. Dazu werden gezielt die Ziffern
korrigiert, die nicht verstanden worden sind. Die Spracherkennung
kann dabei nach dem aus der Veröffentlichung "Hermann Ney, Volker
Steinbiß,
Xavier Aubert, Reinhold Haeb-Umbach: Progress in Large Vocabulary,
Continuous Speech Recognition, in: H. Niemann, R. de Mori, G. Hanrieder:
Progress and Prospects of Speech Research and Technology, 1994,
Seiten 75 bis 92" bekannten
Verfahren entnommen werden. Nachdem eine eingegebene Ziffernkette
zu dem Zweck der Verifikation ausgegeben worden ist, hat der Benutzer
die Möglichkeit,
die erkannte Ziffernfolge zu akzeptieren oder zurückzuweisen
und anschließend
bestimmte Ziffern nochmals einzugeben. Die Ausgabe der Ziffern erfolgt
durch die Steueranordnung entweder durch Sprachsynthese oder durch Ausgabe
vorab aufgezeichneter und gespeicherter Einzelziffern.
-
Das
in der
DE 197 09 990
C2 offenbarte System markiert Ziffern einer Ziffernfolge
mit einer ungeraden Position mit einem "b" und
Ziffern der Ziffernfolge mit einer geraden Position mit einem "e". Die letzte Ziffer der Ziffernfolge
wird unabhängig
davon, ob es eine gerade oder ungerade Position der Ziffernfolge
ist, mit einem "e" markiert. Das bedeutet,
dass die Ziffern an der ersten, dritten, fünften Position usw. der Ziffernfolge
mit einem "b" und die Ziffenr
an der zweiten, vierten, sechsten Position usw. der Ziffernfolge
mit einem "e" gekennzeichnet werden.
Hiermit wird für
die Ausgabe eine paarweise Prosodie erzeugt, so dass beispielsweise
die Ziffernfolge "3
8 7 4 2 1 6" in "3b 8e 7b 4e 2b 1e
6e" konvertiert
wird. Bei der Ausgabe der Ziffernfolge werden zwei Phrasenvarianten
verwendet. Eine Ziffer wird entweder mit steigendem oder mit fallendem
Akzent ausgegeben. Für
die Ziffern, die mit "b" markiert sind, werden
Phrasen mit steigendem Akzent verwendet und für die Ziffern, die mit "e" markiert sind, werden Phrasen mit fallendem
Akzent mit dem Ziel verwendet, dass sich bei der Sprachausgabe ein
paarweiser Prosodieverlauf ergibt, der dem natürlichen Sprechverhalten von Menschen
entspricht.
-
Die
WO 03/054856 offenbart ein Verfahren zur Erkennung von Worten und
Pausen aus einem Sprachsignal, wobei die in einer Reihe gesprochenen Worte
und Pausen als zu einer Wortgruppe gehörend zusammengefasst werden,
sobald eine der Pausen einen Grenzwert überschreitet, wobei dem Sprachsignal
der Wortgruppe gespeicherte Referenzen zugeordnet werden, und nach Überschreiten
des Grenzwertes eine Anzeige des Ergebnisses der Zuordnung erfolgt,
wobei Parameter aus dem Sprachsignal bestimmt werden, die Zeitpunkten
der Übergänge zwischen
Bereichen mit Sprache und Nichtsprache entsprechen, und wobei der
Grenzwert abhängig
von diesen Parametern verändert
wird.
-
Es
ist Aufgabe der Erfindung, ein verbessertes Telefonsystem für ein Kraftfahrzeug
anzugeben.
-
Vorgenannte
Aufgabe wird durch ein Telefonsystem für ein Kraftfahrzeug zur akustischen
Eingabe einer zu wählenden
Telefonnummer durch einen Bediener des Telefonsystems, zur Identifikation von
akustisch eingegebenen Ziffern der Telefonnummer und zur Identifikation
von zumindest einer durch den Bediener des Telefonsystems eingehaltenen Eingabepause
zwischen zwei Ziffern der Telefonnummer gelöst, wobei die Telefonnummer
und/oder ein Teil der Telefonnummer mittels des Telefonsystems akustisch
mit einer der Eingabepause entsprechenden Ausgabepause zwischen
den zwei Ziffern ausgebbar ist. Geeignete Spracherkennungssysteme
zur Identifikation von akustisch eingegebenen Ziffern der Telefonnummer
und zur Identifikation von zumindest einer durch den Bediener des
Telefonsystems eingehaltenen Eingabepause zwischen zwei Ziffern
der Telefonnummer können
den eingangs genannten Dokumenten entnommen werden. Eine Ausgabepause
entspricht einer Eingabepause im Sinne der Erfindung insbesondere
dann, wenn sie der selben Position zugeordnet ist, d.h. wenn sie
zwischen den selben Ziffern vorgesehen ist. Es kann dabei vorgesehen
sein, dass die Länge
der Ausgabepause unabhängig
von der Länge
der Eingabepause gewählt wird.
Eine Eingabepause kann im Sinne der Erfindung eine Pause im engen
Sinne oder – wie
z.B. in dem Beispiel gemäß 5 beschrieben – eine,
ggf. durch einem Befehl bedingte, Unterbrechung sein. Eine Ausgabepause
im Sinne der Erfindung ist dagegen vorteilhafterweise eine Pause
im engen Sinne.
-
In
vorteilhafter Ausgestaltung der Erfindung beträgt die Ausgabepause zumindest
250ms, insbesondere zumindest 400ms. In weiterhin vorteilhafter Ausgestaltung
der Erfindung beträgt
die Ausgabepause höchstens
2s, insbesondere höchstens
1s.
-
In
weiterhin vorteilhafter Ausgestaltung der Erfindung umfasst das
Telefonsystem einen zum Speichern der Ziffern der Telefonnummer
zusammen mit einem Symbol zur Charakterisierung der Position der
Eingabepause bzw. der Ausgabepause vorgesehenen Speicher.
-
Vorgenannte
Aufgabe wird zudem durch ein Verfahren zum Betrieb eines – insbesondere
eines oder mehrere der vorgenannten Merkmalen umfassenden – Telefonsystems
für ein
Kraftfahrzeug zur akustischen Eingabe einer zu wählenden Telefonnummer durch
einen Bediener des Telefonsystems, zur Identifikation von akustisch
eingegebenen Ziffern der Telefonnummer und zur Identifikation von
zumindest einer durch den Bediener des Telefonsystems eingehaltenen
Eingabepause zwischen zwei Ziffern der Telefonnummer gelöst, wobei
die Telefonnummer oder ein Teil der Telefonnummer automatisch mit
einer der Eingabepause entsprechenden Ausgabepause zwischen den
zwei Ziffern angesagt wird.
-
In
vorteilhafter Ausgestaltung der Erfindung wird nach dem automatischen
Ansagen der Telefonnummer mit der der Eingabepause entsprechenden Ausgabepause
zwischen den zwei Ziffern überwacht wird,
ob ein Befehl zum Wählen
der angesagten Telefonnummer eingegeben.
-
In
weiterhin vorteilhafter Ausgestaltung der Erfindung wird die angesagte
Telefonnummer nach Eingabe eines Befehls zum Wählen der angesagten Telefonnummer
gewählt.
-
In
weiterhin vorteilhafter Ausgestaltung der Erfindung werden die Ziffern
der Telefonnummer zusammen mit einem Symbol zur Charakterisierung
der Position der Eingabepause gespeichert.
-
Kraftfahrzeug
im Sinne der Erfindung ist insbesondere ein individuell im Straßenverkehr
benutzbares Landfahrzeug. Kraftfahrzeuge im Sinne der Erfindung
sind insbesondere nicht auf Landfahrzeuge mit Verbrennungsmotor
beschränkt.
-
Weitere
Vorteile und Einzelheiten ergeben sich aus der nachfolgenden Beschreibung
von Ausführungsbeispielen.
Dabei zeigen:
-
1 ein
Ausführungsbeispiel
eines Kraftfahrzeuges in einer Prinzipdarstellung,
-
2 ein
Ausführungsbeispiel
einer gespeicherten Telefonnummer,
-
3 ein
weiteres Ausführungsbeispiel
eines Kraftfahrzeuges in einer Prinzipdarstellung,
-
4 ein
Ausführungsbeispiel
eines in einem Telefonsystem bzw. einem Mensch-Telefon-Interfacemodul implementierten
Verfahrens und
-
5 einen
beispielhaften Dialog zwischen einem Telefonsystem und einem Bediener
des Telefonsystems.
-
1 zeigt
ein Ausführungsbeispiel
eines Kraftfahrzeuges 1 in einer Prinzipdarstellung. Das Kraftfahrzeug 1 umfasst
ein Telefonsystem 20 mit einem Mikrofon 2 zur
akustischen Eingabe einer zu wählenden
Telefonnummer durch einen Bediener des Telefonsystems 20 sowie
ein Mensch-Telefon-Interfacemodul 5 mit einem Spracherkennungssystem zur
Identifikation von akustisch eingegebenen Ziffern der Telefonnummer
und zur Identifikation von zumindest einer durch den Bediener des
Telefonsystems 20 eingehaltenen Eingabepause zwischen zwei
Ziffern der Telefonnummer. Spracherkennungssysteme zur Identifikation
von akustisch eingegebenen Ziffern der Telefonnummer und zur Identifikation
von zumindest einer durch einen Bediener eingehaltenen Eingabepause
zwischen zwei Ziffern der Telefonnummer können den eingangs genannten
Dokumenten entnommen werden. Das Telefonsystem 20 umfasst
zudem ein Telefonmodul 6, mittels dessen eine Mobilfunk-Verbindung
zu einem Kommunikationsteilnehmer mit der eingegebenen Telefonnummer
hergestellt werden kann.
-
Das
Mensch-Telefon-Interfacemodul 5 umfasst einen Speicher 16 zum
-wie in 2 am Beispiel einer mit Bezugszeichen
T bezeichneten Telefonnummer 1 2 3 4 5 6 7 8 9 dargestellt -Speichern der
Ziffern der akustisch eingegebenen Telefonnummer T zusammen mit
einem Symbol P zur Charakterisierung der Position der Eingabepause
bzw. der Ausgabepause.
-
Das
Telefonsystem 20 umfasst zudem einen mit dem Mensch-Telefon-Interfacemodul 5 verbundenen
Lautsprecher 3, mittels dessen die (gespeicherte) Telefonnummer
T und/oder ein Teil der (gespeicherten) Telefonnummer T akustisch
mit einer der Eingabepause entsprechenden Ausgabepause zwischen
den zwei Ziffern ausgebbar ist. Selbstverständlich können in einer Telefonnummer
T dabei mehr als eine Eingabepause bzw. Ausgabepause vorgesehen
sein. Die Ausgabepause beträgt
zumindest 250ms, insbesondere zumindest 400ms, jedoch höchstens
2s, insbesondere höchstens
1s.
-
3 zeigt
ein alternatives Ausführungsbeispiel
eines Kraftfahrzeuges 10 in einer Prinzipdarstellung, wobei
gleiche Bezugszeichen wie in 1 gleiche
oder vergleichbare Gegenstände
bezeichnen. Das Kraftfahrzeug 10 umfasst ein Telefonsystem 21 mit
einem Mikrofon 2 zur akustischen Eingabe einer zu wählenden
Telefonnummer durch einen Bediener des Telefonsystems 20 sowie
ein Mensch-Telefon-Interfacemodul 5 mit einem Speicher 16.
Das in 3 dargestellte Mensch-Telefon-Interfacemodul 5 umfasst
eine Schnittstelle 15 für
eine drahtlose Kommunikationsverbindung 8, z.B. Bluetooth,
zwischen dem Mensch-Telefon-Interfacemodul 5 und
einem Mobiltelefon 7, wobei das Mobiltelefon 7 über die drahtlose
Kommunikationsverbindung 8 mittels des Mensch-Telefon-Interfacemoduls 5 bedienbar
ist.
-
4 zeigt
ein Ausführungsbeispiel
eines in dem Mensch-Telefon-Interfacemodul 5 gemäß 1 bzw. 3 implementierten
Verfahrens zum Betrieb des Telefonsystems 20 bzw. 21.
Der Ablauf beginnt mit einer Abfrage 30, ob eine Spracheingabe
erfolgt. Erfolgt eine Spracheingabe, folgt der Abfrage 30 ein Schritt 31,
in dem die Spracheingabe ausgewertet und ihr Ende bzw. eine Eingabepause
erkannt wird. Andernfalls wird die Abfrage 30 wiederholt.
-
Dem
Schritt 31 folgt eine Abfrage 32, ob Ziffern bzw.
eine Ziffer mittels Spracheingabe eingegeben worden sind bzw. ist.
Sind Ziffern mittels Spracheingabe eingegeben worden bzw. ist eine
Ziffer mittels Spracheingabe eingegeben worden, so folgt der Abfrage 32 ein
Schritt 33, in dem die Ziffern bzw. die Ziffer gefolgt
von dem Symbol P zur Charakterisierung der Position der Eingabepause
bzw. der Ausgabepause in dem Speicher 16 abgespeichert
werden bzw. wird. Dem Schritt 33 folgt ein Schritt 34,
in dem die Ziffern bzw. die Ziffer mittels des Lautsprechers 3 akustisch
ausgegeben werden bzw. wird.
-
Sind
mittels Spracheingabe keine Ziffern eingegeben worden, so folgt
der Abfrage 32 eine Abfrage 35, ob mittels Spracheingabe
ein (dem Mensch-Telefon-Interfacemodul 5 bekannter) Befehl eingegeben
worden ist. Ist mittels der Spracheingabe ein (dem Mensch-Telefon-Interfacemodul 5 bekannter)
Befehl eingegeben worden, so wird dieser Befehl in einem Schritt 36 ausgeführt, andernfalls
folgt der Abfrage 35 die Abfrage 30. Dem Schritt 36 eine
Abfrage, ob die Spracheingabe fortgesetzt werden soll. Soll die
Spracheingabe fortgesetzt werden, folgt der Abfrage 37 die
Abfrage 30, andernfalls wird das Verfahren beendet.
-
5 zeigt
einen beispielhaften Dialog zwischen dem Telefonsystem 20 bzw. 21 und
einem Bediener des Telefonsystems 20 bzw. 21,
wie er sich aufgrund der Implementierung des Mensch-Telefon-Interfacemoduls 5 gemäß dem in 4 dargestellten
Verfahrensablauf abspielen kann. Dabei bezeichnen Bezugszeichen 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54 und 55 Dialoganteile des
Bedieners bzw. des Telefonsystems 20 bzw. 21, wobei
mit geraden Bezugszeichen 40, 42, 44, 46, 48, 50, 52, 54 Dialoganteile
des Bedieners und mit ungeraden Bezugszeichen 41, 43, 45, 47, 49, 51, 53, 55 Dialoganteile
des Telefonsystems 20 bzw. 21 bezeichnet sind.
Mit t ist die Zeit bezeichnet.
-
Der
Dialog beginnt mit der Anforderung (Dialoganteil 40) des
Bedieners zu Telefonieren. Es kann auch vorgesehen sein, dass diese
Anforderung ggf. mittels eines in 1 bzw. 3 nicht
dargestellten Bedienelementes erfolgen kann. Das Telefonsystem 20 bzw. 21 antwortet
auf diese Aufforderung mit der folgenden Aufforderung, eine Nummer
einzugeben: „Die
Nummer bitte." (Dialoganteil 41).
Antwortet der Bediener mit „1
2 3" (Dialoganteil 42)
gefolgt von einer Pause, die das Telefonsystem 20 bzw. 21 als
Eingabeende interpretiert (und entsprechend die Eingabe unterbricht),
antwortet das Telefonsystem 20 bzw. 21 mit der
folgenden Aufforderung, weitere Ziffern einzugeben: „1 2 3,
und weiter?" (Dialoganteil 43). Diese
Pause, die das Telefonsystem 20 bzw. 21 als Eingabeende
interpretiert, und damit die Eingabemöglichkeit zunächst unterbricht,
ist ein Beispiel für eine
Ausgabepause im Sinne der Erfindung.
-
Antwortet
der Bediener mit „4
5 6" (Dialoganteil 44)
gefolgt von einer Pause, die das Telefonsystem 20 bzw. 21 als
Eingabeende interpretiert, antwortet das Telefonsystem 20 bzw. 21 mit
der folgenden Aufforderung, weitere Ziffern einzugeben: „4 5 6,
und weiter?" (Dialoganteil 45).
-
Antwortet
der Bediener nun mit „7
8 9" (Dialoganteil 46)
gefolgt von einer Pause, die das Telefonsystem 20 bzw. 21 als
Eingabeende interpretiert, antwortet das Telefonsystem 20 bzw. 21,
das in diesem Beispiel die letzten beiden Ziffern falsch verstanden
hat, mit der folgenden Aufforderung, weitere Ziffern einzugeben: „7 1 1,
und weiter?" (Dialoganteil 47).
-
Antwortet
der Bediener nun mit dem Befehl „Korrektur" (Dialoganteil 48), so wiederholt
das Telefonsystem 20 bzw. 21 den Teil der Telefonnummer, der
akzeptiert wurde: „123
456, und weiter?" (Dialoganteil 49).
Dabei bezeichnet das Symbol ,' eine
Ausgabepause zwischen den beiden Ziffern ,3' und ,4'. Antwortet der Bediener nun erneut
mit „7
8 9" (Dialoganteil 50)
gefolgt von einer Pause, die das Telefonsystem 20 bzw. 21 als
Eingabeende interpretiert, antwortet das Telefonsystem 20 bzw. 21 mit
der folgenden Aufforderung, weitere Ziffern einzugeben: „7 8 9, und
weiter?" (Dialoganteil 51).
-
Antwortet
der Bediener mit dem Befehl „Wiederholen" (Dialoganteil 52),
so wiederholt das Telefonsystem 20 bzw. 21 den
Teil der Telefonnummer, der akzeptiert wurde, d.h. für das zugrunde
liegende Beispiel die vollständige
Telefonnummer: „123
456 789, und weiter?" (Dialoganteil 53).
Dabei bezeichnet das Symbol ,' eine
Ausgabepause zwischen den beiden Ziffern ,3' und ,4' sowie eine Ausgabepause zwischen den
beiden Ziffern ,6' und
,7'.
-
Antwortet
der Bediener daraufhin mit dem Befehl „Wählen" (Dialoganteil 54), veranlasst
das Telefonsystem 20 bzw. 21, dass die Telefonnummer
1 2 3 4 5 6 7 8 9 von dem Telefonmodul 6 bzw. dem Mobiltelefon 8 gewählt wird,
und antwortet mit dem Dialoganteil 55 „Die Nummer wird gewählt".
-
Die
Elemente in den 1 und 3 sind unter
Berücksichtigung
von Einfachheit und Klarheit und nicht notwendigerweise maßstabsgetreu
gezeichnet. So sind z.B. die Größenordnungen
einiger Elemente übertrieben
gegenüber
anderen Elementen dargestellt, um das Verständnis der Ausführungsbeispiele
der vorliegenden Erfindung zu verbessern.
-
- 1,
10
- Kraftfahrzeug
- 2
- Mikrofon
- 3
- Lautsprecher
- 5
- Mensch-Telefon-Interfacemodul
- 6
- Telefonmodul
- 7
- Mobiltelefon
- 8
- drahtlose
Kommunikationsverbindung
- 15
- Schnittstelle
- 16
- Speicher
- 20,
21
- Telefonsystem
- 30,
32, 35, 37
- Abfrage
- 31,
33, 34, 36
- Schritt
- 40,
41, 42, 43,
-
- 44,
45, 46, 47,
-
- 48,
49, 50, 51,
-
- 52,
53, 54, 55
- Dialoganteil
- P
- Symbol
zur Charakterisierung der Position einer Eingabepause bzw. einer
-
- Ausgabepause
- t
- Zeit
- T
- Telefonnummer