-
Die
Erfindung betrifft ein Verfahren zur Steuerung eines Telekommunikationsdiensts
wie im Oberbegriff von Anspruch 1 definiert und ein Telekommunikationsendgerät wie im
Oberbegriff von Anspruch 5 definiert.
-
Aus
dem Stand der Technik ist bekannt, daß ein Telekommunikationsdienst
unter Nutzung von Zahlentasten und DTMF-Tönen gesteuert sein kann. Dies
ist unpraktisch, insbesondere bei einem Mobiltelefon, da zunächst die
Bereitschaftsmeldung gehört
werden muß,
wobei das Mobiltelefon ans Ohr gehalten wird, wonach das Mobiltelefon
zum Drücken
der Tasten herabgenommen werden muß, und danach muß das Gerät wieder
ans Ohr gehoben werden. Dies muß wiederholt
werden, bis alle gewünschten
Vorgänge
durchgeführt sind.
-
Spracherkennungsgeräte des Stands
der Technik, die in Endgeräten
genutzt sind, erkennen die Telefonnummer oder den Namen des angerufenen
Teilnehmers. Eine Telefonnummer wird auf Grundlage der Erkennung
gewählt
und ein Anruf aufgebaut. Davor gibt der Benutzer die individuellen
Nummern und Namen sowohl durch Sprache als auch durch Wählen der
entsprechenden Nummern in das Endgerät ein. Eine gespeicherte Telefonnummer
in dem Endgerät
entspricht dem Namen des angerufenen Teilnehmers.
-
Ein
Problem bei den Geräten
des Stands der Technik ist, daß die
Spracherkennungsgeräte
nur zur Erkennung der individuellen Nummern oder des Namens des
angerufenen Teilnehmers und zu keinerlei anderen Zwecken genutzt
sein kann.
-
Die
Nutzung von Spracherkennung (SR) in Telekommunikationssystemen ist
dahingehend bekannt, daß in
einer Vermittlung oder einem Dienst, der der Vermittlung zugeordnet
ist, Stimmbefehle erkannt werden. Derartige Dienste sind jedoch
selten und die Mehrheit der Dienste erfordert, daß der Benutzer
die Nummern während
des Anrufs wählt.
-
Ein
Problem bei den Spracherkennungsgeräten des Stands der Technik
ist, daß sie
selten sind, so daß die
meisten der derzeitigen Dienste mithilfe einer Tastatur zu nutzen
sind. Ein weiteres Problem ist eine unzuverlässige Spracherkennung aufgrund
von Unterschiedlichkeiten der Stimmen der Benutzer.
-
Die
Patentschrift WO 9712361 beschreibt einen Telefonnetzdienst zum
Umwandeln von Sprache in Tastenwahl, wobei gesprochene Worte in
individuelle DTMF-Töne zur Zuleitung
an ein automatisiertes System umgewandelt werden, das auf die Tastenwahlsteuerung
davon anspricht. Das daraufhin erzeugte DTMF-Signal wird dann an
ein automatisiertes System wie ein Stimmübermittlungssystem oder einen
Anrufbeantworter zur Steuerung dessen Betriebs übertragen. Ein derartiger Netzdienst
kann für
den Fall, daß das
Telefon ein Wähl- oder Drehimpulstelefon
ist, oder unter Umständen,
in denen es vorzuziehen ist, zu sprechen anstatt Tasten einer Telefontastatur
zu drücken,
eingesetzt sein.
-
Die
Patentschrift
JP 02013166 beschreibt
einen Sender, der zum Verbessern der Erkennungsrate und zum Senden
eines effizienten Kompressionssignals durch Senden eines Codes,
welcher einer Stimme eines Sprechers entspricht, an eine entgegengesetzte
Zentrale angeordnet ist. An einem Stimmerkennungsabschnitt wird
eine von einem Sprecher über
ein Handgerät
eingegebene Stimme als ein Wort erkannt. Worte und Code entsprechen
einander eins zu eins in einer Stimme-Code-Vergleichstabelle. Die
erkannte Wörterkette
wird unter Nutzung der Wörterkette
als Abrufschlüssel
in einen dem Wort entsprechenden Code umgewandelt und über ein öffentliches
Tastennetz von einem DTMF-Generator an ein Sende-Empfangsgerät gesendet. Das
Sende-Empfangsgerät
empfängt
den Code von einem DTMF-Empfänger, und
ein dem Code entsprechendes Wort wird unter Nutzung des Codes als
Abrufschlüssel
aus der Vergleichstabelle in derselben Form wie der Vergleichstabelle
des Stimmcodes abgerufen. Dadurch ist eine Funktionsfähigkeit
erzielt, mit der der Sprecher mit dem Sende-Empfangsgerät kommunizieren
kann, als ob er mit jemandem eine Unterhaltung führte, ungeachtet dessen, daß die betreffende
Person nicht zur Stelle ist.
-
Es
ist eine Aufgabe der Erfindung, ein neues Verfahren zum Steuern
von Telekommunikationsdiensten bereitzustellen und dadurch die oben
angeführten
Nachteile zu beseitigen.
-
Das
erfindungsgemäße Verfahren
ist durch die Ausführungen
in Anspruch 1 gekennzeichnet. Das erfindungsgemäße Endgerät ist durch die Ausführungen
in Anspruch 5 gekennzeichnet. Bevorzugte Ausführungsformen der Erfindung
sind in den Unteransprüchen
beschrieben.
-
Die
Erfindung betrifft ein Verfahren zum Steuern eines Telekommunikationsdiensts.
Gemäß der Erfindung
umfaßt
das Verfahren folgende Schritte: Speichern eines Befehlsvokabulars
durch Sprache sowie der elektrischen Steuersignale, die den Befehlswörtern entsprechen,
in einem Endgerät,
Wählen
einer Telefonnummer und Verbinden eines Anrufs, Empfangen von Sprache
von einem Benutzer in dem Endgerät,
Erkennen eines Befehlsworts in der Sprache des Benutzers, Lesen
eines Steuersignals, das dem Befehlswort entspricht, in dem Endgerät und Senden
des aus dem Endgerät
gelesenen Steuersignals zum Steuern des Telekommunikationsdiensts
an das System.
-
Bei
einer Anwendungsmöglichkeit
der Erfindung wird das Befehlsvokabular und die entsprechenden Steuersignale
in den folgenden Schritten gespeichert: das Endgerät wird in
den Befehlsvokabulareingabezustand eingestellt, ein Befehlswort
wird geäußert, ein
Steuersignal wird in das Endgerät
gespeist und das Befehlswort und das entsprechende Steuersignal
wird gespeichert.
-
Bei
einer Anwendungsmöglichkeit
der Erfindung umfaßt
das Steuersignal eine Mehrfrequenzverfahren-Codefolge (DTMF-Codefolge). Benutzer
eines gewöhnlichen
Mobiltelefons drücken
Drucktasten, um beispielsweise Voice-Mail-Auswahlen zu treffen.
-
Bei
einer Anwendungsmöglichkeit
der Erfindung ist das Befehlsvokabular zumindest teilweise telekommunikationsdienstspezifisch.
Telekommunikationsdienstspezifisch bedeutet hier, daß das Befehlswort
ein anderes Steuersignal aufweisen kann, wenn ein anderer Telekommunikationsdienst
genutzt ist. Dies kann zumindest durch zahlreiche verschiedene Befehlsvokabularien
erzielt sein, die ein gleiches Wort umfassen, das mit verschiedenen
Steuersignalen verknüpft
ist.
-
Bei
einer Anwendungsmöglichkeit
der Erfindung ist ein Telekommunikationsdienst auf Grundlage der Telefonnummer
definiert, die im Endgerät
gewählt
ist. Der Telekommunikationsdienst ist festgelegt, aus möglicherweise
vielen mit dem Befehlswort verknüpften
Steuersignalen ein Steuersignal auszusuchen, das für den Telekommunikationsdienst
spezifisch ist.
-
Die
Erfindung betrifft außerdem
ein Endgerät.
Gemäß der Erfindung
umfaßt
das Endgerät
Mittel zum Empfangen von Sprache von dem Benutzer und Übertragen
eines Steuersignals, das einem erkannten Befehlswort entspricht,
Mittel zur Übertragung
und zum Empfang zum Aufbauen einer Verbindung mit einem Telekommunikationsdienst, Übertragen
des Steuersignals, das dem erkannten Befehlswort entspricht, und
Empfangen von Bereitschaftsmeldungen von dem Telekommunikationsdienst,
Mittel zum Abhören
der Bereitschaftsmeldungen des Telekommunikationsdiensts und Mittel
zum Eingeben von Information wie Steuersignalen und Telefonnummern,
Spracherkennungsmittel zum Erkennen eines gesprochenen Befehlsworts,
eine Steuereinheit zum Steuern des Endgeräts und ein Display zum Anzeigen
von Ergebnissen.
-
In
einer Ausführungsform
der Erfindung ist das Spracherkennungsgerät unter Nutzung eines digitalen Signalprozessors
und Speicherschaltungen verwirklicht.
-
In
einer Ausführungsform
der Erfindung ist das Mittel zum Empfangen von Sprache des Benutzers
ein separates Mikrofon mit Freisprecheinrichtung. Das Endgerät weist
für diesen
Betriebsmodus ein separates Mikrofon und Lautsprecher zum Fernbedienen
der Vorrichtung auf.
-
In
einer Ausführungsform
der Erfindung ist das Endgerät
ein mobiles Kommunikationsgerät.
-
Ein
Vorteil der Erfindung ist, daß es
nicht notwendig ist, individuelle Nummernauswahlen einer Befehlsfolge
abzurufen und zu sprechen oder einzugeben, die schwer erinnerlich
sind, sondern es kann eine Reihe von mehreren Nummernauswahlen durch Äußern eines
einzigen Worts, das der Befehlsfolge entspricht, aktiviert werden.
-
Ein
anderer Vorteil der Erfindung ist die Spracherkennungszuverlässigkeit,
nachdem der Benutzer mit seiner eigenen Stimme die Befehlswörter, die
zum Aktivieren der Steuersignale genutzt sind, in das Spracherkennungsgerät eingegeben
hat. Danach stimmen der Tonbezug, der in dem Befehlsvokabular gespeichert
ist, und die Stimme des Benutzers so genau wie möglich überein.
-
Ein
weiterer Vorteil der Erfindung ist, daß die Benutzung einer Tastatur
während
eines Gesprächs
vermieden sein kann. Dies ist bei einem Mobiltelefon vorzuziehen,
da die Benutzung der Tastatur während
eines Anrufs bei einem Mobiltelefon besonders schwierig ist.
-
Die
Erfindung wird detaillierter unter Bezugnahme auf die beiliegenden
Zeichnungen beschrieben.
-
Es
zeigen:
-
1 in
Form eines Ablaufdiagramms das Speichern eines Befehlsvokabulars
in einem Endgerät
gemäß der Erfindung;
-
2 in
Form eines Ablaufdiagramms ein Verfahren gemäß der Erfindung; und
-
3 in
Form eines Blockdiagramms wesentliche Elemente eines mobilen Kommunikationsgeräts gemäß der Erfindung.
-
1 stellt
in Form eines Ablaufdiagramms ein Verfahren gemäß der Erfindung zum Speichern
eines Befehlsvokabulars in einem Endgerät dar. Der Benutzer wählt den
Befehlsvokabulareingabezustand mithilfe von Drucktasten 11 und
wählt 12 die
Nummer des Telekommunikationsdiensts, dem das betreffende Befehlsvokabular
zugeordnet ist. Es wird dem Endgerät ein Befehlswort 13 gesagt
und dann eine Drucktastenfolge 14, die dem Befehlswort
entspricht, zum Erzeugen eines Steuersignals eingegeben. Es wird überprüft, ob alle Wörter des
Befehlsvokabulars eingegeben wurden 15, wonach entweder
die Eingabe beendet und die Dateneingabe gespeichert wird 16 oder
die Eingabe des nächsten
Befehlsworts begonnen wird.
-
2 stellt
in Form eines Ablaufdiagramms ein Verfahren gemäß der Erfindung dar. Der Benutzer wählt zunächst eine
Telefonnummer 21, und das Mobiltelefon wählt das
Vokabular aus, das dieser Nummer zugeordnet ist. Die Telefonnummer
ist beispielsweise die eines Bankdiensts, und ein Befehlsvokabular,
das für Bankdienste
optimiert ist, ist ihr in dem Endgerät zugeordnet. Als nächstes wird überprüft, ob die
Verbindung hergestellt ist 23, d.h. ob der Anrufversuch
durchgeschaltet wurde und ob der Dienst den Anruf angenommen hat.
Wenn die Verbindung hergestellt ist, geht der Vorgang zum nächsten Zustand
weiter, und wenn nicht, endet er. Im nächsten Schritt 24 wird
geprüft,
ob der Benutzer ein Wort geäußert hat,
wobei der Vorgang im zutreffenden Fall zum Erkennen des Worts 25 übergeht
und im gegenteiligen Fall zu Schritt 23 zurückkehrt.
Wenn ein Wort erkannt wird 25, wird es mit Befehlswörtern verglichen,
die in der Vorrichtung gespeichert sind, wie etwa „Konten". Auf Grundlage des
Vergleichs verzweigt sich der Vorgang folgendermaßen: wenn
das Wort kein Befehlswort ist, kehrt der Vorgang zu Schritt 23 zurück, wenn
es jedoch ein Befehlswort ist, wird das entsprechende Steuersignal 27 in
dem Endgerät
gelesen.
-
Wenn
das Steuersignal gelesen wurde 27, wird ein Steuersignal 28,
das dem Befehlswort entspricht, an den Telekommunikationsdienst,
in diesem Fall den Bankdienst, gesendet, wobei das Steuersignal
vorzugsweise eine Reihe von Tönen
ist, die aus DTMF-Tönen
gebildet sind. Dann kehrt der Vorgang zu Schritt 23 zurück, um das
nächste
Befehlswort, Beginn des Diensts oder Trennen der Verbindung zu erwarten.
-
3 zeigt
wesentliche Elemente eines mobilen Kommunikationsgeräts gemäß der Erfindung.
Das mobile Kommunikationsgerät
umfaßt
auf der Übertragungsseite
ein Mikrofon 31, Mikrofonverstärker 32 und ein Senderteil 33.
Gemeinsame Teile zu Übertragung
und Empfang beinhalten einen Duplexschalter 34 und eine Antenne 35.
Auf der Empfangsseite umfaßt
das mobile Kommunikationsgerät
ein Empfängerteil 36,
Hörerverstärker 37 und
einen Hörer 38.
Zudem beinhaltet das mobile Kommunikationsgerät eine Tastatur 39,
Spracherkennungsgerät 40,
Steuerteil 41 und ein Display 42. Während der
Unterweisungsphase des Spracherkennungsgeräts 40 oder während der
Spracherkennung wird unter Steuerung des Steuerteils 41 Klang
vom Mikrofon 31 zum Spracherkennungsgerät 40 geleitet. Anstelle
des Mikrofons 31 des Mobiltelefons kann ein Mikrofon mit
Freisprecheinrichtung genutzt sein. Das Spracherkennungsgerät 40,
das an sich bekannt ist, ist typischerweise unter Nutzung im wesentlichen
eines digitalen Signalprozessors (DSP) und Speicherschaltungen verwirklicht.
-
Als
Beispiel wird ein Fall betrachtet, in dem eine Dienstnummer angerufen
wird, für
die aufeinanderfolgende DTMF-Töne
erzeugt werden müssen,
um eine gegebene Funktion zu aktivieren. Eine derartige Dienstnummer
ist eine Sprachmailbox, die von GSM-Betreibern angeboten ist (GSM
= Global System for Mobile Communications). Eine Sprachmailbox wird
zum Anrufen einer Dienstnummer und Eingeben von Nummernfolgen genutzt,
die als DTMF-Töne übertragen
werden. Die Nummernfolgen werden zum Eingeben eines Paßworts und
Auswählen
einer gewünschten
Funktion in der logischen Baumstruktur des Diensts genutzt. Bei Nutzung
des Verfahrens gemäß der Erfindung
erkennt das Endgerät,
in diesem Falle das mobile Kommunikationsgerät, die Dienstnummer als eine
Sprachmailboxnummer und aktiviert das ihr zugeordnete Befehlsvokabular.
Wenn der Anruf eingerichtet ist, äußert der Benutzer ein Befehlswort,
das der gewünschten
Funktion entspricht und das in dem Spracherkennungsgerät des mobilen
Kommunikationsgeräts
erkannt und in dem Vokabular zu finden ist. In dem Vokabular entspricht
ein Steuersignal dem Befehlswort, und DTMF-Töne gemäß dem Steuersignal werden an
die Sprachmailbox gesendet, genau wie der Benutzer die Nummernfolge
durch Drücken
individueller Drucktasten eingeben würde. Somit ist eine Funktion
einer Sprachmailbox oder dergleichen, die eine lange und schwer
erinnerliche Befehlsfolge erfordert, leicht durch Äußern eines
Befehlsworts des passenden Vokabulars gestartet, an das sich der
Benutzer leicht erinnern kann. Solche Wörter, die zu erkennen sind,
sind beispielsweise „zurück", „weiter", „warten" usw.
-
Ein
telekommunikationsdienstspezifisches Vokabular ist beispielsweise
folgendermaßen:
Befehlswort | Steuersignal |
Paßwort | 1234 |
Abhören | #1 |
Weiter | #2 |
Zurück | #3 |
-
Das
Vokabular wird vorzugsweise wie oben beschrieben vom Benutzer in
dem mobilen Kommunikationsgerät
gespeichert; alternativ lädt
der Benutzer das Vokabular, das dem Dienst entspricht, über eine
Infrarotverbindung (IR-Verbindung)
oder Kommunikationsschnittstelle herunter.
-
Die
Erfindung kann bei einem mobilen Kommunikationsgerät Anwendung
finden, das kein Display oder sogar keine Tastatur aufweist. Ein
mobiles Kommunikationsgerät
ohne Tastatur würde
lediglich durch die Stimme gesteuert.
-
Ein
Steuersignal kann auch aus Signalen gebildet sein, die keine DTMF-Töne sind.
Derartige Signale können
beispielsweise Merkmalsvektoren sein, die bei dem Spracherkennungsvorgang
erzeugt werden.