-
Hintergrund
-
Diese
Erfindung bezieht sich auf erweiterbare Sprachbefehle, die in einer
Vorrichtung bearbeitet werden können.
-
Tragbare
Vorrichtungen wie Mobiltelephone verschaffen heutzutage Zugang zu
einer breiten Vielfalt von Diensten oder Informationen, z.B. zu
Diensten, die durch Telekommunikationsträger oder andere Parteien, etwa
Inhaltsanbieter oder Werbungtreibende, zur Verfügung gestellt oder verkauft
werden. Zum Abruf der Informationen oder Dienste muss ein Benutzer
typischerweise durch eine Reihe von Schnittstellenpräsentationen
(z.B. Bildschirme) navigieren, etwa mittels Tastatureingaben.
-
Jüngste Fortschritte
in der Spracherkennung ermöglichen
das Herstellen von Schnittstellen, bei denen die manuelle Eingabe
durch Sprechen ersetzt wird, beispielsweise durch Aussprechen des
Namens eines auf einem Bildschirm dargestellten Feldes. Benutzer
erwarten, dass immer mehr Dienste verfügbar sind, was das Abrufen
dieser Dienste selbst bei Einsatz von Spracherkennung komplex und
zeitaufwendig macht.
-
Zusammenfassung
-
Unter
einem Aspekt nutzt ein Verfahren zum Leisten von Trägerdiensten
an ein Mobilgerät
gemeinhin im Mobilgerät
gespeicherte Daten, die eine Sprachschnittstelle für das Mobilgerät spezifizieren. Diese
Daten beinhalten erste Daten, die eine Gruppe von Schnittstellenzuständen spezifizieren,
die zu einer ersten Gruppe von Funktionen gehört, und zweite Daten, die eine
Schnittstelle zum Abrufen der Trägerdienste
spezifizieren. Ein zu einer Anfrage auf Abruf der Trägerdienste
gehörender
Befehl wird empfangen, woraufhin eine oder mehrere vom Benutzer
ausgehende Eingaben in Übereinstimmung
mit den zweiten Daten bearbeitet werden. Aktionen werden auf Grundlage
der einen oder mehreren Eingaben und der zweiten Daten bearbeitet,
um dem Mobilgerät
einen der Trägerdienste
zur Verfügung
zu stellen.
-
Die
Aspekte können
eines oder mehrere der folgenden Merkmale umfassen: Die erste Gruppe von
Funktionen arbeitet unabhängig
von einem Träger,
der dem Mobilgerät
Dienste zur Verfügung
stellt.
-
Das
Empfangen des Befehls, der zu einer Anfrage auf Abruf der Trägerdienste
gehört,
beinhaltet das Annehmen einer manuellen Eingabe mittels einer Taste,
die mit den Trägerdiensten
in Zusammenhang steht.
-
Die
zweiten Daten enthalten einen Skript zur Bereitstellung eines der
Trägerdienste.
-
Die
zweiten Daten werden unabhängig
vom Empfang der ersten Daten erhalten. Das Empfangen der zweiten
Daten kann das Herunterladen der zweiten Daten von einem Träger, beispielsweise über ein drahtloses
Netzwerk, einschließen.
-
Die
zweiten Daten beinhalten Spezifikationen von Interaktionen mit entfernten
Systemen ausgehend vom Mobilgerät.
-
Die
Mobilgerät
umfasst ein Mobiltelephon.
-
Vom
Benutzer ausgehende Eingaben werden unter Verwendung der ersten
Daten bearbeitet, was darin resultiert, dass sich die Schnittstelle
in einem ersten Schnittstellenzustand befindet, wenn der zu einer
Anfrage auf Abruf der Trägerdienste
gehörende
Befehl empfangen wird. Der erste Schnittstellenzustand kann wiederhergestellt
werden, nachdem die Bearbeitung der einen oder mehreren vom Benutzer
ausgehenden Eingaben in Übereinstimmung
mit den zweiten Daten abgeschlossen ist, oder es kann ein vorgegebener
Schnittstellenzustand ausgewählt werden,
nachdem die Bearbeitung der einen oder mehreren vom Benutzer ausgehenden
Eingaben in Übereinstimmung
mit den zweiten Daten abgeschlossen ist.
-
Aspekte
der Erfindung können
einen oder mehrere der folgenden Vorteile aufweisen:
Der Benutzer
kann einen Dienst mittels eines Sprachbefehls in einem einzigen
Schritt abrufen und vermeidet so langwieriges Internet-Browsing,
das die Verwendung einer speziell dafür bestimmten Vorrichtung, z.B.
einer Maus, einer Tastatur oder eines Tastaturblocks, einschließt, um nach
Diensten, die unter Umständen
nicht einmal gänzlich
seinem Bedarf entsprechen, zu suchen und diese ausführen zu
lassen.
-
Die
Provider machen die Benutzer in einfacher und schneller Weise auf
Dienste aufmerksam, welche die Benutzer andernfalls möglicherweise nicht
entdecken würden.
-
Durch
Aussprechen von Befehlen ruft der Benutzer Dienste in der natürlichsten
Art menschlicher Kommunikation ab.
-
Der
Benutzer kann die Trägerdienste
häufiger
nutzen als bei Vorhandensein einer komplexeren Benutzerschnittstelle,
wodurch potentiell die Einkünfte
aus den Diensten gesteigert werden oder die Zufriedenheit des Benutzers
mit dem Träger
erhöht wird.
-
Der
Benutzer kann eine persönliche
Gruppe von Diensten, die seinem Bedarf angepasst sind, unterhalten,
also von Diensten, die überall
in schnellstmöglichster
Weise verfügbar
sind. Die kundenspezifische Anpassung kann das Liefern von Diensten
in Abhängigkeit
vom aktuellen Ort des Benutzers umfassen.
-
Weitere
Merkmale und Vorteile der Erfindung gehen aus der folgenden Beschreibung
und den Ansprüchen
hervor.
-
Beschreibung
der Zeichnungen
-
1 ist
ein Blockdiagramm eines Kommunikationssystems.
-
2 ist
ein Diagramm, das einen Schnittstellenzustand zeigt.
-
Beschreibung
-
Bezugnehmend
auf 1 kann ein Benutzer 14 ein Mobilgerät 18 (z.B.
ein Telephon oder einen PDA/Minicomputer) bedienen, um eine breite
Vielfalt von Diensten abzurufen, die von einem Träger 10 oder
einem Dienst- oder Informationsanbieter 12 über ein
drahtloses Netzwerk 17, z.B. ein Funktelefonnetzwerk, zur
Verfügung
gestellt werden. Das Mobilgerät 18 umfasst
eine Sprachschnittstelle 22, die dem Benutzer 14 ermöglicht,
Befehle zu sprechen, die den Betrieb des Geräts 18 oder Anwendungen 30 steuern,
die auf dem Gerät 18 untergebracht
oder in anderer Weise über
dieses zugänglich
sind. Die Sprachschnittstelle 22 nutzt eine Spracherkennungsmaschine,
welche die vom Benutzer gesprochenen Befehle identifiziert. Einige
der Anwendungen können
Informationen oder Dienste abrufen, die entfernt vom Gerät 18 durch
den Träger 10 zur
Verfügung
gestellt werden. Hinsichtlich nachstehender Beschreibung sollte
verständlich
sein, dass Informationen oder Dienste alternativ oder zusätzlich von
Dienst- oder Informationsanbietern 12 geboten werden könnten, die
möglicherweise
separat vom Träger
auftreten oder nicht unbedingt zu diesem gehören.
-
Beispielsweise
können
die Anwendungen 30 den Benutzer 14 mit einem breiten
Angebot an Diensten versorgen, von der einfachsten Wettertextaktualisierung
bis hin zu komplexen Diensten, wie das Aufnehmen eines Photos und
dessen Platzierung auf einer Website. Eine im Mobilgerät 18 untergebrachte
Sprachsteueranwendung 24 steuert die Sprachschnittstelle 22 in
Entsprechung zu Daten, die eine Gruppe von Schnittstellenzuständen definieren.
-
Schnittstellenzustände können in
Zusammenhang stehen mit Zwischenpunkten in einer Interaktion mit
vielen Wenden, bei der das Gerät
dem Benutzer Informationen verschafft (beispielsweise auf der Anzeige
und/oder per Audioausgabe), und dann der Benutzer eine Eingabe liefert
(z.B. per Stimme oder manuell). Der Zustand im Allgemeinen umfasst Informationen,
die sowohl den Punkt in der Interaktion als auch spezifische Informationen
definieren, die dem Benutzer angezeigt oder in anderer Weise präsentiert
werden. Beispielsweise ist das Gerät bei jedem Zustand in der
Lage, eine begrenzte Gruppe von Befehlen anzuzeigen, und der Benutzer
liefert einen der Befehle, welche Aktionen oder Veränderungen des
Zustands in der Schnittstelle bewirken können. Typischerweise sind die
Zustände
der Schnittstelle in einer Menübaumstruktur
angeordnet.
-
Eine
derartige Menübaumstruktur
enthält
typischerweise einen Wurzelzustand, in welchem dem Benutzer eine
allgemeine Gruppe von Befehlen zur Verfügung steht. Jeder unterschiedliche
Befehl, der vom Benutzer eingegeben werden kann, ist mit einem Übergang
zu einem Zustand auf einer nächsten Ebene
verbunden. Beispielsweise kann ein Benutzer zur Einstellung der
Klingeltonlautstärke
im Wurzelzustand einen Befehl für „Einstellungen" wählen, im nächsten Zustand
einen Befehl für „Telephon", in einem weiteren
Zustand einen Befehl für „Klingeltonlautstärke" und schließlich im
finalen Zustand der Interaktion einen Lautstärkepegel. Teilweise bedingt durch
den begrenzten Charakter der manuellen Eingaben auf dem Gerät, wie im
Beispiel der Klingeltonlautstärke,
kann das Abrufen irgendeiner bestimmten Funktion oder eines beliebigen
speziellen Dienstes zahlreiche Interaktionen erfordern.
-
Das
Mobilgerät 18 enthält Daten,
welche Befehle spezifizieren, die der Benutzer bei unterschiedlichen
Zuständen
der Schnittstelle und entsprechenden Aktionen, die ausgeführt werden
sollen, verwenden kann, wenn er einen Befehl ausspricht oder in anderer
Form eingibt. Die Daten, welche die Schnittstelle spezifizieren,
beinhalten sowohl generische Schnittstellendaten 27 als
auch Trägerschnittstellendaten 28.
Im Allgemeinen spezifizieren die generischen Schnittstellendaten 27 einen
Menübaum,
der sich auf Funktionen oder Dienste bezieht, die mit den Fähigkeiten
des Telephons in Verbindung stehen oder die möglicherweise für keinen
bestimmten Träger
spezifisch sind. Die Trägerschnittstellendaten 28 betreffen
Dienste oder Informationen, die gemeinhin trägerspezifisch sind, oder auch
Dienst- oder Informationsanbieter, die nicht notwendigerweise bei
allen Trägern
verfügbar
sind.
-
Eine
Aktion kann sich komplex gestalten und beispielsweise die Verwendung
einer oder mehrerer Anwendungen und/oder einer oder mehrerer Interaktionen
mit dem Träger
oder dem entfernten Dienst- oder Informationsanbieter umfassen.
Bei einigen der Befehle, die in den Schnittstellendaten 27 und 28 spezifiziert
sind, kann es sich um „Shortcuts" handeln, die einen
entfernten Dienst oder entfernte Informationen mittels eines einzigen
Sprachbefehls direkt abrufen und damit einen Vorgang ersetzen, der
sonst mehrere Interaktionen einschließen würde.
-
Ein
Träger 10,
der dem Mobilgerät 18 Dienste
zur Verfügung
stellt, kann eine Gruppe von Diensten anbieten, über die speziell besagter Träger verfügt. Beispielsweise
können
derartige Dienste Hilfsdienste, Zugang zu Informationsportalen oder
zu Portalen zum Herunterladen von Anwendungen, Musikdienste, Spieldienste,
ortsbasierte (informationshaltige oder absatzorientierte) Dienste
und Dienste zur Gesprächsverwaltung
umfassen (z.B. zum Einrichten von Mehrteilnehmergesprächen und
zum Ermöglichen
von Roaming oder auch andere Verwaltungsdienste). Der Träger liefert
dem Mobilgerät 18 Trägerschnittstellendaten 28,
um eine Schnittstelle zu diesen Trägerdiensten zu spezifizieren.
Diese Daten können
vom Träger
auf mehrere alternative Arten zur Verfügung gestellt werden. Beispielsweise
kann die Trägerschnittstelle 28 auf
Anfrage des Trägers durch
den Gerätehersteller
in einen nichtflüchtigen Speicher
im Mobilgerät 18 eingebettet
werden. Alternativ dazu besteht die Möglichkeit, die Daten auf das Gerät als Teil
der Bereitstellung des Mobildienstes für den Benutzer oder auch aus
dem Träger
herunterzuladen (z.B. können
sie unter Verwendung von OTA oder webbasierten Protokollen vom Träger geschoben
oder aus diesem gezogen werden), und zwar während der Servicezeit des Geräts, etwa
wenn der Benutzer einen neuen Dienst abonniert.
-
Ein
veranschaulichendes technisches Merkmal des Mobilgeräts besteht
darin, dass die generischen Schnittstellendaten 27 und
die Trägerschnittstellendaten 28 unabhängig voneinander
beibehalten werden können,
z.B. indem sie zu verschiedenen Zeitpunkten oder unter Verwendung
unterschiedlicher, unabhängiger
Verfahren in das Mobilgerät
geladen werden. Dies unterstützt
verschiedene Träger, die
unterschiedliche Gruppen von Diensten anbieten, oder ein und denselben
Träger,
der im Lauf der Zeit oder verschiedenen Teilnehmern unterschiedliche Dienste
anbietet, ohne dass die generischen Schnittstellendaten 27 oder
die Menüstruktur,
an die sich der Benutzer möglicherweise
gewöhnt
hat, verändert werden
müssen.
-
Die
Trägerschnittstellendaten 28 spezifizieren
die Charakteristiken der Benutzerschnittstelle, die es dem Benutzer
ermöglichen,
die Dienste des Trägers
abzurufen. In einem Beispiel für
eine solche Schnittstelle wird eine spezielle Taste 19 genutzt,
die dem Benutzer Zugang zu „Sprachdiensten" auf dem Gerät verschafft,
die bei jedem Zustand der Schnittstelle in Abhängigkeit von Entscheidungen,
die der Träger
(oder das Trägerproxy,
das Herstellergerät) trifft,
selektiv aktiviert werden. In einem derartigen Beispiel ist die
Spracherkennungsmaschine so konzipiert, dass sie Sprachbefehle annimmt
(beispielsweise durch Initialisieren oder Erzeugen einer Softwareinstanz
von Spracherkennungssoftware), wenn der Benutzer die Sprachdiensttaste 19 drückt, und das
Gerät zeigt
auf die Sprachdienste bezogene Informationen an, etwa ein Menü, das die
verfügbaren Dienste
aufführt.
Anzumerken ist, dass bei dauernder Aktivierung der Taste diese Sprachdienste
für den Benutzer
unabhängig
vom Status des Geräts
verfügbar
sind. Beispielsweise kann ein Benutzer unter Verwendung von Sprachdiensten
sofort vom Bildschirm einer SMS-Anwendung
zu einer Spiele-Site übergehen,
und nach Herunterladen eines Spiels kann er seine SMS-Anwendung
an der Stelle wiederaufnehmen, wo er sie verlassen hat.
-
Die
Sprachdienste des Trägers,
die ausgehend von irgendeinem Zustand in der Menüstruktur implementiert werden,
können
das Gerät
nach Wunsch des Trägers
zu einem Topmenü zurücksetzen,
oder der Zustand des Geräts
kann gespeichert und der Benutzer zu jenem Punkt zurückgeführt werden,
von dem aus die Sprachdienste initialisiert wurden. Anzumerken gilt,
dass der Zustand eines Geräts im
Allgemeinen eine Kombination daraus umfasst, wohin die Anzeige im
Menü zeigt,
was auf dem Bildschirm dargestellt ist und eventuell wie der Status
eines oder mehrerer der Netzwerke lautet (z.B. Empfangen einer SMS
inmitten eines Telephongespräches,
Anhören
eines Musik-Clips).
-
In
diesem Beispiel für
die Schnittstelle erscheint, wenn der Benutzer die Sprachdiensttaste 19 drückt, ein
Menü, in
dem die Auswahlzeilen des Trägers
oder der dritten Partei aufgelistet sind (beispielsweise Klingeltöne, Aktienkurse,
Unterstützung
durch die Vermittlung). Alternativ dazu kann das Gerät zu einem „Standard"-Bildschirm für Sprachdienste
gelenkt werden, wobei die genutzte Fläche der Anzeige ganz oder teilweise übernommen
wird. Der Zustand des Telephons kann zwecks Rückführung nach Beendigung des Sprachdiensts
gecached werden. Wie auch immer der Zustand des Telephons sein mag,
er wird unterbrochen, und die Sprachdienstanwendung wird gestartet,
wobei dem Benutzer Zeichenketten angezeigt werden. Der Benutzer
kann jede beliebige der aufgelisteten Zeichenketten aussprechen,
und das Telephon führt
die entsprechende Aktion aus, wie durch die Trägerverknüpfung zwischen einem Satz und
einer Aktion spezifiziert. Spricht der Benutzer beispielsweise das
Wort „Klingeltöne" aus, startet das
Telephon einen Browser und richtet ihn auf die Site zum Herunterladen
von Klingeltönen,
die der Träger
spezifiziert hat. Zu beachten gilt, dass der Träger Funktionen aktivieren kann,
die zwar mittels des Sprachdienstmenüs verfügbar, aber nicht ausdrücklich gelistet
sind. (Solange sich die passenden Zeichenketten in der Vokabelliste
der Spracherkennungseinrichtung befinden, werden sie erkannt.) Unter
den Zeichenketten, die sich unauffällig verfügbar machen lassen, könnten sich „911", „Unterstützung durch
die Vermittlung", „Rechnungshilfe" oder dergleichen
befinden.
-
Der
Träger
kann die Wahl treffen, dass ihm einige Sprachdienste nur bei ausgewählten Telephonzuständen zur
Verfügung
stehen (z.B. ist eine „Unterstützung durch
die Vermittlung" möglicherweise
nicht verfügbar,
falls ein Telefongespräch
in Gang ist), und es besteht die Möglichkeit auszuwählen, welche
Aktionen bei jedem Zustand in der Funktelephonaktivität durchgeführt werden
können.
Ebenfalls zu beachten ist, dass Sprachdienste durch die Sprachdiensttaste 19 initialisiert
werden können
oder alternativ dazu mittels eines Softkeys in einem PDA-Gerät oder mittels
eines Trigger-Sprachbefehls auf einer Permanenthörvorrichtung. Auf den Trägern können die
auswählbaren
Dienste bei Verkauf des Telephons installiert sein, oder die Träger können die entsprechenden
Teile der Benutzerschnittstelle und weitere Komponenten nach Bedarf
durch Herunterladen von Informationen Over-the-Air oder durch Synching
mit einem separaten Computer aktualisieren.
-
Mit
Blick auf 2 ruft in einem weiteren Beispiel
für einen
Dienst, der von einem diese Methode nutzenden Träger zur Verfügung gestellt
werden kann, ein Benutzer seinen Kalender auf seinem Mobiltelephon
ab, wobei sich die generische Schnittstelle in einem Kalenderzustand 210 befindet;
jedoch würde
der Benutzer gerne den Kurs der IBM-Aktie kennen. Auf dem Träger ist
im Sprachmenü ein „Aktienkurs" genannter Sprachdienst
installiert, der zu der ausgewählten
Sprachdiensttaste gehört,
und der Benutzer oder der Träger
hat eine finite Gruppe von Aktien identifiziert, nach denen der
Benutzer fragen kann. Der Benutzer blickt auf einen Bildschirm,
der seinen aktuellen Kalender darstellt. Er drückt die Sprachdiensttaste 19,
was darin resultiert, dass die Schnittstelle in einen Sprachdienstzustand 250 tritt. Der
Bildschirm wird zeitweise mit einer Liste von Befehlen überschrieben,
die er sagen kann und von denen einer „Aktienkurs" lautet. Der Benutzer
sagt „Aktienkurs", woraus sich ein
Zustandsübergang
zu Zustand 255 ergibt, in dem das Telephon (entweder hörbar oder
auf der Anzeige oder auch beides) mit „welcher Kurs" antwortet; der Bildschirm
zeigt eine Liste der Aktienkurse, die verfügbar sind. „IBM" stellt eine der Wahlmöglichkeiten
auf dieser Liste dar, und der Benutzer sagt „IBM". Das Telephon erkennt IBM, geht zu
Status 260 über
und sendet eine Nachricht an den Träger zurück, damit dem Benutzer der IBM-Aktienkurs geliefert
wird. (Diese Lieferung an den Träger
kann über
einen SMS-Kanal,
eine IP-Verbindung, über
WIFI falls verfügbar
oder über
jedes beliebige andere Netzwerk erfolgen, das für den Benutzer und/oder den
Träger
verfügbar
ist.)
-
Im
Anschluss an den Empfang der Anfrage nach der IBM-Kursnotierung
sucht der Träger
den gegenwärtigen
IBM-Aktienkurs heraus und sendet eine SMS mit dem aktuellen IBM-Kurs
an den Benutzer. Alternativ dazu kann der Träger dem Benutzer eine URL zur
Verwendung mit dem ins Telephon eingebauten WAP-Browser oder mit
dem auf einigen Telephonen verfügbaren
HTML-Browser senden; darüber
hinaus kann er ein Telephongespräch
mit dem Benutzer beginnen, in dem der Kurs genannt wird, oder eine
Audionachricht für
den Benutzer in dessen Voicemail-Inbox hinterlassen, oder es kann
sogar eine Email oder MMS-Nachricht gesandt werden; ferner besteht
die Möglichkeit,
weitere Lieferdienste einzusetzen. Nach Abschluss der Aktienkursinteraktion kehrt
die Schnittstelle zum Kalenderzustand 210 zurück, in dem
die Sprachdiensttaste 19 ursprünglich gedrückt wurde.
-
In
einem weiteren Beispiel führt
der Benutzer ein Telephongespräch
mit einem anderen Benutzer, und beide wären am Aktienkurs interessiert.
Der Benutzer drückt
die Sprachdiensttaste und fragt nach einer verbalen Kursangabe für IBM-Aktien. Der Träger liefert
eine Sprachnachricht mit dem Aktienkurs, und diese Mitteilung kann
für beide
Zuhörer
gleichzeitig abgespielt werden.
-
In
noch einem weiteren Beispiel könnte
der Benutzer die Absicht haben, sich die aktuellen Nachrichten von
CNN anzuhören.
Es wird davon ausgegangen, dass sich der Benutzer zwar einen Eintrag
in seinem PIM ansieht, dass aber die Sprachstarttaste für diesen
Zustand aktiviert ist und ferner dass der Träger CNN als Eintrag unter den
verfügbaren
Befehlen gelistet hat. Der Benutzer drückt die Sprachdiensttaste,
woraufhin der Bildschirm eine Liste von Befehlen anzeigt, von denen
einer „CNN" ist. Der Benutzer
sagt: „CNN", und das Telephon
sendet eine Anfrage an den Träger,
damit eine Multimedia-Session eingeleitet wird, die dem Benutzer
CNN über
sein Telephon liefert. Daraufhin wird der Telephonzustand durch
eine multimodale Übertragung
von CNN unterbrochen, und der Benutzer hört solange zu, bis diese zu
Ende ist oder bis er den Empfang unterbricht.
-
Bei
Betrieb der sprachbasierten Benutzerschnittstelle erfasst die Sprachschnittstelle 22 digitale
Sprachsignale, welche vom Benutzer 14 Gesprochenes enthalten,
und identifiziert Befehle in dem Gesprochenen; außerdem ist
sie in der Lage, dem Benutzer 14 digitale Sprachsignale
in hörbarer
Form zu liefern (d.h. synthetisierte oder aufgezeichnete Sprache).
Das vom Benutzer empfangene digitale Sprachsignal wird durch die
Spracherkennungsmaschine bearbeitet, damit der Sprachbefehl erkannt wird.
Ein Text-zu-Sprache-Modul erzeugt digitale Sprachsignale anhand
des Texts, der dem Benutzer 14 vorzulegen ist.
-
Die
Schnittstellendaten 27 und 28 enthalten die Spezifikation
von Befehlen, die der Benutzer sprechen kann und Zuordnungen zwischen
den Befehlen und den Aktionen, die auszuführen sind, wenn der Benutzer
einen Befehl ausspricht. Die Spezifikation einer Aktion kann die
Form eines Text-Strings besitzen, der eine oder mehrere Anweisungen
enthält, oder
eines Skripts, das zwecks Ausführung
der Aktion bearbeitet werden kann. Beispielsweise kann eine solche
Anweisung eine bestimmte auszuführende Anwendung 30 und
Eingaben identifizieren, die für diese
Anwendung zu tätigen
sind. Eine zu einem Befehl gehörende
Aktion kann spezifizieren, dass die Anwendung darin besteht, mit
dem Trägerserver 16 über ein drahtloses
Telekommunikationsnetzwerk 17 zu kommunizieren. Beispielsweise
kann das Mobilgerät 18 mit
den Trägerservern 16 durch
Media Messaging Services (MMS) kommunizieren, die speziell dafür entworfen
sind, um Multimediadienste an Mobilgeräte zu liefern, oder durch das
Wireless Application Protocol (WAP). Die Trägerserver 16 können das MMS
Push-Verfahren nutzen, um Multimedianachrichten an das Mobilgerät 18 zu
liefern. Die Kommunikation zwischen dem Mobilgerät 18 und den Trägerservern 16 ist
nicht auf die spezifischen Verfahren und Protokolle beschränkt, die
oben aufgezeigt sind.
-
Im
Mobilgerät 18 läuft ein
Prozess ab, der durch die Sprachanwendung 24 koordiniert
wird und der die sprachbezogenen Informationen in den Trägerschnittstellendaten 28 aktualisiert.
In diesem Prozess aktualisiert der Träger das Vokabular in den Trägerschnittstellendaten 28.
Dieses Vokabular definiert die Liste gesprochener Worten, die vom
Mobilgerät 18 erkannt
werden. Während
der Aktualisierung des Vokabulars wird der Benutzer 14 auf
die neuen gültigen
Worte hingewiesen, die er einsetzen kann, um mit dem Gerät 18 zu
kommunizieren; beispielsweise werden dem Benutzer die neuen gültigen Äußerungen
via das Text-zu-Sprache-Modul 26 oder
auf dem Bildschirm als Text und Sprache vorgestellt. Der Träger kann
die Grammatik in den Trägerschnittstellendaten 28 auf
den neuesten Stand bringen. Die Sprachbenutzerschnittstelle 22 wendet
die Grammatik und das Vokabular an, um die Sprachbefehle des Benutzers
zu verstehen.
-
Ferner
ist der Träger
zur Aktualisierung der Gruppe von Anwendungen 30 in der
Lage, entweder durch Ersetzen alter Anwendungen oder durch Hinzufügen neuer
Anwendungen. Die Anwendungen 30 spiegeln das Angebot an
Diensten wider, die für
den Benutzer verfügbar
sind. Eine neue Anwendung entspricht einem neuen Dienst, der für den Benutzer
verfügbar
gemacht wird.
-
Mit
Unterstützung
der Sprachanwendung 24 kann der Benutzer 14 bei
der Pflege der Trägerschnittstellendaten 28 mitwirken.
Beispielsweise kann der Benutzer die Gruppe von Sprachbefehlen, die
er einsetzen kann, überprüfen und
für jeden Sprachbefehl
bestimmen, welcher Dienst geleistet wird. Der Benutzer 14 kann
die Entscheidung treffen, Befehle und Anwendungen zu löschen, die
unterinteressante Dienste verschaffen.
-
Obgleich
der Benutzer 14 vom Träger
Aktualisierungen für
neue Dienste auf regelmäßiger Basis erhalten
kann, können
Fälle eintreten,
bei denen der Benutzer einen Dienst möchte, über den er nicht verfügt. Der
Benutzer 14 kann über
die Identität
des Trägers
und den Ort seiner Server 16 im Bilde sein und den Inhalt
der Server auf der Suche nach einem Dienst durchsehen. Außerdem ist
es möglich,
dass der Benutzer den Ort eines bestimmten Dienstes entweder aufgrund
vergangener Erfahrung mit besagtem Dienst oder jüngster Werbung kennt. Ungeachtet dessen,
wie der Benutzer einen gewünschten
Dienst identifiziert, kann er eine speziell dafür bestimmte Player-Anwendung
verwenden, um die notwendige Unterstützung für den gewünschten neuen Dienst herunterzuladen.
-
Zusätzlich oder
als eine Alternative zum Träger
kann eine Reihe anderer Parteien Dienste in Mobilgeräten zur
Verfügung
stellen. Träger
können
ihre Kunden mit Mobilgeräten
ausstatten, die eine Anfangsgruppe von Diensten unterstützen, die
sich mittels Sprachbefehlen in einem einzigen Schritt starten lassen.
-
Träger können die
Liste verfügbarer
Dienste erweitern oder anderen Parteien, wie Werbetreibenden oder
Verkäufern,
gestatten, ihre Kunden mit neuen Diensten in einer Vielfalt von
Geschäftsszenarien zu
erreichen.
-
In
einer Ausführungsform
wird die oben erläuterte
Methode in Software implementiert oder in einer Kombination aus
Soft- und Hardware. Die Software im Mobilgerät, die gemeinhin Anweisungen
für einen
physischen oder virtuellen Prozessor enthält, kann sich auf einem maschinenlesbaren
Medium befinden, z.B. in einem nichtflüchtigen Halbleiterspeicher.
Die Software kann in einem übertragenen
Signal enthalten dem Mobilgerät
geliefert werden, z.B. enthalten in Datensignalen, die über das
drahtlose Netzwerk übertragen
werden.
-
Selbstverständlich ist
die vorangehende Beschreibung vorgesehen, um die Tragweite der Erfindung,
die durch die Tragweite der beigefügten Ansprüche definiert ist, zu veranschaulichen
und nicht, um sie einzuschränken.
Weitere Ausführungsformen befinden
sich innerhalb der Tragweite der folgenden Ansprüche.
-
Zusammenfassung
-
(57)
Zusammenfassung: Ein Mobilgerät,
wie z.B. ein Mobiltelephon, enthält
eine Sprachschnittstelle, die einen ersten Teil aufweist, der unter
Umständen
nicht für
einen bestimmten Träger
spezifisch ist, und einen zweiten Teil, der eine Schnittstelle für Dienste
zur Verfügung
stellt, die entweder für
einen Träger
oder für
Dienst- oder Informationsanbieter spezifisch sind, die nicht unbedingt
bei allen Trägern verfügbar sind.
Mühelosen
Zugang zu den Trägerdiensten
bietet eine Sprachbefehlschnittstelle. Die Gruppe von Trägerdiensten
ist optional vom Träger erweiterbar.