DE112005001540T5 - Erweiterbare Sprachbefehle - Google Patents

Erweiterbare Sprachbefehle Download PDF

Info

Publication number
DE112005001540T5
DE112005001540T5 DE112005001540T DE112005001540T DE112005001540T5 DE 112005001540 T5 DE112005001540 T5 DE 112005001540T5 DE 112005001540 T DE112005001540 T DE 112005001540T DE 112005001540 T DE112005001540 T DE 112005001540T DE 112005001540 T5 DE112005001540 T5 DE 112005001540T5
Authority
DE
Germany
Prior art keywords
data
interface
services
carrier
mobile device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE112005001540T
Other languages
English (en)
Inventor
Daniel L. Boston Roth
Chris Cambridge Reiner
Mark Indian Harbor Beach Furnari
Jordan Gloucester Cohen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Voice Signal Technologies Inc
Original Assignee
Voice Signal Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Voice Signal Technologies Inc filed Critical Voice Signal Technologies Inc
Publication of DE112005001540T5 publication Critical patent/DE112005001540T5/de
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72406User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by software upgrading or downloading
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42136Administration or customisation of services
    • H04M3/42178Administration or customisation of services by downloading data to substation equipment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/18Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Telephonic Communication Services (AREA)
  • Toys (AREA)
  • Telephone Function (AREA)

Abstract

Verfahren zur Bereitstellung von Träger- bzw. Betreiberdiensten an einem Mobilgerät, umfassend:
das Speichern von Daten im Mobilgerät, die eine Sprachschnittstelle für das Mobilgerät spezifizieren, einschließlich des Speicherns erster Daten, die eine Gruppe von Schnittstellenzuständen spezifizieren, die zu einer ersten Gruppe von Funktionen gehört, und des Speicherns zweiter Daten, die eine Schnittstelle zum Abrufen der Träger- bzw. Betreiberdienste spezifizieren;
das Erhalten eines Befehls, der zu einer Anfrage auf Abruf der Träger- bzw. Betreiberdienste gehört;
das Bearbeiten einer oder mehrerer vom Benutzer ausgehender Eingaben in Übereinstimmung mit den zweiten Daten;
das Durchführen von Aktionen basierend auf der einen oder den mehreren Eingaben und den zweiten Daten, um einen der Träger- bzw. Betreiberdienste am Mobilgerät zur Verfügung zu stellen.

Description

  • Hintergrund
  • Diese Erfindung bezieht sich auf erweiterbare Sprachbefehle, die in einer Vorrichtung bearbeitet werden können.
  • Tragbare Vorrichtungen wie Mobiltelephone verschaffen heutzutage Zugang zu einer breiten Vielfalt von Diensten oder Informationen, z.B. zu Diensten, die durch Telekommunikationsträger oder andere Parteien, etwa Inhaltsanbieter oder Werbungtreibende, zur Verfügung gestellt oder verkauft werden. Zum Abruf der Informationen oder Dienste muss ein Benutzer typischerweise durch eine Reihe von Schnittstellenpräsentationen (z.B. Bildschirme) navigieren, etwa mittels Tastatureingaben.
  • Jüngste Fortschritte in der Spracherkennung ermöglichen das Herstellen von Schnittstellen, bei denen die manuelle Eingabe durch Sprechen ersetzt wird, beispielsweise durch Aussprechen des Namens eines auf einem Bildschirm dargestellten Feldes. Benutzer erwarten, dass immer mehr Dienste verfügbar sind, was das Abrufen dieser Dienste selbst bei Einsatz von Spracherkennung komplex und zeitaufwendig macht.
  • Zusammenfassung
  • Unter einem Aspekt nutzt ein Verfahren zum Leisten von Trägerdiensten an ein Mobilgerät gemeinhin im Mobilgerät gespeicherte Daten, die eine Sprachschnittstelle für das Mobilgerät spezifizieren. Diese Daten beinhalten erste Daten, die eine Gruppe von Schnittstellenzuständen spezifizieren, die zu einer ersten Gruppe von Funktionen gehört, und zweite Daten, die eine Schnittstelle zum Abrufen der Trägerdienste spezifizieren. Ein zu einer Anfrage auf Abruf der Trägerdienste gehörender Befehl wird empfangen, woraufhin eine oder mehrere vom Benutzer ausgehende Eingaben in Übereinstimmung mit den zweiten Daten bearbeitet werden. Aktionen werden auf Grundlage der einen oder mehreren Eingaben und der zweiten Daten bearbeitet, um dem Mobilgerät einen der Trägerdienste zur Verfügung zu stellen.
  • Die Aspekte können eines oder mehrere der folgenden Merkmale umfassen: Die erste Gruppe von Funktionen arbeitet unabhängig von einem Träger, der dem Mobilgerät Dienste zur Verfügung stellt.
  • Das Empfangen des Befehls, der zu einer Anfrage auf Abruf der Trägerdienste gehört, beinhaltet das Annehmen einer manuellen Eingabe mittels einer Taste, die mit den Trägerdiensten in Zusammenhang steht.
  • Die zweiten Daten enthalten einen Skript zur Bereitstellung eines der Trägerdienste.
  • Die zweiten Daten werden unabhängig vom Empfang der ersten Daten erhalten. Das Empfangen der zweiten Daten kann das Herunterladen der zweiten Daten von einem Träger, beispielsweise über ein drahtloses Netzwerk, einschließen.
  • Die zweiten Daten beinhalten Spezifikationen von Interaktionen mit entfernten Systemen ausgehend vom Mobilgerät.
  • Die Mobilgerät umfasst ein Mobiltelephon.
  • Vom Benutzer ausgehende Eingaben werden unter Verwendung der ersten Daten bearbeitet, was darin resultiert, dass sich die Schnittstelle in einem ersten Schnittstellenzustand befindet, wenn der zu einer Anfrage auf Abruf der Trägerdienste gehörende Befehl empfangen wird. Der erste Schnittstellenzustand kann wiederhergestellt werden, nachdem die Bearbeitung der einen oder mehreren vom Benutzer ausgehenden Eingaben in Übereinstimmung mit den zweiten Daten abgeschlossen ist, oder es kann ein vorgegebener Schnittstellenzustand ausgewählt werden, nachdem die Bearbeitung der einen oder mehreren vom Benutzer ausgehenden Eingaben in Übereinstimmung mit den zweiten Daten abgeschlossen ist.
  • Aspekte der Erfindung können einen oder mehrere der folgenden Vorteile aufweisen:
    Der Benutzer kann einen Dienst mittels eines Sprachbefehls in einem einzigen Schritt abrufen und vermeidet so langwieriges Internet-Browsing, das die Verwendung einer speziell dafür bestimmten Vorrichtung, z.B. einer Maus, einer Tastatur oder eines Tastaturblocks, einschließt, um nach Diensten, die unter Umständen nicht einmal gänzlich seinem Bedarf entsprechen, zu suchen und diese ausführen zu lassen.
  • Die Provider machen die Benutzer in einfacher und schneller Weise auf Dienste aufmerksam, welche die Benutzer andernfalls möglicherweise nicht entdecken würden.
  • Durch Aussprechen von Befehlen ruft der Benutzer Dienste in der natürlichsten Art menschlicher Kommunikation ab.
  • Der Benutzer kann die Trägerdienste häufiger nutzen als bei Vorhandensein einer komplexeren Benutzerschnittstelle, wodurch potentiell die Einkünfte aus den Diensten gesteigert werden oder die Zufriedenheit des Benutzers mit dem Träger erhöht wird.
  • Der Benutzer kann eine persönliche Gruppe von Diensten, die seinem Bedarf angepasst sind, unterhalten, also von Diensten, die überall in schnellstmöglichster Weise verfügbar sind. Die kundenspezifische Anpassung kann das Liefern von Diensten in Abhängigkeit vom aktuellen Ort des Benutzers umfassen.
  • Weitere Merkmale und Vorteile der Erfindung gehen aus der folgenden Beschreibung und den Ansprüchen hervor.
  • Beschreibung der Zeichnungen
  • 1 ist ein Blockdiagramm eines Kommunikationssystems.
  • 2 ist ein Diagramm, das einen Schnittstellenzustand zeigt.
  • Beschreibung
  • Bezugnehmend auf 1 kann ein Benutzer 14 ein Mobilgerät 18 (z.B. ein Telephon oder einen PDA/Minicomputer) bedienen, um eine breite Vielfalt von Diensten abzurufen, die von einem Träger 10 oder einem Dienst- oder Informationsanbieter 12 über ein drahtloses Netzwerk 17, z.B. ein Funktelefonnetzwerk, zur Verfügung gestellt werden. Das Mobilgerät 18 umfasst eine Sprachschnittstelle 22, die dem Benutzer 14 ermöglicht, Befehle zu sprechen, die den Betrieb des Geräts 18 oder Anwendungen 30 steuern, die auf dem Gerät 18 untergebracht oder in anderer Weise über dieses zugänglich sind. Die Sprachschnittstelle 22 nutzt eine Spracherkennungsmaschine, welche die vom Benutzer gesprochenen Befehle identifiziert. Einige der Anwendungen können Informationen oder Dienste abrufen, die entfernt vom Gerät 18 durch den Träger 10 zur Verfügung gestellt werden. Hinsichtlich nachstehender Beschreibung sollte verständlich sein, dass Informationen oder Dienste alternativ oder zusätzlich von Dienst- oder Informationsanbietern 12 geboten werden könnten, die möglicherweise separat vom Träger auftreten oder nicht unbedingt zu diesem gehören.
  • Beispielsweise können die Anwendungen 30 den Benutzer 14 mit einem breiten Angebot an Diensten versorgen, von der einfachsten Wettertextaktualisierung bis hin zu komplexen Diensten, wie das Aufnehmen eines Photos und dessen Platzierung auf einer Website. Eine im Mobilgerät 18 untergebrachte Sprachsteueranwendung 24 steuert die Sprachschnittstelle 22 in Entsprechung zu Daten, die eine Gruppe von Schnittstellenzuständen definieren.
  • Schnittstellenzustände können in Zusammenhang stehen mit Zwischenpunkten in einer Interaktion mit vielen Wenden, bei der das Gerät dem Benutzer Informationen verschafft (beispielsweise auf der Anzeige und/oder per Audioausgabe), und dann der Benutzer eine Eingabe liefert (z.B. per Stimme oder manuell). Der Zustand im Allgemeinen umfasst Informationen, die sowohl den Punkt in der Interaktion als auch spezifische Informationen definieren, die dem Benutzer angezeigt oder in anderer Weise präsentiert werden. Beispielsweise ist das Gerät bei jedem Zustand in der Lage, eine begrenzte Gruppe von Befehlen anzuzeigen, und der Benutzer liefert einen der Befehle, welche Aktionen oder Veränderungen des Zustands in der Schnittstelle bewirken können. Typischerweise sind die Zustände der Schnittstelle in einer Menübaumstruktur angeordnet.
  • Eine derartige Menübaumstruktur enthält typischerweise einen Wurzelzustand, in welchem dem Benutzer eine allgemeine Gruppe von Befehlen zur Verfügung steht. Jeder unterschiedliche Befehl, der vom Benutzer eingegeben werden kann, ist mit einem Übergang zu einem Zustand auf einer nächsten Ebene verbunden. Beispielsweise kann ein Benutzer zur Einstellung der Klingeltonlautstärke im Wurzelzustand einen Befehl für „Einstellungen" wählen, im nächsten Zustand einen Befehl für „Telephon", in einem weiteren Zustand einen Befehl für „Klingeltonlautstärke" und schließlich im finalen Zustand der Interaktion einen Lautstärkepegel. Teilweise bedingt durch den begrenzten Charakter der manuellen Eingaben auf dem Gerät, wie im Beispiel der Klingeltonlautstärke, kann das Abrufen irgendeiner bestimmten Funktion oder eines beliebigen speziellen Dienstes zahlreiche Interaktionen erfordern.
  • Das Mobilgerät 18 enthält Daten, welche Befehle spezifizieren, die der Benutzer bei unterschiedlichen Zuständen der Schnittstelle und entsprechenden Aktionen, die ausgeführt werden sollen, verwenden kann, wenn er einen Befehl ausspricht oder in anderer Form eingibt. Die Daten, welche die Schnittstelle spezifizieren, beinhalten sowohl generische Schnittstellendaten 27 als auch Trägerschnittstellendaten 28. Im Allgemeinen spezifizieren die generischen Schnittstellendaten 27 einen Menübaum, der sich auf Funktionen oder Dienste bezieht, die mit den Fähigkeiten des Telephons in Verbindung stehen oder die möglicherweise für keinen bestimmten Träger spezifisch sind. Die Trägerschnittstellendaten 28 betreffen Dienste oder Informationen, die gemeinhin trägerspezifisch sind, oder auch Dienst- oder Informationsanbieter, die nicht notwendigerweise bei allen Trägern verfügbar sind.
  • Eine Aktion kann sich komplex gestalten und beispielsweise die Verwendung einer oder mehrerer Anwendungen und/oder einer oder mehrerer Interaktionen mit dem Träger oder dem entfernten Dienst- oder Informationsanbieter umfassen. Bei einigen der Befehle, die in den Schnittstellendaten 27 und 28 spezifiziert sind, kann es sich um „Shortcuts" handeln, die einen entfernten Dienst oder entfernte Informationen mittels eines einzigen Sprachbefehls direkt abrufen und damit einen Vorgang ersetzen, der sonst mehrere Interaktionen einschließen würde.
  • Ein Träger 10, der dem Mobilgerät 18 Dienste zur Verfügung stellt, kann eine Gruppe von Diensten anbieten, über die speziell besagter Träger verfügt. Beispielsweise können derartige Dienste Hilfsdienste, Zugang zu Informationsportalen oder zu Portalen zum Herunterladen von Anwendungen, Musikdienste, Spieldienste, ortsbasierte (informationshaltige oder absatzorientierte) Dienste und Dienste zur Gesprächsverwaltung umfassen (z.B. zum Einrichten von Mehrteilnehmergesprächen und zum Ermöglichen von Roaming oder auch andere Verwaltungsdienste). Der Träger liefert dem Mobilgerät 18 Trägerschnittstellendaten 28, um eine Schnittstelle zu diesen Trägerdiensten zu spezifizieren. Diese Daten können vom Träger auf mehrere alternative Arten zur Verfügung gestellt werden. Beispielsweise kann die Trägerschnittstelle 28 auf Anfrage des Trägers durch den Gerätehersteller in einen nichtflüchtigen Speicher im Mobilgerät 18 eingebettet werden. Alternativ dazu besteht die Möglichkeit, die Daten auf das Gerät als Teil der Bereitstellung des Mobildienstes für den Benutzer oder auch aus dem Träger herunterzuladen (z.B. können sie unter Verwendung von OTA oder webbasierten Protokollen vom Träger geschoben oder aus diesem gezogen werden), und zwar während der Servicezeit des Geräts, etwa wenn der Benutzer einen neuen Dienst abonniert.
  • Ein veranschaulichendes technisches Merkmal des Mobilgeräts besteht darin, dass die generischen Schnittstellendaten 27 und die Trägerschnittstellendaten 28 unabhängig voneinander beibehalten werden können, z.B. indem sie zu verschiedenen Zeitpunkten oder unter Verwendung unterschiedlicher, unabhängiger Verfahren in das Mobilgerät geladen werden. Dies unterstützt verschiedene Träger, die unterschiedliche Gruppen von Diensten anbieten, oder ein und denselben Träger, der im Lauf der Zeit oder verschiedenen Teilnehmern unterschiedliche Dienste anbietet, ohne dass die generischen Schnittstellendaten 27 oder die Menüstruktur, an die sich der Benutzer möglicherweise gewöhnt hat, verändert werden müssen.
  • Die Trägerschnittstellendaten 28 spezifizieren die Charakteristiken der Benutzerschnittstelle, die es dem Benutzer ermöglichen, die Dienste des Trägers abzurufen. In einem Beispiel für eine solche Schnittstelle wird eine spezielle Taste 19 genutzt, die dem Benutzer Zugang zu „Sprachdiensten" auf dem Gerät verschafft, die bei jedem Zustand der Schnittstelle in Abhängigkeit von Entscheidungen, die der Träger (oder das Trägerproxy, das Herstellergerät) trifft, selektiv aktiviert werden. In einem derartigen Beispiel ist die Spracherkennungsmaschine so konzipiert, dass sie Sprachbefehle annimmt (beispielsweise durch Initialisieren oder Erzeugen einer Softwareinstanz von Spracherkennungssoftware), wenn der Benutzer die Sprachdiensttaste 19 drückt, und das Gerät zeigt auf die Sprachdienste bezogene Informationen an, etwa ein Menü, das die verfügbaren Dienste aufführt. Anzumerken ist, dass bei dauernder Aktivierung der Taste diese Sprachdienste für den Benutzer unabhängig vom Status des Geräts verfügbar sind. Beispielsweise kann ein Benutzer unter Verwendung von Sprachdiensten sofort vom Bildschirm einer SMS-Anwendung zu einer Spiele-Site übergehen, und nach Herunterladen eines Spiels kann er seine SMS-Anwendung an der Stelle wiederaufnehmen, wo er sie verlassen hat.
  • Die Sprachdienste des Trägers, die ausgehend von irgendeinem Zustand in der Menüstruktur implementiert werden, können das Gerät nach Wunsch des Trägers zu einem Topmenü zurücksetzen, oder der Zustand des Geräts kann gespeichert und der Benutzer zu jenem Punkt zurückgeführt werden, von dem aus die Sprachdienste initialisiert wurden. Anzumerken gilt, dass der Zustand eines Geräts im Allgemeinen eine Kombination daraus umfasst, wohin die Anzeige im Menü zeigt, was auf dem Bildschirm dargestellt ist und eventuell wie der Status eines oder mehrerer der Netzwerke lautet (z.B. Empfangen einer SMS inmitten eines Telephongespräches, Anhören eines Musik-Clips).
  • In diesem Beispiel für die Schnittstelle erscheint, wenn der Benutzer die Sprachdiensttaste 19 drückt, ein Menü, in dem die Auswahlzeilen des Trägers oder der dritten Partei aufgelistet sind (beispielsweise Klingeltöne, Aktienkurse, Unterstützung durch die Vermittlung). Alternativ dazu kann das Gerät zu einem „Standard"-Bildschirm für Sprachdienste gelenkt werden, wobei die genutzte Fläche der Anzeige ganz oder teilweise übernommen wird. Der Zustand des Telephons kann zwecks Rückführung nach Beendigung des Sprachdiensts gecached werden. Wie auch immer der Zustand des Telephons sein mag, er wird unterbrochen, und die Sprachdienstanwendung wird gestartet, wobei dem Benutzer Zeichenketten angezeigt werden. Der Benutzer kann jede beliebige der aufgelisteten Zeichenketten aussprechen, und das Telephon führt die entsprechende Aktion aus, wie durch die Trägerverknüpfung zwischen einem Satz und einer Aktion spezifiziert. Spricht der Benutzer beispielsweise das Wort „Klingeltöne" aus, startet das Telephon einen Browser und richtet ihn auf die Site zum Herunterladen von Klingeltönen, die der Träger spezifiziert hat. Zu beachten gilt, dass der Träger Funktionen aktivieren kann, die zwar mittels des Sprachdienstmenüs verfügbar, aber nicht ausdrücklich gelistet sind. (Solange sich die passenden Zeichenketten in der Vokabelliste der Spracherkennungseinrichtung befinden, werden sie erkannt.) Unter den Zeichenketten, die sich unauffällig verfügbar machen lassen, könnten sich „911", „Unterstützung durch die Vermittlung", „Rechnungshilfe" oder dergleichen befinden.
  • Der Träger kann die Wahl treffen, dass ihm einige Sprachdienste nur bei ausgewählten Telephonzuständen zur Verfügung stehen (z.B. ist eine „Unterstützung durch die Vermittlung" möglicherweise nicht verfügbar, falls ein Telefongespräch in Gang ist), und es besteht die Möglichkeit auszuwählen, welche Aktionen bei jedem Zustand in der Funktelephonaktivität durchgeführt werden können. Ebenfalls zu beachten ist, dass Sprachdienste durch die Sprachdiensttaste 19 initialisiert werden können oder alternativ dazu mittels eines Softkeys in einem PDA-Gerät oder mittels eines Trigger-Sprachbefehls auf einer Permanenthörvorrichtung. Auf den Trägern können die auswählbaren Dienste bei Verkauf des Telephons installiert sein, oder die Träger können die entsprechenden Teile der Benutzerschnittstelle und weitere Komponenten nach Bedarf durch Herunterladen von Informationen Over-the-Air oder durch Synching mit einem separaten Computer aktualisieren.
  • Mit Blick auf 2 ruft in einem weiteren Beispiel für einen Dienst, der von einem diese Methode nutzenden Träger zur Verfügung gestellt werden kann, ein Benutzer seinen Kalender auf seinem Mobiltelephon ab, wobei sich die generische Schnittstelle in einem Kalenderzustand 210 befindet; jedoch würde der Benutzer gerne den Kurs der IBM-Aktie kennen. Auf dem Träger ist im Sprachmenü ein „Aktienkurs" genannter Sprachdienst installiert, der zu der ausgewählten Sprachdiensttaste gehört, und der Benutzer oder der Träger hat eine finite Gruppe von Aktien identifiziert, nach denen der Benutzer fragen kann. Der Benutzer blickt auf einen Bildschirm, der seinen aktuellen Kalender darstellt. Er drückt die Sprachdiensttaste 19, was darin resultiert, dass die Schnittstelle in einen Sprachdienstzustand 250 tritt. Der Bildschirm wird zeitweise mit einer Liste von Befehlen überschrieben, die er sagen kann und von denen einer „Aktienkurs" lautet. Der Benutzer sagt „Aktienkurs", woraus sich ein Zustandsübergang zu Zustand 255 ergibt, in dem das Telephon (entweder hörbar oder auf der Anzeige oder auch beides) mit „welcher Kurs" antwortet; der Bildschirm zeigt eine Liste der Aktienkurse, die verfügbar sind. „IBM" stellt eine der Wahlmöglichkeiten auf dieser Liste dar, und der Benutzer sagt „IBM". Das Telephon erkennt IBM, geht zu Status 260 über und sendet eine Nachricht an den Träger zurück, damit dem Benutzer der IBM-Aktienkurs geliefert wird. (Diese Lieferung an den Träger kann über einen SMS-Kanal, eine IP-Verbindung, über WIFI falls verfügbar oder über jedes beliebige andere Netzwerk erfolgen, das für den Benutzer und/oder den Träger verfügbar ist.)
  • Im Anschluss an den Empfang der Anfrage nach der IBM-Kursnotierung sucht der Träger den gegenwärtigen IBM-Aktienkurs heraus und sendet eine SMS mit dem aktuellen IBM-Kurs an den Benutzer. Alternativ dazu kann der Träger dem Benutzer eine URL zur Verwendung mit dem ins Telephon eingebauten WAP-Browser oder mit dem auf einigen Telephonen verfügbaren HTML-Browser senden; darüber hinaus kann er ein Telephongespräch mit dem Benutzer beginnen, in dem der Kurs genannt wird, oder eine Audionachricht für den Benutzer in dessen Voicemail-Inbox hinterlassen, oder es kann sogar eine Email oder MMS-Nachricht gesandt werden; ferner besteht die Möglichkeit, weitere Lieferdienste einzusetzen. Nach Abschluss der Aktienkursinteraktion kehrt die Schnittstelle zum Kalenderzustand 210 zurück, in dem die Sprachdiensttaste 19 ursprünglich gedrückt wurde.
  • In einem weiteren Beispiel führt der Benutzer ein Telephongespräch mit einem anderen Benutzer, und beide wären am Aktienkurs interessiert. Der Benutzer drückt die Sprachdiensttaste und fragt nach einer verbalen Kursangabe für IBM-Aktien. Der Träger liefert eine Sprachnachricht mit dem Aktienkurs, und diese Mitteilung kann für beide Zuhörer gleichzeitig abgespielt werden.
  • In noch einem weiteren Beispiel könnte der Benutzer die Absicht haben, sich die aktuellen Nachrichten von CNN anzuhören. Es wird davon ausgegangen, dass sich der Benutzer zwar einen Eintrag in seinem PIM ansieht, dass aber die Sprachstarttaste für diesen Zustand aktiviert ist und ferner dass der Träger CNN als Eintrag unter den verfügbaren Befehlen gelistet hat. Der Benutzer drückt die Sprachdiensttaste, woraufhin der Bildschirm eine Liste von Befehlen anzeigt, von denen einer „CNN" ist. Der Benutzer sagt: „CNN", und das Telephon sendet eine Anfrage an den Träger, damit eine Multimedia-Session eingeleitet wird, die dem Benutzer CNN über sein Telephon liefert. Daraufhin wird der Telephonzustand durch eine multimodale Übertragung von CNN unterbrochen, und der Benutzer hört solange zu, bis diese zu Ende ist oder bis er den Empfang unterbricht.
  • Bei Betrieb der sprachbasierten Benutzerschnittstelle erfasst die Sprachschnittstelle 22 digitale Sprachsignale, welche vom Benutzer 14 Gesprochenes enthalten, und identifiziert Befehle in dem Gesprochenen; außerdem ist sie in der Lage, dem Benutzer 14 digitale Sprachsignale in hörbarer Form zu liefern (d.h. synthetisierte oder aufgezeichnete Sprache). Das vom Benutzer empfangene digitale Sprachsignal wird durch die Spracherkennungsmaschine bearbeitet, damit der Sprachbefehl erkannt wird. Ein Text-zu-Sprache-Modul erzeugt digitale Sprachsignale anhand des Texts, der dem Benutzer 14 vorzulegen ist.
  • Die Schnittstellendaten 27 und 28 enthalten die Spezifikation von Befehlen, die der Benutzer sprechen kann und Zuordnungen zwischen den Befehlen und den Aktionen, die auszuführen sind, wenn der Benutzer einen Befehl ausspricht. Die Spezifikation einer Aktion kann die Form eines Text-Strings besitzen, der eine oder mehrere Anweisungen enthält, oder eines Skripts, das zwecks Ausführung der Aktion bearbeitet werden kann. Beispielsweise kann eine solche Anweisung eine bestimmte auszuführende Anwendung 30 und Eingaben identifizieren, die für diese Anwendung zu tätigen sind. Eine zu einem Befehl gehörende Aktion kann spezifizieren, dass die Anwendung darin besteht, mit dem Trägerserver 16 über ein drahtloses Telekommunikationsnetzwerk 17 zu kommunizieren. Beispielsweise kann das Mobilgerät 18 mit den Trägerservern 16 durch Media Messaging Services (MMS) kommunizieren, die speziell dafür entworfen sind, um Multimediadienste an Mobilgeräte zu liefern, oder durch das Wireless Application Protocol (WAP). Die Trägerserver 16 können das MMS Push-Verfahren nutzen, um Multimedianachrichten an das Mobilgerät 18 zu liefern. Die Kommunikation zwischen dem Mobilgerät 18 und den Trägerservern 16 ist nicht auf die spezifischen Verfahren und Protokolle beschränkt, die oben aufgezeigt sind.
  • Im Mobilgerät 18 läuft ein Prozess ab, der durch die Sprachanwendung 24 koordiniert wird und der die sprachbezogenen Informationen in den Trägerschnittstellendaten 28 aktualisiert. In diesem Prozess aktualisiert der Träger das Vokabular in den Trägerschnittstellendaten 28. Dieses Vokabular definiert die Liste gesprochener Worten, die vom Mobilgerät 18 erkannt werden. Während der Aktualisierung des Vokabulars wird der Benutzer 14 auf die neuen gültigen Worte hingewiesen, die er einsetzen kann, um mit dem Gerät 18 zu kommunizieren; beispielsweise werden dem Benutzer die neuen gültigen Äußerungen via das Text-zu-Sprache-Modul 26 oder auf dem Bildschirm als Text und Sprache vorgestellt. Der Träger kann die Grammatik in den Trägerschnittstellendaten 28 auf den neuesten Stand bringen. Die Sprachbenutzerschnittstelle 22 wendet die Grammatik und das Vokabular an, um die Sprachbefehle des Benutzers zu verstehen.
  • Ferner ist der Träger zur Aktualisierung der Gruppe von Anwendungen 30 in der Lage, entweder durch Ersetzen alter Anwendungen oder durch Hinzufügen neuer Anwendungen. Die Anwendungen 30 spiegeln das Angebot an Diensten wider, die für den Benutzer verfügbar sind. Eine neue Anwendung entspricht einem neuen Dienst, der für den Benutzer verfügbar gemacht wird.
  • Mit Unterstützung der Sprachanwendung 24 kann der Benutzer 14 bei der Pflege der Trägerschnittstellendaten 28 mitwirken. Beispielsweise kann der Benutzer die Gruppe von Sprachbefehlen, die er einsetzen kann, überprüfen und für jeden Sprachbefehl bestimmen, welcher Dienst geleistet wird. Der Benutzer 14 kann die Entscheidung treffen, Befehle und Anwendungen zu löschen, die unterinteressante Dienste verschaffen.
  • Obgleich der Benutzer 14 vom Träger Aktualisierungen für neue Dienste auf regelmäßiger Basis erhalten kann, können Fälle eintreten, bei denen der Benutzer einen Dienst möchte, über den er nicht verfügt. Der Benutzer 14 kann über die Identität des Trägers und den Ort seiner Server 16 im Bilde sein und den Inhalt der Server auf der Suche nach einem Dienst durchsehen. Außerdem ist es möglich, dass der Benutzer den Ort eines bestimmten Dienstes entweder aufgrund vergangener Erfahrung mit besagtem Dienst oder jüngster Werbung kennt. Ungeachtet dessen, wie der Benutzer einen gewünschten Dienst identifiziert, kann er eine speziell dafür bestimmte Player-Anwendung verwenden, um die notwendige Unterstützung für den gewünschten neuen Dienst herunterzuladen.
  • Zusätzlich oder als eine Alternative zum Träger kann eine Reihe anderer Parteien Dienste in Mobilgeräten zur Verfügung stellen. Träger können ihre Kunden mit Mobilgeräten ausstatten, die eine Anfangsgruppe von Diensten unterstützen, die sich mittels Sprachbefehlen in einem einzigen Schritt starten lassen.
  • Träger können die Liste verfügbarer Dienste erweitern oder anderen Parteien, wie Werbetreibenden oder Verkäufern, gestatten, ihre Kunden mit neuen Diensten in einer Vielfalt von Geschäftsszenarien zu erreichen.
  • In einer Ausführungsform wird die oben erläuterte Methode in Software implementiert oder in einer Kombination aus Soft- und Hardware. Die Software im Mobilgerät, die gemeinhin Anweisungen für einen physischen oder virtuellen Prozessor enthält, kann sich auf einem maschinenlesbaren Medium befinden, z.B. in einem nichtflüchtigen Halbleiterspeicher. Die Software kann in einem übertragenen Signal enthalten dem Mobilgerät geliefert werden, z.B. enthalten in Datensignalen, die über das drahtlose Netzwerk übertragen werden.
  • Selbstverständlich ist die vorangehende Beschreibung vorgesehen, um die Tragweite der Erfindung, die durch die Tragweite der beigefügten Ansprüche definiert ist, zu veranschaulichen und nicht, um sie einzuschränken. Weitere Ausführungsformen befinden sich innerhalb der Tragweite der folgenden Ansprüche.
  • Zusammenfassung
  • (57) Zusammenfassung: Ein Mobilgerät, wie z.B. ein Mobiltelephon, enthält eine Sprachschnittstelle, die einen ersten Teil aufweist, der unter Umständen nicht für einen bestimmten Träger spezifisch ist, und einen zweiten Teil, der eine Schnittstelle für Dienste zur Verfügung stellt, die entweder für einen Träger oder für Dienst- oder Informationsanbieter spezifisch sind, die nicht unbedingt bei allen Trägern verfügbar sind. Mühelosen Zugang zu den Trägerdiensten bietet eine Sprachbefehlschnittstelle. Die Gruppe von Trägerdiensten ist optional vom Träger erweiterbar.

Claims (15)

  1. Verfahren zur Bereitstellung von Träger- bzw. Betreiberdiensten an einem Mobilgerät, umfassend: das Speichern von Daten im Mobilgerät, die eine Sprachschnittstelle für das Mobilgerät spezifizieren, einschließlich des Speicherns erster Daten, die eine Gruppe von Schnittstellenzuständen spezifizieren, die zu einer ersten Gruppe von Funktionen gehört, und des Speicherns zweiter Daten, die eine Schnittstelle zum Abrufen der Träger- bzw. Betreiberdienste spezifizieren; das Erhalten eines Befehls, der zu einer Anfrage auf Abruf der Träger- bzw. Betreiberdienste gehört; das Bearbeiten einer oder mehrerer vom Benutzer ausgehender Eingaben in Übereinstimmung mit den zweiten Daten; das Durchführen von Aktionen basierend auf der einen oder den mehreren Eingaben und den zweiten Daten, um einen der Träger- bzw. Betreiberdienste am Mobilgerät zur Verfügung zu stellen.
  2. Verfahren nach Anspruch 1, wobei die erste Gruppe von Funktionen unabhängig von einem Träger bzw. Betreiber bzw. Netzbetreiber ist, der dem Mobilgerät Dienste zur Verfügung stellt.
  3. Verfahren nach Anspruch 1, wobei das Erhalten des Befehls, der zu einer Anfrage auf Abruf der Trägerdienste gehört, das Annehmen einer manuellen Eingabe mittels einer Taste umfasst, die mit den Trägerdiensten in Verbindung steht.
  4. Verfahren nach Anspruch 1, wobei die zweiten Daten einen Skript zur Bereitstellung eines der Trägerdienste enthalten.
  5. Verfahren nach Anspruch 1, weiterhin umfassend das Erhalten der zweiten Daten unabhängig vom Erhalten der ersten Daten.
  6. Verfahren nach Anspruch 5, wobei das Erhalten der zweiten Daten das Herunterladen der zweiten Daten von einem Träger bzw. Betreiber bzw. Netzbetreiber umfasst.
  7. Verfahren nach Anspruch 6, wobei das Herunterladen der zweiten Daten das Herunterladen der zweiten Daten über ein drahtloses Netzwerk umfasst.
  8. Verfahren nach Anspruch 1, wobei die zweiten Daten Spezifikationen von Interaktionen mit entfernten Systemen vom Mobilgerät aus umfassen.
  9. Verfahren nach Anspruch 1, wobei das Mobilgerät ein Mobiltelephon umfasst.
  10. Verfahren nach Anspruch 1, weiterhin umfassend das Bearbeiten von vom Benutzer ausgehenden Eingaben unter Verwendung der ersten Daten, resultierend darin, dass sich die Schnittstelle in einem ersten Schnittstellenzustand befindet, wenn der zu einer Anfrage auf Abfrage der Trägerdienste gehörende Befehl erhalten wird.
  11. Verfahren nach Anspruch 10, weiterhin umfassend das Wiederherstellen des ersten Schnittstellenzustands nach Abschließen der Bearbeitung der einen oder mehreren vom Benutzer ausgehenden Eingaben in Übereinstimmung mit den zweiten Daten.
  12. Verfahren nach Anspruch 10, weiterhin umfassend das Auswählen eines vorgegebenen Schnittstellenzustands nach Abschließen der Bearbeitung der einen oder mehreren vom Benutzer ausgehenden Eingaben in Übereinstimmung mit den zweiten Daten.
  13. Mobilgerät, umfassend: einen Datenspeicher für eine Schnittstellenspezifikation, enthaltend einen ersten Datenspeicher für eine Spezifikation einer Gruppe von Schnittstellenzuständen, die zu einer ersten Gruppe von Funktionen gehört, und einen zweiten Datenspeicher für eine Spezifikation einer Schnittstelle zum Abrufen von Träger- bzw. Betreiberdiensten; eine Sprachschnittstelle, die auf den Datenspeicher für die Schnittstellenspezifikation zugreift und die so gestaltet ist, dass sie, in zumindest einigen der Schnittstellenzustände, Prozessbefehle in Übereinstimmung mit der Spezifikation der Schnittstelle zum Abrufen der Träger- bzw. Betreiberdienste bearbeitet.
  14. Mobilgerät nach Anspruch 13, wobei das Mobilgerät so gestaltet ist, dass es von einem Träger bzw. Betreiber bzw. Netzbetreiber Daten für die Spezifikation der Schnittstelle zum Abrufen der Trägerdienste herunterlädt.
  15. Mobilgerät nach Anspruch 13, wobei die Sprachschnittstelle weiterhin so gestaltet ist, dass sie einen Schnittstellenzustand nach Bearbeiten der Befehle wiederherstellt.
DE112005001540T 2004-06-22 2005-06-22 Erweiterbare Sprachbefehle Withdrawn DE112005001540T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US58195904P 2004-06-22 2004-06-22
US60/581,959 2004-06-22
PCT/US2005/022242 WO2006002308A2 (en) 2004-06-22 2005-06-22 Extendable voice commands

Publications (1)

Publication Number Publication Date
DE112005001540T5 true DE112005001540T5 (de) 2007-08-02

Family

ID=35782341

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112005001540T Withdrawn DE112005001540T5 (de) 2004-06-22 2005-06-22 Erweiterbare Sprachbefehle

Country Status (7)

Country Link
US (2) US8019324B2 (de)
JP (1) JP2008504607A (de)
KR (1) KR100891695B1 (de)
CN (2) CN1973525B (de)
DE (1) DE112005001540T5 (de)
GB (1) GB2429883B (de)
WO (1) WO2006002308A2 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102013222930B4 (de) * 2012-11-12 2017-01-26 Nvidia Corporation Sprachsteuerung auf einem mobilen Informations-Gerät

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060030315A1 (en) * 2004-08-06 2006-02-09 Christopher Smith Method and system for provisioning wireless services using SIM information
US20060184899A1 (en) * 2005-02-11 2006-08-17 Research In Motion Limited System and method for context specific content handling
US7697922B2 (en) * 2006-10-18 2010-04-13 At&T Intellectual Property I., L.P. Event notification systems and related methods
US20080154870A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Collection and use of side information in voice-mediated mobile search
WO2008083172A2 (en) * 2006-12-26 2008-07-10 Voice Signal Technologies, Inc. Integrated voice search commands for mobile communications devices
US20080154608A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. On a mobile device tracking use of search results delivered to the mobile device
US20080154612A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Local storage and use of search results for voice-enabled mobile communications devices
US20080153465A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Voice search-enabled mobile device
US8386259B2 (en) 2006-12-28 2013-02-26 Intel Corporation Voice interface to NFC applications
US10056077B2 (en) 2007-03-07 2018-08-21 Nuance Communications, Inc. Using speech recognition results based on an unstructured language model with a music system
US8886540B2 (en) 2007-03-07 2014-11-11 Vlingo Corporation Using speech recognition results based on an unstructured language model in a mobile communication facility application
US8949266B2 (en) 2007-03-07 2015-02-03 Vlingo Corporation Multiple web-based content category searching in mobile search application
US8635243B2 (en) 2007-03-07 2014-01-21 Research In Motion Limited Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application
US8949130B2 (en) 2007-03-07 2015-02-03 Vlingo Corporation Internal and external speech recognition use with a mobile communication facility
US20080221884A1 (en) 2007-03-07 2008-09-11 Cerra Joseph P Mobile environment speech processing facility
US8838457B2 (en) 2007-03-07 2014-09-16 Vlingo Corporation Using results of unstructured language model based speech recognition to control a system-level function of a mobile communications facility
US8886545B2 (en) 2007-03-07 2014-11-11 Vlingo Corporation Dealing with switch latency in speech recognition
US8447285B1 (en) 2007-03-26 2013-05-21 Callwave Communications, Llc Methods and systems for managing telecommunications and for translating voice messages to text messages
US8583746B1 (en) 2007-05-25 2013-11-12 Callwave Communications, Llc Methods and systems for web and call processing
US9794348B2 (en) 2007-06-04 2017-10-17 Todd R. Smith Using voice commands from a mobile device to remotely access and control a computer
JP2009159573A (ja) * 2007-12-28 2009-07-16 Nec Corp 通信端末装置及び通信事業者サーバ、並びに、方法及びプログラム
US8700008B2 (en) 2008-06-27 2014-04-15 Microsoft Corporation Providing data service options in push-to-talk using voice recognition
JP2010205130A (ja) * 2009-03-05 2010-09-16 Denso Corp 制御装置
US8639513B2 (en) 2009-08-05 2014-01-28 Verizon Patent And Licensing Inc. Automated communication integrator
US8626511B2 (en) * 2010-01-22 2014-01-07 Google Inc. Multi-dimensional disambiguation of voice commands
US9026102B2 (en) * 2010-03-16 2015-05-05 Bby Solutions, Inc. Movie mode and content awarding system and method
US8548449B2 (en) * 2010-05-20 2013-10-01 Microsoft Corporation Mobile contact notes
US10129720B1 (en) * 2011-12-30 2018-11-13 Genesys Telecommunications Laboratories, Inc. Conversation assistant
US10255914B2 (en) 2012-03-30 2019-04-09 Michael Boukadakis Digital concierge and method
US9430633B2 (en) 2012-07-12 2016-08-30 International Business Machines Corporation Aural cuing pattern based mobile device security
US9374429B2 (en) 2012-12-18 2016-06-21 Sony Corporation System and method for sharing event information using icons
US20140173458A1 (en) * 2012-12-18 2014-06-19 Sony Corporation System and method for sharing event information using icons

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0140814B1 (ko) * 1994-12-16 1998-07-01 양승택 정보통신 서비스 메뉴 음성 제어 방법
US9418381B2 (en) * 2000-04-14 2016-08-16 Citigroup Credit Services, Inc. (USA) Method and system for notifying customers of transaction opportunities
US6453352B1 (en) * 1997-07-14 2002-09-17 Electronic Data Systems Corporation Integrated electronic commerce system and method
KR19990056086A (ko) * 1997-12-29 1999-07-15 윤종용 셀룰라 이동통신단말기의 음성인식 다이얼 메뉴 제공 방법
US6144726A (en) * 1998-06-12 2000-11-07 Csg Systems, Inc. Telecommunications access cost management system
US6873693B1 (en) * 1999-09-13 2005-03-29 Microstrategy, Incorporated System and method for real-time, personalized, dynamic, interactive voice services for entertainment-related information
US6456975B1 (en) * 2000-01-13 2002-09-24 Microsoft Corporation Automated centralized updating of speech recognition systems
KR20010077316A (ko) * 2000-02-01 2001-08-17 김봉래 무선데이타통신이 가능한 이동전화단말기를 이용 음성을인터페이스로 인터넷을 이용하게 해주는 시스템
WO2001063942A2 (en) * 2000-02-25 2001-08-30 Pulsar Communications, Inc. Enhanced telecommunications services
JP3642004B2 (ja) * 2000-05-22 2005-04-27 日本電気株式会社 中継装置、移動体無線通信システム、その障害通知方法、及びその障害通知プログラムを記録した記録媒体
JP2004503887A (ja) * 2000-06-16 2004-02-05 ヘルセテック インコーポレイテッド 携帯情報端末用音声認識装置
JP2002094684A (ja) 2000-09-13 2002-03-29 Takao Nakano 情報提供方法
JP2002099508A (ja) * 2000-09-22 2002-04-05 Matsushita Electric Ind Co Ltd 端末装置
US6952414B1 (en) * 2000-09-26 2005-10-04 Advanced Micro Devices, Inc. Portable internet browser device with cordless phone module and method of operation
US20020077833A1 (en) * 2000-12-20 2002-06-20 Arons Barry M. Transcription and reporting system
US7123933B2 (en) * 2001-05-31 2006-10-17 Orative Corporation System and method for remote application management of a wireless device
JP2003005946A (ja) * 2001-06-22 2003-01-10 Casio Comput Co Ltd アイコン設定システム、アイコン設定方法、情報処理装置およびアイコン設定プログラム
KR100412474B1 (ko) * 2001-06-28 2003-12-31 유승혁 음성인식과 원격지 전화번호부 서버를 이용한 유선전화와 모바일폰의 전화번호부 시스템 및 관리 방법
US20030013483A1 (en) * 2001-07-06 2003-01-16 Ausems Michiel R. User interface for handheld communication device
US6901255B2 (en) * 2001-09-05 2005-05-31 Vocera Communications Inc. Voice-controlled wireless communications system and method
US6965770B2 (en) * 2001-09-13 2005-11-15 Nokia Corporation Dynamic content delivery responsive to user requests
US6791529B2 (en) * 2001-12-13 2004-09-14 Koninklijke Philips Electronics N.V. UI with graphics-assisted voice control system
US20060168095A1 (en) * 2002-01-22 2006-07-27 Dipanshu Sharma Multi-modal information delivery system
US9374451B2 (en) * 2002-02-04 2016-06-21 Nokia Technologies Oy System and method for multimodal short-cuts to digital services
KR100506395B1 (ko) * 2002-06-27 2005-08-05 에스케이 주식회사 무선 환경에서의 상담원과 음성인식서버를 이용한 정보제공방법 및 시스템
US6970698B2 (en) * 2002-07-23 2005-11-29 Sbc Technology Resources, Inc. System and method for updating data in remote devices
US7421390B2 (en) * 2002-09-13 2008-09-02 Sun Microsystems, Inc. Method and system for voice control of software applications
US8661112B2 (en) * 2002-12-20 2014-02-25 Nuance Communications, Inc. Customized interactive voice response menus
US20040254836A1 (en) * 2003-01-28 2004-12-16 Emoke Barabas Jutka T. Method & system for distribution & management of electronic vouchers via carrier applications
CN1177278C (zh) * 2003-01-29 2004-11-24 无敌科技(西安)有限公司 携带式电子作业平台系统管理的方法
US20040162724A1 (en) * 2003-02-11 2004-08-19 Jeffrey Hill Management of conversations
US7739345B2 (en) * 2003-03-31 2010-06-15 Sap Ag Alert notification engine
CA2532257A1 (en) * 2003-07-14 2005-01-27 Orative Corporation System and method for active mobile collaboration
US6996223B2 (en) * 2003-07-24 2006-02-07 International Business Machines Corporation Method, apparatus and computer program product for interactive phone call routing in a service provider network and information processing in an enterprise network
US7054637B2 (en) * 2003-09-26 2006-05-30 Exphand, Inc. Dynamically distributed, portal-based application services network topology for cellular systems
US7389235B2 (en) * 2003-09-30 2008-06-17 Motorola, Inc. Method and system for unified speech and graphic user interfaces
US7356572B2 (en) * 2003-11-10 2008-04-08 Yahoo! Inc. Method, apparatus and system for providing a server agent for a mobile device
US20050277432A1 (en) * 2003-11-26 2005-12-15 Viana Rodrigo B D Dynamic display generation for mobile communication devices

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102013222930B4 (de) * 2012-11-12 2017-01-26 Nvidia Corporation Sprachsteuerung auf einem mobilen Informations-Gerät

Also Published As

Publication number Publication date
GB0624785D0 (en) 2007-01-17
KR20070057713A (ko) 2007-06-07
US8019324B2 (en) 2011-09-13
WO2006002308A3 (en) 2006-09-21
CN102938803A (zh) 2013-02-20
JP2008504607A (ja) 2008-02-14
WO2006002308A9 (en) 2006-04-27
CN102938803B (zh) 2015-10-28
US20050288005A1 (en) 2005-12-29
WO2006002308A2 (en) 2006-01-05
US20110294476A1 (en) 2011-12-01
GB2429883A (en) 2007-03-07
KR100891695B1 (ko) 2009-04-03
GB2429883B (en) 2009-01-14
US8731609B2 (en) 2014-05-20
CN1973525B (zh) 2012-11-07
CN1973525A (zh) 2007-05-30

Similar Documents

Publication Publication Date Title
DE112005001540T5 (de) Erweiterbare Sprachbefehle
EP1324314B1 (de) Spracherkennungssystem und Verfahren zum Betrieb eines solchen
DE602004012071T2 (de) Multimedia- und textnachrichten mit sprache-zu-text-hilfe
US8363807B2 (en) System and method for performing an action on a phone in response to a user initiating an outbound call to one or more select phone numbers
DE10340587B4 (de) Verfahren zum Verarbeiten von Information und Daten in Mobiltelefonen und computerlesbares Medium
DE60021761T2 (de) System zur speicherung und bereitstellung von mobilkommunikations - adress - informationen
DE10123068A1 (de) Geräteregistrierungsserver zur automatischen Verbindung und zum Datenaustausch zwischen allgemein verwendeten Geräten und Backend-Systemen
DE60133097T2 (de) Verfahren und übertragungsnetzwerk zur steuerung von menufunktionen eines mobilen telefons
KR100881657B1 (ko) 위젯형 통화 대기화면 제공 시스템
DE60200020T2 (de) Kommunikationsendgerät und entsprechendes Steuerungsverfahren, Server und entsprechendes Steuerungsverfahren, und Speichermedium
DE102005052311A1 (de) System und Verfahren zum Anwendungsmanagement und entsprechende Geräte
DE60128928T2 (de) Telekommunikationsendgerät und verfahren zur kommunikation mit einem server mittels eines telekommunikationsendgerätes
EP2200263A1 (de) Verfahren zur Steuerung einer Benutzerschnittstelle
DE112011105966B4 (de) Kommunikationseinrichtungen, zugehörige Geräte und Vorrichtungen
DE60206619T2 (de) Verfahren und vorrichtung zur erzeugung und verteilung von interaktiven echtzeit-medieninhalten uber drahtlose kommunikationsnetze und das internet
EP2220557B1 (de) Implementierung des user interfaces von mobiltelefonen auf basis von browser technologie
DE60303578T2 (de) Interaktionserver, Computerprogramm und Verfahren zur Anpassung von Dialogmodalitäten zwischen einem Client und einem Server
DE10153946A1 (de) Verfahren zur Vereinheitlichung der Bediensteuerung bei Mobilfunkendgeräten
KR100700117B1 (ko) 이동통신 단말기의 배경화면을 이용한 맞춤형 정보제공 시스템 및 그 제공방법
DE10020831A1 (de) Verfahren zum Austauschen von Sprachinformationen und Daten
EP1342358A1 (de) Verfahren zur konfigurierung einer benutzeroberfläche
WO2006018369A1 (de) Verfahren und telekommunikationsgerät zum empfangen von bei einem servicezentrum hinterlegten servicenachrichten
EP1531639B1 (de) Verfahren zur Übertragung von Daten auf ein mobiles Endgerät in Mobilfunknetzen
EP1531642B1 (de) Konfiguration von mobilen Endgeräten in Mobilfunknetzen
DE102004063685B4 (de) Umfassende Nutzungsprofile

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8181 Inventor (new situation)

Inventor name: ROTH, DANIEL L., BOSTON, MASS., US

Inventor name: REINER, CHRIS, CAMBRIDGE, MASS., US

Inventor name: FURNARI, MARK, INDIAN HARBOR BEACH, FLA., US

Inventor name: COHEN, JORDAN, GLOUCESTER, MASS., US

8125 Change of the main classification

Ipc: H04W 4/00 AFI20050622BHDE

8139 Disposal/non-payment of the annual fee