DE69832003T2 - Verfahren zum Wählen einer Telefonnummer durch Sprachbefehle und ein durch Sprachbefehle gesteuertes Telekommunikationsendgerät - Google Patents

Verfahren zum Wählen einer Telefonnummer durch Sprachbefehle und ein durch Sprachbefehle gesteuertes Telekommunikationsendgerät Download PDF

Info

Publication number
DE69832003T2
DE69832003T2 DE69832003T DE69832003T DE69832003T2 DE 69832003 T2 DE69832003 T2 DE 69832003T2 DE 69832003 T DE69832003 T DE 69832003T DE 69832003 T DE69832003 T DE 69832003T DE 69832003 T2 DE69832003 T2 DE 69832003T2
Authority
DE
Germany
Prior art keywords
string
recognized
telephone number
voice
number string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69832003T
Other languages
English (en)
Other versions
DE69832003D1 (de
Inventor
Kari Laurila
Markku Mettälä
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of DE69832003D1 publication Critical patent/DE69832003D1/de
Application granted granted Critical
Publication of DE69832003T2 publication Critical patent/DE69832003T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

  • Die vorliegende Erfindung betrifft ein Verfahren zum Wählen einer Telefonnummer durch Sprachbefehle, das im Oberbegriff des anhängigen Patentanspruchs 1 dargelegt wird. Ferner betrifft die Erfindung ein Telekommunikationsendgerät, das im Oberbegriff des anhängigen Patentanspruchs 4 dargelegt wird.
  • Eine Telefonnummer wird für gewöhnlich durch Verwenden einer Wählscheibe oder von Wähltasten eines Telekommunikationsendgeräts gewählt. Es gibt jedoch Situationen, in welchen es notwendig wäre, eine Telefonnummer z.B. durch Sprechen der Telefonnummer zu wählen. Insbesondere zur Verwendung in Kraftfahrzeugen wurden so genannte Freisprechbetriebsarten entwickelt, wobei der Fahrer des Fahrzeugs das Steuerrad zum Wählen der Telefonnummer nicht loslassen muss. Das Wählen der Telefonnummer erfolgt demnach durch Sagen der zu wählenden Telefonnummer. Diese Art von Freisprechbetrieb ist z.B. auch für Büros praktisch. In der einfachsten Form funktioniert diese Art des Wählens der Telefonnummer durch Sprachbefehle derart, dass der Benutzer des Telekommunikationsendgeräts die Telefonnummer Ziffer für Ziffer sagt, wobei nach dem Sagen der ganzen Nummer eine Spracherkennungseinheit im Telekommunikationsendgerät die Zahlenfolge sucht, welche die Spracherkennungseinheit als jene interpretiert, die der durch den Benutzer angesagten Zahlenfolge am besten entspricht. Die Interpretation basiert z.B. auf der Tatsache, dass die Spracherkennungseinheit einen oder mehrere Merkmalsvektoren auf der Basis des empfangenen Audiosignals berechnet. Der Sprachmusterspeicher der Spracherkennungseinheit enthält z.B. Sprachmuster, welche numerischen Ziffern entsprechen, und diese werden zusammen mit den aus dem Audiosignal berechneten Merkmalsvektoren zum Berechnen des Erkennungsergebnisses durch Verwenden von an sich bekannten Verfahren verwendet.
  • Telefonnummern sind für gewöhnlich sehr lang, üblicherweise Zahlenfolgen mit wenigstens sieben numerischen Ziffern, wobei die Anzahl von verschiedenen Kombinationen sehr groß ist: Bei einer Folge von sieben Zahlzeichen gibt es 10.000.000 alternative Kombinationen. Wenn Anrufe an Mobilstationen, an Telekommunikationsendgeräte verschiedener Verzeichnisbereiche oder von einem Land in ein anderes getätigt werden, kann die Länge der Telefonnummer bis zu 15 numerische Ziffern lang sein. Die große Anzahl von alternativen Kombinationen stellt hohe Ansprüche an den Betrieb eines durch Sprachbefehle zu steuernden Geräts, um die Anzahl von falschen Erkennungen auf ein Minimum herabsetzen zu können. In der zuvor erwähnten Situation des Wählens einer Telefonnummer, die aus sieben numerischen Ziffern besteht, führt die falsche Erkennung selbst einer numerischen Ziffer zu einer falschen Wahl.
  • Das US-Patent Nr. 4,870,686 offenbart ein Telekommunikationsendgerät, das durch Spracherkennung gesteuert wird, wobei die zu wählende Telefonnummer in einer oder mehreren Ziffernketten geäußert werden kann. Jede Ziffernkette wird getrennt erkannt, wobei die Anzahl von Alternativen für jede Ziffernkette erheblich niedriger ist als in einer Situation, in der die ganze Telefonnummer als eine Ziffernkette erkannt wird. Zum Beispiel kann die Telefonnummer „1234567" demnach z.B. in den Ziffernketten „12", „34" und „567" geäußert werden, wobei die Anzahl von verschiedenen Wählalternativen einhundert für die erste und die zweite Ziffernkette und eintausend für die dritte Ziffernkette beträgt. Somit ist die Wahrscheinlichkeit, dass jede Ziffernkette richtig erkannt wird, beträchtlich höher, als wenn die ganze Telefonnummer als eine Zahlenfolge erkannt werden würde. Allerdings weist auch dieses Wählverfahren den Nachteil auf, dass, wenn irgendeine der Ziffernketten beim ersten Mal falsch erkannt wird, in welchem Fall der Benutzer die Spracherkennungseinheit steuert, um diese Zahlzeichenfolge erneut zu erkennen, die Spracherkennungseinheit dieselbe falsche Interpretation möglicherweise auch beim nächsten Mal macht. Im schlimmsten Fall muss der Benutzer die ganze Zahlenfolge wiederholen, und selbst dies gewährleistet nicht, dass die Spracherkennungseinheit die geäußerte Telefonnummer richtig erkennen kann. Die Unzuverlässigkeit der Erkennung ist auf eine Anzahl von verschiedenen Faktoren zurückzuführen. Zum Beispiel kann die Erkennung der Telefonnummer durch Rauschbedingungen gestört werden. Außerdem werden viele Erkennungseinheiten auf der Herstellungsstufe vorteilhafterweise so programmiert, dass ein durchschnittliches Sprachmuster für jede Zahl von Null bis Neun im Sprachmusterspeicher der Erkennungseinheit gespeichert wird. Verschiedene Benutzer sprechen die Zahlen jedoch auf eine etwas unterschiedliche Art und Weise aus, was nicht unbedingt immer zu einer gleich guten Erkennung für verschiedene Benutzer führt, wobei die Fehlerrate unterschiedlich sein kann, wenn verschiedene Personen solch ein Telekommunikationsendgerät verwenden, das durch Sprachbefehle gesteuert wird. In diesen Situationen ist es möglich, Erkennungseinheiten zu verwenden, welche gelehrt werden können, die Stimme des Benutzers zu erkennen, d.h. der Benutzer spricht die Zahlen von Null bis Neun aus, wobei die Spracherkennungseinheit die Sprachmuster, welche den Zahlen im Sprachmusterspeicher entsprechen, speichert. Trotzdem schaltet auch dies nicht alle falschen Erkennungen, z.B. unter dem Einfluss von Rauschen oder der Stimme des Benutzers, die aus irgendeinem Grund anders ist, aus.
  • Ferner wurden solche sprachgesteuerten Telekommunikationsendgeräte entwickelt, in welchen der Benutzer die gewünschten Telefonnummern und eine Identifikation, die diesen entspricht, wie beispielsweise den Namen einer Firma und/oder einer Person, speichern kann. Demnach kann die Auswahl der Telefonnummer durch Äußern der Identifikation erfolgen, auf deren Basis die Spracherkennungseinheit die gespeicherten Identifikationen vergleicht und das Wählen auf der Basis dieses Vergleichs ausführt. In solch einem Gerät, in welchem die Identifikation in Teilidentifikationen unterteilt werden kann, führt die Erkennungseinheit einen Vergleich von Teilidentifikationen durch, und nach der richtigen Erkennung der Teilidentifikation äußert der Benutzer die nächste Teilidentifikation. Wenn eine genügende Anzahl von Teilidentifikationen geäußert wurde, um die Telefonnummer zu identifizieren, führt das Telekommunikationsendgerät das Wählen der Telefonnummer aus. Auch bei dieser Art eines Telekommunikationsendgeräts kann das Problem auftreten, dass die Identifikation oder Teilidentifikation ständig falsch erkannt wird und die richtige Telefonnummer nicht gewählt werden kann.
  • Das Patent US-5,577,164 offenbart ein Verfahren und eine Vorrichtung zur Verarbeitung der Verhinderung und Wiederherstellung von falschen Sprachbefehlserkennungen. Informationen zum Identifizieren, ob ein Wort im reinen Erkennungsvorgang erkannt werden sollte, werden in einem Erkennungswörterbuch gespeichert. Diese Informationen werden jedes Mal, wenn das erkannte Ergebnis erhalten wird, aktualisiert, um das Wort für die nächste Erkennung zu aktualisieren und es möglich zu machen, zu verhindern, dass eine falsche Erkennung wiederholt wird. Eine Anzeige dessen, ob jedes Wort wiederholt eingegeben werden kann, wird als Identifikationsinformation im Erkennungswörterbuch gespeichert. Wenn das erkannte Wort ein Wort ist, das nicht wiederholt eingegeben werden kann, wird die Identifikationsinformation des Wortes aktualisiert.
  • Ein Spracherkennungsabschnitt des Geräts führt bei Spracheingabe über den Spracheingabeabschnitt eine Sprachtonerkennung durch. Der Spracherkennungsabschnitt vergleicht die digitalen Sprachsignale, die durch den Spracheingabeabschnitt aufgenommen werden, mit dem Sprachmuster für jedes Wort, das im Erkennungswörterbuch gespeichert ist und gibt Informationen im Wörterbuch über das Wort mit der größten Ähnlichkeit aus. Wenn ein Erkennungsfehler erfasst wird, oder wenn dasselbe Wort zweimal erkannt wird, obwohl das Wort nicht wiederholt werden kann, wird das erkannte Wort als nicht verwendbar markiert. Wenn zum Beispiel der Befehl „einschalten" erkannt wird, obwohl das Gerät bereits eingeschaltet ist, wird ein Fehler angezeigt.
  • Nach einer falschen Erkennung werden dem Benutzer jene Zahlen, die bereits richtig erkannt sind, nicht angezeigt.
  • Die Patentanmeldung EP 0 307 193 offenbart einen Telefonapparat, in welchem ein Anruf als Reaktion auf Äußerungen von Bedienern ohne manuelles Wählen mithilfe einer Spracherkennungsfunktion getätigt werden kann. Die Spracherkennung erfolgt durch Erzeugen eines Sprachmusters aus dem geäußerten Sprachsignal und Vergleichen desselben mit gespeicherten Sprachmustern. Jenes gespeicherte Sprachmuster, das den geringsten Unterschied ergibt, wird ausgewählt, um das geäußerte Wort darzustellen, wenn der Unterschied gering genug ist. Wenn der Unterschied innerhalb einer vorgegebenen Grenze ist, ist das jeweilige Wort das Ergebnis der Spracherkennung. Andernfalls wird ein Erkennungsfehler signalisiert. Die Fehlererkennungssignalisierung zeigt nur an, dass die Erkennung nicht erfolgreich war.
  • Ein Zweck der vorliegenden Erfindung ist es, die zuvor erwähnten Nachteile in einem großen Maß auszuschalten und ein so genaues Wählen einer Telefonnummer durch Sprachbefehle als möglich bereitzustellen. Die Erfindung basiert auf der Idee, dass, wenn der Benutzer eine Telefonnummer, einen Teil der Telefonnummer oder eine Identifikation äußert, nach einer falschen Erkennung diese Erkennung durch die Erkennungseinheit als falsch markiert wird, wobei, wenn der Benutzer die Zahlenfolge oder die Identifikation wiederholt, die Erkennungseinheit nicht mehr die erkannte falsche Alternative, sondern die Alternative anbietet, welche gemäß der Berechnung durch die Erkennungseinheit die nächstwahrscheinliche ist und welche nicht als falsch markiert ist. Auf diese Weise wird die Anzahl von alternativen Kombinationen nach jeder falschen Erkennung verringert, wobei die richtige Zahlenfolge oder Identifikation spätestens dann erstellt wird, wenn nur eine einzige Alternative bleibt. Das Verfahren gemäß der vorliegenden Erfindung ist durch das gekennzeichnet, was im kennzeichnenden Teil des anhängigen Patentanspruchs 1 dargelegt wird. Ferner ist das Telekommunikationsendgerät gemäß der vorliegenden Erfindung durch das gekennzeichnet, was im kennzeichnenden Teil des anhängigen Patentanspruchs 4 dargelegt wird.
  • Die vorliegende Erfindung liefert bedeutende Vorteile. Durch Verwenden des Verfahrens der Erfindung kann der Betrieb von sprachgesteuerten Telekommunikationsendgeräten z.B. aus dem Grund, dass die Erkennungseinheit nach einer falschen Erkennung nicht dieselbe Alternative anbietet, in erheblichem Maße verbessert werden. Auch bei Störbedingungen ist das Telekommunikationsendgerät der Erfindung zuverlässiger als sprachgesteuerte Telekommunikationsendgeräte des Standes der Technik. Außerdem verbessert das Verfahren der Erfindung den Betrieb solcher Telekommunikationsendgeräte, in welchen die Spracherkennungseinheit keine so genannte „lernfähige" Erkennungseinheit ist, sondern in welcher die Erkennung auf einem durchschnittlichen Sprachmuster basiert.
  • Im Folgenden wird die Erfindung unter Bezugnahme auf die angehängten Zeichnungen ausführlicher beschrieben, wobei
  • 1 ein reduziertes Blockdiagramm eines Telekommunikationsendgeräts gemäß einer vorteilhaften Ausführungsform der Erfindung ist;
  • 2 eine Tabelle ist, welche die Funktionsweise des Verfahrens gemäß der ersten vorteilhaften Ausführungsform der Erfindung mit der Funktionsweise des Verfahrens gemäß dem Stand der Technik vergleicht;
  • 3 eine Tabelle ist, welche die Funktionsweise des Verfahrens gemäß der zweiten vorteilhaften Ausführungsform der Erfindung mit der Funktionsweise des Verfahrens gemäß dem Stand der Technik vergleicht.
  • Die Funktionsweise des Verfahrens gemäß der Erfindung wird in einem sprachgesteuerten Telekommunikationsendgerät von 1 beschrieben, in welchem das Wählen der Telefonnummer durch Sprachbefehle durch Äußern der zu wählenden Telefonnummer entweder als eine einzige Zahlenfolge oder in zwei oder mehr Zahlenketten geteilt ausgeführt werden kann. Das Telekommunikationsendgerät 1 kann jedes Telekommunikationsendgerät, wie beispielsweise ein Festnetztelekommunikationsendgerät oder ein drahtloses Telekommunikationsendgerät, z.B. eine GSM-Mobilstation, sein. In dieser vorteilhaften Ausführungsform umfasst das Telekommunikationsendgerät 1 eine Benutzerschnittstelle mit einem Mikrofon 2a, einem Kopfhörer 3a, einer Anzeige 4 und einer Tastatur 5. Das elektrische Signal, das durch das Mikrofon 2a erzeugt wird, wird in einem Mikrofonverstärker 6 verstärkt und in einem Sprachbefehlszustand zu einer Erkennungseinheit 7 geleitet. Auf eine entsprechende Weise wird das Audiosignal, das durch die Erkennungseinheit 7 erzeugt wird, in einem Kopfhörerverstärker 13 verstärkt und zum Kopfhörer 3a geleitet. Die Erkennungseinheit 7 weist eine Steuereinheit 14, welche z.B. ein Digitalsignalprozessor DSP ist, einen Sprachmusterspeicher 8 und einen Programmspeicher 9 auf. Der Sprachmusterspeicher 8 ist vorteilhafterweise ein nichtflüchtiger Direktzugriffsspeicher NVRAM (für engl. non-volatile random access memory). Der Programmspeicher 9 ist vorzugsweise ein Nur-Lese-Speicher (ROM für engl. read-only memory) oder ein nichtflüchtiger Direktzugriffsspeicher (RAM). Ferner weist die Erkennungseinheit 7 einen Direktzugriffsspeicher (RAM) 10 zum Speichern von Daten während der Verwendung des Geräts auf. Es ist zu erwähnen, dass der Sprachmusterspeicher 8 und der Programmspeicher 9 auch so genannte FLASH- Speicher sein können, wie für einen Fachmann zu erkennen ist.
  • Signale werden zwischen der Erkennungseinheit 7 und dem Telekommunikationsendgerät 1 z.B. über ein Anpassungsnetz 15 zum Puffern und Verstärken von Signalen, falls nötig, übertragen.
  • Die Benutzersprachschnittstelle des Telekommunikationsendgeräts 1 der Erfindung ist vorzugsweise eine Zweiwegbenutzerschnittstelle, d.h. dem Telekommunikationsendgerät 1 können Sprachbefehle eingegeben werden, und das Telekommunikationsendgerät 1 kann entweder durch Sprachansagen und/oder über eine Anzeigeeinheit 4 Antworten auf die Befehle erzeugen. Die Sprachansagen können vorteilhafterweise mit einem Sprachsynthesizer 12 oder durch einen Digitalsignalprozessor DSP erzeugt werden, wobei die Sprachansagen z.B. im Programmspeicher 9 der Erkennungseinheit 7 im Voraus gespeichert werden. Die Speicherkapazität, die durch die Sprachansagen benötigt wird, kann durch Speichern von Sprachansagen unter Verwendung eines an sich bekannten Sprachcodierungsverfahren verringert werden.
  • Außerdem weist das Telekommunikationsendgerät 1 von 1 eine Steuereinheit 18 zum Steuern des Betriebs des Telekommunikationsendgeräts und ein Verbindungsteil 11 auf. Das Verbindungsteil ist eines gemäß dem Stand der Technik zum Verbinden des Telekommunikationsgeräts 1 mit einem Telekommunikationsnetz (nicht dargestellt). Das Verbindungsteil 11 ist zum Beispiel in einer GSM-Mobilstation ein Funkteil, das vorteilhafterweise einen Sender TX, einen Empfänger RX, einen Antennenschalter SW und eine Antenne ANT umfasst. Das Telekommunikationsendgerät 1 von 1 kann auch als ein herkömmliches Telekommunikationsendgerät verwendet werden, wobei das Wählen der Telefonnummer durch Verwenden der Tastatur 5 ausgeführt wird. Das Mikrofon 2 und der Kopfhörer 3 können zum Beispiel das Mikrofon 2b und der Kopfhörer 3b der Freisprechanlage 17 oder das Mikrofon 2a und der Kopfhörer 3a des Telefonteils sein.
  • Das Umschalten des Telekommunikationsendgeräts 1 auf eine Betriebsart zur Steuerung durch Sprachbefehle erfolgt auf eine an sich bekannte Art und Weise, nämlich zum Beispiel durch die Menüfunktionen des Telekommunikationsendgeräts 1, oder auf eine Art und Weise, dass das Telekommunikationsendgerät 1 an die Freisprechanlage 17 mit einem Schalter 16 zum Aktivieren des Sprachbefehlbetriebs angeschlossen wird. Wenn das Telekommunikationsendgerät 1 in der sprachgesteuerten Betriebsart ist, werden Audiosignale über das Mikrofon 2a oder das Zusatzmikrofon 2b empfangen, im Mikrofonverstärker 6 verstärkt und zur Erkennungseinheit 7 geleitet. Auf der Basis des empfangenen Audiosignals berechnet die Erkennungseinheit 7 den entsprechenden einen oder die entsprechenden mehreren Merkmalsvektoren, welche durch die Erkennungseinheit 7 verarbeitet werden, um herauszufinden, welcher Befehl oder welche Nummer vom Benutzer geäußert wurde. Dies erfolgt auf eine an sich bekannte Art und Weise, nämlich zum Beispiel durch Vergleichen des berechneten Merkmalsvektors mit den Sprachmustern, die im Sprachmusterspeicher 8 gespeichert sind. Der Sprachmusterspeicher 8 enthält auch Sprachmuster, welche verschiedenen Befehlen entsprechen. Für jeden zu erkennenden Befehl erzeugt die Erkennungseinheit 7 vorteilhafterweise mehrere mögliche Alternativen und ihre Reihenfolge nach der Wahrscheinlichkeit, wobei der erste Vorschlag die Alternative ist, für welche die Erkennungseinheit 7 die größte Wahrscheinlichkeit berechnet hat.
  • Das Wählen der Telefonnummer wird zum Beispiel durch das Äußern des Befehls „SELECT NUMBER" (Nummer Auswählen) begonnen. Danach erzeugt die Erkennungseinheit 7 die Meldung „GIVE NUMBER" (Nummer Eingeben) auf der Anzeige oder erzeugt eine entsprechende Tonmeldung im Kopfhörer 3a, 3b. Ein Vorteil der Tonmeldung ist, dass der Benutzer seine Augen nicht auf das Anzeigemittel 4 zu richten braucht, was in einigen Situationen schwierig sein könnte. Danach äußert der Benutzer die gewünschte Telfonnummer entweder als eine einzige Zahlenfolge oder als zwei oder mehr Zahlenketten. Als ein Beispiel wird die Telefonnummer „1234567" verwendet, welche durch den Benutzer in drei Zahlenketten, nämlich „12", „34" und „567", geäußert wird. Der Benutzer beginnt mit dem Äußern der Zahlenkette „12". Danach führt die Erkennungseinheit 7 einen Vergleich mit den Daten im Sprachmusterspeicher durch und schlussfolgert zum Beispiel, dass der Benutzer die Zahlenkette „98" geäußert hat. Die Erkennungseinheit 7 erzeugt diese erkannte Zahlenkette „98" für das Anzeigemittel 4 und/oder als eine Tonmeldung für den Kopfhörer 2a, 2b. Der Benutzer merkt, dass die Wahl falsch war, wobei der Benutzer auf eine an sich bekannte Art und Weise zum Beispiel den Befehl „ERROR" (Fehler) äußert. Daraufhin markiert die Erkennungseinheit 7 diese Zahlenkette als falsch, wiederholt möglicherweise die bereits richtig erkannten Zahlenketten (wenn bereits welche erkannt wurden) als eine Tonmeldung im Kopfhörer 3 und/oder als Textmeldung auf dem Anzeigemittel 4 und wartet auf die Zahlenkette, die vom Benutzer erneut geäußert werden soll. Aus dieser Wiederholung des richtig erkannten Teils der Telefonnummer kann der Benutzer schlussfolgern, dass die Erkennungseinheit den „ERROR"- Befehl richtig erkannt hat, d.h. es ist eine Art von Bestätigungsmeldung für den Benutzer. Nachdem der Benutzer die Zahlenkette erneut geäußert hat, führt die Erkennungseinheit 7 mit dem Unterschied, dass sie die Zahlenkette „98", die sich als falsch herausgestellt hatte, ignoriert, eine neue Erkennung durch. Als Nächstes schlägt die Erkennungseinheit 7 eine neue Zahlenkette vor. Wenn die Erkennung nun richtig ist, äußert der Benutzer die nächste Zahlenkette, welche wieder durch die Erkennungseinheit 7 erkannt wird. Wenn die Erkennung wieder falsch ist, wird die Wahl als falsch markiert, der richtig erkannte Teil der Telefonnummer wird wiederholt, und es wird eine neue Erkennung durchgeführt. Wenn weiter auf diese Weise vorgegangen wird, wird schließlich die ganze Telefonnummer zum Wählen richtig erkannt. Das Wählen der Nummer erfolgt zum Beispiel durch Äußern des Befehls „DIAL" (Wählen). Danach wird die Operation auf eine an sich bekannte Art und Weise durch einen Rufaufbau, der in diesem Zusammenhang nicht näher erörtert werden muss, fortgesetzt.
  • In einer Fehlersituation kann die Erkennungseinheit 7 auch auf eine Art und Weise funktionieren, dass die Erkennungseinheit 7 als Reaktion auf den „ERROR"-Befehl oder dergleichen die Meldung „CORRRECTION" (Korrektur) erzeugt und erst danach die richtig erkannten Zahlenketten wiederholt. In einigen Situationen macht es diese „CORRECTION"-Meldung für den Benutzer leichter, zu bemerken, dass die Erkennungseinheit 7 den „ERROR"-Befehl richtig erkannt hat.
  • Es ist möglich, dass der Benutzer vor dem Rufaufbau zu bestätigen wünscht, dass die durch die Erkennungseinheit erkannte Nummer wirklich richtig ist. Dies kann z.B. durch Äußern des Befehls „CONFIRM" (Bestätigen) geschehen, woraufhin die Erkennungseinheit die Telefonnummer vorteilhafterweise als Tonmeldung wiederholt und den Benutzer gleichzeitig auch fragt, ob er wünscht, einen Ruf aufzubauen. Wenn die Nummer richtig ist und der Benutzer danach wünscht, einen Ruf aufzubauen, äußert er den Befehl „DIAL" (Wählen), wie bereits erwähnt. Andernfalls wird kein Ruf aufgebaut.
  • Folglich erzeugt die Erkennungseinheit 7 der Erfindung wenigstens eine Wählalternative für jede geäußerte Zahlenkette. Die Erkennungseinheit 7 kann auch auf eine Art und Weise funktionieren, dass sie mehrere alternative Zahlenketten erzeugt, für welche sie einen Wahrscheinlichkeitswert berechnet. Demnach ist die erste Auswahl die Zahlenkette mit dem höchsten Wahrscheinlichkeitswert. Wenn die Auswahl falsch ist, braucht der Benutzer die Zahlenkette nicht notwendigerweise zu wiederholen, sondern der Benutzer kann stattdessen den Befehl „NEXT" (Nächste) äußern, woraufhin die Erkennungseinheit 7 die Zahlenkette mit dem nächsthöchsten Wahrscheinlichkeitswert vorschlägt. Wenn auch dieser falsch ist, wird wieder der nächste vorgeschlagen und so weiter, bis alle Zahlenketten, für welche ein Wahrscheinlichkeitswert berechnet wurde, durchgegangen wurden, oder bis die richtige Zahlenkette gefunden wurde. Wenn keine der Zahlenketten der vom Benutzer geäußerten Zahlenkette entspricht, fordert die Erkennungseinheit 7 den Benutzer auf, die Zahlenkette erneut zu äußern. In diesem Fall schlägt die Erkennungseinheit 7 die Zahlenketten, die sich in der vorhergehenden Phase als falsch herausstellten, nicht mehr vor.
  • Zur Realisierung des Verfahrens gemäß der Erfindung ist der Datenspeicher 10 der Erkennungseinheit 7 zum Beispiel mit einer Tabelle versehen, in welcher die Erkennungswerte einer geäußerten Zahlenkette gespeichert sind. Ein vorteilhaftes Beispiel ist in Tabelle 1 gezeigt. Hier hat der Benutzer die Zahlenkette „12" geäußert. Die Erkennungseinheit 7 hat die Wahrscheinlichkeitswerte für ein paar Alternativen berechnet, wobei die Zahlenkette „98" den höchsten Wahrscheinlichkeitswert aufweist, die Zahlenkette „92" den nächsthöchsten Wert aufweist, die Zahlenkette „12" den nächsthöchsten Wert aufweist und noch eine weitere Erkennung für die Zahlenkette „18" berechnet wird. Darüber hinaus enthalten die Zeilen der Tabelle die falschen Daten, welche zu Beginn 0 sind, d.h. es sind noch keine falschen Zahlenketten bekannt. Nachdem die Erkennungseinheit 7 die Zahlenkette „98" vorgeschlagen und der Benutzer gemeldet hat, dass sie falsch ist, versetzt die Erkennungseinheit 7 die Fehlerdaten auf der Zeile in einen anderen Zustand, z.B. in den Logisch-1-Zustand. Demnach stellt die Erkennungseinheit 7 bei neuerlicher Durchführung der Erkennung fest, dass die Fehlerdaten der Zeile 1 sind, und übergeht diese Zeile, indem zur nächsten Zeile weiter geht, welche in diesem Fall ebenso falsch ist. Nachdem die ganze Zahlenkette richtig erkannt ist (in diesem Beispiel die dritte Alternative), fügt die Erkennungseinheit 7 diese Zahlenkette am Ende der möglicherweise bereits erkannten Zahlenketten hinzu, stellt den Inhalt der Tabelle auf Null zurück und wartet auf die nächste Zahlenkette oder, wenn bereits die ganze Telefonnummer richtig erkannt wurde, geht die Erkennungseinheit 7 zum Wählen der Telefonnummer über. Tabelle 2 stellt eine Situation dar, in welcher die Erkennungseinheit die richtige Zahlenfolge festgestellt hat. Es versteht sich von selbst, dass die Tabelle auf etliche verschiedene Arten und Weisen realisiert werden kann, welche Stand der Technik und einem Fachmann bekannt sind.
  • Figure 00150001
    Tabelle 1
  • Figure 00150002
    Tabelle 2
  • Die Erfindung kann auch in solchen sprachgesteuerten Telekommunikationsendgeräten angewendet werden, in welchen die Telefonnummer auch durch Verwenden von Identifikationen und/oder Teilidentifikationen gewählt werden kann. Demnach entspricht das Verfahren in seinen allgemeinen Zügen der zuvor dargelegten Nummernwahl, wobei eine Identifikation einer Telefonnummer entspricht und eine Teilidentifikation einem Teil der Telefonnummer entspricht, und der Vergleich erfolgt auf der Basis dieser Identifikationen und möglichen Teilidentifikationen.
  • Die angehängte 2 veranschaulicht die Funktionsweise des Verfahrens gemäß der ersten vorteilhaften Ausführungsform der Erfindung, sowie zum Vergleich die Funktionsweise des Verfahrens gemäß dem Stand der Technik in Tabellenform, wobei die linke Seite 201 der Tabelle 200 das Verfahren der Erfindung veranschaulicht und die rechte Seite 202 der Tabelle das Verfahren des Standes der Technik veranschaulicht. Der Benutzer beabsichtigt, die Telefonnummer „123456789" zu wählen, indem er sie in drei Zahlenketten, nämlich „123", „456" und „789", äußert. Die Benutzerspalten 203, 205 enthalten die Befehle, die vom Benutzer des Telekommunikationsendgeräts geäußert werden, und die Erkennungseinheitsspalten 204, 206 enthalten die Meldungen, die durch die Erkennungseinheit jeweils für den Benutzer erzeugt werden.
  • Ferner veranschaulicht die angehängte 3 die Funktionsweise des Verfahren gemäß der zweiten vorteilhaften Ausführungsform der Erfindung, sowie zum Vergleich die Funktionsweise das Verfahrens gemäß dem Stand der Technik in Tabellenform, wobei die linke Seite 301 der Tabelle 300 das Verfahren der Erfindung veranschaulicht und die rechte Seite 302 der Tabelle das Verfahren des Standes der Technik veranschaulicht. Die Benutzerspalten 303, 305 enthalten die Befehle, die vom Benutzer des Telekommunikationsendgeräts geäußert werden, und die Erkennungseinheitsspalten 304, 306 enthalten die Meldungen, die durch die Erkennungseinheit jeweils für den Benutzer erzeugt werden.
  • Die Erfindung ist nicht nur auf die zuvor dargelegten Ausführungsformen beschränkt, sondern sie kann innerhalb des Rahmens der angehängten Patentansprüche modifiziert werden.

Claims (7)

  1. Verfahren zum Wählen einer Telefonnummer durch Sprachbefehle, wobei die auszuwählende Telefonnummer als eine Folge von mehreren Zahlenketten, wobei jede Kette eine oder mehr Ziffern umfasst, geäußert und dann erkannt und zum Vergleich mit der Zahlenkette, die geäußert wurde, dargestellt wird, wie erkannt, umfassend die folgenden Schritte: Erkennen einer Zahlenkette einer geäußerten Telefonnummer, die ausgewählt werden soll, und Darstellen der Zahlenkette, die erkannt wird, wobei eine falsch erkannte Zahlenkette, die dargestellt wird, als falsch markiert wird, Erkennen einer Neuäußerung der Zahlenkette der auszuwählenden Telefonnummer und Darstellen der erkannten Zahlenkette der Neuäußerung, aber nicht Darstellen einer Zahlenkette, die als eine falsche markiert ist, dadurch gekennzeichnet, dass nach dem Markieren einer falsch erkannten Zahlenkette eine Tonmeldung oder eine Textmeldung von jenen Zahlenketten der auszuwählenden Telefonnummer, die richtig erkannt wurden, erzeugt wird.
  2. Verfahren nach Anspruch 1, wobei für jede geäußerte Zahlenkette zwei oder mehr Erkennungsalternativen erzeugt werden, für welche die Wahrscheinlichkeitswerte berechnet werden, dadurch gekennzeichnet, dass zu jeder Erkennungszeit vorgeschlagen wird, die Alternative auszuwählen, die den höchsten Wahrscheinlichkeitswert aufweist und die nicht als falsch markiert ist.
  3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass nach einer falschen Erkennung vorgeschlagen wird, die Alternative auszuwählen, die den nächsten Wahrscheinlichkeitswert jener Erkennungsalternativen aufweist, die nicht als falsch markiert sind.
  4. Telekommunikationsendgerät (1), umfassend: Mittel (2a, 2b, 6, 7, 8) zum Wählen einer Telefonnummer durch Sprachbefehle, welche Telefonnummer so ausgelegt ist, dass sie als eine Folge von mehreren Zahlenketten geäußert wird, wobei jede Kette eine oder mehr Ziffern umfasst, Mittel zum Erkennen einer geäußerten Telefonnummer, die ausgewählt werden soll, Mittel (3, 4) zum Darstellen der Zahlenkette, die erkannt wird, zum Vergleich mit der Zahlenkette, die geäußert wurde, Mittel (7, 10) zum Markieren einer falsch erkannten Zahlenkette als falsch, dadurch gekennzeichnet, dass die Mittel (2a, 2b, 4) zum Darstellen so ausgelegt sind, dass sie nach dem Markieren einer falsch erkannten Zahlenkette eine Tonmeldung oder eine Textmeldung von jenen Zahlenketten der auszuwählenden Telefonnummer, die richtig erkannt wurden, erzeugen.
  5. Telekommunikationsendgerät (1) nach Anspruch 4, dadurch gekennzeichnet, dass eine falsche Erkennung so ausgelegt ist, dass sie der Erkennereinheit (7) durch einen Sprachbefehl bekannt gemacht wird.
  6. Telekommunikationsendgerät (1) nach Anspruch 5, dadurch gekennzeichnet, dass es Mittel (3, 4) zum Erzeugen einer Bestätigungsmeldung von einem Sprachbefehl, der eine Fehlererkennung angibt, umfasst.
  7. Telekommunikationsendgerät (1) nach einem der Ansprüche 4 bis 6, dadurch gekennzeichnet, dass es eine Mobilstation (1) ist.
DE69832003T 1997-05-06 1998-04-28 Verfahren zum Wählen einer Telefonnummer durch Sprachbefehle und ein durch Sprachbefehle gesteuertes Telekommunikationsendgerät Expired - Fee Related DE69832003T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI971925 1997-05-06
FI971925A FI111673B (fi) 1997-05-06 1997-05-06 Menetelmä puhelinnumeron valitsemiseksi puhekomennoilla ja puhekomennoilla ohjattava telepäätelaite

Publications (2)

Publication Number Publication Date
DE69832003D1 DE69832003D1 (de) 2005-12-01
DE69832003T2 true DE69832003T2 (de) 2006-07-13

Family

ID=8548798

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69832003T Expired - Fee Related DE69832003T2 (de) 1997-05-06 1998-04-28 Verfahren zum Wählen einer Telefonnummer durch Sprachbefehle und ein durch Sprachbefehle gesteuertes Telekommunikationsendgerät

Country Status (5)

Country Link
US (1) US6314166B1 (de)
EP (1) EP0877518B1 (de)
JP (1) JPH10341276A (de)
DE (1) DE69832003T2 (de)
FI (1) FI111673B (de)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6631179B1 (en) * 1998-06-10 2003-10-07 Henry Sifuentes Voice and motion activated telephone
US7116763B2 (en) * 1998-06-10 2006-10-03 Henry Sifuentes Voice and motion activated telephone
US6785366B1 (en) * 1998-10-01 2004-08-31 Canon Kabushiki Kaisha Apparatus for making outgoing call
JP2000261537A (ja) * 1999-03-11 2000-09-22 Nec Saitama Ltd ダイヤルメモリ検索装置
KR20010094229A (ko) * 2000-04-04 2001-10-31 이수성 전화기의 음성인식 조작 방법 및 시스템
DE10021389A1 (de) 2000-05-03 2001-11-08 Nokia Mobile Phones Ltd Verfahren zum Steuern eines Systems, insbesondere eines elektrischen und/oder elektronischen Systems mit zumindest einer Anwendungseinrichtung
WO2002041610A1 (fr) * 2000-11-17 2002-05-23 Sanyo Electric Co., Ltd. Appareil telephonique a commande vocale
DE10122828A1 (de) * 2001-05-11 2002-11-14 Philips Corp Intellectual Pty Verfahren zum Training oder zur Adaption eines Spracherkenners
US6892051B2 (en) * 2001-06-25 2005-05-10 Cingular Wireless Ii, Llc System and method for providing an adapter module
US6889065B2 (en) * 2001-06-25 2005-05-03 Cingular Wireless Ii, Llc System and method for providing an adapter module
US7113572B2 (en) * 2001-10-03 2006-09-26 Cingular Wireless Ii, Llc System and method for recognition of and automatic connection using spoken address information received in voice mails and live telephone conversations
US7103168B2 (en) * 2002-04-16 2006-09-05 Bellsouth Intellectual Property Corporation Methods and systems for implementing personal dialing plans
JP3726783B2 (ja) * 2002-07-16 2005-12-14 株式会社デンソー 音声認識装置
FR2844911B1 (fr) * 2002-09-24 2006-07-21 Thales Sa Procede de reconnaissance vocale avec correction automatique
CN1829960A (zh) * 2003-08-05 2006-09-06 皇家飞利浦电子股份有限公司 可扩展标记语言文档的基于概率的确认的方法和系统
DE102005019028B4 (de) * 2005-04-23 2020-11-12 Volkswagen Ag Telefonsystem und Verfahren zum Betreiben eines Telefonsystems für ein Kraftfahrzeug

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0307193B1 (de) * 1987-09-11 1993-11-18 Kabushiki Kaisha Toshiba Telefonapparat
US4870686A (en) * 1987-10-19 1989-09-26 Motorola, Inc. Method for entering digit sequences by voice command
JP2927891B2 (ja) 1989-06-19 1999-07-28 日本電気株式会社 音声ダイヤル装置
US5329609A (en) * 1990-07-31 1994-07-12 Fujitsu Limited Recognition apparatus with function of displaying plural recognition candidates
FI97919C (fi) 1992-06-05 1997-03-10 Nokia Mobile Phones Ltd Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten
DE4225475A1 (de) * 1992-08-01 1994-02-03 Philips Patentverwaltung Einrichtung zur Spracherkennung
US5577164A (en) * 1994-01-28 1996-11-19 Canon Kabushiki Kaisha Incorrect voice command recognition prevention and recovery processing method and apparatus
CA2143980A1 (en) 1994-04-06 1995-10-07 Raziel Haimi-Cohen User display in speech recognition system
FI111893B (fi) * 1995-06-02 2003-09-30 Nokia Corp Menetelmä ja laite puhelimen ohjaamiseksi komennoilla
US5917890A (en) * 1995-12-29 1999-06-29 At&T Corp Disambiguation of alphabetic characters in an automated call processing environment
FI101333B (fi) * 1996-09-02 1998-05-29 Nokia Mobile Phones Ltd Puhekomennoilla ohjattava telepäätelaite
US6154526A (en) * 1996-12-04 2000-11-28 Intellivoice Communications, Inc. Data acquisition and error correcting speech recognition system

Also Published As

Publication number Publication date
DE69832003D1 (de) 2005-12-01
FI971925A0 (fi) 1997-05-06
US6314166B1 (en) 2001-11-06
FI111673B (fi) 2003-08-29
EP0877518A2 (de) 1998-11-11
EP0877518A3 (de) 2003-08-06
JPH10341276A (ja) 1998-12-22
EP0877518B1 (de) 2005-10-26
FI971925A (fi) 1998-11-07

Similar Documents

Publication Publication Date Title
DE69832003T2 (de) Verfahren zum Wählen einer Telefonnummer durch Sprachbefehle und ein durch Sprachbefehle gesteuertes Telekommunikationsendgerät
DE69629873T2 (de) Verfahren und Vorrichtung zum Steuern eines Telephons mittels Sprachbefehle
DE69828611T2 (de) Zellulares telefongerät mit sprachgesteuerten wahlverfahren
DE69426969T2 (de) Spracherkennung mit bewerteter Entscheidung
DE3885683T2 (de) Telefonapparat.
DE60111775T2 (de) Sprachgesteuertes tragbares endgerät
DE60024506T2 (de) Verfahren zur mehrstufigen Spracherkennung und Funkübertragungsvorrichtung zur Steuerung durch Sprache
DE3688747T2 (de) Optimales verfahren für datenermässigung in einem spracherkennungssystem.
DE69026866T2 (de) Wähleinheit mit Spracherkennung
DE69614789T2 (de) Vom Anwender auswählbare mehrfache Schwellenwertkriterien für Spracherkennung
DE3301516A1 (de) Sprachgesteuerter funksenderempfaenger und verfahren zu dessen sprachsteuerung
DE3853294T2 (de) Verfahren zur beendigung eines telefonanrufs durch sprachsteuerung.
DE69735522T2 (de) Sprachgesteuerter Telekommunikationsterminal
DE3688749T2 (de) Verfahren und vorrichtung zur sprachsynthese ohne informationen über die stimme oder hinsichtlich stimmhöhe.
EP1041362B1 (de) Eingabeverfahren in ein Fahrerinformationssystem
DE60212725T2 (de) Verfahren zur automatischen spracherkennung
DE10006930B4 (de) System und Verfahren zur Spracherkennung
DE10047613A1 (de) Verfahren und System zum Betreiben eines tragbaren Telefons durch Spracherkennung
EP1456837B1 (de) Verfahren und vorrichtung zur spracherkennung
DE60008893T2 (de) Sprachgesteuertes tragbares Endgerät
DE102009009697B4 (de) Fahrzeug-Freisprecheinrichtung
DE602004004746T2 (de) Ortsabhängige Sprachwahlvorrichtung und Sprachwahlverfahren
EP0928532B1 (de) Verfahren zum einstellen von endgerätespezifischen parametern eines kommunikationsendgeräts
DE19751123C1 (de) Vorrichtung und Verfahren zur sprecherunabhängigen Sprachnamenwahl für Telekommunikations-Endeinrichtungen
DE4225475A1 (de) Einrichtung zur Spracherkennung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee