DE10327943A1 - Unterschiedliche Zahlenleseweisen zulassendes Spracherkennungssystem - Google Patents

Unterschiedliche Zahlenleseweisen zulassendes Spracherkennungssystem Download PDF

Info

Publication number
DE10327943A1
DE10327943A1 DE10327943A DE10327943A DE10327943A1 DE 10327943 A1 DE10327943 A1 DE 10327943A1 DE 10327943 A DE10327943 A DE 10327943A DE 10327943 A DE10327943 A DE 10327943A DE 10327943 A1 DE10327943 A1 DE 10327943A1
Authority
DE
Germany
Prior art keywords
digit
reading
language content
digit number
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE10327943A
Other languages
English (en)
Other versions
DE10327943B4 (de
Inventor
Hideo Kariya Miyauchi
Makoto Kariya Sakai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Publication of DE10327943A1 publication Critical patent/DE10327943A1/de
Application granted granted Critical
Publication of DE10327943B4 publication Critical patent/DE10327943B4/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/187Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Navigation (AREA)
  • Telephone Function (AREA)
  • Traffic Control Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Ein in einer Erkennungswörterbuch-Speichereinheit gespeichertes Erkennungswörterbuch speichert ein Erkennungswort und einen Sprachinhalt auf zwei Weisen. Auf eine erste Weise werden das Erkennungswort einer einstelligen Zahl und sein Sprachinhalt eines Lesens der einstelligen Zahl zueinander in Beziehung gesetzt. Auf eine zweite Weise werden das Erkennungswort einer mehrstelligen Zahl und ihr Sprachinhalt eines Lesens der mehrstelligen Zahl, das einen Ausdruck eines Zahlenwerts beinhaltet, zueinander in Beziehung gesetzt. Zum Beispiel wird dadurch auch "12" erkannt, wenn ein Sprecher ausspricht, um "12" durch Lesen von entweder "eins-zwei" oder "zwölf" einzugeben. Als ein Ergebnis wählt ein Benutzer eine Leseweise für eine Telefonnummer aus, so daß der Benutzer die Telenonnummer einfach lesen kann.

Description

  • Die vorliegende Erfindung betrifft ein Spracherkennungssystem, das eine auf mehrere unterschiedliche Weisen ausgesprochene Zahl erkennt. Zum Beispiel können die Zahlen, wie zum Beispiel "12" oder "1000" als jede einstellige Zahl in einer fortlaufenden Reihenfolge, wie zum Beispiel "eins-zwei" oder "eins-null-null-null" gelesen werden oder als eine mehrstellige Zahl, wie zum Beispiel "zwölf" oder "eintausend", gelesen werden.
  • Es gibt ein Spracherkennungssystem, das eine Telefonnummer unter Verwendung von Sprache aufnimmt, die von einem Benutzer ausgesprochen wird. In dem System ist es erforderlich, daß der Benutzer die Telefonnummer Ziffer (numerisches Zeichen) um Ziffer in einer fortlaufenden Reihenfolge (ein fortlaufendes einstelliges Lesen) liest (oder ausspricht). Wenn eine Telefonnummer eine Ferngesprächsnummer von "0566", eine Ortsgesprächsnummer von "12" und eine Teilnehmernummer von "3000" aufweist, ist es zum Beispiel erforderlich, daß die Telefonnummer durch fortlaufendes einstelliges Lesen als "null", "fünf", "sechs", "sechs", "eins", "zwei", "drei", "null", "null" und "null" gelesen wird. Das System erkennt dadurch die Telefonnummer, die von dem Benutzer ausgesprochen wird, als eine Zahl, die fortlaufende Ziffern von "0566123000" aufweist.
  • Ein Benutzer liest manchmal die Telefonnummer auf andere Weisen. Zum Beispiel können die Ortsgesprächsnummer von "12" und die Teilnehmernummer von "3000" als "zwölf' und "dreitausend", die Zahlenwerte beinhalten, gelesen werden (Zahlenwerte enthaltendes Lesen oder ausgesprochenes Lesen). Jedoch erkennt das Spracherkennungssystem das Zahlenwerte enthaltene Lesen nicht.
  • Es ist eine Aufgabe der vorliegenden Erfindung, ein Spracherkennungssystem zu schaffen, das ein derartiges Lesen von Zahlen auf unter schiedliche Weisen zuläßt, daß ein Benutzer eine Leseweise auswählen kann, die zuläßt, das der Benutzer eine Zahl einfach liest.
  • Die Aufgabe wird mit den in Anspruch 1, 2, 6, 10 und 11 angegebenen Maßnahmen gelöst.
  • Weitere vorteilhafte Ausgestaltungen der vorliegenden Erfindung sind Gegenstand der abhängigen Ansprüche.
  • Genauer gesagt ist, um die vorhergehende Aufgabe zu lösen, ein Spracherkennungssystem mit dem Folgenden versehen. Zum Zuordnen einer eingegebenen Zahl, die von einem Benutzer ausgesprochen wird, speichert das Spracherkennungssystem eine einstellige Zahl und einen ersten Sprachinhalt eines Lesens der einstelligen Zahl und eine mehrstellige Zahl und einen zweiten Sprachinhalt eines Lesens der mehrstelligen Zahl. Hierbei werden die einstellige Zahl und der erste Sprachinhalt miteinander korreliert und werden die mehrstellige Zahl und der zweite Sprachinhalt miteinander korreliert. Wenn eine gegebene Zahl von dem Benutzer eingegeben wird, wird die eingegebene gegebene Zahl durch Zuordnen der ersten und zweiten Sprachinhalte erkannt. Diese Struktur läßt zu, daß ein Benutzer eine Leseweise auswählt, auf welche der Benutzer einfach eine Zahl lesen kann.
  • Gemäß einem anderen Aspekt der vorliegenden Erfindung ist ein Spracherkennungssystem mit dem Folgenden Versehen. Zum Zuordnen einer eingegebenen Telefonnummer, die von einem Benutzer ausgesprochen wird, weist das Spracherkennungssystem den Benutzer an, eine Telefonnummer durch Teilen in eine Ferngesprächsnummer, eine Ortsgesprächsnummer und eine Teilnehmernummer zu teilen. Das System speichert Erkennungswörterbücher, welches eine Zahl und einen Sprachinhalt eines Lesens der Zahl beinhaltet, bezüglich von jedem eines Ferngesprächsnummerwörterbuchs, eines Ortsgesprächsnummernwörterbuchs und eines Teilnehmernummerwörterbuchs.
  • Das Ortsgesprächsnummernwörterbuch speichert ein erstes Paar einer einstelligen Zahl und eines ersten Sprachinhalts eines Lesens der einstelligen Zahl und ein zweites Paar einer mehrstelligen Zahl und eines zweiten Sprachinhalts eines Lesens der mehrstelligen Zahl durch Einschließen eines Zahlenwerts. Wenn die Ferngesprächsnummer, die Ortsgesprächsnummer und die Teilnehmernummer gemäß Anweisungen von dem Benutzer eingegeben werden, werden die eingegebenen Zahlen durch Zuordnen zu entsprechenden Erkennungswörterbüchern erkannt. Diese Struktur läßt zu, daß Erkennungswörterbücher zum Zuordnen einer Spracheingabe gemäß einem Eingabeinhalt oder einer Eingabereihenfolge einer Telefonnummer umgeschaltet werden. Die zugeordneten Spracheingaben sind dadurch beschränkt, so daß verhindert wird, daß sich eine Erkennungsrate einer Telefonnummer verringert.
  • Die vorliegende Erfindung wird nachstehend anhand von Ausführungsbeispielen unter Bezugnahme auf die beiliegende Zeichnung näher erläutert.
  • Es zeigt:
  • 1 ein schematisches Blockschaltbild einer Struktur eines Fahrzeugnavigationssystems gemäß ersten und zweiten Ausführungsbeispielen der vorliegende Erfindung;
  • 2 ein Blockschaltbild einer Struktur einer Spracherkennungseinheit gemäß den Ausführungsbeispielen der vorliegenden Erfindung;
  • 3 ein Blockschaltbild einer Struktur einer Streckenleiteinheit gemäß den Ausführungsbeispielen der vorliegenden Erfindung;
  • 4 eine Tabelle eines in einer Erkennungswörterbuch-Speichereinheit gespeicherten Erkennungswörterbuchs gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung;
  • 5 ein Flußdiagramm einer Gesamtverarbeitung des Fahrzeugnavigationssystems gemäß den Ausführungsbeispielen der vorliegenden Erfindung;
  • 6 ein Flußdiagramm einer Verarbeitung einer Spracherkennung für eine Telefonnummer gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung;
  • 7 eine Tabelle von in einer Nachrichtenspeichereinheit gespeicherten Nachrichten gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung;
  • 8 eine Tabelle eines Ferngesprächsnummer-Wörterbuchs gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung;
  • 9 eine Tabelle eines Ortsgesprächsnummer-Wörterbuchs gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung;
  • 10 eine Tabelle eines Teilnehmernummer-Wörterbuchs gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung;
  • 11 eine Tabelle von in einer Nachrichtenspeichereinheit gespeicherten Nachrichten gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung; und
  • 12 ein Flußdiagramm einer Verarbeitung einer Spracherkennung für eine Telefonnummer gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung.
  • Nachstehend erfolgt die Beschreibung eines ersten Ausführungsbeispiels der vorliegenden Erfindung.
  • Eine Fahrzeugnavigationsvorrichtung, die in einem Fahrzeug vorgesehen ist, wird als ein Ausführungsbeispiel erläutert, auf das sich ein Spracherkennungssystem der vorliegenden Erfindung bezieht.
  • Wie es in 1 gezeigt ist, weist die Fahrzeugnavigationsvorrichtung 1 eine Spracherkennungs-(REC)-Einheit 10, eine Streckenleiteinheit 11, eine Fahrzeugpositions- und Richtungsberechnungseinheit 12 und eine Straßenkarten-Zeicheneinheit (nicht gezeigt) auf. Die Fahrzeugnavigationsvorrich tung 1 ist mit einem Mikrofon 2 zum Eingeben von Sprache, einem Sprachschalter 3, einer Anzeigeeinheit 4, einem Lautsprecher 5, einem GPS-Empfänger 6, einem Fahrzeuggeschwindigkeitssensor 7, einem Gierwertsensor 8, einer Kartendatenbank 9 und dergleichen verbunden.
  • Das Mikrofon 2 und der Sprachschalter 3 werden zur Spracheingabe verwendet. Wenn ein Druckknopf des Sprachschalters 3 niedergedrückt wird, wird ein Eingabe-Auslösesignal zu der Spracherkennungseinheit 10 gesendet. Wenn die Spracherkennungseinheit 10 das Eingabe-Auslösesignal empfängt, schaltet sie zu einer Spracheingabebetriebsart eines Zulassens der Spracheingabe durch das Mikrofon 2 um.
  • In der Spracheingabebetriebsart wird, wenn ein Benutzer Sprache ausspricht, die Sprache durch das Mikrofon 2 zu einem Sprachsignal gewandelt, um zu der Spracherkennungseinheit 10 gesendet zu werden. Die Spracherkennungseinheit 10 erkennt das Sprachsignal zum Wandeln in eine Zahl oder eine Anweisung, die der Sprache entspricht. Zum Beispiel wird eine Sprache von "eins-zwei" zu einer Zahl von "12" gewandelt. Die Zahl wird zu der Streckenleiteinheit 11 gesendet. Wenn die Streckenleiteinheit 11 eine Telefonnummer erfaßt, die eine Ferngesprächsnummer, eine Ortsgesprächsnummer und eine Teilnehmernummer aufweist, sucht sie dann nach einer Position, die der Telefonnummer entspricht, um sie auf der Anzeigeeinheit 4 anzuzeigen.
  • Die Anzeigeeinheit 4 ist aus einer Flüssigkristallanzeige ausgebildet, die eine Straßenkarte oder dergleichen zeigt. Eine Berührungsanzeige bzw. ein Touch-Panel kann als die Anzeigeeinheit 4 verwendet werden.
  • Der Lautsprecher 5 wird zum Ausgeben einer Sprachhilfe oder von verschiedenen Alarmen verwendet. Zum Beispiel kann er ein Lautsprecher, der vorhergehend in das Fahrzeug eingebaut worden ist, oder ein Lautsprecher sein, der in die Fahrzeugnavigationsvorrichtung 1 eingebaut ist.
  • Der GPS-Empfänger 6, der Fahrzeuggeschwindigkeitssensor 7 und der Gierwertsensor 8 erzeugen erforderliche Signale (Sensorsignale), die zum Berechnen einer derzeitigen Position oder einer Fahrtrichtung des Fahr zeugs verwendet werden. Die erzeugten Sensorsignale werden zu der Fahrzeugpositions- und Richtungsberechnungseinheit 12 gesendet.
  • Die Kartendatenbank 9 ist in einem Speicher (nicht gezeigt) gespeichert und beinhaltet eine Karteninformation und eine Straßeninformation. Obgleich eine CD-ROM oder eine DVD-ROM im allgemeinen abhängig von einer Datenmenge als der Speicher verwendet wird, können eine Speicherkarte oder ein Festplattenlaufwerk ebenso verwendet werden. Die Karteninformation wird zum Beispiel zum Zeichnen einer Landkarte, die in der Anzeigeeinheit 4 gezeigt ist, verwendet und besteht aus Daten, die zu Gebäudenamen, Adressen, Telefonnummern, Koordinaten auf einer Karte und dergleichen zueinander in Beziehung gesetzt sind.
  • Es wird auf 2 verwiesen. Die Spracherkennungseinheit 10 der Fahrzeugnavigationsvorrichtung wird nachstehend erläutert. Die Spracherkennungseinheit 10 beinhaltet eine A/D-Wandlerschaltung 101, eine Erkennungsprogramm-Verarbeitungseinheit 102, eine Tonmodell-Speichereinheit 103, eine Erkennungswörterbuch-Speichereinheit 104 und dergleichen.
  • Die A/D-Wandlerschaltung 101 wandelt ein analoges Sprachsignal, das von dem Mikrofon 2 empfangen wird, zu einem digitalen Signal. Das gewandelte digitale Sprachsignal wird zu der Erkennungsprogramm-Verarbeitungseinheit 102 gesendet.
  • Die Erkennungsprogramm-Verarbeitungseinheit 102 wandelt unter Verwendung der Tonmodell-Speichereinheit 103 und der Erkennungswörterbuch-Speichereinheit 104 das digitale Sprachsignal zu einer Zahl oder einer Anweisung. Die Erkennungsprogramm-Verarbeitungseinheit 102 analysiert einen Sprachinhalt, der dem digitalen Sprachsignal entspricht, unter Verwendung von zum Beispiel einem bekannten Hidden-Marukov-Modell, das in der Tonmodell-Speichereinheit 103 gespeichert ist.
  • Dieser analysierte Sprachinhalt wird dann Sprachinhalten zugeordnet, die in der Erkennungswörterbuch-Speichereinheit 104 gespeichert sind, so daß das wahrscheinlichste Erkennungswort und seine entsprechende Zahl extrahiert werden.
  • Die Erkennungswörterbuch-Speichereinheit 104 wird erläutert. Die Erkennungswörterbuch-Speichereinheit 104 beinhaltet ein Erkennungswörterbuch, das eine Struktur aufweist, die in 4 gezeigt ist. Ein Erkennungswort entspricht einer einstelligen Zahl (einem numerischen Zeichen) wie zum Beispiel "1" oder einer mehrstelligen Zahl, wie zum Beispiel "12". Die einstellige Zahl und die mehrstellige Zahl werden zu einem fortlaufenden einstelligen Lesen bzw. einem Zahlenwerte beinhaltenden Lesen in Beziehung gesetzt. Zum Beispiel wird eine einstellige Zahl von "eins" mit "1" des fortlaufenden einstelligen Lesen in Beziehung gesetzt und werden eine zweistellige Zahl von "12" und eine vierstellige Zahl von "1000" mit "zwölf" und "tausend" des Zahlenwerte beinhaltenden Lesens in Beziehung gesetzt.
  • Daher werden in der Erkennungswörterbuch-Speichereinheit 104 die einstelligen Zahlen (0 bis 9) mit dem fortlaufenden einstelligen Lesen in Beziehung gesetzt, während die mehrstelligen Zahlen (zum Beispiel "12" oder "1000") mit den Zahlenwerte beinhaltenden Lesen in Beziehung gesetzt werden. Signale, die den Zahlen oder Anweisungen entsprechen, die von der Erkennungsprogramm-Verarbeitungseinheit 102 extrahiert werden, werden dann zu der Streckenleiteinheit 11 gesendet.
  • Die Streckenleiteinheit 11 der Fahrzeugnavigationsvorrichtung 1 wird nachstehend unter Bezugnahme auf 3 erläutert. Die Streckenleiteinheit 11 beinhaltet eine Funktionsausführungseinheit 10, eine Nachrichtenausgabeeinheit 111 und eine Nachrichtenspeichereinheit 112.
  • Die Funktionsausführungseinheit 110 führt eine Funktion eines Anzeigens einer Straßenkarte, die eine derzeitige Position des Fahrzeugs umgibt, eine Funktion eines Suchens nach einer Stelle durch eine Telefonnummerneingabe oder dergleichen aus. Zum Beispiel werden bei der Funktion eines Anzeigens der Straßenkarte, die die derzeitige Position des Fahrzeugs umgibt, wenn eine entsprechende Anweisung empfangen wird, Signale, die sich auf die derzeitige Position und Fahrtrichtung des Fahrzeugs beziehen, aus der Fahrzeugpositions- und -richtungsberechnungseinheit 12 erzielt. Weiterhin werden Kartendaten, die das Fahrzeug umgeben, aus der Kartendatenbank 9 ausgelesen. Die Signale und die Kartendaten werden dann zu Bildsignalen gewandelt und auf der Anzeigeeinheit 4 angezeigt. Die Funktionausführungseinheit 10 sendet dann einen Anweisungscode, der der ausgeführten Funktion entspricht, zu der Nachrichtenausgabeeinheit 111.
  • Bei der Funktion eines Suchens der Stelle durch die Telefonnummerneingabe wird ein Gebäude, das der Telefonnummer entspricht, und seine Umgebungskarte wie folgt mitgeteilt: die Funktionsausführungseinheit 110 empfängt eine Telefonnummer, die Ferngesprächs-, Ortsgesprächs- und Teilnehmernummern aufweist, von der Spracherkennungseinheit 10; sie erzielt einen Gebäudenamen, eine Adresse und Koordinaten, die der eingegebenen Telefonnummer entsprechen, von der Kartendatenbank 9; sie erzielt weiterhin eine Karten- und eine Straßeninformation, die die erzielten Koordinaten umgeben; die erzielte Information wird zu Bildsignalen gewandelt, die zu der Anzeigeeinheit 4 zu senden sind; und die Stelle, die der Telefonnummer entspricht, und seine Umgebungsstraßenkarte werden auf der Anzeigeeinheit 4 angezeigt.
  • Die Nachrichtenausgabeeinheit 111 empfängt den Anweisungscode, um eine entsprechende Nachricht zu extrahieren, aus der Nachrichtenspeichereinheit 112. Die Nachricht wird auf der Anzeigeeinheit 4 angezeigt oder zu dem Lautsprecher 5 ausgegeben. Wie es in 7 gezeigt ist, werden Nachrichten, die in der Nachrichtenspeichereinheit 112 gespeichert sind, zu Anweisungscodes in Beziehung gesetzt. Zum Beispiel teilt die Nachrichtenausgabeeinheit 111 bei der Funktion eines Anzeigens der Straßenkarte, die die derzeitige Position des Fahrzeugs umgibt, wenn ein Anweisungscode von "00001" empfangen wird, "DERZEITIGE POSITION IST ANZUZEIGEN" mit, was dem Anweisungscode von "00001" entspricht.
  • Eine Verarbeitung der Fahrzeugnavigationsvorrichtung wird unter Berücksichtigung der Funktion eines Suchens der Stelle, die einer eingegebenen Telefonnummer entspricht, unter Bezugnahme auf die 5 und 6 erläutert. Als ein Beispiel wird ein Fall, in dem eine Telefonnummer von "00220-12-1000" eingegeben wird, nachstehend erläutert.
  • In einem Schritt 1 fährt, wie es in 5 gezeigt ist, ein Wartezustand fort, bis der Sprachschalter 3 von einem Benutzer niedergedrückt wird, und die Verarbeitung schreitet zu einem Schritt 2, wenn der Sprachschalter 3 niedergedrückt wird. In dem Schritt 2 schaltet die Spracherkennungseinheit 10 zu einer Eingabebetriebsart um, in der eine Spracheingabe zugelassen wird.
  • Eine Spracherkennungsverarbeitung in einem Schritt 3 wird unter Bezugnahme auf 6 erläutert. In einem Schritt 30 wird es bestimmt, ob "SUCHE NACH TELEFONNUMMER" zum Suchen einer Stelle eines Objekts eingegeben wird. Wenn es bestimmt wird, daß "SUCHE NACH TELEFONNUMMER" eingegeben wird, schreitet die Verarbeitung zu einem Schritt 31 fort. Ansonsten bleibt die Verarbeitung in dem Wartezustand.
  • In dem Schritt 31 wird die eingegebene Sprache zum Bestimmen des Sprachinhalts analysiert. Hierbei wird es angenommen, daß die ausgesprochene Sprache als Sprachinhalte von "null", "zwei", "zwei", "null", "zwölf" und "eintausend" analysiert wird.
  • In einem Schritt 32 werden die wahrscheinlichsten Erkennungswörter für die Sprachinhalte durch Zuordnen in dem Erkennungswörterbuch der Erkennungswörterbuch-Speichereinheit 104 extrahiert.
  • In einem Schritt 33 wird eine Zahl entsprechend den extrahierten Erkennungswörtern extrahiert. Hierbei wird eine Mehrzahl von Zahlen von "0", " 2", " 2", "0", "12" und "1000" extrahiert.
  • In einem Schritt 34 werden Signale, die den extrahierten Zahlen entsprechen, zu der Funktionsausführungseinheit 110 der Streckenleiteinheit 11 gesendet. Hierbei werden die extrahierten Zahlen auf eine kombinierte Weise, das heißt zu fortlaufenden zehn Ziffern von "0220121000", gewandelt.
  • In einem Schritt 4 in 5 werden Daten, die einer Telefonnummer der zehnstelligen Nummer entsprechen, die von der Spracherkennungseinheit 10 gesendet wird, aus der Kartendatenbank 9 extrahiert. Die Daten beinhalten einen Gebäudenamen, eine Adresse und Koordinaten. Eine Informa tion über eine Karte oder Straße, die die extrahierten Koordinaten umgeben, wird weiterhin extrahiert.
  • In einem Schritt 5 werden die extrahierten Daten und die Information zu Bildsignalen gewandelt, die zu der Anzeigeeinheit 4 zu senden sind. Die Stelle, die der eingegebenen Telefonnummer entspricht, und ihre Umgebungsstraßenkarte werden dadurch angezeigt.
  • Wie es vorhergehend erläutert worden ist, ordnet das Spracherkennungssystem der vorliegenden Erfindung bei einem Erkennen einer Telefonnummer einen eingegebenen Sprachinhalt unter Verwendung des Erkennungswörterbuchs zu, das Sprachinhalte beinhaltet, die dem fortlaufenden einstelligen Lesen und ebenso dem Zahlenwerte beinhaltenden Lesen entsprechen. Dadurch wird auch dann, wenn ein Benutzer das fortlaufende einstellige Lesen von "eins-zwei" oder das Zahlenwerte beinhaltende Lesen von "zwölf' auswählt, eine Zahl von "12" erkannt.
  • Weiterhin beinhaltet das Erkennungswörterbuch Wiederholungswörter und Ersatzwörter. Wie es in 4 gezeigt ist, sind die Erkennungswörter zum Beispiel "zweimal" oder "dreimal", während die Ersatzwörter zum Beispiel "o" sind, das "0" anzeigt. Auch dann, wenn ein Benutzer "1000" als "eins-null-null-null", "eins-o-o-o", "eins-dreimal null" oder "eins-dreimal o" liest, das wohlklingend ist, wird eine Zahl von "1000" richtig erkannt. Deshalb kann der Benutzer eine Leseweise auswählen, die zuläßt, daß der Benutzer die Telefonnummer einfach liest.
  • Weiterhin kann die vorliegende Erfindung nicht nur auf eine Funktion eines Suchens nach einer Stelle in einer Fahrzeugnavigationsvorrichtung gerichtet sein, sondern ebenso auf andere Fälle. Die Fälle sind derart, wie zum Beispiel eine Funktion eines Eingehens eines Bestimmungsorts durch eine Telefonnummer oder eine Funktion eines Anrufens eines Festnetztelefons unter Verwendung einer Spracheingabe einer Telefonnummer in einer Telefonzelle.
  • Nachstehend erfolgt die Beschreibung eines zweiten Ausführungsbeispiels der vorliegenden Erfindung.
  • Das zweite Ausführungsbeispiel der vorliegenden Erfindung ist in vielen Aspekten zu dem ersten Ausführungsbeispiel der vorliegenden Erfindung ähnlich. Unterschiedliche Merkmale sind wie folgt: eine Erkennungswörterbuch-Speichereinheit 104 beinhaltet drei Wörterbücher einer Ferngesprächstelefonnummer, einer Ortsgesprächstelefonnummer und einer Teilnehmertelefonnummer; Nachrichten, die in einer Nachrichtenspeichereinheit 112 gespeichert sind, beinhalten Nachrichten, die einer Eingabeweise einer Telefonnummer entsprechen; und die Eingabeweisen werden einem Benutzer zum Führen einer Spracheingabe mitgeteilt, wenn der Benutzer die Ferngesprächstelefonnummer, die Ortsgesprächstelefonnummer oder die Teilnehmertelefonnummer eingibt.
  • Die Erkennungswörterbuch-Speichereinheit 104 des zweiten Ausführungsbeispiels der vorliegenden Erfindung beinhaltet die drei Erkennungswörterbücher, die in den 8 bis 10 gezeigt sind. Ein Ferngesprächsnummer-Wörterbuch, das in 8 gezeigt ist, wird zum Erkennen der Ferngesprächstelefonnummer verwendet. Es speichert Erkennungswörter und einstellige Zahlen, von denen beide zueinander in Beziehung gesetzt sind. Das heißt, die Erkennungswörter entsprechen den einstelligen Zahlen, so daß die Erkennungswörter für ein fortlaufendes einstelliges Lesen verwendet werden.
  • Ein Ortsgesprächnummer-Wörterbuch, das in 9 gezeigt ist, wird zum Erkennen der Ortsgesprächtelefonnummer verwendet. Es speichert Erkennungswörter und einstellige oder mehrstellige Zahlen. Die Erkennungswörter, die den mehrstelligen Zahlen entsprechen, werden für ein Zahlenwerte beinhaltendes Lesen verwendet, während die Erkennungswörter, die den einstelligen Zahlen entsprechen, für das fortlaufende einstellige Lesen verwendet werden. Zum Beispiel ist eine zweistellige Zahl von "12" gespeichert, die zu einem Erkennungswort von "zwölf' in Verbindung gesetzt ist.
  • Ein Teilnehmernummer-Wörterbuch, das in 10 gezeigt ist, wird zum Erkennen der Teilnehmertelefonnummer verwendet. Es speichert Erkennungswörter und einstellige und vierstellige Zahlen. Die Erkennungswörter, die den vierstelligen Zahlen entsprechen, werden für das Zahlen werte beinhaltende Lesen verwendet, während die Erkennungswörter, die den einstelligen Zahlen entsprechen, für das fortlaufende einstellige Lesen verwendet werden. Zum Beispiel ist eine vierstellige Zahl von "1000" gespeichert, die zu einem Erkennungswort von "eintausend" in Beziehung gesetzt ist.
  • Nachrichten, die in der Nachrichtenspeichereinheit 112 des zweiten Ausführungsbeispiels der vorliegenden Erfindung gespeichert sind, sind in 11 gezeigt. Nachrichten, die Anweisungscodes von "C1001 ", "C1002" und C1003" aufweisen, entsprechen einer Funktion eines Suchens einer Stelle durch eine Telefonnummerneingabe. Die Nachrichtenausgabeeinheit 111 empfängt einen Anweisungscode, der zu einer Eingabereihenfolge der Telefonnummer in Beziehung gesetzt ist, von der Funktionsausführungseinheit 110. Sie extrahiert dann eine Nachricht, die dem empfangenen Anweisungscode entspricht, aus der Nachrichtenspeichereinheit 112, um sie zum Leiten einer Spracheingabe zu dem Benutzer zu der Anzeigeeinheit 4 oder dem Lautsprecher 5 auszugeben.
  • Eine Verarbeitung einer Spracherkennung für eine Telefonnummer des zweiten Ausführungsbeispiels der vorliegenden Erfindung, die ein Führen der Spracheingabe der Telefonnummer beinhaltet, wird nachstehend unter Bezugnahme auf 12 erläutert. Diese Verarbeitung wird innerhalb der Verarbeitung ausgeführt, die in dem ersten Ausführungsbeispiel der vorliegenden Erfindung in 5 erläutert ist. Hier im weiteren Verlauf wird es angenommen, daß eine Telefonnummer von "0220-12-1000" über Sprache durch einen Benutzer eingegeben wird.
  • In einem Schritt 300 wird es bestimmt, ob "SUCHE NACH TELEFONNUMMER" zum Suchen einer Stelle eines Objekts eingegeben wird. Wenn es bestimmt wird, daß "SUCHE NACH TELEFONNUMMER" eingegeben wird, schreitet eine Verarbeitung zu einem Schritt 301 fort. Ansonsten bleibt die Verarbeitung in einem Wartezustand.
  • In dem Schritt 301 wird für die nachfolgende Verarbeitung in Schritten 303 und 304 ein Ferngesprächsnummer-Wörterbuch als ein Erkennungswörterbuch der Erkennungswörterbuch-Speichereinheit 104 festgelegt, das zum Extrahieren eines Erkennungsworts zu verwenden ist. In den Schritten 303 und 304 wird ein Erkennungswort durch Zuordnen extrahiert und wird eine Zahl, die dem Erkennungswort entspricht, aus dem Ferngesprächsnummer-Wörterbuch extrahiert.
  • In einem Schritt 302 wird ein Signal, das mitteilt, daß ein Ferngesprächsnummer-Wörterbuch als das Erkennungswörterbuch festgelegt ist, zu der Funktionsausführungseinheit 110 gesendet. Die Funktionsausführungseinheit 110 sendet dann einen Anweisungscode von "C1001 ", der einer Ferngesprächstelefonnummer entspricht, zu der Nachrichtenausgabeeinheit 111. Die Nachrichtenausgabeeinheit 111 extrahiert dann eine Nachricht, die dem Anweisungscode von "C1001" entspricht, aus der Nachrichtenspeichereinheit 112, um sie zu der Anzeigeeinheit 4 oder dem Lautsprecher 5 auszugeben. Eine Nachricht von "Bitte geben sie eine Ferngesprächstelefonnummer ein", wird dadurch dem Benutzer mitgeteilt.
  • In einem Schritt 303 spricht der Benutzer, um die Ferngesprächstelefonnummer gemäß der Nachricht einzugeben, die in dem Schritt 302 mitgeteilt wird. Sprachinhalte werden dann aus der ausgesprochenen Sprache analysiert. Als ein Ergebnis einer Analyse werden "null", "zwei", "zwei" und "null" als die Sprachinhalte erkannt.
  • In einem Schritt 304 wird das wahrscheinlichste Erkennungswort für die analysierten Sprachinhalte durch das Zuordnen in dem Ferngesprächstelefonnummer-Wörterbuch der Erkennungswörterbuch-Speichereinheit 104 extrahiert. Zahlen, die den extrahierten Erkennungswörtern entsprechen, werden dann extrahiert. Hierbei werden "0", "2", "2" und "0" für fortlaufende Zahlen von "null", "zwei", "zwei" und "null" extrahiert.
  • In einem Schritt 305 werden Signale, die den fortlaufenden Zahlen entsprechen, zu der Streckenleiteinheit 11 gesendet. Hierbei werden die extrahierten fortlaufenden Zahlen, die zu senden sind, als eine Form einer vierstelligen Zahl von "0220" kombiniert. Die Streckenleiteinheit 11 zeigt demgemäß die empfangene vierstellige Zahl auf der Anzeigeeinheit 4 an.
  • In einem Schritt 306 wird es bestimmt, ob eine Teilnehmertelefonnummer extrahiert wird. Wenn es bestimmt wird, daß die Teilnehmertelefonnummer extrahiert wird, ist die Verarbeitung der Spracherkennung beendet. Ansonsten kehrt die Verarbeitung zu dem Schritt 301 zurück. In der vorhergehenden Erläuterung wird lediglich die Ferngesprächstelefonnummer extrahiert, so daß die Verarbeitung zu dem Schritt 301 zurückkehrt.
  • Erneut wird in dem Schritt 301 auf der Grundlage der Reihenfolge der Telefonnummerneingabe ein Ortsgesprächnummern-Wörterbuch als ein nächstes Erkennungswörterbuch festgelegt, das zum Extrahieren eines Erkennungsworts zu verwenden ist.
  • In einem Schritt 302 sendet die Funktionsausführungseinheit 110 ähnlich der vorhergehenden Erläuterung einen Anweisungscode von "C1002", der einer Ortsgesprächtelefonnummer entspricht, zu einer Nachrichtenausgabeeinheit 111. Die Nachrichtenausgabeeinheit 111 extrahiert dann eine Nachricht, die dem Anweisungscode von "C1002" entspricht, von der Nachrichtenspeichereinheit 112, um sie zu der Anzeigeeinheit 4 oder dem Lautsprecher 5 auszugeben. Eine Nachricht von "Bitte geben sie eine Ortsgesprächstelefonnummer ein" wird dadurch dem Benutzer mitgeteilt.
  • In einem Schritt 303 spricht der Benutzer, um die Ortsgesprächstelefonnummer gemäß der Nachricht einzugeben, die in dem Schritt 302 mitgeteilt wird. Sprachinhalte werden dann aus der ausgesprochenen Sprache analysiert. Als ein Ergebnis eines Analysierens wird "zwölf" als die Sprachinhalte erkannt.
  • In einem Schritt 304 wird das wahrscheinlichste Erkennungswort für die analysierten Sprachinhalte durch das Zuordnen in dem Ortsgesprächstelefonnummern-Wörterbuch der Erkennungswörterbuch-Speichereinheit 104 extrahiert. Eine Anzahl, die dem extrahierten Erkennungswort entspricht, wird dann extrahiert. Hierbei wird "12" für eine Zahlenwerte beinhaltende Zahl von "zwölf' extrahiert.
  • In einem Schritt 305 werden Signale, die der Zahlenwerte beinhaltenden Zahl entsprechen, zu der Streckenleiteinheit 11 gesendet. Die Strec kenleiteinheit 11 zeigt demgemäß die empfangene zweistellige Zahl auf der Anzeigeeinheit 4 an.
  • In einem Schritt 306 wird es erneut bestimmt, ob die Teilnehmertelefonnummer extrahiert wird. In der vorhergehenden Erläuterung kehrt die Verarbeitung zu dem Schritt 301 zurück, da die Teilnehmertelefonnummer noch nicht extrahiert wird.
  • Erneut wird in dem Schritt 301 auf der Grundlage der Reihenfolge der Telefonnummerneingabe ein Teilnehmernummern-Wörterbuch als ein letztes Erkennungswörterbuch festgelegt, das zum Extrahieren eines Erkennungswort zu verwenden ist.
  • In einem Schritt 302 sendet ähnlich der vorhergehenden Erläuterung die Funktionsausführungseinheit 110 einen Anweisungscode von "C1003", der einer Teilnehmertelefonnummer entspricht, zu der Nachrichtenausgabeeinheit 111. Die Nachrichtenausgabeeinheit 111 extrahiert dann eine Nachricht, die dem Anweisungscode von "C1003" entspricht, aus der Nachrichtenspeichereinheit 112, um sie zu der Anzeigeeinheit 4 oder dem Lautsprecher 5 auszugeben. Eine Nachricht von "Bitte geben sie die letzten vier Ziffern ein" wird dadurch dem Benutzer mitgeteilt.
  • In dem Schritt 303 spricht der Benutzer, um die Teilnehmertelefonnummer gemäß der Nachricht einzugeben, die in dem Schritt 302 mitgeteilt wird. Sprachinhalte werden dann aus der ausgesprochenen Sprache analysiert. Als ein Ergebnis der Analyse wird "eintausend" als die Sprachinhalte erkannt.
  • In dem Schritt 304 wird das wahrscheinlichste Erkennungswort für die analysierten Sprachinhalte durch das Zuordnen in dem Teilnehmernummern-Wörterbuch der Erkennungswörterbuch-Speichereinheit 104 extrahiert. Eine Zahl, die dem extrahierten Erkennungswort entspricht, wird dann extrahiert. Hierbei wird "1000" für eine Zahlenwerte beinhaltende Zahl von "eintausend" extrahiert.
  • In dem Schritt 305 werden Signale, die der Zahlenwerte beinhaltenden Zahl entsprechen, zu der Streckenleiteinheit 11 gesendet. Die Streckenleiteinheit 11 zeigt demgemäß die empfangene vierstellige Zahl auf der Anzeigeeinheit 4 an.
  • In dem Schritt 306 wird es erneut bestimmt, ob die Teilnehmertelefonnummer extrahiert wird. Hierbei wird es bestimmt, daß die Teilnehmertelefonnummer extrahiert wird, so daß die Verarbeitung der Spracherkennung beendet ist, um dadurch zu der Verarbeitung zurückzukehren, die in 5 gezeigt ist.
  • Wie es vorhergehend erläutert worden ist, schaltet das Spracherkennungssystem dieses Ausführungsbeispiels der vorliegenden Erfindung Erkennungswörterbücher zum Zuordnen einer Spracheingabe gemäß einem Eingabeinhalt oder einer Eingabereihenfolge einer Telefonnummer durch einen Benutzer um. Die zugeordneten Sprachinhalte werden dann beschränkt, so daß es verhindert wird, daß sich eine Wiederholungsrate einer Telefonnummer verringert.
  • Weiterhin können bezüglich einer Ortsgesprächstelefonnummer und einer Teilnehmertelefonnummer ein fortlaufendes einstelliges Lesen und ein Zahlenwerte beinhaltendes Lesen gleichzeitig zugelassen werden, so daß ein Benutzer eine Leseweise auswählt, in welcher der Benutzer die Telefonnummer einfach liest.
  • Da "0" im allgemeinen eine erste Ziffer einer Ferngesprächstelefonnummer ist, kann ein Benutzer kaum die Ferngesprächstelefonnummer durch das Zahlenwerte beinhaltende Lesen lesen. Ein Ferngesprächsnummern-Wörterbuch kann dadurch lediglich ein Paar einer einstelligen Zahl und eines Erkennungsworts speichern, das durch das fortlaufende einstellige Lesen mit den Sprachinhalten in Beziehung gesetzt wird.
  • Weiterhin werden Nachrichten gemäß einem Inhalt einer Spracheingabe einer Ferngesprächstelefonnummer, einer Ortsgesprächstelefonnummer oder einer Teilnehmertelefonnummer mitgeteilt, so daß zugelassen wird, daß eine Eingabeführung für die Telefonnummern leicht von dem Benutzer verstanden wird.
  • In dem zweiten Ausführungsbeispiel der vorliegenden Erfindung ist eine Erkennungswörterbuch-Speichereinheit 104 aus drei unabhängigen Wörterbüchern einer Ferngesprächstelefonnummer, einer Ortsgesprächstelefonnummer und einer Teilnehmertelefonnummer ausgebildet. In jedem Wörterbuch wird ein Erkennungswort gespeichert, das zu einer einstelligen Zahl, die dem fortlaufenden einstelligen Lesen entspricht, oder einer mehrstelligen Zahl, die dem Zahlenwerte beinhaltenden Lesen entspricht, in Beziehung gesetzt ist. Deshalb kann das Erkennungswörterbuch unterschiedlich aus einem Wörterbuch für ein fortlaufendes einstelliges Lesen und einem Wörterbuch für das Zahlenwerte beinhaltende Lesen ausgebildet sein. Bei diesem Ausbilden von Wörterbüchern werden Spracheingaben einer Ferngesprächstelefonnummer in dem Wörterbuch für das fortlaufende einstellige Lesen zugeordnet, während Spracheingaben von Ortsgesprächsund Teilnehmertelefonnummern in beiden Wörterbüchern für das fortlaufende einstellige Lesen und das Zahlenwerte beinhaltende Lesen zugeordnet werden.
  • Wie es zuvor erläutert worden ist, speichert gemäß der vorliegenden Erfindung ein in einer Erkennungswörterbuch-Speichereinheit gespeichertes Erkennungswörterbuch ein Erkennungswort und einen Sprachinhalt auf zwei Weisen. Auf eine erste Weise werden das Erkennungswort einer einstelligen Zahl und sein Sprachinhalt eines Lesens der einstelligen Zahl zueinander in Beziehung gesetzt. Auf eine zweite Weise werden das Erkennungswort einer mehrstelligen Zahl und ihr Sprachinhalt eines Lesens der mehrstelligen Zahl, das einen Ausdruck eines Zahlenwerts beinhaltet, zueinander in Beziehung gesetzt. Zum Beispiel wird dadurch auch "12" erkannt, wenn ein Sprecher ausspricht, um "12" durch Lesen von entweder "eins-zwei" oder "zwölf" einzugeben. Als ein Ergebnis wählt ein Benutzer eine Leseweise für ein Telefonnummer aus, so daß der Benutzer die Telefonnummer einfach lesen kann.

Claims (11)

  1. Spracherkennungssystem, das aufweist: eine Spracheingabeeinrichtung (2, 101) zum Eingeben von Sprache, die von einem Benutzer ausgesprochen wird; eine erste Speichereinrichtung (104) zum Speichern einer einstelligen Zahl und eines ersten Sprachinhalts eines Lesens der einstelligen Zahl, wobei die einstellige Zahl und der erste Sprachinhalt zueinander in Beziehung gesetzt sind; eine zweite Speichereinrichtung (104) zum Speichern einer mehrstelligen Zahl und eines zweiten Sprachinhalts eines Lesens der mehrstelligen Zahl durch Einschließen eines Zahlenwerts, wobei die mehrstellige Zahl und der zweite Sprachinhalt zueinander in Beziehung gesetzt sind; und eine Erkennungseinrichtung (102) zum Erkennen einer eingegebenen Telefonnummer durch Zuordnen zu dem ersten Sprachinhalt und dem zweiten Sprachinhalt, wenn eine Telefonnummer von dem Benutzer durch die Spracheingabeeinrichtung (2, 101) eingegeben wird.
  2. Spracherkennungssystem, das aufweist: eine Spracheingabeeinrichtung (2, 101) zum Eingeben von Sprache, die von einem Benutzer ausgesprochen wird; eine Anweisungseinrichtung (4, 5, 110, 111, 112) zum Anweisen des Benutzers, eine Telefonnummer durch die Spracheingabeeinrichtung (2, 101) durch Teilen in eine Ferngesprächsnummer, eine Ortsgesprächnummer und eine Teilnehmernummer einzugeben; eine Speichereinrichtung (104) zum Speichern von Erkennungswörterbüchern, die eine Zahl und einen Sprachinhalt eines Lesens der Zahl beinhalten, bezüglich von jedem eines Ferngesprächsnummer-Wörterbuchs, eines Ortsgesprächnummer-Wörterbuchs und eines Teilnehmernummer-Wörterbuchs, wobei die Zahl und der Sprachinhalt zueinander in Beziehung gesetzt sind; und eine Erkennungseinrichtung (102) zum Erkennen von eingegebenen Zahlen durch Zuordnen zu den entsprechenden Erkennungswörterbüchern, wenn die Ferngesprächsnummer, die Ortsgesprächnummer und die Teil nehmernummer von dem Benutzer gemäß Anweisungen von der Anweisungseinrichtung (4, 5, 110, 111, 112) eingegeben werden, wobei das Spracherkennungssystem in dem Ortsgesprächnummer-Wörterbuch ein erstes Paar einer einstelligen Zahl und eines ersten Sprachinhalts eines Lesens der einstelligen Zahl und ein zweites Paar einer mehrstelligen Zahl und eines zweiten Sprachinhalts eines Lesens der mehrstelligen Zahl durch Einschließen eines Zahlenwerts speichert, die einstellige Zahl und der erste Sprachinhalt zueinander in Beziehung gesetzt sind, und die mehrstellige Zahl und der zweite Sprachinhalt zueinander in Beziehung gesetzt sind.
  3. Spracherkennungssystem nach Anspruch 2, wobei das Teilnehmernummer-Wörterbuch ein bestimmtes Paar einer einstelligen Zahl und eines bestimmten Sprachinhalts eines Lesens der einstelligen Zahl und ein bestimmtes Paar einer mehrstelligen Zahl und eines bestimmten Spracheinhalts eines Lesens der mehrstelligen Zahl durch Einschließen eines Zahlenwerts speichert, die einstellige und der bestimmte Sprachinhalt zueinander in Beziehung gesetzt sind, und die mehrstellige Zahl und der gegebene Sprachinhalt zueinander in Beziehung gesetzt sind.
  4. Spracherkennungssystem nach Anspruch 2 oder 3, wobei das Ferngesprächsnummer-Wörterbuch ein bestimmtes Paar einer einstelligen Zahl und eines bestimmten Sprachinhalts eines Lesens der einstelligen Zahl speichert, wobei die einstellige Zahl und der bestimmte Sprachinhalt zueinander in Beziehung gesetzt sind.
  5. Spracherkennungssystem nach einem der Ansprüche 2 bis 4, wobei die Anweisungseinrichtung aufweist: eine Nachrichtenspeichereinrichtung (112) zum Speichern von Nachrichten, die Eingaben der Ferngesprächsnummer, der Ortsgesprächnummer und der Teilnehmernummer entsprechen; eine Nachrichtenextrahierungseinrichtung (110, 111) zum Extrahieren der gespeicherten Nachrichten auf der Grundlage der Eingaben der Ferngesprächsnummer, der Ortsgesprächnummer und der Teilnehmernummer; und eine Nachrichtenmitteilungseinrichtung (4, 5) zum Mitteilen der extrahierten Nachricht.
  6. Spracherkennungssystem, das aufweist: eine Spracheingabeeinrichtung (2, 101) zum Eingeben von Sprache, die von einem Benutzer ausgesprochen wird; eine Speichereinrichtung (104) zum Speichern einer Mehrzahl eines ersten Paars einer einstelligen Zahl und eines ersten Sprachinhalts eines Lesens der einstelligen Zahl und einer Mehrzahl eines zweiten Paars einer mehrstelligen Zahl und eines zweiten Sprachinhalts eines Lesens der mehrstelligen Zahl, wobei die einstellige Zahl und der erste Sprachinhalt zueinander in Beziehung gesetzt sind und die mehrstellige Zahl und der zweite Sprachinhalt zueinander in Beziehung gesetzt sind; und eine Erkennungseinrichtung (102) zum Erkennen einer eingegebenen gegebenen Zahl durch Zuordnen zu den ersten und zweiten Sprachinhalten in der Speichereinrichtung (104), wenn die gegebene Zahl von dem Benutzer durch die Spracheingabeeinrichtung (2, 101) eingegeben wird.
  7. Spracherkennungssystem nach Anspruch 6, wobei die gegebene Zahl eine Telefonnummer beinhaltet.
  8. Spracherkennungssystem nach Anspruch 6 oder 7, wobei der zweite Sprachinhalt einen Sprachinhalt eines Lesens der mehrstelligen Zahl durch Einschließen eines Zahlenwerts beinhaltet.
  9. Spracherkennungssystem nach einem der Ansprüche 6 bis 8, wobei der zweite Sprachinhalt einen Sprachinhalt eines Lesens der mehrstelligen Zahl durch Einschließen eines Wiederholungsworts, das eine Wiederholung pro einstelliger Zahl durchführt, beinhaltet.
  10. Spracherkennungsverfahren, das die folgenden Schritte aufweist: Speichern (S31) einer Mehrzahl eines ersten Paars einer einstelligen Zahl und eines ersten Sprachinhalts eines Lesens der einstelligen Zahl und einer Mehrzahl eines zweiten Paars einer mehrstelligen Zahl und eines zweiten Sprachinhalts eines Lesens der mehrstelligen Zahl, wobei die einstellige Zahl und der erste Sprachinhalt zueinander in Beziehung gesetzt sind und die mehrstellige Zahl und der zweite Sprachinhalt zueinander in Beziehung gesetzt sind; Eingeben (S30) von Sprache, die von einem Benutzer ausgesprochen wird; und Erkennen (S31, S32, S33) einer eingegebenen gegebenen Zahl durch Zuordnen zu dem ersten Sprachinhalt und dem zweiten Sprachinhalt, wenn die gegebene Nummer von dem Benutzer eingegeben wird.
  11. Spracherkennungsverfahren, das die folgenden Schritt aufweist: Speichern (S301) von Erkennungswörterbüchern, die eine Zahl und einen Sprachinhalt eines Lesens der Zahl beinhalten, bezüglich von jedem eines Ferngesprächsnummer-Wörterbuchs, eines Ortsgesprächnummer-Wörterbuchs und eines Teilnehmernummer-Wörterbuchs, wobei die Zahl und der Sprachinhalt zueinander in Beziehung gesetzt sind, das Ortsgesprächnummer-Wörterbuch ein erstes Paar einer einstelligen Zahl und eines ersten Sprachinhalts eines Lesens der einstelligen Zahl und ein zweites Paar einer mehrstelligen Zahl und eines zweiten Sprachinhalts eines Lesens der mehrstelligen Zahl durch Einschließen eines Zahlenwerts speichert, wobei die einstellige Zahl und der erste Sprachinhalt zueinander in Beziehung gesetzt sind und die mehrstellige Zahl und der zweite Sprachinhalt zueinander in Beziehung gesetzt sind; Anweisen (S302, 306) eines Benutzers, eine Telefonnummer durch Teilen in eine Ferngesprächsnummer, eine Ortsgesprächsnummer und eine Teilnehmernummer einzugeben; Eingeben (S300) von Sprache, die von dem Benutzer ausgesprochen wird; und Erkennen (S303, S304) von eingegebenen Nummern durch Zuordnen zu den entsprechenden Erkennungswörterbüchern, wenn die Ferngesprächsnummer, die Ortsgesprächsnummer und die Teilnehmernummer von dem Benutzer gemäß Anweisungen eingegeben werden.
DE10327943.1A 2002-07-16 2003-06-20 Unterschiedliche Zahlenleseweisen zulassendes Spracherkennungssystem Expired - Fee Related DE10327943B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002206553A JP3726783B2 (ja) 2002-07-16 2002-07-16 音声認識装置
JP2002/206553 2002-07-16

Publications (2)

Publication Number Publication Date
DE10327943A1 true DE10327943A1 (de) 2004-02-05
DE10327943B4 DE10327943B4 (de) 2014-10-02

Family

ID=30112799

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10327943.1A Expired - Fee Related DE10327943B4 (de) 2002-07-16 2003-06-20 Unterschiedliche Zahlenleseweisen zulassendes Spracherkennungssystem

Country Status (3)

Country Link
US (1) US20040015354A1 (de)
JP (1) JP3726783B2 (de)
DE (1) DE10327943B4 (de)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4556586B2 (ja) * 2004-09-22 2010-10-06 トヨタ自動車株式会社 運転支援装置
US9639554B2 (en) * 2004-12-17 2017-05-02 Microsoft Technology Licensing, Llc Extensible file system
JP2007256643A (ja) * 2006-03-23 2007-10-04 Denso Corp 音声認識装置及びナビゲーションシステム
US7831431B2 (en) * 2006-10-31 2010-11-09 Honda Motor Co., Ltd. Voice recognition updates via remote broadcast signal
JP4672686B2 (ja) * 2007-02-16 2011-04-20 株式会社デンソー 音声認識装置及びナビゲーション装置
KR100883105B1 (ko) 2007-03-30 2009-02-11 삼성전자주식회사 휴대단말기에서 음성인식을 이용한 다이얼링 방법 및 장치
RU2705769C1 (ru) * 2015-10-28 2019-11-11 ФОРД ГЛОУБАЛ ТЕКНОЛОДЖИЗ, ЭлЭлСи Распознавание речи транспортным средством вместе с носимым устройством
US10580405B1 (en) * 2016-12-27 2020-03-03 Amazon Technologies, Inc. Voice control of remote device

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5157719A (en) * 1990-03-12 1992-10-20 Advanced Cellular Telcom Corp. Automatic area code dialing apparatus and methods particularly adapted for cellular or other types of telephone systems
DE4225475A1 (de) * 1992-08-01 1994-02-03 Philips Patentverwaltung Einrichtung zur Spracherkennung
US5566272A (en) * 1993-10-27 1996-10-15 Lucent Technologies Inc. Automatic speech recognition (ASR) processing using confidence measures
GB2325112B (en) * 1997-05-06 2002-07-31 Ibm Voice processing system
FI111673B (fi) * 1997-05-06 2003-08-29 Nokia Corp Menetelmä puhelinnumeron valitsemiseksi puhekomennoilla ja puhekomennoilla ohjattava telepäätelaite
US6119087A (en) * 1998-03-13 2000-09-12 Nuance Communications System architecture for and method of voice processing
DE19937490B4 (de) * 1999-08-07 2018-11-29 Volkswagen Ag Verfahren und Vorrichtung zur Eingabe von Steuerungsbefehlen für Komfortgeräte, insbesondere in Kraftfahrzeugen
JP4486235B2 (ja) * 2000-08-31 2010-06-23 パイオニア株式会社 音声認識装置
US20020042709A1 (en) * 2000-09-29 2002-04-11 Rainer Klisch Method and device for analyzing a spoken sequence of numbers

Also Published As

Publication number Publication date
JP3726783B2 (ja) 2005-12-14
US20040015354A1 (en) 2004-01-22
DE10327943B4 (de) 2014-10-02
JP2004053620A (ja) 2004-02-19

Similar Documents

Publication Publication Date Title
DE69837064T2 (de) Nachrichtenverarbeitungssystem und Verfahren für die Verarbeitung von Nachrichten
EP0905662B1 (de) Eingabesystem wenigstens für Orts- und/oder Strassennamen
DE60017000T2 (de) Verfahren zur zielorientierten Sprachübersetzung mittels Extraktion der Bedeutung und Dialog
EP1176395B1 (de) Verfahren zur Auswahl einer Ortsbezeichnung in einem Navigationssystem durch Spracheingabe
DE19709518C1 (de) Verfahren und Vorrichtung zur Spracheingabe einer Zieladresse in ein Zielführungssystem im Echtzeitbetrieb
DE69628904T2 (de) Navigationssystem für Fahrzeuge
DE69811921T2 (de) Vorrichtung und verfahren zur unterscheidung von ähnlich klingenden wörtern in der spracherkennung
DE60215272T2 (de) Verfahren und Vorrichtung zur sprachlichen Dateneingabe bei ungünstigen Bedingungen
DE3135483C2 (de) Verfahren und Schaltungsanordnung zur Erkennung einer alphanumerischen Eingangszeichenkette
EP0802522A2 (de) Anordnung und Verfahren zur Aktionsermittlung
EP1264302B1 (de) Verfahren zur spracheingabe eines zielortes mit hilfe eines definierten eingabedialogs in ein zielführungssystem
EP1071075B1 (de) Verfahren und Vorrichtung zur Eingabe von Daten
DE3115318A1 (de) "elektronisches uebersetzungsgeraet"
DE69719702T2 (de) Ein automatisches Auskunftssystem welches ein heuristisches Modell zur Vorhersage der am wahrscheinlichsten erfragten Nummer verwendet
US20020046029A1 (en) Facility retrieval apparatus and method
DE69621404T2 (de) System zum Vorlesen von Text
DE10327943A1 (de) Unterschiedliche Zahlenleseweisen zulassendes Spracherkennungssystem
DE10246029A1 (de) Spracherkennungssystem, Programm und Navigationssystem
DE102009010877A1 (de) Zeicheneingabeempfangsvorrichtung und Verfahren zum Empfangen von Zeicheneingaben
EP1321851B1 (de) Verfahren und System zum Nutzen von vom Nutzer frei zu wählenden Markierungsnamen als Einsprungposition in die Menustruktur eines Sprach-Dialogsystems
DE102017211447B4 (de) Verfahren zum Auswählen eines Listeneintrags aus einer Auswahlliste einer Bedienvorrichtung mittels Sprachbedienung sowie Bedienvorrichtung
DE102006051331A1 (de) Verfahren zur Auswahl eines Fahrziels
EP1395979B1 (de) Verfahren zur spracherkennung und spracherkennungssystem
DE102004059372A1 (de) Fahrzeugeinbaueinheit, Sprachkonversationsdokumenterzeugungs-Server und diese verwendendes Navigationssystem
DE4243181A1 (de)

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final
R084 Declaration of willingness to licence
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee