-
Die vorliegende Erfindung betrifft
ein Spracherkennungssystem, das eine auf mehrere unterschiedliche
Weisen ausgesprochene Zahl erkennt. Zum Beispiel können die
Zahlen, wie zum Beispiel "12" oder "1000" als jede einstellige
Zahl in einer fortlaufenden Reihenfolge, wie zum Beispiel "eins-zwei" oder "eins-null-null-null" gelesen werden oder
als eine mehrstellige Zahl, wie zum Beispiel "zwölf" oder "eintausend", gelesen werden.
-
Es gibt ein Spracherkennungssystem,
das eine Telefonnummer unter Verwendung von Sprache aufnimmt, die
von einem Benutzer ausgesprochen wird. In dem System ist es erforderlich,
daß der
Benutzer die Telefonnummer Ziffer (numerisches Zeichen) um Ziffer
in einer fortlaufenden Reihenfolge (ein fortlaufendes einstelliges
Lesen) liest (oder ausspricht). Wenn eine Telefonnummer eine Ferngesprächsnummer
von "0566", eine Ortsgesprächsnummer
von "12" und eine Teilnehmernummer
von "3000" aufweist, ist es
zum Beispiel erforderlich, daß die
Telefonnummer durch fortlaufendes einstelliges Lesen als "null", "fünf", "sechs", "sechs", "eins", "zwei", "drei", "null", "null" und "null" gelesen wird. Das
System erkennt dadurch die Telefonnummer, die von dem Benutzer ausgesprochen
wird, als eine Zahl, die fortlaufende Ziffern von "0566123000" aufweist.
-
Ein Benutzer liest manchmal die Telefonnummer
auf andere Weisen. Zum Beispiel können die Ortsgesprächsnummer
von "12" und die Teilnehmernummer
von "3000" als "zwölf' und "dreitausend", die Zahlenwerte
beinhalten, gelesen werden (Zahlenwerte enthaltendes Lesen oder
ausgesprochenes Lesen). Jedoch erkennt das Spracherkennungssystem
das Zahlenwerte enthaltene Lesen nicht.
-
Es ist eine Aufgabe der vorliegenden
Erfindung, ein Spracherkennungssystem zu schaffen, das ein derartiges
Lesen von Zahlen auf unter schiedliche Weisen zuläßt, daß ein Benutzer eine Leseweise auswählen kann,
die zuläßt, das
der Benutzer eine Zahl einfach liest.
-
Die Aufgabe wird mit den in Anspruch
1, 2, 6, 10 und 11 angegebenen Maßnahmen gelöst.
-
Weitere vorteilhafte Ausgestaltungen
der vorliegenden Erfindung sind Gegenstand der abhängigen Ansprüche.
-
Genauer gesagt ist, um die vorhergehende Aufgabe
zu lösen,
ein Spracherkennungssystem mit dem Folgenden versehen. Zum Zuordnen
einer eingegebenen Zahl, die von einem Benutzer ausgesprochen wird,
speichert das Spracherkennungssystem eine einstellige Zahl und einen
ersten Sprachinhalt eines Lesens der einstelligen Zahl und eine
mehrstellige Zahl und einen zweiten Sprachinhalt eines Lesens der
mehrstelligen Zahl. Hierbei werden die einstellige Zahl und der
erste Sprachinhalt miteinander korreliert und werden die mehrstellige
Zahl und der zweite Sprachinhalt miteinander korreliert. Wenn eine
gegebene Zahl von dem Benutzer eingegeben wird, wird die eingegebene
gegebene Zahl durch Zuordnen der ersten und zweiten Sprachinhalte
erkannt. Diese Struktur läßt zu, daß ein Benutzer
eine Leseweise auswählt,
auf welche der Benutzer einfach eine Zahl lesen kann.
-
Gemäß einem anderen Aspekt der
vorliegenden Erfindung ist ein Spracherkennungssystem mit dem Folgenden
Versehen. Zum Zuordnen einer eingegebenen Telefonnummer, die von
einem Benutzer ausgesprochen wird, weist das Spracherkennungssystem
den Benutzer an, eine Telefonnummer durch Teilen in eine Ferngesprächsnummer,
eine Ortsgesprächsnummer
und eine Teilnehmernummer zu teilen. Das System speichert Erkennungswörterbücher, welches
eine Zahl und einen Sprachinhalt eines Lesens der Zahl beinhaltet,
bezüglich
von jedem eines Ferngesprächsnummerwörterbuchs,
eines Ortsgesprächsnummernwörterbuchs
und eines Teilnehmernummerwörterbuchs.
-
Das Ortsgesprächsnummernwörterbuch speichert ein erstes
Paar einer einstelligen Zahl und eines ersten Sprachinhalts eines
Lesens der einstelligen Zahl und ein zweites Paar einer mehrstelligen Zahl
und eines zweiten Sprachinhalts eines Lesens der mehrstelligen Zahl
durch Einschließen
eines Zahlenwerts. Wenn die Ferngesprächsnummer, die Ortsgesprächsnummer
und die Teilnehmernummer gemäß Anweisungen
von dem Benutzer eingegeben werden, werden die eingegebenen Zahlen
durch Zuordnen zu entsprechenden Erkennungswörterbüchern erkannt. Diese Struktur
läßt zu, daß Erkennungswörterbücher zum
Zuordnen einer Spracheingabe gemäß einem
Eingabeinhalt oder einer Eingabereihenfolge einer Telefonnummer
umgeschaltet werden. Die zugeordneten Spracheingaben sind dadurch
beschränkt,
so daß verhindert
wird, daß sich eine
Erkennungsrate einer Telefonnummer verringert.
-
Die vorliegende Erfindung wird nachstehend anhand
von Ausführungsbeispielen
unter Bezugnahme auf die beiliegende Zeichnung näher erläutert.
-
Es zeigt:
-
1 ein
schematisches Blockschaltbild einer Struktur eines Fahrzeugnavigationssystems
gemäß ersten
und zweiten Ausführungsbeispielen
der vorliegende Erfindung;
-
2 ein
Blockschaltbild einer Struktur einer Spracherkennungseinheit gemäß den Ausführungsbeispielen
der vorliegenden Erfindung;
-
3 ein
Blockschaltbild einer Struktur einer Streckenleiteinheit gemäß den Ausführungsbeispielen
der vorliegenden Erfindung;
-
4 eine
Tabelle eines in einer Erkennungswörterbuch-Speichereinheit gespeicherten
Erkennungswörterbuchs
gemäß dem ersten
Ausführungsbeispiel
der vorliegenden Erfindung;
-
5 ein
Flußdiagramm
einer Gesamtverarbeitung des Fahrzeugnavigationssystems gemäß den Ausführungsbeispielen
der vorliegenden Erfindung;
-
6 ein
Flußdiagramm
einer Verarbeitung einer Spracherkennung für eine Telefonnummer gemäß dem ersten
Ausführungsbeispiel
der vorliegenden Erfindung;
-
7 eine
Tabelle von in einer Nachrichtenspeichereinheit gespeicherten Nachrichten
gemäß dem ersten
Ausführungsbeispiel
der vorliegenden Erfindung;
-
8 eine
Tabelle eines Ferngesprächsnummer-Wörterbuchs
gemäß dem zweiten
Ausführungsbeispiel
der vorliegenden Erfindung;
-
9 eine
Tabelle eines Ortsgesprächsnummer-Wörterbuchs
gemäß dem zweiten
Ausführungsbeispiel
der vorliegenden Erfindung;
-
10 eine
Tabelle eines Teilnehmernummer-Wörterbuchs
gemäß dem zweiten
Ausführungsbeispiel
der vorliegenden Erfindung;
-
11 eine
Tabelle von in einer Nachrichtenspeichereinheit gespeicherten Nachrichten
gemäß dem zweiten
Ausführungsbeispiel
der vorliegenden Erfindung; und
-
12 ein
Flußdiagramm
einer Verarbeitung einer Spracherkennung für eine Telefonnummer gemäß dem zweiten
Ausführungsbeispiel
der vorliegenden Erfindung.
-
Nachstehend erfolgt die Beschreibung
eines ersten Ausführungsbeispiels
der vorliegenden Erfindung.
-
Eine Fahrzeugnavigationsvorrichtung,
die in einem Fahrzeug vorgesehen ist, wird als ein Ausführungsbeispiel
erläutert,
auf das sich ein Spracherkennungssystem der vorliegenden Erfindung
bezieht.
-
Wie es in 1 gezeigt ist, weist die Fahrzeugnavigationsvorrichtung 1 eine
Spracherkennungs-(REC)-Einheit 10, eine Streckenleiteinheit 11, eine
Fahrzeugpositions- und Richtungsberechnungseinheit 12 und
eine Straßenkarten-Zeicheneinheit (nicht
gezeigt) auf. Die Fahrzeugnavigationsvorrich tung 1 ist
mit einem Mikrofon 2 zum Eingeben von Sprache, einem Sprachschalter 3,
einer Anzeigeeinheit 4, einem Lautsprecher 5,
einem GPS-Empfänger 6,
einem Fahrzeuggeschwindigkeitssensor 7, einem Gierwertsensor 8,
einer Kartendatenbank 9 und dergleichen verbunden.
-
Das Mikrofon 2 und der Sprachschalter 3 werden
zur Spracheingabe verwendet. Wenn ein Druckknopf des Sprachschalters 3 niedergedrückt wird,
wird ein Eingabe-Auslösesignal
zu der Spracherkennungseinheit 10 gesendet. Wenn die Spracherkennungseinheit 10 das
Eingabe-Auslösesignal empfängt, schaltet
sie zu einer Spracheingabebetriebsart eines Zulassens der Spracheingabe
durch das Mikrofon 2 um.
-
In der Spracheingabebetriebsart wird,
wenn ein Benutzer Sprache ausspricht, die Sprache durch das Mikrofon 2 zu
einem Sprachsignal gewandelt, um zu der Spracherkennungseinheit 10 gesendet
zu werden. Die Spracherkennungseinheit 10 erkennt das Sprachsignal
zum Wandeln in eine Zahl oder eine Anweisung, die der Sprache entspricht.
Zum Beispiel wird eine Sprache von "eins-zwei" zu einer Zahl von "12" gewandelt.
Die Zahl wird zu der Streckenleiteinheit 11 gesendet. Wenn
die Streckenleiteinheit 11 eine Telefonnummer erfaßt, die
eine Ferngesprächsnummer,
eine Ortsgesprächsnummer
und eine Teilnehmernummer aufweist, sucht sie dann nach einer Position,
die der Telefonnummer entspricht, um sie auf der Anzeigeeinheit 4 anzuzeigen.
-
Die Anzeigeeinheit 4 ist
aus einer Flüssigkristallanzeige
ausgebildet, die eine Straßenkarte oder
dergleichen zeigt. Eine Berührungsanzeige bzw.
ein Touch-Panel kann als die Anzeigeeinheit 4 verwendet
werden.
-
Der Lautsprecher 5 wird
zum Ausgeben einer Sprachhilfe oder von verschiedenen Alarmen verwendet.
Zum Beispiel kann er ein Lautsprecher, der vorhergehend in das Fahrzeug
eingebaut worden ist, oder ein Lautsprecher sein, der in die Fahrzeugnavigationsvorrichtung 1 eingebaut
ist.
-
Der GPS-Empfänger 6, der Fahrzeuggeschwindigkeitssensor 7 und
der Gierwertsensor 8 erzeugen erforderliche Signale (Sensorsignale),
die zum Berechnen einer derzeitigen Position oder einer Fahrtrichtung
des Fahr zeugs verwendet werden. Die erzeugten Sensorsignale werden
zu der Fahrzeugpositions- und Richtungsberechnungseinheit 12 gesendet.
-
Die Kartendatenbank 9 ist
in einem Speicher (nicht gezeigt) gespeichert und beinhaltet eine
Karteninformation und eine Straßeninformation.
Obgleich eine CD-ROM oder eine DVD-ROM im allgemeinen abhängig von
einer Datenmenge als der Speicher verwendet wird, können eine
Speicherkarte oder ein Festplattenlaufwerk ebenso verwendet werden.
Die Karteninformation wird zum Beispiel zum Zeichnen einer Landkarte,
die in der Anzeigeeinheit 4 gezeigt ist, verwendet und
besteht aus Daten, die zu Gebäudenamen,
Adressen, Telefonnummern, Koordinaten auf einer Karte und dergleichen
zueinander in Beziehung gesetzt sind.
-
Es wird auf 2 verwiesen. Die Spracherkennungseinheit 10 der
Fahrzeugnavigationsvorrichtung wird nachstehend erläutert. Die
Spracherkennungseinheit 10 beinhaltet eine A/D-Wandlerschaltung
101, eine Erkennungsprogramm-Verarbeitungseinheit 102,
eine Tonmodell-Speichereinheit 103, eine Erkennungswörterbuch-Speichereinheit 104 und
dergleichen.
-
Die A/D-Wandlerschaltung 101 wandelt
ein analoges Sprachsignal, das von dem Mikrofon 2 empfangen
wird, zu einem digitalen Signal. Das gewandelte digitale Sprachsignal
wird zu der Erkennungsprogramm-Verarbeitungseinheit 102 gesendet.
-
Die Erkennungsprogramm-Verarbeitungseinheit 102 wandelt
unter Verwendung der Tonmodell-Speichereinheit 103 und
der Erkennungswörterbuch-Speichereinheit 104 das
digitale Sprachsignal zu einer Zahl oder einer Anweisung. Die Erkennungsprogramm-Verarbeitungseinheit 102 analysiert
einen Sprachinhalt, der dem digitalen Sprachsignal entspricht, unter
Verwendung von zum Beispiel einem bekannten Hidden-Marukov-Modell,
das in der Tonmodell-Speichereinheit 103 gespeichert ist.
-
Dieser analysierte Sprachinhalt wird
dann Sprachinhalten zugeordnet, die in der Erkennungswörterbuch-Speichereinheit 104 gespeichert
sind, so daß das
wahrscheinlichste Erkennungswort und seine entsprechende Zahl extrahiert
werden.
-
Die Erkennungswörterbuch-Speichereinheit 104 wird
erläutert.
Die Erkennungswörterbuch-Speichereinheit 104 beinhaltet
ein Erkennungswörterbuch,
das eine Struktur aufweist, die in 4 gezeigt ist.
Ein Erkennungswort entspricht einer einstelligen Zahl (einem numerischen
Zeichen) wie zum Beispiel "1" oder einer mehrstelligen
Zahl, wie zum Beispiel "12". Die einstellige
Zahl und die mehrstellige Zahl werden zu einem fortlaufenden einstelligen
Lesen bzw. einem Zahlenwerte beinhaltenden Lesen in Beziehung gesetzt.
Zum Beispiel wird eine einstellige Zahl von "eins" mit "1" des fortlaufenden einstelligen Lesen
in Beziehung gesetzt und werden eine zweistellige Zahl von "12" und eine vierstellige
Zahl von "1000" mit "zwölf" und "tausend" des Zahlenwerte
beinhaltenden Lesens in Beziehung gesetzt.
-
Daher werden in der Erkennungswörterbuch-Speichereinheit 104 die
einstelligen Zahlen (0 bis 9) mit dem fortlaufenden
einstelligen Lesen in Beziehung gesetzt, während die mehrstelligen Zahlen (zum
Beispiel "12" oder "1000") mit den Zahlenwerte beinhaltenden
Lesen in Beziehung gesetzt werden. Signale, die den Zahlen oder
Anweisungen entsprechen, die von der Erkennungsprogramm-Verarbeitungseinheit 102 extrahiert
werden, werden dann zu der Streckenleiteinheit 11 gesendet.
-
Die Streckenleiteinheit 11 der
Fahrzeugnavigationsvorrichtung 1 wird nachstehend unter
Bezugnahme auf 3 erläutert. Die
Streckenleiteinheit 11 beinhaltet eine Funktionsausführungseinheit 10,
eine Nachrichtenausgabeeinheit 111 und eine Nachrichtenspeichereinheit 112.
-
Die Funktionsausführungseinheit 110 führt eine
Funktion eines Anzeigens einer Straßenkarte, die eine derzeitige
Position des Fahrzeugs umgibt, eine Funktion eines Suchens nach
einer Stelle durch eine Telefonnummerneingabe oder dergleichen aus. Zum
Beispiel werden bei der Funktion eines Anzeigens der Straßenkarte,
die die derzeitige Position des Fahrzeugs umgibt, wenn eine entsprechende Anweisung
empfangen wird, Signale, die sich auf die derzeitige Position und
Fahrtrichtung des Fahrzeugs beziehen, aus der Fahrzeugpositions-
und -richtungsberechnungseinheit 12 erzielt. Weiterhin
werden Kartendaten, die das Fahrzeug umgeben, aus der Kartendatenbank 9 ausgelesen.
Die Signale und die Kartendaten werden dann zu Bildsignalen gewandelt
und auf der Anzeigeeinheit 4 angezeigt. Die Funktionausführungseinheit 10 sendet
dann einen Anweisungscode, der der ausgeführten Funktion entspricht,
zu der Nachrichtenausgabeeinheit 111.
-
Bei der Funktion eines Suchens der
Stelle durch die Telefonnummerneingabe wird ein Gebäude, das
der Telefonnummer entspricht, und seine Umgebungskarte wie folgt
mitgeteilt: die Funktionsausführungseinheit 110 empfängt eine
Telefonnummer, die Ferngesprächs-,
Ortsgesprächs-
und Teilnehmernummern aufweist, von der Spracherkennungseinheit 10;
sie erzielt einen Gebäudenamen, eine
Adresse und Koordinaten, die der eingegebenen Telefonnummer entsprechen,
von der Kartendatenbank 9; sie erzielt weiterhin eine Karten-
und eine Straßeninformation,
die die erzielten Koordinaten umgeben; die erzielte Information
wird zu Bildsignalen gewandelt, die zu der Anzeigeeinheit 4 zu
senden sind; und die Stelle, die der Telefonnummer entspricht, und
seine Umgebungsstraßenkarte
werden auf der Anzeigeeinheit 4 angezeigt.
-
Die Nachrichtenausgabeeinheit 111 empfängt den
Anweisungscode, um eine entsprechende Nachricht zu extrahieren,
aus der Nachrichtenspeichereinheit 112. Die Nachricht wird
auf der Anzeigeeinheit 4 angezeigt oder zu dem Lautsprecher 5 ausgegeben.
Wie es in 7 gezeigt
ist, werden Nachrichten, die in der Nachrichtenspeichereinheit 112 gespeichert
sind, zu Anweisungscodes in Beziehung gesetzt. Zum Beispiel teilt
die Nachrichtenausgabeeinheit 111 bei der Funktion eines
Anzeigens der Straßenkarte,
die die derzeitige Position des Fahrzeugs umgibt, wenn ein Anweisungscode
von "00001" empfangen wird, "DERZEITIGE POSITION IST
ANZUZEIGEN" mit,
was dem Anweisungscode von "00001" entspricht.
-
Eine Verarbeitung der Fahrzeugnavigationsvorrichtung
wird unter Berücksichtigung
der Funktion eines Suchens der Stelle, die einer eingegebenen Telefonnummer
entspricht, unter Bezugnahme auf die 5 und 6 erläutert. Als ein Beispiel wird
ein Fall, in dem eine Telefonnummer von "00220-12-1000" eingegeben wird, nachstehend erläutert.
-
In einem Schritt 1 fährt, wie
es in 5 gezeigt ist,
ein Wartezustand fort, bis der Sprachschalter 3 von einem
Benutzer niedergedrückt
wird, und die Verarbeitung schreitet zu einem Schritt 2, wenn der
Sprachschalter 3 niedergedrückt wird. In dem Schritt 2
schaltet die Spracherkennungseinheit 10 zu einer Eingabebetriebsart
um, in der eine Spracheingabe zugelassen wird.
-
Eine Spracherkennungsverarbeitung
in einem Schritt 3 wird unter Bezugnahme auf 6 erläutert.
In einem Schritt 30 wird es bestimmt, ob "SUCHE NACH TELEFONNUMMER" zum Suchen einer Stelle
eines Objekts eingegeben wird. Wenn es bestimmt wird, daß "SUCHE NACH TELEFONNUMMER" eingegeben wird,
schreitet die Verarbeitung zu einem Schritt 31 fort. Ansonsten bleibt
die Verarbeitung in dem Wartezustand.
-
In dem Schritt 31 wird die
eingegebene Sprache zum Bestimmen des Sprachinhalts analysiert. Hierbei
wird es angenommen, daß die
ausgesprochene Sprache als Sprachinhalte von "null", "zwei", "zwei", "null", "zwölf" und "eintausend" analysiert wird.
-
In einem Schritt 32 werden die wahrscheinlichsten
Erkennungswörter
für die
Sprachinhalte durch Zuordnen in dem Erkennungswörterbuch der Erkennungswörterbuch-Speichereinheit 104 extrahiert.
-
In einem Schritt 33 wird
eine Zahl entsprechend den extrahierten Erkennungswörtern extrahiert.
Hierbei wird eine Mehrzahl von Zahlen von "0", " 2", " 2", "0", "12" und "1000" extrahiert.
-
In einem Schritt 34 werden
Signale, die den extrahierten Zahlen entsprechen, zu der Funktionsausführungseinheit 110 der
Streckenleiteinheit 11 gesendet. Hierbei werden die extrahierten
Zahlen auf eine kombinierte Weise, das heißt zu fortlaufenden zehn Ziffern
von "0220121000", gewandelt.
-
In einem Schritt 4 in 5 werden Daten, die einer
Telefonnummer der zehnstelligen Nummer entsprechen, die von der
Spracherkennungseinheit 10 gesendet wird, aus der Kartendatenbank 9 extrahiert. Die
Daten beinhalten einen Gebäudenamen,
eine Adresse und Koordinaten. Eine Informa tion über eine Karte oder Straße, die
die extrahierten Koordinaten umgeben, wird weiterhin extrahiert.
-
In einem Schritt 5 werden
die extrahierten Daten und die Information zu Bildsignalen gewandelt, die
zu der Anzeigeeinheit 4 zu senden sind. Die Stelle, die
der eingegebenen Telefonnummer entspricht, und ihre Umgebungsstraßenkarte
werden dadurch angezeigt.
-
Wie es vorhergehend erläutert worden
ist, ordnet das Spracherkennungssystem der vorliegenden Erfindung
bei einem Erkennen einer Telefonnummer einen eingegebenen Sprachinhalt
unter Verwendung des Erkennungswörterbuchs
zu, das Sprachinhalte beinhaltet, die dem fortlaufenden einstelligen
Lesen und ebenso dem Zahlenwerte beinhaltenden Lesen entsprechen.
Dadurch wird auch dann, wenn ein Benutzer das fortlaufende einstellige
Lesen von "eins-zwei" oder das Zahlenwerte
beinhaltende Lesen von "zwölf' auswählt, eine
Zahl von "12" erkannt.
-
Weiterhin beinhaltet das Erkennungswörterbuch
Wiederholungswörter
und Ersatzwörter.
Wie es in 4 gezeigt
ist, sind die Erkennungswörter
zum Beispiel "zweimal" oder "dreimal", während die
Ersatzwörter
zum Beispiel "o" sind, das "0" anzeigt. Auch dann, wenn ein Benutzer "1000" als "eins-null-null-null", "eins-o-o-o", "eins-dreimal null" oder "eins-dreimal o" liest, das wohlklingend
ist, wird eine Zahl von "1000" richtig erkannt.
Deshalb kann der Benutzer eine Leseweise auswählen, die zuläßt, daß der Benutzer
die Telefonnummer einfach liest.
-
Weiterhin kann die vorliegende Erfindung nicht
nur auf eine Funktion eines Suchens nach einer Stelle in einer Fahrzeugnavigationsvorrichtung
gerichtet sein, sondern ebenso auf andere Fälle. Die Fälle sind derart, wie zum Beispiel
eine Funktion eines Eingehens eines Bestimmungsorts durch eine Telefonnummer
oder eine Funktion eines Anrufens eines Festnetztelefons unter Verwendung
einer Spracheingabe einer Telefonnummer in einer Telefonzelle.
-
Nachstehend erfolgt die Beschreibung
eines zweiten Ausführungsbeispiels
der vorliegenden Erfindung.
-
Das zweite Ausführungsbeispiel der vorliegenden
Erfindung ist in vielen Aspekten zu dem ersten Ausführungsbeispiel
der vorliegenden Erfindung ähnlich.
Unterschiedliche Merkmale sind wie folgt: eine Erkennungswörterbuch-Speichereinheit 104 beinhaltet
drei Wörterbücher einer
Ferngesprächstelefonnummer,
einer Ortsgesprächstelefonnummer
und einer Teilnehmertelefonnummer; Nachrichten, die in einer Nachrichtenspeichereinheit 112 gespeichert sind,
beinhalten Nachrichten, die einer Eingabeweise einer Telefonnummer
entsprechen; und die Eingabeweisen werden einem Benutzer zum Führen einer Spracheingabe
mitgeteilt, wenn der Benutzer die Ferngesprächstelefonnummer, die Ortsgesprächstelefonnummer
oder die Teilnehmertelefonnummer eingibt.
-
Die Erkennungswörterbuch-Speichereinheit 104 des
zweiten Ausführungsbeispiels
der vorliegenden Erfindung beinhaltet die drei Erkennungswörterbücher, die
in den 8 bis 10 gezeigt sind. Ein Ferngesprächsnummer-Wörterbuch,
das in 8 gezeigt ist,
wird zum Erkennen der Ferngesprächstelefonnummer
verwendet. Es speichert Erkennungswörter und einstellige Zahlen,
von denen beide zueinander in Beziehung gesetzt sind. Das heißt, die
Erkennungswörter
entsprechen den einstelligen Zahlen, so daß die Erkennungswörter für ein fortlaufendes
einstelliges Lesen verwendet werden.
-
Ein Ortsgesprächnummer-Wörterbuch, das in 9 gezeigt ist, wird zum
Erkennen der Ortsgesprächtelefonnummer
verwendet. Es speichert Erkennungswörter und einstellige oder mehrstellige Zahlen.
Die Erkennungswörter,
die den mehrstelligen Zahlen entsprechen, werden für ein Zahlenwerte
beinhaltendes Lesen verwendet, während
die Erkennungswörter,
die den einstelligen Zahlen entsprechen, für das fortlaufende einstellige
Lesen verwendet werden. Zum Beispiel ist eine zweistellige Zahl von "12" gespeichert, die
zu einem Erkennungswort von "zwölf' in Verbindung gesetzt
ist.
-
Ein Teilnehmernummer-Wörterbuch,
das in 10 gezeigt ist,
wird zum Erkennen der Teilnehmertelefonnummer verwendet. Es speichert
Erkennungswörter
und einstellige und vierstellige Zahlen. Die Erkennungswörter, die
den vierstelligen Zahlen entsprechen, werden für das Zahlen werte beinhaltende
Lesen verwendet, während
die Erkennungswörter,
die den einstelligen Zahlen entsprechen, für das fortlaufende einstellige
Lesen verwendet werden. Zum Beispiel ist eine vierstellige Zahl
von "1000" gespeichert, die
zu einem Erkennungswort von "eintausend" in Beziehung gesetzt
ist.
-
Nachrichten, die in der Nachrichtenspeichereinheit 112 des
zweiten Ausführungsbeispiels
der vorliegenden Erfindung gespeichert sind, sind in 11 gezeigt. Nachrichten,
die Anweisungscodes von "C1001 ", "C1002" und C1003" aufweisen, entsprechen
einer Funktion eines Suchens einer Stelle durch eine Telefonnummerneingabe.
Die Nachrichtenausgabeeinheit 111 empfängt einen Anweisungscode, der
zu einer Eingabereihenfolge der Telefonnummer in Beziehung gesetzt
ist, von der Funktionsausführungseinheit 110.
Sie extrahiert dann eine Nachricht, die dem empfangenen Anweisungscode entspricht,
aus der Nachrichtenspeichereinheit 112, um sie zum Leiten
einer Spracheingabe zu dem Benutzer zu der Anzeigeeinheit 4 oder
dem Lautsprecher 5 auszugeben.
-
Eine Verarbeitung einer Spracherkennung für eine Telefonnummer
des zweiten Ausführungsbeispiels
der vorliegenden Erfindung, die ein Führen der Spracheingabe der
Telefonnummer beinhaltet, wird nachstehend unter Bezugnahme auf 12 erläutert. Diese Verarbeitung wird
innerhalb der Verarbeitung ausgeführt, die in dem ersten Ausführungsbeispiel
der vorliegenden Erfindung in 5 erläutert ist.
Hier im weiteren Verlauf wird es angenommen, daß eine Telefonnummer von "0220-12-1000" über Sprache durch einen Benutzer
eingegeben wird.
-
In einem Schritt 300 wird
es bestimmt, ob "SUCHE
NACH TELEFONNUMMER" zum
Suchen einer Stelle eines Objekts eingegeben wird. Wenn es bestimmt
wird, daß "SUCHE NACH TELEFONNUMMER" eingegeben wird,
schreitet eine Verarbeitung zu einem Schritt 301 fort.
Ansonsten bleibt die Verarbeitung in einem Wartezustand.
-
In dem Schritt 301 wird
für die
nachfolgende Verarbeitung in Schritten 303 und 304 ein
Ferngesprächsnummer-Wörterbuch
als ein Erkennungswörterbuch
der Erkennungswörterbuch-Speichereinheit 104 festgelegt,
das zum Extrahieren eines Erkennungsworts zu verwenden ist. In den
Schritten 303 und 304 wird ein Erkennungswort
durch Zuordnen extrahiert und wird eine Zahl, die dem Erkennungswort
entspricht, aus dem Ferngesprächsnummer-Wörterbuch
extrahiert.
-
In einem Schritt 302 wird
ein Signal, das mitteilt, daß ein
Ferngesprächsnummer-Wörterbuch
als das Erkennungswörterbuch
festgelegt ist, zu der Funktionsausführungseinheit 110 gesendet.
Die Funktionsausführungseinheit 110 sendet
dann einen Anweisungscode von "C1001 ", der einer Ferngesprächstelefonnummer
entspricht, zu der Nachrichtenausgabeeinheit 111. Die Nachrichtenausgabeeinheit 111 extrahiert
dann eine Nachricht, die dem Anweisungscode von "C1001" entspricht, aus der Nachrichtenspeichereinheit 112,
um sie zu der Anzeigeeinheit 4 oder dem Lautsprecher 5 auszugeben.
Eine Nachricht von "Bitte
geben sie eine Ferngesprächstelefonnummer
ein", wird dadurch
dem Benutzer mitgeteilt.
-
In einem Schritt 303 spricht
der Benutzer, um die Ferngesprächstelefonnummer
gemäß der Nachricht
einzugeben, die in dem Schritt 302 mitgeteilt wird. Sprachinhalte
werden dann aus der ausgesprochenen Sprache analysiert. Als ein
Ergebnis einer Analyse werden "null", "zwei", "zwei" und "null" als die Sprachinhalte
erkannt.
-
In einem Schritt 304 wird das wahrscheinlichste
Erkennungswort für
die analysierten Sprachinhalte durch das Zuordnen in dem Ferngesprächstelefonnummer-Wörterbuch
der Erkennungswörterbuch-Speichereinheit 104 extrahiert.
Zahlen, die den extrahierten Erkennungswörtern entsprechen, werden dann
extrahiert. Hierbei werden "0", "2", "2" und "0" für
fortlaufende Zahlen von "null", "zwei", "zwei" und "null" extrahiert.
-
In einem Schritt 305 werden Signale,
die den fortlaufenden Zahlen entsprechen, zu der Streckenleiteinheit 11 gesendet.
Hierbei werden die extrahierten fortlaufenden Zahlen, die zu senden
sind, als eine Form einer vierstelligen Zahl von "0220" kombiniert. Die
Streckenleiteinheit 11 zeigt demgemäß die empfangene vierstellige
Zahl auf der Anzeigeeinheit 4 an.
-
In einem Schritt 306 wird es bestimmt,
ob eine Teilnehmertelefonnummer extrahiert wird. Wenn es bestimmt
wird, daß die
Teilnehmertelefonnummer extrahiert wird, ist die Verarbeitung der
Spracherkennung beendet. Ansonsten kehrt die Verarbeitung zu dem
Schritt 301 zurück.
In der vorhergehenden Erläuterung
wird lediglich die Ferngesprächstelefonnummer
extrahiert, so daß die
Verarbeitung zu dem Schritt 301 zurückkehrt.
-
Erneut wird in dem Schritt 301 auf
der Grundlage der Reihenfolge der Telefonnummerneingabe ein Ortsgesprächnummern-Wörterbuch
als ein nächstes
Erkennungswörterbuch
festgelegt, das zum Extrahieren eines Erkennungsworts zu verwenden ist.
-
In einem Schritt 302 sendet
die Funktionsausführungseinheit 110 ähnlich der
vorhergehenden Erläuterung
einen Anweisungscode von "C1002", der einer Ortsgesprächtelefonnummer
entspricht, zu einer Nachrichtenausgabeeinheit 111. Die
Nachrichtenausgabeeinheit 111 extrahiert dann eine Nachricht,
die dem Anweisungscode von "C1002" entspricht, von
der Nachrichtenspeichereinheit 112, um sie zu der Anzeigeeinheit 4 oder
dem Lautsprecher 5 auszugeben. Eine Nachricht von "Bitte geben sie eine
Ortsgesprächstelefonnummer
ein" wird dadurch dem
Benutzer mitgeteilt.
-
In einem Schritt 303 spricht
der Benutzer, um die Ortsgesprächstelefonnummer
gemäß der Nachricht
einzugeben, die in dem Schritt 302 mitgeteilt wird. Sprachinhalte
werden dann aus der ausgesprochenen Sprache analysiert. Als ein
Ergebnis eines Analysierens wird "zwölf" als die Sprachinhalte
erkannt.
-
In einem Schritt 304 wird
das wahrscheinlichste Erkennungswort für die analysierten Sprachinhalte
durch das Zuordnen in dem Ortsgesprächstelefonnummern-Wörterbuch
der Erkennungswörterbuch-Speichereinheit 104 extrahiert.
Eine Anzahl, die dem extrahierten Erkennungswort entspricht, wird dann
extrahiert. Hierbei wird "12" für eine Zahlenwerte
beinhaltende Zahl von "zwölf' extrahiert.
-
In einem Schritt 305 werden
Signale, die der Zahlenwerte beinhaltenden Zahl entsprechen, zu
der Streckenleiteinheit 11 gesendet. Die Strec kenleiteinheit 11 zeigt
demgemäß die empfangene
zweistellige Zahl auf der Anzeigeeinheit 4 an.
-
In einem Schritt 306 wird
es erneut bestimmt, ob die Teilnehmertelefonnummer extrahiert wird.
In der vorhergehenden Erläuterung
kehrt die Verarbeitung zu dem Schritt 301 zurück, da die
Teilnehmertelefonnummer noch nicht extrahiert wird.
-
Erneut wird in dem Schritt 301 auf
der Grundlage der Reihenfolge der Telefonnummerneingabe ein Teilnehmernummern-Wörterbuch
als ein letztes Erkennungswörterbuch
festgelegt, das zum Extrahieren eines Erkennungswort zu verwenden
ist.
-
In einem Schritt 302 sendet ähnlich der
vorhergehenden Erläuterung
die Funktionsausführungseinheit 110 einen
Anweisungscode von "C1003", der einer Teilnehmertelefonnummer
entspricht, zu der Nachrichtenausgabeeinheit 111. Die Nachrichtenausgabeeinheit 111 extrahiert
dann eine Nachricht, die dem Anweisungscode von "C1003" entspricht, aus der Nachrichtenspeichereinheit 112,
um sie zu der Anzeigeeinheit 4 oder dem Lautsprecher 5 auszugeben.
Eine Nachricht von "Bitte
geben sie die letzten vier Ziffern ein" wird dadurch dem Benutzer mitgeteilt.
-
In dem Schritt 303 spricht
der Benutzer, um die Teilnehmertelefonnummer gemäß der Nachricht einzugeben,
die in dem Schritt 302 mitgeteilt wird. Sprachinhalte werden
dann aus der ausgesprochenen Sprache analysiert. Als ein Ergebnis
der Analyse wird "eintausend" als die Sprachinhalte
erkannt.
-
In dem Schritt 304 wird
das wahrscheinlichste Erkennungswort für die analysierten Sprachinhalte durch
das Zuordnen in dem Teilnehmernummern-Wörterbuch der Erkennungswörterbuch-Speichereinheit 104 extrahiert.
Eine Zahl, die dem extrahierten Erkennungswort entspricht, wird
dann extrahiert. Hierbei wird "1000" für eine Zahlenwerte
beinhaltende Zahl von "eintausend" extrahiert.
-
In dem Schritt 305 werden
Signale, die der Zahlenwerte beinhaltenden Zahl entsprechen, zu
der Streckenleiteinheit 11 gesendet. Die Streckenleiteinheit 11 zeigt
demgemäß die empfangene
vierstellige Zahl auf der Anzeigeeinheit 4 an.
-
In dem Schritt 306 wird
es erneut bestimmt, ob die Teilnehmertelefonnummer extrahiert wird. Hierbei
wird es bestimmt, daß die
Teilnehmertelefonnummer extrahiert wird, so daß die Verarbeitung der Spracherkennung
beendet ist, um dadurch zu der Verarbeitung zurückzukehren, die in 5 gezeigt ist.
-
Wie es vorhergehend erläutert worden
ist, schaltet das Spracherkennungssystem dieses Ausführungsbeispiels
der vorliegenden Erfindung Erkennungswörterbücher zum Zuordnen einer Spracheingabe
gemäß einem
Eingabeinhalt oder einer Eingabereihenfolge einer Telefonnummer
durch einen Benutzer um. Die zugeordneten Sprachinhalte werden dann
beschränkt,
so daß es
verhindert wird, daß sich eine
Wiederholungsrate einer Telefonnummer verringert.
-
Weiterhin können bezüglich einer Ortsgesprächstelefonnummer
und einer Teilnehmertelefonnummer ein fortlaufendes einstelliges
Lesen und ein Zahlenwerte beinhaltendes Lesen gleichzeitig zugelassen
werden, so daß ein
Benutzer eine Leseweise auswählt,
in welcher der Benutzer die Telefonnummer einfach liest.
-
Da "0" im
allgemeinen eine erste Ziffer einer Ferngesprächstelefonnummer ist, kann
ein Benutzer kaum die Ferngesprächstelefonnummer
durch das Zahlenwerte beinhaltende Lesen lesen. Ein Ferngesprächsnummern-Wörterbuch
kann dadurch lediglich ein Paar einer einstelligen Zahl und eines
Erkennungsworts speichern, das durch das fortlaufende einstellige
Lesen mit den Sprachinhalten in Beziehung gesetzt wird.
-
Weiterhin werden Nachrichten gemäß einem Inhalt
einer Spracheingabe einer Ferngesprächstelefonnummer, einer Ortsgesprächstelefonnummer oder
einer Teilnehmertelefonnummer mitgeteilt, so daß zugelassen wird, daß eine Eingabeführung für die Telefonnummern
leicht von dem Benutzer verstanden wird.
-
In dem zweiten Ausführungsbeispiel
der vorliegenden Erfindung ist eine Erkennungswörterbuch-Speichereinheit 104 aus
drei unabhängigen Wörterbüchern einer
Ferngesprächstelefonnummer, einer
Ortsgesprächstelefonnummer
und einer Teilnehmertelefonnummer ausgebildet. In jedem Wörterbuch
wird ein Erkennungswort gespeichert, das zu einer einstelligen Zahl,
die dem fortlaufenden einstelligen Lesen entspricht, oder einer
mehrstelligen Zahl, die dem Zahlenwerte beinhaltenden Lesen entspricht,
in Beziehung gesetzt ist. Deshalb kann das Erkennungswörterbuch
unterschiedlich aus einem Wörterbuch
für ein
fortlaufendes einstelliges Lesen und einem Wörterbuch für das Zahlenwerte beinhaltende
Lesen ausgebildet sein. Bei diesem Ausbilden von Wörterbüchern werden
Spracheingaben einer Ferngesprächstelefonnummer
in dem Wörterbuch
für das
fortlaufende einstellige Lesen zugeordnet, während Spracheingaben von Ortsgesprächsund Teilnehmertelefonnummern
in beiden Wörterbüchern für das fortlaufende
einstellige Lesen und das Zahlenwerte beinhaltende Lesen zugeordnet
werden.
-
Wie es zuvor erläutert worden ist, speichert gemäß der vorliegenden
Erfindung ein in einer Erkennungswörterbuch-Speichereinheit gespeichertes Erkennungswörterbuch
ein Erkennungswort und einen Sprachinhalt auf zwei Weisen. Auf eine
erste Weise werden das Erkennungswort einer einstelligen Zahl und
sein Sprachinhalt eines Lesens der einstelligen Zahl zueinander
in Beziehung gesetzt. Auf eine zweite Weise werden das Erkennungswort
einer mehrstelligen Zahl und ihr Sprachinhalt eines Lesens der mehrstelligen
Zahl, das einen Ausdruck eines Zahlenwerts beinhaltet, zueinander
in Beziehung gesetzt. Zum Beispiel wird dadurch auch "12" erkannt, wenn ein
Sprecher ausspricht, um "12" durch Lesen von
entweder "eins-zwei" oder "zwölf" einzugeben. Als
ein Ergebnis wählt
ein Benutzer eine Leseweise für
ein Telefonnummer aus, so daß der
Benutzer die Telefonnummer einfach lesen kann.