-
Die
vorliegende Erfindung betrifft eine Spracherkennungseinheit, deren
Bedienbarkeit und Reaktionsfähigkeit
verbessert werden, sowie ein diesbezügliches Verfahren.
-
Bisher
erfolgt in dem Fall, in dem der Name einer Institution unter Verwendung
einer Spracherkennungseinheit gesucht wird, die Sprachausgabe des
Namens schließlich
nach dem Eingrenzen von in Warteschlange angeordneten Wörtern basierend
auf einem Kategorie- und einem Ortsnamen, wie in einem in 13 dargestellten
Verfahren zum Eingrenzen gezeigt wird, um das Verhältnis von
Erkennung und Restriktion, wie beispielsweise die nutzbare Speichergröße, sicherzustellen.
Spracherkennung bedeutet in diesem Fall Spracherkennung für die Bedienung
durch Sprache, wobei beispielsweise ein Fahrzeugnavigationssystem
die Spracheingabe des Benutzers über
ein Mikrofon erkennt und die Verarbeitung für die Bedienung unter Verwendung
der erkannten Sprache durchführt,
und bedeutet insbesondere Spracherkennung, bei der die Bedienung
zum Auswählen
einer gewünschten
Institution aus einer beträchtlichen
Anzahl von Institutionskandidaten durch Sprache durchgeführt wird.
In einem ersten Schritt wird ein Steuerbefehlswörterbuch zum Ausführen einer
Fahrzeugnavigation in dem System eingestellt, und ein Benutzer teilt
dem System seine/ihre Absicht mit, einen Weg zu einem Zielort durch
Eingeben eines Sprachbefehls „Einstellen
eines Zielortes" einzustellen.
-
Das
System muss einen konkreten Ort, der ein Zielort sein soll, suchen,
da jedoch die Anzahl der Institutionen enorm groß ist, kann der konkrete Ort nicht
mittels einer einzigen Spracherkennung spezifiziert werden. Deshalb
wird zum Reduzieren der Anzahl der Institutionen, die Suchobjekte
sind, das Eingrenzen anschließend
basierend auf einem Kategorienamen durchgeführt. Zum Eingrenzen auf Basis
eines Kategorienamens wird, nachdem ein Kategorienamenwörterbuch
als ein Erkennungswörterbuch ausgewählt wurde,
ein Benutzer zunächst
durch 1) „Sagen
Sie bitte einen Kategorienamen" aufgefordert,
einen Kategorienamen zu nennen. Wenn der Benutzer 2) „Bildungseinrichtung" sagt, erkennt die Spracherkennungseinrichtung
die Spracheingabe. Das System fordert den Benutzer auf, eine weitere detaillierte
Unterkategorie der Kategorie der Bildungsinstitution zu spezifizieren,
und nachdem ein Unterkategorienamenwörterbuch als das Erkennungswörterbuch
ausgewählt
ist, wird der Benutzer durch 3) „Nächster Kategorie name bitte" aufgefordert, einen
Unterkategorienamen zu nennen. Wenn der Benutzer 4) „High School" sagt, erkennt die
Spracherkennungseinheit die Spracheingabe.
-
Wenn
die Unterkategorie festgelegt ist, sagt das System 5) „Name der
Präfektur
bitte", nachdem ein
Präfekturnamenwörterbuch
als das Erkennungswörterbuch
ausgewählt
ist, um anschließend
auf Basis eines Gebietes einzugrenzen, und fordert den Benutzer
auf, ein Gebiet in Einheiten eines Präfekturnamens einzugrenzen.
Wenn der Benutzer 6) Tokio sagt, erkennt die Spracherkennungseinheit
die Spracheingabe als Tokio. In dem Fall, in dem die Unterkategorie
eine High School und der Präfekturname
Tokio ist, wird in dem System im Voraus festgelegt, einen Benutzer
aufzufordern, einen Namen eines Stadtbezirks zu spezifizieren, und
nachdem ein Stadtbezirksnamenwörterbuch
als das Erkennungswörterbuch
ausgewählt
ist, fordert das System den Benutzer mit 7) „Name des Stadtbezirks bitte" auf, den Namen eines
Stadtbezirkes zu sagen. Wenn der Benutzer 8) Shibuya Ward sagt,
erkennt die Spracherkennungseinheit die Spracheingabe. Da die Anzahl
der Institutionen durch die vorangehende Spezifizierung weit genug
eingegrenzt ist, beginnt die Suche des Institutionsnamens.
-
Nachdem
das System ein Wörterbuch
für High
Schools im Stadtbezirk Shibuya Ward von Tokio als das Erkennungswörterbuch
ausgewählt
hat, fordert es den Benutzer mit 9) „Der Name bitte" auf, einen Institutionsnamen
zu sagen. Wenn der Benutzer „Schule
So-und-So" sagt, erkennt die
Spracherkennungseinheit die Spracheingabe und stellt die Schule So-und-So
als einen Zielort ein.
-
Wie
oben beschrieben, muss eine mühsame Prozedur
ausgeführt
werden, bei der die hierarchische Struktur von Spracherkennungswörterbüchern sequenziell
eingehalten wird und sämtliche
Bedingungen zum Eingrenzen festgelegt werden. Es existiert ein Verfahren
zum Erstellen sämtlicher
Institutionsnamen, so dass diese schließlich auf der höchsten Hierarchieebene
zu suchen sind, um das Ausführen
der oben erwähnten
mühsamen
Prozedur zu vermeiden.
-
In
diesem Fall ist jedoch ein Speicher mit einer beträchtlichen
Kapazität
erforderlich und es besteht ebenfalls das Problem, dass der Erkennungsgrad
verschlechtert wird und das Ergebnis einer Sprachausgabe nicht zufriedenstellend
ist. Wenn beispielsweise ein bestimmter Benutzer kein Golf spielt, er/sie
keine Golflinks sucht, kann jedoch, wenn sämtliche Institutionsnamen einschließlich der
Kategorie, die den Benutzer nicht interessiert (in diesem Fall Golflinks),
erstellt werden, ein bestimmter Institutionsname fälschlicherweise
als der Name eines Golflinks erkannt werden. Dadurch wird der Benutzer
gestresst. Weitere Beispiele von Systemen, die dem Stand der Technik
entsprechen, werden in den Dokumenten EP-A-0935123, US-A-6112174
und US-A-6108631 offenbart.
-
Die
Erfindung wird hinsichtlich der vorangehend erwähnten Situation gemacht, und
es ist eine Aufgabe der Erfindung, eine Spracherkennungseinheit
und ein diesbezügliches
Verfahren bereitzustellen, deren Bedienbarkeit und deren Reaktionsfähigkeit
jeweils durch das Durchführen
eines Erkennungsprozesses unter Verwendung eines Wörterbuches,
das wenigstens entsprechend einer eingrenzenden Bedingung klassifiziert
ist, die durch einen Benutzer im Voraus eingestellt wird, zusätzlich zu
einem Wörterbuch
zum Eingrenzen auf der höchsten Hierarchieebene
als Objekte der Erkennung verbessert werden.
-
Des
Weiteren ist es eine Aufgabe der Erfindung, eine Spracherkennungseinheit
und ein diesbezügliches
Verfahren bereitzustellen, wobei ein Institutionsname, der mit der
folgenden eingrenzenden Bedingung übereinstimmt, durch eine Spracheingabe gesucht
werden kann, indem eine häufig
von dem Benutzer verwendete eingrenzende Bedingung, wie beispielsweise
ein Kategorie- und ein Gebietsname, im Voraus eingestellt wird,
ohne die mühsame
Prozedur, bei der die hierarchische Struktur sequenziell eingehalten
und eine eingrenzende Bedingung festgelegt wird, durchführen zu
müssen
und des Weiteren wird, da ein Wörterbuch
für eine
eingrenzende Bedingung gleichzeitig auch ein Objekt der Erkennung
ist, die Suche entsprechend einer herkömmlichen Prozedur aktiviert,
bei der die hierarchische Struktur sequenziell eingehalten und eine
eingrenzende Bedingung festgelegt wird, selbst wenn ein Institutionsname,
der nicht mit einer im Voraus eingestellten eingrenzenden Bedingung übereinstimmt, gesucht
werden soll.
-
Um
die vorangehend genannten Aufgaben zu lösen, stellt die vorliegende
Erfindung eine Spracherkennungsvorrichtung in Übereinstimmung mit dem Patentanspruch
1 bereit.
-
Die
bestimmte Ebene der Hierarchie ist vorzugsweise die höchste Ebene
der Hierarchie.
-
Die
bestimmte Ebene der Hierarchie ist vorzugsweise eine Ebene, die
niedriger ist als die höchste
Ebene der Hierarchie.
-
Die
Extrahiereinrichtung extrahiert vorzugsweise in Reaktion auf die
Erkennung von weiteren Sprachbefehlen durch die Erkennungseinrichtung
als die Liste von in Warteschlange angeordneten Wörtern:
Wörterbücher niedrigerer
Ebene, die mit ausgewählten
in Warteschlange angeordneten Wörtern
verbunden sind, von denen jedes auf einer hierarchischen Ebene angeordnet
ist, die mit jedem Erkennungsprozess iterativ niedriger ist.
-
Die
Spracherkennungswörterbücher umfassen
vorzugsweise:
ein Klassifizierungswörterbuch zum Speichern von Klassifizierungsnamen
von Institutionen; und
ein Institutionswörterbuch zum Speichern von
Namen von Institutionen, die zu einem Institutionstyp gehören.
-
Die
Spracherkennungswörterbücher umfassen
vorzugsweise:
ein Gebietswörterbuch
zum Speichern von Gebietsnamen; und
ein Institutionswörterbuch
zum Speichern der Namen von Institutionen, die in einem Gebiet vorhanden sind.
-
Wenn
ein Benutzer ein erwünschtes
Wörterbuch
auswählt,
werden die Inhalte dieses Wörterbuchs
vorzugsweise in der Speichereinrichtung gespeichert.
-
Die
vorliegende Erfindung stellt außerdem ein
Spracherkennungsverfahren in Übereinstimmung mit
dem Patentanspruch 8 bereit.
-
Die
bestimmte Ebene ist vorzugsweise eine Ebene, die niedriger als die
höchste
Ebene in der Hierarchie ist.
-
Die
Wörterbücher, die
entsprechend wenigstens einer eingrenzenden Bedingung klassifiziert sind,
die durch einen Benutzer im Voraus eingestellt wird, sind vorzugsweise
Wörterbücher, deren
Nutzungshäufigkeit
hoch ist.
-
In
den Zeichnungen ist
-
1 ein
Blockdiagramm, das eine Ausführungsform
einer Spracherkennungseinheit in Übereinstimmung mit der Erfindung
darstellt.
-
2 ist
eine erklärende
Zeichnung zum Erklären
eines Spracherkennungsverfahrens in Übereinstimmung mit der Erfindung
und zeigt ein Beispiel eines hierarchischen Wörterbuchbaumes.
-
3 ist
eine erklärende
Zeichnung zum Erklären
des Spracherkennungsverfahrens in Übereinstimmung mit der Erfindung
und zeigt ein Beispiel eines hierarchischen Wörterbuchbaumes.
-
4 ist
eine erklärende
Zeichnung zum Erklären
des Spracherkennungsverfahrens in Übereinstimmung mit der Erfindung
und zeigt ein Beispiel eines hierarchischen Wörterbuchbaumes.
-
5 ist
eine erklärende
Zeichnung zum Erklären
des Spracherkennungsverfahrens in Übereinstimmung mit der Erfindung
und zeigt ein Beispiel eines hierarchischen Wörterbuchbaumes.
-
6 ist
ein Ablaufdiagramm, das Verfahrensschritte zum Einhalten der Hierarchien
in dem in 3 dargestellten hierarchischen
Wörterbuchbaum zeigt.
-
7 ist
ein Ablaufdiagramm, das Verfahrensschritte zum Einhalten der Hierarchien
in dem in 5 dargestellten hierarchischen
Wörterbuchbaum zeigt.
-
8 ist
ein Ablaufdiagramm, das die detaillierten Verfahrensschritte für einen
in den 6 und 7 dargestellten Erkennungsprozess
zeigt.
-
9 zeigt
das Ersteinstellungsverfahren einer eingrenzenden Bedingung auf
einem Anzeigebildschirm.
-
10 zeigt
das Ersteinstellungsverfahren einer eingrenzenden Bedingung auf
einem Anzeigebildschirm.
-
11 zeigt
das Ersteinstellungsverfahren einer eingrenzenden Bedingung auf
einem Anzeigebildschirm.
-
12 zeigt
das Ersteinstellungsverfahren einer eingrenzenden Bedingung auf
einem Anzeigebildschirm.
-
13 ist
eine erklärende
Zeichnung zum Erklären
einer Vorgehensweise des herkömmlichen Typs
zum Eingrenzen.
-
Im
Folgenden werden die bevorzugten Ausführungsformen der Erfindung
unter Bezugnahme auf die angehängten
Zeichnungen ausführlicher
beschrieben.
-
1 ist
ein Blockdiagramm, das eine Ausführungsform
einer Spracherkennungseinheit in Übereinstimmung mit der Erfindung
darstellt.
-
Wie
in 1 dargestellt, nimmt ein Mikrofon 100 die
Spracheingabe eines Benutzers auf, wandelt diese in ein elektrisches
Signal um und überträgt es zu
einer Kennwert-Berechungseinrichtung 101.
Die Kennwert-Berechnungseinrichtung 101 wandelt die Puls-Code-Modulations-(PDM)
Daten zu einem für die
Spracherkennung geeigneten Kennwert um und stellt diesen einer Erkennungseinrichtung 102 bereit. Die
Erkennungseinrichtung 102 berechnet die Ähnlichkeit
zwischen der eingegebenen Sprache, die zu einem Kennwert umgewandelt
wurde, und jedem in Warteschlange angeordneten Wort in einem Erkennungswörterbuch,
das in den RAM 103 geladen wurde, und gibt n Teile von
in Warteschlange angeordneten Wörtern,
die eine größere Ähnlichkeit
haben, und jeweilige Ähnlichkeit(-swerte)
an eine Steuereinrichtung 107 als ein Ergebnis aus.
-
Eine
Erkennungswörterbuch-Speichereinrichtung 105 speichert
eine Vielzahl von Wörterbüchern für die Spracherkennung.
Die Typen von Wörterbüchern umfassen
ein Wör terbuch
für eine
eingrenzende Bedingung, das für
jede eingrenzende Bedingung bereitstellt wird, sowie ein Institutionsnamenwörterbuch,
in dem Zielortnamen gespeichert sind, die durch die Kombination
von eingrenzenden Bedingungen klassifiziert sind, wie beispielsweise konkrete
Namen von Institutionen. Darüber
hinaus gibt es für
das Wörterbuch
entsprechend einer eingrenzenden Bedingung ein Großgebietswörterbuch, in
dem Gebietsnamen, die ein großes
Gebiet bezeichnen, wie beispielsweise ein Präfekturname, zum Suchen eines
Ortes gespeichert sind, ein Kleingebietswörterbuch, das für jede Präfektur bereitgestellt
wird und Gebietsnamen speichert, die ein kleines Gebiet bezeichnen,
wie beispielsweise einen Stadtbezirksnamen, das zu jeder Präfektur gehört, ein
Kategoriewörterbuch
zum Speichern wichtiger Klassifizierungskategorienamen der Suchorte,
wie beispielsweise den Typ einer Institution, sowie ein Unterkategoriewörterbuch,
das für
jede wichtige Klassifizierungskategorie bereitgestellt wird und
Unterkategorienamen speichert, die zu jeder wichtigen Klassifizierungskategorie
gehören.
-
Eine
Erkennungswörterbuch-Auswähleinrichtung 104 wählt ein
erwünschtes
Wörterbuch
von den in der Erkennungswörterbuch-Speichereinrichtung 105 gespeicherten
Wörterbüchern entsprechend
einem Befehl von der Steuereinrichtung 107 aus und lädt es in
den RAM 103 als in Warteschlange angeordnete Wörter. Eine
Ersteinstellungseinrichtung 108 besteht aus einer Fernbedienungstaste oder
einer Sprachbedienungseinrichtung für einen Benutzer, um so auszuwählen, dass
er ein erwünschtes
Wörterbuch
von den Institutionsnamenwörterbüchern entsprechend
der Kombination von eingrenzenden Bedingungen als ein Wörterbuch
auf der höchsten
Ebene der Hierarchie einstellt. Ein durch einen Benutzer mittels
der Ersteinstellungseinrichtung 108 eingestelltes Institutionsnamenwörterbuch
ist ein Ersteinstellungswörterbuch.
Ein Verfahren zum Einstellen wird an späterer Stelle beschrieben. Eine
Ersteinstellungs-Speichereinrichtung 106 speichert eine
eingrenzende Bedingung, die durch einen Benutzer als eine Ersteinstellung
unter Verwendung der Ersteinstellungseinrichtung 108 eingestellt
wird, oder das Institutionsnamenwörterbuch, das ein Benutzer als
ein Ersteinstellungswörterbuch
eingestellt.
-
Eine
Sprachsyntheseeinrichtung 109 erzeugt eine synthetische
Sprache für
eine Bedienungsanweisung und eine Rückmeldung und gibt sie an einen
Lautsprecher 112 aus. Eine Sucheinrichtung 111 ist
mit Datenbanken von Kartendaten, nicht dargestellt, und weiteren
bereitgestellt und sucht den Lageplan, die Adresse, die Telefonnummer
und die Dienstinhalte einer Institution, die schließlich durch die
Spracherkennung aus einer detaillierten Informationsdatenbank aufgefunden
wird. Eine Ergebnisanzeigeeinrichtung 110 ist eine Anzeige
zum Anzeigen von detaillierten Informationen, die durch die Sucheinrichtung 111 aufgefunden
werden, zusammen mit dem Ergebnis der Erkennung bei der Sprachbedienung,
den in Warteschlange angeordneten Wörtern, einer Bedienungsanweisung
und einer Rückmeldung.
-
Die
Steuereinrichtung 107 steuert jede Komponente entsprechend
dem Ergebnis der von jeder der vorangehend erwähnten Komponenten ausgegebenen
Ausgabe. Das heißt,
die Steuereinrichtung 107 steuert so, dass die Erkennungswörterbuch-Auswähleinrichtung 104 zuerst
ein Kategoriewörterbuch aus
der Erkennungswörterbuch-Speichereinrichtung 105 extrahiert,
wenn die Suche einer Institution durch die Spracherkennung durchgeführt wird,
und das extrahierte Kategoriewörterbuch
in den RAM 103 als in Warteschlange angeordnete Wörter lädt. Zu diesem Zeitpunkt
steuert die Steuereinrichtung 107 so, dass eine eingrenzende
Bedingung oder ein Institutionsnamenwörterbuch, die oder das von
einem Benutzer im Voraus eingestellt wird, durch Bezugnahme auf die
Ersteinstellungs-Speichereinrichtung 106 erkannt wird,
und die Erkennungswörterbuch-Auswähleinrichtung 104 extrahiert
auf die gleiche Weise die entsprechende eingrenzende Bedingung oder
das entsprechende Institutionsnamenwörterbuch aus der Erkennungswörterbuch-Speichereinrichtung 105 und lädt sie oder
es in den RAM 103 als in Warteschlange angeordnete Wörter.
-
Die
Sprachsyntheseeinrichtung 109 wird angewiesen, eine Bedienungsanweisung,
wie beispielsweise „Sagen
Sie bitte einen Kategorienamen" zu
erzeugen, und diese aus dem Lautsprecher 112 auszugeben.
-
Wenn
ein in Warteschlange angeordnetes Wort in einem Kategoriewörterbuch,
das in dem RAM 103 als in Warteschlange angeordnete Wörter gespeichert
ist, in Sprachform eingegeben wird, wird ein Wörterbuch einer Unterkategorie,
das zu einer durch die Spracheingabe dargestellten Kategorie gehört, aus
der Erkennungswörterbuch-Speichereinrichtung 105 ausgelesen
und in den RAM 103 als das nächste in Warteschlange angeordnete
Wort geladen. Wenn ein in Warteschlange angeordnetes Wort in dem
Unterkategoriewörterbuch,
das in dem RAM 103 als in Warteschlange angeordnete Wörter gespeichert
ist, in Sprachform eingegeben wird, wird die durch die Spracheinga be
bezeichnete Unterkategorie gespeichert, ein Großgebietswörterbuch, das sich auf die Unterkategorie
bezieht, wird aus der Erkennungswörterbuch-Speichereinrichtung 105 ausgelesen
und in den RAM 103 als das nächste in Warteschlange angeordnete
Wort geladen.
-
Wenn
ein in Warteschlange angeordnetes Wort in dem Großgebietswörterbuch,
das in dem RAM 103 als in Warteschlange angeordnete Wörter gespeichert
ist, in Sprachform eingegeben wird, wird ein Wörterbuch eines Kleingebietes,
das zu dem eingegebenen Großgebiet
gehört,
aus der Erkennungswörterbuch-Speichereinrichtung 105 ausgelesen
und in den RAM 103 als das nächste in Warteschlange angeordnete
Wort geladen. Wenn ein in Warteschlange angeordnetes Wort in dem
Kleingebietswörterbuch,
das in dem RAM 103 als in Warteschlange angeordnete Wörter gespeichert
ist, in Sprachform eingegeben wird, wird das durch die Spracheingabe
bezeichnete Kleingebiet gespeichert, ein Wörterbuch, das einen konkreten
Ort, der sich auf das Kleingebiet bezieht, darstellt, wird aus der
Erkennungswörterbuch-Speichereinrichtung 105 ausgelesen
und in den RAM 103 als das nächste in Warteschlange angeordnete
Wort geladen. Wie vorangehend beschrieben, ist ein aus in Warteschlange
angeordneten Wörtern
bestehendes Wörterbuch
hierarchisch in der Erkennungswörterbuch-Speichereinrichtung 105 gespeichert,
so dass es sequenziell geändert
und hierarchisch verwendet wird. Das heißt, wie in Form eines hierarchischen
Wörterbuchbaumes
in den später
beschriebenen 2 bis 5 dargestellt,
dass ein Unterkategoriewörterbuch
unter einem Kategoriewörterbuch
angeordnet ist, ein Kleingebietswörterbuch unter einem Großgebietswörterbuch
angeordnet ist und mehrere Wörterbücher, die einen
konkreten Ort anzeigen, auf der niedrigsten Ebene der Kategorie
vorhanden sind.
-
Die 2 bis 12 sind
erklärende
Zeichnungen zum Erklären
der Funktionsweise dieser Ausführungsform
der Erfindung, die in 1 gezeigt wird, die 2 bis 5 zeigen
einen hierarchischen Wörterbuchbaum
von Spracherkennungswörterbüchern mit
hierarchischer Struktur, die 6 bis 8 sind
Ablaufdiagramme, die die Funktionsweise darstellen, und die 9 bis 12 zeigen
die Konfiguration eines Bildschirmes für die Ersteinstellung einer
eingrenzenden Bedingung.
-
Die
Erfindung ist dadurch gekennzeichnet, dass beim Suchen eines Spracherkennungswörterbuches
mit einer hierarchischen Struktur ein Erkennungsprozess ebenfalls auf
ein oder mehrere Institutionsnamenwörterbücher, die durch den Benutzer
im Voraus eingestellt werden (Wörterbücher, die
gemäß einer
eingrenzenden Bedingung klassifiziert sind und einem Krankenhauswörterbuch
sowie einem Unterkunftswörterbuch
in dem hierarchischen Wörterbuchbaum,
der in 3 dargestellt wird, entsprechen), zusammen mit
einem ersten Wörterbuch
für eine
eingrenzende Bedingung (ein Kategorienamenwörterbuch in dem in 3 dargestellten
hierarchischen Wörterbuchbaum)
auf einer ersten Hierarchieebene als ein Objekt der Erkennung angewandt
wird.
-
Das
heißt,
wenn ein Benutzer eine eingrenzende Bedingung, wie beispielsweise
einen Kategorie- und einen Gebietsnamen, die jeweils häufig von einem
Benutzer verwendet werden, im Voraus einstellt, kann ein Institutionsname,
der ein Ziel sein soll und mit der mit der eingrenzenden Bedingung übereinstimmt,
durch eine Spracheingabe und ohne die mühsame Prozedur gesucht werden,
bei der die hierarchische Struktur sequenziell eingehalten und eine eingrenzende
Bedingung bestimmt wird. Da ein Wörterbuch für eine eingrenzende Bedingung
gleichzeitig auch ein Objekt der Erkennung ist, kann selbst ein
Institutionsname, der nicht mit der im Voraus eingestellten eingrenzenden
Bedingung übereinstimmt,
entsprechend einer herkömmlichen
Vergehensweise gesucht werden, bei der die hierarchische Struktur sequenziell
eingehalten und eine eingrenzende Bedingung bestimmt wird.
-
Es
ist erstrebenswert, dass die Anzahl oder die Größe der Institutionsnamenwörterbücher (Wörterbücher, die
entsprechend einer eingrenzenden Bedingung klassifiziert sind),
die im Voraus eingestellt werden kann, durch einen Systemdesigner
aus dem Blickwinkel des Erkennungsgrades und aufgrund der Beschränkung der
nutzbaren Speicherkapazität
im Voraus eingestellt wird.
-
Bei
einem Erkennungsprozess auf einer ersten Hierarchieebene kann, selbst
wenn ein Wort in einem Kategorienamenwörterbuch erkannt wird, ein Wörterbuch
(ein Wörterbuch
für Unterkünfte in
dem in 5 dargestellten hierarchischen Wörterbuchbaum),
das mit einer eingrenzenden Bedingung übereinstimmt und ein in Warteschlange
angeordnetes auf die erkannte Sprache bezogenes Wort von den in
Warteschlange angeordneten Wörtern
enthält, die
als die in Warteschlange angeordneten Wörter in einem Wörterbuch
gespeichert sind, das bei der Erkennung ein Objekt der Erkennung
ist, wie beispielsweise ein Institutionsnamenwörterbuch (ein Wörterbuch,
das entsprechend der eingrenzen den Bedingung klassifiziert ist und
einem Krankenhauswörterbuch
sowie einem Unterkunftswörterbuch
in dem in 5 dargestellten hierarchischen
Wörterbuchbaum entspricht),
das durch einen Benutzer im Voraus eingestellt und in dem in 5 gezeigten
hierarchischen Wörterbuchbaum
dargestellt wird, ebenfalls ein Objekt der Erkennung zusammen mit
dem Unterkategorienamenwörterbuch
sein. Ein Erkennungsprozess auf einer dritten oder der nachfolgenden
Hierarchieebene ist ebenfalls ähnlich.
-
Im
Folgenden wird der Erkennungsprozess ausführlich in Bezug auf die Zeichnungen
beschrieben. Zunächst
sieht die Kommunikation entsprechend dem in 2 dargestellten
hierarchischen Wörterbuchbaum
zwischen einem System und einem Benutzer folgendermaßen aus.
- (1) Das System: „Sagen Sie bitte einen Befehl"
- (2) Der Benutzer: „Krankenhaus"
- (3) Das System: „Nächste Kategorie
bitte"
- (4) Der Benutzer: „Klinik"
- (5) Das System: „Präfekturname
bitte"
- (6) Der Benutzer: „Präfektur Saitama"
- (7) Das System: „Name
des Stadtbezirks bitte"
- (8) Der Benutzer: „Stadt
Kawagoe"
- (9) Das System: „Name
bitte"
- (10) Der Benutzer: „Dr.
Kuritas Praxis"
-
Das
heißt,
dass in diesem Fall die Spracherkennung mit einem Wörterbuch
für Krankenhäuser (Kliniken)
in der Stadt Kawagoe in der Präfektur
Saitama 204 als ein Objekt der Erkennung für die Spracheingabe „Dr. Kuritas
Praxis" durchgeführt wird.
-
In
der Zwischenzeit sieht die Kommunikation zwischen dem System und
einem Benutzer in dem Fall, in dem der Benutzer ein Krankenhaus 302 und Unterkünfte 303,
wie in dem hierarchischen Wörterbuchbaum
in 3 dargestellt, entsprechend der Charakteristik
der Erfindung im Voraus einstellt, und in dem Fall, in dem der Name
einer Institution, der mit den eingestellten eingrenzenden Bedingungen übereinstimmt,
gesucht wird, folgendermaßen
aus.
- (1) Das System: „Sagen Sie bitte einen Kategorienamen
oder einen Institutionsnamen"
- (2) Der Benutzer: „Dr.
Saitos Praxis"
-
In
diesem Fall wird die Spracherkennung mit einem Kategorienamenwörterbuch 301,
einem Krankenhauswörterbuch 302 sowie
einem Unterkunftswörterbuch 303 als
ein Objekt der Erkennung für
die Spracheingabe „Dr.
Saitos Praxis" durchgeführt. Wenn
in diesem Fall das Objekt (Dr. Saitos Praxis) in dem Krankenhauswörterbuch 302 enthalten
ist, wird der Suchvorgang durch eine Spracheingabe beendet. Das
Krankenhauswörterbuch 302 besteht
aus einer Reihe von Wörterbüchern (307, 308,
..., 313) mit Namen, die zu sämtlichen Unterkategorien von
Krankenhäusern
in allen Stadtbezirken sämtlicher
Präfekturen
gehören,
und das Unterkunftswörterbuch 303 ist
ebenfalls ähnlich.
-
Die
Kommunikation zwischen dem System und einem Benutzer sieht in dem
Fall, in dem der Name einer Institution, der nicht mit einer eingestellten
eingrenzenden Bedingung übereinstimmt,
entsprechend dem in 4 dargestellten hierarchischen
Wörterbuchbaum
gesucht wird, und in dem Fall, in dem lediglich ein Wörterbuch
für eine
eingrenzende Bedingung ein Objekt der Erkennung auf einer zweiten
oder der nachfolgenden Hierarchieebene ist, folgendermaßen aus.
- (1) Das System: „Sagen Sie bitte einen Kategorienamen
oder einen Institutionsnamen"
- (2) Der Benutzer: „Bahnhofsname"
- (3) Das System: „Unterkategoriename
bitte"
- (4) Der Benutzer: „Private
Bahnlinie"
- (5) Das System: „Name
der Präfektur
bitte"
- (6) Der Benutzer: „Präfektur Saitama"
- (7) Das System: „Name
des Stadtbezirks bitte"
- (8) Der Benutzer: „Stadt
Kumagaya"
- (9) Das System: „Name
des Bahnhofes bitte"
- (10) Der Benutzer: „Ishiwara
Station"
-
In
diesem Fall wird die Spracherkennung mit einem Wörterbuch für Bahnhofsnamen (von privaten Bahnlinien)
in der Stadt Kumagaya in der Präfektur Saitama 408 als
ein Objekt der Erkennung für
die Spracheingabe: „Ishiwara
Station" durchgeführt. Da das
Objekt (Ishiwara Station) nicht in den in Warteschlange angeordneten
Wörterbüchern 400 der
ersten Hierarchieebene enthalten ist, sagt der Benutzer einen Kategorienamen,
der in einem Kategotienamenwörterbuch 401 auf
einer ersten Hierarchieebene enthalten ist und anschließend wird
der Suchvorgang entsprechend einem Verfahren des herkömmlichen
Typs durchgeführt.
-
Im
Folgenden wird in Bezug auf 5 ein Fall
beschrieben, in dem der Name einer Institution, der mit einer eingestellten
eingrenzenden Bedingung übereinstimmt,
gesucht wird, und Institutionsnamenwörterbücher, die mit einer im Voraus
eingestellten eingrenzenden Bedingung übereinstimmen, zusammen mit
der eingestellten eingrenzenden Bedingung und einer eingrenzenden
Bedingung, die in einem Suchprozess festgelegt wird, ein Objekt
der Erkennung auf einer zweiten oder der nachfolgenden Hierarchieebene
sind. In diesem Fall sieht die Kommunikation zwischen dem System
und einem Benutzer folgendermaßen
aus.
- (1) Das System: „Sagen Sie bitte einen Kategorienamen
oder einen Institutionsnamen"
- (2) Der Benutzer: „Unterkünfte"
- (3) Das System: „Unterkategoriename
oder Institutionsname bitte"
- (4) Der Benutzer: „Kobayashi
Hotel"
-
In
diesem Fall wird die Spracherkennung mit einem Unterkategorienamenwörterbuch
für Unterkünfte 505 und
einem Unterkunftswörterbuch 503 als Objekte
der Erkennung für
die Spracheingabe „Kobayashi
Hotel" durchgeführt. Wenn
das Objekt („Kobayashi
Hotel") in dem Unterkunftswörterbuch 503 enthalten
ist, wird der Suchvorgang zu diesem Zeitpunkt beendet.
-
Institutionsnamenwörterbücher, die
mit der eingrenzenden Bedingung übereinstimmen,
die im Voraus eingestellt wird, zusammen mit dem Wörterbuch
für eine
eingrenzende Bedingung und der in dem Suchvorgang festgelegten eingrenzenden
Bedingung sind Objekte der Erkennung auf der zweiten oder der nachfolgenden
Ebene der Hierarchie. Beispielsweise:
- (1) Das
System: „Sagen
Sie bitte einen Kategorienamen oder einen Institutionsnamen"
- (2) Der Benutzer: „Unterkünfte"
- (3) Das System: „Unterkategoriename
oder Institutionsname bitte"
- (4) Der Benutzer: „Hotel
im japanischen Stil"
- (5) Das System: „Name
der Präfektur
oder Institutionsname bitte"
- (6) Der Benutzer: „Kobayashi
Hotel"
-
Die
Kommunikation zwischen dem System und einem Benutzer sieht in dem
Fall, in dem Name einer Institution, der nicht mit einer voreingestellten eingrenzenden
Bedingung übereinstimmt,
gesucht wird, folgendermaßen
aus:
- (1) Das System: „Sagen Sie bitte einen Kategorienamen
oder einen Institutionsnamen"
- (2) Der Benutzer: „Bahnhofsname"
- (3) Das System: „Unterkategoriename
bitte" (*)
- (4) Der Benutzer: „JR"
- (5) Das System: „Name
der Präfektur
bitte" (*)
- (6) Der Benutzer: „Präfektur Saitama"
- (7) Das System: „Name
des Stadtbezirkes bitte" (*)
- (8) Der Benutzer: „Stadt
Kumagaya"
- (9) Das System: „Bahnhofsname
bitte"
- (10) Der Benutzer: „Kumagaya
Station"
-
In
diesem Fall wird die Spracherkennung mit einem Wörterbuch für Bahnhofsnamen (der JR – Japan
Railway) in der Stadt Kumagaya in der Präfektur Saitama als ein Objekt
der Erkennung für
die Spracheingabe „Kumagaya
Station" durchgeführt. Wenn keine
Institution, die mit der voreingestellten eingrenzenden Bedingung
und sämtlichen
in einem Suchvorgang festgelegten eingrenzenden Bedingungen übereinstimmt,
vorhanden ist, ist kein Institutionsname in der Führung des
Systems bei den Punkten beinhaltet, die in der vorangehend aufgeführten Kommunikation
zwischen dem System und dem Benutzer mit dem Zeichen * versehen
sind.
-
6 ist
ein Ablaufdiagramm, das einen Vorgang zum Einhalten von Hierarchien
in dem in 3 dargestellten hierarchischen
Wörterbuchbaum
zeigt. Im Folgenden wird unter Bezugnahme auf den in 3 dargestellten
hierarchischen Wörterbuchbaum und
das in 6 dargestellte Ablaufdiagramm die Funktionsweise
der in 1 dargestellten Ausführungsform der Erfindung beschrieben.
-
Zuerst
stellt ein Benutzer in einem Schritt S600 eine eingrenzende Bedingung
durch die Ersteinstellungseinrichtung 108 ein. Da der zuerst
eingestellte Wert in der Ersteinstellungs-Speichereinrichtung 106 gespeichert
wird, muss die Verarbeitung nur einmal zu einer Ersteinstellungszeit
und nicht bei jeder Suche durchgeführt werden. In einem Schritt S601
wird festgestellt, ob die Initiierung der Suche durch eine Spracheingabetaste
und andere ausgelöst
wird oder nicht, und wenn sie nicht ausgelöst wird, kehrt die Steuerung
zu dem Schritt S601 zurück.
-
In
der Zwischenzeit geht die Steuerung, in dem Fall, in dem die Initiierung
der Suche ausgelöst wird,
zu der Verarbeitung in einem Schritt S602 über und das Kategorienamenwörterbuch 301 und
ein oder mehrere Institutionsnamenwörterbücher, die in der Ersteinstellungs-Speichereinrichtung 106 gespeichert
sind und mit der durch den Benutzer im Voraus eingestellten Bedingung übereinstimmen,
werden in den RAM 103 geladen. In einem Schritt S603 wird
ein Erkennungsprozess unter Verwendung der in den RAM 103 geladenen
Wörterbücher als
Objekte der Erkennung ausgeführt.
Zu diesen Zeitpunkt sagt der Benutzer einen Kategorienamen oder
einen Institutionsnamen, der mit der im Voraus eingestellten Bedingung übereinstimmt.
-
In
einem Schritt S604 geht die Steuerung zur der Verarbeitung in einem
Schritt S613 über,
wenn das Ergebnis der Erkennung in dem Schritt S603 der Institutionsname
ist, und das Ergebnis wird durch die Ergebnisanzeigeeinrichtung 110 angezeigt,
die Text-to-Speech-(TTS)
Ausgabe wird ausgegeben, und der Suchvorgang wird durch die Sucheinrichtung 111 durchgeführt. Wenn
in dem Schritt S604 das Ergebnis der Erkennung kein Institutionsname
ist, geht die Steuerung zu der Verarbeitung in einem Schritt S605 über und
ein Unterkategorienamenwörterbuch in
der Kategorie des Ergebnisses der Erkennung wird in den RAM 103 geladen.
In einem Schritt S606 wird ein Erkennungsprozess unter Verwendung
des Wörterbuches
ausgeführt,
das einem Unterkategorienamen entspricht, der durch den Benutzer
ausgesprochen wurde, und das als ein Objekt der Erkennung in den
RAM 103 geladen wurde.
-
In
einem Schritt S607 wird ein Präfektumamenwörterbuch
in den RAM 103 geladen und in einem Schritt S608 wird ein
Erkennungsprozess unter Verwendung des Wörterbuches durchgeführt, das
einem Präfekturnamen
entspricht, der durch den Benutzer ausgesprochen wurde, und das
als ein Objekt der Erkennung in den RAM 103 geladen wurde.
-
In
einem Schritt S609 wird ein Stadtbezirksnamenwörterbuch einer Präfektur als
das Ergebnis der Erkennung in dem Schritt S608 in den RAM 103 geladen
und in einem Schritt S610 wird ein Erkennungsprozess unter Verwendung
des Wörterbuches durchgeführt, das
einem Stadtbezirksnamen entspricht, der durch den Benutzer ausgesprochen
wurde, und das als ein Objekt der Erkennung in den RAM 103 geladen
wurde.
-
In
einem Schritt S611 werden Institutionsnamenwörterbücher, die mit den Bedingungen übereinstimmen,
die als das Ergebnis der Erkennung in den Schritten S603, S606,
S608 und S610 erhalten werden, in den RAM 103 geladen und
in einem Schritt S612 wird ein Erkennungsprozess unter Verwendung des
Wörterbuches
durchgeführt,
das einem Institutionsnamen entspricht, der durch den Benutzer ausgesprochen
wurde, und das als ein Objekt der Erkennung in den RAM 103 geladen
wurde. Das Ergebnis wird schließlich
in einem Schritt S613 durch die Ergebnisanzeigeeinrichtung 110 angezeigt,
die TTS-Ausgabe
erfolgt und der Suchvorgang wird durch die Sucheinrichtung 111 ausgeführt.
-
7 ist
ein Ablaufdiagramm, das einen Vorgang zum Einhalten von Hierarchien
in dem in 5 dargestellten hierarchischen
Wörterbuchbaum
zeigt. Im Folgenden wird unter Bezugnahme auf den in 5 dargestellten
hierarchischen Wörterbuchbaum und
das in 7 dargestellte Ablaufdiagramm die Funktionsweise
der in 1 dargestellten Ausführungsform der Erfindung beschrieben.
-
Zuerst
stellt ein Benutzer in einem Schritt S700 eine eingrenzende Bedingung über die
Ersteinstellungseinrichtung 108 ein. Da sein zuerst eingestellter
Wert in der Ersteinstellungs-Speichereinrichtung 106 gespeichert
wird, muss dieser Verfahrensschritt lediglich einmal zu einer Ersteinstellungszeit ausgeführt werden,
und es ist nicht erforderlich, diesen Verfahrensschritt bei jeder
Suche auszuführen. In
einem Schritt S701 wird festgestellt, ob die Initiierung der Suche
durch eine Spracheingabetaste und andere ausgelöst wird oder nicht, und wenn
sie nicht ausgelöst
wird, kehrt die Steuerung zu der Verarbeitung in dem Schritt S701
zurück.
Wenn die Initiierung der Suche ausgelöst wird, geht die Steuerung
zu der Verarbeitung in einem Schritt S702 über und das Kategorienamenwörterbuch
und ein oder mehrere Institutionsnamenwörterbücher, die in der Ersteinstellungs-Speichereinrichtung 106 gespeichert
sind und mit der durch den Benutzer im Voraus eingestellten Bedingung übereinstimmen,
werden in den RAM 103 geladen. In einem Schritt S703 wird
ein Erkennungsprozess unter Verwendung des in den RAM 103 geladenen
Wörterbuches
als ein Objekt der Erkennung durchgeführt. Zu diesem Zeitpunkt spricht
der Benutzer einen Kategorienamen oder einen Institutionsnamen aus,
der mit der im Voraus eingestellten Bedingung übereinstimmt.
-
In
einem Schritt S704 geht die Steuerung zu der Verarbeitung in einem
Schritt S716 über,
wenn das Ergebnis der Erkennung in dem Schritt S703 der Institutionsname
ist. Wenn das Ergebnis der Erkennung nicht der Institutionsname
ist, geht die Steuerung zu der Verarbeitung in einem Schritt S705 über, und
das Unterkategorienamenwörterbuch
in der Kategorie des Ergebnisses der Erkennung sowie ein Institutionsnamenwörterbuch,
das sowohl mit der im Voraus eingestellten Bedingung als auch mit
einer Bedingung übereinstimmt,
die als ein Ergebnis der Erkennung in dem Schritt S703 erhalten
wird, werden in den RAM 103 geladen, und in dem Schritt
S706 wird ein Erkennungsprozess unter Verwendung des Wörterbuches
durchgeführt,
das dem Unterkategorienamen oder dem Institutionsnamen entspricht,
der durch den Benutzer ausgesprochen wurde, und das als ein Objekt
der Erkennung in den RAM 103 geladen wurde.
-
In
einem Schritt S707 geht die Steuerung zu der Verarbeitung in dem
Schritt S716 über,
wenn das Ergebnis der Erkennung in dem Schritt S706 der Institutionsname
ist. Wenn das Ergebnis der Erkennung nicht der Institutionsname
ist, geht die Steuerung zu der Verarbeitung in einem Schritt S708 über, das
Präfektumamenwörterbuch
sowie ein Institutionsnamenwörterbuch,
das mit der im Voraus eingestellten Bedingung und sämtlichen
Bedingungen übereinstimmt,
die als ein Ergebnis der Erkennung in den Schritten S703 und S706
erhalten werden, werden in den RAM 103 geladen, und in
einem Schritt S709 wird ein Erkennungsprozess unter Verwendung des
Wörterbuchs
durchgeführt,
das einem Präfekturnamen
oder einem Institutionsnamen entspricht, der durch den Benutzer
ausgesprochen wurde, und das in den RAM 103 als ein Objekt
der Erkennung geladen wurde.
-
In
einem Schritt S710 geht die Steuerung zu der Verarbeitung in dem
Schritt S716 über,
wenn das Ergebnis der Erkennung in dem Schritt S709 der Institutionsname
ist. Wenn das Ergebnis der Erkennung nicht der Institutionsname
ist, geht die Steuerung zu der Verarbeitung in einem Schritt S711 über, und
ein Stadtbezirksnamenwörterbuch
einer Präfektur
als ein Ergebnis der Erkennung in dem Schritt S709 sowie ein Institutionsnamenwörterbuch,
das mit der im Voraus eingestellten Bedingung und sämtlichen
Bedin gungen übereinstimmt,
die als ein Ergebnis der Erkennung in den Schritten S703, S706 und
S709 erhalten werden, werden in den RAM 103 geladen, und
in einem Schritt S712 wird ein Erkennungsprozess unter Verwendung
des Wörterbuchs durchgeführt, das
einem Stadtbezirksnamen oder einem Institutionsnamen entspricht,
der durch den Benutzer ausgesprochen wurde, und das als ein Objekt der
Erkennung in den RAM 103 geladen wurde.
-
In
einem Schritt S713 geht die Steuerung zu der Verarbeitung in den
Schritt S716 über,
wenn das Ergebnis der Erkennung in dem Schritt S712 der Institutionsname
ist. Wenn das Ergebnis der Erkennung nicht der Institutionsname
ist, geht die Steuerung zu der Verarbeitung in einem Schritt S714 über. Ein
Institutionsnamenwörterbuch,
das mit sämtlichen Bedingungen übereinstimmt,
die als ein Ergebnis der Erkennung in den Schritten S703, S706,
S709 und S712 erhalten werden, wird in den RAM 103 geladen, und
in einem Schritt S715 wird ein Erkennungsprozess unter Verwendung
des Wörterbuchs
durchgeführt,
das einem Institutionsnamen entspricht, der durch den Benutzer ausgesprochen
wurde, und das als ein Objekt der Erkennung in den RAM 103 geladen
wurde. In dem Schritt S716 wird schließlich das Ergebnis angezeigt,
es erfolgt die TTS-Ausgabe
und der Suchvorgang wird durchgeführt.
-
8 ist
ein Ablaufdiagramm, das die detaillierten Verfahrensschritte eines
in den 6 und 7 (in den Schritten S603, S606,
S608, S610, S612, S703, S706, S709, S712 und S715) dargestellten
Erkennungsprozesses zeigt.
-
Im
Folgenden wird unter Bezugnahme auf das in 8 dargestellte
Ablaufdiagramm ein Erkennungsprozess beschrieben, der in jedem der
vorangehend erwähnten
Schritte ausgeführt
wird. Zunächst
wird in einem Schritt S800 erfasst, ob die Eingabe von dem Mikrofon 100 Sprache
enthält
oder nicht. Als ein Verfahren zum Erfassen gibt es ein Verfahren,
bei dem eine Spracheingabe erfasst wird, wenn die Stärke einen
bestimmten Schwellenwert übersteigt.
Das Erfassen von Sprache wird als die Initiierung der Spracheingabe
beurteilt, in einem Schritt S801 wird der Kennwert durch die Kennwert-Berechnungseinrichtung 101 berechnet,
und in einem Schritt S802 wird die Ähnlichkeit zwischen jedem Wort,
das in einem in den RAM 103 geladenen Erkennungswörterbuch
enthalten ist, und einem Kennwert, der basierend auf der Spracheingabe
berechnet wird, berechnet. In einem Schritt S803 kehrt die Steuerung
zu der Verarbeitung in dem Schritt S801 zurück, wenn die Spracheingabe
nicht beendet ist. Wenn die Spracheingabe beendet ist, wird ein
Wort, das die größte Ähnlichkeit
hat, als ein Ergebnis der Erkennung in einem Schritt S804 ausgegeben.
-
Schließlich werden
für ein
Verfahren zur Ersteinstellung einer eingrenzenden Bedingung zwei Fälle beschrieben,
wobei in einem Fall eine Fernbedienung und in dem anderen Fall die
Spracherkennung verwendet wird.
-
In
dem Fall, in dem eine Fernbedienung verwendet wird, wird zunächst ein
Element für
die Änderung
der Einstellung einer eingrenzenden Bedingung auf einem Menübildschirm
ausgewählt,
der durch Betätigen
einer Menütaste
auf der Fernbedienung angezeigt wird. Auf diese Weise wird ein in 9 dargestellter
Bildschirm für
die Änderung
der Einstellung einer eingrenzenden Bedingung angezeigt. Auf dem Bildschirm
für die Änderung
der Einstellung einer eingrenzenden Bedingung ist eine Gruppe von
Institutionsnamenwörterbüchern, die
entsprechend einer eingrenzenden Bedingung (einem Präfekturnamen oder
einem Kategorienamen) klassifiziert sind, in einer Matrix verteilt
und angeordnet. In diesem Fall wird ein Cursor auf einen Bedingungsnamen
bewegt, dessen Einstellung durch einen Joystick der Fernbedienung
geändert
werden soll.
-
Beispielsweise
wird eine erwünschte
Präfektur
in einer Liste von Präfekturen
durch Bewegen des Joysticks in einer Querrichtung, wie in 10 dargestellt,
ausgewählt.
Wenn eine Festlegungstaste auf der Fernbedienung gedrückt wird,
wenn beispielsweise die Präfektur
Saitama ausgewählt
ist, wird eine Bedingung an der Position des Cursors (Institutionsnamenwörterbücher in
sämtlichen
Kategorien, die in der Präfektur
Saitama existieren) zu einer eingrenzenden Bedingung.
-
Des
Weiteren wird eine erwünschte
Kategorie in einer Liste von Kategorienamen durch Bewegen des Joysticks
in einer Längsrichtung,
wie in 11 dargestellt, ausgewählt. Wenn
die Festlegungstaste betätigt
wird, wenn beispielsweise Krankenhäuser ausgewählt sind, wird eine Bedingung
an der Position des Cursors (Krankenhausnamenwörterbücher aus dem ganzen Land) zu
einer eingrenzenden Bedingung. Darüber hinaus wird, wenn Krankenhäuser, wie
in 11 dargestellt, ausgewählt werden, nachdem die Präfektur Saitama
auf einem in 10 dargestellten Anzeigebildschirm
ausgewählt wurde,
ein Krankenhausnamenwörterbuch
für die Präfektur Saitama
eingegrenzt, wie in 12 dargestellt.
-
In
diesem Fall werden die Namenswörterbücher angezeigt,
die im Fall von „Präfektur Saitama" und „Krankenhaus" ausgewählt und
als ein Ersteinstellungswert eingestellt werden, es ist jedoch nicht erforderlich,
sowohl einen Präfekturnamen
als auch einen Krankenhausnamen einzustellen, und jeder Name kann
unabhängig
voneinander eingestellt werden. Auch in dem Fall, in dem im Voraus
eingestellt wird, dass eine Bedingung an einer Position, an der die
Festlegungstaste betätigt
wird, zu einer eingrenzenden Bedingung wird, muss die Einstellung
freigegeben werden. Das heißt,
wenn die vorangehend erwähnte
Bedingung zu einer eingrenzenden Bedingung wird, wird die Einstellung
freigegeben und in dem Fall, in dem die vorangehend erwähnte Bedingung
keine eingrenzende Bedingung wird, wird die Einstellung so geändert, dass
die Bedingung zu einer eingrenzenden Bedingung wird. Vorangehend
wird der Fall beschrieben, in dem eine eingrenzende Bedingung durch
den Joystick ausgewählt
wird, anstelle des Joysticks kann jedoch darüber hinaus auch ein Touch Panel
verwendet werden.
-
Im
Folgenden wird ein Fall beschrieben, in dem die Ersteinstellung
einer eingrenzenden Bedingung durch Spracherkennung durchgeführt wird.
Ein Vorgang zum Ändern
der eingrenzenden Bedingung durch die Bedeutung eines Wortes, wie
beispielsweise die Änderung
der Einstellung, wird ebenfalls zu einem in Warteschlange angeordneten
Wörterbuch
auf einer ersten Hierarchieebene der Spracherkennung hinzugefügt, und
wenn das Wort erkannt wird, beginnt der Vorgang zum Ändern der
Einstellung der eingrenzenden Bedingung. Bei dem Vorgang zum Ändern der
Einstellung wird zunächst
ein Spracherkennungsprozess unter Verwendung eines Wörterbuches
durchgeführt,
in dem die eingrenzenden Bedingungsnamen als in Warteschlange angeordnete Wörter enthalten
sind, und wenn eine erkannte Bedingung aktiviert ist, wird diese
deaktiviert und wenn sie deaktiviert ist, wird die Einstellung so
geändert, dass
die Bedingung aktiviert wird.
-
Anschließend wird
bei dem Vorgang zum Ändern
der Einstellung ein Spracherkennungsprozess unter Verwendung eines
Wörterbuches
durchgeführt, das
ein in Warteschlange angeordnetes Wort enthält, das zum Aktivieren oder
Deaktivieren nach jedem eingrenzenden Bedingungsnamen hinzugefügt wird, und
wenn das erkannte Wort das Aktivieren eines Bedingungsnamens beinhaltet,
wird die Bedingung aktiviert, und wenn das erkannte Wort das Deaktivieren
eines Bedingungsnamens beinhaltet, wird die Bedingung deaktiviert.
Bei dem vorangehend beschriebenen Vorgang zum Ändern der Einstellung kann
ebenfalls eine kontinuierliche Erkennung unter Verwendung von Syntax
(ein Bedingungsname) + (ein Wort, das das Aktivieren oder das Deaktivieren spezifiziert)
durchgeführt
werden.
-
Wie
vorangehend beschrieben, werden in Übereinstimmung mit der Erfindung
die Bedienbarkeit sowie die Reaktionsfähigkeit jeweils durch das Durchführen eines
Erkennungsprozesses unter Verwendung eines Wörterbuches, das entsprechend wenigstens
einer eingrenzenden Bedingung klassifiziert ist, die durch einen
Benutzer im Voraus eingestellt wird, zusätzlich zu einem Wörterbuch
für eine eingrenzende
Bedingung auf der höchsten
Hierarchieebene als Objekte der Erkennung verbessert.
-
Wie
vorangehend beschrieben, wird das Spracherkennungsverfahren in Übereinstimmung
mit der Erfindung für
die Spracherkennungseinheit mit einer Vielzahl von Spracherkennungswörterbüchern mit
hierarchischer Struktur verwendet, wobei die Bedienbarkeit und die
Reaktionsfähigkeit
durch das Durchführen
eines Spracherkennungsprozesses unter Verwendung eines Wörterbuches,
das entsprechend wenigstens einer eingrenzenden Bedingung klassifiziert
ist, die durch einen Benutzer im Voraus eingestellt wird, zusammen
mit dem Wörterbuch
für eine
eingrenzende Bedingung auf der höchsten
Hierarchieebene als Objekte der Erkennung verbessert wird, und der
Name einer Zielinstitution, der mit der folgenden eingrenzenden
Bedingung übereinstimmt, kann
durch eine Spracheingabe gesucht werden, indem eine durch einen
Benutzer häufig
verwendete eingrenzende Bedingung, wie beispielsweise ein Kategorie-
und ein Gebietsname, im Voraus eingestellt wird, ohne die mühsame Prozedur
durchführen
zu müssen,
bei der die hierarchische Struktur sequenziell eingehalten und eine
eingrenzende Bedingung festgelegt wird.
-
Darüber hinaus
kann in Übereinstimmung mit
der Erfindung in dem Fall, in dem ein Institutionsname gesucht wird,
der nicht mit einer im Voraus eingestellten eingrenzenden Bedingung übereinstimmt, auch
die herkömmliche
Prozedur verwendet werden, bei der eine eingrenzende Bedingung sequenziell festgelegt
wird. Des Weiteren kann in dem Fall, in dem ein Institutionsname
gesucht wird, der mit einer im Voraus eingestellten ein grenzenden
Bedingung übereinstimmt,
der Verarbeitungsschritt für
das Erkennen des Institutionsnamens auch unter Verwendung eines
Wörterbuches
durchgeführt
werden, das schließlich
in Übereinstimmung
mit der eingrenzenden Bedingung eingestellt wird, nachdem eine eingrenzende
Bedingung sequenziell entsprechend der herkömmlichen Vorgehensweise festgelegt
wurde.