DE60126882T2 - Hierarchisierte Wörterbücher für die Spracherkennung - Google Patents

Hierarchisierte Wörterbücher für die Spracherkennung Download PDF

Info

Publication number
DE60126882T2
DE60126882T2 DE60126882T DE60126882T DE60126882T2 DE 60126882 T2 DE60126882 T2 DE 60126882T2 DE 60126882 T DE60126882 T DE 60126882T DE 60126882 T DE60126882 T DE 60126882T DE 60126882 T2 DE60126882 T2 DE 60126882T2
Authority
DE
Germany
Prior art keywords
dictionary
speech recognition
name
recognition
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60126882T
Other languages
English (en)
Other versions
DE60126882D1 (de
Inventor
Hiroshi Kawagoe-shi Saito
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Corp filed Critical Pioneer Corp
Application granted granted Critical
Publication of DE60126882D1 publication Critical patent/DE60126882D1/de
Publication of DE60126882T2 publication Critical patent/DE60126882T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Navigation (AREA)
  • Document Processing Apparatus (AREA)

Description

  • Die vorliegende Erfindung betrifft eine Spracherkennungseinheit, deren Bedienbarkeit und Reaktionsfähigkeit verbessert werden, sowie ein diesbezügliches Verfahren.
  • Bisher erfolgt in dem Fall, in dem der Name einer Institution unter Verwendung einer Spracherkennungseinheit gesucht wird, die Sprachausgabe des Namens schließlich nach dem Eingrenzen von in Warteschlange angeordneten Wörtern basierend auf einem Kategorie- und einem Ortsnamen, wie in einem in 13 dargestellten Verfahren zum Eingrenzen gezeigt wird, um das Verhältnis von Erkennung und Restriktion, wie beispielsweise die nutzbare Speichergröße, sicherzustellen. Spracherkennung bedeutet in diesem Fall Spracherkennung für die Bedienung durch Sprache, wobei beispielsweise ein Fahrzeugnavigationssystem die Spracheingabe des Benutzers über ein Mikrofon erkennt und die Verarbeitung für die Bedienung unter Verwendung der erkannten Sprache durchführt, und bedeutet insbesondere Spracherkennung, bei der die Bedienung zum Auswählen einer gewünschten Institution aus einer beträchtlichen Anzahl von Institutionskandidaten durch Sprache durchgeführt wird. In einem ersten Schritt wird ein Steuerbefehlswörterbuch zum Ausführen einer Fahrzeugnavigation in dem System eingestellt, und ein Benutzer teilt dem System seine/ihre Absicht mit, einen Weg zu einem Zielort durch Eingeben eines Sprachbefehls „Einstellen eines Zielortes" einzustellen.
  • Das System muss einen konkreten Ort, der ein Zielort sein soll, suchen, da jedoch die Anzahl der Institutionen enorm groß ist, kann der konkrete Ort nicht mittels einer einzigen Spracherkennung spezifiziert werden. Deshalb wird zum Reduzieren der Anzahl der Institutionen, die Suchobjekte sind, das Eingrenzen anschließend basierend auf einem Kategorienamen durchgeführt. Zum Eingrenzen auf Basis eines Kategorienamens wird, nachdem ein Kategorienamenwörterbuch als ein Erkennungswörterbuch ausgewählt wurde, ein Benutzer zunächst durch 1) „Sagen Sie bitte einen Kategorienamen" aufgefordert, einen Kategorienamen zu nennen. Wenn der Benutzer 2) „Bildungseinrichtung" sagt, erkennt die Spracherkennungseinrichtung die Spracheingabe. Das System fordert den Benutzer auf, eine weitere detaillierte Unterkategorie der Kategorie der Bildungsinstitution zu spezifizieren, und nachdem ein Unterkategorienamenwörterbuch als das Erkennungswörterbuch ausgewählt ist, wird der Benutzer durch 3) „Nächster Kategorie name bitte" aufgefordert, einen Unterkategorienamen zu nennen. Wenn der Benutzer 4) „High School" sagt, erkennt die Spracherkennungseinheit die Spracheingabe.
  • Wenn die Unterkategorie festgelegt ist, sagt das System 5) „Name der Präfektur bitte", nachdem ein Präfekturnamenwörterbuch als das Erkennungswörterbuch ausgewählt ist, um anschließend auf Basis eines Gebietes einzugrenzen, und fordert den Benutzer auf, ein Gebiet in Einheiten eines Präfekturnamens einzugrenzen. Wenn der Benutzer 6) Tokio sagt, erkennt die Spracherkennungseinheit die Spracheingabe als Tokio. In dem Fall, in dem die Unterkategorie eine High School und der Präfekturname Tokio ist, wird in dem System im Voraus festgelegt, einen Benutzer aufzufordern, einen Namen eines Stadtbezirks zu spezifizieren, und nachdem ein Stadtbezirksnamenwörterbuch als das Erkennungswörterbuch ausgewählt ist, fordert das System den Benutzer mit 7) „Name des Stadtbezirks bitte" auf, den Namen eines Stadtbezirkes zu sagen. Wenn der Benutzer 8) Shibuya Ward sagt, erkennt die Spracherkennungseinheit die Spracheingabe. Da die Anzahl der Institutionen durch die vorangehende Spezifizierung weit genug eingegrenzt ist, beginnt die Suche des Institutionsnamens.
  • Nachdem das System ein Wörterbuch für High Schools im Stadtbezirk Shibuya Ward von Tokio als das Erkennungswörterbuch ausgewählt hat, fordert es den Benutzer mit 9) „Der Name bitte" auf, einen Institutionsnamen zu sagen. Wenn der Benutzer „Schule So-und-So" sagt, erkennt die Spracherkennungseinheit die Spracheingabe und stellt die Schule So-und-So als einen Zielort ein.
  • Wie oben beschrieben, muss eine mühsame Prozedur ausgeführt werden, bei der die hierarchische Struktur von Spracherkennungswörterbüchern sequenziell eingehalten wird und sämtliche Bedingungen zum Eingrenzen festgelegt werden. Es existiert ein Verfahren zum Erstellen sämtlicher Institutionsnamen, so dass diese schließlich auf der höchsten Hierarchieebene zu suchen sind, um das Ausführen der oben erwähnten mühsamen Prozedur zu vermeiden.
  • In diesem Fall ist jedoch ein Speicher mit einer beträchtlichen Kapazität erforderlich und es besteht ebenfalls das Problem, dass der Erkennungsgrad verschlechtert wird und das Ergebnis einer Sprachausgabe nicht zufriedenstellend ist. Wenn beispielsweise ein bestimmter Benutzer kein Golf spielt, er/sie keine Golflinks sucht, kann jedoch, wenn sämtliche Institutionsnamen einschließlich der Kategorie, die den Benutzer nicht interessiert (in diesem Fall Golflinks), erstellt werden, ein bestimmter Institutionsname fälschlicherweise als der Name eines Golflinks erkannt werden. Dadurch wird der Benutzer gestresst. Weitere Beispiele von Systemen, die dem Stand der Technik entsprechen, werden in den Dokumenten EP-A-0935123, US-A-6112174 und US-A-6108631 offenbart.
  • Die Erfindung wird hinsichtlich der vorangehend erwähnten Situation gemacht, und es ist eine Aufgabe der Erfindung, eine Spracherkennungseinheit und ein diesbezügliches Verfahren bereitzustellen, deren Bedienbarkeit und deren Reaktionsfähigkeit jeweils durch das Durchführen eines Erkennungsprozesses unter Verwendung eines Wörterbuches, das wenigstens entsprechend einer eingrenzenden Bedingung klassifiziert ist, die durch einen Benutzer im Voraus eingestellt wird, zusätzlich zu einem Wörterbuch zum Eingrenzen auf der höchsten Hierarchieebene als Objekte der Erkennung verbessert werden.
  • Des Weiteren ist es eine Aufgabe der Erfindung, eine Spracherkennungseinheit und ein diesbezügliches Verfahren bereitzustellen, wobei ein Institutionsname, der mit der folgenden eingrenzenden Bedingung übereinstimmt, durch eine Spracheingabe gesucht werden kann, indem eine häufig von dem Benutzer verwendete eingrenzende Bedingung, wie beispielsweise ein Kategorie- und ein Gebietsname, im Voraus eingestellt wird, ohne die mühsame Prozedur, bei der die hierarchische Struktur sequenziell eingehalten und eine eingrenzende Bedingung festgelegt wird, durchführen zu müssen und des Weiteren wird, da ein Wörterbuch für eine eingrenzende Bedingung gleichzeitig auch ein Objekt der Erkennung ist, die Suche entsprechend einer herkömmlichen Prozedur aktiviert, bei der die hierarchische Struktur sequenziell eingehalten und eine eingrenzende Bedingung festgelegt wird, selbst wenn ein Institutionsname, der nicht mit einer im Voraus eingestellten eingrenzenden Bedingung übereinstimmt, gesucht werden soll.
  • Um die vorangehend genannten Aufgaben zu lösen, stellt die vorliegende Erfindung eine Spracherkennungsvorrichtung in Übereinstimmung mit dem Patentanspruch 1 bereit.
  • Die bestimmte Ebene der Hierarchie ist vorzugsweise die höchste Ebene der Hierarchie.
  • Die bestimmte Ebene der Hierarchie ist vorzugsweise eine Ebene, die niedriger ist als die höchste Ebene der Hierarchie.
  • Die Extrahiereinrichtung extrahiert vorzugsweise in Reaktion auf die Erkennung von weiteren Sprachbefehlen durch die Erkennungseinrichtung als die Liste von in Warteschlange angeordneten Wörtern:
    Wörterbücher niedrigerer Ebene, die mit ausgewählten in Warteschlange angeordneten Wörtern verbunden sind, von denen jedes auf einer hierarchischen Ebene angeordnet ist, die mit jedem Erkennungsprozess iterativ niedriger ist.
  • Die Spracherkennungswörterbücher umfassen vorzugsweise:
    ein Klassifizierungswörterbuch zum Speichern von Klassifizierungsnamen von Institutionen; und
    ein Institutionswörterbuch zum Speichern von Namen von Institutionen, die zu einem Institutionstyp gehören.
  • Die Spracherkennungswörterbücher umfassen vorzugsweise:
    ein Gebietswörterbuch zum Speichern von Gebietsnamen; und
    ein Institutionswörterbuch zum Speichern der Namen von Institutionen, die in einem Gebiet vorhanden sind.
  • Wenn ein Benutzer ein erwünschtes Wörterbuch auswählt, werden die Inhalte dieses Wörterbuchs vorzugsweise in der Speichereinrichtung gespeichert.
  • Die vorliegende Erfindung stellt außerdem ein Spracherkennungsverfahren in Übereinstimmung mit dem Patentanspruch 8 bereit.
  • Die bestimmte Ebene ist vorzugsweise eine Ebene, die niedriger als die höchste Ebene in der Hierarchie ist.
  • Die Wörterbücher, die entsprechend wenigstens einer eingrenzenden Bedingung klassifiziert sind, die durch einen Benutzer im Voraus eingestellt wird, sind vorzugsweise Wörterbücher, deren Nutzungshäufigkeit hoch ist.
  • In den Zeichnungen ist
  • 1 ein Blockdiagramm, das eine Ausführungsform einer Spracherkennungseinheit in Übereinstimmung mit der Erfindung darstellt.
  • 2 ist eine erklärende Zeichnung zum Erklären eines Spracherkennungsverfahrens in Übereinstimmung mit der Erfindung und zeigt ein Beispiel eines hierarchischen Wörterbuchbaumes.
  • 3 ist eine erklärende Zeichnung zum Erklären des Spracherkennungsverfahrens in Übereinstimmung mit der Erfindung und zeigt ein Beispiel eines hierarchischen Wörterbuchbaumes.
  • 4 ist eine erklärende Zeichnung zum Erklären des Spracherkennungsverfahrens in Übereinstimmung mit der Erfindung und zeigt ein Beispiel eines hierarchischen Wörterbuchbaumes.
  • 5 ist eine erklärende Zeichnung zum Erklären des Spracherkennungsverfahrens in Übereinstimmung mit der Erfindung und zeigt ein Beispiel eines hierarchischen Wörterbuchbaumes.
  • 6 ist ein Ablaufdiagramm, das Verfahrensschritte zum Einhalten der Hierarchien in dem in 3 dargestellten hierarchischen Wörterbuchbaum zeigt.
  • 7 ist ein Ablaufdiagramm, das Verfahrensschritte zum Einhalten der Hierarchien in dem in 5 dargestellten hierarchischen Wörterbuchbaum zeigt.
  • 8 ist ein Ablaufdiagramm, das die detaillierten Verfahrensschritte für einen in den 6 und 7 dargestellten Erkennungsprozess zeigt.
  • 9 zeigt das Ersteinstellungsverfahren einer eingrenzenden Bedingung auf einem Anzeigebildschirm.
  • 10 zeigt das Ersteinstellungsverfahren einer eingrenzenden Bedingung auf einem Anzeigebildschirm.
  • 11 zeigt das Ersteinstellungsverfahren einer eingrenzenden Bedingung auf einem Anzeigebildschirm.
  • 12 zeigt das Ersteinstellungsverfahren einer eingrenzenden Bedingung auf einem Anzeigebildschirm.
  • 13 ist eine erklärende Zeichnung zum Erklären einer Vorgehensweise des herkömmlichen Typs zum Eingrenzen.
  • Im Folgenden werden die bevorzugten Ausführungsformen der Erfindung unter Bezugnahme auf die angehängten Zeichnungen ausführlicher beschrieben.
  • 1 ist ein Blockdiagramm, das eine Ausführungsform einer Spracherkennungseinheit in Übereinstimmung mit der Erfindung darstellt.
  • Wie in 1 dargestellt, nimmt ein Mikrofon 100 die Spracheingabe eines Benutzers auf, wandelt diese in ein elektrisches Signal um und überträgt es zu einer Kennwert-Berechungseinrichtung 101. Die Kennwert-Berechnungseinrichtung 101 wandelt die Puls-Code-Modulations-(PDM) Daten zu einem für die Spracherkennung geeigneten Kennwert um und stellt diesen einer Erkennungseinrichtung 102 bereit. Die Erkennungseinrichtung 102 berechnet die Ähnlichkeit zwischen der eingegebenen Sprache, die zu einem Kennwert umgewandelt wurde, und jedem in Warteschlange angeordneten Wort in einem Erkennungswörterbuch, das in den RAM 103 geladen wurde, und gibt n Teile von in Warteschlange angeordneten Wörtern, die eine größere Ähnlichkeit haben, und jeweilige Ähnlichkeit(-swerte) an eine Steuereinrichtung 107 als ein Ergebnis aus.
  • Eine Erkennungswörterbuch-Speichereinrichtung 105 speichert eine Vielzahl von Wörterbüchern für die Spracherkennung. Die Typen von Wörterbüchern umfassen ein Wör terbuch für eine eingrenzende Bedingung, das für jede eingrenzende Bedingung bereitstellt wird, sowie ein Institutionsnamenwörterbuch, in dem Zielortnamen gespeichert sind, die durch die Kombination von eingrenzenden Bedingungen klassifiziert sind, wie beispielsweise konkrete Namen von Institutionen. Darüber hinaus gibt es für das Wörterbuch entsprechend einer eingrenzenden Bedingung ein Großgebietswörterbuch, in dem Gebietsnamen, die ein großes Gebiet bezeichnen, wie beispielsweise ein Präfekturname, zum Suchen eines Ortes gespeichert sind, ein Kleingebietswörterbuch, das für jede Präfektur bereitgestellt wird und Gebietsnamen speichert, die ein kleines Gebiet bezeichnen, wie beispielsweise einen Stadtbezirksnamen, das zu jeder Präfektur gehört, ein Kategoriewörterbuch zum Speichern wichtiger Klassifizierungskategorienamen der Suchorte, wie beispielsweise den Typ einer Institution, sowie ein Unterkategoriewörterbuch, das für jede wichtige Klassifizierungskategorie bereitgestellt wird und Unterkategorienamen speichert, die zu jeder wichtigen Klassifizierungskategorie gehören.
  • Eine Erkennungswörterbuch-Auswähleinrichtung 104 wählt ein erwünschtes Wörterbuch von den in der Erkennungswörterbuch-Speichereinrichtung 105 gespeicherten Wörterbüchern entsprechend einem Befehl von der Steuereinrichtung 107 aus und lädt es in den RAM 103 als in Warteschlange angeordnete Wörter. Eine Ersteinstellungseinrichtung 108 besteht aus einer Fernbedienungstaste oder einer Sprachbedienungseinrichtung für einen Benutzer, um so auszuwählen, dass er ein erwünschtes Wörterbuch von den Institutionsnamenwörterbüchern entsprechend der Kombination von eingrenzenden Bedingungen als ein Wörterbuch auf der höchsten Ebene der Hierarchie einstellt. Ein durch einen Benutzer mittels der Ersteinstellungseinrichtung 108 eingestelltes Institutionsnamenwörterbuch ist ein Ersteinstellungswörterbuch. Ein Verfahren zum Einstellen wird an späterer Stelle beschrieben. Eine Ersteinstellungs-Speichereinrichtung 106 speichert eine eingrenzende Bedingung, die durch einen Benutzer als eine Ersteinstellung unter Verwendung der Ersteinstellungseinrichtung 108 eingestellt wird, oder das Institutionsnamenwörterbuch, das ein Benutzer als ein Ersteinstellungswörterbuch eingestellt.
  • Eine Sprachsyntheseeinrichtung 109 erzeugt eine synthetische Sprache für eine Bedienungsanweisung und eine Rückmeldung und gibt sie an einen Lautsprecher 112 aus. Eine Sucheinrichtung 111 ist mit Datenbanken von Kartendaten, nicht dargestellt, und weiteren bereitgestellt und sucht den Lageplan, die Adresse, die Telefonnummer und die Dienstinhalte einer Institution, die schließlich durch die Spracherkennung aus einer detaillierten Informationsdatenbank aufgefunden wird. Eine Ergebnisanzeigeeinrichtung 110 ist eine Anzeige zum Anzeigen von detaillierten Informationen, die durch die Sucheinrichtung 111 aufgefunden werden, zusammen mit dem Ergebnis der Erkennung bei der Sprachbedienung, den in Warteschlange angeordneten Wörtern, einer Bedienungsanweisung und einer Rückmeldung.
  • Die Steuereinrichtung 107 steuert jede Komponente entsprechend dem Ergebnis der von jeder der vorangehend erwähnten Komponenten ausgegebenen Ausgabe. Das heißt, die Steuereinrichtung 107 steuert so, dass die Erkennungswörterbuch-Auswähleinrichtung 104 zuerst ein Kategoriewörterbuch aus der Erkennungswörterbuch-Speichereinrichtung 105 extrahiert, wenn die Suche einer Institution durch die Spracherkennung durchgeführt wird, und das extrahierte Kategoriewörterbuch in den RAM 103 als in Warteschlange angeordnete Wörter lädt. Zu diesem Zeitpunkt steuert die Steuereinrichtung 107 so, dass eine eingrenzende Bedingung oder ein Institutionsnamenwörterbuch, die oder das von einem Benutzer im Voraus eingestellt wird, durch Bezugnahme auf die Ersteinstellungs-Speichereinrichtung 106 erkannt wird, und die Erkennungswörterbuch-Auswähleinrichtung 104 extrahiert auf die gleiche Weise die entsprechende eingrenzende Bedingung oder das entsprechende Institutionsnamenwörterbuch aus der Erkennungswörterbuch-Speichereinrichtung 105 und lädt sie oder es in den RAM 103 als in Warteschlange angeordnete Wörter.
  • Die Sprachsyntheseeinrichtung 109 wird angewiesen, eine Bedienungsanweisung, wie beispielsweise „Sagen Sie bitte einen Kategorienamen" zu erzeugen, und diese aus dem Lautsprecher 112 auszugeben.
  • Wenn ein in Warteschlange angeordnetes Wort in einem Kategoriewörterbuch, das in dem RAM 103 als in Warteschlange angeordnete Wörter gespeichert ist, in Sprachform eingegeben wird, wird ein Wörterbuch einer Unterkategorie, das zu einer durch die Spracheingabe dargestellten Kategorie gehört, aus der Erkennungswörterbuch-Speichereinrichtung 105 ausgelesen und in den RAM 103 als das nächste in Warteschlange angeordnete Wort geladen. Wenn ein in Warteschlange angeordnetes Wort in dem Unterkategoriewörterbuch, das in dem RAM 103 als in Warteschlange angeordnete Wörter gespeichert ist, in Sprachform eingegeben wird, wird die durch die Spracheinga be bezeichnete Unterkategorie gespeichert, ein Großgebietswörterbuch, das sich auf die Unterkategorie bezieht, wird aus der Erkennungswörterbuch-Speichereinrichtung 105 ausgelesen und in den RAM 103 als das nächste in Warteschlange angeordnete Wort geladen.
  • Wenn ein in Warteschlange angeordnetes Wort in dem Großgebietswörterbuch, das in dem RAM 103 als in Warteschlange angeordnete Wörter gespeichert ist, in Sprachform eingegeben wird, wird ein Wörterbuch eines Kleingebietes, das zu dem eingegebenen Großgebiet gehört, aus der Erkennungswörterbuch-Speichereinrichtung 105 ausgelesen und in den RAM 103 als das nächste in Warteschlange angeordnete Wort geladen. Wenn ein in Warteschlange angeordnetes Wort in dem Kleingebietswörterbuch, das in dem RAM 103 als in Warteschlange angeordnete Wörter gespeichert ist, in Sprachform eingegeben wird, wird das durch die Spracheingabe bezeichnete Kleingebiet gespeichert, ein Wörterbuch, das einen konkreten Ort, der sich auf das Kleingebiet bezieht, darstellt, wird aus der Erkennungswörterbuch-Speichereinrichtung 105 ausgelesen und in den RAM 103 als das nächste in Warteschlange angeordnete Wort geladen. Wie vorangehend beschrieben, ist ein aus in Warteschlange angeordneten Wörtern bestehendes Wörterbuch hierarchisch in der Erkennungswörterbuch-Speichereinrichtung 105 gespeichert, so dass es sequenziell geändert und hierarchisch verwendet wird. Das heißt, wie in Form eines hierarchischen Wörterbuchbaumes in den später beschriebenen 2 bis 5 dargestellt, dass ein Unterkategoriewörterbuch unter einem Kategoriewörterbuch angeordnet ist, ein Kleingebietswörterbuch unter einem Großgebietswörterbuch angeordnet ist und mehrere Wörterbücher, die einen konkreten Ort anzeigen, auf der niedrigsten Ebene der Kategorie vorhanden sind.
  • Die 2 bis 12 sind erklärende Zeichnungen zum Erklären der Funktionsweise dieser Ausführungsform der Erfindung, die in 1 gezeigt wird, die 2 bis 5 zeigen einen hierarchischen Wörterbuchbaum von Spracherkennungswörterbüchern mit hierarchischer Struktur, die 6 bis 8 sind Ablaufdiagramme, die die Funktionsweise darstellen, und die 9 bis 12 zeigen die Konfiguration eines Bildschirmes für die Ersteinstellung einer eingrenzenden Bedingung.
  • Die Erfindung ist dadurch gekennzeichnet, dass beim Suchen eines Spracherkennungswörterbuches mit einer hierarchischen Struktur ein Erkennungsprozess ebenfalls auf ein oder mehrere Institutionsnamenwörterbücher, die durch den Benutzer im Voraus eingestellt werden (Wörterbücher, die gemäß einer eingrenzenden Bedingung klassifiziert sind und einem Krankenhauswörterbuch sowie einem Unterkunftswörterbuch in dem hierarchischen Wörterbuchbaum, der in 3 dargestellt wird, entsprechen), zusammen mit einem ersten Wörterbuch für eine eingrenzende Bedingung (ein Kategorienamenwörterbuch in dem in 3 dargestellten hierarchischen Wörterbuchbaum) auf einer ersten Hierarchieebene als ein Objekt der Erkennung angewandt wird.
  • Das heißt, wenn ein Benutzer eine eingrenzende Bedingung, wie beispielsweise einen Kategorie- und einen Gebietsnamen, die jeweils häufig von einem Benutzer verwendet werden, im Voraus einstellt, kann ein Institutionsname, der ein Ziel sein soll und mit der mit der eingrenzenden Bedingung übereinstimmt, durch eine Spracheingabe und ohne die mühsame Prozedur gesucht werden, bei der die hierarchische Struktur sequenziell eingehalten und eine eingrenzende Bedingung bestimmt wird. Da ein Wörterbuch für eine eingrenzende Bedingung gleichzeitig auch ein Objekt der Erkennung ist, kann selbst ein Institutionsname, der nicht mit der im Voraus eingestellten eingrenzenden Bedingung übereinstimmt, entsprechend einer herkömmlichen Vergehensweise gesucht werden, bei der die hierarchische Struktur sequenziell eingehalten und eine eingrenzende Bedingung bestimmt wird.
  • Es ist erstrebenswert, dass die Anzahl oder die Größe der Institutionsnamenwörterbücher (Wörterbücher, die entsprechend einer eingrenzenden Bedingung klassifiziert sind), die im Voraus eingestellt werden kann, durch einen Systemdesigner aus dem Blickwinkel des Erkennungsgrades und aufgrund der Beschränkung der nutzbaren Speicherkapazität im Voraus eingestellt wird.
  • Bei einem Erkennungsprozess auf einer ersten Hierarchieebene kann, selbst wenn ein Wort in einem Kategorienamenwörterbuch erkannt wird, ein Wörterbuch (ein Wörterbuch für Unterkünfte in dem in 5 dargestellten hierarchischen Wörterbuchbaum), das mit einer eingrenzenden Bedingung übereinstimmt und ein in Warteschlange angeordnetes auf die erkannte Sprache bezogenes Wort von den in Warteschlange angeordneten Wörtern enthält, die als die in Warteschlange angeordneten Wörter in einem Wörterbuch gespeichert sind, das bei der Erkennung ein Objekt der Erkennung ist, wie beispielsweise ein Institutionsnamenwörterbuch (ein Wörterbuch, das entsprechend der eingrenzen den Bedingung klassifiziert ist und einem Krankenhauswörterbuch sowie einem Unterkunftswörterbuch in dem in 5 dargestellten hierarchischen Wörterbuchbaum entspricht), das durch einen Benutzer im Voraus eingestellt und in dem in 5 gezeigten hierarchischen Wörterbuchbaum dargestellt wird, ebenfalls ein Objekt der Erkennung zusammen mit dem Unterkategorienamenwörterbuch sein. Ein Erkennungsprozess auf einer dritten oder der nachfolgenden Hierarchieebene ist ebenfalls ähnlich.
  • Im Folgenden wird der Erkennungsprozess ausführlich in Bezug auf die Zeichnungen beschrieben. Zunächst sieht die Kommunikation entsprechend dem in 2 dargestellten hierarchischen Wörterbuchbaum zwischen einem System und einem Benutzer folgendermaßen aus.
    • (1) Das System: „Sagen Sie bitte einen Befehl"
    • (2) Der Benutzer: „Krankenhaus"
    • (3) Das System: „Nächste Kategorie bitte"
    • (4) Der Benutzer: „Klinik"
    • (5) Das System: „Präfekturname bitte"
    • (6) Der Benutzer: „Präfektur Saitama"
    • (7) Das System: „Name des Stadtbezirks bitte"
    • (8) Der Benutzer: „Stadt Kawagoe"
    • (9) Das System: „Name bitte"
    • (10) Der Benutzer: „Dr. Kuritas Praxis"
  • Das heißt, dass in diesem Fall die Spracherkennung mit einem Wörterbuch für Krankenhäuser (Kliniken) in der Stadt Kawagoe in der Präfektur Saitama 204 als ein Objekt der Erkennung für die Spracheingabe „Dr. Kuritas Praxis" durchgeführt wird.
  • In der Zwischenzeit sieht die Kommunikation zwischen dem System und einem Benutzer in dem Fall, in dem der Benutzer ein Krankenhaus 302 und Unterkünfte 303, wie in dem hierarchischen Wörterbuchbaum in 3 dargestellt, entsprechend der Charakteristik der Erfindung im Voraus einstellt, und in dem Fall, in dem der Name einer Institution, der mit den eingestellten eingrenzenden Bedingungen übereinstimmt, gesucht wird, folgendermaßen aus.
    • (1) Das System: „Sagen Sie bitte einen Kategorienamen oder einen Institutionsnamen"
    • (2) Der Benutzer: „Dr. Saitos Praxis"
  • In diesem Fall wird die Spracherkennung mit einem Kategorienamenwörterbuch 301, einem Krankenhauswörterbuch 302 sowie einem Unterkunftswörterbuch 303 als ein Objekt der Erkennung für die Spracheingabe „Dr. Saitos Praxis" durchgeführt. Wenn in diesem Fall das Objekt (Dr. Saitos Praxis) in dem Krankenhauswörterbuch 302 enthalten ist, wird der Suchvorgang durch eine Spracheingabe beendet. Das Krankenhauswörterbuch 302 besteht aus einer Reihe von Wörterbüchern (307, 308, ..., 313) mit Namen, die zu sämtlichen Unterkategorien von Krankenhäusern in allen Stadtbezirken sämtlicher Präfekturen gehören, und das Unterkunftswörterbuch 303 ist ebenfalls ähnlich.
  • Die Kommunikation zwischen dem System und einem Benutzer sieht in dem Fall, in dem der Name einer Institution, der nicht mit einer eingestellten eingrenzenden Bedingung übereinstimmt, entsprechend dem in 4 dargestellten hierarchischen Wörterbuchbaum gesucht wird, und in dem Fall, in dem lediglich ein Wörterbuch für eine eingrenzende Bedingung ein Objekt der Erkennung auf einer zweiten oder der nachfolgenden Hierarchieebene ist, folgendermaßen aus.
    • (1) Das System: „Sagen Sie bitte einen Kategorienamen oder einen Institutionsnamen"
    • (2) Der Benutzer: „Bahnhofsname"
    • (3) Das System: „Unterkategoriename bitte"
    • (4) Der Benutzer: „Private Bahnlinie"
    • (5) Das System: „Name der Präfektur bitte"
    • (6) Der Benutzer: „Präfektur Saitama"
    • (7) Das System: „Name des Stadtbezirks bitte"
    • (8) Der Benutzer: „Stadt Kumagaya"
    • (9) Das System: „Name des Bahnhofes bitte"
    • (10) Der Benutzer: „Ishiwara Station"
  • In diesem Fall wird die Spracherkennung mit einem Wörterbuch für Bahnhofsnamen (von privaten Bahnlinien) in der Stadt Kumagaya in der Präfektur Saitama 408 als ein Objekt der Erkennung für die Spracheingabe: „Ishiwara Station" durchgeführt. Da das Objekt (Ishiwara Station) nicht in den in Warteschlange angeordneten Wörterbüchern 400 der ersten Hierarchieebene enthalten ist, sagt der Benutzer einen Kategorienamen, der in einem Kategotienamenwörterbuch 401 auf einer ersten Hierarchieebene enthalten ist und anschließend wird der Suchvorgang entsprechend einem Verfahren des herkömmlichen Typs durchgeführt.
  • Im Folgenden wird in Bezug auf 5 ein Fall beschrieben, in dem der Name einer Institution, der mit einer eingestellten eingrenzenden Bedingung übereinstimmt, gesucht wird, und Institutionsnamenwörterbücher, die mit einer im Voraus eingestellten eingrenzenden Bedingung übereinstimmen, zusammen mit der eingestellten eingrenzenden Bedingung und einer eingrenzenden Bedingung, die in einem Suchprozess festgelegt wird, ein Objekt der Erkennung auf einer zweiten oder der nachfolgenden Hierarchieebene sind. In diesem Fall sieht die Kommunikation zwischen dem System und einem Benutzer folgendermaßen aus.
    • (1) Das System: „Sagen Sie bitte einen Kategorienamen oder einen Institutionsnamen"
    • (2) Der Benutzer: „Unterkünfte"
    • (3) Das System: „Unterkategoriename oder Institutionsname bitte"
    • (4) Der Benutzer: „Kobayashi Hotel"
  • In diesem Fall wird die Spracherkennung mit einem Unterkategorienamenwörterbuch für Unterkünfte 505 und einem Unterkunftswörterbuch 503 als Objekte der Erkennung für die Spracheingabe „Kobayashi Hotel" durchgeführt. Wenn das Objekt („Kobayashi Hotel") in dem Unterkunftswörterbuch 503 enthalten ist, wird der Suchvorgang zu diesem Zeitpunkt beendet.
  • Institutionsnamenwörterbücher, die mit der eingrenzenden Bedingung übereinstimmen, die im Voraus eingestellt wird, zusammen mit dem Wörterbuch für eine eingrenzende Bedingung und der in dem Suchvorgang festgelegten eingrenzenden Bedingung sind Objekte der Erkennung auf der zweiten oder der nachfolgenden Ebene der Hierarchie. Beispielsweise:
    • (1) Das System: „Sagen Sie bitte einen Kategorienamen oder einen Institutionsnamen"
    • (2) Der Benutzer: „Unterkünfte"
    • (3) Das System: „Unterkategoriename oder Institutionsname bitte"
    • (4) Der Benutzer: „Hotel im japanischen Stil"
    • (5) Das System: „Name der Präfektur oder Institutionsname bitte"
    • (6) Der Benutzer: „Kobayashi Hotel"
  • Die Kommunikation zwischen dem System und einem Benutzer sieht in dem Fall, in dem Name einer Institution, der nicht mit einer voreingestellten eingrenzenden Bedingung übereinstimmt, gesucht wird, folgendermaßen aus:
    • (1) Das System: „Sagen Sie bitte einen Kategorienamen oder einen Institutionsnamen"
    • (2) Der Benutzer: „Bahnhofsname"
    • (3) Das System: „Unterkategoriename bitte" (*)
    • (4) Der Benutzer: „JR"
    • (5) Das System: „Name der Präfektur bitte" (*)
    • (6) Der Benutzer: „Präfektur Saitama"
    • (7) Das System: „Name des Stadtbezirkes bitte" (*)
    • (8) Der Benutzer: „Stadt Kumagaya"
    • (9) Das System: „Bahnhofsname bitte"
    • (10) Der Benutzer: „Kumagaya Station"
  • In diesem Fall wird die Spracherkennung mit einem Wörterbuch für Bahnhofsnamen (der JR – Japan Railway) in der Stadt Kumagaya in der Präfektur Saitama als ein Objekt der Erkennung für die Spracheingabe „Kumagaya Station" durchgeführt. Wenn keine Institution, die mit der voreingestellten eingrenzenden Bedingung und sämtlichen in einem Suchvorgang festgelegten eingrenzenden Bedingungen übereinstimmt, vorhanden ist, ist kein Institutionsname in der Führung des Systems bei den Punkten beinhaltet, die in der vorangehend aufgeführten Kommunikation zwischen dem System und dem Benutzer mit dem Zeichen * versehen sind.
  • 6 ist ein Ablaufdiagramm, das einen Vorgang zum Einhalten von Hierarchien in dem in 3 dargestellten hierarchischen Wörterbuchbaum zeigt. Im Folgenden wird unter Bezugnahme auf den in 3 dargestellten hierarchischen Wörterbuchbaum und das in 6 dargestellte Ablaufdiagramm die Funktionsweise der in 1 dargestellten Ausführungsform der Erfindung beschrieben.
  • Zuerst stellt ein Benutzer in einem Schritt S600 eine eingrenzende Bedingung durch die Ersteinstellungseinrichtung 108 ein. Da der zuerst eingestellte Wert in der Ersteinstellungs-Speichereinrichtung 106 gespeichert wird, muss die Verarbeitung nur einmal zu einer Ersteinstellungszeit und nicht bei jeder Suche durchgeführt werden. In einem Schritt S601 wird festgestellt, ob die Initiierung der Suche durch eine Spracheingabetaste und andere ausgelöst wird oder nicht, und wenn sie nicht ausgelöst wird, kehrt die Steuerung zu dem Schritt S601 zurück.
  • In der Zwischenzeit geht die Steuerung, in dem Fall, in dem die Initiierung der Suche ausgelöst wird, zu der Verarbeitung in einem Schritt S602 über und das Kategorienamenwörterbuch 301 und ein oder mehrere Institutionsnamenwörterbücher, die in der Ersteinstellungs-Speichereinrichtung 106 gespeichert sind und mit der durch den Benutzer im Voraus eingestellten Bedingung übereinstimmen, werden in den RAM 103 geladen. In einem Schritt S603 wird ein Erkennungsprozess unter Verwendung der in den RAM 103 geladenen Wörterbücher als Objekte der Erkennung ausgeführt. Zu diesen Zeitpunkt sagt der Benutzer einen Kategorienamen oder einen Institutionsnamen, der mit der im Voraus eingestellten Bedingung übereinstimmt.
  • In einem Schritt S604 geht die Steuerung zur der Verarbeitung in einem Schritt S613 über, wenn das Ergebnis der Erkennung in dem Schritt S603 der Institutionsname ist, und das Ergebnis wird durch die Ergebnisanzeigeeinrichtung 110 angezeigt, die Text-to-Speech-(TTS) Ausgabe wird ausgegeben, und der Suchvorgang wird durch die Sucheinrichtung 111 durchgeführt. Wenn in dem Schritt S604 das Ergebnis der Erkennung kein Institutionsname ist, geht die Steuerung zu der Verarbeitung in einem Schritt S605 über und ein Unterkategorienamenwörterbuch in der Kategorie des Ergebnisses der Erkennung wird in den RAM 103 geladen. In einem Schritt S606 wird ein Erkennungsprozess unter Verwendung des Wörterbuches ausgeführt, das einem Unterkategorienamen entspricht, der durch den Benutzer ausgesprochen wurde, und das als ein Objekt der Erkennung in den RAM 103 geladen wurde.
  • In einem Schritt S607 wird ein Präfektumamenwörterbuch in den RAM 103 geladen und in einem Schritt S608 wird ein Erkennungsprozess unter Verwendung des Wörterbuches durchgeführt, das einem Präfekturnamen entspricht, der durch den Benutzer ausgesprochen wurde, und das als ein Objekt der Erkennung in den RAM 103 geladen wurde.
  • In einem Schritt S609 wird ein Stadtbezirksnamenwörterbuch einer Präfektur als das Ergebnis der Erkennung in dem Schritt S608 in den RAM 103 geladen und in einem Schritt S610 wird ein Erkennungsprozess unter Verwendung des Wörterbuches durchgeführt, das einem Stadtbezirksnamen entspricht, der durch den Benutzer ausgesprochen wurde, und das als ein Objekt der Erkennung in den RAM 103 geladen wurde.
  • In einem Schritt S611 werden Institutionsnamenwörterbücher, die mit den Bedingungen übereinstimmen, die als das Ergebnis der Erkennung in den Schritten S603, S606, S608 und S610 erhalten werden, in den RAM 103 geladen und in einem Schritt S612 wird ein Erkennungsprozess unter Verwendung des Wörterbuches durchgeführt, das einem Institutionsnamen entspricht, der durch den Benutzer ausgesprochen wurde, und das als ein Objekt der Erkennung in den RAM 103 geladen wurde. Das Ergebnis wird schließlich in einem Schritt S613 durch die Ergebnisanzeigeeinrichtung 110 angezeigt, die TTS-Ausgabe erfolgt und der Suchvorgang wird durch die Sucheinrichtung 111 ausgeführt.
  • 7 ist ein Ablaufdiagramm, das einen Vorgang zum Einhalten von Hierarchien in dem in 5 dargestellten hierarchischen Wörterbuchbaum zeigt. Im Folgenden wird unter Bezugnahme auf den in 5 dargestellten hierarchischen Wörterbuchbaum und das in 7 dargestellte Ablaufdiagramm die Funktionsweise der in 1 dargestellten Ausführungsform der Erfindung beschrieben.
  • Zuerst stellt ein Benutzer in einem Schritt S700 eine eingrenzende Bedingung über die Ersteinstellungseinrichtung 108 ein. Da sein zuerst eingestellter Wert in der Ersteinstellungs-Speichereinrichtung 106 gespeichert wird, muss dieser Verfahrensschritt lediglich einmal zu einer Ersteinstellungszeit ausgeführt werden, und es ist nicht erforderlich, diesen Verfahrensschritt bei jeder Suche auszuführen. In einem Schritt S701 wird festgestellt, ob die Initiierung der Suche durch eine Spracheingabetaste und andere ausgelöst wird oder nicht, und wenn sie nicht ausgelöst wird, kehrt die Steuerung zu der Verarbeitung in dem Schritt S701 zurück. Wenn die Initiierung der Suche ausgelöst wird, geht die Steuerung zu der Verarbeitung in einem Schritt S702 über und das Kategorienamenwörterbuch und ein oder mehrere Institutionsnamenwörterbücher, die in der Ersteinstellungs-Speichereinrichtung 106 gespeichert sind und mit der durch den Benutzer im Voraus eingestellten Bedingung übereinstimmen, werden in den RAM 103 geladen. In einem Schritt S703 wird ein Erkennungsprozess unter Verwendung des in den RAM 103 geladenen Wörterbuches als ein Objekt der Erkennung durchgeführt. Zu diesem Zeitpunkt spricht der Benutzer einen Kategorienamen oder einen Institutionsnamen aus, der mit der im Voraus eingestellten Bedingung übereinstimmt.
  • In einem Schritt S704 geht die Steuerung zu der Verarbeitung in einem Schritt S716 über, wenn das Ergebnis der Erkennung in dem Schritt S703 der Institutionsname ist. Wenn das Ergebnis der Erkennung nicht der Institutionsname ist, geht die Steuerung zu der Verarbeitung in einem Schritt S705 über, und das Unterkategorienamenwörterbuch in der Kategorie des Ergebnisses der Erkennung sowie ein Institutionsnamenwörterbuch, das sowohl mit der im Voraus eingestellten Bedingung als auch mit einer Bedingung übereinstimmt, die als ein Ergebnis der Erkennung in dem Schritt S703 erhalten wird, werden in den RAM 103 geladen, und in dem Schritt S706 wird ein Erkennungsprozess unter Verwendung des Wörterbuches durchgeführt, das dem Unterkategorienamen oder dem Institutionsnamen entspricht, der durch den Benutzer ausgesprochen wurde, und das als ein Objekt der Erkennung in den RAM 103 geladen wurde.
  • In einem Schritt S707 geht die Steuerung zu der Verarbeitung in dem Schritt S716 über, wenn das Ergebnis der Erkennung in dem Schritt S706 der Institutionsname ist. Wenn das Ergebnis der Erkennung nicht der Institutionsname ist, geht die Steuerung zu der Verarbeitung in einem Schritt S708 über, das Präfektumamenwörterbuch sowie ein Institutionsnamenwörterbuch, das mit der im Voraus eingestellten Bedingung und sämtlichen Bedingungen übereinstimmt, die als ein Ergebnis der Erkennung in den Schritten S703 und S706 erhalten werden, werden in den RAM 103 geladen, und in einem Schritt S709 wird ein Erkennungsprozess unter Verwendung des Wörterbuchs durchgeführt, das einem Präfekturnamen oder einem Institutionsnamen entspricht, der durch den Benutzer ausgesprochen wurde, und das in den RAM 103 als ein Objekt der Erkennung geladen wurde.
  • In einem Schritt S710 geht die Steuerung zu der Verarbeitung in dem Schritt S716 über, wenn das Ergebnis der Erkennung in dem Schritt S709 der Institutionsname ist. Wenn das Ergebnis der Erkennung nicht der Institutionsname ist, geht die Steuerung zu der Verarbeitung in einem Schritt S711 über, und ein Stadtbezirksnamenwörterbuch einer Präfektur als ein Ergebnis der Erkennung in dem Schritt S709 sowie ein Institutionsnamenwörterbuch, das mit der im Voraus eingestellten Bedingung und sämtlichen Bedin gungen übereinstimmt, die als ein Ergebnis der Erkennung in den Schritten S703, S706 und S709 erhalten werden, werden in den RAM 103 geladen, und in einem Schritt S712 wird ein Erkennungsprozess unter Verwendung des Wörterbuchs durchgeführt, das einem Stadtbezirksnamen oder einem Institutionsnamen entspricht, der durch den Benutzer ausgesprochen wurde, und das als ein Objekt der Erkennung in den RAM 103 geladen wurde.
  • In einem Schritt S713 geht die Steuerung zu der Verarbeitung in den Schritt S716 über, wenn das Ergebnis der Erkennung in dem Schritt S712 der Institutionsname ist. Wenn das Ergebnis der Erkennung nicht der Institutionsname ist, geht die Steuerung zu der Verarbeitung in einem Schritt S714 über. Ein Institutionsnamenwörterbuch, das mit sämtlichen Bedingungen übereinstimmt, die als ein Ergebnis der Erkennung in den Schritten S703, S706, S709 und S712 erhalten werden, wird in den RAM 103 geladen, und in einem Schritt S715 wird ein Erkennungsprozess unter Verwendung des Wörterbuchs durchgeführt, das einem Institutionsnamen entspricht, der durch den Benutzer ausgesprochen wurde, und das als ein Objekt der Erkennung in den RAM 103 geladen wurde. In dem Schritt S716 wird schließlich das Ergebnis angezeigt, es erfolgt die TTS-Ausgabe und der Suchvorgang wird durchgeführt.
  • 8 ist ein Ablaufdiagramm, das die detaillierten Verfahrensschritte eines in den 6 und 7 (in den Schritten S603, S606, S608, S610, S612, S703, S706, S709, S712 und S715) dargestellten Erkennungsprozesses zeigt.
  • Im Folgenden wird unter Bezugnahme auf das in 8 dargestellte Ablaufdiagramm ein Erkennungsprozess beschrieben, der in jedem der vorangehend erwähnten Schritte ausgeführt wird. Zunächst wird in einem Schritt S800 erfasst, ob die Eingabe von dem Mikrofon 100 Sprache enthält oder nicht. Als ein Verfahren zum Erfassen gibt es ein Verfahren, bei dem eine Spracheingabe erfasst wird, wenn die Stärke einen bestimmten Schwellenwert übersteigt. Das Erfassen von Sprache wird als die Initiierung der Spracheingabe beurteilt, in einem Schritt S801 wird der Kennwert durch die Kennwert-Berechnungseinrichtung 101 berechnet, und in einem Schritt S802 wird die Ähnlichkeit zwischen jedem Wort, das in einem in den RAM 103 geladenen Erkennungswörterbuch enthalten ist, und einem Kennwert, der basierend auf der Spracheingabe berechnet wird, berechnet. In einem Schritt S803 kehrt die Steuerung zu der Verarbeitung in dem Schritt S801 zurück, wenn die Spracheingabe nicht beendet ist. Wenn die Spracheingabe beendet ist, wird ein Wort, das die größte Ähnlichkeit hat, als ein Ergebnis der Erkennung in einem Schritt S804 ausgegeben.
  • Schließlich werden für ein Verfahren zur Ersteinstellung einer eingrenzenden Bedingung zwei Fälle beschrieben, wobei in einem Fall eine Fernbedienung und in dem anderen Fall die Spracherkennung verwendet wird.
  • In dem Fall, in dem eine Fernbedienung verwendet wird, wird zunächst ein Element für die Änderung der Einstellung einer eingrenzenden Bedingung auf einem Menübildschirm ausgewählt, der durch Betätigen einer Menütaste auf der Fernbedienung angezeigt wird. Auf diese Weise wird ein in 9 dargestellter Bildschirm für die Änderung der Einstellung einer eingrenzenden Bedingung angezeigt. Auf dem Bildschirm für die Änderung der Einstellung einer eingrenzenden Bedingung ist eine Gruppe von Institutionsnamenwörterbüchern, die entsprechend einer eingrenzenden Bedingung (einem Präfekturnamen oder einem Kategorienamen) klassifiziert sind, in einer Matrix verteilt und angeordnet. In diesem Fall wird ein Cursor auf einen Bedingungsnamen bewegt, dessen Einstellung durch einen Joystick der Fernbedienung geändert werden soll.
  • Beispielsweise wird eine erwünschte Präfektur in einer Liste von Präfekturen durch Bewegen des Joysticks in einer Querrichtung, wie in 10 dargestellt, ausgewählt. Wenn eine Festlegungstaste auf der Fernbedienung gedrückt wird, wenn beispielsweise die Präfektur Saitama ausgewählt ist, wird eine Bedingung an der Position des Cursors (Institutionsnamenwörterbücher in sämtlichen Kategorien, die in der Präfektur Saitama existieren) zu einer eingrenzenden Bedingung.
  • Des Weiteren wird eine erwünschte Kategorie in einer Liste von Kategorienamen durch Bewegen des Joysticks in einer Längsrichtung, wie in 11 dargestellt, ausgewählt. Wenn die Festlegungstaste betätigt wird, wenn beispielsweise Krankenhäuser ausgewählt sind, wird eine Bedingung an der Position des Cursors (Krankenhausnamenwörterbücher aus dem ganzen Land) zu einer eingrenzenden Bedingung. Darüber hinaus wird, wenn Krankenhäuser, wie in 11 dargestellt, ausgewählt werden, nachdem die Präfektur Saitama auf einem in 10 dargestellten Anzeigebildschirm ausgewählt wurde, ein Krankenhausnamenwörterbuch für die Präfektur Saitama eingegrenzt, wie in 12 dargestellt.
  • In diesem Fall werden die Namenswörterbücher angezeigt, die im Fall von „Präfektur Saitama" und „Krankenhaus" ausgewählt und als ein Ersteinstellungswert eingestellt werden, es ist jedoch nicht erforderlich, sowohl einen Präfekturnamen als auch einen Krankenhausnamen einzustellen, und jeder Name kann unabhängig voneinander eingestellt werden. Auch in dem Fall, in dem im Voraus eingestellt wird, dass eine Bedingung an einer Position, an der die Festlegungstaste betätigt wird, zu einer eingrenzenden Bedingung wird, muss die Einstellung freigegeben werden. Das heißt, wenn die vorangehend erwähnte Bedingung zu einer eingrenzenden Bedingung wird, wird die Einstellung freigegeben und in dem Fall, in dem die vorangehend erwähnte Bedingung keine eingrenzende Bedingung wird, wird die Einstellung so geändert, dass die Bedingung zu einer eingrenzenden Bedingung wird. Vorangehend wird der Fall beschrieben, in dem eine eingrenzende Bedingung durch den Joystick ausgewählt wird, anstelle des Joysticks kann jedoch darüber hinaus auch ein Touch Panel verwendet werden.
  • Im Folgenden wird ein Fall beschrieben, in dem die Ersteinstellung einer eingrenzenden Bedingung durch Spracherkennung durchgeführt wird. Ein Vorgang zum Ändern der eingrenzenden Bedingung durch die Bedeutung eines Wortes, wie beispielsweise die Änderung der Einstellung, wird ebenfalls zu einem in Warteschlange angeordneten Wörterbuch auf einer ersten Hierarchieebene der Spracherkennung hinzugefügt, und wenn das Wort erkannt wird, beginnt der Vorgang zum Ändern der Einstellung der eingrenzenden Bedingung. Bei dem Vorgang zum Ändern der Einstellung wird zunächst ein Spracherkennungsprozess unter Verwendung eines Wörterbuches durchgeführt, in dem die eingrenzenden Bedingungsnamen als in Warteschlange angeordnete Wörter enthalten sind, und wenn eine erkannte Bedingung aktiviert ist, wird diese deaktiviert und wenn sie deaktiviert ist, wird die Einstellung so geändert, dass die Bedingung aktiviert wird.
  • Anschließend wird bei dem Vorgang zum Ändern der Einstellung ein Spracherkennungsprozess unter Verwendung eines Wörterbuches durchgeführt, das ein in Warteschlange angeordnetes Wort enthält, das zum Aktivieren oder Deaktivieren nach jedem eingrenzenden Bedingungsnamen hinzugefügt wird, und wenn das erkannte Wort das Aktivieren eines Bedingungsnamens beinhaltet, wird die Bedingung aktiviert, und wenn das erkannte Wort das Deaktivieren eines Bedingungsnamens beinhaltet, wird die Bedingung deaktiviert. Bei dem vorangehend beschriebenen Vorgang zum Ändern der Einstellung kann ebenfalls eine kontinuierliche Erkennung unter Verwendung von Syntax (ein Bedingungsname) + (ein Wort, das das Aktivieren oder das Deaktivieren spezifiziert) durchgeführt werden.
  • Wie vorangehend beschrieben, werden in Übereinstimmung mit der Erfindung die Bedienbarkeit sowie die Reaktionsfähigkeit jeweils durch das Durchführen eines Erkennungsprozesses unter Verwendung eines Wörterbuches, das entsprechend wenigstens einer eingrenzenden Bedingung klassifiziert ist, die durch einen Benutzer im Voraus eingestellt wird, zusätzlich zu einem Wörterbuch für eine eingrenzende Bedingung auf der höchsten Hierarchieebene als Objekte der Erkennung verbessert.
  • Wie vorangehend beschrieben, wird das Spracherkennungsverfahren in Übereinstimmung mit der Erfindung für die Spracherkennungseinheit mit einer Vielzahl von Spracherkennungswörterbüchern mit hierarchischer Struktur verwendet, wobei die Bedienbarkeit und die Reaktionsfähigkeit durch das Durchführen eines Spracherkennungsprozesses unter Verwendung eines Wörterbuches, das entsprechend wenigstens einer eingrenzenden Bedingung klassifiziert ist, die durch einen Benutzer im Voraus eingestellt wird, zusammen mit dem Wörterbuch für eine eingrenzende Bedingung auf der höchsten Hierarchieebene als Objekte der Erkennung verbessert wird, und der Name einer Zielinstitution, der mit der folgenden eingrenzenden Bedingung übereinstimmt, kann durch eine Spracheingabe gesucht werden, indem eine durch einen Benutzer häufig verwendete eingrenzende Bedingung, wie beispielsweise ein Kategorie- und ein Gebietsname, im Voraus eingestellt wird, ohne die mühsame Prozedur durchführen zu müssen, bei der die hierarchische Struktur sequenziell eingehalten und eine eingrenzende Bedingung festgelegt wird.
  • Darüber hinaus kann in Übereinstimmung mit der Erfindung in dem Fall, in dem ein Institutionsname gesucht wird, der nicht mit einer im Voraus eingestellten eingrenzenden Bedingung übereinstimmt, auch die herkömmliche Prozedur verwendet werden, bei der eine eingrenzende Bedingung sequenziell festgelegt wird. Des Weiteren kann in dem Fall, in dem ein Institutionsname gesucht wird, der mit einer im Voraus eingestellten ein grenzenden Bedingung übereinstimmt, der Verarbeitungsschritt für das Erkennen des Institutionsnamens auch unter Verwendung eines Wörterbuches durchgeführt werden, das schließlich in Übereinstimmung mit der eingrenzenden Bedingung eingestellt wird, nachdem eine eingrenzende Bedingung sequenziell entsprechend der herkömmlichen Vorgehensweise festgelegt wurde.

Claims (11)

  1. Spracherkennungsvorrichtung, die umfasst: eine Vielzahl von hierarchisch gespeicherten Spracherkennungswörterbüchern, eine Extrahiereinrichtung zum Extrahieren des Inhalts von bestimmten Wörterbüchern als eine Liste von in Warteschlange angeordneten Wörtern, eine Speichereinrichtung zum vorübergehenden Speichern der extrahierten Liste von in Warteschlange angeordneten Wörtern, eine Erkennungseinrichtung zum Erkennen eines eingegebenen Sprachbefehls durch Vergleichen des eingegebenen Sprachbefehls und der Liste von in Warteschlange angeordneten Wörtern, die in der Speichereinrichtung gespeichert ist, wobei die Spracherkennungsvorrichtung dadurch gekennzeichnet ist, dass sie des Weiteren umfasst: eine Einstelleinrichtung, um einem Benutzer zu ermöglichen, eine eingrenzende Bedingung auf Basis von Informationen, die sich auf ein nichthierarchisches Attribut beziehen, voreinzustellen, wobei die Extrahiereinrichtung eingerichtet ist, um aus der Vielzahl von hierarchisch gespeicherten Spracherkennungswörterbüchern ein Wörterbuch auf einer bestimmten Ebene der Hierarchie und ein Wörterbuch, das durch Bezugnahme auf die eingrenzende Bedingung, die durch den Benutzer als die Liste von in Warteschlange angeordneten Wörtern voreingestellt wurde, erstellt wurde, zu extrahieren, und eingerichtet ist, um sie in der Speichereinrichtung zu speichern, wenn eine Erkennungsprozess beginnt.
  2. Spracherkennungsvorrichtung nach Anspruch 1, wobei die bestimmte Ebene der Hierarchie die höchste Ebene der Hierarchie ist.
  3. Spracherkennungsvorrichtung nach Anspruch 1, wobei die bestimmte Ebene der Hierarchie eine Ebene ist, die niedriger ist als die höchste Ebene der Hierarchie.
  4. Spracherkennungsvorrichtung nach Anspruch 2 oder 3, wobei die Extrahiereinrichtung in Reaktion auf die Erkennung von weiteren Sprachbefehlen durch die Erkennungseinrichtung als die Liste von in Warteschlange angeordneten Wörtern extrahiert: Wörterbücher niedriger Ebene, die mit ausgewählten in Warteschlange angeordneten Wörtern verbunden sind, von denen jedes auf einer hierarchischen Ebene angeordnet ist, die mit jedem Erkennungsprozess iterativ niedriger ist.
  5. Spracherkennungsvorrichtung nach Anspruch 2 oder 3, wobei die Spracherkennungswörterbücher umfassen: ein Klassifizierungswörterbuch zum Speichern von Klassifizierungsnamen von Institutionen und ein Institutionswörterbuch zum Speichern von Namen von Institutionen, die zu einem Institutionstyp gehören.
  6. Spracherkennungsvorrichtung nach Anspruch 2 oder 3, wobei die Spracherkennungswörterbücher umfassen: ein Gebietswörterbuch zum Speichern von Gebietsnamen und ein Institutionswörterbuch zum Speichern der Namen von Institutionen, die in einem Gebiet vorhanden sind.
  7. Spracherkennungsvorrichtung nach einem der Ansprüche 5 oder 6, wobei, wenn ein Benutzer ein erwünschtes Wörterbuch auswählt, die Inhalte dieses Wörterbuches in der Speichereinrichtung gespeichert werden.
  8. Spracherkennungsverfahren für eine Spracherkennungseinheit mit einer Vielzahl von Spracherkennungswörterbüchern, die hierarchisch gespeichert sind, das Verfahren umfasst die folgenden Schritte: Erstellen aus der Vielzahl von Spracherkennungswörterbüchern sowohl eines Wörterbuches auf einer bestimmten Ebene der Hierarchie als auch eines Wörterbuches, das mit einer eingrenzenden Bedingung verbunden ist, die auf Basis von Informationen, die sich auf ein nichthierarchisches Attribut beziehen, durch den Benutzer voreingestellt wird, und Erkennen eines eingegebenen Sprachbefehls durch Verwenden sowohl des Wörterbuches auf einer bestimmten Ebene der Hierarchie als auch des Wörterbuches, das unter Bezugnahme auf die durch den Benutzer voreingestellte eingrenzende Bedingung erstellt wurde.
  9. Verfahren nach Anspruch 8, wobei die bestimmte Ebene die höchste Ebene in der Hierarchie ist.
  10. Verfahren nach Anspruch 8, wobei die bestimmte Ebene der Hierarchie eine Ebene ist, die niedriger ist als die höchste Ebene in der Hierarchie.
  11. Spracherkennungsverfahren nach Anspruch 9 oder 10, wobei die Wörterbücher, die entsprechenden wenigstens einer eingrenzenden Bedingung klassifiziert sind, die durch einen Benutzer im Voraus eingestellt wird, Wörterbücher sind, deren Nutzungshäufigkeit hoch ist.
DE60126882T 2000-09-05 2001-09-03 Hierarchisierte Wörterbücher für die Spracherkennung Expired - Fee Related DE60126882T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000267954 2000-09-05
JP2000267954A JP4116233B2 (ja) 2000-09-05 2000-09-05 音声認識装置ならびにその方法

Publications (2)

Publication Number Publication Date
DE60126882D1 DE60126882D1 (de) 2007-04-12
DE60126882T2 true DE60126882T2 (de) 2007-12-20

Family

ID=18754785

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60126882T Expired - Fee Related DE60126882T2 (de) 2000-09-05 2001-09-03 Hierarchisierte Wörterbücher für die Spracherkennung

Country Status (4)

Country Link
US (1) US20020032568A1 (de)
EP (1) EP1193959B1 (de)
JP (1) JP4116233B2 (de)
DE (1) DE60126882T2 (de)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100650473B1 (ko) * 2002-05-10 2006-11-29 아사히 가세이 가부시키가이샤 음성 인식 장치
JP4171815B2 (ja) * 2002-06-17 2008-10-29 富士通テン株式会社 音声認識装置
EP1411497A1 (de) * 2002-10-18 2004-04-21 Koninklijke KPN N.V. Verfahren und System zum hierarchischen sprachgesteuerten Wählen und Dienstselektion
JP2004226698A (ja) * 2003-01-23 2004-08-12 Yaskawa Electric Corp 音声認識装置
DE10329546A1 (de) * 2003-06-30 2005-01-20 Daimlerchrysler Ag Lexikon gesteuerter Teilsprachmodell-Mechanismus für die automatische Spracherkennung
JP2005148724A (ja) * 2003-10-21 2005-06-09 Zenrin Datacom Co Ltd 音声認識を用いた情報入力を伴う情報処理装置
CN101272384A (zh) * 2004-05-21 2008-09-24 语音移动有限公司 远程访问系统和方法以及其智能代理
US7925506B2 (en) * 2004-10-05 2011-04-12 Inago Corporation Speech recognition accuracy via concept to keyword mapping
JP4498906B2 (ja) * 2004-12-03 2010-07-07 三菱電機株式会社 音声認識装置
DE112006002988T5 (de) * 2005-12-14 2009-01-29 Mitsubishi Electric Corp. Spracherkennungsvorrichtung
JP2007199315A (ja) * 2006-01-25 2007-08-09 Ntt Software Corp コンテンツ提供装置
US8364467B1 (en) * 2006-03-31 2013-01-29 Google Inc. Content-based classification
JP4767754B2 (ja) 2006-05-18 2011-09-07 富士通株式会社 音声認識装置および音声認識プログラム
JP2008058409A (ja) * 2006-08-29 2008-03-13 Aisin Aw Co Ltd 音声認識方法及び音声認識装置
US7831431B2 (en) * 2006-10-31 2010-11-09 Honda Motor Co., Ltd. Voice recognition updates via remote broadcast signal
US8195461B2 (en) * 2006-12-15 2012-06-05 Mitsubishi Electric Corporation Voice recognition system
EP1936606B1 (de) 2006-12-21 2011-10-05 Harman Becker Automotive Systems GmbH Mehrstufige Spracherkennung
JP2008197338A (ja) * 2007-02-13 2008-08-28 Denso Corp 音声認識装置
US8219399B2 (en) * 2007-07-11 2012-07-10 Garmin Switzerland Gmbh Automated speech recognition (ASR) tiling
DE102008027958A1 (de) * 2008-03-03 2009-10-08 Navigon Ag Verfahren zum Betrieb eines Navigationssystems
JP2009251934A (ja) * 2008-04-07 2009-10-29 Just Syst Corp 検索装置、検索方法および検索プログラム
US20110099507A1 (en) 2009-10-28 2011-04-28 Google Inc. Displaying a collection of interactive elements that trigger actions directed to an item
US20110131040A1 (en) * 2009-12-01 2011-06-02 Honda Motor Co., Ltd Multi-mode speech recognition
US20110184736A1 (en) * 2010-01-26 2011-07-28 Benjamin Slotznick Automated method of recognizing inputted information items and selecting information items
JP5795068B2 (ja) * 2011-07-27 2015-10-14 三菱電機株式会社 ユーザインタフェース装置、情報処理方法および情報処理プログラム
JP5686903B2 (ja) * 2011-09-13 2015-03-18 三菱電機株式会社 ナビゲーション装置および方法
CN110926493A (zh) * 2019-12-10 2020-03-27 广州小鹏汽车科技有限公司 一种导航方法、装置、车辆及计算机可读存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
JPH10143191A (ja) * 1996-11-13 1998-05-29 Hitachi Ltd 音声認識システム
JP3556425B2 (ja) * 1997-03-18 2004-08-18 株式会社東芝 共有辞書更新方法および辞書サーバ
DE19742054A1 (de) * 1997-09-24 1999-04-01 Philips Patentverwaltung Eingabesystem wenigstens für Orts- und/oder Straßennamen
JPH11224265A (ja) * 1998-02-06 1999-08-17 Pioneer Electron Corp 情報検索装置及び情報検索方法並びに情報検索プログラムを記録した記録媒体
JP3930138B2 (ja) * 1998-02-27 2007-06-13 株式会社東芝 情報解析方法および情報解析プログラムを記憶した媒体
US6363342B2 (en) * 1998-12-18 2002-03-26 Matsushita Electric Industrial Co., Ltd. System for developing word-pronunciation pairs
JP3980791B2 (ja) * 1999-05-03 2007-09-26 パイオニア株式会社 音声認識装置を備えたマンマシンシステム
JP4642953B2 (ja) * 1999-09-09 2011-03-02 クラリオン株式会社 音声検索装置、および、音声認識ナビゲーション装置

Also Published As

Publication number Publication date
JP4116233B2 (ja) 2008-07-09
EP1193959A2 (de) 2002-04-03
EP1193959A3 (de) 2002-12-18
JP2002073075A (ja) 2002-03-12
US20020032568A1 (en) 2002-03-14
EP1193959B1 (de) 2007-02-28
DE60126882D1 (de) 2007-04-12

Similar Documents

Publication Publication Date Title
DE60126882T2 (de) Hierarchisierte Wörterbücher für die Spracherkennung
DE60109105T2 (de) Hierarchisierte Wörterbücher für die Spracherkennung
DE60032193T2 (de) Verfahren und System zur Auswahl erkannter Wörter bei der Korrektur erkannter Sprache
DE60122352T2 (de) Augenverfolgung für kontextabhängige spracherkennung
DE112007002665B4 (de) Spracherkennungssystem
DE60016722T2 (de) Spracherkennung in zwei Durchgängen mit Restriktion des aktiven Vokabulars
DE112014002819B4 (de) System und Verfahren zur Erkennung von Sprache
EP2176858B1 (de) Verfahren zur spracherkennung
DE60109979T2 (de) Navigationssystem
DE69726499T2 (de) Verfahren und Vorrichtung zur Kodierung von Aussprache-Prefix-Bäumen
DE69130747T2 (de) Übersetzungsverfahren und -system zur Übertragung zwischen zwei Sprechern mit unterschiedlicher Sprache
DE19709518C1 (de) Verfahren und Vorrichtung zur Spracheingabe einer Zieladresse in ein Zielführungssystem im Echtzeitbetrieb
DE602004002230T2 (de) Spracherkennungssystem für ein Mobilgerät
DE10012572C2 (de) Vorrichtung und Verfahren zur Spracheingabe eines Zielortes mit Hilfe eines definierten Eingabedialogs in ein Zielführungssystem
DE60110990T2 (de) Hanhabung von gleichlautenden Wörtern in einem Sprachabfragesystem
DE69719702T2 (de) Ein automatisches Auskunftssystem welches ein heuristisches Modell zur Vorhersage der am wahrscheinlichsten erfragten Nummer verwendet
DE102009010275A1 (de) Informationsgewinnungsvorrichtung, Informationsgewinnungssystem und Informationsgewinnungsverfahren
DE112015004198T5 (de) Fahrzeugausrüstungssteuerungsvorrichtung und verfahren zum suchen nach steuerungsinhalt
DE69621404T2 (de) System zum Vorlesen von Text
DE102017219616A1 (de) Sprachsteuerung für ein Fahrzeug
EP3152753B1 (de) Assistenzsystem, das mittels spracheingaben steuerbar ist, mit einer funktionseinrichtung und mehreren spracherkennungsmodulen
DE69326900T2 (de) Spracherkennungssystem
DE102005017484A1 (de) Adress-Datenbank und Adress-Auffindungssystem unter Verwendung dieser
DE102017211447B4 (de) Verfahren zum Auswählen eines Listeneintrags aus einer Auswahlliste einer Bedienvorrichtung mittels Sprachbedienung sowie Bedienvorrichtung
DE102004059372A1 (de) Fahrzeugeinbaueinheit, Sprachkonversationsdokumenterzeugungs-Server und diese verwendendes Navigationssystem

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee