-
TECHNISCHES GEBIET
-
Die vorliegende Erfindung bezieht sich auf ein Dialogsteuersystem und ein Dialogsteuerverfahren zum Erkennen eines Textes, der als eine Eingabe wie beispielsweise eine Spracheingabe oder eine Tastatureingabe von einem Benutzer bereitgestellt wird, und zum Schätzen einer Absicht des Benutzers auf der Grundlage des Ergebnisses der Erkennung, um hierdurch einen Dialog für die Durchführung einer durch den Benutzer beabsichtigten Operation zu führen.
-
STAND DER TECHNIK
-
In den letzten Jahren wurden, um eine Operation einer Vorrichtung durchzuführen, Spracherkennungssysteme verwendet, um beispielsweise eine von einer Person erzeugte Spracheingabe zu empfangen und eine Operation unter Verwendung des Ergebnisses der Erkennung der Spracheingabe durchzuführen. In derartigen Spracherkennungssystemen wurden bisher mögliche Spracherkennungsergebnisse, die von dem System erwartet wurden, und entsprechende Operationen vorher miteinander assoziiert. Wenn ein Spracherkennungsergebnis mit dem Erwarteten übereinstimmt, wird seine entsprechende Operation durchgeführt. Somit muss, um eine Operation durchzuführen, der Benutzer die Ausdrücke, die durch das System erwartet werden, vorher lernen.
-
Als eine Technik, um das Spracherkennungssystem gemäß einer unbeschränkten Sprache durchführbar zu machen, selbst wenn der Benutzer die Ausdrücke zur Erreichung seines Zwecks nicht lernt, ist ein Verfahren offenbart, in welchem eine Vorrichtung eine Absicht der Aussage des Benutzers schätzt, um einen Dialog zur Erreichung eines Zwecks zu führen. Gemäß diesem Verfahren ist es erforderlich, um eine große Verschiedenheit von von dem Benutzer erzeugten gesprochenen Ausdrücken zu stützen, eine große Verschiedenheit von Satzbeispielen für das Lernen für ein Spracherkennungs-Wörterbuch zu verwenden, und auch eine große Verschiedenheit von Satzbeispielen für das Lernen für ein Absichtsschätzungs-Wörterbuch zu verwenden, das für Absichtsschätzungstechniken zum Schätzen der Absicht der Aussage verwendet wird.
-
Jedoch besteht das Problem, dass, obgleich es relativ einfach ist, die Satzbeispiele zu vermehren, das Sprachmodelle, die in dem Spracherkennungs-Wörterbuch zu verwenden sind, automatisch sammelbar sind, es eine große Anstrengung erfordert, Lerndaten für das Absichtsschätzungs-Wörterbuch im Vergleich zu der für das Spracherkennungs-Wörterbuch vorzubereiten, da korrekte Antworten für die Vorbereitung von Lerndaten für das Absichtsschätzungs-Wörterbuch manuell bereitgestellt werden müssen. Auch nimmt die Anzahl von Wörtern im Verlauf der Zeit zu, da der Benutzer in einigen Fällen unter Verwendung neuer Wörter oder Slangwörter spricht. Es besteht das Problem, dass es kostenaufwendig ist, das Absichtsschätzungs-Wörterbuch, das für eine derartig große Verschiedenheit von Wörtern geeignet ist, zu gestalten.
-
Um sich der vorgenannten Probleme anzunehmen, offenbart das Patentdokument 1 als ein Beispiel eine Spracheingabe-Verarbeitungsvorrichtung, die ein Synonymwörterbuch zur Vermehrung annehmbarer Wörter für jedes Satzbeispiel verwendet. Durch Verwendung des Synonymwörterbuchs können, wenn genaue Ergebnisse einer Spracherkennung erhalten werden, die Wörter der genauen Ergebnisse der Spracherkennung, die solchen entsprechen, die in dem Synonymwörterbuch enthalten sind, durch repräsentative Wörter ersetzt werden. Dies ermöglicht, dass ein für eine derartig große Verschiedenheit von Wörtern geeignetes Absichtsschätzungs-Wörterbuch erhalten wird, selbst wenn das Lernen durch nur Satzbeispiele unter Verwendung repräsentativer Wörter durchgeführt wird.
-
ZITATLISTE
-
PATENTLITERATUR
-
- Patentdokument 1: Japanische Patentanmeldungs-Veröffentlichung Nr. 2014-106523 .
-
ZUSAMMENFASSUNG DER ERFINDUNG
-
TECHNISCHES PROBLEM
-
Jedoch erfordert gemäß der im vorgenannten Patentdokument 1 beschriebenen Technik das Aktualisieren des Synonymwörterbuchs ein manuelles Prüfen, und es ist nicht einfach, auf alle Arten von Wörtern zu antworten. Somit besteht das Problem, dass möglicherweise der Fall auftreten kann, dass die Schätzung der Benutzerabsicht versagt, wenn der Benutzer ein Wort verwendet, das in dem Synonymwörterbuch nicht vorhanden ist. Zusätzlich stimmt, wenn die Benutzerabsicht nicht genau geschätzt wird, eine Antwort des Systems nicht mit der Benutzerabsicht überein. Dann besteht das Problem, da das System keine Rückkopplung zu dem Benutzer über den Grund, weshalb die Antwort nicht mit der Benutzerabsicht übereinstimmt, vorsieht, dass der Benutzer den Grund nicht verstehen kann und fortfährt, die in dem Synonymwörterbuch nicht vorhandenen Wörter zu benutzen, wodurch die Durchführung eines Dialogs oder die Durchführung eines wortmäßigen Dialogs versagt.
-
Die Erfindung wurde gemacht, um die vorbeschriebenen Probleme zu lösen, und es ist eine Aufgabe der Erfindung, wenn der Benutzer ein Wort verwendet, das in einem Dialogsteuersystem nicht erkennbar ist, eine Rückkopplung zu dem Benutzer hinsichtlich der Information, die anzeigt, dass das nicht erkennbare Wort nicht verwendet werden kann, vorzusehen, und dem Benutzer eine Antwort zu erteilen, die diesen in die Lage versetzt, zu erkennen, wie die erneute Eingabe aussehen sollte.
-
LÖSUNG DES PROBLEMS
-
Gemäß der Erfindung ist ein Dialogsteuersystem angegeben, welches enthält: eine Textanalysiereinheit, die konfiguriert ist, einen als eine Eingabe in der Form einer natürlichen Sprache durch einen Benutzer bereitgestellten Text zu analysieren; einen Absichtsschätzungsprozessor, der konfiguriert ist, sich auf ein Absichtsschätzungsmodell zu beziehen, in welchem Wörter und entsprechende, anhand der Wörter zu schätzende Benutzerabsichten gespeichert sind, um hierdurch eine Absicht des Benutzers aufgrund der von der Textanalysiereinheit erhaltenen Ergebnisse der Textanalyse zu schätzen; eine Extraktionseinheit für unbekannte Wörter, die konfiguriert ist zum Herausziehen eines Worts, das nicht in dem Absichtsschätzungsmodell gespeichert ist, aus den Textanalyseergebnissen als ein unbekanntes Wort, wenn die Absicht des Benutzers durch den Absichtsschätzungsprozessor nicht eindeutig bestimmt werden kann; und eine Antworttextnachricht-Erzeugungseinheit, die konfiguriert ist, eine Antworttextnachricht zu erzeugen, die das von der Extraktionseinheit für unbekannte Wörter herausgezogene unbekannte Wort enthält.
-
VORTEILHAFTE WIRKUNGEN DER ERFINDUNG
-
Gemäß der Erfindung kann der Benutzer leicht erkennen, welchen Ausdruck der Benutzer erneut korrekt eingeben sollte, wodurch er in der Lage ist, einen reibungslosen Dialog mit dem Dialogsteuersystem zu führen.
-
KURZBESCHREIBUNG DER ZEICHNUNGEN
-
1 ist ein Blockschaltbild, das eine Konfiguration eines Dialogsteuersystems gemäß einem ersten Ausführungsbeispiel zeigt.
-
2 ist ein Diagramm, das ein Beispiel für einen Dialog zwischen einem Benutzer und dem Dialogsteuersystem gemäß dem ersten Ausführungsbeispiel zeigt.
-
3 ist ein Flussdiagramm, das Operationen des Dialogsteuersystems gemäß dem ersten Ausführungsbeispiel zeigt.
-
4 ist ein Diagramm, das ein Beispiel für eine Merkmalsliste zeigt, die morphologische Analyseergebnisse enthält, die durch einen morphologischen Analysierer in dem Dialogsteuersystem gemäß dem ersten Ausführungsbeispiel erhalten wurden.
-
5 ist ein Diagramm, das ein Beispiel für Absichtsschätzungsergebnisse zeigt, die durch einen Absichtsschätzungsprozessor in dem Dialogsteuersystem gemäß dem ersten Ausführungsbeispiel erhalten wurden.
-
6 ist ein Flussdiagramm, das Operationen einer Extraktionsvorrichtung für unbekannte Wörter in dem Dialogsteuersystem gemäß dem ersten Ausführungsbeispiel zeigt.
-
7 ist ein Diagramm, das ein Beispiel für eine Liste von Kandidaten für unbekannte Wörter zeigt, die von der Extraktionsvorrichtung für unbekannte Wörter in dem Dialogsteuersystem gemäß dem ersten Ausführungsbeispiel herausgezogen wurden.
-
8 ist ein Diagramm, das ein Beispiel für Dialog-Szenario-Daten zeigt, die in einem Dialog-Szenario-Datenspeicher in dem Dialogsteuersystem gemäß dem ersten Ausführungsbeispiel gespeichert sind.
-
9 ist ein Blockschaltbild, das eine Konfiguration eines Dialogsteuersystems gemäß einem zweiten Ausführungsbeispiel zeigt.
-
10 ist ein Diagramm, das ein Beispiel für eine häufig erscheinende Wortliste zeigt, die in einem Absichtsschätzmodell-Speicher in dem Dialogsteuersystem gemäß dem zweiten Ausführungsbeispiel gespeichert ist.
-
11 ist ein Diagramm, das ein Beispiel für einen Dialog zwischen einem Benutzer und dem Dialogsteuersystem gemäß dem zweiten Ausführungsbeispiel zeigt.
-
12 ist ein Flussdiagramm, das Operationen des Dialogsteuersystems gemäß dem zweiten Ausführungsbeispiel zeigt.
-
13 ist ein Flussdiagramm, das Operationen einer Extraktionsvorrichtung für unbekannte Wörter in dem Dialogsteuersystem gemäß dem zweiten Ausführungsbeispiel zeigt.
-
14 ist ein Diagramm, das ein Beispiel für das Syntaxanalyseergebnis, das durch einen Syntaxanalysierer in dem Dialogsteuersystem gemäß dem zweiten Ausführungsbeispiel erhalten wurde.
-
15 ist ein Blockschaltbild, das eine Konfiguration eines Dialogsteuersystems gemäß einem dritten Ausführungsbeispiel zeigt.
-
16 ist ein Diagramm, das ein Beispiel für einen Dialog zwischen einem Benutzer und dem Dialogsteuersystem gemäß dem dritten Ausführungsbeispiel zeigt.
-
17 ist ein Flussdiagramm, das Operationen des Dialogsteuersystems gemäß dem dritten Ausführungsbeispiel zeigt.
-
18 ist ein Diagramm, das ein Beispiel für Absichtsschätzungsergebnisse zeigt, die durch einen Absichtsschätzungsprozessor in dem Dialogsteuersystem gemäß dem dritten Ausführungsbeispiel erhalten wurden.
-
19 ist ein Flussdiagramm, das Operationen eines Extraktionsprozessors für bekannte Wörter in dem Dialogsteuersystem gemäß dem dritten Ausführungsbeispiel zeigt.
-
20 ist ein Diagramm, das ein Beispiel für Dialog-Szenario-Daten zeigt, die in einem Dialog-Szenario-Datenspeicher in dem Dialogsteuersystem gemäß dem dritten Ausführungsbeispiel gespeichert sind.
-
BESCHREIBUNG DER AUSFÜHRUNGSBEISPIELE
-
Nachfolgend werden zur detaillierten Erläuterung der Erfindung Ausführungsbeispiele zum Durchführen der Erfindung mit Bezug auf die begleitenden Zeichnungen beschrieben.
-
Erstes Ausführungsbeispiel
-
1 ist ein Konfigurationsdiagramm, das ein Dialogsteuersystem 100 gemäß einem ersten Ausführungsbeispiel zeigt.
-
Das Dialogsteuersystem 100 nach dem ersten Ausführungsbeispiel enthält: eine Spracheingabeeinheit 101, einen Spracherkennungs-Wörterbuch-Speicher 102, eine Spracherkennungsvorrichtung 103, einen Speicher 104 für Wörterbuch für morphologische Analyse, einen morphologischen Analysierer 105 (eine Textanalysiereinheit), einen Absichtsschätzungsmodell-Speicher 106, einen Absichtsschätzungs-Prozessor 107, eine Extraktionsvorrichtung 108 für unbekannte Wörter, einen Dialog-Szenario-Datenspeicher 109, einen Antworttextnachrichten-Generator 110, einen Sprachsynthetisierer 111 und eine Sprachausgabeeinheit 112.
-
Nachfolgend wird als ein Beispiel der Fall beschrieben, in welchem das Dialogsteuersystem 100 bei einem Fahrzeug-Navigationssystem angewendet wird. Es ist festzustellen, dass der anwendbare Bereich nicht auf das Fahrzeug-Navigationssystem beschränkt ist und kann angemessen geändert werden kann. Weiterhin erfolgt die Beschreibung unter Verwendung eines beispielhaften Falls, in welchem der Benutzer einen Dialog mit dem Dialogsteuersystem 100 durch Liefern einer Spracheingabe zu diesem durchführt. Es ist festzustellen, dass Mittel zum Durchführen eines Dialogs mit dem Dialogsteuersystem 100 nicht auf die Spracheingabe beschränkt sind.
-
Die Spracheingabeeinheit 101 empfängt eine Spracheingabe, die zu dem Dialogsteuersystem 100 geführt wird. Der Spracherkennungs-Wörterbuch-Speicher 102 ist ein Bereich, in welchem ein Spracherkennungs-Wörterbuch, das zum Durchführen einer Spracherkennung verwendet wird, gespeichert ist. Mit Bezug auf das in dem Spracherkennungs-Wörterbuch-Speicher 102 gespeicherte Spracherkennungs-Wörterbuch führt die Spracherkennungsvorrichtung 103 eine Spracherkennung der Sprachdaten, die zu der Spracheingabeeinheit 101 geführt wurden, durch, um sie hierdurch in einen Text umzuwandeln. Der Speicher 104 für das Wörterbuch für morphologische Analyse ist ein Bereich, in welchem ein Wörterbuch für morphologische Analyse zum Durchführen einer morphologischen Analyse gespeichert ist. Der morphologische Analysierer 105 teilt den von der Spracherkennung erhaltenen Text in Morpheme. Der Absichtsschätzungsmodell-Speicher 106 ist ein Bereich, in welchem ein Absichtsschätzungsmodell, das zum Schätzen einer Benutzerabsicht (nachfolgend als die Absicht bezeichnet) auf der Grundlage der Morpheme verwendet wird, gespeichert ist. Der Absichtsschätzungs-Prozessor 107 empfängt die Ergebnisse der morphologischen Analyse als eine durch den morphologischen Analysierer 105 erhaltene Eingabe und schätzt die Absicht mit Bezug auf das Absichtsschätzungsmodell. Das Ergebnis der Schätzung wird als eine Liste, die Paare von geschätzten Absichten und ihrer jeweiligen Treffer, die Wahrscheinlichkeiten dieser Absichten anzeigen, darstellen, ausgegeben.
-
Als Nächstes werden die Einzelheiten des Absichtsschätzungs-Prozessors 107 beschrieben.
-
Die von dem Absichtsschätzungs-Prozessor 107 geschätzte Absicht wird beispielsweise in einer solchen Form wie "<Hauptabsicht> [{<Schlitzname> = <Schlitzwert>}, ...]" dargestellt. Beispielsweise kann sie als "Setzen des Bestimmungspunkts [{Einrichtung = <Einrichtungsname>}]" oder "Routenänderung [{Kriterium = normale Straße mit hoher Priorität}]" dargestellt werden. Mit Bezug auf "Bestimmungspunkt setzen [{Einrichtung = <Einrichtungsname>}]" wird ein spezifischer Einrichtungsname in <Einrichtungsname> gesetzt. Beispielsweise wird in dem Fall von <Einrichtungsname> = "Tokyo Skytree" die Absicht, dass der Benutzer "Tokyo Skytree" als einen Bestimmungspunkt wünscht, angezeigt, und in dem Fall von "Routenänderung [{Kriterium = normale Straße mit hoher Priorität}]" wird die Absicht, dass der Benutzer "normale Straße mit hoher Priorität" als das Routensuchkriterium zu setzen wünscht, angezeigt.
-
Weiterhin wird, wenn der Schlitzwert gleich "NULL" ist, die Absicht mit unsicherem Schlitzwert angezeigt. Beispielsweise zeigt die als "Routenänderung [{Kriterium = NULL}]" dargestellte Absicht die Absicht an, dass der Benutzer das Routensuchkriterium zu setzen wünscht, aber das Kriterium noch ungewiss ist.
-
In einem von dem Absichtsschätzungsprozessor 107 durchgeführten Absichtsschätzungsverfahren ist ein Verfahren wie beispielsweise ein Verfahren für maximale Entropie oder dergleichen anwendbar. Spezifisch ergeben sich mit Bezug auf die Sprache "Änderung der Route in eine normale Straße mit hoher Priorität", Inhaltsworte "Route, normale Straße, Präferenz, Änderung" (nachfolgend wird jedes als Merkmal bezeichnet), die aus der morphologischen Analyse herausgezogen wurden, und entsprechende korrekte Absichten von "Routenänderung [{Kriterium = normale Straße mit hoher Priorität}]" werden als Sätze erhalten. Eine große Anzahl von Sätzen von Merkmalen und entsprechenden Absichten werden gesammelt und dann wird geschätzt, dass jede der Absichten wieviel Wahrscheinlichkeit für eine Liste der Merkmale hat, unter Verwendung eines statistischen Verfahrens. Im Folgenden erfolgt die Beschreibung unter der Annahme, dass die Absichtsschätzung, die das Verfahren für maximale Entropie verwendet, durchgeführt wird.
-
Die Extraktionsvorrichtung 108 für unbekannte Wörter zieht aus den von dem morphologischen Analysierer 105 herausgezogenen Merkmalen ein Merkmal heraus, das nicht in dem Absichtsschätzungsmodell des Absichtsschätzungsmodell-Speichers 106 gespeichert ist. Nachfolgend wird das Merkmal, das nicht in dem Absichtsschätzungsmodell enthalten ist, als ein unbekanntes Wort bezeichnet. Der Dialog-Szenario-Datenspeicher 109 ist ein Bereich, in welchem Dialog-Szenario-Daten, die Informationen darüber enthalten, was nachfolgend als Antwort auf die von dem Absichtsschätzungs-Prozessor 107 geschätzte Absicht durchzuführen ist, gespeichert sind. Der Antworttextnachrichten-Generator 110 verwendet als Eingaben die von dem Absichtsschätzungs-Prozessor 107 geschätzten Absichten und das unbekannte Wort, wenn das unbekannte Wort von der Extraktionsvorrichtung 108 für unbekannte Wörter herausgezogen ist, um hierdurch eine Antworttextnachricht unter Verwendung der in dem Dialog-Szenario-Datenspeicher 109 gespeicherten Dialog-Szenario-Daten zu erzeugen. Der Sprachsynthetisierer 111 verwendet die von dem Antworttextnachrichten-Generator 110 erzeugte Antworttextnachricht als eine Eingabe, um hierdurch eine synthetische Sprache zu erzeugen. Die Sprachausgabeeinheit 112 gibt die von dem Sprachsynthetisierer 111 erzeugte synthetische Sprache aus.
-
Als Nächstes werden die Operationen des Dialogsteuersystems 100 gemäß dem ersten Ausführungsbeispiel beschrieben.
-
2 ist ein Diagramm, das ein Beispiel für einen Dialog zwischen dem Benutzer und dem Dialogsteuersystem 100 gemäß dem ersten Ausführungsbeispiel zeigt.
-
Zuerst stellt "U:" am Beginn jeder Linie die Aussage des Benutzers dar, und "S:" stellt eine Antwort des Dialogsteuersystems 100 dar. Eine Antwort 201, eine Antwort 203 und eine Antwort 205 sind jeweils eine Ausgabe des Dialogsteuersystems 100, und eine Aussage 202 und eine Aussage 204 sind jeweils die Aussage eines Benutzers, und es ist somit gezeigt, dass der Dialog aufeinanderfolgend fortschreitet.
-
Auf der Grundlage des beispielhaften Dialogs in 2 werden Verarbeitungsoperationen, die von dem Dialogsteuersystem 100 zum Erzeugen der Antworttextnachricht durchzuführen sind, mit Bezug auf die 3 bis 8 beschrieben.
-
3 ist ein Flussdiagramm, das Operationen des Dialogsteuersystems 100 gemäß dem ersten Ausführungsbeispiel zeigt.
-
4 ist ein Diagramm, das ein Beispiel für eine Merkmalsliste, die von dem morphologischen Analysierer 105 in dem Dialogsteuersystem 100 gemäß dem ersten Ausführungsbeispiel erhaltene Ergebnisse der morphologischen Analyse darstellt. In dem Beispiel von 4 besteht die Liste aus einem Merkmal 401 bis zu einem Merkmal 404.
-
5 ist ein Diagramm, das ein Beispiel für von dem Absichtsschätzungs-Prozessor 107 in dem Dialogsteuersystem 100 gemäß dem ersten Ausführungsbeispiel erhaltene Ergebnisse der Absichtsschätzung zeigt. Als ein Absichtsschätzungsergebnis 501 ist ein Absichtsschätzungsergebnis mit der erstrangigen Absichtsschätzungs-Trefferquote mit dieser Absichtsschätzungs-Trefferquote gezeigt, und als ein Absichtsschätzungsergebnis 502 wird ein Absichtsschätzungsergebnis mit der zweitrangigen Absichtsschätzungs-Trefferquote mit diesem Absichtsschätzungs-Trefferquote gezeigt.
-
6 ist ein Flussdiagramm, das Operationen der Extraktionsvorrichtung 108 für unbekannte Wörter in dem Dialogsteuersystem 100 gemäß dem ersten Ausführungsbeispiel zeigt.
-
7 ist ein Diagramm, das ein Beispiel für eine Liste von Kandidaten für unbekannte Wörter, die von der Extraktionsvorrichtung 108 für unbekannte Wörter in dem Dialogsteuersystem 100 gemäß dem ersten Ausführungsbeispiel herausgezogen wurden. In dem Beispiel nach 7 besteht die Liste aus einem Kandidaten 701 für unbekannte Wörter und einem Kandidaten 702 für unbekannte Wörter.
-
8 ist ein Diagramm, das ein Beispiel für in dem Dialog-Szenario-Datenspeicher 109 in dem Dialogsteuersystem 100 gemäß dem ersten Ausführungsbeispiel gespeicherte Dialog-Szenario-Daten. In den Dialog-Szenario-Daten für die Absicht in 8A sind Antworten, die durch das Dialogsteuersystem 100 für die jeweiligen Absichtsschätzergebnisse bereitzustellen sind, enthalten, und durch das Dialogsteuersystem 100 auszuführende Befehle für eine Vorrichtung (nicht gezeigt), die durch dieses System gesteuert werden, sind enthalten. Weiterhin ist in den Dialog-Szenario-Daten für unbekannte Wörter in 8B eine Antwort, die durch das Dialogsteuersystem 100 für das unbekannte Wort bereitzustellen ist, enthalten.
-
Zuerst wird das Flussdiagramm nach 3 beschrieben. Wenn der Benutzer eine Dialogstarttaste (nicht gezeigt) oder dergleichen drückt, die in dem Dialogsteuersystem 100 vorgesehen ist, gibt das Dialogsteuersystem 100 eine Antwort und einen Piepston aus, um das Starten des Dialogs zu veranlassen. In dem Beispiel nach 2 gibt, wenn der Benutzer die Dialogstarttaste drückt, das Dialogsteuersystem 100 durch Sprache die Antwort 201 "Bitte sprechen nach dem Piepston" aus und gibt dann einen Piepston aus. Nachdem sie ausgegeben sind, gelangt die Spracherkennungsvorrichtung 103 in einen erkennbaren Zustand und der Vorgang bewegt sich zu der Verarbeitung im Schritt ST301 in dem Flussdiagramm nach 3. Es ist zu beachten, dass der Piepston nach der Sprachausgabe zweckmäßig geändert werden kann.
-
Die Spracheingabeeinheit 101 empfängt eine Spracheingabe (Schritt ST301). In dem Beispiel nach 2 spricht der Benutzer, da er für die Suche nach der Route unter Verwendung einer normalen Straße mit hoher Priorität als dem Suchkriterium zu suchen wünscht, die Aussage 202 von "schnelles Durchführen des Setzens einer Grundpegel-Straße als der Route" ["Sakutto, 'route' wo shita-michi ni settei si te" in japanischer Aussprache], und in diesem Fall empfängt die Spracheingabeeinheit 101 diese Aussage als eine im Schritt ST301 eingegebene Sprache. Die Spracherkennungsvorrichtung 103 bezieht sich auf das in dem Spracherkennungs-Wörterbuch-Speicher 102 gespeicherte Spracherkennungs-Wörterbuch, um hierdurch eine Spracherkennung der in dem Schritt ST301 empfangenen Spracheingabe durchzuführen, um sie in einen Text umzuwandeln (Schritt ST302).
-
Der morphologische Analysierer 105 bezieht sich auf das in dem Speicher 104 gespeicherte Wörterbuch für morphologische Analyse, um hierdurch eine morphologische Analyse des im Schritt ST302 in den Text umgewandelten Spracherkennungsergebnisses durchzuführen (Schritt ST303). In dem Beispiel nach 2 führt der morphologische Analysierer 105 mit Bezug auf das Spracherkennungsergebnis von "schnelles Durchführen des Setzens einer Grundpegel-Straße als die Route" ["Sakutto, 'route' wo shita-michi ni settei si te" in japanischer Aussprache] für die Aussage 202 im Schritt ST303 eine morphologische Analyse so durch, dass "'schnell' [Sakutto] /Adverb; 'Route'/Substantiv; [wo]/postpositionale Partikel; 'Grundpegel-Straße' [shita-michi]/Substantiv; [ni]/postpositionale Partikel; 'setzen' [settei]/Substantiv (mit dem Verb 'suru' in japanischer Ausdruckweise zu verbinden); 'Durchführen' [si]/Verb; und [te]/postpositionale Partikel" erhalten werden.
-
Als Nächstes zieht der Absichtsschätzungs-Prozessor 107 aus den im Schritt ST303 erhaltenen Ergebnissen der morphologischen Analyse die Merkmale heraus, die in der Absichtsschätzungsverarbeitung zu verwenden sind (Schritt ST304), und führt die Absichtsschätzungsverarbeitung zum Schätzen einer Absicht von den im Schritt ST304 herausgezogenen Merkmalen durch unter Verwendung des in dem Absichtsschätzungsmodell-Speicher 106 gespeicherten Absichtsschätzungsmodells (Schritt ST305).
-
Gemäß dem Beispiel nach 2 zieht mit Bezug auf die Ergebnisse der morphologischen Analyse: "'schnelle' [Sakutto]/Adverb; 'Route'/Substantiv; [wo]/postpositionale Partikel; 'Grundpegel-Straße' [shita-michi]/Substantiv; [ni]/postpositionale Partikel; 'Setzen' [settei]/Substantiv; (in japanischer Ausdrucksweise mit dem Verb 'suru' zu verbinden); 'Durchführen' [si]/Verb; und [te]/postpositionale Partikel", der Absichtsschätzungs-Prozessor 107 die Merkmale hiervon im Schritt ST304 heraus, um sie hierdurch als Merkmalsliste zu sammeln, wie in 4 als ein Beispiel gezeigt ist. Die Merkmalsliste in 4 besteht aus: dem Merkmal 401 "'schnell'/Adverb"; dem Merkmal 402 "'Route'/Substantiv"; dem Merkmal 403 "'Grundpegel-Straße'/Substantiv"; und dem Merkmal 404 "'Setzen'/Substantiv (in japanischer Ausdrucksweise mit dem Verb 'suru' zu verbinden)".
-
Mit Bezug auf die in 4 gezeigte Merkmalsliste führt der Absichtsschätzungs-Prozessor 107 eine Absichtsschätzungsverarbeitung im Schritt ST305 durch. Wenn beispielsweise die Merkmale "'schnell'/Adverb" und "'Grundpegel-Straße'/Substantiv" in dem Absichtsschätzungsmodell nicht vorhanden sind, wird die Absichtsschätzung durchgeführt auf der Grundlage der Merkmale "'Route'/Substantiv" und "'Setzen'/Substantiv (in japanischer Ausdrucksweise mit dem Verb "suru" zu verbinden), so dass die in 5 gezeigte Absichtsschätzungsergebnis-Liste erhalten wird. Diese AbsichtsschätzungsergebnisListe besteht aus Rangfolge, Absichtsschätzergebnissen und Absichtsschätztreffern, in denen gezeigt ist, dass das Absichtsschätzergebnis für "Routenänderung [{Kriterium = NULL}]", das mit dem Rang "1" angezeigt ist, eine Absichtsschätzungs-Trefferquote von 0,583 hat. Weiterhin ist gezeigt, dass das Absichtsschätzungsergebnis von "Routenänderung [{Kriterium = Normale Straße mit hoher Priorität}]", das mit dem Rang "2" angezeigt ist, eine Absichtsschätzungs-Trefferquote von 0,177 hat. Es ist zu beachten, dass in 5 Absichtsschätzungsergebnisse und ihre Absichtsschätzungs-Trefferquote mit den Rängen, die dem Rang "1" und dem Rang "2" nachfolgen, nicht illustriert sind, aber ebenso gesetzt werden können.
-
Der Absichtsschätzungs-Prozessor 107 beurteilt auf der Grundlage der im Schritt ST305 erhaltenen Absichtsschätzungsergebnis-Liste, ob eine Absicht des Benutzers eindeutig bestimmt werden kann oder nicht (Schritt ST306). Bei der Beurteilungsverarbeitung im Schritt ST306 wird, wenn beispielsweise den folgenden beiden Kriterien (a), (b) genügt ist, beurteilt, dass eine Absicht des Benutzers eindeutig bestimmt werden kann.
Kriterium (a): eine Absichtsschätzungs-Trefferquote des Absichtsschätzungsergebnisses auf dem ersten Rang beträgt 0,5 oder mehr.
Kriterium (b): ein Schlitzwert des Absichtsschätzungsergebnisses auf dem ersten Rang ist nicht "NULL".
-
Wenn dem Kriterium (a) und dem Kriterium (b) jeweils genügt ist, das heißt, wenn eine Absicht des Benutzers eindeutig bestimmt werden kann (Schritt ST306: JA), geht der Vorgang zu der Verarbeitung im Schritt ST308 weiter. Bei dieser Gelegenheit gibt der Absichtsschätzungs-Prozessor 107 die Absichtsschätzungsergebnis-Liste zu dem Antworttextnachrichten-Generator 110 aus.
-
Wenn demgegenüber zumindest einem von dem Kriterium (a) und dem Kriterium (b) nicht genügt ist, das heißt, wenn keine Absicht des Benutzers eindeutig bestimmt werden kann (Schritt ST306: NEIN), dann geht der Vorgang zu der Verarbeitung im Schritt ST307 weiter. Bei dieser Gelegenheit gibt der Absichtsschätzungs-Prozessor 107 die Absichtsschätzungsergebnis-Liste und die Merkmalsliste zu der Extraktionsvorrichtung 108 für unbekannte Wörter aus.
-
In dem Fall der in 5 gezeigten Absichtsschätzungsergebnisse beträgt die Absichtsschätzungs-Trefferquote mit dem Rang "1" "0,583" und genügt somit dem Kriterium (a), aber der Schlitzwert ist "NULL" und genügt somit nicht dem Kriterium (b). Demgemäß beurteilt der Absichtsschätzungs-Prozessor 107 in der Beurteilungsverarbeitung im Schritt ST306, dass keine Absicht des Benutzers bestimmt werden kann, und dann geht der Vorgang zu der Verarbeitung im Schritt ST307 weiter.
-
In dem Schritt ST307 führt die Extraktionsvorrichtung 108 für unbekannte Wörter die Extraktionsverarbeitung für unbekannte Wörter auf der Grundlage der von dem Absichtsschätzungs-Prozessor bereitgestellten Merkmalsliste durch. Die Extraktionsverarbeitung für unbekannte Wörter im Schritt ST307 wird im Einzelnen mit Bezug auf das Flussdiagramm in 6 beschrieben.
-
Die Extraktionsvorrichtung 108 für unbekannte Wörter zieht aus der erhaltenen Merkmalsliste jedes Merkmal, das nicht in dem in dem Absichtsschätzungsmodell-Speicher 106 gespeicherten Absichtsschätzungsmodell enthalten ist, als einen Kandidaten für ein unbekanntes Wort heraus und fügt ihn zu einer Kandidatenliste für unbekannte Wörter hinzu (Schritt ST601).
-
In dem Fall der in 4 gezeigten Merkmalsliste werden das Merkmal 401 "'schnell'/Adverb" und das Merkmal 403 "'Grundpegel-Straße'/Substantiv" als Kandidaten für unbekannte Wörter herausgezogen und zu der in 7 gezeigten Kandidatenliste für unbekannt Wörter hinzugefügt.
-
Dann beurteilt die Extraktionsvorrichtung 108 für unbekannte Wörter, ob ein oder mehrere Kandidaten für unbekannte Wörter im Schritt ST601 herausgezogen wurden oder nicht (Schritt ST602). Wenn kein Kandidat für unbekannte Wörter herausgezogen wurde (Schritt ST602: NEIN), ist die Extraktionsverarbeitung für unbekannte Wörter beendet und der Vorgang geht zu der Verarbeitung im Schritt ST308 weiter. Die Extraktionsvorrichtung 108 für unbekannte Wörter gibt die Absichtsschätzungsergebnis-Liste zu dem Antworttextnachrichten-Generator 110 aus.
-
Demgegenüber löscht, wenn ein oder mehrere Kandidaten für unbekannte Wörter herausgezogen wurden (Schritt ST602: JA), die Extraktionsvorrichtung 108 für unbekannte Wörter von den in der Kandidatenliste für unbekannte Wörter enthaltenen Kandidaten für unbekannte Wörter jeden Kandidaten für unbekannte Wörter, dessen lexikale Kategorie eine andere ist als Verb, Substantiv und Adjektiv, um hierdurch die Liste in eine Liste für unbekannte Wörter zu modifizieren (Schritt ST603), und dann geht der Vorgang zu der Verarbeitung im Schritt ST308 weiter. Die Extraktionsvorrichtung 108 für unbekannte Wörter gibt die Absichtsschätzungsergebnis-Liste und die Liste für unbekannte Wörter zu dem Antworttextnachrichten-Generator 110 aus.
-
In dem Fall der in 7 gezeigten Kandidatenliste für unbekannte Wörter wird, da die Anzahl der Kandidaten für unbekannte Wörter gleich zwei ist, im Schritt ST602 "JA" bestimmt, so dass der Vorgang zu der Verarbeitung im Schritt ST603 weitergeht. In diesem Schritt ST603 wird der Kandidat 701 für unbekannte Wörter "'schnell'/Adverb", dessen lexikale Kategorie Adverb ist, gelöscht, so dass nur der Kandidat 702 für unbekannte Wörter "'Grundpegel-Straße'/Substantiv" in der Liste für unbekannte Wörter verbleibt.
-
Die Beschreibung der Operationen im Flussdiagramm nach 3 wird fortgesetzt.
-
Der Antworttextnachrichten-Generator 110 beurteilt, ob die Liste für unbekannte Wörter von der Extraktionsvorrichtung 108 für unbekannte Wörter bereitgestellt wurde oder nicht (Schritt ST308). Wenn keine Liste für unbekannte Wörter bereitgestellt wurde (Schritt ST308; Nein), erzeugt der Antworttextnachrichten-Generator 110 eine Antworttextnachricht unter Verwendung der in dem Dialog-Szenario-Datenspeicher 109 gespeicherten Dialog-Szenario-Daten durch Lesen einer mit dem Absichtsschätzungsergebnis übereinstimmenden Antwortschablone und einer mit dem durch die Liste für unbekannte Wörter angezeigten unbekannten Wort übereinstimmenden Antwortschablone auf diesem (Schritt ST310). Bei der Erzeugung der Antworttextnachricht wird eine mit der Liste für unbekannte Wörter übereinstimmende Antworttextnachricht vor einer mit dem Absichtsschätzungsergebnis übereinstimmenden Antworttextnachricht eingefügt. Weiterhin wird, wenn ein entsprechender Befehl in den Dialog-Szenario-Daten gesetzt ist, der Befehl gemäß Schritt ST310 ausgeführt.
-
In dem vorbeschriebenen Fall beurteilt, da die Liste für unbekannte Wörter, in der das unbekannte Wort "'Grundpegel-Straße'/Substantiv" enthalten ist, im Schritt ST603 erzeugt wurde, der Antworttextnachrichten-Generator 110 im Schritt ST308, dass die Liste für unbekannte Wörter bereitgestellt wurde, und erzeugt die Antworttextnachricht, die mit dem Absichtsschätzungsergebnis und dem unbekannten Wort übereinstimmt, im Schritt ST310. Spezifisch wird in dem Fall der in 5 gezeigten Absichtsschätzungsergebnis-Liste als eine Antwortschablone, die mit dem erstrangigen Absichtsschätzungsergebnis "Routenänderung [{Kriterium = NULL}]" übereinstimmt, eine Schablone 801 in den Dialog-Szenario-Daten für die Absicht in 8A ausgelesen, so dass eine Antworttextnachricht "Ich werde nach der Route suchen. Bitte sprich jedes Suchkriterium" erzeugt wird. Dann ersetzt der Antworttextnachrichten-Generator 110 <unbekanntes Wort> in einer Schablone 802 in den Dialog-Szenario-Daten für unbekanntes Wort, die in 8B gezeigt sind, durch einen tatsächlichen Wert in der Liste für unbekannte Wörter, um hierdurch eine Antworttextnachricht zu erzeugen. In dem vorbeschriebenen Fall ist das bereitgestellte unbekannte Wort "Grundpegel-Straße", so dass die erzeugte Antworttextnachricht "das Wort 'Grundpegel-Straße' ist ein unbekanntes Wort" lautet. Zuletzt wird diese Antworttextnachricht, die mit der Liste für unbekannte Wörter übereinstimmt, vor der Antworttextnachricht, die mit dem Absichtsschätzungsergebnis übereinstimmt, eingefügt, so dass die Antworttextnachricht "Das Wort 'Grundpegel-Straße' ist ein unbekanntes Wort. Ich werde nach der Route suchen. Bitte sprich jedes Suchkriterium" erzeugt wird.
-
Der Sprachsynthetisierer 111 erzeugt Sprachdaten aus der im Schritt ST309 oder Schritt ST310 erzeugten Antworttextnachricht und liefert die Sprachdaten zu der Sprachausgabeeinheit 112 (Schritt ST311). Die Sprachausgabeeinheit 112 gibt als Sprache die im Schritt ST311 gelieferten Sprachdaten aus (Schritt ST312). Folglich ist die Verarbeitung des Erzeugens der Antworttextnachricht mit Bezug auf die Sprache eines Benutzers beendet. Danach geht der Vorgang in dem Flussdiagramm zu der Verarbeitung im Schritt ST301 zurück, um auf eine von dem Benutzer durchgeführte Spracheingabe zu warten.
-
In dem vorbeschriebenen Fall wird die Antwort 203 von "Das Wort 'Grundpegel-Straße' ist ein unbekanntes Wort. Ich werde nach der Route suchen. Bitte sprich jedes Suchkriterium" wie in 2 gezeigt durch Sprache ausgegeben.
-
Da die Antwort 203 durch Sprach ausgegeben wird, kann dem Benutzer bewusst sein, dass er etwas unter Verwendung eines Ausdrucks, der von "Grundpegel-Straße" verschieden ist, sprechen soll. Beispielsweise kann der Benutzer erneut in einer Weise sprechen, die durch die Aussage 204 "Führe schnell das Setzen einer normalen Straße als die Route durch" in 2 dargestellt ist, um hierdurch den Dialog mit dem Dialogsteuersystem 100 fortzusetzen.
-
Wenn der Benutzer die vorbeschriebene Aussage 204 macht, führt das Dialogsteuersystem 100 die in den Flussdiagrammen in 3 und 6 gezeigte Spracherkennungsverarbeitung mit der Aussage 204 durch. Als Ergebnis besteht die im Schritt ST304 erhaltene Merkmalsliste aus den vier herausgezogenen Merkmalen "'schnell'/Adverb", "'Route'/Substantiv", "'normale Straße'/Substantiv" und "'setzen'/Substantiv (in der japanischen Aussprache mit dem Verb 'suru' zu verbinden)". In dieser Merkmalsliste ist nur das Wort "'schnell'/Adverb" unbekannt. Dann wird im Schritt ST305 ein Absichtsschätzungsergebnis von "[{Kriterium = normale Straße mit hoher Priorität}]" mit dem Rang "1" mit einer Absichtsschätzungs-Trefferquote von "0,822" erhalten.
-
Dann wird in der Beurteilungsverarbeitung im Schritt ST306 beurteilt, da die Absichtsschätzungs-Trefferquote des Absichtsschätzungsergebnisses mit dem Rang "1" gleich "0,822" ist und somit dem Kriterium (a) genügt, und der Schlitzwert nicht "NULL" ist und somit dem Kriterium (b) genügt, dass eine Absicht des Benutzers eindeutig bestimmt werden kann, so dass der Vorgang zu der Verarbeitung im Schritt ST308 geht. Im Schritt ST308 wird beurteilt, dass keine Liste für unbekannte Wörter bereitgestellt wurde, und dann wird im Schritt ST309 eine Schablone 803 in den Dialog-Szenario-Daten für die Absicht in 8A ausgelesen als die Antwortschablone, die mit "Routenänderung [{Kriterium = normale Straße mit hoher Priorität}]" übereinstimmt, so dass die Antworttextnachricht "ich werde nach einer normalen Straße mit hoher Priorität als der Route suchen" erzeugt wird, und ein Befehl "Setze (Routentyp, normale Straße mit hoher Priorität)", der zum Suchen der Route vorgesehen ist, während eine normale Straße mit hoher Priorität gegeben wird, wird ausgeführt. Dann werden im Schritt ST311 Sprachdaten aus der Antworttextnachricht erzeugt, und im Schritt ST312 werden die Sprachdaten durch Sprache ausgegeben. Auf diese Weise ist es möglich, den Befehl gemäß der ursprünglichen Absicht des Benutzers "Ich möchte nach der Route mit dem Suchkriterium des Gebens einer normalen Straße mit hoher Priorität suchen" durch einen reibungslosen Dialog mit dem Dialogsteuersystem 100 auszuführen.
-
Wie vorstehend beschrieben ist, enthält die Konfiguration gemäß dem ersten Ausführungsbeispiel: den morphologischen Analysierer 105, der das Spracherkennungsergebnis in Morpheme teilt; den Absichtsschätzungs-Prozessor 107, der eine Absicht des Benutzers anhand der morphologischen Analyseergebnisse schätzt; die Extraktionsvorrichtung 108 für unbekannte Wörter, die, wenn eine Absicht des Benutzers durch den Absichtsschätzungsprozessor 107 nicht eindeutig bestimmt werden kann, ein Merkmal, das in dem Absichtsschätzungsmodell nicht vorhanden ist, als ein unbekanntes Wort herauszieht; und den Antworttextnachrichten-Generator 110, der, wenn das unbekannte Wort herausgezogen ist, eine Antworttextnachricht enthaltend das unbekannte Wort erzeugt. Somit ist es möglich, die Antworttextnachricht enthaltend ein als das unbekannte Wort herausgezogenes Wort zu erzeugen, um hierdurch dem Benutzer das Wort, aufgrund dessen die Schätzung jeglicher Absicht durch das Dialogsteuersystem 100 versagt, zu präsentieren. Hierdurch wird dem Benutzer ermöglicht, das Wort, das im Ausdruck zu ändern ist, zu erkennen, so dass der Dialog reibungslos fortschreiten kann.
-
Zweites Ausführungsbeispiel
-
In einem zweiten Ausführungsbeispiel wird eine Konfiguration zum weiteren syntaktischen Analysieren der morphologischen Analyseergebnisse, um hierdurch eine Extraktion eines unbekannten Worts unter Verwendung des syntaktischen Analyseergebnisses durchzuführen, beschrieben.
-
9 ist ein Blockschaltbild, das eine Konfiguration eines Dialogsteuersystems 100a gemäß dem zweiten Ausführungsbeispiel zeigt.
-
In dem zweiten Ausführungsbeispiel enthält eine Extraktionsvorrichtung 108a für unbekannte Wörter weiterhin einen syntaktischen Analysierer 113, und ein Absichtsextraktionsmodell-Speicher 106a speichert eine häufig auftretende Wortliste zusätzlich zu dem Absichtsschätzungsmodell. Es ist zu beachten, dass im Folgenden mit Bezug auf die Teile, die die gleichen wie die Konfigurationselemente des Dialogsteuersystems 100 gemäß dem ersten Ausführungsbeispiel oder diesen äquivalent sind, die gleichen Bezugszahlen wie die in dem ersten Ausführungsbeispiel verwendeten erhalten haben, so dass ihre Beschreibung weggelassen oder vereinfacht wird.
-
Der syntaktische Analysierer 113 analysiert weiterhin syntaktisch die morphologischen Analyseergebnisse, die durch den morphologischen Analysierer 105 erhalten wurden. Die Extraktionsvorrichtung 108a für unbekannte Wörter führt eine Extraktion von unbekannten Wörtern unter Verwendung von Abhängigkeitsinformationen, die durch das von dem syntaktischen Analysierer 113 erhaltene syntaktische Analyseergebnis angezeigt werden, durch. Ein Absichtsschätzungsmodell-Speicher 106a ist ein Speicherbereich, in welchem die häufig erscheinende Wortliste zusätzlich zu dem in dem ersten Ausführungsbeispiel gezeigten Absichtsschätzungsmodell gespeichert wird. Die häufig erscheinende Wortliste ist eine solche, in der häufig erscheinende Wörter, die sehr häufig mit Bezug auf ein gegebenes Absichtsschätzungsergebnis erscheinen, als eine Liste wie beispielsweise in 10 gezeigt gespeichert sind, und eine häufig erscheinende Wortliste 1002 für "Änderung, Auswahl, Route, Verlauf, Richtungen" ist mit einem Absichtsschätzungsergebnis 1001 "Routenänderung [{Kriterium = NULL}]" assoziiert.
-
Als Nächstes werden Operationen des Dialogsteuersystems 100a gemäß dem zweiten Ausführungsbeispiel beschrieben.
-
11 ist ein Diagramm, das ein Beispiel für einen Dialog mit dem Dialogsteuersystem 100a gemäß dem zweiten Ausführungsbeispiel zeigt.
-
Ähnlich wie in 2 für das erste Ausführungsbeispiel stellt "U:" am Anfang jeder Linie die Aussage eines Benutzers dar, und "S:" stellt eine Antwort von dem Dialogsteuersystem 100a dar. Eine Antwort 1101, eine Antwort 1103 und eine Antwort 1105 sind jeweils eine Antwort von dem Dialogsteuersystem 100a, und eine Aussage 1102 und eine Aussage 1104 sind jeweils eine Aussage eines Benutzers, und somit ist gezeigt, dass ein Dialog aufeinanderfolgend fortschreitet.
-
Es werden Verarbeitungsoperationen in dem Dialogsteuersystem 100a zum Erzeugen einer Antworttextnachricht, die mit der in 11 gezeigten Aussage des Benutzers übereinstimmt, unter Bezug auf die 10 und 12 bis 14 beschrieben.
-
12 ist ein Flussdiagramm, das Operationen des Dialogsteuersystems 100a gemäß dem zweiten Ausführungsbeispiel zeigt. 13 ist ein Flussdiagramm, das Operationen der Extraktionsvorrichtung 108a für unbekannte Wörter in dem Dialogsteuersystem 100a gemäß dem zweiten Ausführungsbeispiel zeigt. In 12 und 13 werden mit Bezug auf die Schritte, die die gleichen wie die von dem Dialogsteuersystem 100 gemäß dem ersten Ausführungsbeispiel durchgeführten sind, diesen die gleichen Zahlen wie die in 3 und 6 verwendeten gegeben, so dass ihre Beschreibung weggelassen oder vereinfacht wird.
-
14 ist ein Diagramm, das ein Beispiel für das durch den syntaktischen Analysierer 113 in dem Dialogsteuersystem 100a gemäß dem zweiten Ausführungsbeispiel erhaltene syntaktische Analyseergebnis zeigt. In dem Beispiel von 14 ist gezeigt, dass ein lexikales Stück 1401, ein lexikales Stück 1402 und ein lexikales Stück 1403 ein lexikales 1404 modifizieren.
-
Es ist zuerst festzustellen, dass, wie in dem Flussdiagramm in 12 gezeigt ist, die Grundoperationen des Dialogsteuersystems 100a des zweiten Ausführungsbeispiels die gleichen sind wie diejenigen des Dialogsteuersystems 100 des ersten Ausführungsbeispiels, und es besteht eine Differenz nur dahingehend, dass die Extraktionsvorrichtung 108a für unbekannte Wörter eine Extraktion eines unbekannten Worts im Schritt ST1201 unter Verwendung der Abhängigkeitsinformationen durchführt, die das von dem syntaktischen Analysierer 113 erhaltene Analyseergebnis sind. Genauer gesagt, die Verarbeitung der Extraktion des unbekannten Worts durch die Extraktionsvorrichtung 108a für unbekannte Wörter wird auf der Grundlage des Flussdiagramms in 13 durchgeführt.
-
Zuerst werden auf der Grundlage des in 11 gezeigten Beispiels für den Dialog zwischen dem Dialogsteuersystem 100a und dem Benutzer die Grundoperationen des Dialogsteuersystems 100a gemäß dem Flussdiagramm in 12 beschrieben.
-
Wenn der Benutzer die Dialogstarttaste drückt, gibt das Dialogsteuersystem 100a durch Sprache die Antwort 1101 "Bitte nach dem Piepston sprechen" aus und gibt dann einen Piepston aus. Nachdem diese ausgegeben sind, gelangt die Spracherkennungsvorrichtung 103 in einen Erkennungszustand und der Vorgang geht zu der Verarbeitung im Schritt ST301 in dem Flussdiagramm in 12 weiter. Es ist zu beachten, dass der Piepston nach der Sprachausgabe zweckmäßig geändert werden kann.
-
Wenn der Benutzer nach der Route unter Verwendung einer normalen Straße als das Suchkriterium suchen möchte, und spricht, um die Aussage 1102 "wegen Geldmangels wähle eine Grundpegel-Straße als die Route aus" ["Kin-kektu na node, 'Route' wa shita-michi wo senntaku si te" in japanischer Aussprache] zu machen, empfängt die Spracheingabeeinheit 101 diese im Schritt ST301 als eine Spracheingabe. Im Schritt ST302 führt die Spracherkennungsvorrichtung 103 eine Spracherkennung der empfangenen Spracheingabe durch, um diese in einen Text umzuwandeln. Mit Bezug auf das Spracherkennungsergebnis von "Wegen Geldmangels wähle eine Grundpegel-Straße als die Route aus" ["Kin-ketsu na node, 'Route' wa shita-michi wo sentaku si te"] führt der morphologische Analysierer 105 im Schritt ST303 eine morphologische Analyse durch, um zu erhalten: "'Geldmangel' [Kin-ketsu]/Substantiv; [na]/Hilfsverb; [node] /postpositionale Partikel; 'Route'/Substantiv; [wa]/postpositionale Partikel; 'Grundpegel-Straße' [shita-michi]/Substantiv; [wo]/postpositionale Partikel; 'Auswahl' [sentaku]/Substantiv (in japanischer Aussprache mit dem Verb 'suru' zu verbinden); 'machen' [si]/Verb; und [te]/postpositionale Partikel". Im Schritt ST304 zieht der Absichtsschätzungs-Prozessor 107 aus den im Schritt ST303 erhaltenen morphologischen Analyseergebnissen die in der Absichtsschätzungsverarbeitung zu verwendenden Merkmale heraus: "'Geldmangel' /Substantiv", "'Route'/Substantiv", "'Grundpegel-Straße'/Substantiv" und "'Auswahl'/Substantiv (in japanischer Aussprache mit dem Verb 'suru' zu verbinden)", um hierdurch eine Merkmalsliste bestehend aus diesen vier Merkmalen zu erzeugen.
-
Weiterhin führt im Schritt ST305 der Absichtsschätzungs-Prozessor 107 eine Absichtsschätzungsverarbeitung bei der im Schritt ST304 erzeugten Merkmalsliste durch. Hier wird, wenn beispielsweise die Merkmale "'Geldmangel'/Substantiv" und "'Grundpegel-Straße'/Substantiv" in dem in dem Absichtsschätzungsmodell-Speicher 6 gespeicherten Absichtsschätzungsmodell nicht vorhanden sind, die Absichtsschätzungsverarbeitung auf der Grundlage der Merkmale "'Route'/Substantiv" und "'Auswahl'/Substantiv (in japanischer Aussprache mit dem Verb 'suru' zu verbinden)" durchgeführt, so dass die in 5 gezeigte Absichtsschätzungsergebnis-Liste wie in dem ersten Ausführungsbeispiel erhalten wird. Das Absichtsschätzungsergebnis "Routenänderung [{Kriterium = NULL}]", das mit dem Rang "1" angezeigt wird, wird mit einer Absichtsschätzungs-Trefferquote von 0,583 angezeigt, und das Absichtsschätzungsergebnis "Routenänderung [{Kriterium = normale Route mit hoher Priorität}]", das mit dem Rang "2" angezeigt wird, wird mit einer Absichtsschätzungs-Trefferquote 0,177 erhalten.
-
Wenn die Absichtsschätzungsergebnis-Liste erhalten wird, geht der Vorgang zu der Verarbeitung im Schritt ST306 weiter.
-
Wie vorstehend beschrieben ist, wird, da die Absichtsschätzungsergebnis-Liste in 5, die die gleiche wie die in dem ersten Ausführungsbeispiel ist, erhalten wird, das Ergebnis der Beurteilung im Schritt ST306 als "NEIN" erhalten, das das gleiche wie in dem ersten Ausführungsbeispiel ist, so dass beurteilt wird, dass eine Absicht des Benutzers nicht eindeutig bestimmt werden kann, und der Vorgang geht zu der Verarbeitung im Schritt ST1201 weiter. Der Absichtsschätzungs-Prozessor 107 gibt die Absichtsschätzungsergebnis-Liste und die Merkmalsliste zu der Extraktionsvorrichtung 108a für unbekannte Wörter aus.
-
Bei der Verarbeitung im Schritt ST1201 führt auf der Grundlage der von dem Absichtsschätzungs-Prozessor 107 gelieferten Merkmalsliste die Extraktionsvorrichtung 108a für unbekannte Wörter eine Extraktionsverarbeitung für unbekannte Wörter durch, wobei sie die durch den syntaktischen Analysierer 113 erhaltenen Abhängigkeitsinformationen verwendet. Die die Abhängigkeitsinformationen verwendende Extraktionsverarbeitung für unbekannte Wörter im Schritt ST1201 wird im Einzelnen mit Bezug auf das Flussdiagramm in 13 beschrieben.
-
Die Extraktionsvorrichtung 108a für unbekannte Wörter zieht aus der erhaltenen Merkmalsliste jedes Merkmal, das nicht in dem in dem Absichtsschätzungsmodell-Speicher 106 gespeicherten Absichtsschätzungsmodell enthalten ist, als einen Kandidaten für ein unbekanntes Wort heraus und fügt es zu einer Kandidatenliste für unbekannte Wörter hinzu (Schritt ST601).
-
In dem Fall der im Schritt ST304 erzeugten Merkmalsliste werden aus den vier Merkmalen "'Geldmangel/Substantiv", "'Route'/Substantiv"; "'Grundpegel-Straße'/Substantiv" und "'Auswahl'/Substantiv (in japanischer Aussprache in Verbindung mit dem Verb 'suru' zu verbinden)", die Merkmale "'Geldmangel'/Substantiv" und "'Grundpegel-Straße'/Substantiv" als Kandidaten für ein unbekanntes Wort herausgezogen und zu der Kandidatenliste für unbekannte Wörter hinzugefügt.
-
Dann beurteilt die Extraktionsvorrichtung 108a für unbekannte Wörter, ob ein oder mehrere Kandidaten für ein unbekanntes Wort im Schritt ST601 herausgezogen wurden oder nicht (Schritt ST602). Wenn kein Kandidat für ein unbekanntes Wort herausgezogen wurde (Schritt ST602: NEIN), wird die Extraktionsverarbeitung für unbekannte Wörter beendet und der Vorgang geht zu der Verarbeitung im Schritt ST308 weiter.
-
Demgegenüber teilt, wenn ein oder mehrere Kandidaten für ein unbekanntes Wort herausgezogen wurden (Schritt ST602: JA), der syntaktische Analysierer 113 die morphologischen Analyseergebnisse in Einheiten von lexikalen Stücken, und analysiert Abhängigkeitsbeziehungen mit Bezug auf die lexikalen Stücke, um hierdurch das syntaktische Analyseergebnis zu erhalten (Schritt ST1301).
-
Mit Bezug auf die vorbeschriebenen morphologischen Analyseergebnisse: "'Geldmangel' [Kin-ketsu]/Substantiv; [na]/Hilfsverb; [node]/ postpositionale Partikel; 'Route'/Substantiv; [wa]/postpositionale Partikel; 'Grundpegel-Straße' [shita-michi]/Substantiv; [wo]/postpositionale Partikel; 'Auswahl' [sentaku]/Substantiv (in japanischer Aussprache mit dem Verb 'suru' zu verbinden); 'machen' [si]/Verb; und [te]/postpositionale Partikel", werden diese zuerst im Schritt ST1301 in Einheiten der lexikalen Stücke geteilt: "'wegen Geldmangels' [Kin-ketsu/na/node]: Verbphrase", "'als die Route' [Route/wa]: Substantivphrase", "'von Grundpegel-Straße' [shita-michi/wo]: Substantivphrase", und "'Auswahl machen' [sentaku/si/te]: Verbphrase". Weiterhin werden die Abhängigkeitsbeziehungen zwischen den jeweiligen lexikalen Stücken analysiert, um hierdurch das in 14 gezeigte syntaktische Analyseergebnis zu erhalten.
-
In dem Beispiel des in 14 gezeigten syntaktischen Analyseergebnisses modifiziert das lexikale Stück 1401 das lexikale Stück 1404, das lexikale Stück 1402 modifiziert das lexikale Stück 1404, und das lexikale Stück 1403 modifiziert das lexikale Stück 1404. Hier sind die Typen von Abhängigkeiten in einen ersten Abhängigkeitstyp und einen zweiten Abhängigkeitstyp kategorisiert. Der erste Abhängigkeitstyp ist ein derartiger Typ, in welchem ein Substantiv oder ein Adverb verwendet wird, um ein Verb oder ein Adjektiv zu modifizieren, und entspricht einem Abhängigkeitstyp 1405 in dem Beispiel von 14, in welchem "'als die Route': Substantivphrase" und "'von Grundpegel-Straße': Substantivphrase" modifizieren: "'mache Auswahl': Verbphrase". Andererseits ist der zweite Abhängigkeitstyp ein solcher Typ, in welchem ein Verb, ein Adjektiv oder ein Hilfsverb verwendet wird, um ein Verb, ein Adjektiv oder ein Hilfsverb zu modifizieren, und der einem Abhängigkeitstyp 1406 entspricht, in welchem "'wegen Geldmangels': Verbphrase" modifiziert: "'mache Auswahl': Verbalphrase".
-
Nach der Beendigung der Verarbeitung der syntaktischen Analyse im Schritt ST1301 zieht die Extraktionsvorrichtung 108a für unbekannte Wörter häufig erscheinende Wörter gemäß dem Absichtsschätzungsergebnis heraus (Schritt ST1302). In dem Fall beispielsweise, in welchem das in 10 gezeigte Absichtsschätzungsergebnis 1001 "Routenänderung [{Kriterium = NULL}]" im Schritt ST1302 erhalten wird, wird die häufig erscheinende Wortliste 1002 "Änderung, Auswahl, Route, Verlauf, Richtungen" gewählt.
-
Dann bezieht sich die Extraktionsvorrichtung 108a für unbekannte Wörter auf das im Schritt ST1301 erhaltene syntaktische Analyseergebnis, um hierdurch aus diesem ein oder mehrere lexikale Stücke herauszuziehen, die ein Wort enthalten, das unter den im Schritt ST601 herausgezogenen Kandidaten für ein unbekanntes Wort ist und das eine Abhängigkeitsbeziehung des ersten Abhängigkeitstyps mit dem im Schritt ST1302 herausgezogenen, häufig erscheinenden Wort errichtet, und fügt das in den herausgezogenen einem oder mehreren lexikalen Stücken enthaltene Wort zu der Liste für unbekannte Wörter hinzu (Schritt ST1303).
-
Wie in 14 gezeigt ist, gibt es zwei lexikale Stücke, die das lexikale Stück 1402 "als die Route" und das lexikale Stück 1404 "machen Auswahl" beinhalten, wobei jedes lexikale Stück das häufig erscheinende Wort, das in der gewählten, häufig erscheinenden Wortliste 1002 existiert, enthält. In den lexikalen Stücken, die die jeweiligen Kandidaten für ein unbekanntes Wort "Geldmangel" und "Grundpegel-Straße" enthalten, die das lexikale Stück 1404 modifizieren, ist das lexikale Stück, das das lexikale Stück 1404 gemäß dem ersten Abhängigkeitstyp modifiziert, nur das lexikale Stück 1403 "von Grundpegel-Straße", das den Kandidaten für das unbekannte Wort "Grundpegel-Straße" enthält. Demgemäß ist in einer Liste von unbekannten Wörtern nur "Grundpegel-Straße" enthalten.
-
Die Extraktionsvorrichtung 108a für unbekannte Wörter gibt das Absichtsschätzungsergebnis und, wenn eine Liste von unbekannten Wörtern vorhanden ist, die Liste von unbekannten Wörtern zu dem Antworttextnachrichten-Generator 110 aus.
-
Unter Bezugnahme auf das Flussdiagramm in 12 wird die Beschreibung der Operationen fortgesetzt.
-
Der Antworttextnachrichten-Generator 110 beurteilt, ob die Liste von unbekannten Wörtern durch die Extraktionsvorrichtung 108a für unbekannte Wörter bereitgestellt wurde oder nicht (Schritt ST308), und danach wird die gleiche Verarbeitung wie in Schritt ST309 bis Schritt ST312, die in dem ersten Ausführungsbeispiel gezeigt ist, durchgeführt. Gemäß den in 10 und 14 gezeigten Beispielen wird die in 11 gezeigte Antwort 1103 "das Wort '-Grundpegel-Straße ist' ein unbekanntes Wort. Bitte sage es in einer anderen Weise" durch Sprache ausgegeben. Danach geht der Vorgang in dem Flussdiagramm zu der Verarbeitung im Schritt ST301 zurück, um auf eine von dem Benutzer vorgenommene Spracheingabe zu warten.
-
Wegen der durch Sprache ausgegebenen Antwort 1103 kann dem Benutzer bewusst sein, dass er "Grundpegel-Straße" zu ändern hat, indem er es auf andere Weise sagt, so dass der Benutzer wieder in einer Weise wie beispielsweise "Wegen Geldmangels führe das Setzen einer normalen Straße als die Route durch" sprechen kann, wie durch die Aussage 1104 in 11 gezeigt ist. Demgemäß wird "Routenänderung [{Kriterium = normale Straße mit hoher Priorität}]" als das Absichtsschätzungsergebnis für die Aussage 1104 erhalten, so dass das System durch Sprache die Antwort 1105 "Ich werde in eine normale Straße mit hoher Priorität als die Route ändern" ausgibt. Auf diese Weise ist es möglich, den Befehl gemäß der ursprünglichen Absicht des Benutzers "Ich möchte nach einer normalen Straße als der Route suchen" durch einen reibungslosen Dialog mit dem Dialogsteuersystem 100a auszuführen.
-
Wie vorstehend beschrieben ist, enthält die Konfiguration gemäß dem zweiten Ausführungsbeispiel: den syntaktischen Analysierer 113, der eine syntaktische Analyse des durch den morphologischen Analysierer 105 erhaltenen morphologischen Analyseergebnisses durchführt; und die Extraktionsvorrichtung 108 für unbekannte Wörter, die ein unbekanntes Wort auf der Grundlage der Abhängigkeitsbeziehungen zwischen den erhaltenen lexikalen Stücken herauszieht. Somit ist es möglich, das unbekannte Wort in einer Weise, die auf ein spezifisches Inhaltswort beschränkt ist, aus dem Ergebnis der syntaktischen Analyse der Aussage des Benutzers herauszuziehen, und dann dieses Wort in die Antworttextnachricht, die von dem Dialogsteuersystem 100a bereitgestellt wird, einzufügen. Unter den Wörtern, die durch das Dialogsteuersystem 100a nicht erkannt werden können, kann dem Benutzer ein wichtiges Wort präsentiert werden. Hierdurch wird ermöglicht, dass der Benutzer das zu sprechende Wort wieder korrekt erkennt, so dass der Dialog reibungsfrei fortgesetzt werden kann.
-
Drittes Ausführungsbeispiel
-
In einem dritten Ausführungsbeispiel wird eine Konfiguration zum Durchführen einer Extraktion eines bekannten Worts unter Verwendung der morphologischen Analyseergebnisse beschrieben, die eine Verarbeitung ist, die entgegengesetzt zu der Verarbeitung mit einer Extraktion eines unbekannten Worts bei dem jeweils vorbeschriebenen ersten Ausführungsbeispiel und zweiten Ausführungsbeispiel ist.
-
15 ist ein Blockschaltbild, das eine Konfiguration eines Dialogsteuersystems 100b gemäß dem dritten Ausführungsbeispiel zeigt.
-
In dem dritten Ausführungsbeispiel ergibt sich die Konfiguration aus dem Dialogsteuersystem 100 des in 1 gezeigten ersten Ausführungsbeispiels, indem eine Extraktionsvorrichtung 114 für bekannte Wörter anstelle der Extraktionsvorrichtung 108 für unbekannte Wörter vorgesehen ist. Es ist zu beachten, dass im Folgenden mit Bezug auf die Teile, die die gleichen wie die Konfigurationselemente des Dialogsteuersystems 100 nach dem ersten Ausführungsbeispiel oder denen äquivalent sind, diese mit den gleichen Bezugszahlen wie denjenigen, die in dem ersten Ausführungsbeispiel verwendet werden, versehen sind, so dass ihre Beschreibung weggelassen oder vereinfacht wird.
-
Die Extraktionsvorrichtung 114 für bekannte Wörter zieht aus den von dem morphologischen Analysierer 105 herausgezogenen Merkmalen jedes Merkmal, das nicht in dem Absichtsschätzungsmodell des Absichtsschätzungsmodell-Speichers 106 gespeichert ist, als einen Kandidaten für ein unbekanntes Wort heraus, und zieht hieraus jedes Merkmal, das ein anderes als der herausgezogene Kandidat für ein unbekanntes Wort ist, als ein bekanntes Wort heraus.
-
Als Nächstes werden Operationen des Dialogsteuersystems 100b gemäß dem dritten Ausführungsbeispiel beschrieben.
-
16 ist ein Diagramm, das ein Beispiel für einen Dialog zwischen dem Dialogsteuersystem 100b gemäß dem dritten Ausführungsbeispiel und dem Benutzer zeigt.
-
Ähnlich wie 2 für das erste Ausführungsbeispiel stellt "U:" am Anfang jeder Linie eine Aussage eines Benutzers dar, und "S:" stellt eine Aussage/Antwort von dem Dialogsteuersystem 100b dar. Eine Antwort 1601, eine Antwort 1603 und eine Antwort 1605 sind jeweils eine Antwort von dem Dialogsteuersystem 100b, und eine Aussage 1602 und eine Aussage 1604 sind jeweils eine Aussage eines Benutzers, und es ist somit gezeigt, dass der Dialog aufeinanderfolgend fortschreitet.
-
Auf der Grundlage des Dialogbeispiels in 16 werden Verarbeitungsoperationen in dem Dialogsteuersystem 100b zum Erzeugen einer Antworttextnachricht mit Bezug auf die 17 bis 20 beschrieben.
-
17 ist ein Flussdiagramm, das Operationen des Dialogsteuersystems 100b gemäß dem dritten Ausführungsbeispiel zeigt.
-
18 ist ein Diagramm, das ein Beispiel für Absichtsschätzungsergebnisse zeigt, die durch den Absichtsschätzungs-Prozessor 107 in dem Dialogsteuersystem 100b gemäß dem dritten Ausführungsbeispiel erhalten wurden. Als ein Absichtsschätzungsergebnis 1801 ist ein Absichtsschätzungsergebnis mit der erstrangigen Absichtsschätzungs-Trefferquote mit dieser Absichtsschätzungs-Trefferquote gezeigt, und als ein Absichtsschätzungsergebnis 1802 ist ein Absichtsschätzungsergebnis mit der zweitrangigen Erfassungsschätzungs-Trefferquote mit dieser Erfassungsschätzungs-Trefferquote gezeigt.
-
19 ist ein Flussdiagramm, das Operationen des Prozessors 114 für die Extraktion bekannter Wörter in dem Dialogsteuersystem 100b gemäß dem dritten Ausführungsbeispiel zeigt. In 17 und 19 sind mit Bezug auf die Schritte, die die gleichen sind wie diejenigen, die durch das Dialogsteuersystem gemäß dem ersten Ausführungsbeispiel durchgeführt werden, die gleichen Zahlen wie diejenigen, die in 3 und 6 verwendet werden, diesen zugeteilt, so dass ihre Beschreibung weggelassen oder vereinfacht wird.
-
20 ist ein Diagramm, das ein Beispiel für in dem Dialog-Szenario-Datenspeicher 109 des Dialogsteuersystems 100b gemäß dem dritten Ausführungsbeispiel gespeicherte Dialog-Szenario-Daten zeigt. In den Dialog-Szenario-Daten für die Absicht in 20A sind Antworten, die durch das Dialogsteuersystem 100b für die jeweiligen Absichtsschätzungsergebnisse bereitzustellen sind, enthalten, und Befehle, die durch das Dialogsteuersystem 100b für eine von diesem System gesteuerte Vorrichtung (nicht gezeigt) auszuführen sind, sind enthalten. Weiterhin ist in den Dialog-Szenario-Daten für ein bekanntes Wort in 20B eine Antwort, die durch das Dialogsteuersystem 100b für das bekannte Wort bereitzustellen ist, enthalten.
-
Wie in dem Flussdiagramm in 17 gezeigt ist, sind die Grundoperationen des Dialogsteuersystems 100b nachdem dritten Ausführungsbeispiel die gleichen wie diejenigen des Dialogsteuersystems 100 nach dem ersten Ausführungsbeispiel, aber es besteht ein Unterschied nur dahingehend, dass die Extraktionsvorrichtung 114 für das bekannt Wort eine Extraktion des bekannten Worts in dem Schritt ST1701 durchführt. Genauer gesagt, die Verarbeitung für die Extraktion des bekannten Worts durch die Extraktionsvorrichtung 114 für bekannte Wörter wird auf der Grundlage des Flussdiagramms in 19 durchgeführt.
-
Zuerst werden auf der Grundlage des in 16 gezeigten Beispiels für den Dialog mit dem Dialogsteuersystem 100b die Grundoperationen des Dialogsteuersystems 100b gemäß dem Flussdiagramm in 17 beschrieben.
-
Wenn der Benutzer auf die Dialogstarttaste drückt, gibt das Dialogsteuersystem 100b die Antwort 1601 "Bitte sprechen nach dem Piepston" durch Sprache aus und gibt dann einen Piepston aus. Nachdem diese ausgegeben sind, wird die Spracherkennungsvorrichtung 103 in einen empfangbaren Zustand versetzt und der Vorgang bewegt sich zu der Verarbeitung im Schritt ST301 in dem Flussdiagramm in 17. Es ist zu beachten, dass der Piepston nach der Sprachausgabe zweckmäßig geändert werden kann.
-
Wenn der Benutzer spricht, um die Ansage
1602 "Mai Feibareit ist '
-Stadion "'["'
-Stadion' wo 'Mai Feibareit'" in japanischer Ausdrucksweise], zu machen, empfängt die Spracheingabeeinheit
101 diese als eine Spracheingabe im Schritt ST301. Im Schritt ST302 führt die Spracherkennungsvorrichtung
103 die Spracherkennung der empfangenen Spracheingabe durch, um sie in einen Text umzuwandeln. Im Schritt ST303 führt der morphologische Analysierer
105 eine morphologische Analyse des Spracherkennungsergebnisses "Mai Feibareit ist '
-Stadion' ['
-Stadion' wo 'Mai Feibareit']" durch, um "'
-Stadion'/Substantiv (Einrichtungsname); 'wo'/postpositionale Partikel; und 'Mai Feibareit'/Substantiv" zu erhalten. Im Schritt ST304 zieht der Absichtsschätzungs-Prozessor
107 aus den morphologischen Analyseergebnissen, die im Schritt ST303 erhalten wurden, die Merkmale "#Einrichtungsname (= '
-Stadion')" und "Mai Feibareit" heraus, die in der Absichtsschätzungsverarbeitung zu verwenden sind, und erzeugt eine Merkmalsliste, die diese zwei Merkmale aufweist. Hier ist "#Einrichtungsname" ein spezielles Symbol, das einen Namen einer Einrichtung anzeigt.
-
Weiterhin führt im Schritt ST305 der Absichtsschätzungsprozessor 107 eine Absichtsschätzungsverarbeitung der im Schritt ST304 erzeugten Merkmalsliste durch. Wenn beispielsweise das Merkmal "Mai Feibareit" in dem in dem Absichtsschätzungsmodell-Speicher 106 gespeicherten Absichtsschätzungsmodell nicht vorhanden ist, wird die Absichtsschätzungsverarbeitung auf der Grundlage des Merkmals "#Einrichtungsname" durchgeführt, so dass eine in 18 gezeigte Absichtsschätzungsergebnis-Liste erhalten wird. Das Absichtsschätzungsergebnis 1801 "Bestimmungspunkt setzen [{Einrichtung = <Einrichtungsname>}]", das mit dem Rang "1" angezeigt wird, wird mit einer Absichtsschätzungs-Trefferquote 0,462 erhalten, und das Absichtsschätzungsergebnis 1802 "Registrierungspunkthinzufügung [{Einrichtung = <Einrichtungsname>}]", das mit dem Rang "2" angezeigt wird, wird mit einer Absichtsschätzungs-Trefferquote 0,243 erhalten. Es ist zu beachten, dass in 18, obgleich dies nicht illustriert ist, Absichtsschätzungsergebnisse und ihre Absichtsschätzungs-Trefferquoten mit den Rängen, die dem Rang "1" und dem Rang "2" nachfolgen, ebenfalls gesetzt sind.
-
Wenn die Absichtsschätzungsergebnis-Liste erhalten wird, geht der Vorgang zu der Verarbeitung im Schritt ST306 weiter.
-
Der Absichtsschätzungs-Prozessor 107 beurteilt auf der Grundlage der im Schritt ST305 erhaltenen Absichtsschätzungsergebnis-Liste, ob eine Absicht des Benutzers eindeutig bestimmt werden kann oder nicht (Schritt ST306). Die Beurteilungsverarbeitung im Schritt ST306 wird beispielsweise auf der Grundlage der zwei Kriterien (a), (b), die in dem vorher beschriebenen Ausführungsbeispiel gezeigt sind, durchgeführt. Wenn sowohl dem Kriterium (a) als auch dem Kriterium (b) genügt ist, das heißt, eine Absicht des Benutzers eindeutig bestimmt werden kann (Schritt ST306: JA), geht der Vorgang zu der Verarbeitung in dem Schritt ST308 weiter. Hierbei gibt der Absichtsschätzungs-Prozessor 107 die Absichtsschätzungsresultat-Liste zu dem Antworttextnachrichten-Generator 110 aus.
-
Demgegenüber geht, wenn zumindest eines der Kriterien (a) und (b) nicht genügt ist, das heißt, wenn keine Absicht des Benutzers eindeutig bestimmt werden kann (Schritt ST306: NEIN), der Vorgang zu der Verarbeitung im Schritt ST307 weiter. Hierbei gibt der Absichtsschätzungs-Prozessor 107 die Absichtsschätzungsergebnis-Liste und die Merkmalsliste zu der Extraktionsvorrichtung 114 für bekannte Wörter aus.
-
In dem Fall des Absichtsschätzungsergebnisses mit dem in 18 gezeigten Rang "1" ist die Absichtsschätzungs-Trefferquote "0,462" und genügt somit nicht dem Kriterium (a). Demgemäß wird beurteilt, dass keine Absicht des Benutzers bestimmt werden kann, so dass der Vorgang zu der Verarbeitung im Schritt ST1701 weitergeht.
-
In der Verarbeitung im Schritt ST1701 führt die Extraktionsvorrichtung 114 für bekannte Wörter die Extraktion eines bekannten Worts auf der Grundlage der von dem Absichtsschätzungs-Prozessor 107 bereitgestellten Merkmalsliste durch. Die Extraktionsverarbeitung für ein bekanntes Wort im Schritt ST1701 wird im Einzelnen mit Bezug auf das Flussdiagramm in 19 beschrieben.
-
Die Extraktionsvorrichtung 114 für bekannte Wörter zieht aus der bereitgestellten Merkmalsliste jedes Merkmal, das nicht in dem in dem Absichtsschätzungsmodell-Speicher 106 gespeicherten Absichtsschätzungsmodell enthalten ist, als einen Kandidaten für ein unbekanntes Wort heraus und fügt es zu einer Liste aus Kandidaten für ein unbekanntes Wort hinzu (Schritt ST601).
-
In dem Fall der im Schritt ST304 erzeugten Merkmalsliste wird das Merkmal "Mai Feibareit" als ein Kandidat für ein unbekanntes Wort herausgezogen und zu der Liste aus Kandidaten für ein unbekanntes Wort hinzugefügt.
-
Dann beurteilt die Extraktionsvorrichtung 114 für bekannte Wörter, ob ein oder mehrere Kandidaten für ein unbekanntes Wort im Schritt ST601 herausgezogen wurden oder nicht (Schritt ST602). Wenn kein Kandidat für ein unbekanntes Wort herausgezogen wurde (Schritt ST602: NEIN), wird die Extraktionsverarbeitung für ein unbekanntes Wort beendet und der Vorgang geht zu der Verarbeitung im Schritt ST308 weiter.
-
Wenn demgegenüber ein oder mehrere Kandidaten für ein unbekanntes Wort herausgezogen wurden (Schritt ST602: JA), sammelt die Extraktionsvorrichtung 114 für bekannte Wörter jedes der Merkmale, die andere als die in der Liste für Kandidaten für ein unbekanntes Wort enthaltene Kandidaten für ein unbekanntes Wort sind, als eine Liste für Kandidaten für ein bekanntes Wort (Schritt ST1901).
-
In dem Fall der im Schritt ST304 erzeugten Merkmalsliste entspricht "#Einrichtungsname" der Liste für Kandidaten für ein bekanntes Wort. Dann löscht die Extraktionsvorrichtung für bekannte Wörter von denjenigen in der Liste für Kandidaten für ein bekanntes Wort, die in dem Schritt ST1901 gesammelt wurde, jeden Kandidaten für ein bekanntes Wort, dessen lexikale Kategorie eine andere als Verb, Substantiv und Adjektiv ist, um hierdurch die Liste in eine Liste aus bekannten Worten zu modifizieren (Schritt ST1902).
-
In dem Fall der im Schritt ST304 erzeugten Merkmalsliste entspricht "#Einrichtungsname" der Liste aus Kandidaten für ein bekanntes Wort, und folglich ist nur "
-Stadion" in der Liste für bekannte Wörter enthalten. Die Extraktionsvorrichtung
114 für bekannte Wörter gibt die Absichtsschätzungsergebnisse und, wenn eine Liste aus bekannten Wörtern vorhanden ist, die Liste aus bekannten Wörtern zu dem Antworttextnachrichten-Generator
110 aus.
-
Bezugnehmend auf das Flussdiagramm in 17 wird die Beschreibung über die Operationen fortgesetzt.
-
Der Antworttextnachrichten-Generator 110 beurteilt, ob die Liste aus bekannten Wörtern von der Extraktionsvorrichtung 114 für bekannte Wörter bereitgestellt wurde oder nicht (Schritt ST1702). Wenn keine Liste aus bekannten Wörtern bereitgestellt wurde (Schritt ST1702: NEIN), erzeugt der Antworttextnachrichten-Generator 110 eine Antworttextnachricht unter Verwendung der in dem Dialog-Szenario-Datenspeicher 109 gespeicherten Dialog-Szenario-Daten durch Auslesen einer Antwortschablone, die mit dem Absichtsschätzungsergebnis übereinstimmt, aus diesem (Schritt ST1703). Weiterhin wird, wenn ein entsprechender Befehl in den Dialog-Szenario-Daten gesetzt ist, der Befehl gemäß dem Schritt ST1703 ausgeführt.
-
Wenn die Liste aus bekannten Wörtern bereitgestellt wurde (Schritt ST1702: JA) erzeugt der Antworttextnachrichten-Generator 110 eine Antworttextnachricht unter Verwendung der Dialog-Szenario-Daten, die in dem Dialog-Szenario-Datenspeicher 109 gespeichert sind, durch Auslesen einer Antwortschablone, die mit dem Absichtsschätzungsergebnis übereinstimmt, und einer Antwortschablone, die mit dem in der Liste aus bekannten Wörtern aufgelisteten bekannten Wort übereinstimmt, aus diesem (Schritt ST1704). Bei der Erzeugung der Antworttextnachricht wird eine Antworttextnachricht, die mit der Liste aus bekannten Wörtern übereinstimmt, vor einer Antworttextnachricht, die mit dem Absichtsschätzungsergebnis übereinstimmt, eingefügt. Weiterhin wird, wenn ein entsprechender Befehl in den Dialog-Szenario-Daten gesetzt ist, der Befehl gemäß dem Schritt ST1704 ausgeführt.
-
In dem Beispiel der in
18 gezeigten Absichtsschätzungsergebnisse sind zwei von ihnen, nämlich das erstrangige Absichtsschätzungsergebnis "Bestimmungspunkt setzen [{Einrichtung = <Einrichtungsname>}]" und das zweitrangige Absichtsschätzungsergebnis "Registrierungspunkthinzufügung [{Einrichtung = <Einrichtungsname>}]" als mehrdeutig gezeigt, so dass eine Antwortschablone
2001, die mit diesen übereinstimmt, ausgelesen wird und eine Antworttextnachricht "Ist '
-Stadion' als Bestimmungspunkt oder Registrierungspunkt zu setzen?" erzeugt wird.
-
Dann ersetzt, wenn die Liste aus bekannten Wörtern bereitgestellt wurde, der Antworttextnachrichten-Generator
110 <bekanntes Wort> in einer Schablone
2002 in den Dialog-Szenario-Daten für ein bekanntes Wort, die in
20B gezeigt sind, durch einen tatsächlichen Wert in der Liste für bekannte Wörter, um hierdurch eine Antworttextnachricht zu erzeugen. Wenn beispielsweise das vorgesehene bekannte Wort "
-Stadion" ist, lautet die erzeugte Antworttextnachricht: "Das Wort, das ein anderes als '
-Stadion' ist, ist ein unbekanntes Wort". Zuletzt wird die Antworttextnachricht, die mit der Liste aus bekannten Wörtern übereinstimmt, vor der Antworttextnachricht, die mit den Absichtsschätzungsergebnissen übereinstimmt, eingefügt, so dass eine Antworttextnachricht "Das Wort, das ein anderes als '
-Stadion' ist, ist ein unbekanntes Wort. Ist '
-Stadion' als Bestimmungspunkt oder Registrierungspunkt zu setzen?" erzeugt wird.
-
Der Sprachsynthetisierer
111 erzeugt Sprachdaten anhand der im Schritt ST1703 oder Schritt ST1704 erzeugten Antworttextnachricht, und gibt die Daten zu der Sprachausgabeeinheit
112 aus (Schritt ST311). Die Sprachausgabeeinheit
112 gibt als Sprache die im Schritt ST311 bereitgestellten Sprachdaten aus (Schritt ST312). Folglich ist die Verarbeitung des Erzeugens der Antworttextnachricht mit Bezug auf eine Aussage des Benutzers beendet. Gemäß den in
18 und
20 gezeigten Beispielen wird "das Wort, das ein anderes als '
-Stadion' ist, ist ein unbekanntes Wort. Ist '
-Stadion' als Bestimmungspunkt oder Registrierungspunkt zu setzen?", das die in
16 gezeigte Antwort
1603 ist, durch Sprache ausgegeben. Danach kehrt der Ablauf in dem Flussdiagramm zu der Verarbeitung im Schritt ST301 zurück, um auf eine von dem Benutzer durchzuführende Spracheingabe zu warten.
-
Da die Antwort
1603 durch Sprache ausgegeben wird, versteht der Benutzer, dass das Wort, das ein anderes als "
-Stadion" ist, nicht erkannt wurde, und somit kann ihm bewusst sein, dass "Mai Feibareit" nicht erkannt wurde, und dass er dies nur unter Verwendung eines anderen Ausdrucks zu sprechen hat. Beispielsweise kann der Benutzer wieder in einer Weise sprechen, die durch die Ansage
1604 "Füge es als Registrierungspunkt hinzu" in
16 dargestellt ist, und kann somit den Dialog mit dem Dialogsteuersystem
100b unter Verwendung des brauchbaren Worts hierfür durchführen.
-
Mit Bezug auf die Ansage 1604 führt das Dialogsteuersystem 100b wieder die in den Flussdiagrammen in 17 und 19 gezeigte Spracherkennungsverarbeitung durch. Als eine Folge wird ein Absichtsschätzungsergebnis "Registrierungspunkthinzufügung [{Kriterium = <Einrichtungsname>}]" im Schritt ST305 erhalten.
-
Weiterhin wird im Schritt ST1703 eine Schablone
2003 in den Dialog-Szenario-Daten für die Absicht in
20A ausgelesen als eine Antwortschablone, die mit "Registrierungspunkthinzufügung [{Kriterium = <Einrichtungsname>}]" übereinstimmt, und eine Antworttextnachricht "Werde '
-Stadion' als Registrierungspunkt hinzufügen" wird erzeugt, so dass ein Befehl "Hinzufügen von (Registrierungspunkt, <Einrichtungsname>)", der für die Hinzufügung des Einrichtungsnamens als einen Registrierungspunkt gegeben wird, ausgeführt wird. Dann werden im Schritt ST311 Sprachdaten aus der Antworttextnachricht erzeugt, und im Schritt ST312 werden die Sprachdaten durch Sprache ausgegeben. Auf diese Weise ist es möglich, den Befehl gemäß der Benutzerabsicht durch einen reibungslosen Dialog mit dem Dialogsteuersystem
100b auszuführen.
-
Wie vorstehend beschrieben ist, enthält die Konfiguration gemäß dem dritten Ausführungsbeispiel: den morphologischen Analysierer 105, der das Spracherkennungsergebnis in Morpheme teilt; den Absichtsschätzungs-Prozessor 107, der eine Absicht des Benutzers aus den morphologischen Analyseergebnissen schätzt; die Extraktionsvorrichtung 114 für bekannte Wörter, die, wenn eine Absicht des Benutzers nicht eindeutig bestimmt werden kann, aus den morphologischen Analyseergebnissen ein Merkmal, das ein anderes als das unbekannte Wort ist, als ein bekanntes Wort herauszieht; und den Antworttextnachrichten-Generator 110, der, wenn das bekannte Wort herausgezogen ist, eine Antworttextnachricht erzeugt, die das bekannte Wort enthält, nämlich eine Antworttextnachricht, die ein anderes Wort als jedes der Wörter, die als das unbekannte Wort vorgesehen sind, enthält. Somit ist es möglich, ein Wort zu präsentieren, anhand dessen jede Absicht durch das Dialogsteuersystem 100b geschätzt werden kann, um hierdurch zu bewirken, dass der Benutzer ein Wort erkennt, das im Ausdruck zu ändern ist, so dass der Dialog reibungslos verlaufen kann.
-
Obgleich die vorstehenden Ausführungsbeispiel 1 bis 3 als ein Beispiel beschrieben wurden, in dem die japanische Sprache phonetisch erkannt wird, können die Dialogsteuersysteme 100, 100a, 100b auf verschiedene Sprachen wie Englisch, Deutsch, Chinesisch oder dergleichen angewendet werden, indem das Extraktionsverfahren für das Merkmal auf die Absichtsschätzung bezogen wird, die für jede der jeweiligen Sprachen durch den Absichtsschätzung-Prozessor 107 durchgeführt wird.
-
Wenn weiterhin die Dialogsteuersystem 100, 100a, 100b, die in dem jeweils vorbeschriebenen ersten bis dritten Ausführungsbeispiel gezeigt sind, auf die Sprache anzuwenden sind, deren Wort durch ein spezifisches Symbol (zum Beispiel, einen Zwischenraum) unterteilt sind, und wenn ihre linguistische Struktur schwierig zu analysieren ist, ist es auch zulässig, anstelle des morphologischen Analysierers 105 eine Konfiguration zum Durchführen der Extraktionsverarbeitung zum Herausziehen von <Einrichtungsname>, <Wohnort> oder dergleichen aus einem eingegebenen natürlichen Sprachtext unter Verwendung beispielsweise eines Musteranpassungsverfahrens vorzusehen; und den Absichtsschätzungs-Prozessor 107 so zu konfigurieren, dass er die Absichtsschätzungsverarbeitung mit den herausgezogenen <Einrichtungsname>, <Wohnort> oder dergleichen durchführt.
-
Weiterhin wurde in dem jeweils vorbeschriebenen ersten bis dritten Ausführungsbeispiel die Verarbeitung der morphologischen Analyse bei dem eingegebenen Text durchgeführt, der durch die Spracherkennung erhalten wurde, wenn eine Spracheingabe erfolgt ist. Alternativ ist es zulässig, nicht das Spracherkennungsergebnis als eine Eingabe zu verwenden, sondern eine Konfiguration derart vorzunehmen, dass die Verarbeitung der morphologischen Analyse bei einer Texteingabe durchgeführt wird, die durch Verwendung einer Eingabevorrichtung, beispielsweise einer Tastatur oder dergleichen, erhalten wird. Mit dieser Konfiguration kann mit Bezug auf eine Texteingabe, die eine andere als eine Spracheingabe ist, eine ähnliche Wirkung wie vorbeschrieben erzielt werden.
-
Weiterhin wurde in dem jeweils vorbeschriebenen ersten bis dritten Ausführungsbeispiel eine derartige Konfiguration gezeigt, bei der der morphologische Analysierer 105 eine Verarbeitung der morphologischen Analyse des Texts, der als das Spracherkennungsergebnis erhalten wurde, durchgeführt, und dann die Absichtsschätzung durchgeführt. Alternativ ist es in dem Fall, in welchem ein durch die Spracherkennungsmaschine erhaltenes Ergebnis selbst ein morphologisches Analyseergebnis enthält, zulässig, so zu konfigurieren, dass die Absichtsschätzung direkt unter Verwendung von Informationen, die dieses Ergebnis anzeigen, durchgeführt werden kann.
-
Weiterhin ist in dem jeweils vorbeschriebenen ersten bis dritten Ausführungsbeispiel, obgleich das Absichtsschätzungsverfahren unter Verwendung eines Beispiels beschrieben wurde, in welchem die Anwendung eines Lernmodells unter Verwendung eines Verfahrens der maximalen Entropie angenommen wird, das Absichtsschätzungsverfahren nicht hierauf beschränkt.
-
GEWERBLICHE ANWENDBARKEIT
-
Das Dialogsteuersystem gemäß der Erfindung ist in der Lage, eine Rückkopplung zu dem Benutzer durch Informationen, die anzeigen, welches Wort unter den von dem Benutzer gesprochenen Wörtern nicht verwendet werden kann, vorzusehen, und daher ist es geeignet zur Verwendung für die Verbesserung der Durchführung eines Dialogs mit einer Fahrzeug-Navigationsvorrichtung, einem Mobiltelefon, einem tragbaren Endgerät, einer Informationsvorrichtung oder dergleichen, in denen ein Spracherkennungssystem oder dergleichen installiert ist.
-
BEZUGSZEICHENLISTE
-
- 100, 100a, 100b: Dialogsteuersystem, 101: Spracheingabeeinheit, 102: Spracherkennungs-Wörterbuchspeicher, 103: Spracherkennungsvorrichtung, 104: Wörterbuchspeicher für morphologische Analyse, 105: morphologischer Analysierer, 106, 106a: Absichtsschätzungsmodell-Speicher, 107: Absichtsschätzungs-Prozessor, 108, 108a: Extraktionsvorrichtung für unbekannte Wörter, 109: Dialog-Szenario-Datenspeicher, 110: Antworttextnachrichten-Generator, 111: Sprachsynthetisierer, 112: Sprachausgabeeinheit, 113: syntaktischer Analysierer, 114: Extraktionsvorrichtung für bekannte Wörter.