DE112016006549B4 - Antworterzeugungsvorrichtung, dialogsteuersystem und antworterzeugungsverfahren - Google Patents

Antworterzeugungsvorrichtung, dialogsteuersystem und antworterzeugungsverfahren Download PDF

Info

Publication number
DE112016006549B4
DE112016006549B4 DE112016006549.3T DE112016006549T DE112016006549B4 DE 112016006549 B4 DE112016006549 B4 DE 112016006549B4 DE 112016006549 T DE112016006549 T DE 112016006549T DE 112016006549 B4 DE112016006549 B4 DE 112016006549B4
Authority
DE
Germany
Prior art keywords
user
response
sentence
function
symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE112016006549.3T
Other languages
English (en)
Other versions
DE112016006549T5 (de
Inventor
Yoichi Fujii
Yusuke Koji
Keisuke Watanabe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE112016006549T5 publication Critical patent/DE112016006549T5/de
Application granted granted Critical
Publication of DE112016006549B4 publication Critical patent/DE112016006549B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Antworterzeugungsvorrichtung, welche aufweist:
eine Dialogmanagementeinheit (31) zum Auswählen einer Antwortschablone entsprechend einem Dialogzustand mit einem Benutzer aus Antwortschablonen entsprechend vorbestimmten Dialogzuständen und zum Ausgeben eines Begriffssymbols, das in der ausgewählten Antwortschablone enthalten ist;
eine Verständnispegel-Schätzeinheit (30) zur Bezugnahme auf eine Schätzbedingungstabelle (5A), in der mehrere Schätzbedingungen, die durch die vorbestimmten Dialogzustände definiert sind, und Wichtungen, die den jeweiligen Schätzbedingungen entsprechend dem Verständnis für Begriffssymbole zugeteilt sind, miteinander assoziiert sind, und eine Häufigkeitstabelle (5B), in der Häufigkeiten, mit denen eine Funktion in den jeweiligen Schätzbedingungen ausgeführt wurde, und ein Begriffssymbol entsprechend der Funktion miteinander assoziiert sind, zum Spezifizieren der Häufigkeiten und der Wichtungen der jeweiligen Schätzbedingungen der Funktion entsprechend dem Begriffssymbol, das von der Dialogmanagementeinheit (31) eingegeben wurde, und zum Ausgeben eines Ergebnisses einer Größenbestimmung einer Ergebnisquote, die anhand der spezifizierten Häufigkeiten und Wichtungen berechnet wurde, zu der Dialogmanagementeinheit (31) als Verständnispegel eines Benutzers für das Begriffssymbol; und
eine Antworterzeugungseinheit (32) zum Erzeugen eines Antwortsatzes in dem Dialogzustand mit dem Benutzer auf der Grundlage der von der Dialogmanagementeinheit (31) ausgewählten Antwortschablone, Hinzufügen eines erläuternden Satzes zu dem Antwortsatz in Abhängigkeit von dem Verständnispegel des Benutzers für das von der Dialogmanagementeinheit (31) eingegebene Begriffssymbol, und Ausgeben des Antwortsatzes.

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung bezieht sich auf eine Antworterzeugungsvorrichtung, die den Verständnispegel eines Benutzers für in einem System in einem Dialog zwischen dem Benutzer und dem System verwendete Begriffe schätzt und einen Antwortsatz für die Erleichterung des Verständnisses des Benutzers der Begriffe auf der Grundlage des Schätzergebnisses erzeugt, ein Dialogsteuersystem enthaltend die Antworterzeugungsvorrichtung, und ein Antworterzeugungsverfahren.
  • STAND DER TECHNIK
  • In den letzten Jahren wurde die Aufmerksamkeit auf Technologien zum Eingeben der Sprache von von Menschen geäußerten Wörtern und Ausgeben von Funktionen entsprechend Erkennungsergebnissen der eingegebenen Sprache fokussiert. Diese Technologien werden als eine Sprachschnittstelle von Vorrichtungen wie Mobiltelefonen und Fahrzeug-Navigationsvorrichtungen verwendet. Als ein grundsätzlicher Algorithmus werden angenommene Spracherkennungsergebnisse und Funktionen vorher assoziiert, und in einem Fall, in welchem ein Erkennungsergebnis für eingegebene Sprache angenommen wurde, wird eine Funktion entsprechend diesem Erkennungsergebnis ausgeführt. Da auf diese Weise eine Funktion durch die Äußerung eines Benutzers direkt ausgeführt wird, ist dies wirksam als eine Abkürzung zum Bezeichnen einer auszuführenden Funktion.
  • Damit ein Benutzer eine beabsichtigte Funktion ausführt, ist es erforderlich, einen Begriff entsprechend der Funktion zu äußern. Daher nimmt, wenn die Anzahl von in einem System ausführbaren Funktionen zunimmt, die Anzahl von Begriffen, die der Benutzer sich merken muss, ebenfalls zu. In diesem Fall besteht, wenn der Benutzer eine Betriebsanweisung des Systems nicht ausreichend versteht, die Wahrscheinlichkeit, dass der Benutzer nicht weiß, welchen Begriff er äußern soll, wenn die beabsichtigte Funktion ausgeführt wird.
  • Als eine herkömmliche Technik zum Lösen derartiger Probleme gibt es beispielsweise eine im Patentdokument 1 beschriebene Vorrichtung. In dieser Vorrichtung wird die Anzahl von Malen von Auszeiten der Spracheingabe, die eine auszuführende Funktion bezeichnet, oder die Anzahl von Malen der Korrektur dieser Spracheingabe gezählt, und der Verständnispegel eines Benutzers mit Bezug auf den Inhalt einer Führungssatz-Anregungsbezeichnung für die Funktion wird anhand des Zählergebnisses geschätzt. Dann wird aus Führungssätzen mit unterschiedlichem Grad von Einzelheiten des Inhalts dem Benutzer ein Führungssatz mit einem Grad von Einzelheiten entsprechend dem geschätzten Verständnispegel präsentiert.
  • Zusätzlich werden beispielsweise bei einem im Patentdokument 2 beschriebenen Verfahren Merkmalswörter für jede Kategorie aus Kennungsinformationen eines sozialen Lesezeichens eines Benutzers herausgezogen. Dann wird auf der Grundlage der Historie oder anderen Informationen von Webseiten, die Häufigkeit, mit der ein Merkmalswort auf den Webseiten, auf die der Benutzer zugegriffen hat, verwendet wird, gezählt, und eine Kategorie, in der die Benutzungshäufigkeit des Merkmalsworts kleiner als oder gleich einem Schwellenwert ist, wird als eine dem Benutzer unbekannte Kategorie bestimmt. In dem Fall, in welchem ein Merkmalswort einer Webseite, die von dem Benutzer aufgerufen wurde, zu der unbekannten Kategorie gehört, wird bestimmt, dass das Merkmalswort dieser Webseite ein dem Benutzer unbekanntes Wort ist, und ein erläuternder Satz über das unbekannte Wort wird dem Benutzer präsentiert.
  • Die Patentdokumente 3 und 4 beschreiben ein Spracherkennungsverfahren beziehungsweise ein Sprachdialogverfahren, bei denen eine Dialogführung unter Verwendung von spezifischen gespeicherten Benutzerdaten durchgeführt wird. Dabei werden der Verständnispegel und Eingabecharakteristika des Benutzers berücksichtigt.
  • ZITIERUNGSLISTE
  • PATENTDOKUMENTE
    • Patentdokument 1: WO 2008/084575 A1
    • Patentdokument 2: JP 2010-92286 A
    • Patentdokument 3: US 2008/0103781 A1
    • Patentdokument 4: EP 1 761 015 A1
  • KURZFASSUNG DER ERFINDUNG
  • TECHNISCHES PROBLEM
  • Bei der im Patentdokument 1 beschriebenen Vorrichtung wird der Verständnispegel eines Benutzers mit Bezug auf eine Führungssatz-Anregungsbezeichnung einer auszuführenden Funktion geschätzt, und der Führungssatz wird so geändert, dass er einen Grad von Einzelheiten entsprechend diesem Verständnispegel hat, und hierdurch dem Benutzer präsentiert. Jedoch zeigt dieser Führungssatz lediglich den von dem Benutzer zum Bezeichnen der Funktion geäußerten Inhalt an und erläutert nicht die Begriffe selbst, deren Inhalt der Benutzer unter den Funktionen bezeichnenden Begriffen nicht versteht. Daher kann ungeachtet dessen, wie sehr der Inhalt des Führungssatzes geändert wird, der Benutzer die Begriffe nicht verstehen, und der Zustand, in welchem der Inhalt der Begriffe nicht verstanden wird, wird selbst bei der nächsten Spracheingabe fortgesetzt.
  • Beispielsweise kann in dem Fall, in welchem die Funktion des Änderns der Orientierung einer Karte in einem Fahrzeug-Navigationssystem durch Spracheingabe bezeichnet wird, bei der im Patentdokument 1 beschriebenen Vorrichtung, obgleich bestimmt werden kann, dass der Benutzer Funktionen, die einen Begriff „Norden oben“ oder „vorwärts nach oben“ enthalten, nicht kennt, nicht bestimmt werden, ob beide oder einer von „Norden oben“ und „vorwärts nach oben“ nicht verstanden wird. Daher ist es, obgleich es möglich ist, dem Benutzer Antwortinformationen mit einem höheren Grad von Einzelheiten zu präsentieren, nicht möglich, optimale Antwortinformationen zu präsentieren, um das Verständnis der Begriffe zu erleichtern.
  • Auch wird bei einem im Patentdokument 2 beschriebenen Verfahren in dem Fall, in welchem ein Merkmalswort einer durch den Benutzer aufgerufenen Webseite zu der unbekannten Kategorie gehört, bestimmt, dass das Merkmalswort dieser Webseite ein dem Benutzer unbekanntes Wort ist, und ein erläuternder Satz über das unbekannte Wort wird dem Benutzer präsentiert.
  • Jedoch schätzt das im Patentdokument 2 beschriebene Verfahren lediglich den Erkenntnispegel des Benutzers hinsichtlich der Kategorie und schätzt nicht den Verständnispegel des Benutzers hinsichtlich des Begriffs selbst. Daher besteht das Problem, dass Antwortinformationen, die Begriffe, die der Benutzer nicht versteht, angemessen erklären, nicht präsentiert werden können.
  • Beispielsweise wird in dem Fall, in welchem „Norden oben“ verstanden wird, aber „vorwärts nach oben“ nicht verstanden wird als auf die Orientierung einer Karte bezogene Funktionen, bei dem im Patentdokument 2 beschriebenen Verfahren der Verständnispegel für „Orientierung einer Karte“, was eine Kategorie ist, zu der diese Begriffe gehören, geschätzt.
  • Jedoch wird der Verständnispegel des Benutzers für Begriffe selbst, die zu der Kategorie „Orientierung der Karte“ gehören, nicht geschätzt. Aus diesem Grund besteht, selbst in dem Fall, in welchem der Verständnispegel des Benutzers für den Begriff „Norden oben“ hoch ist, eine Wahrscheinlichkeit, dass ein erläuternder Satz für diesen Begriff dem Benutzer präsentiert wird, und selbst in dem Fall, in welchem der Benutzer über den Begriff „vorwärts nach oben“ informiert werden möchte, ein erläuternder Satz über diesen Begriff nicht präsentiert wird.
  • Die vorliegende Erfindung löst die vorgenannten Probleme, und es ist eine Aufgabe der vorliegenden Erfindung, eine Antworterzeugungsvorrichtung, ein Dialogsteuersystem und ein Antworterzeugungsverfahren anzugeben, die in der Lage sind, das Verständnis eines Benutzers für in einem Dialog verwendete Begriffe angemessen zu erleichtern.
  • LÖSUNG DES PROBLEMS
  • Eine Antworterzeugungsvorrichtung nach der vorliegenden Erfindung enthält eine Dialogmanagementeinheit, eine Verständnispegel-Schätzeinheit und eine Antworterzeugungseinheit. Die Dialogmanagementeinheit wählt eine Antwortschablone entsprechend einem Dialogzustand mit einem Benutzer aus Antwortschablonen entsprechend vorbestimmten Dialogzuständen aus und gibt ein Begriffssymbol aus, das in der ausgewählten Antwortschablone enthalten ist. Die Verständnispegel-Schätzeinheit bezieht sich auf eine Schätzbedingungstabelle, in der mehrere Schätzbedingungen, die durch die vorbestimmten Dialogzustände definiert sind, und Wichtungen, die den jeweiligen Schätzbedingungen entsprechend dem Verständnis für Begriffssymbole miteinander assoziiert sind, und eine Häufigkeitstabelle, in der Häufigkeiten, mit der eine Funktion bei den jeweiligen Schätzbedingungen ausgeführt wird, und ein Begriffssystem entsprechend der Funktion miteinander assoziiert sind, spezifiziert Häufigkeiten und Wichtungen der jeweiligen Schätzbedingungen für die Funktion entsprechend dem von der Dialogmanagementeinheit eingegebenen Begriffssymbol, und gibt ein Ergebnis einer Größenbestimmung einer anhand der spezifizierten Häufigkeiten und der Wichtungen berechneten Ergebnisquote zu der Dialogmanagementeinheit als den Verständnispegel des Benutzers für das Begriffssymbol aus. Die Antworterzeugungseinheit erzeugt einen Antwortsatz in dem Dialogzustand mit dem Benutzer auf der Grundlage der durch die Dialogmanagementeinheit ausgewählten Antwortschablone, fügt einen erläuternden Satz über das Begriffssymbol zu dem Antwortsatzsatz in Abhängigkeit von dem Verständnispegel des Benutzers für das von der Dialogmanagementeinheit eingegebene Begriffssymbol hinzu und gibt den Antwortsatz aus.
  • VORTEILHAFTE WIRKUNGEN DER ERFINDUNG
  • Gemäß der vorliegenden Erfindung wird der Verständnispegel eines Benutzers für einen in einem Dialog mit dem Benutzer präsentiertes Begriffssymbol geschätzt, und ein erläuternder Satz wir zu einem Antwortsatz in Abhängigkeit von dem Verständnispegel hinzugefügt, und somit ist es möglich, angemessen das Verständnis des Benutzers für den in dem Dialog verwendeten Begriff zu erleichtern.
  • Figurenliste
    • 1 ist ein Blockschaltbild, das eine Konfiguration eines Dialogsteuersystems nach einem ersten Ausführungsbeispiel der Erfindung illustriert.
    • 2 ist eine Tabelle, die ein Beispiel für eine Schätzbedingungstabelle illustriert.
    • 3A ist eine Tabelle, die ein Beispiel für eine Häufigkeitstabelle in dem Fall illustriert, in welchem ein Dialog zum ersten Mal durchgeführt wird.
    • 3B ist eine Tabelle, die ein Beispiel für die Häufigkeitstabelle in dem Fall illustriert, in welchem ein Dialog mehrere Male durchgeführt wird.
    • 4 ist eine Tabelle, die ein Beispiel für eine Begriffserläuterungstabelle illustriert.
    • 5A ist ein Diagramm, das eine Hardwarekonfiguration zum Implementieren des Dialogsteuersystems illustriert.
    • 5B ist ein Diagramm, das eine Hardwarekonfiguration zum Ausführen von Software für die Ausführung des Dialogsteuersystems illustriert.
    • 6 ist ein Flussdiagramm, das die Arbeitsweise einer Antworterzeugungsvorrichtung nach dem ersten Ausführungsbeispiel illustriert.
    • 7 ist ein Flussdiagramm, das die Arbeitsweise des Dialogsteuersystems nach dem ersten Ausführungsbeispiel illustriert.
    • 8 ist ein Diagramm, das spezifische Beispiele für Steuerinformationen, die durch Dialog mit einem Benutzer ausführbare Funktionen definieren, und Antwortschablonen entsprechend den jeweiligen Funktionen illustriert.
    • 9 ist en Flussdiagramm, das ein Beispiel für eine spezifische Operation der Antworterzeugungsvorrichtung nach dem ersten Ausführungsbeispiel illustriert.
    • 10 ist ein Flussdiagramm, das eine spezifische Verarbeitung der Schätzung eines Verständnispegels für einen Begriff illustriert.
    • 11 ist ein Blockschaltbild, das eine Konfiguration eines Dialogsteuersystems nach einem zweiten Ausführungsbeispiel der Erfindung illustriert.
    • 12 ist ein Flussdiagramm, das eine spezifische Operation einer Antworterzeugungsvorrichtung nach dem zweiten Ausführungsbeispiel illustriert.
    • 13 ist ein Diagramm, das spezifische Beispiele für Antwortschablonen und Antwortinformationen nach dem zweiten Ausführungsbeispiel illustriert.
  • BESCHREIBUNG VON AUSFÜHRUNGSBEISPIELEN
  • Um die Erfindung weiterhin im Einzelnen zu beschreiben, werden nachfolgend Ausführungsbeispiele zum Ausführen der Erfindung mit Bezug auf die begleitenden Zeichnungen beschrieben.
  • Erstes Ausführungsbeispiel
  • 1 ist ein Blockschaltbild, das eine Konfiguration eines Dialogsteuersystems 1 nach einem ersten Ausführungsbeispiel der Erfindung illustriert. Wie in 1 illustriert ist, steuert das Dialogsteuersystem 1 die Eingabe und Ausgabe von Informationen im Dialog mit einem Benutzer und enthält eine Eingangseinheit 2, eine Antworterzeugungsvorrichtung 3, eine Ausgabeeinheit 4, eine Häufigkeitsinformations-Speichereinheit 5, eine Speichereinheit 6 für erläuternde Informationen, und eine Antwortschablonen-Speichereinheit 7.
  • Die Eingangseinheit 2 ist eine Komponente, die von einem Benutzer eingegebene Informationen annimmt und eine Eingangseinheit 20 für manuelle Operationen und eine Spracherkennungseinheit 21 enthält. Die Antworterzeugungsvorrichtung 3 erzeugt einen in einem Dialog mit einem Benutzer präsentierten Antwortsatz und enthält eine Verständnispegel-Schätzeinheit 30, eine Dialogmanagementeinheit 31 und eine Antworterzeugungseinheit 32.
  • Die Ausgabeeinheit 4 stellt hör- oder sichtbar den von der Antworterzeugungsvorrichtung 3 ausgegebenen Antwortsatz für den Benutzer dar. Beispielsweise wird der Antwortsatz in eine Sprache synthetisiert und hierdurch ausgegeben. Alternativ wird der Antwortsatz auf einem Monitorschirm als Textinformation angezeigt.
  • Die Häufigkeitsinformations-Speichereinheit 5 speichert Häufigkeitsinformationen, die für jeden in einem Dialog befindlichen Benutzer erhalten werden. Die Häufigkeitsinformationen enthalten eine Schätzbedingungstabelle und eine Häufigkeitstabelle.
  • 2 ist eine Tabelle, die ein Beispiel für eine Schätzbedingungstabelle 5A illustriert. Die Schätzbedingungstabelle 5A enthält Tabelleninformationen, in denen mehrere Schätzbedingungen und Wichtungen wi , die den jeweiligen Schätzbedingungen zugeteilt sind, entsprechend dem Verständnis für Begriffssymbole miteinander assoziiert sind. In dem Fall von 2 sind Schätzbedingungen, denen die Bedingungsnummern 1 bis 6 zugewiesen sind, und Wichtungen wa , die den jeweiligen Schätzbedingungen zugeteilt sind, in der Schätzbedingungstabelle 5A miteinander assoziiert.
  • Es ist festzustellen, dass i ein Suffix ist, das eine Bedingungsnummer anzeigt, und in dem Fall von 2 ist i = 1 bis 6.
  • Die Schätzbedingung ist durch einen Dialogzustand definiert, beispielsweise ist die Schätzbedingung der Bedingungsnummer 1 definiert durch einen Dialogzustand, dass „der Benutzer einen Begriff geäußert hat, bevor die Sprachführung enthaltend den Begriff oder einen erläuterten Satz für den Begriff ausgegeben wird“.
  • IN diesem Fall besteht, da der Benutzer den Begriff plötzlich ohne Ausgabe der Sprachführung geäußert hat, eine hohe Wahrscheinlichkeit, dass der Benutzer den Begriff mit Verständnis für den Inhalt des Begriffs geäußert hat.
  • Daher wird die Schätzbedingung der Bedingungsnummer 11,00 zugewiesen, was der größte Wert für die auf das Verständnis des Benutzers für das Begriffssymbol bezogene Wichtung w1 ist.
  • Die Schätzbedingung der Bedingungsnummer 5 ist definiert durch einen Dialogzustand, dass „während ein Auswahlschirm eines Begriffs angezeigt wird, hat der Benutzer eine Funktion bezeichnet, die eine andere als eine Funktion entsprechend dem Begriff ist“.
  • In diesem Fall hat, obgleich der Auswahlschirm für den Begriff angezeigt wird, der Benutzer unter Verwendung der Eingangseinheit eine Funktion bezeichnet, die eine andere als die Funktion entsprechend dem Begriffssymbol ist. Es ist hierdurch vorstellbar, dass es höchstwahrscheinlich ist, dass der Benutzer den Begriff des Auswahlschirms nicht gut versteht und somit eine Funktion bezeichnet hat, die verschieden von der Funktion entsprechend dem Begriffssymbol ist.
  • Daher wird der Schätzbedingung der Bedingungsnummer 5 der relativ kleine Wert 0,20 als die Wichtung w5 in Bezug auf das Verständnis des Benutzers für das Begriffssymbol zugewiesen.
  • 3A ist eine Tabelle, die ein Beispiel für eine Häufigkeitstabelle 5B in dem Fall, in welchem ein Dialog zum ersten Mal durchgeführt wird, illustriert. 3B ist eine Tabelle, die ein Beispiel für die Häufigkeitstabelle 5B in dem Fall, in welchem ein Dialog mehrere Male durchgeführt wird, illustriert.
  • Die Häufigkeitstabelle 5B enthält Tabelleninformationen, in denen eine Häufigkeit fi , mit der eine Funktion in einem Dialogzustand für jede von Schätzbedingungen bezeichnet und ausgeführt wird, mit einem Begriffssymbol entsprechend der Funktion assoziiert ist, und enthält Häufigkeitsdaten für jedes Begriffssymbol. Häufigkeitsdaten zeigen Häufigkeiten fi an, mit denen eine Funktion entsprechend einem Begriffssymbol von einem Benutzer unter Schätzbedingungen der Bedingungsnummern 1 bis 6 bezeichnet und ausgeführt wird.
  • Ein Begriffssymbol entspricht einer Funktion, die ein Benutzer durch einen Dialog bezeichnen kann, und ein Begriff oder ein erläuternder Satz über den Begriff wird gesetzt. Es ist zu beachten, dass in der folgenden Beschreibung das Setzen eines Begriffs oder eines erläuternden Satzes für ein Begriffssymbol beschrieben wird als „Einsetzen eines Begriffs oder eines erläuternden Satzes an einer Begriffseinsatzposition“, wie es angemessen ist, wobei beide das Gleiche bedeuten.
  • Häufigkeitsdaten 5B-1 des Begriffssymbols „#Norden oben“ zeigen Häufigkeiten f1 bis f6 an, bei denen eine Funktion entsprechend dem Begriffssymbol „#Norden oben“ unter Schätzbedingungen jeweils der Bedingungsnummern 1 bis 6 bezeichnet und ausgeführt wird. Die Funktion entsprechend dem Begriffssymbol „#Norden oben“ ist eine Funktion des Anzeigens einer Karte derart, dass der Norden nach oben orientiert ist.
  • Häufigkeitsdaten 5B-2 des Begriffssymbols „#vorwärts nach oben“ zeigen Häufigkeiten f1 bis f6 an, mit denen eine Funktion entsprechend dem Begriffssymbol „#vorwärts nach oben“ von dem Benutzer unter Schätzbedingungen der jeweiligen Bedingungsnummern 1 bis 6 von dem Benutzer bezeichnet und ausgeführt wird. Die Funktion entsprechend dem Begriffssymbol „#vorwärts nach oben“ ist eine Funktion des Anzeigens einer Karte in der Weise, dass die Fahrtrichtung des Fahrzeugs nach oben orientiert ist.
  • Es ist zu beachten, dass, da die in 3A illustrierte Häufigkeitstabelle 5B Informationen entspricht, wenn ein Dialog zum ersten Mal durchgeführt wird, die Häufigkeit fi nicht gezählt wird. Daher sind die Häufigkeiten fi sowohl der Häufigkeitsdaten 5B-1 und der Häufigkeitsdaten 5B-2 gleich 0.
  • Andererseits werden, da die in 3B illustrierte Häufigkeitstabelle 5B Informationen enthält, die erhalten werden, wenn ein Dialog mehrere Male durchgeführt wird, die Häufigkeiten fi sowohl in den Häufigkeitsdaten 5B-1 als auch den Häufigkeitsdaten 5B-2 gezählt. Beispielsweise ist die Häufigkeit f2 gleich 3 unter einer Schätzbedingung der Bedingungsnummer 2 in den Häufigkeitsdaten 5B-1.
  • Dies zeigt an, dass die Häufigkeit f2 , mit der die Funktion entsprechend dem Begriffssymbol „#Norden oben“ durch den Benutzer bezeichnet und ausgeführt wird, unter der Schätzbedingung der Bedingungsnummer 2 gleich drei Mal ist.
  • Die Speichereinheit 6 für erläuternde Informationen speichert eine Begriffserläuterungstabelle.
  • 4 ist eine Tabelle, die ein Beispiel für eine Begriffserläuterungstabelle 5C illustriert. Die Begriffserläuterungstabelle 5C enthält Tabelleninformationen, in denen in einem Dialog mit dem Benutzer verwendete Begriffssymbole mit Begriffen und erläuternden Sätzen, die für die Begriffssymbole gesetzt sind, assoziiert sind. Es ist zu beachten, dass ein erläuternder Satz in einer Form definiert ist, die mit einem Substantiv endet, so dass ein korrekter Satz erzeugt wird, wenn er für ein Begriffssymbol gesetzt wird.
  • Beispielweise wird ein erläuternder Satz für den Begriff „Norden oben“ als „Kartenanzeige, bei der der Norden oben angeordnet ist“ definiert.
  • In dem Fall einer Antwortschablone „Möchten Sie {#Norden oben}?“ führt, der erläuternde Satz zu dem Begriffssymbole #Norden oben zu einem Antwortsatz „Möchten Sie eine Kartenanzeige, bei der Norden oben angeordnet ist?“, der ein einen Sinn ergebender Satz ist.
  • Es ist zu beachten, dass das Setzen des Begriffs „Norden oben“ für das Begriffssymbol #Norden oben zu einem Antwortsatz „Möchten Sie norden oben?“ führt.
  • Auch ist in der Begriffserläuterungstabelle 5C ein erläuternder Satz für einen Begriff „VICS“ definiert als „Fahrzeuginformations- und -kommunikationssystem“, und ein erläuternder Satz für einen Begriff „smart-IC“ ist definiert als „Austausch, der durch eine ETC-Karte erfolgen kann“. Diese Begriffe sind auch derart definiert, dass sie mit einem Substantiv enden, so dass ein Satz einen Sinn macht, wenn ein erläuternder Satz für ein Begriffssymbol gesetzt wird.
  • Es ist zu beachten, dass VICS und ETC eingetragene Marken sind.
  • Die Antwortschablonen-Speichereinheit ist ein Speicher, der vorbestimmte Dialogzustände und Antwortschablonen entsprechend diesen Dialogzuständen speichert.
  • Eine Antwortschablone ist eine Schablone eines Satzes, der einem Benutzer von der Systemseite in jedem Dialogzustand präsentiert wird, und ein vorstehend beschriebenes Begriffssymbol kann in einigen Fällen darin angeordnet sein. Nachfolgend wird ein auf der Grundlage einer Antwortschablone erzeugter Satz als ein Antwortsatz bezeichnet.
  • Die Eingangseinheit 20 für manuelle Operationen der Eingangseinheit 2 ist eine Komponente, die durch manuelle Betätigung eines Benutzers eingegebene Informationen annimmt und Hardware wie eine Hardwaretaste und ein Touchpanel und Software zum Annehmen von unter Verwendung von diesen eingegebenen Informationen enthält. Die Spracherkennungseinheit 21 erkennt die von dem Benutzer geäußerte Sprache und erwirbt einen Text des Erkennungsergebnisses.
  • Wie vorstehend beschrieben ist, ist es, da Häufigkeitsinformationen für jeden Benutzer in der Häufigkeitsinformations-Speichereinheit 5 gespeichert sind, erforderlich, der Systemseite zu ermöglichen, einen Benutzer zu identifizieren. Daher gibt, wenn er mit dem System zusammenarbeitet, der Benutzer Identifikationsinformationen zum Identifizieren des Benutzers unter Verwendung der Eingangseinheit 2 ein. Auf der Systemseite werden Häufigkeitsinformationen entsprechend dem Benutzer verwendet durch Spezifizieren des diese Identifikationsinformationen verwendenden Benutzers.
  • Es ist zu beachten, dass eine bekannte Technik für eine Spracherkennung der Spracherkennungseinheit 21 und eine Sprachsynthese der Ausgabeeinheit 4 verwendet werden kann. Beispielsweise wird eine Technik verwendet, die im Kapitel 7 (Seiten 134 bis 148) und im Kapitel 8 (Seiten 149 bis 192) des folgenden Bezugsdokuments beschrieben ist.
  • (Bezugsdokument) „Digital Voice Processing“, Tokai University Press., 25. September 1985.
  • Die Verständnispegel-Schätzeinheit 30 spezifiziert Häufigkeiten und Wichtungen der jeweiligen Schätzbedingungen einer Funktion entsprechend einem Begriffssymbol, das von der Dialogmanagementeinheit 31 eingegeben wurde, durch Bezugnahme auf die Schätzbedingungstabelle 5A und die Häufigkeitstabelle 5B, und gibt ein Ergebnis der Größenbestimmung einer Ergebnisquote, die anhand der spezifizierten Häufigkeiten und der Wichtungen berechnet wurde, zu der Dialogmanagementeinheit 31 als den Verständnispegel des Benutzers für das Begriffssymbol aus.
  • Beispielsweise bezieht sich die Verständnispegel-Schätzeinheit 30 auf die Schätzbedingungstabelle 5A und bestimmt eine Schätzbedingung (Bedingungsnummer i), die einen Dialogzustand anzeigt, in welchem die Funktion ausgeführt wurde und eine Wichtung wij der Schätzbedingung in Abhängigkeit von dem Verständnis für ein Begriffssymbol j entsprechend dieser Funktion zugeteilt wurde. Es ist zu beachten, dass j ein Suffix ist, das das Bezugssymbol anzeigt. Als Nächstes bezieht sich die Verständnispegel-Schätzeinheit 30 auf die Häufigkeitstabelle 5B und bestimmt eine Häufigkeit fij , mit der die Funktion entsprechend dem Begriffssymbol j für jede der Schätzbedingungen ausgeführt wird. Dann berechnet die Verständnispegel-Schätzeinheit 30 eine Ergebnisquote Σfij ·wij, die die Summe von Werten fij ·wij ist, die durch Multiplizieren jeder der Häufigkeiten fij und der Wichtungen wij , die für die jeweiligen Schätzbedingungen in dieser Weise bestimmt wurden, erhalten wurden, und verwendet ein Ergebnis der Größenbestimmung dieser Ergebnisquote als den Verständnispegel des Benutzers für das Begriffssymbol j.
  • Die Dialogmanagementeinheit 31 wählt eine Antwortschablone entsprechend einem Dialogzustand mit dem Benutzer aus Antwortschablonen entsprechend vorbestimmten Dialogzuständen aus, gibt ein Begriffssymbol, das in der ausgewählten Antwortschablone enthalten ist, zu der Verständnispegel-Schätzeinheit 30 aus, und erwirbt den Verständnispegel des Benutzers für das Bezugssymbol.
  • Beispielsweise bestimmt auf der Grundlage der Eingabeinformationen von dem Benutzer, die von der Eingangseinheit 2 angenommen wurden, die Dialogmanagementeinheit 31 den Dialogzustand mit dem Benutzer und eine Funktion, die der Benutzer auszuführen beabsichtigt. Dann wählt die Dialogmanagementeinheit 31 eine Antwortschablone entsprechend einem Dialogzustand, von dem angenommen wird, dass er dem bestimmten Dialogzustand folgt, aus der Antwortschablonen-Speichereinheit 7 aus. Die Dialogmanagementeinheit 31 gibt ein Begriffssymbol, dass in der in dieser Weise ausgewählten Antwortschablone enthalten ist, zu der Verständnispegel-Schätzeinheit 30 aus und erwirbt den Verständnispegel des Benutzers für das Begriffssymbol von der Verständnispegel-Schätzeinheit 30.
  • Auch aktualisiert jedes Mal, wenn die Funktion entsprechend dem durch den Benutzer bezeichneten Begriffssymbol ausgeführt wird, die Dialogmanagementeinheit 31 den Inhalt der Häufigkeitstabelle 5B für dieses Begriffssymbol, das in der Häufigkeitsinformations-Speichereinheit 5 gespeichert ist. Beispielsweise erhöht in dem Fall, in welchem eine Funktion entsprechend dem Begriffssymbol „#Norden oben“ unter der Schätzbedingung der Bedingungsnummer 2 ausgeführt wird, die Dialogmanagementeinheit 31 die Häufigkeit f2 entsprechend der Bedingungsnummer 2 der Häufigkeitsdaten 5B-1 um +1.
  • Die Antworterzeugungseinheit 32 erzeugt einen Antwortsatz entsprechend dem Dialogzustand mit dem Benutzer auf der Grundlage der von der Dialogmanagementeinheit 31 ausgewählten Antwortschablone, fügt einen erläuternden Satz zu dem Antwortsatz in Abhängigkeit von dem Verständnispegel des Benutzers für das von der Dialogmanagementeinheit 31 eingegebene Begriffssymbol hinzu, und gibt den Antwortsatz aus.
  • Beispielsweise bestimmt in einem Fall, in welchem der Verständnispegel des Benutzers für das von der Dialogmanagementeinheit 31 erworbene Begriffssymbol größer als ein oder gleich einem Schwellenwert X ist, die Antworterzeugungseinheit 32, dass der Verständnispegel des Benutzers für das Begriffssymbol hoch ist, und führt die Ausgabe ohne Hinzufügen des erläuternden Satzes zu dem Antwortsatz durch.
  • Andererseits bestimmt in dem Fall, in welchem der Verständnispegel des Benutzers für das Begriffssymbol kleiner als der Schwellenwert X ist, die Antworterzeugungseinheit 32, dass der Verständnispegel des Benutzers für das Begriffssymbol niedrig ist, erzeugt einen Satz, in welchem ein erläuternder Satz durch den Antwortsatz gefolgt wird, oder ein Satz, in welchem der Antwortsatz durch einen erläuternden Satz für den Begriff gefolgt ist, und gibt diesen aus.
  • Insbesondere kann, indem dem Benutzer der Satz als Antwortinformation, in welchem der erläuternde Satz dem Antwortsatz gefolgt ist, präsentiert wird, der Benutzer vorher den Inhalt des Begriffs, der in dem Antwortsatz enthalten ist, anhand des erläuternden Satzes wissen.
  • 5A ist ein Diagramm, das eine Hardwarekonfiguration zum Implementieren des Dialogsteuersystems 1 illustriert. 5B ist ein Diagramm, das eine Hardwarekonfiguration zum Ausführen von Software zum Implementieren des Dialogsteuersystems 1 illustriert. In dem Dialogsteuersystem 1 wird die Eingangseinheit 20 für manuelle Operation der Eingangseinheit 2 beispielsweise durch ein in den 5A und 5B illustriertes Touchpanel 101 implementiert. Zusätzlich führt die Spracherkennungseinheit 21 eine Spracherkennung der von dem Benutzer geäußerten Sprache, die von einem Mikrofon 102 eingegeben wird, durch. Die Ausgabeeinheit 4 führt eine Sprachsynthese bei dem von der Antworterzeugungsvorrichtung 3 ausgegebenen Antwortsatz durch und gibt die Sprache durch einen Lautsprecher 103 aus oder zeigt Textinformationen des Antwortsatzes auf einem Monitor 104 an.
  • Die Funktionen der Verständnispegel-Schätzeinheit 30, der Dialogmanagementeinheit 31 und der Antworterzeugungseinheit 32 in der Antworterzeugungsvorrichtung 3 werden durch eine Verarbeitungsschaltung implementiert. Das heißt, die Antworterzeugungsvorrichtung 3 enthält eine Verarbeitungsschaltung zum aufeinanderfolgenden Durchführen der Verarbeitung vom Schritt ST1 bis zum Schritt ST3, die in 6 illustriert sind, durch.
  • Die Verarbeitungsschaltung kann dedizierte Hardware oder eine zentrale Verarbeitungseinheit (CPU) 105 sein, die ein in einem Speicher 107 gespeichertes Programm liest und ausführt.
  • Darüber hinaus können die Häufigkeitsinformations-Speichereinheit 5, die Speichereinheit 6 für erläuternde Informationen und die Antwortschablonen-Speichereinheit 7 in einem Speicherbereich eines in 5B illustrierten Plattenlaufwerks 106 konfiguriert sein, oder sie können in einer externen Speichervorrichtung konfiguriert sein, die Informationen aus der Antworterzeugungsvorrichtung 3 lesen und in diese schreiben kann.
  • In dem Fall, in welchem die Verarbeitungsschaltung eine Verarbeitungsschaltung 100 aus dedizierter Hardware wie in 5A illustriert ist, kann die Verarbeitungsschaltung 100 eine einzelne Schaltung, eine zusammengesetzte Schaltung, einen programmierten Prozessor, einen parallel programmierten Prozessor, eine anwendungsspezifische integrierte Schaltung (ASIC), ein vor Ort programmierbares Gate (Array FPGA) oder eine Kombination hiervon enthalten.
  • Zusätzlich können die Funktionen der jeweiligen Einheiten der Verständnispegel-Schätzeinheit 30, der Dialogmanagementeinheit 31 und der Antworterzeugungseinheit 32 getrennt durch Verarbeitungsschaltungen implementiert sein, oder die Funktionen der jeweiligen Einheiten können kollektiv durch eine Verarbeitungsschaltung implementiert sein.
  • Wenn die Verarbeitungsschaltung wie in 5B illustriert eine CPU 105 ist, werden die Funktionen der Verständnispegel-Schätzeinheit 30, der Dialogmanagementeinheit 31 und der Antworterzeugungseinheit 32 durch Software, Firmware oder eine Kombination aus Software und Firmware implementiert.
  • Software und Firmware werden als ein Programm geschrieben und einem Speicher 107 gespeichert. Die CPU 105 liest das in dem Speicher 107 gespeicherte Programm und führt dieses aus, und implementiert hierdurch Funktionen der Einheiten. Das heißt, die Antworterzeugungsvorrichtung 3 enthält den Speicher 107 zum Speichern eines Programms, das die Verarbeitung der jeweiligen vorbeschriebenen Schritte in 6 als ein Ergebnis ausführt, wenn das Programm von der CPU 105 ausgeführt wird.
  • Darüber hinaus bewirken diese Programme, dass ein Computer die Abläufe oder Verfahren der Verständnispegel-Schätzeinheit 30, der Dialogmanagementeinheit 31 und der Antworterzeugungseinheit 32 ausführt.
  • Es ist zu beachten, dass einige der Funktionen der Verständnispegel-Schätzeinheit, der Dialogmanagementeinheit 31 und der Antworterzeugungseinheit 32 durch dedizierte Hardware implementiert sein können, und andere hiervon können durch Software oder Firmware implementiert werden. Beispielsweise implementiert die Verständnispegel-Schätzeinheit 30 die Funktion hiervon durch Verwendung der Verarbeitungsschaltung 100 von dedizierter Hardware, während die Dialogmanagementeinheit 31 und die Antworterzeugungseinheit 32 die Funktionen hiervon durch die CPU 105, die in dem Speicher 107 gespeicherte Programme ausführt, implementieren.
  • Auf diese Weise kann die Verarbeitungsschaltung die vorstehend beschriebenen Funktionen durch Hardware, Software, Firmware oder eine Kombination von diesen implementiert werden.
  • Jede der in dem Dialogsteuersystem 1 enthaltenen Komponenten kann zumindest eine einer an einem Fahrzeug befestigen Informationsverarbeitungsvorrichtung oder dergleichen, die von einem Benutzer verwendet wird, einer mobilen Endgerätevorrichtung und einer Servervorrichtung, die in der Lage ist, Informationen mit diesen Vorrichtungen auszutauschen, sein.
  • Beispielsweise enthält eine Informationsverarbeitungsvorrichtung die Eingangseinheit 2 und die Ausgabeeinheit 4, während die Antworterzeugungsvorrichtung 3 in einer Servervorrichtung, die in der Lage ist, mit der Informationsverarbeitungsvorrichtung zu kommunizieren, konfiguriert ist. Mit dieser Konfiguration ist es möglich, das Dialogsteuersystem 1 von der Informationsverarbeitungsvorrichtung und der Servervorrichtung zu implementieren.
  • Es ist zu beachten, dass das Dialogsteuersystem 1 durch Ersetzen der Informationsverarbeitungsvorrichtung durch eine mobile Endgerätevorrichtung in dieser Konfiguration implementieren kann.
  • Als Nächstes wird die Arbeitsweise beschrieben.
  • 7 ist ein Flussdiagramm, das die Arbeitsweise des Dialogsteuersystems 1 nach dem ersten Ausführungsbeispiel illustriert und eine Verarbeitungsreihe illustriert, die durch einen Dialog mit einem Benutzer durchgeführt wird. Zusätzlich ist 8 ein Diagramm, das spezifische Beispiele für Steuerinformationen illustriert, die Funktionen definieren, die durch einen Dialog mit einem Benutzer und Antwortschablonen entsprechend den jeweiligen Funktionen ausführbar sind. Nachfolgend wird angenommen, dass ein in einem Dialog befindlicher Benutzer die eigenen Identifikationsinformationen des Benutzers unter Verwendung der Eingangseinheit 2 eingibt, und dass der Benutzer hierdurch auf der Seite des Dialogsteuersystems 1 identifiziert wird.
  • Es wird weiterhin angenommen, dass in einem Dialog mit dem Benutzer eine Antwortschablone gemäß der in 8 illustrierten Funktion ausgewählt wird, und dass auf der Grundlage hiervon ein Antwortsatz präsentiert wird.
  • Nachfolgend wird der Fall, in welchem der Benutzer das Dialogsteuersystem 1 zum ersten Mal verwendet, und der Fall, in welchem der Benutzer das Dialogsteuersystem 1 mehrere Male verwendet hat und Häufigkeitsdaten akkumuliert werden, beschrieben.
  • Wenn das Dialogsteuersystem 1 von dem Benutzer zum ersten Mal verwendet wird, setzt die Dialogmanagementeinheit 31 0 für das Begriffserläuterungsflag jedes Begriffssymbols, das in dem Dialog mit dem Benutzer verwendet wird (Schritt ST1a). Das Begriffserläuterungsflag ist ein Flag zum nur einmaligen Erläutern eines Begriffssymbols in der Reihe der Dialogverarbeitung in 7, und ein Antwortsatz, zu dem ein erläuternder Satz hinzugefügt wird, wird dem Benutzer präsentiert durch Setzen von 0 in das Begriffserläuterungsflag. Wenn der Antwortsatz, zu dem ein erläuternder Satz hinzugefügt wird, dem Benutzer in einer Reihe von Dialogverarbeitung präsentiert wird, wird 1 als das Begriffserläuterungsflag für dieses Begriffssymbol gesetzt.
  • Als Nächstes tritt die Dialogmanagementeinheit 31 in einen Bereitschaftszustand für die Spracheingabe des Benutzers oder die Eingabe durch manuelle Betätigung unter Verwendung der Eingangseinheit 2 ein (Schritt ST2a). Wenn keine Spracheingabe oder manuelle Eingabe stattfindet (Schritt ST2a: NEIN), wird die Verarbeitung des Schritts ST2a wiederholt.
  • In dem Fall der Eingabe einer Funktion, die der Benutzer auszuführen wünscht, das heißt, eines Begriffs entsprechend der durch den Benutzer beabsichtigten Funktion, durch Sprache äußert der Benutzer den Begriff nach dem Drücken einer Äußerungsstarttaste.
  • Die Äußerungsstarttaste dient als ein Auslöser für die Spracherkennungseinheit 21 zum Erkennen der von dem Mikrofon 102 eingegebenen Sprache. Als eine Folge erkennt die Spracherkennungseinheit 21 die von dem Benutzer geäußerte Sprache und gibt das Erkennungsergebnis zu der Dialogmanagementeinheit 31 aus. Es ist zu beachten, dass hier angenommen wird, dass keine fehlerhafte Erkennung der Sprache durch die Spracherkennungseinheit 21 stattfindet und dass die Eingabesprache immer korrekt erkannt wird.
  • Nachfolgend spezifiziert, wenn eine Spracheingabe oder eine Eingabe durch manuelle Betätigung durch den Benutzer vorliegt (Schritt ST2a: JA) die die Dialogmanagementeinheit 31 die von dem Benutzer beabsichtigte Funktion auf der Grundlage des Inhalts der durch die Spracheingabe oder die manuelle Betätigung eingegebenen Informationen (Schritt ST3a).
  • Wenn beispielsweise „Kartenoperation“ geäußert wird oder „Kartenoperation“ durch eine Softwaretaste gedrückt wird, spezifiziert die Dialogmanagementeinheit 31 eine von dem Benutzer beabsichtigte Funktion A0.
  • In dem Schritt ST4a wählt die Dialogmanagementeinheit 31 eine Antwortschablone B0 entsprechend einem nächsten Dialogzustand für die Funktion A0 aus den in der Antwortschablonen-Speichereinheit 7 gespeicherten Antwortschablonen aus und gibt die Antwortschablone B0 zu der Antworterzeugungseinheit 32 aus. Wie in 8 illustriert ist, enthält die Antwortschablone B0 keine Begriffssymbole, und somit erzeugt die Antworterzeugungseinheit 32 einen Antwortsatz auf der Grundlage der Antwortschablone B0. Als eine Folge wird beispielsweise ein Antwortsatz „Ändern von Maßstäben, Ändern der Kartenorientierung, Ändern von Karten, oder andere können ausgewählt werden“ erzeugt und zu der Ausgabeeinheit 4 ausgegeben.
  • Die Ausgabeeinheit 4 präsentiert dem Benutzer den Antwortsatz (Schritt ST5a).
  • Beispielsweise zeigt die Ausgabeeinheit 4 Optionen wie „Ändern von Maßstäben“, Ändern der Kartenorientierung“, „Ändern von Karten“ auf dem Monitor 104 an und synthetisiert eine Sprache des Antwortsatzes von „Ändern von Maßstäben, Ändern der Kartenorientierung, Ändern von Karten, oder andere können ausgewählt werden“ und gibt die Sprache über den Lautsprecher 103 aus.
  • Die Dialogmanagementeinheit 31 verifiziert, ob die im Schritt ST4a spezifizierte Funktion die Verarbeitung der Beendigung eines Dialogs enthält (Schritt ST6a).
  • In der durch den Benutzer bezeichneten Funktion A0 ist die Dialogbestimmungsverarbeitung C0 wie in 8 illustriert gesetzt. Wie durch „(keine)“ in der Dialogbeendigungsverarbeitung C0 illustriert ist, ist keine Verarbeitung zum Beenden des Dialogs gesetzt. Daher kehrt der Ablauf zu der Verarbeitung des Schritts ST2a zurück.
  • Es wird angenommen, dass „Ändern der Kartenorientierung“ durch die Betätigungseingabe des Benutzers bezeichnet wird. In diesem Fall wird die vorbeschriebene Verarbeitung vom Schritt ST2a zum Schritt ST3a durchgeführt, und zwei Schlüsselwörter „Norden oben“ und „vorwärts nach oben“, die die Funktionen A1-1 und A1-2 darstellen, können einen Übergang von der Funktion A1, die durch den Benutzer beabsichtigt ist, vornehmen können, werden auf dem Schirm des Monitors 104 angezeigt. Nachfolgend wird die Erzeugungsverarbeitung von Antwortinformationen im Schritt ST4a durchgeführt, deren Einzelheiten mit Bezug auf 9 beschrieben werden.
  • 9 ist ein Flussdiagramm, das ein Beispiel für eine spezifische Operation der Antworterzeugungsvorrichtung 3 nach dem ersten Ausführungsbeispiel illustriert und eine Verarbeitungsreihe der Erzeugung der Antwortinformationen im Schritt ST4a illustriert.
  • Im Schritt ST1b wählt die Dialogmanagementeinheit 31 eine Antwortschablone B1 „Wünschen Sie {#Norden oben} oder {#vorwärts nach oben}?“ aus den in der Antwortschablonen-Speichereinheit 7 gespeicherten Antwortschablonen als ein nächstes Dialogszenario aus.
  • Nachfolgend zieht die Dialogmanagementeinheit 31 die Begriffssymbole „#Norden oben“ und „#vorwärts nach oben“, die in der Antwortschablone B1 enthalten sind, heraus und gibt die Begriffssymbole zu der Verständnispegel-Schätzeinheit 30 aus (Schritt ST2b).
  • Als Nächstes schätzt die Verständnispegel-Schätzeinheit 30 den Verständnispegel des Benutzers für das von der Dialogmanagementeinheit 31 eingegebene Begriffssymbol (Schritt ST3b). Einzelheiten dieser Verarbeitung werden mit Bezug auf 10 beschrieben. Es ist zu beachten, dass in diesem Fall, da das Dialogsteuersystem 1 zum ersten Mal von dem Benutzer verwendet wird, die Häufigkeitsdaten 5B-1 von „#Norden oben“ und die Häufigkeitsdaten 5B-2 von „#vorwärts nach oben“ in dem Zustand von 3A sind.
  • 10 ist ein Flussdiagramm, das eine spezifische Verarbeitung des Schätzens eines Verständnispegels für einen Begriff illustriert, und im Schritt ST3b wird eine Verarbeitungsreihe des Schätzens des Verständnispegels des Benutzers für jeden Begriff illustriert. Nachfolgend wird ein Fall des Klassifizierens des Verständnispegels des Benutzers in zwei Pegel von hoch und niedrig als ein Beispiel gegeben.
  • Zuerst bezieht sich die Verständnispegel-Schätzeinheit 30 auf das Begriffserläuterungsflag und verifiziert, ob 1 in das Begriffserläuterungsflag gesetzt ist (Schritt ST1c). Da das Begriffserläuterungsflag hier gleich 0 ist (Schritt ST1c: NEIN), geht der Ablauf zu der Verarbeitung des Schritts ST2c weiter.
  • In dem Schritt ST2c liest die Verständnispegel-Schätzeinheit 30 Häufigkeitsinformationen entsprechend dem Begriffssymbol aus der Häufigkeitsinformations-Speichereinheit 5 und spezifiziert Häufigkeiten fi der jeweiligen Schätzbedingungen für das Begriffssymbol und Wichtungen wi , die den jeweiligen Schätzbedingungen zugeteilt sind. Als Nächstes berechnet die Verständnispegel-Schätzeinheit 30 Σfi · wi, welches die Summe von Werten fi · wi ist, die durch Multiplizieren der Häufigkeiten fi mit den Wichtungen wi erhalten wurden, als eine auf den Verständnispegel des Benutzers mit Bezug auf das Begriffssymbol bezogene Ergebnisquote erhalten wurden, ist. Hier ist, da die Häufigkeiten in den Häufigkeitsdaten 5B-1 von „#Norden oben“ und die Häufigkeitsdaten 5B-2 von „#vorwärts nach oben“ sämtlich 0 sind, die Ergebnisquote auch 0,0.
  • Als Nächstes bestimmt die Verständnispegel-Schätzeinheit 30, ob die Ergebnisquote Σfi · wi größer als der oder gleich dem vorbestimmten Schwellenwert X ist (Schritt ST3c). Hier ist der Schwellenwert X auf 3,00 gesetzt.
  • Hier sind sowohl die Ergebnisquote für „#Norden oben“ als auch die Ergebnisquote „#vorwärts nach oben“ kleiner als der Schwellenwert X (Schritt ST3c: NEIN).
  • In diesem Fall bestimmt die Verständnispegel-Schätzeinheit 30, dass die Verständnispegel des Benutzers mit Bezug auf das Begriffssymbol „#Norden oben“ und das Begriffssymbol „#vorwärts nach oben“ beide niedrig sind (Schritt ST4c). Die Verständnispegel-Schätzeinheit 30 gibt Ergebnisse der Größenbestimmung der Trefferquoten unter Verwendung eines derartigen Schwellenwerts X zu der Dialogmanagementeinheit 31 als die Verständnispegel des Benutzers aus und beendet die Verarbeitung von 10.
  • Bei Beendigung der Verarbeitung von 10 kehrt der Ablauf zu der Verarbeitung des Schritts ST3b in 9 zurück.
  • Im Schritt ST3b erwirbt die Dialogmanagementeinheit 31 den Verständnispegel des Benutzers für das Begriffssymbol von der Verständnispegel-Schätzeinheit 30 und gibt dann die Antwortschablone und den Verständnispegel des Benutzers für das Begriffssymbol zu der Antworterzeugungseinheit 32 aus.
  • Hier werden zusätzlich zu der Antwortschablone B1 das Ergebnis der Größenbestimmung, dass „der Verständnispegel des Benutzers für #Norden oben niedrig ist“ und das Ergebnis der Größenbestimmung, das „der Verständnispegel des Benutzers für #vorwärts ist oben niedrig ist“ zu der Antworterzeugungseinheit 32 als die Verständnispegel des Benutzers ausgegeben.
  • Die Antworterzeugungseinheit 32 verifiziert, ob die Erzeugungsverarbeitung für Antwortinformationen für alle Begriffssymbole, die in der Antwortschablone B1 enthalten sind, durchgeführt wurde (Schritt T4b).
  • Hier sind „#Norden oben“ und „#vorwärts nach oben“ nicht verarbeitet (Schritt ST4b: NEIN), und die Antworterzeugungseinheit 32 wählt aufeinanderfolgend Begriffe der unverarbeiteten Begriffssymbole in der Antwortschablone B1 aus (Schritt ST5b). Hier wird „#Norden oben“ ausgewählt.
  • Als Nächstes verifiziert auf der Grundlage des Verständnispegels des Benutzers für die Begriffssymbole, die von der Dialogmanagementeinheit 31 eingegeben wurden, die Antworterzeugungseinheit 32, ob der Verständnispegel des Benutzers für das ausgewählte Begriffssymbol niedrig ist (Schritt ST6b). Hier erzeugt, da das Ergebnis der Größenbestimmung, dass „der Verständnispegel des Benutzers für #Norden oben ist niedrig“ von der Dialogmanagementeinheit 31 eingegeben wird (Schritt ST6b: JA), die Antworterzeugungseinheit 32 einen Satz unter Verwendung eines erläuternden Satzes für das ausgewählte Begriffssymbol (Schritt ST7b). Hier erzeugt, da der Verständnispegel des Benutzers für „Norden oben“ niedrig ist, die Antworterzeugungseinheit 32 einen Satz „Norden oben ist eine Kartenanzeige, bei der der Norden nach oben angeordnet ist.“.
  • Nachfolgend wird, da das Ergebnis der Größenbestimmung, dass „der Verständnispegel des Benutzers für #vorwärts nach oben gering ist“, von der Dialogmanagementeinheit 31 für „#vorwärts nach oben“ eingegeben wurde, die Verarbeitung vom Schritt ST4b zum Schritt ST7b aufeinanderfolgend durchgeführt.
  • Als ein Ergebnis erzeugt die Antworterzeugungseinheit 32 einen Satz „vorwärts nach oben ist eine Kartenanzeige mit einer nach oben angeordneten Fahrtrichtung.“.
  • Da die Erzeugungsverarbeitung für Antwortinformationen für alle Begriffssymbole durchgeführt wurde (Schritt ST4b: JA), erzeugt die Antworterzeugungseinheit 12 einen Satz, in welchem entsprechende Begriffe an Begriffseinsatzpositionen der Antwortschablone B1 eingesetzt werden (Schritt ST8b).
  • In diesem Fall wird ein Antwortsatz „Wünschen Sie Norden oben oder vorwärts nach oben?“, in welchem die Begriffe entsprechend „#Norden oben“ und „#vorwärts nach oben“, die in der Antwortschablone B1 enthalten sind, gesetzt sind, erzeugt. Als ein Ergebnis wird die Verarbeitung von 9 beendet, und der Ablauf kehrt zu der Verarbeitung des Schritts ST5a von 7 zurück.
  • Im Schritt ST5a von 7 präsentiert die Ausgabeeinheit 4 dem Benutzer den Antwortsatz.
  • Hier wird ein Auswahlschirm mit „Norden oben ist eine Kartenanzeige, bei der der Norden oben angeordnet ist. Vorwärts nach oben ist eine Kartenanzeige mit einer nach oben gerichteten Fahrtrichtung. Wünschen Sie Norden oben oder vorwärts nach oben?“ auf dem Monitor 104 angezeigt.
  • Weiterhin erfolgt eine Sprachausgabe „Norden oben ist eine Kartenanzeige, bei der der Norden oben angeordnet ist. Vorwärts nach oben ist eine Kartenanzeige mit einer nach oben gerichteten Fahrtrichtung. Wünschen Sie Norden oben oder vorwärts nach oben?“ aus dem Laufsprecher 103.
  • Nachfolgend kehrt im Schritt ST6a, da die in 8 illustrierte Dialogbeendigungsverarbeitung C0 ausgewählt ist, der Ablauf zu der Verarbeitung des Schritts ST2a zurück.
  • Im Schritt ST2a versteht der Benutzer anhand des von der Ausgabeeinheit 4 präsentierten Antwortsatzes, dass der Begriff „Norden oben“ „Kartenanzeige, bei der der Norden oben angeordnet ist“ bedeutet.
  • Dann spezifiziert, wenn der Benutzer „Norden oben“ äußert oder eine Auswahltaste für „Norden oben“ unter Verwendung der Eingangseinheit 20 für manuelle Betätigung drückt, die Dialogmanagementeinheit 31 die in 8 illustrierte Funktion A1-1 (Schritt ST3a).
  • Als Nächstes nimmt im Schritt ST4a, da das Begriffserläuterungsflag für „#Norden oben“ gleich 1 ist, die Dialogmanagementeinheit 31 an, dass der Benutzer „#Norden oben“ versteht und wählt eine Antwortschablone B2 „Norden oben ist gewählt.“ aus. Dann erzeugt die Antworterzeugungseinheit 32 einen Antwortsatz „Norden oben ist gewählt.“.
  • Im Schritt ST5a präsentiert die Ausgabeeinheit 4 den Benutzer dem Antwortsatz „Norden oben ist gewählt“. In der Funktion A1-1 zur Änderung der Orientierung einer Karte in Norden oben wird die in 8 illustrierte Dialogbeendigungsverarbeitung C1 gesetzt (Schritt ST6a: JA). Bei der Dialogbeendigungsverarbeitung C1 wird die Verarbeitung für „Setzen (Kartenorientierung, Norden oben)“ gesetzt, und die Änderung der Orientierung der Karte in Norden oben beendet den Dialog.
  • Daher führt im Schritt ST7a eine Funktionsausführungseinheit (nicht dargestellt) die Funktion des Änderns der Orientierung der Karte in Norden oben durch, worauf der Ablauf zum Schritt ST8a weitergeht.
  • Wenn der Orientierung der Karte ermöglicht ist, Norden oben zu sein, addiert die Dialogmanagementeinheit 311 zu der Häufigkeit f2 der Schätzbedingung der Bedingungsnummer 2 in den Häufigkeitsdaten 5B-1 (Schritt ST8a).
  • Zusätzlich kann im Schritt ST8a die Dialogmanagementeinheit 31 auch für ein Begriffssymbol entsprechend einer Funktion in einer exklusiven Beziehung mit der Funktion eines Befehls, der im Schritt ST7a ausgeführt wurde, die Häufigkeit einer Schätzbedingung, deren Wichtung wi kleiner als die der Schätzbedingung, unter der die Funktion ausgeführt wurde, aktualisieren.
  • Es ist zu beachten, dass Funktionen in einer exklusiven Beziehung sich auf Funktionen beziehen, die aufeinander bezogen sind und nicht gleichzeitig ausgeführt werden können.
  • Beispielsweise sind Norden oben und vorwärts nach oben als Funktionen zur Anzeige der Orientierung einer Karte aufeinander bezogen und können nicht gleichzeitig ausgeführt werden, und sind somit in einer exklusiven Beziehung.
  • In dem Fall, in welchem Norden oben unter der Schätzbedingung der Bedingungsnummer 2 bezeichnet ist und ein Befehl ausgeführt wird, addiert die Dialogmanagementeinheit 31 +1 zu der Häufigkeit f3 für die Schätzbedingung der Bedingungsnummer 3 in den Häufigkeitsdaten 5B-2 auch für vorwärts nach oben.
  • In dem Fall, in welchem der Benutzer „Norden oben“ unter der Schätzbedingung der Bedingungsnummer 2 äußert, nachdem die Sprachführung enthaltend den Begriff „Norden oben“ und den Begriff „vorwärts nach oben“ ausgegeben wurde, genügt dies aus der Perspektive von vorwärts nach oben der Schätzbedingung der Bedingungsnummer 3, in der ein anderer Begriff als vorwärts nach oben geäußert wird.
  • Auf diese Weise wird, wenn eine bestimmte Funktion ausgeführt wird, durch sequenzielles Aktualisieren der Häufigkeiten der ausgeführten Funktion und einer Funktion in einer exklusiven Beziehung der mit der ausgeführten Funktion der Verständnispegel des Benutzers für das Begriffssymbol durch Verwendung der Häufigkeitsdaten geschätzt.
  • Andererseits setzt in dem Fall, in welchem das Dialogsteuersystem 1 mehrere Male von dem Benutzer benutzt wurde, die Dialogmanagementeinheit 31 das Begriffserläuterungsflag auf 0 (Schritt ST1a) und geht dann zum Schritt ST2a weiter, um in einen Bereitschaftszustand für Spracheingabe oder Eingabe durch manuelle Betätigung einzutreten.
  • Wenn der Benutzer „Kartenoperation“ einer Softwaretaste im Schritt ST2a drückt, wählt die Dialogmanagementeinheit 31 die Antwortschablone B0 entsprechend einem nächsten Dialogzustand für die Funktion A0 aus den in der Antwortschablonen-Speichereinheit 7 gespeicherten Antwortschablonen aus und gibt die Antwortschablone B0 zu der Antworterzeugungseinheit 32 aus. Die Antworterzeugungseinheit 32 erzeugt einen Antwortsatz auf der Grundlage der Antwortschablone B0. Als eine Folge wird beispielsweise ein Antwortsatz „Ändern von Maßstäben, Ändern der Kartenorientierung, Ändern von Karten, oder anderen kann ausgewählt werden“ erzeugt und zu der Ausgabeeinheit 4 ausgegeben.
  • Die Ausgabeeinheit 4 zeigt Optionen wie „Ändern von Maßstäben“, „Änderung der Kartenorientierung“, „Ändern von Karten“ auf dem Monitor 104 an und synthetisiert eine Sprache des Antwortsatzes „Ändern von Maßstäben, Ändern der Kartenorientierung, Ändern von Karten oder anderen kann ausgewählt werden“ und gibt die Sprache über den Laufsprecher 103 aus.
  • Hier wird angenommen, dass „Ändern der Kartenorientierung“ durch die Betätigungseingabe des Benutzers bezeichnet wird. In diesem Fall wird die Verarbeitung vom Schritt ST2a bis zum Schritt ST3a durchgeführt, und zwei Schlüsselwörter „Norden oben“ und „vorwärts nach oben“, die die Funktionen A1-1 und A1-2 darstellen, die einen Übergang von der von dem Benutzer beabsichtigten Funktion A1 vornehmen können, werden auf dem Schirm des Monitors 104 angezeigt.
  • Nachfolgend wird die Erzeugungsverarbeitung von Antwortinformationen im Schritt ST4a durchgeführt, deren Einzelheiten wieder mit Bezug auf 9 beschrieben werden.
  • Im Schritt ST1b wählt die Dialogmanagementeinheit 31 eine Antwortschablone B1 „Wünschen Sie {#Norden oben} oder {#vorwärts nach oben}?“ aus den in der Antwortschablonen-Speichereinheit 7 gespeicherten Antwortschablonen als ein nächstes Dialogszenario aus. Nachfolgend zieht die Dialogmanagementeinheit 31 die Begriffssymbole „„#Norden oben“ und „#vorwärts nach oben“, die in der Antwortschablone B1 enthalten sind, heraus und gibt die Begriffssymbole zu der Verständnispegel-Schätzeinheit 30 aus (Schritt ST2b). Im Schritt ST3b schätzt die Verständnispegel-Schätzeinheit 30 den Verständnispegel des Benutzers für das von der Dialogmanagementeinheit 31 eingegebene Begriffssymbol.
  • Einzelheiten dieser Verarbeitung werden wieder mit Bezug auf 10 beschrieben. Hier wird angenommen, dass die Häufigkeitsdaten 5B-1 von „#Norden oben“ und die Häufigkeitsdaten 5B-2 von „#vorwärts nach oben“ in dem Zustand von 3B sind.
  • Im Schritt ST1c bezieht sich die Verständnispegel-Schätzeinheit 30 auf das Begriffserläuterungsflag und verifiziert, ob 1 in dem Begriffserläuterungsflag gesetzt ist. Da das Begriffserläuterungsflag hier gleich 0 ist (Schritt ST1c: NEIN), geht der Ablauf zu der Verarbeitung des Schritts ST2c weiter.
  • Im Schritt ST2c liest die Verständnispegel-Schätzeinheit 30 Häufigkeitsinformationen entsprechend dem Begriffssymbol aus der Häufigkeitsinformations-Speichereinheit 5 und spezifiziert Häufigkeiten fi der der jeweiligen Schätzbedingungen für das Begriffssymbol und Wichtungen wi , die den jeweiligen Schätzbedingungen zugewiesen sind.
  • Als Nächstes berechnet die Häufigkeitspegel-Schätzeinheit 30 Σfi · wi, was die Summe von Werten fi · wi, die durch Multiplizieren der Häufigkeiten fi mit den Wichtungen wi erhalten wurden, als eine auf den Verständnispegel des Benutzers für das Begriffssymbol bezogene Ergebnisquote ist.
  • Hier wird, da die Häufigkeitsdaten 5B-1 und die Häufigkeitsdaten 5B-2 in dem Zustand von 3B sind, eine Ergebnisquote für das Begriffssymbol „#Norden oben“ als 5,8 berechnet, während eine Ergebnisquote für das Begriffssymbol „#vorwärts nach oben“ als 1,9 berechnet wird.
  • Nachfolgend bestimmt die Verständnispegel-Schätzeinheit 30, ob die Ergebnisquote Σfi · wi größer als der oder gleich dem vorbestimmten Schwellenwert X ist (Schritt ST3c). Hier ist der Schwellenwert X auf 3,00 gesetzt.
  • Hier ist die Ergebnisquote für „#Norden oben“ größer als der oder gleich dem Schwellenwert X (Schritt ST3c: JA), währen die Ergebnisquote für „#vorwärts nach oben“ kleiner als der Schwellenwert X ist (Schritt ST3c: NEIN).
  • Anhand eines Vergleichsergebnisses zwischen den Ergebnisquoten und dem Schwellenwert X bestimmt die Verständnispegel-Schätzeinheit 30, dass der Verständnispegel des Benutzers für das Begriffssymbol „#Norden oben“ hoch ist (Schritt ST5c), während bestimmt wird, dass der Verständnispegel des Benutzers für das Begriffssymbole „#vorwärts nach oben“ niedrig ist (Schritt ST4c).
  • Die Verständnispegel-Schätzeinheit 30 gibt Ergebnisse der Größenbestimmung der Ergebnisquoten zu der Dialogmanagementeinheit 31 als Verständnispegel des Benutzers für das Begriffssymbol aus und beendet die Verarbeitung von 10.
  • Bei Beendigung der Verarbeitung von 10 kehrt der Ablauf zu der Verarbeitung des Schritts ST3b von 9 zurück.
  • Im Schritt ST3b erwirbt die Dialogmanagementeinheit 31 den Verständnispegel des Benutzers für das Begriffssymbol von der Verständnispegel-Schätzeinheit 30 und gibt dann die Antwortschablone und den Verständnispegel des Benutzers für das Begriffssymbol zu der Antworterzeugungseinheit 32 aus.
  • Hier werden zusätzlich zu der Antwortschablone B1 das Ergebnis der Größenbestimmung, dass „der Verständnispegel des Benutzers für #Norden oben ist hoch“ und das Ergebnis der Größenbestimmung, dass „der Verständnispegel des Benutzers für #vorwärts nach oben niedrig ist“ als die Verständnispegel des Benutzers zu der Antworterzeugungseinheit 32 ausgegeben.
  • Die Antworterzeugungseinheit 32 verifiziert, ob die Erzeugungsverarbeitung für Antwortinformationen für alle in der Antwortschablone B1 enthaltene Begriffssymbole durchgeführt wurde (Schritt ST4b).
  • Hier sind „#Norden oben“ und „#vorwärts nach oben“ nicht verarbeitet (Schritt ST4b: NEIN), die Antworterzeugungseinheit 32 wählt aufeinanderfolgend Begriffe der nicht verarbeiteten Begriffssymbole in der Antwortschablone B1 aus (Schritt ST5b). Hier ist „#Norden oben“ ausgewählt.
  • Als Nächstes verifiziert die Antworterzeugungseinheit 32 auf der Grundlage des von der Dialogmanagementeinheit 31 eingegebenen Verständnispegels des Benutzers für die Begriffssymbole, ob der Verständnispegel des Benutzers für das ausgewählte Begriffssymbol niedrig ist (Schritt ST6b). Hier geht, da das Ergebnis der Größenbestimmung, dass „der Verständnispegel des Benutzers für #Norden oben ist hoch“ von der Dialogmanagementeinheit 31 eingegeben wird (Schritt ST6b: NEIN), die Antworterzeugungseinheit 32 zu der Verarbeitung des Schritts ST4b weiter.
  • Da das Begriffssymbol „#vorwärts nach oben“ nicht verarbeitet ist (Schritt ST4b: NEIN), geht der Ablauf zu der Verarbeitung des Schritts ST5b weiter.
  • Hier wird, da das Ergebnis der Größenbestimmung, dass „der Verständnispegel des Benutzers für #vorwärts nach oben ist niedrig“ von der Dialogmanagementeinheit 31 eingegeben wurde, die Verarbeitung von Schritt ST5b bis zu Schritt ST7b durchgeführt. Als ein Ergebnis erzeugt die Antworterzeugungseinheit 32 einen Satz „Vorwärts nach oben ist die Kartenanzeige mit einer aufwärts angeordneten Fahrtrichtung.“. Danach geht der Ablauf zu der Verarbeitung des Schritts ST4b weiter.
  • Da die Erzeugungsverarbeitung für Antwortinformationen für alle Begriffssymbole durchgeführt wurde (Schritt ST4b: JA), erzeugt die Antworterzeugungseinheit 32 einen Satz, in welchem entsprechende Begriffe an Begriffseinsatzpositionen der Antwortschablone B1 eingesetzt sind (Schritt ST8b).
  • In diesem Fall wird ein Antwortsatz „Wünschen Sie Norden oben oder vorwärts nach oben?“, in welchem die Begriffe entsprechend „#Norden oben“ und „#vorwärts nach oben“, die in der Antwortschablone B1 enthalten sind, gesetzt sind, erzeugt.
  • Als ein Ergebnis wird ein Satz „Vorwärts nach oben ist eine Kartenanzeige mit einer aufwärts gerichteten Fahrtrichtung. Wünschen Sie Norden oben oder vorwärts nach oben?“ erzeugt.
  • Danach wird die Verarbeitung von 9 beendet und der Ablauf kehrt zu der Verarbeitung von Schritt ST5a in 7 zurück.
  • Im Schritt ST5a von 7 präsentiert die Ausgabeeinheit 4 dem Benutzer den von der Antworterzeugungseinheit 32 erzeugten Satz. Hier wird ein Auswahlschirm „Vorwärts nach oben ist eine Kartenanzeige mit einer aufwärts gerichteten Fahrtrichtung. Wünschen Sie Norden oben oder vorwärts nach oben?“ auf dem Monitor 104 angezeigt.
  • Weiterhin wird eine Sprachäußerung „Vorwärts nach oben ist eine Kartenanzeige mit einer aufwärts gerichteten Fahrtrichtung. Wünschen Sie Norden oben oder vorwärts nach oben?“ über den Lautsprecher 103 ausgegeben.
  • Nachfolgend kehrt im Schritt ST6a, da die in 8 illustrierte Dialogbeendigungsverarbeitung C0 ausgewählt ist, der Ablauf zu der Verarbeitung des Schritts ST2a zurück.
  • Im Schritt ST2a versteht der Benutzer, dass „Norden oben“ eine häufig verwendete Funktion ist, und zusätzlich hierzu, dass „vorwärts nach oben“ „Kartenanzeige mit einer aufwärts gerichteten Fahrtrichtung“ bedeutet, anhand des von der Ausgabeeinheit 4 präsentierten Satzes.
  • Dann wird, wenn der Benutzer „Norden oben“ äußert oder eine Auswahltaste für „Norden oben“ unter Verwendung der Eingangseinheit 20 für manuelle Betätigung drückt, die Verarbeitung von Schritt ST3a bis zum Schritt ST7a durchgeführt. Dann führt die Funktionsausführungseinheit (nicht illustriert) eine Funktion des Änderns der Orientierung der Karte in Norden oben aus, woraufhin der Ablauf zum Schritt ST8a weitergeht.
  • In dem Fall, in welchem Norden oben in dem vorbeschriebenen Dialog durch eine Sprache bezeichnet ist, addiert die Dialogmanagementeinheit 31 +1 zu der Häufigkeit f2 der Schätzbedingung der Bedingungsnummer 2 in den Häufigkeitsdaten 5B-1 (Schritt ST8a). Weiterhin addiert die Dialogmanagementeinheit 31 +1 für das Begriffssymbol „#vorwärts nach oben“ zu der Häufigkeit f3 der Schätzbedingung der Bedingungsnummer 3 in den Häufigkeitsdaten 5B-2.
  • Wenn Norden oben durch Drücken der Auswahltaste für „Norden oben“ auf dem Auswahlschirm bezeichnet wird, fügt die Dialogmanagementeinheit 31 +1 zu der Häufigkeit f4 der Schätzbedingung der Bedingungsnummer 4 in den Häufigkeitsdaten 5B-1. Die Dialogmanagementeinheit 31 addiert weiterhin +1 zu der Häufigkeit f3 der Schätzbedingung der Bedingungsnummer 3 in den Häufigkeitsdaten 5B-2 für „#vorwärts nach oben“.
  • In einem derartigen Dialogzustand zum Bezeichnen einer von mehreren Funktionen, die aufeinander bezogen, aber in einer exklusiven Beziehung sind, kann in vielen Fällen auch ein Begriff entsprechend einer anderen Funktion aus den mehreren Funktionen auch dem Benutzer präsentiert werden. In diesem Fall wird in dem Fall, in welchem der Verständnispegel des Benutzers für den Begriff entsprechend der anderen Funktion niedrig ist, dem Benutzer ein erläuternder Satz über den Begriff entsprechend dieser Funktion präsentiert.
  • Das heißt, hinsichtlich eines Begriffs entsprechend einer Funktion, die nicht durchgeführt wird, aus den Begriffen entsprechend den mehreren Funktionen, werden Antwortinformationen, die das Verständnis des Benutzers erleichtern, präsentiert.
  • Somit werden, durch Aktualisieren der Häufigkeit, selbst wenn die andere Funktion nicht wie vorstehend beschrieben durchgeführt wird, für die das Begriffsverständnis des Benutzers unter den Begriffen entsprechend den mehreren Funktionen erhalten wurde, Antwortinformationen enthaltend einen erläuternden Satz auch für die andere Funktion, die nicht durchgeführt wurde, nicht länger präsentiert.
  • Dies verkürzt die Zeit zum Erzeugen der Antwortinformationen enthaltend den erläuternden Satz für den Begriff, wodurch ein effizienter Dialog in Abhängigkeit von dem Verständnis des Benutzers für den Begriff ermöglicht wird.
  • Wie vorstehend beschrieben ist, wählt in der Antworterzeugungsvorrichtung 3 nach dem ersten Ausführungsbeispiel die Dialogmanagementeinheit 31 eine Antwortschablone entsprechend einem Dialogzustand mit einem Benutzer aus Antwortschablonen entsprechend vorbestimmten Dialogzuständen aus und gibt ein Begriffssymbol, das in der ausgewählten Antwortschablone enthalten ist, aus. Die Verständnispegel-Schätzeinheit 30 spezifiziert Häufigkeiten und die Wichtungen der jeweiligen Schätzbedingungen einer Funktion entsprechend einem von der Dialogmanagementeinheit 31 eingegebenen Begriffssymbol durch Bezugnahme auf die Schätzbedingungstabelle 5A und die Häufigkeitstabelle 5B, und gibt ein Ergebnis der Größenbestimmung einer anhand der spezifizierten Häufigkeiten und der Wichtungen berechneten Ergebnisquote zu der Dialogmanagementeinheit 31 als den Verständnispegel des Benutzers für das Begriffssymbol aus. Die Antworterzeugungseinheit 32 erzeugt einen Antwortsatz in dem Dialogzustand mit dem Benutzer auf der Basis der durch die Dialogmanagementeinheit 31 ausgewählten Antwortschablone, fügt einen erläuternden Satz über das Begriffssymbol zu dem Antwortsatz in Abhängigkeit von dem Verständnispegel des Benutzers für das von der Dialogmanagementeinheit 31 eingegebene Begriffssymbol hinzu, und gibt den Antwortsatz aus. Auf diese Weise wird der Verständnispegel des Benutzers für einen in einem Dialog mit dem Benutzer präsentierten Begriff geschätzt, und ein erläuternder Satz wird in Abhängigkeit von dem Verständnispegel zu einem Antwortsatz hinzugefügt, und somit ist es möglich, das Verständnis des Benutzers für den in dem Dialog verwendeten Begriff angemessen zu erleichtern.
  • Weiterhin berechnet in der Antworterzeugungsvorrichtung 3 nach dem ersten Ausführungsbeispiel die Verständnispegel-Schätzeinheit 30 die Summe Σfi · wi von Werten fi · wi, die durch Multiplizieren jeder der Häufigkeiten fi und der Wichtungen wi , die für jeweilige Schätzbedingungen spezifiziert sind, erhalten wurden, als eine Ergebnisquote. Als eine Folge ist es möglich, einen genauen Verständnispegel gemäß einer Dialoghistorie mit dem Benutzer zu schätzen.
  • Weiterhin erzeugt in der Antworterzeugungsvorrichtung 3 nach dem ersten Ausführungsbeispiel die Antworterzeugungseinheit 32 einen Satz, und gibt diesen aus, in welchem ein erläuternder Satz nicht zu dem Antwortsatz für das Begriffssymbol, für das ein Verständnispegel des Benutzers hoch ist, hinzugefügt ist, und ein erläuternder Satz zu dem Antwortsatz für das Begriffssymbol, für das ein Verständnispegel des Benutzers niedrig ist, hinzugefügt ist.
  • Als eine Folge ist es, da der Satz, in welchem ein erläuternder Satz zu dem Antwortsatz in Abhängigkeit von dem Verständnispegel des Benutzers für das Begriffssymbol hinzugefügt wird, möglich, das Verständnis des Benutzers für den in dem Dialog verwendeten Begriff angemessen zu erleichtern.
  • Weiterhin erzeugt in der Antworterzeugungsvorrichtung 3 nach dem ersten Ausführungsbeispiel die Antworterzeugungseinheit 32 einen Satz, in welchem ein erläuternder Satz vor oder nach dem Antwortsatz für ein Begriffssymbol, für das ein Verständnispegel des Benutzers niedrig ist, hinzugefügt wird. Insbesondere hinsichtlich eines Begriffs, für den ein Verständnispegel des Benutzers niedrig ist, kann durch Erzeugen eines Satzes, in welchem ein erläuternder Satz für den Begriff durch den Antwortsatz gefolgt wird, der Benutzer den in dem Antwortsatz enthaltenen Begriff verstehen und hierdurch eine Operation entsprechend dem Antwortsatz durchführen.
  • Weiterhin erzeugt in der Antworterzeugungsvorrichtung 3 nach dem ersten Ausführungsbeispiel die Antworterzeugungseinheit 32 den Antwortsatz, in welchem ein Begriff zu einem Begriffssymbol gesetzt ist, für das ein Verständnispegel des Benutzers hoch ist, und erzeugt den Antwortsatz, in welchem ein erläuternder Satz zu einem Begriffssymbol gesetzt ist, für das ein Verständnispegel des Benutzers niedrig ist. Auf diese Weise ist es, da der Satz, in welchem ein erläuternder Satz für einen Begriff zu dem Inhalt des Antwortsatzes in Abhängigkeit von dem Verständnispegel des Benutzers für das Begriffssymbol hinzugefügt ist, möglich, das Verständnis des Benutzers für den in dem Dialog verwendeten Begriff angemessen zu erleichtern.
  • Weiterhin aktualisiert in der Antworterzeugungsvorrichtung 3 nach dem ersten Ausführungsbeispiel in einem Fall, in welchem eine von mehreren Funktionen in einer exklusiven Beziehung, in der die mehreren Funktionen aufeinander bezogen sind und nicht gleichzeitig durchgeführt werden können, durchgeführt wird, die Dialogmanagementeinheit 31 die Häufigkeit der Schätzbedingung, unter der die Funktion für das Begriffssymbol entsprechend der durchgeführten Funktion durchgeführt wird, und aktualisiert auch für ein Begriffssymbol entsprechend einer Funktion, die in der exklusiven Beziehung ist und nicht durchgeführt wurde, die Häufigkeit einer Schätzbedingung, deren Wichtung kleiner als die der Schätzbedingung, unter der die Funktion durchgeführt wurde, ist.
  • Das das Verständnis des Benutzers für Begriffe entsprechend mehreren Funktionen, die aufeinander bezogen sind und nicht gleichzeitig durchgeführt werden können, in der vorbeschriebenen Weise erhalten wird, werden demgemäß Antwortinformationen enthaltend den erläuternden Satz über den Begriff nicht länger präsentiert. Als ein Ergebnis wird, da das Verständnis des Benutzers für die Begriffe entsprechend den mehreren Funktionen erhalten wird, auch die Dialogzeit verkürzt, wodurch die Durchführung eines effizienten Dialogs ermöglicht wird.
  • Zweites Ausführungsbeispiel
  • 11 ist ein Blockschaltbild, das eine Konfiguration eines Dialogsteuersystems 1A nach einem zweiten Ausführungsbeispiel der Erfindung illustriert. In 11 ist die gleiche Komponente wie die in 1 mit dem gleichen Symbol bezeichnet und eine Beschreibung hiervon wird weggelassen. Wie das in dem ersten Ausführungsbeispiele beschriebene Dialogsteuersystem 1 steuert das Dialogsteuersystem 1A die Eingabe und Ausgabe von Informationen in einem Dialog mit einem Benutzer und enthält eine Eingangseinheit 2, eine Antworterzeugungsvorrichtung 3A, eine Ausgabeeinheit 4, eine Häufigkeitsinformations-Speichereinheit 5, eine Speichereinheit 6 für erläuternde Informationen und eine Antwortschablonen-Speichereinheit 7.
  • Die Antworterzeugungsvorrichtung 3A erzeugt einen in einem Dialog mit einem Benutzer präsentierten Antwortsatz und enthält eine Verständnispegel-Schätzeinheit 30, eine Dialogmanagementeinheit 31A, eine Antworterzeugungseinheit 32A und eine Absichtsschätzeinheit 33.
  • Zusätzlich zu ähnlichen Funktionen wie denjenigen der in dem ersten Ausführungsbeispiel beschriebenen Dialogmanagementeinheit 31 wählt die Dialogmanagementeinheit 31a eine Antwortschablone entsprechend einem Dialogzustand zum Bezeichnen einer durch die Absichtsschätzeinheit 33 geschätzten Funktion aus in der Antwortschablonen-Speichereinheit 7 gespeicherten Antwortschablonen aus.
  • Zusätzlich zu Funktionen, die denjenigen der in dem ersten Ausführungsbeispiel beschriebenen Antworterzeugungseinheit 32 ähnlich sind, erzeugt die Antworterzeugungseinheit 32A Antwortinformationen unter Berücksichtigung der Länge eines Satzes, der dem Benutzer zu präsentieren ist.
  • Beispielsweise erzeugt in einem Fall, in welchem Die Länge eines Satzes, in welchem ein erläuternder Satz über einen Begriff an einer Begriffseinsatzposition einer Antwortschablone eingesetzt ist, größer als ein oder gleich einem Schwellenwert ist, die Antworterzeugungseinheit 32A einen Satz, in welchem der Inhalt des Antwortsatzes in Sätze geteilt ist, von denen jeder eine Länge hat, die kleiner als der Schwellenwert ist. Beispiele für diesen Satz enthalten einen Satz enthaltend einen Antwortsatz, in welchem ein Begriff an einer Begriffseinsatzposition eingesetzt ist, und einen erläuternden Satz für den Begriff.
  • Die Absichtsschätzeinheit 33 schätzt eine Funktion, die der Benutzer durchzuführen beabsichtigt, auf der Basis der eingegebenen Informationen des Benutzers, die von der Eingangseinheit 2 angenommen wurden.
  • Beispielsweise wird durch Vorbereiten von Paaren einer korrekten beabsichtigten Funktion und eines geäußerten exemplarischen Satzes, der diese Funktion bezeichnet und Verwenden eines Maschinenlernens wie des maximalen Entropieverfahrens eine Funktion, die der Benutzer durchzuführen beabsichtigt, anhand der freien Äußerung des Benutzers geschätzt.
  • Es ist zu beachten, dass die Funktionen der Verständnispegel-Schätzeinheit 30, der Dialogmanagementeinheit 31A, der Antworterzeugungseinheit 32A und der Absichtsschätzeinheit 33 durch eine Verarbeitungsschaltung implementiert werden.
  • In dem Fall, in welchem die Verarbeitungsschaltung die Verarbeitungsschaltung 100 der in 5A illustrierten dedizierten Hardware ist, entspricht die Verarbeitungsschaltung 100 beispielsweise einer Einzelschaltung, einer zusammengesetzten Schaltung, einem programmierten Prozessor, einem parallel programmierten Prozessor, einer ASIC, einem FPGA oder einer Kombination von diesen.
  • Darüber hinaus sind, wenn die Verarbeitungsschaltung die in 5B illustrierte CPU 105 ist, die Funktionen der Verständnispegel-Schätzeinheit 30, der Dialogmanagementeinheit 31A, der Antworterzeugungseinheit 32A und der Absichtsschätzeinheit 33 durch Software, Firmware oder eine Kombination aus Software und Firmware implementiert.
  • Als Nächstes wird die Arbeitsweise beschrieben.
  • 12 ist ein Flussdiagramm, das die Arbeitsweise des Dialogsteuersystems 1A nach dem zweiten Ausführungsbeispiel illustriert und eine durch einen Dialog mit einem Benutzer durchgeführte Verarbeitungsreihe illustriert.
  • Anders als bei dem ersten Ausführungsbeispiel wird bei dem zweiten Ausführungsbeispiel unter der Annahme, dass die Eingabe der freien Äußerung angenommen wird und dass die Absichtsschätzeinheit 33 eine anhand des Inhalts der Äußerung durchzuführende Funktion schätzen kann, die folgende Verfahrensweise beschrieben. Auch wird bei dem zweiten Ausführungsbeispiel angenommen, dass die Äußerung des Benutzers ohne eine fehlerhafte Erkennung korrekt erkannt wird. Weiterhin wird angenommen, dass ein Dialog durch Verwendung einer nicht illustrierten Äußerungsstarttaste initiiert wird. Nachfolgend werden wie bei dem ersten Ausführungsbeispiel der Fall, in welchem der Benutzer das Dialogsteuersystem 1A zum ersten Mal benutzt, und der Fall, in welchem der Benutzer das Dialogsteuersystem 1A mehrere Male verwendet hat und Häufigkeitsdaten akkumuliert werden, beschrieben. Es ist zu beachten, dass in diesem Fall angenommen wird, dass ein in einem Dialog befindlicher Benutzer die eigenen Identifikationsinformationen des Benutzers unter Verwendung der Eingangseinheit 2 eingibt und dass der Benutzer hierdurch auf der Seite des Dialogsteuersystems 1A identifiziert wird.
  • In dem Fall, in welchem das Dialogsteuersystem 1A zum ersten Mal von dem Benutzer verwendet wird, werden wie bei dem ersten Ausführungsbeispiel, wenn „Ändern der Kartenorientierung“ einer Softwaretaste gedrückt wird, zwei Begriffe (Schlüsselwörter) „Norden oben“ und „vorwärts nach oben“ auf einem Schirm des Monitors 104 angezeigt. Danach geht der Ablauf zu der Antwortinformations-Erzeugungsverarbeitung von 12 weiter.
  • Im Schritt ST1d von 12 kann wie im Schritt ST1b die Dialogmanagementeinheit 31A eine von dem Benutzer beabsichtigte Funktion spezifizieren und eine Antwortschablone entsprechend einem Dialogzustand auswählen, um nachfolgend dieser Funktion zu folgen. Darüber hinaus sind Schritte ST2d und ST3d ähnlich der Verarbeitung der in 9 illustrierten Schritte ST2b und ST3b, und somit wird deren Beschreibung weggelassen.
  • Durch die Reihe der Verarbeitung gibt die Dialogmanagementeinheit 31A z der Antworterzeugungseinheit 32A die Antwortschablone B1, das Ergebnis der Größenbestimmung, dass „der Verständnispegel des Benutzers für #Norden oben ist niedrig“ und das Ergebnis der Größenbestimmung, dass „der Verständnispegel des Benutzers für #vorwärts nach oben ist niedrig“ aus.
  • Im Schritt ST4d liest die Antworterzeugungseinheit 32A erläuternde Sätze über das Begriffssymbol „#Norden oben“ und das Begriffssymbol „#vorwärts nach oben“ aus der Speichereinheit 6 für erläuternde Informationen.
  • Da der Verständnispegel des Benutzers für das Begriffssymbol „#Norden oben“ und das Begriffssymbol „#vorwärts nach oben“, die in der Antwortschablone B1 enthalten sind, niedrig ist, erzeugt die Antworterzeugungseinheit 32A einen Antwortsatz, in welchem der erläuternde Satz für das Begriffssymbol gesetzt ist und berechnet die Länge des erzeugten Antwortsatzes.
  • In diesem Fall werden die Anzahl von Zeichen der beiden Teile „ni shi ma su ka (Wünschen Sie)“, die Teile der Antwortschablone B1 ausschließlich der Begriffssymbole sind, und die Anzahl von Zeichen der jeweiligen erläuternden Sätze für die Begriffe „Norden oben“ und „vorwärts nach oben“ berechnet, und diese Anzahlen von Zeichen werden summiert.
  • Als ein Ergebnis wird die Länge des Antwortsatzes, in welchem die erläuternden Sätze für die Begriffssymbole der Antwortschablone B1 gesetzt sind, berechnet. In dem vorstehenden Beispiel ist die Anzahl von Zeichen des Teils „ni shi ma su ka (Möchten Sie) “ gleich 5, die Anzahl von Zeichen des erläuternden Satzes „kita ga ue ni na ru chi zu hyo ji (Kartenanzeige, bei der der Norden oben angeordnet ist)“ des Begriffs „Norden oben“ ist gleich 10, und die Anzahl von Zeichen des erläuternden Satzes „shin kou hou kou ga ue ni na ru chi zu hyo ji (Kartenanzeige mit einer nach oben gerichteten Fahrtrichtung)“ des Begriffs „vorwärts nach oben“ ist gleich 13, und die Länge des Antwortsatzes insgesamt ist gleich 33 (= 5 + 5 + 10 + 13).
  • Als Nächstes bestimmt die Antworterzeugungseinheit 32A, ob die Länge des Antwortsatzes größer als ein oder gleiche einem Schwellenwert N ist (Schritt ST5d). Wenn der Antwortsatz zu lang ist, wenn der auf der Grundlage der Antwortschablone erzeugte Antwortsatz hörbar oder sichtbar präsentiert wird, ist es möglich, dass der Benutzer den Inhalt des Antwortsatzes nicht unmittelbar erkennen kann. Daher wird als der Schwellenwert N ein oberer Grenzwert innerhalb eines Bereichs von Längen eines Satzes, für den vorhergesagt wird, dass die Erkennung durch den Benutzer nicht gestört wird, gesetzt.
  • In diesem Fall ist die Länge des Antwortsatzes gleich 33, die größer als der oder gleich dem Schwellenwert N (= 30) ist (Schritt ST5d: JA). Hier erzeugt die Antworterzeugungseinheit 32A beispielsweise einen in 13 illustrierten Satz D3 als Antwortinformationen (Schritt ST6d).
  • In 13 lautet der Satz D3 „Norden oben ist eine Kartenanzeige, bei der der Norden oben angeordnet ist. Vorwärts nach oben ist eine Kartenanzeige, bei der eine Fahrtrichtung aufwärts gerichtet ist. Wünschen Sie Norden oben oder vorwärts nach oben?“, und eine Schablone mit der Form „{#Begriffssymbol = Begriff} bedeutet {#Begriffssymbol = erläuternder Satz für den Begriff}.“ wird vorbereitet.
  • Die Antworterzeugungseinheit 32A setzt den entsprechenden Begriff oder den erläuternden Satz für die Begriffssymbole in die vorgenannte Schablone, wodurch ein Satz „no su a ppu wa ki ta ga u e ni na ru chi zu hyo ji de su (Norden oben ist Kartenanzeige, bei der der Norden oben angeordnet ist)“, der neunzehn Zeichen enthält, und ein Satz „he di nn gu a ppu wa shi n kou hou kou ga u e ni na ru chi zu hyo ji de su (vorwärts nach oben ist eine Kartenanzeige mit einer nach oben gerichteten Fahrtrichtung)“, der 24 Zeichen enthält, erzeugt werden.
  • Weiterhin setzt die Antworterzeugungseinheit 32A die Begriffe entsprechend den Begriffssymbolen der Antwortschablone B1, wodurch der Antwortsatz „no su a ppu ni shi ma su ka, he di nn gu a ppu ni shi ma su ka (Wünschen Sie Norden oben oder vorwärts nach oben)?, der 24 Zeichen enthält, erzeugt wird. Der Satz D3, der in dieser Weise erzeugt wird, wird von der Antworterzeugungseinheit 32A zu der Ausgabeeinheit 4 als Antwortinformationen ausgegeben. Dann gibt die Ausgabeeinheit 4 eine Sprache aus und zeigt einen Schirm an. Wenn der Satz D3 „Norden oben ist eine Kartenanzeige, bei der der Norden oben angeordnet ist: Vorwärts nach oben ist eine Kartenanzeige, bei der die Fahrtrichtung nach oben angeordnet ist. Wünschen Sie Norden oben oder vorwärts nach oben?“ durch Sprache ausgegeben wird, versteht der Benutzer, dass der Begriff „Norden oben“ „Kartenanzeige, bei der der Norden oben angeordnet ist“ bedeutet.
  • Wenn der Benutzer „Norden oben“ äußert oder eine Auswahltaste für „Norden oben“ unter Verwendung der Eingangseinheit 20 für manuelle Betätigung drückt, wird die Verarbeitung von Schritt ST3a bis Schritt ST7a in 7 durchgeführt. Dann führt die Funktionsdurchführungseinheit (nicht illustriert) eine Funktion des Änderns der Orientierung der Karte in Norden oben durch, worauf der Ablauf zum Schritt ST8a in 7 weitergeht.
  • In dem Fall, in welchem in dem vorbeschriebenen Dialog Norden oben durch eine Sprache bezeichnet wird, addiert die Dialogmanagementeinheit 31A +1 zu der Häufigkeit f2 der Schätzbedingung der Bedingungsnummer 2 in den Häufigkeitsdaten 5B-1 (Schritt ST8a). Weiterhin addiert die Dialogmanagementeinheit 31A für das Begriffssymbol „#vorwärts nach oben“ +1 zu der Häufigkeit f3 der Schätzbedingung der Bedingungsnummer 3 in den Häufigkeitsdaten 5B-2.
  • Wenn Norden oben durch Drücken der Auswahltaste für „Norden oben“ auf dem Auswahlschirm bezeichnet wird, addiert die Dialogmanagementeinheit 31A +1 zu der Häufigkeit f4 der Schätzbedingung der Bedingungsnummer 4 in den Häufigkeitsdaten 5B-1. Die Dialogmanagementeinheit 31A addierter weiterhin +1 zu der Häufigkeit f3 der Schätzbedingung der Bedingungsnummer 3 in den Häufigkeitsdaten 5B-2 für „#vorwärts nach oben“.
  • Auf diese Weise wird, wenn eine bestimmte Funktion durchgeführt wird, durch aufeinanderfolgendes Aktualisieren der Häufigkeiten der durchgeführten Funktion und einer Funktion in einer exklusiven Beziehung mit der durchgeführten Funktion der Verständnispegel des Benutzers für das Begriffssymbol unter Verwendung der Häufigkeitsdaten geschätzt.
  • Andererseits werden in dem Fall, in welchem das Dialogsteuersystem 1A mehrere Male von dem Benutzer verwendet wird, wie vorstehend beschrieben ist, wenn „Ändern der Kartenorientierung“ einer Softwaretaste gedrückt wird, zwei Begriffe (Schlüsselwörter) „Norden oben“ und „vorwärts nach oben“ auf einem Schirm des Monitors 104 angezeigt. Danach geht der Ablauf zu der Antwortinformations-Erzeugungsverarbeitung von 12 weiter.
  • Durch die Verarbeitungsreihe vom Schritt ST1d bis zum Schritt ST3d in 12 gibt die Dialogmanagementeinheit 31A die Antwortschablone B1, das Ergebnis der Größenbestimmung, dass „der Verständnispegel des Benutzers für #Norden oben ist hoch“ und das Ergebnis der Größenbestimmung, dass „der Verständnispegel des Benutzers für #vorwärts nach oben ist niedrig“ zu der Antworterzeugungseinheit 32A aus.
  • Im Schritt ST4d liest auf der Grundlage der von der Dialogmanagementeinheit 31A eingegebenen Informationen die Antworterzeugungseinheit 32A den Begriff des Begriffssymbols „#Norden oben“ und den erläuternden Satz für das Symbol „#vorwärts nach oben“ aus der Speichereinheit 6 für erläuternde Informationen.
  • Die Antworterzeugungseinheit 32A erzeugt die Anzahl von Zeichen der beiden Teile „ni shi ma su ka (Wünschen Sie)“, die Teile der Antwortschablone B1 unter Ausschluss der Begriffssymbole sind, die Anzahl von Zeichen des Begriffs „Norden oben“ und die Anzahl von Zeichen des erläuternden Satzes des Begriffs „vorwärts nach oben“ werden berechnet, und diese Anzahlen von Zeichen werden summiert.
  • Als ein Ergebnis wird die Länge des Antwortsatzes, in welchem der erläuternde Satz für den Begriff zu dem Begriffssymbol der Antwortschablone B1 gesetzt ist, berechnet. In diesem Fall ist die Anzahl von Zeichen des Teils „ni shi ma su ka (Wünschen Sie)“ gleich 5, die Anzahl von Zeichen des Begriffs „no su a ppu (Norden oben)“ ist gleich 6, und die Anzahl von Zeichen des erläuternden Satzes „shin kou hou kou ga u e ni na ru chi zu hyo ji (Kartenanzeige mit einer nach oben gerichteten Fahrtrichtung) des Begriffs „vorwärts nach oben“ ist gleich 13, die Länge des Antwortsatzes insgesamt ist 29 (= 5 + 5 + 6 + 13).
  • Als Nächstes bestimmt die Antworterzeugungseinheit 32A, ob die Länge des Antwortsatzes größer als ein oder gleich einem Schwellenwert N ist (Schritt ST5d). Hier ist die Länge des Antwortsatzes 29 und ist kleiner als der Schwellenwert N (= 30) (Schritt ST5d: NEIN). Hier erzeugt die Antworterzeugungseinheit 32A beispielsweise einen in 13 illustrierten Satz D1 als Antwortinformationen (Schritt ST6d).
  • Weiterhin erzeugt in Vorbereitung für den Fall, in welchem der Benutzer mit einer Äußerung ähnlich „Kartenanzeige mit einer aufwärts gerichteten Fahrtrichtung“ wie „Fahrtrichtung nach oben“ oder „Karte in der Fahrtrichtung“ fortfährt und hierdurch „vorwärts nach oben“ bezeichnet, die Antworterzeugungseinheit 32A auch vorher einen Satz „Kartenanzeige mit einer Fahrtrichtung, die nach oben gerichtet ist, ist vorwärts nach oben.“.
  • Wenn der Satz D1 „Wünschen Sie Norden oben oder Kartenanzeige mit einer nach oben gerichteten Fahrtrichtung?“ durch Sprache ausgegeben wird, versteht der Benutzer, dass „Norden oben“ eine Funktion ist, die häufig verwendet wird, und dass eine Kartenanzeige mit einer nach oben gerichteten Fahrtrichtung zusätzlich hierzu vorliegt.
  • Wenn der Benutzer „Karte mit einer nach oben gerichteten Fahrtrichtung“ äußert, wird die Verarbeitung vom Schritt ST3a zum Schritt ST7a in 7 durchgeführt. Dann führt die Funktionsdurchführungseinheit (nicht illustriert) eine Funktion des Änderns der Orientierung der Karte in Norden oben durch, woraufhin der Ablauf zum Schritt ST8a in 7 fortschreitet.
  • Wenn eine Karte, in der die Fahrtrichtung aufwärts gerichtet ist, in dem vorgenannten Dialog durch eine Sprach bezeichnet wird, schätzt die Absichtsschätzeinheit 33, dass die Funktion, die der Benutzer durchzuführen beabsichtigt, „vorwärts nach oben“ ist.
  • Die Dialogmanagementeinheit 31A addiert +1 zu der Häufigkeit f2 der Schätzbedingung der Bedingungsnummer 2 in den Häufigkeitsdaten 5B-2 (Schritt ST8a). Weiterhin addiert die Dialogmanagementeinheit 31A auch für das Begriffssymbol „#Norden oben“ +1 zu der Häufigkeit f3 der Schätzbedingung der Bedingungsnummer 3 in den Häufigkeitsdaten 5B-1.
  • Zusätzlich gibt, wie vorstehend beschrieben ist, in dem Fall, in welchem eine Funktion durch eine Sprache wie „Karte mit einer aufwärts gerichteten Fahrtrichtung“ ohne Verwendung des Begriffssymbols „#vorwärts nach oben“ als ein Satz bezeichnet wird, der die Beschreibung der bezeichneten Funktion und den Begriff verwendet, die Antworterzeugungseinheit 32A den vorgenannten Satz „Kartenanzeige mit einer nach oben gerichteten Fahrtrichtung ist vorwärts nach oben.“ zu der Ausgabeeinheit 4 aus. Als ein Ergebnis präsentiert die Ausgabeeinheit 4 dem Benutzer den Satz D2.
  • In dem Fall, in welchem die Funktion durch Bezeichnen des erläuternden Satzes in dieser Weise durchgeführt wird, ist es durch zusätzliches Präsentieren eines Satzes, in welchem ein Begriff entsprechend dieser Funktion mit einem erläuterten Satz hierfür assoziiert ist, für den Benutzer auch möglich, das Verständnis des Benutzers für den Begriff angemessen zu erleichtern.
  • Wie vorstehend geschrieben ist, teilt in der Antworterzeugungsvorrichtung 3A nach dem zweiten Ausführungsbeispiel in einem Fall, in welchem der erzeugte Satz eine Länge hat, die größer als der oder gleich dem vorbestimmten Schwellenwert N ist, die Antworterzeugungseinheit 32A den Satz in mehrere Sätze, die jeweils eine Länge haben, die kleiner als der Schwellenwert N ist, und gibt die Sätze aus. Auf diese Weise ist es möglich, Antwortinformationen zu präsentieren, die der Benutzer leicht erkennen kann.
  • Die Antworterzeugungsvorrichtung 3A nach dem zweiten Ausführungsbeispiel enthält weiterhin die Absichtsschätzeinheit 33, die eine Funktion, die der Benutzer durchzuführen beabsichtigt, auf der Grundlage der Eingangsinformationen schätzt. Als ein Ergebnis kann, selbst in dem Fall, in welchem ein Inhalt, der ähnlich einem Begriff oder einem in dem Antwortsatz enthaltenen erläuternden Satz ist, von dem Benutzer geäußert wird, die Funktion anhand des Inhalts der Äußerung geschätzt werden.
  • Weiterhin erzeugt in der Antworterzeugungsvorrichtung 3A nach dem zweiten Ausführungsbeispiel die Antworterzeugungseinheit 32A einen Satz enthaltend das Begriffssymbol und einen erläuternden Satz in einem Fall, in welchem eine Funktion entsprechend dem Begriffssymbol durch den Benutzer ohne Verwendung des Begriffssymbols durchgeführt wird, und gibt diese aus.
  • Da der auf diese Weise erzeugte Satz präsentiert wird, kann der Benutzer den Begriff entsprechend der ausgeführten Funktion verstehen.
  • Insbesondere ist, obgleich die Absichtsschätzeinheit 33 die Funktion anhand verschiedener Stücke des von dem Benutzer geäußerten Inhalts schätzen kann, die Zuverlässigkeit der anhand des geäußerten Inhalts geschätzten Funktion gering. Daher wird, indem ein Satz enthaltend einen Begriff und ein erläuternder Satz präsentiert werden, die Wahrscheinlichkeit, dass der Benutzer den die Funktion in dem Dialog darstellenden Begriff verwendet, nachträglich erhöht. Dies kann die Zuverlässigkeit der von der Absichtsschätzeinheit 33 geschätzten Funktion verbessern.
  • Darüber hinaus ist, obgleich der Fall, in welchem die Absichtsschätzeinheit 33 die Funktion entsprechend dem Begriffssymbol schätzt, wenn das Begriffssymbol von dem Benutzer nicht verwendet wird, die vorliegende Erfindung jedoch nicht hierauf beschränkt. Beispielsweise erkennt, wenn der Benutzer die Funktion entsprechend dem Begriffssymbol durch manuelle Betätigung mittels Verwendung der Eingangseinheit 20 für manuelle Betätigung ohne Äußerung des Begriffssymbols durchführt, die Dialogmanagementeinheit 32A, dass die Funktion entsprechend dem Begriffssymbol durchgeführt wurde und teilt diesen Umstand der Antworterzeugungseinheit 32A mit. Als eine Folge erzeugt die Antworterzeugungseinheit 32A einen Satz enthaltend das Begriffssymbol und den erläuternden Satz, und gibt diesen aus.
  • Das heißt, da die Schätzung durch die Absichtsschätzeinheit 33 nicht erforderlich ist, in einem Fall, in welchem die Dialogmanagementeinheit 31 nach dem ersten Ausführungsbeispiel erkennen kann, dass der Benutzer die Funktion entsprechend dem Begriffssymbol ohne Verwendung des Begriffssymbols durchgeführt hat, kann die Antworterzeugungseinheit 32 nach dem ersten Ausführungsbeispiel einen Satz enthaltend das Begriffssymbol und den erläuternden Satz erzeugen.
  • Es ist zu beachten, dass in dem ersten Ausführungsbeispiel und dem zweiten Ausführungsbeispiel die Wichtung wi , die den Schätzbedingungen in der Schätzbedingungstabelle 5A zugewiesen ist, ungeachtet des Verstreichens der Zeit ein konstanter Wert ist.
  • Jedoch besteht unter einer Schätzbedingung, dass eine Funktion nicht bezeichnet wird, selbst wenn eine gewisse Zeitperiode verstrichen, eine Wahrscheinlichkeit, dass der Benutzer den Inhalt eines in einem Dialogzustand, der durch die Schätzbedingung angezeigt wird, präsentierten Begriffs vergessen hat, und somit ist es erforderlich, den Benutzer den Begriff wieder verstehen zu lassen.
  • Daher kann die Dialogmanagementeinheit 31 oder die Dialogmanagementeinheit 31A in der Schätzbedingungstabelle 5A die Wichtung wi für eine Schätzbedingung, die einen Schwellenwert von verstrichener Zeit nach der letzten Aktualisierung der Häufigkeit fi überschreitet, herabsetzen. Beispielsweise werden mehrere Schwellenwerte für die verstrichene Zeit vorbereitet, und die Wichtung wi wird jedes Mal, wenn ein Schwellenwert der verstrichenen Zeit überschritten wird, schrittweise oder allmählich herabgesetzt.
  • Auf diese Weise nimmt der Verständnispegel des Benutzers für ein Begriffssymbol unter einer Schätzbedingung, die häufig nicht in dem Dialog mit dem Benutzer folgt, ab, und somit wird ein Antwortsatz mit einem hinzugefügten erläuternden Satz präsentiert. Dies erleichtert dem Benutzer, dass unter der Schätzbedingung, die häufig nicht dem Dialog mit dem Benutzer folgt, präsentierte Begriffssymbol zu verstehen.
  • In dem Fall, in welchem eine Funktion, die nicht gleichzeitig mit der früher bezeichneten Funktion durchgeführt werden kann, innerhalb einer zulässigen Zeitperiode, nachdem die Funktion durch den Benutzer bezeichnet wurde, bezeichnet wird, kann die Dialogmanagementeinheit 31 oder die Dialogmanagementeinheit 31A die Häufigkeit fi einer Schätzbedingung für die nachfolgend bezeichnete Funktion aktualisieren, ohne die Häufigkeit fi einer Schätzbedingung für die früher bezeichnete Funktion zu aktualisieren.
  • Beispielsweise sind Norden oben und vorwärts nach oben in einer exklusiven Beziehung, die gegenseitig hinsichtlich der Kartenorientierung bezogen sind und nicht gleichzeitig ausgeführt werden können. In diesem Fall wird in dem Fall, in welchem aufwärts nach oben, das in einer exklusiven Beziehung ist, innerhalb der zulässigen Zeitperiode nach der Bezeichnung von Norden oben bezeichnet wird, die das letzte Mal für Norden oben inkrementierte Häufigkeit auf den ursprünglichen Wert zurückgesetzt, und die Häufigkeit für vorwärts nach oben wird inkrementiert.
  • Als ein Ergebnis kann in dem Fall, in welchem eine Funktion, die verschieden von der Funktion entsprechend diesem Begriff ist, fehlerhaft bezeichnet ist aufgrund eines ungenügenden Verständnisses des Benutzers für diesen Begriff, die Häufigkeit derart korrigiert werden, dass diese Bezeichnung nicht bei der Schätzung des Verständnispegels reflektiert wird.
  • Weiterhin kann bei dem ersten Ausführungsbeispiel und dem zweiten Ausführungsbeispiel eine Schätzbedingung einen Zustand des Benutzers enthalten. In diesem Fall aktualisiert die Dialogmanagementeinheit 31 oder die Dialogmanagementeinheit 31A die Häufigkeit fi , mit der eine Funktion unter einer Schätzbedingung entsprechend dem Zustand des Benutzers auf der Grundlage von Erfassungsinformationen über den Zustand des Benutzers bezeichnet wird.
  • Auf diese Weise kann der Erfassungspegel des Benutzers für ein Begriffssymbol in Abhängigkeit von dem Zustand des Benutzers geschätzt werden.
  • Weiterhin wird bei dem ersten Ausführungsbeispiel und dem zweiten Ausführungsbeispiel der Fall, in welchem ein Dialog mit dem Benutzer auf Japanisch durchgeführt wird, illustriert, aber die vorliegende Erfindung ist nicht hierauf beschränkt.
  • Beispielsweise wird durch Vorbereiten von Daten, die für eine Dialogverarbeitung wie Antwortschablonen, der Schätzbedingungstabelle, der Häufigkeitstabelle und der Begriffserläuterungstabelle in verschiedenen Sprachen wie Englisch, Deutsch und Chinesisch verwendet werden, eine Anwendung auf Dialoge unter Verwendung dieser Sprachen auch möglich.
  • Es ist zu beachten, dass innerhalb des Bereichs der vorliegenden Erfindung die vorliegende Erfindung eine flexible Kombination der jeweiligen Ausführungsbeispiele, eine Modifikation jeder Komponente der jeweiligen Ausführungsbeispiele oder das Weglassen jeder Komponente in den jeweiligen Ausführungsbeispielen enthalten kann.
  • GEWERBLICHE ANWENDBARKEIT
  • Eine Antworterzeugungsvorrichtung nach der vorliegenden Erfindung kann das Verständnis eines Benutzers für einen in einem Dialog verwendeten Begriff angemessen erleichtern und ist somit geeignet für beispielsweise eine Schnittstelle eines Fahrzeug-Navigationssystems, in welchem ein technischer Begriff zum Bezeichnen einer Funktion verwendet wird.
  • Bezugszeichenliste
  • 1, 1A: digitales Steuersystem, 2: Eingangseinheit, 3, 3A: Antworterzeugungsvorrichtung, 4: Ausgabeeinheit, 5: Häufigkeitsinformations-Speichereinheit, 5A: Schätzbedingungstabelle, 5B: Häufigkeitstabelle, 5B-1, 5B-2: Häufigkeitsdaten, 5C: Begriffserläuterungstabelle, 6: Speichereinheit für erläuternde Informationen, 7: Antwortschablonen-Speichereinheit, 20: Eingangseinheit für manuelle Betätigung, 21: Spracherkennungseinheit, 30: Verständnispegel-Schätzeinheit, 31, 31A: Dialogmanagementeinheit, 32, 32A: Antworterzeugungseinheit, 33: Absichtsschätzeinheit, 100: Verarbeitungsschaltung, 101: Touchpanel, 102: Mikrofon, 103: Lautsprecher, 104: Monitor, 105: CPU, 106: Plattenlaufwerk, 107: Speicher.

Claims (13)

  1. Antworterzeugungsvorrichtung, welche aufweist: eine Dialogmanagementeinheit (31) zum Auswählen einer Antwortschablone entsprechend einem Dialogzustand mit einem Benutzer aus Antwortschablonen entsprechend vorbestimmten Dialogzuständen und zum Ausgeben eines Begriffssymbols, das in der ausgewählten Antwortschablone enthalten ist; eine Verständnispegel-Schätzeinheit (30) zur Bezugnahme auf eine Schätzbedingungstabelle (5A), in der mehrere Schätzbedingungen, die durch die vorbestimmten Dialogzustände definiert sind, und Wichtungen, die den jeweiligen Schätzbedingungen entsprechend dem Verständnis für Begriffssymbole zugeteilt sind, miteinander assoziiert sind, und eine Häufigkeitstabelle (5B), in der Häufigkeiten, mit denen eine Funktion in den jeweiligen Schätzbedingungen ausgeführt wurde, und ein Begriffssymbol entsprechend der Funktion miteinander assoziiert sind, zum Spezifizieren der Häufigkeiten und der Wichtungen der jeweiligen Schätzbedingungen der Funktion entsprechend dem Begriffssymbol, das von der Dialogmanagementeinheit (31) eingegeben wurde, und zum Ausgeben eines Ergebnisses einer Größenbestimmung einer Ergebnisquote, die anhand der spezifizierten Häufigkeiten und Wichtungen berechnet wurde, zu der Dialogmanagementeinheit (31) als Verständnispegel eines Benutzers für das Begriffssymbol; und eine Antworterzeugungseinheit (32) zum Erzeugen eines Antwortsatzes in dem Dialogzustand mit dem Benutzer auf der Grundlage der von der Dialogmanagementeinheit (31) ausgewählten Antwortschablone, Hinzufügen eines erläuternden Satzes zu dem Antwortsatz in Abhängigkeit von dem Verständnispegel des Benutzers für das von der Dialogmanagementeinheit (31) eingegebene Begriffssymbol, und Ausgeben des Antwortsatzes.
  2. Antworterzeugungsvorrichtung nach Anspruch 1, bei der die Verständnispegel-Schätzeinheit (30) als die Ergebnisquote eine Summe von Werten berechnet, die durch Multiplizieren der Häufigkeiten und der Wichtungen für die jeweiligen Schätzbedingungen erhalten wurden.
  3. Antworterzeugungsvorrichtung nach Anspruch 1, bei der die Antworterzeugungseinheit (32) einen Satz erzeugt und ausgibt, in welchem ein erläuternder Satz nicht zu dem Antwortsatz für ein Begriffssymbol hinzugefügt wird, für das ein Verständnispegel des Benutzers hoch ist, und ein erläuternder Satz zu dem Antwortsatz für ein Begriffssymbol hinzugefügt ist, für das ein Verständnispegel des Benutzers gering ist.
  4. Antworterzeugungsvorrichtung nach Anspruch 1, bei der die Antworterzeugungseinheit (32) einen Satz erzeugt, in welchem ein erläuternder Satz vor oder nach dem Antwortsatz für ein Begriffssymbol, für das ein Verständnispegel des Benutzers niedrig ist, hinzugefügt ist.
  5. Antworterzeugungsvorrichtung nach Anspruch 1, bei der die Antworterzeugungseinheit (32) den Antwortsatz erzeugt, in welchem ein Begriff als ein Begriffssymbol gesetzt ist, für das ein Verständnispegel des Benutzers hoch ist, und den Antwortsatz erzeugt, in welchem ein erläuternder Satz für ein Begriffssymbol gesetzt ist, für das ein Verständnispegel des Benutzers gering ist.
  6. Antworterzeugungsvorrichtung nach Anspruch 1, bei der in einem Fall, in welchem der erzeugte Satz eine Länge hat, die größer als ein oder gleich einem vorbestimmten Schwellenwert ist, die Antworterzeugungseinheit (32) den Satz in mehrere Sätze teilt, die jeweils eine Länge, die kleiner als der Schwellenwert ist, haben, und die Sätze ausgibt.
  7. Antworterzeugungsvorrichtung nach Anspruch 1, weiterhin aufweisend eine Absichtsschätzeinheit (33) zum Schätzen einer Funktion, die der Benutzer auszuführen beabsichtigt, auf der Grundlage von Eingangsinformationen.
  8. Antworterzeugungsvorrichtung nach Anspruch 1, bei der, wenn eine von mehreren Funktionen in einer exklusiven Beziehung, in der die mehreren Funktionen aufeinander bezogen sind und nicht gleichzeitig ausgeführt werden können, ausgeführt wird, die Dialogmanagementeinheit (31) die Häufigkeit einer Schätzbedingung, unter der die Funktion für ein Begriffssymbol entsprechend der ausgeführten Funktion ausgeführt hat, aktualisiert und auch für ein Begriffssymbol entsprechend einer Funktion, die in der exklusiven Beziehung ist und nicht ausgeführt wurde, die Häufigkeit einer Schätzbedingung, deren Wichtung kleiner als die der Schätzbedingung, unter der die Funktion ausgeführt wurde, ist, aktualisiert.
  9. Antworterzeugungsvorrichtung nach Anspruch 1, bei der die Antworterzeugungseinheit (32) einen Satz enthaltend ein Begriffssymbol und einen erläuternden Satz erzeugt und ausgibt, wenn eine Funktion entsprechend dem Begriffssymbol durch den Benutzer ohne Verwendung des Begriffssymbols ausgeführt wird.
  10. Antworterzeugungsvorrichtung nach Anspruch 1, bei der die Dialogmanagementeinheit (31) die Wichtung für eine Schätzbedingung, deren Häufigkeit nicht aktualisiert wird, selbst wenn eine vorbestimmte Zeitperiode verstrichen ist, nachdem die Häufigkeit zum letzten Mal aktualisiert wurde, verringert.
  11. Antworterzeugungsvorrichtung nach Anspruch 1, bei der, wenn innerhalb einer zulässigen Zeitperiode nachdem die Ausführung einer von mehreren Funktionen in einer exklusiven Beziehung, in der die mehreren Funktionen nicht gleichzeitig ausgeführt werden können, bezeichnet wurde, die Ausführung einer anderen Funktion in der exklusiven Beziehung bezeichnet wird, die Dialogmanagementeinheit (31) die Häufigkeit einer Schätzbedingung, unter der die Ausführung der Funktion vorher bezeichnet wurde, nicht aktualisiert, sondern die Häufigkeit einer Schätzbedingung, unter der die Ausführung der anderen Funktion bezeichnet wurde, aktualisiert.
  12. Dialogsteuersystem, welches aufweist: eine Dialogmanagementeinheit (31) zum Auswählen einer Antwortschablone entsprechend einem Dialogzustand mit einem Benutzer aus Antwortschablonen entsprechend vorbestimmten Dialogzuständen und Ausgeben eines Begriffssymbols, das in der ausgewählten Antwortschablone enthalten ist; eine Verständnispegel-Schätzeinheit (30) zur Bezugnahme auf eine Schätzbedingungstabelle (5A), in der mehrere Schätzbedingungen, die durch die vorbestimmten Dialogzustände definiert sind, und Wichtungen, die den jeweiligen Schätzzuständen entsprechend einem Verständnis für Begriffssymbole zugewiesen sind, miteinander assoziiert sind, und eine Häufigkeitstabelle (5B), in der Häufigkeiten, mit denen eine Funktion in den jeweiligen Schätzbedingungen ausgeführt wurde, und ein Begriffssymbol entsprechend der Funktion miteinander assoziiert sind, zum Spezifizieren der Häufigkeiten und der Wichtungen der jeweiligen Schätzbedingungen der Funktion entsprechend dem von der Dialogmanagementeinheit (31) eingegebenen Begriffssymbol, und zum Ausgeben eines Ergebnisses einer Größenbestimmung einer Ergebnisquote, die anhand der spezifizierten Häufigkeiten und der Wichtungen berechnet wurde, zu der Dialogmanagementeinheit (31) als einen Verständnispegel eines Benutzers für das Begriffssymbol; eine Antworterzeugungseinheit (32) zum Erzeugen eines Antwortsatzes in dem Dialogzustand mit dem Benutzer auf einer Grundlage der von der Dialogmanagementeinheit (31) ausgewählten Antwortschablone, Hinzufügen eines erläuternden Satzes zu dem Antwortsatz in Abhängigkeit von dem Verständnispegel des Benutzers für das von der Dialogmanagementeinheit (31) eingegebene Begriffssymbol, und Ausgeben des Antwortsatzes; eine Eingangseinheit (2) zum Annehmen des Dialogs mit dem Benutzer; und eine Ausgabeeinheit (4) zum Präsentieren des von der Antworterzeugungseinheit (32) ausgegebenen Satzes für den Benutzer.
  13. Antworterzeugungsverfahren, welches aufweist: Auswählen, durch eine Dialogmanagementeinheit (31), einer Antwortschablone entsprechend einem Dialogzustand mit einem Benutzer aus Antwortschablonen entsprechend vorbestimmten Dialogzuständen; Ausgeben eines Begriffssymbols, das in der ausgewählten Antwortschablone enthalten ist; Bezugnehmen, durch eine Verständnispegel-Schätzeinheit (30), auf eine Schätzbedingungstabelle (5A), in der mehrere Schätzbedingungen, die durch die vorbestimmten Dialogzustände definiert sind, und Wichtungen, die den jeweiligen Schätzbedingungen entsprechend dem Verständnis für Begriffssymbole zugeteilt sind, miteinander assoziiert sind, und eine Häufigkeitstabelle (5B), in der Häufigkeiten, mit denen eine Funktion in den jeweiligen Schätzzuständen ausgeführt wurde, und ein Begriffssymbol entsprechend der Funktion miteinander assoziiert sind; Spezifizieren der Häufigkeiten und der Wichtungen der jeweiligen Schätzbedingungen der Funktion entsprechend dem von der Dialogmanagementeinheit (31) eingegebenen Begriffssymbol; Ausgeben eines Ergebnisses einer Größenbestimmung einer Ergebnisquote, die anhand der spezifizierten Häufigkeiten und Wichtungen berechnet wurde, zu der Dialogmanagementeinheit (31) als Verständnispegel des Benutzers für das Begriffssymbol; Erzeugen, durch eine Antworterzeugungseinheit (32), eines Antwortsatzes in dem Dialogzustand mit dem Benutzer auf der Grundlage der durch die Dialogmanagementeinheit (31) ausgewählten Antwortschablone; Hinzufügen eines erläuternden Satzes zu dem Antwortsatz in Abhängigkeit von einem Verständnispegel des Benutzers für das von der Dialogmanagementeinheit (31) eingegebene Begriffssymbol; und Ausgeben des Antwortsatzes.
DE112016006549.3T 2016-04-11 2016-04-11 Antworterzeugungsvorrichtung, dialogsteuersystem und antworterzeugungsverfahren Active DE112016006549B4 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/061702 WO2017179101A1 (ja) 2016-04-11 2016-04-11 応答生成装置、対話制御システムおよび応答生成方法

Publications (2)

Publication Number Publication Date
DE112016006549T5 DE112016006549T5 (de) 2018-11-15
DE112016006549B4 true DE112016006549B4 (de) 2019-11-14

Family

ID=60041483

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112016006549.3T Active DE112016006549B4 (de) 2016-04-11 2016-04-11 Antworterzeugungsvorrichtung, dialogsteuersystem und antworterzeugungsverfahren

Country Status (6)

Country Link
US (1) US10504508B2 (de)
JP (1) JP6391887B2 (de)
CN (1) CN108885872A (de)
DE (1) DE112016006549B4 (de)
TW (1) TW201737125A (de)
WO (1) WO2017179101A1 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019106054A (ja) * 2017-12-13 2019-06-27 株式会社東芝 対話システム
JP6984474B2 (ja) * 2018-02-14 2021-12-22 トヨタ自動車株式会社 情報処理装置および情報処理方法
TWI718369B (zh) * 2018-04-26 2021-02-11 國立勤益科技大學 智能互動系統
US11063887B2 (en) * 2018-09-13 2021-07-13 Sharp Kabushiki Kaisha Information processing apparatus, user terminal apparatus, and control method
JP7135886B2 (ja) * 2019-01-24 2022-09-13 トヨタ自動車株式会社 促し発話装置、促し発話方法及びプログラム
US11303588B1 (en) * 2019-09-05 2022-04-12 Meta Platforms, Inc. Automating a response to a message communicated to a business entity via an online messaging application

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1761015A1 (de) * 2005-09-02 2007-03-07 Swisscom AG Selbstanpassende Benutzerschnittstelle für Dialogsysteme
US20080103781A1 (en) * 2006-10-28 2008-05-01 General Motors Corporation Automatically adapting user guidance in automated speech recognition

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084590A (ja) * 2003-09-11 2005-03-31 Nissan Motor Co Ltd 音声認識装置
TWI297123B (en) 2004-12-29 2008-05-21 Delta Electronics Inc Interactive entertainment center
JP4603988B2 (ja) * 2006-01-31 2010-12-22 キヤノン株式会社 情報処理装置および方法
JP5137853B2 (ja) 2006-12-28 2013-02-06 三菱電機株式会社 車載用音声認識装置
JP2009037458A (ja) * 2007-08-02 2009-02-19 Toyota Motor Corp 応答システム、及び応答内容制御方法
JP2009193448A (ja) * 2008-02-15 2009-08-27 Oki Electric Ind Co Ltd 対話システム、方法及びプログラム
JP5132511B2 (ja) 2008-10-08 2013-01-30 ヤフー株式会社 知識dbを利用した検索方法
US20110276329A1 (en) * 2009-01-20 2011-11-10 Masaaki Ayabe Speech dialogue apparatus, dialogue control method, and dialogue control program
TWI379205B (en) 2009-03-12 2012-12-11 Ind Tech Res Inst Instant communication interacting system and method thereof
JP6389171B2 (ja) * 2013-06-19 2018-09-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声対話方法、及び機器
US9792015B2 (en) 2013-09-19 2017-10-17 Microsoft Technology Licensing, Llc Providing visualizations for conversations
CN105068661B (zh) * 2015-09-07 2018-09-07 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1761015A1 (de) * 2005-09-02 2007-03-07 Swisscom AG Selbstanpassende Benutzerschnittstelle für Dialogsysteme
US20080103781A1 (en) * 2006-10-28 2008-05-01 General Motors Corporation Automatically adapting user guidance in automated speech recognition

Also Published As

Publication number Publication date
JPWO2017179101A1 (ja) 2018-09-20
US20190096395A1 (en) 2019-03-28
DE112016006549T5 (de) 2018-11-15
US10504508B2 (en) 2019-12-10
TW201737125A (zh) 2017-10-16
WO2017179101A1 (ja) 2017-10-19
JP6391887B2 (ja) 2018-09-19
CN108885872A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
DE112016006549B4 (de) Antworterzeugungsvorrichtung, dialogsteuersystem und antworterzeugungsverfahren
DE112017004374B4 (de) System und Verfahren zur Spracherkennung
DE102017124264B4 (de) Computerimplementiertes Verfahren und Rechensystem zum Bestimmen phonetischer Beziehungen
DE112014002819B4 (de) System und Verfahren zur Erkennung von Sprache
DE602006000090T2 (de) Konfidenzmaß für ein Sprachdialogsystem
DE112015003382B4 (de) Spracherkennungseinrichtung und Spracherkennungsverfahren
DE102018000299A1 (de) Automatisches Segmentieren von Bildern auf Grundlage von in natürlicher Sprache gegebenen Äußerungen
DE112013006770B4 (de) Spracherkennungsvorrichtung und Spracherkennungsverfahren
DE3236834A1 (de) Verfahren und geraet zur sprachanalyse
DE102008017993A1 (de) Sprachsuchvorrichtung
DE112014004836B4 (de) Verfahren und System zum Verbessern eines verrauschten Eingangssignals
DE112010006037T5 (de) Spracherkennungsvorrichtung und Navigationssystem
DE60133537T2 (de) Automatisches umtrainieren eines spracherkennungssystems
EP3224831A1 (de) Kraftfahrzeug-bedienvorrichtung mit korrekturstrategie für spracherkennung
DE10008502C2 (de) Anapher-Analysevorrichtung mit Vorgängerkandidatenzurückweisungseinrichtung unter Verwendung eines Kandidatenzurückweisungsentscheidungsbaums
DE112014006795B4 (de) Spracherkennungssystem und Spracherkennungsverfahren
DE112016007323T5 (de) Informationsverarbeitungsvorrichtung und Informationsverarbeitungsverfahren
DE112012003479T5 (de) Verringerung von falschen Treffern in Spracherkennungssystemen
DE102023202711A1 (de) System und verfahren mit entitätstypklarstellung für feinkörnigen faktenwissenabruf
DE112014007287B4 (de) Spracherkennungsvorrichtung und Spracherkennungsverfahren
DE602004003609T2 (de) Lösung der Segmentierungsmehrdeutigkeit bei der Grammatikerstellung
DE112015003357B4 (de) Verfahren und System zum Erkennen einer eine Wortabfolge enthaltenden Sprachansage
DE102021116409A1 (de) Gemeinsame automatische spracherkennung und text-zu-sprache-umwandlung unter verwendung gegnerischer neuronaler netzwerke
DE102017104094B4 (de) Sprachverarbeitungssystem und sprachverarbeitungsverfahren
DE112015007163T5 (de) Spracherkennungsvorrichtung, Sprachhervorhebungsvorrichtung, Spracherkennungsverfahren, Sprachhervorhebungsverfahren und Navigationssystem

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G10L0015220000

Ipc: G10L0013000000

R016 Response to examination communication
R018 Grant decision by examination section/examining division
R084 Declaration of willingness to licence
R020 Patent grant now final