DE112019006677T5 - Antwortverarbeitungsvorrichtung und Antwortverarbeitungsverfahren - Google Patents

Antwortverarbeitungsvorrichtung und Antwortverarbeitungsverfahren Download PDF

Info

Publication number
DE112019006677T5
DE112019006677T5 DE112019006677.3T DE112019006677T DE112019006677T5 DE 112019006677 T5 DE112019006677 T5 DE 112019006677T5 DE 112019006677 T DE112019006677 T DE 112019006677T DE 112019006677 T5 DE112019006677 T5 DE 112019006677T5
Authority
DE
Germany
Prior art keywords
user
response
information
response processing
agent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE112019006677.3T
Other languages
English (en)
Inventor
Yoshinori Maeda
Noriko Totsuka
Chie Kamada
Yuki Takeda
Kazuya Tateishi
Yuichiro Koyama
Emiru TSUNOO
Akira Takahashi
Hideaki Watanabe
Akira Fukui
Kan Kuroda
Hiroaki Ogawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Group Corp
Original Assignee
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Group Corp filed Critical Sony Group Corp
Publication of DE112019006677T5 publication Critical patent/DE112019006677T5/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Eine Antwortverarbeitungsvorrichtung umfasst: eine Annahmeeinheit zum Annehmen von Eingabeinformationen, die als Auslöseinformationen dienen, um eine Informationsvorrichtung zu veranlassen, eine Antwort zu erzeugen; eine Präsentationseinheit, um einem Benutzer jede Antwort zu präsentieren, die von einer Vielzahl von Informationsvorrichtungen als Antwort auf die Eingabeinformationen generiert wird; und eine Übertragungseinheit zum Übertragen einer Benutzerreaktion auf die präsentierte Antwort an die Vielzahl von Informationsvorrichtungen. Beispielsweise akzeptiert die Eingabeeinheit die von dem Benutzer geäußerte Sprachinformation als Eingabeinformation.

Description

  • Gebiet
  • Die vorliegende Offenbarung bezieht sich auf eine Antwortverarbeitungsvorrichtung und ein Antwortverarbeitungsverfahren. Genauer gesagt, bezieht sich die vorliegende Offenbarung auf Antwortverarbeitung für einen Benutzer, der eine Vielzahl von Informationsvorrichtungen benutzt.
  • Hintergrund
  • Mit dem Fortschritt der Netzwerktechnologie haben Benutzer immer mehr Gelegenheiten, eine Vielzahl von Informationsvorrichtungen zu benutzen. In Anbetracht einer solchen Situation ist eine Technologie zur reibungslosen Nutzung der Vielzahl von Informationsvorrichtungen vorgeschlagen worden.
  • Beispielsweise ist eine Technik zur effizienten Durchführung der Verarbeitung der Gesamtheit eines Systems durch Bereitstellen einer Vorrichtung vorgeschlagen worden, die zur integralen Steuerung des Systems ausgelegt ist, wobei eine Vielzahl von Client-Vorrichtungen über ein Netzwerk angeschlossen ist.
  • Anführungsliste
  • Patentdokumente
  • Patentdokument 1: JP H07-004882 A Kurzdarstellung
  • Technisches Problem
  • Gemäß der oben beschriebenen herkömmlichen Technik empfängt die Vorrichtung, die zur integralen Steuerung des Systems ausgelegt ist, Verarbeitungsanforderungen für die Informationsvorrichtungen und führt die Verarbeitung entsprechend den Funktionen der einzelnen Informationsvorrichtungen durch, um die Verarbeitung für die Gesamtheit des Systems effizient durchzuführen.
  • Die herkömmliche Technik kann jedoch nicht immer den Komfort jedes Benutzers verbessern. Insbesondere geht es bei der herkömmlichen Technik nur darum zu bestimmen, ob die Informationsvorrichtungen die Verarbeitungsanforderungen empfangen können, und beispielsweise wird, wenn jede der Informationsvorrichtungen die Anforderung eines Benutzers empfängt und eine Verarbeitung durchführt, die Verarbeitung nicht immer in einer Weise durchgeführt, die der Anforderung des Benutzers entspricht.
  • Daher sind in der vorliegenden Offenbarung eine Antwortverarbeitungsvorrichtung und ein Antwortverarbeitungsverfahren vorgesehen, die dazu ausgelegt sind, den Komfort des Benutzers zu verbessern.
  • Lösung des Problems
  • Gemäß der vorliegenden Offenbarung weist eine Verarbeitungsvorrichtung eine Empfangseinheit auf, die dazu ausgelegt ist, Eingabeinformationen zu empfangen, bei denen es sich um Informationen handelt, die die Erzeugung einer Antwort durch eine Informationsvorrichtung auslösen; eine Präsentationseinheit, die dazu ausgelegt ist, einem Benutzer jede der von einer Vielzahl der Informationsvorrichtungen für die Eingabeinformationen erzeugten Antworten zu präsentieren; und eine Übertragungseinheit, die dazu ausgelegt ist, die Reaktion des Benutzers auf die präsentierten Antworten an die Vielzahl von Informationsvorrichtungen zu übertragen.
  • Figurenliste
    • 1 ist ein Diagramm, das ein Antwortverarbeitungssystem gemäß einer ersten Ausführungsform darstellt.
    • 2A ist ein Diagramm (1), das ein Beispiel eines Antwortprozesses gemäß der ersten Ausführungsform darstellt.
    • 2B ist ein Diagramm (2), das ein Beispiel des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
    • 2C ist ein Diagramm (3), das ein Beispiel des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
    • 2D ist ein Diagramm (4), das ein Beispiel des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
    • 3A ist ein Diagramm (1), das eine erste Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
    • 3B ist ein Diagramm (2), das die erste Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
    • 3C ist ein Diagramm (3), das die erste Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
    • 3D ist ein Diagramm (4), das die erste Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
    • 4A ist ein Diagramm (1), das eine zweite Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
    • 4B ist ein Diagramm (2), das die zweite Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
    • 5 ist ein Diagramm, das eine dritte Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
    • 6A ist ein Diagramm (1), das eine vierte Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
    • 6B ist ein Diagramm (2), das die vierte Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
    • 7 ist ein Diagramm, das ein Konfigurationsbeispiel des Antwortverarbeitungssystems gemäß der ersten Ausführungsform darstellt.
    • 8 ist ein Diagramm, das ein Beispiel einer Benutzerinformationstabelle gemäß der ersten Ausführungsform darstellt.
    • 9 ist ein Diagramm, das ein Beispiel einer Agententabelle gemäß der ersten Ausführungsform darstellt.
    • 10 ist ein Diagramm, das ein Beispiel einer Befehlstabelle gemäß der ersten Ausführungsform darstellt.
    • 11 ist ein Diagramm, das ein Beispiel einer Historietabelle gemäß der ersten Ausführungsform darstellt.
    • 12A ist ein Flussdiagramm, das einen Prozess gemäß der ersten Ausführungsform darstellt.
    • 12B ist ein Blockdiagramm, das einen Prozess gemäß der ersten Ausführungsform darstellt.
    • 13 ist ein Diagramm, das ein Beispiel eines Antwortprozesses gemäß einer zweiten Ausführungsform darstellt.
    • 14 ist ein Diagramm, das eine erste Variation des Antwortprozesses gemäß der zweiten Ausführungsform darstellt.
    • 15 ist eine Tabelle, die ein Beispiel einer Datenbank gemäß der zweiten Ausführungsform darstellt.
    • 16A ist ein Diagramm, das eine zweite Variation des Antwortprozesses gemäß der zweiten Ausführungsform darstellt.
    • 16B ist ein Diagramm, das eine dritte Variation des Antwortprozesses gemäß der zweiten Ausführungsform darstellt.
    • 17 ist ein Hardware-Konfigurationsdiagramm, das ein Beispiel eines Computers darstellt, der dazu ausgelegt ist, die Funktionen einer Antwortverarbeitungsvorrichtung zu erzielen.
  • Beschreibung der Ausführungsformen
  • Ausführungsformen der vorliegenden Offenbarung werden nachstehend unter Bezugnahme auf die Zeichnungen ausführlich beschrieben. Beachten Sie, dass in jeder der folgenden Ausführungsformen gleiche Teile durch gleiche Referenzsymbole gekennzeichnet sind, weshalb eine sich wiederholende Beschreibung davon ausgelassen wird.
  • Außerdem wird die vorliegende Offenbarung in der Reihenfolge der nachstehend angegebenen Punkte beschrieben.
    • 1. Erste Ausführungsform
      • 1-1. Übersicht des Antwortverarbeitungssystems gemäß der ersten Ausführungsform
      • 1-2. Beispiel des Antwortprozesses gemäß der ersten Ausführungsform
      • 1-3. Variationen des Antwortprozesses gemäß der ersten Ausführungsform
      • 1-4. Konfiguration des Antwortverarbeitungssystems gemäß der ersten Ausführungsform
      • 1-5. Verfahren des Antwortprozesses gemäß der ersten Ausführungsform
      • 1-6. Modifikation der ersten Ausführungsform
    • 2. Zweite Ausführungsform
      • 2-1. Beispiel des Antwortprozesses gemäß der zweiten Ausführungsform
      • 2-2. Variationen des Antwortprozesses gemäß der zweiten Ausführungsform
    • 3. Andere Ausführungsformen
      • 3-1. Variation der Antwortausgabe
      • 3-2. Zeitpunkt zum Übertragen der Reaktion des Benutzers
      • 3-3. Gerätekonfiguration
    • 4. Effekte der Antwortverarbeitungsvorrichtung gemäß der vorliegenden Offenbarung
    • 5. Hardware-Konfiguration
  • (1. Erste Ausführungsform)
  • [1-1. Übersicht des Antwortverarbeitungssystems gemäß der ersten Ausführungsform]
  • Ein Überblick über einen Antwortprozess gemäß einer ersten Ausführungsform der vorliegenden Offenbarung wird unter Bezugnahme auf 1 beschrieben. 1 ist ein Diagramm, das ein Antwortverarbeitungssystem gemäß der ersten Ausführungsform darstellt. Die Informationsverarbeitung gemäß der ersten Ausführungsform wird von einer in 1 dargestellten Antwortverarbeitungsvorrichtung 100 und dem Antwortverarbeitungssystem 1 durchgeführt, das die Antwortverarbeitungsvorrichtung 100 enthält.
  • Wie in 1 dargestellt, weist das Antwortverarbeitungssystem 1 die Antwortverarbeitungsvorrichtung 100, einen Agenten 10A, einen Agenten 10B, einen Agenten 10C und einen Agenten 10D auf. Die im Antwortverarbeitungssystem 1 enthaltenen Vorrichtungen sind über ein drahtgebundenes oder drahtloses Netzwerk, das nicht dargestellt ist, kommunikativ verbunden.
  • Der Agent 10A, Agent 10B, Agent 10C und Agent 10D sind Vorrichtungen, von denen jede die Funktion hat, eine Sprachkonversation oder dergleichen mit einem Benutzer zu führen (bezeichnet als Agentenfunktion oder dergleichen) und verschiedene Informationsverarbeitungen wie Spracherkennung und Antwortgenerierung durchzuführen. Insbesondere sind die Agenten 10A und dergleichen so genannte Internet-of-Things (IoT)-Vorrichtungen und führen jeweils verschiedene Prozesse der Informationsverarbeitung in Zusammenarbeit mit einer externen Vorrichtung wie einem Cloud-Server durch. Im Beispiel von 1 sind der Agent 10A und dergleichen so genannte intelligente Lautsprecher.
  • Im Folgenden werden eine Agentenfunktion zum Erlernen von Sprachkonversation und Sprachantwort und eine Informationsvorrichtung, die über die Agentenfunktion verfügt, kollektiv als „Agent“ bezeichnet. Beachten Sie, dass die Agentenfunktion nicht nur eine Funktion aufweist, die von einem einzelnen Agenten 10 ausgeführt wird, sondern auch eine Funktion, die auf einem Server ausgeführt wird, der über das Netzwerk mit dem Agenten 10 verbunden ist. Im Folgenden, wenn es nicht notwendig ist, einzelne Informationsvorrichtungen, wie z. B. den Agenten 10A, Agenten 10B, Agenten 10C und Agenten 10D zu unterscheiden, werden die Informationsvorrichtungen kollektiv als „Agenten 10“ bezeichnet.
  • Die Antwortverarbeitungsvorrichtung 100 ist ein Beispiel einer Antwortverarbeitungsvorrichtung gemäß der vorliegenden Offenbarung. Beispielsweise ist die Antwortverarbeitungsvorrichtung 100 eine Vorrichtung, die so ausgelegt ist, dass sie eine Sprach- oder Textkonversation mit dem Benutzer führt und verschiedene Informationsverarbeitungen, wie z. B. Spracherkennung und Generierung einer Antwort an den Benutzer, durchführt. Insbesondere führt die Antwortverarbeitungsvorrichtung 100 den Antwortprozess auf Informationen (im Folgenden als „Eingabeinformationen“ bezeichnet) durch, die die Generierung der Antwort auslösen, wie z. B. eine gesammelte Sprache oder eine Aktion des Benutzers. Beispielsweise erkennt die Antwortverarbeitungsvorrichtung 100 die Frage eines Benutzers und gibt eine Antwort auf die Frage per Sprache aus oder zeigt Informationen zur Frage auf dem Bildschirm an. Beachten Sie, dass für die von der Antwortverarbeitungsvorrichtung 100 durchgeführte Verarbeitung von Spracherkennung, Sprachausgabe und dergleichen verschiedene bekannte Techniken verwendet werden können. Außerdem koordiniert die Antwortverarbeitungsvorrichtung 100 die von den Agenten 10 erzeugten Antworten und Rückmeldungen an die Agenten 10, deren detaillierte Beschreibung später erfolgt.
  • 1 stellt ein Beispiel dar, bei dem die Antwortverarbeitungsvorrichtung 100 ein so genanntes Tablet-Endgerät oder Smartphone ist. Beispielsweise umfasst die Antwortverarbeitungsvorrichtung 100 eine Lautsprechereinheit, die zur Ausgabe von Sprache ausgelegt ist, und eine Anzeigeeinheit (Flüssigkristallanzeige usw.), die zur Ausgabe von Video und dergleichen ausgelegt ist. Beispielsweise führt die Antwortverarbeitungsvorrichtung 100 den Antwortprozess gemäß der vorliegenden Offenbarung auf der Basis der Funktion eines auf dem Smartphone oder Tablet-Endgerät installierten Programms (Anwendung) durch. Beachten Sie, dass die Antwortverarbeitungsvorrichtung 100 zusätzlich zum Smartphone oder Tablet-Endgerät eine tragbare Vorrichtung, wie z. B. ein Uhr-Endgerät oder ein Glas-Endgerät, sein kann. Außerdem kann die Antwortverarbeitungsvorrichtung 100 durch verschiedene intelligente Vorrichtungen mit Informationsverarbeitungsfunktionen realisiert werden. Beispielsweise kann die Antwortverarbeitungsvorrichtung 100 ein intelligentes Haushaltsgerät wie ein Fernseher, eine Klimaanlage oder ein Kühlschrank, ein intelligentes Fahrzeug wie ein Auto, eine Drohne oder ein autonomer Roboter wie ein Haustierroboter oder humanoider Roboter sein.
  • In dem in 1 dargestellten Beispiel verwendet der Benutzer die Informationsvorrichtung wie den Agenten 10A zusammen mit der Antwortverarbeitungsvorrichtung 100. Mit anderen Worten, in dem Beispiel von 1 wird angenommen, dass sich der Benutzer in einer Umgebung befindet, in der eine Vielzahl der Agenten 10 verwendet wird.
  • Wie in dem in 1 dargestellten Beispiel gibt es verschiedene Probleme beim entsprechenden Betrieb in einer Situation, in der die Vielzahl der Agenten 10 vom Benutzer verwendet wird.
  • Beispielsweise muss der Benutzer jedes Mal überlegen, ob er welchen Agenten 10 verwenden soll, um welche Art von Prozess durchzuführen (d. h. ob er welche Art von Eingabeinformationen in einen Agenten 10 eingeben soll). Außerdem muss der Benutzer, wenn er einen Agenten 10 veranlasst, einen Prozess durchzuführen, und dann die anderen Agenten 10 veranlasst, denselben Prozess durchzuführen, denselben Prozess wiederholt durchführen. Beachten Sie, dass im Folgenden eine Aufforderung, den Agenten 10 zu veranlassen, auf der Basis der Eingabeinformationen des Benutzers eine Art von Prozess durchzuführen, als „Befehl“ bezeichnet wird. Der Befehl hat beispielsweise ein Skript, das die Frage eines Benutzers oder den Inhalt einer Anfrage angibt.
  • Außerdem lernt der Agent 10 durch die Konversation mit dem Benutzer, ob der Benutzer dazu neigt, welche Art von Frage oder welche Art von Anfrage zu stellen, oder ob der Benutzer normalerweise nach welcher Art von Antwort fragt. Wenn es jedoch eine Vielzahl von Agenten 10 gibt, muss der Benutzer für jeden der Agenten 10 einen Prozess zum Vermehren der Agenten 10 durchführen.
  • Außerdem greifen beispielsweise die Agenten 10, denen der Benutzer die Frage stellt, auf unterschiedliche Dienste zu und erhalten Antworten. Daher kann in einigen Fällen die Vielzahl von Agenten 10, denen der Benutzer die gleiche Frage stellt, unterschiedliche Antworten generieren. Außerdem sind einige Agenten 10 möglicherweise nicht in der Lage, auf Dienste zuzugreifen, um Antworten auf die Frage des Benutzers zu erhalten und die Antworten zu generieren. Wenn keine richtige Antwort erhalten wird, muss der Benutzer die gleiche Frage mühsam an andere Agenten 10 stellen.
  • Daher löst die Antwortverarbeitungsvorrichtung 100 gemäß der vorliegenden Offenbarung die oben beschriebenen Probleme durch den nachstehend beschriebenen Antwortprozess.
  • Insbesondere fungiert die Antwortverarbeitungsvorrichtung 100 als Front-End-Vorrichtung für die Vielzahl von Agenten 10 und nimmt kollektiv eine Interaktion mit dem Benutzer an. Beispielsweise analysiert die Antwortverarbeitungsvorrichtung 100 den Inhalt der Frage des Benutzers und generiert den Befehl in Abhängigkeit von dem Inhalt der Frage. Anschließend überträgt die Antwortverarbeitungsvorrichtung 100 kollektiv den generierten Befehl an den Agenten 10A, den Agenten 10B, den Agenten 10C und den Agenten 10D. Außerdem präsentiert die Antwortverarbeitungsvorrichtung 100 dem Benutzer die von den jeweiligen Agenten 10 generierten Antworten und überträgt die Reaktion des Benutzers auf die präsentierten Antworten an die Agenten 10.
  • Dies ermöglicht es der Antwortverarbeitungsvorrichtung 100, das Problem einer Benutzerumgebung zu lösen, bei der die Ergebnisse der Vielzahl von Agenten 10 nur empfangen werden können, wenn derselbe Befehl viele Male ausgeführt wird. Außerdem löst die Antwortverarbeitungsvorrichtung 100 das Problem einer Situation, in der der Prozess zum Vermehren der Agenten 10 für jeden der Agenten 10 durchgeführt werden muss. Auf diese Weise verhält sich die Antwortverarbeitungsvorrichtung 100 als Front-End-Vorrichtung für die Vielzahl von Agenten 10 und steuert die Generierung und Ausgabe der Antwort, um den Komfort für den Benutzer zu verbessern. Die Antwortverarbeitungsvorrichtung 100 spielt sozusagen eine Vermittlerrolle für das gesamte System.
  • Im Folgenden wird ein Beispiel für den Antwortprozess der ersten Ausführungsform gemäß der vorliegenden Offenbarung im Anschluss an den Prozess unter Bezugnahme auf 1 beschrieben.
  • In dem in 1 dargestellten Beispiel wird davon ausgegangen, dass die Antwortverarbeitungsvorrichtung 100 mit dem Agenten 10A, dem Agenten 10B, dem Agenten 10C und dem Agenten 10D im Vorfeld zusammenarbeitet.
  • Beispielsweise speichert die
  • Antwortverarbeitungsvorrichtung 100 Informationen wie ein Aktivierungswort zum Aktivieren jedes Agenten 10 und ein Format für jeden Agenten 10 zum Empfangen von Sprache (z. B. die Art einer Sprachanwendungs-Programmierschnittstelle (API), die von jedem Agenten 10 verarbeitet werden kann, usw.) in einer Datenbank.
  • Die Antwortverarbeitungsvorrichtung 100 empfängt zunächst eine Art von Eingabeinformation vom Benutzer (Schritt S1). Beispielsweise die Antwortverarbeitungsvorrichtung 100, der vom Benutzer eine gesprochene Frage gestellt wird.
  • In diesem Fall startet die Antwortverarbeitungsvorrichtung 100 den Antwortprozess der Antwortverarbeitungsvorrichtung 100 (Schritt S2). Außerdem aktiviert die Antwortverarbeitungsvorrichtung 100 bei Empfang der Eingabeinformation vom Benutzer die Agenten 10, die miteinander kooperieren (Schritt S3).
  • Insbesondere wandelt die Antwortverarbeitungsvorrichtung 100 die vom Benutzer empfangenen Sprachinformationen in den Befehl um und generiert den Befehl in einem Format, das von jedem Agenten 10 erkennbar ist. Insbesondere erfasst die Antwortverarbeitungsvorrichtung 100 die Stimme des Benutzers und analysiert die in der Stimme des Benutzers enthaltene Frage durch die Verarbeitung der automatischen Spracherkennung (ASR) oder des natürlichen Sprachverständnisses (NLU). Wenn beispielsweise die Stimme die Absicht der Frage des Benutzers enthält, erkennt die Antwortverarbeitungsvorrichtung 100 die Absicht der Frage als Eingabeinformation und generiert einen Befehl gemäß der Absicht der Frage. Beachten Sie, dass die Antwortverarbeitungsvorrichtung 100 die Befehle verschiedener Modi aus denselben Eingabeinformationen generieren kann, beispielsweise gemäß den APIs der Agenten 10. Dann überträgt die Antwortverarbeitungsvorrichtung 100 den generierten Befehl an jeden Agenten 10.
  • Beispielsweise generiert der Agent 10A, der den Befehl empfängt, die Antwort entsprechend der Eingabeinformation. Insbesondere generiert der Agent 10A die Antwort auf die Frage des Benutzers als Antwort. Anschließend überträgt der Agent 10A die generierte Antwort an die Antwortverarbeitungsvorrichtung 100 (Schritt S4). Obwohl in 1 nicht dargestellt, übermitteln der Agent 10B, der Agent 10C und der Agent 10D auch die von dem Agenten 10B, dem Agenten 10C und dem Agenten 10D generierten Antworten an die Antwortverarbeitungsvorrichtung 100, wie bei dem Agenten 10A.
  • Die Antwortverarbeitungsvorrichtung 100 sammelt die Antworten der Agenten 10 und präsentiert dem Benutzer Informationen, die angeben, welcher Agent 10 welche Art von Antwort generiert hat (Schritt S5). Beispielsweise wandelt die Antwortverarbeitungsvorrichtung 100 Informationen, die Übersichten über die von den Agenten 10 empfangenen Antworten aufweisen, in Sprache um und gibt die umgewandelte Sprache an den Benutzer aus. Dadurch kann der Benutzer eine Vielzahl der Antworten erhalten, indem er der Antwortverarbeitungsvorrichtung 100 nur die Frage stellt.
  • Anschließend teilt der Benutzer der Antwortverarbeitungsvorrichtung 100 mit, welche der von den Agenten 10 generierten Antworten tatsächlich ausgegeben werden sollen. Die Antwortverarbeitungsvorrichtung 100 überträgt kollektiv den Inhalt der vom Benutzer ausgewählten Antwort, Identifikationsinformationen eines vom Benutzer ausgewählten Agenten 10 und dergleichen an die Agenten 10. Dadurch erhält jeder Agent 10 als Rückmeldung die vom Benutzer ausgewählte Antwort auf die Frage des Benutzers, also ein positives Beispiel für den Benutzer. Außerdem kann jeder Agent 10 als Rückmeldung die anderen, vom Benutzer nicht ausgewählten Antworten auf die Frage des Benutzers erhalten, d. h. Negativbeispiele für den Benutzer. Daher ermöglicht die Antwortverarbeitungsvorrichtung 100 das Lernen der Vielzahl von Agenten 10 (Rückmeldung an jeden Agenten 10) in einer Interaktion.
  • [1-2. Beispiel des Antwortprozesses gemäß der ersten Ausführungsform]
  • Als Nächstes wird ein Beispiel des oben beschriebenen Antwortprozesses unter Bezugnahme auf 2 beschrieben. 2A ist ein Diagramm (1), das ein Beispiel des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
  • In dem Beispiel von 2A gibt der Benutzer die Sprache A11, die folgenden Inhalt aufweist: „Ich möchte „Sotsugyo“ (Abschluss) hören‟, in die Antwortverarbeitungsvorrichtung 100 ein (Schritt S11). Die Antwortverarbeitungsvorrichtung 100 empfängt die Sprache A11 des Benutzers als Eingabeinformation.
  • Anschließend führt die Antwortverarbeitungsvorrichtung 100 eine ASR- oder NLU-Verarbeitung an der Sprache A11 durch und analysiert deren Inhalt. Dann generiert die Antwortverarbeitungsvorrichtung 100 den Befehl, der der Sprache A11 entspricht (Schritt S12) .
  • Die Antwortverarbeitungsvorrichtung 100 überträgt den generierten Befehl an jeden Agenten 10 (Schritt S13). Beispielsweise bezieht sich die Antwortverarbeitungsvorrichtung 100 auf die API oder ein Protokoll, mit dem jeder Agent 10 kompatibel ist, und überträgt den Befehl in einem Format, das mit jedem Agenten 10 kompatibel ist.
  • Der aus 2A fortgesetzte Prozess wird unter Bezugnahme auf 2B beschrieben. 2B ist ein Diagramm (2), das ein Beispiel des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
  • Jeder Agent 10 generiert die dem Befehl entsprechende Antwort auf der Basis des von der Antwortverarbeitungsvorrichtung 100 empfangenen Befehls. Beispielsweise wird angenommen, dass der Agent 10A auf der Basis des Befehlsinhalts den Wunsch des Benutzers als „Abspielen des Liedes „Sotsugyo““ interpretiert. In diesem Fall greift der Agent 10A beispielsweise auf einen Musikdienst zu, mit dem der Agent 10A verbunden werden darf, und erwirbt das Lied „Sotsugyo“, das von einem Sänger A gesungen wird. Dann überträgt der Agent 10A an die Antwortverarbeitungsvorrichtung 100, dass „das Abspielen des von dem Sänger A gesungenen Liedes „Sotsugyo““ die von dem Agenten 10A generierte Antwort ist (Schritt S14).
  • Ebenso wird angenommen, dass der Agent 10B auf der Basis des Befehlsinhalts den Wunsch des Benutzers als „Abspielen des Liedes „Sotsugyo““ interpretiert. In diesem Fall greift der Agent 10B zum Beispiel auf einen Musikdienst zu, mit dem der Agent 10B verbunden werden darf, und erwirbt das Lied „Sotsugyo“, das von einem Sänger B gesungen wird. Dann überträgt der Agent 10B an die Antwortverarbeitungsvorrichtung 100, dass das Abspielen des von dem Sänger B gesungenen Liedes „Sotsugyo““ die von dem Agenten 10B generierte Antwort ist.
  • Außerdem wird angenommen, dass der Agent 10C auf der Basis des Befehlsinhalts den Wunsch des Benutzers als „Wiedergeben von Informationen über das Lied „Sotsugyo““ interpretiert. In diesem Fall greift der Agent 10B beispielsweise auf einen Nachrichtendienst zu, an den die Vorrichtung angeschlossen werden darf, und holt sich Informationen über „Sotsugyo“ (Abschluss) (in diesem Beispiel Nachrichteninformationen). Dann überträgt der Agent 10C an die Antwortverarbeitungsvorrichtung 100, dass „Wiedergeben der Nachricht über „Sotsugyo“ (Abschluss)‟ die vom Agenten 10C generierte Antwort ist.
  • Außerdem wird angenommen, dass der Agent 10D auf der Basis des Befehlsinhalts den Wunsch des Benutzers als „Wiedergeben von Informationen über das Lied „Sotsugyo““ interpretiert. In diesem Fall wird angenommen, dass der Agent 10B beispielsweise eine Websuche durchführt, um nach Informationen über „Sotsugyo“ (Abschluss) zu suchen. Dann überträgt der Agent 10D an die Antwortverarbeitungsvorrichtung 100, dass „Wiedergeben eines Ergebnisses der Websuche nach „Sotsugyo“ (Abschluss)‟ die vom Agenten 10D generierte Antwort ist.
  • Die Antwortverarbeitungsvorrichtung 100 erfasst die von den Agenten 10 generierten Antworten. Dann generiert die Antwortverarbeitungsvorrichtung 100 Informationen, die angeben, welche Art von Antwort von jedem Agenten 10 generiert wurde (Schritt S15). Beispielsweise generiert die Antwortverarbeitungsvorrichtung 100 eine Sprache A12, die Übersichten über die von den Agenten 10 generierten Antworten enthält.
  • Anschließend gibt die Antwortverarbeitungsvorrichtung 100 die generierte Sprache A12 aus und präsentiert dem Benutzer die in der Sprache A12 enthaltenen Informationen (Schritt S16). Dabei kann der Benutzer den Inhalt von vier Antworttypen nur durch Eingabe der Sprache A11 in die Antwortverarbeitungsvorrichtung 100 kennen.
  • Der aus 2B fortgesetzte Prozess wird unter Bezugnahme auf 2C beschrieben. 2C ist ein Diagramm (3), das ein Beispiel des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
  • Der Benutzer, der die Sprache A12 hört, wählt eine beliebige der Antworten aus, die in der Sprache A12 enthalten sind. In dem Beispiel von 2C wird davon ausgegangen, dass der Benutzer bestimmt, dass die von dem Agenten 10A vorgeschlagene Antwort die Anfrage des Benutzers erfüllt. In diesem Fall gibt der Benutzer die Sprache A13, die den Inhalt wie „„Agent 10A‟, bitte‟ enthält, in die Antwortverarbeitungsvorrichtung 100 ein (Schritt S17).
  • Beim Empfangen der Sprache A13 bestimmt die Antwortverarbeitungsvorrichtung 100, dass die Antwort des Agenten A10 von den gehaltenen Antworten, die vom Benutzer angeforderte Antwort ist (Schritt S18). In diesem Fall generiert die Antwortverarbeitungsvorrichtung 100 die Sprache A14 und gibt diese zur Anleitung „Agent 10A spielt „Sotsugyo“ von Sänger A ab‟ aus. Außerdem fordert die Antwortverarbeitungsvorrichtung 100 den Agenten 10A auf, die generierte Antwort auszugeben (Schritt S19). Der Agent 10A führt „Abspielen von „Sotsugyo“ von Sänger A‟, was die von dem Agenten 10A generierte Antwort ist, als Antwort auf die Anforderung durch.
  • Dadurch kann der Benutzer aus den präsentierten Antworten diejenige ausgeben, die für die Anfrage des Benutzers am besten geeignet ist.
  • Der aus 2C fortgesetzte Prozess wird unter Bezugnahme auf 2D beschrieben. 2D ist ein Diagramm (4), das ein Beispiel des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
  • Nachdem der Agent 10A die Antwort ausgegeben hat, generiert die Antwortverarbeitungsvorrichtung 100 die Rückmeldung über eine Reihe von Gesprächen mit dem Benutzer (Schritt S20).
  • Beispielsweise generiert die Antwortverarbeitungsvorrichtung 100 als Rückmeldung den Inhalt der für die Eingabeinformationen generierten Antworten der Agenten 10. Außerdem generiert die Antwortverarbeitungsvorrichtung 100 als Rückmeldung eine Information, die angibt, dass beispielsweise von den durch die Agenten 10 generierten Antworten, welche von welchem Agenten 10 generierte Antwort vom Benutzer ausgewählt wird und welche von welchem Agenten 10 generierte Antwort nicht vom Benutzer ausgewählt wird. Wie in 2D dargestellt, erzeugt die Antwortverarbeitungsvorrichtung 100 eine Rückmeldung A15, die die Eingabeinformationen, die generierten Antworten und die ausgewählte Antwort angibt.
  • Anschließend überträgt die Antwortverarbeitungsvorrichtung 100 die generierte Rückmeldung A15 an die Agenten 10 (Schritt S21). Dadurch kann der Benutzer kollektiv das Feedback an alle Agenten 10 bereitstellen, ohne das gleiche Gespräch mit allen Agenten 10 zu führen, was ein effizientes Lernen der Agenten 10 ermöglicht.
  • [1-3. Variationen des Antwortprozesses gemäß der ersten Ausführungsform]
  • Als Nächstes werden Variationen des oben beschriebenen Antwortprozesses unter Bezugnahme auf die 3 bis 6 beschrieben. 3A ist ein Diagramm (1), das eine erste Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
  • In dem Beispiel von 3A gibt der Benutzer die Sprache A31, die folgenden Inhalt aufweist: „Ich möchte „Sotsugyo“ (Abschluss) hören‟, wie in 2A in die Antwortverarbeitungsvorrichtung 100 ein (Schritt S31). Die Antwortverarbeitungsvorrichtung 100 empfängt die Sprache A31 von dem Benutzer als Eingabeinformation.
  • Im Beispiel von 3A bezieht sich die Antwortverarbeitungsvorrichtung 100, die die Sprache A31 empfangen hat, auf eine Auswahlhistorie A32 des Benutzers, die angibt, welche Art von Antwort oder welchen Agenten 10 der Benutzer in der Vergangenheit für dieselben oder ähnliche Eingabeinformationen ausgewählt hat (Schritt S32). Insbesondere bezieht sich die Antwortverarbeitungsvorrichtung 100 auf die Art der Antwort (Abspielen der Musik, Abspielen der Nachrichten usw.), die vom Benutzer in der Vergangenheit ausgewählt wurde, die Anzahl der Male, die Häufigkeit, das Verhältnis oder dergleichen beim Auswählen jedes Agenten 10.
  • Der aus 3A fortgesetzte Prozess wird unter Bezugnahme auf 3B beschrieben. 3B ist ein Diagramm (2), das die erste Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
  • Die Antwortverarbeitungsvorrichtung 100, die sich in Schritt S32 auf die Auswahlhistorie A32 des Benutzers bezieht, bestimmt, ob der Benutzer eine Tendenz hat, welche Art von Antwort auszuwählen, oder ob der Benutzer eine Tendenz hat, welchen Agenten 10 auszuwählen, wenn er die Eingabeinformationen wie die Sprache A31 empfängt. Dann, nach der Erfassung der von den Agenten 10 generierten Antworten, bestimmt die Antwortverarbeitungsvorrichtung 100 auf der Basis einer vergangenen Auswahlhistorie des Benutzers, ob welche Antwort ausgegeben werden soll, d. h. ob die Antwort von welchem Agenten 10 ausgegeben werden soll, ohne dem Benutzer die Vielzahl der Antworten zu präsentieren (Schritt S33).
  • In dem Beispiel von 3B wird davon ausgegangen, dass die Antwortverarbeitungsvorrichtung 100 bestimmt, dass der Benutzer auf der Basis der vergangenen Auswahlhistorie des Benutzers wahrscheinlich die von dem Agenten 10A generierte Antwort auswählen wird. In diesem Fall gibt die Antwortverarbeitungsvorrichtung 100 die Sprache A33 aus, die angibt, dass die von dem Agenten 10A generierte Antwort an den Benutzer ausgegeben wird, ohne die von den Agenten 10 generierten Antworten zu präsentieren.
  • Dann fordert die Antwortverarbeitungsvorrichtung 100 den Agenten 10A auf, die generierte Antwort auszugeben (Schritt S34). Der Agent 10A führt „Abspielen von „Sotsugyo“ von Sänger A‟, was die von dem Agenten 10A generierte Antwort ist, als Antwort auf die Anforderung durch.
  • Auf diese Weise kann die Antwortverarbeitungsvorrichtung 100 die von den Agenten 10 generierten Antworten auf der Basis der vergangenen Auswahlhistorie des Benutzers auswerten, um automatisch eine für den Benutzer geeignete Antwort auszuwählen. Dadurch kann der Benutzer veranlassen, dass die Antwort, die der Tendenz oder Vorliebe des Benutzers entspricht, ohne Präsentation der Vielzahl von Antworten ausgegeben wird, und dadurch einen effizienten Gesprächsprozess genießen.
  • Beachten Sie, dass die Antwortverarbeitungsvorrichtung 100 eine auszugebende Antwort auswählen kann, gemäß der Tendenz des Benutzers, welchen Agenten 10 zu bevorzugen, oder eine auszugebende Antwort auswählen kann, gemäß der Art der Antwort, die von jedem Agenten 10 generiert wird, und der Tendenz des Benutzers, welche Art von Antwort zu bevorzugen.
  • Der aus 3B fortgesetzte Prozess wird unter Bezugnahme auf 3C beschrieben. 3C ist ein Diagramm (3), das die erste Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
  • Das Beispiel von 3C zeigt eine Situation, bei der der Benutzer, der sich die von der Antwortverarbeitungsvorrichtung 100 automatisch ausgewählte Antwort ansieht oder anhört, den Inhalt der anderen Antworten wissen möchte. Dabei gibt der Benutzer die Sprache A34 wie „Was noch?“ in die Antwortverarbeitungsvorrichtung 100 ein (Schritt S35).
  • Wenn sie Informationen, wie z. B. die Sprache A34, empfängt, die eine Absicht zur Auswahl einer Antwort oder eines Agenten 10 angeben, führt die Antwortverarbeitungsvorrichtung 100 eine Verarbeitung gemäß der Absicht des Benutzers durch. Beachten Sie, dass im Folgenden in einigen Fällen eine Aufforderung, die eine bestimmte Absicht angibt, wie z. B. das Auswählen einer Antwort oder eines Agenten 10, wie in der Sprache A34, als „bestimmter Befehl“ bezeichnet wird. Die bestimmten Befehle können vorab in der Antwortverarbeitungsvorrichtung 100 registriert werden, oder sie können vom Benutzer individuell registriert werden.
  • Die Antwortverarbeitungsvorrichtung 100 führt die Verarbeitung gemäß dem bestimmten Befehl durch, der in der Sprache A34 enthalten ist (Schritt S36). Beispielsweise wird der bestimmte Befehl, der in der Sprache A34 enthalten ist, ausgegeben, um „eine von einem anderen Agenten 10 generierte Antwort zu präsentieren“. In diesem Fall präsentiert die Antwortverarbeitungsvorrichtung 100 dem Benutzer eine von einem anderen Agenten 10 als dem Agenten 10A generierte Antwort.
  • Beispielsweise liest die Antwortverarbeitungsvorrichtung 100 beim Empfangen der Sprache A31 die anderen Antworten, die nach der Erfassung von den anderen Agenten 10 gehalten werden. Alternativ kann die Antwortverarbeitungsvorrichtung 100 den der Sprache A31 entsprechenden Befehl erneut an den Agenten 10B, den Agenten 10C und den Agenten 10D übertragen, um die von den Agenten 10B, 10C und 10D generierten Antworten zu erfassen (Schritt S37).
  • Dann generiert die Antwortverarbeitungsvorrichtung 100 die Sprache A35 für die Präsentation der von dem Agenten 10B, dem Agenten 10C und dem Agenten 10D generierten Antworten (Schritt S38). Die Sprache A35 enthält Sprache, die den Inhalt der vom Agenten 10B, dem Agenten 10C und dem Agenten 10D generierten Antworten angibt. Die Antwortverarbeitungsvorrichtung 100 gibt die generierte Sprache A35 an den Benutzer aus.
  • Der aus 3C fortgesetzte Prozess wird unter Bezugnahme auf 3D beschrieben. 3D ist ein Diagramm (4), das die erste Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
  • Das Beispiel von 3D zeigt eine Situation, bei der der Benutzer, der die Sprache A35 bestätigt, den Inhalt einer anderen Antwort ansehen oder anhören möchte. Dabei gibt der Benutzer beispielsweise eine Sprache A36 wie „Das Nächste, bitte“ in die Antwortverarbeitungsvorrichtung 100 ein (Schritt S39).
  • Es wird davon ausgegangen, dass die Sprache A36 der bestimmte Befehl ist, der „Wechsel einer Ausgabequelle, von einem Agenten 10, der die Antwort ausgibt, zum nächsten Agenten 10“ angibt. In diesem Fall steuert die Antwortverarbeitungsvorrichtung 100 den Wechsel der Ausgabequelle von dem Agenten 10A, der „Sotsugyo“ von Sänger A ausgibt, zu dem Agenten 10B gemäß der Absicht des bestimmten Befehls. Außerdem gibt die Antwortverarbeitungsvorrichtung 100 an den Benutzer die Sprache A37 aus, die angibt, dass die Ausgabequelle auf den Agenten 10B geändert werden soll (Schritt S40).
  • Dann fordert die Antwortverarbeitungsvorrichtung 100 den Agenten 10A auf, die Ausgabe der Antwort zu stoppen, und den Agenten 10B, die Antwort auszugeben (Schritt S41).
  • Auf diese Weise kann selbst, wenn eine Antwort ausgegeben wird, die nicht vom Benutzer gewünscht ist, eine vom Benutzer gewünschte Antwort ausgegeben werden, indem nur eine einfache Operation wie der bestimmte Befehl durchgeführt wird.
  • Als nächstes wird eine andere Variante des Antwortprozesses unter Bezugnahme auf 4 beschrieben. 4A ist ein Diagramm (1), das eine zweite Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
  • Das Beispiel von 4A zeigt eine Situation, bei der ein ähnliches Gespräch wie in den 2A und 2B zwischen der Antwortverarbeitungsvorrichtung 100 und dem Benutzer geführt wird, und die Sprache A51, die einen ähnlichen Inhalt wie die Sprache A12 hat, von der Antwortverarbeitungsvorrichtung 100 präsentiert wird (Schritt S51).
  • Dabei wird davon ausgegangen, dass der Benutzer bestimmt, dass der von der Sprache A51 präsentierte Inhalt nicht den vom Benutzer gewünschten Inhalt aufweist. In diesem Fall gibt der Benutzer die Sprache A52 wie „Was noch?“ in die Antwortverarbeitungsvorrichtung 100 ein (Schritt S52).
  • Der aus 4A fortgesetzte Prozess wird unter Bezugnahme auf 4B beschrieben. 4B ist ein Diagramm (2), das die zweite Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
  • Die Antwortverarbeitungsvorrichtung 100 empfängt die Sprache A52 und führt den bestimmten Befehl aus, der in der Sprache A52 enthalten ist. Wie oben beschrieben, fordert der in der Sprache A52 enthaltene bestimmte Befehl „die Ausgabe der von den anderen Agenten 10 generierten Antworten“ an, aber in 4A präsentiert die Antwortverarbeitungsvorrichtung 100 die Antworten aller miteinander kooperierender Agenten 10.
  • In diesem Fall bestimmt die Antwortverarbeitungsvorrichtung 100, dass die präsentierten Antworten keine Antwort aufweisen, mit der der Benutzer zufrieden ist. Dann veranlasst die Antwortverarbeitungsvorrichtung 100 jeden Agenten 10, eine zusätzliche Suche durchzuführen, um eine Antwort auf die Anfrage des Benutzers zu generieren. Dabei gibt die Antwortverarbeitungsvorrichtung 100 eine Sprache A53 aus, die dem Benutzer angibt, dass jeder Agent 10 veranlasst ist, die zusätzliche Suche durchzuführen.
  • Außerdem generiert die Antwortverarbeitungsvorrichtung 100 eine Rückmeldung A54, die den Inhalt der auf die Eingabeinformationen generierten Antworten und die Nicht-Auswahl aller Antworten angibt (Schritt S53). Außerdem überträgt die Antwortverarbeitungsvorrichtung 100 eine Anfrage für die zusätzliche Suche an die Agenten 10 zusammen mit der Rückmeldung A54 (Schritt S54).
  • Auf diese Weise überträgt die Antwortverarbeitungsvorrichtung 100 die Anfrage für die zusätzliche Suche an die Agenten 10, zusammen mit der Rückmeldung A54, die den Inhalt der von den Agenten 10 generierten Antworten und die Nicht-Auswahl aller Antworten angibt. Dies ermöglicht es jedem Agenten 10, die zusätzliche Suche durchzuführen, nachdem er erkannt hat, dass die von den anderen Agenten 10 generierten Antworten zusätzlich zu der vom entsprechenden Agenten 10 generierten Antwort unpassend sind. Dadurch kann der Benutzer effizient die vom Benutzer gewünschte Antwort erhalten, verglichen mit der zusätzlichen Suche, zu deren Durchführung die einzelnen Agenten 10 veranlasst werden.
  • Als nächstes wird eine andere Variante des Antwortprozesses unter Bezugnahme auf 5 beschrieben. 5 ist ein Diagramm, das eine dritte Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
  • Das Beispiel von 5 zeigt eine Situation, bei der, wenn die Antwortverarbeitungsvorrichtung 100 die Eingabeinformationen ähnlich der in 2A dargestellten Sprache A11 empfängt und die Agenten 10 veranlasst, die Antworten zu generieren, alle Agenten 10 denselben Antwortinhalt präsentieren.
  • In diesem Fall präsentiert die Antwortverarbeitungsvorrichtung 100 dem Benutzer die Sprache A61, die angibt, dass alle Agenten 10 dieselbe Antwort generiert haben (Schritt S61).
  • In diesem Fall gibt der Benutzer in die Antwortverarbeitungsvorrichtung 100 ein, dass die Antwort von einem bestimmten Agenten 10 auszugeben ist. Beispielsweise gibt der Benutzer die Sprache A62 wie z. B. „Agent 10A, bitte“ in die Antwortverarbeitungsvorrichtung 100 ein (Schritt S62).
  • Die Antwortverarbeitungsvorrichtung 100 führt die Verarbeitung basierend auf/auf der Basis des bestimmten Befehls („Veranlasse den Agenten 10A, die Antwort auszugeben“) durch, der in der Sprache A62 enthalten ist (Schritt S63). Insbesondere generiert die Antwortverarbeitungsvorrichtung 100 die Sprache A63 zur Anleitung „Ich werde den Agenten 10A veranlassen, die Verarbeitung durchzuführen“ und gibt diese aus. Außerdem fordert die Antwortverarbeitungsvorrichtung 100 den Agenten 10A auf, die generierte Antwort auszugeben (Schritt S64).
  • Wie oben beschrieben, kann die Antwortverarbeitungsvorrichtung 100, wenn die von den Agenten 10 erhaltenen Antworten den gleichen Inhalt haben, eine Ausgabe wie die Sprache A61 generieren, die angibt, dass die gleiche Antwort generiert wird. Dies ermöglicht es der Antwortverarbeitungsvorrichtung 100, die prägnante Information an den Benutzer zu übermitteln.
  • Als nächstes wird eine andere Variante des Antwortprozesses unter Bezugnahme auf 6 beschrieben. 6A ist ein Diagramm (1), das eine vierte Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
  • Das Beispiel von 6 zeigt eine Situation, bei der, wie in dem Beispiel von 5, wenn die Antwortverarbeitungsvorrichtung 100 die Agenten 10 veranlasst, die Antworten auf der Basis bestimmter Eingabeinformationen zu generieren, alle Agenten 10 denselben Antwortinhalt präsentieren.
  • In diesem Fall präsentiert die Antwortverarbeitungsvorrichtung 100 dem Benutzer die Sprache A71, die angibt, dass alle Agenten 10 dieselbe Antwort generiert haben (Schritt S71).
  • Dabei wird davon ausgegangen, dass der Benutzer bestimmt, dass der von der Sprache A71 präsentierte Inhalt nicht den vom Benutzer gewünschten Inhalt aufweist. In diesem Fall gibt der Benutzer die Sprache A72 wie z. B. „Was noch?“ in die Antwortverarbeitungsvorrichtung 100 ein (Schritt S72).
  • Die Antwortverarbeitungsvorrichtung 100 empfängt die Sprache A72 und führt den bestimmten Befehl aus, der in der Sprache A72 enthalten ist. Beispielsweise fordert der in der Stimme A72 enthaltene spezifische Befehl „Ausgabe der vom nächsten Agenten 10 generierten Antwort anstatt der vom Agenten 10 generierten und jetzt ausgegebenen Antwort“, aber in 6A präsentiert die Antwortverarbeitungsvorrichtung 100 bereits die Antworten aller miteinander kooperierender Agenten 10.
  • Daher generiert die Antwortverarbeitungsvorrichtung 100 die Sprache A73, die angibt, dass alle miteinander kooperierenden Agenten 10 die Antworten mit demselben Inhalt generiert haben (Schritt S73). Dann gibt die Antwortverarbeitungsvorrichtung 100 die generierte Sprache A73 an den Benutzer aus.
  • Der aus 6A fortgesetzte Prozess wird unter Bezugnahme auf 6B beschrieben. 6B ist ein Diagramm (2), das die vierte Variation des Antwortprozesses gemäß der ersten Ausführungsform darstellt.
  • Das Beispiel von 6B zeigt eine Situation, bei der der Benutzer, der die Sprache A73 bestätigt, den Inhalt einer anderen Antwort ansehen oder anhören möchte. Dabei gibt der Benutzer die Sprache A74 wie z. B. „Irgend eine andere Antwort?“ in die Antwortverarbeitungsvorrichtung 100 ein (Schritt S74).
  • Die Antwortverarbeitungsvorrichtung 100 empfängt die Sprache A74 und führt den bestimmten Befehl aus, der in der Sprache A74 enthalten ist. Wie oben beschrieben, fordert der in der Sprache A74 enthaltene bestimmte Befehl „die Ausgabe der von den anderen Agenten 10 generierten Antworten“ an, aber in 6A präsentiert die Antwortverarbeitungsvorrichtung 100 die Antworten aller miteinander kooperierender Agenten 10.
  • In diesem Fall bestimmt die Antwortverarbeitungsvorrichtung 100, dass die präsentierten Antworten keine Antwort aufweisen, mit der der Benutzer zufrieden ist. Dann veranlasst die Antwortverarbeitungsvorrichtung 100 jeden Agenten 10, eine zusätzliche Suche durchzuführen, um eine Antwort auf die Anfrage des Benutzers zu generieren. Dabei gibt die Antwortverarbeitungsvorrichtung 100 eine Sprache A75 aus, die dem Benutzer angibt, dass jeder Agent 10 veranlasst ist, die zusätzliche Suche durchzuführen (Schritt S75).
  • Dann, wie in dem in 4B dargestellten Beispiel, überträgt die Antwortverarbeitungsvorrichtung 100 die Anforderung für die zusätzliche Suche an die Agenten 10, zusammen mit der Rückmeldung, die den Inhalt der für die Eingabeinformationen generierten Antworten und die Nicht-Auswahl aller Antworten angibt (Schritt S76).
  • Auf diese Weise interpretiert die Antwortverarbeitungsvorrichtung 100 entsprechend dem Inhalt des bestimmten Befehls gemäß dem Inhalt der von jedem Agenten 10 generierten Antwort oder dem bereits dem Benutzer präsentierten Inhalt und führt die Informationsverarbeitung im Einklang mit der Situation durch. Dadurch kann der Benutzer mit nur einem kurzen Gespräch effizient die von dem Benutzer gewünschte Antwort erhalten.
  • Wie oben beschrieben, empfängt die Antwortverarbeitungsvorrichtung 100 gemäß der ersten Ausführungsform die Eingabeinformation, d. h. die Information, die die Generierung der Antwort durch jeden Agenten 10 auslöst, vom Benutzer, wie in den 1 bis 6 dargestellt. Dann präsentiert die Antwortverarbeitungsvorrichtung 100 dem Benutzer die Antworten, die durch die Vielzahl von Agenten 10 für die Eingabeinformationen generiert wurden. Außerdem überträgt die Antwortverarbeitungsvorrichtung 100 die Reaktion des Benutzers auf die präsentierten Antworten an die Vielzahl von Agenten 10.
  • Auf diese Weise fungiert die Antwortverarbeitungsvorrichtung 100 als Front-End, das die Konversation zwischen der Vielzahl von Agenten 10 und dem Benutzer vermittelt, und somit kann der Benutzer die von der Vielzahl von Agenten 10 erhaltenen Informationen oder die von der Vielzahl von Agenten 10 ausgegebenen Antworten nur durch Konversation mit der Antwortverarbeitungsvorrichtung 100 erhalten. Außerdem überträgt die Antwortverarbeitungsvorrichtung 100 als Rückmeldung die Reaktion des Benutzers auf die präsentierten Antworten an die Agenten 10, was ein effizientes Lernen der Vielzahl von Agenten 10 ermöglicht. Dies ermöglicht es der Antwortverarbeitungsvorrichtung 100, den Komfort für den Benutzer zu verbessern.
  • [1-4. Konfiguration des Antwortverarbeitungssystems gemäß der ersten Ausführungsform]
  • Als nächstes wird die Konfiguration der Antwortverarbeitungsvorrichtung 100 und dergleichen gemäß der oben beschriebenen ersten Ausführungsform unter Bezugnahme auf 7 beschrieben. 7 ist ein Diagramm, das ein Konfigurationsbeispiel des Antwortverarbeitungssystems 1 gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellt.
  • Wie in 7 dargestellt, umfasst das Antwortverarbeitungssystem 1 einen Agenten 10, die Antwortverarbeitungsvorrichtung 100 und einen externen Server 200. Der Agent 10, die Antwortverarbeitungsvorrichtung 100 und der externe Server 200 sind über ein in 7 dargestelltes Netzwerk N (z. B. das Internet) auf drahtgebundene oder drahtlose Weise kommunikativ verbunden. Beachten Sie, dass das Antwortverarbeitungssystem 1, auch wenn es in 7 nicht dargestellt ist, eine Vielzahl von Agenten 10 oder eine Vielzahl von externen Servern 200 aufweisen kann.
  • Der Agent 10 ist ein Informationsverarbeitungs-Endgerät, das von dem Benutzer verwendet wird. Der Agent 10 führt ein Gespräch mit dem Benutzer und generiert die Antwort auf die Sprache, Aktion oder dergleichen des Benutzers. Beachten Sie, dass der Agent 10 die gesamte oder einen Teil der Konfiguration enthalten kann, die in der Antwortverarbeitungsvorrichtung 100 enthalten ist, die später beschrieben wird.
  • Der externe Server 200 ist ein Dienstserver, der verschiedene Dienste bereitstellt. Beispielsweise stellt der externe Server 200 gemäß den Anforderungen vom Agenten 10 und der Antwortverarbeitungsvorrichtung 100 einen Musikdienst, Wetterinformationen, Verkehrsinformationen und dergleichen bereit.
  • Die Antwortverarbeitungsvorrichtung 100 ist ein Informationsverarbeitungs-Endgerät, das den Antwortprozess gemäß der vorliegenden Offenbarung durchführt. Wie in 7 dargestellt, verfügt die Antwortverarbeitungsvorrichtung 100 über einen Sensor 20, eine Eingabeeinheit 21, eine Kommunikationseinheit 22, eine Speichereinheit 30, eine Empfangseinheit 40, eine Präsentationseinheit 50, eine Übertragungseinheit 54 und eine Ausgabeeinheit 60.
  • Der Sensor 20 ist eine Vorrichtung, die dazu ausgelegt ist, verschiedene Arten von Informationen zu erkennen. Der Sensor 20 umfasst zum Beispiel einen Spracheingabesensor 20A, der dazu ausgelegt ist, die Sprechstimme des Benutzers zu erfassen. Der Spracheingabesensor 20A ist zum Beispiel ein Mikrofon. Außerdem umfasst der Sensor 20 zum Beispiel einen Bildeingabesensor 20B. Der Bildeingabesensor 20B ist zum Beispiel eine Kamera, die dazu ausgelegt ist, ein Bild der Bewegung oder des Gesichtsausdrucks des Benutzers, der Situation in der Wohnung des Benutzers oder dergleichen zu erfassen.
  • Außerdem kann der Sensor 20 einen Berührungssensor, der dazu ausgelegt ist, das Berühren der Antwortverarbeitungsvorrichtung 100 durch den Benutzer zu erkennen, einen Beschleunigungssensor, einen Gyrosensor oder dergleichen enthalten. Außerdem kann der Sensor 20 einen Sensor aufweisen, der dazu ausgelegt ist, die aktuelle Position der Antwortverarbeitungsvorrichtung 100 zu erkennen. Beispielsweise kann der Sensor 20 eine von einem GPS-Satelliten (Global Positioning System) gesendete Funkwelle empfangen, um auf der Basis der empfangenen Funkwelle Positionsinformationen (z. B. Breiten- und Längengrad) zu erkennen, die die aktuelle Position der Antwortverarbeitungsvorrichtung 100 angeben.
  • Außerdem kann der Sensor 20 einen Funkwellensensor aufweisen, der dazu ausgelegt ist, eine von der externen Vorrichtung abgegebene Funkwelle zu erkennen, einen elektromagnetischen Wellensensor, der dazu ausgelegt ist, eine elektromagnetische Welle zu erkennen, oder dergleichen. Außerdem kann der Sensor 20 eine Umgebung erkennen, in der sich die Antwortverarbeitungsvorrichtung 100 befindet. Insbesondere kann der Sensor 20 einen Beleuchtungsstärkesensor umfassen, der dazu ausgelegt ist, die Beleuchtungsstärke im Umfeld der Antwortverarbeitungsvorrichtung 100 zu erkennen, einen Feuchtigkeitssensor, der dazu ausgelegt ist, die Feuchtigkeit im Umfeld der Antwortverarbeitungsvorrichtung 100 zu erkennen, einen geomagnetischen Sensor, der dazu ausgelegt ist, ein Magnetfeld an der Position der Antwortverarbeitungsvorrichtung 100 zu erkennen, oder dergleichen.
  • Außerdem muss der Sensor 20 nicht unbedingt in der Antwortverarbeitungsvorrichtung 100 enthalten sein. Beispielsweise kann der Sensor 20 außerhalb der Antwortverarbeitungsvorrichtung 100 installiert werden, solange der Sensor 20 die Möglichkeit hat, die erfassten Informationen per Kommunikation oder dergleichen an die Antwortverarbeitungsvorrichtung 100 zu übertragen.
  • Die Eingabeeinheit 21 ist eine Vorrichtung, die dazu ausgelegt ist, verschiedene Operationen von dem Benutzer zu empfangen. Beispielsweise wird die Eingabeeinheit 21 durch eine Tastatur, eine Maus, ein Touchpanel oder dergleichen realisiert.
  • Die Kommunikationseinheit 22 wird zum Beispiel durch eine Netzwerk-Schnittstellenkarte (NIC) oder dergleichen realisiert. Die Kommunikationseinheit 22 ist auf drahtgebundene oder drahtlose Weise an das Netzwerk N angeschlossen, um über das Netzwerk N Informationen zum/vom Agenten 10, dem externen Server 200 oder dergleichen zu übertragen/empfangen.
  • Die Speichereinheit 30 wird zum Beispiel durch eine Halbleiterspeichervorrichtung, wie einen Direktzugriffsspeicher (RAM) oder Flash-Speicher, oder eine Speichervorrichtung, wie eine Festplatte oder optische Platte, realisiert. Die Speichereinheit 30 verfügt über eine Benutzerinformationstabelle 31, eine Agententabelle 32, eine Befehlstabelle 33 und eine Historietabelle 34. Im Folgenden werden die einzelnen Datentabellen der Reihe nach beschrieben.
  • Die Benutzerinformationstabelle 31 speichert Informationen über den Benutzer, der die Antwortverarbeitungsvorrichtung 100 und den Agenten 10 benutzt. 8 stellt ein Beispiel der Benutzerinformationstabelle 31 gemäß der ersten Ausführungsform dar. 8 ist ein Diagramm, das ein Beispiel der Benutzerinformationstabelle 31 gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellt. In dem in 8 dargestellten Beispiel enthält die Benutzerinformationstabelle 31 Elemente wie „Benutzer-ID“, „Benutzerattributinformationen“ und „Historie-Informationen“.
  • Die „Benutzer-ID“ repräsentiert Identifikationsinformationen, die jeden Benutzer identifizieren. Die „Benutzerattributinformationen“ repräsentieren verschiedene Informationen jedes Benutzers, die bei Gebrauch der Antwortverarbeitungsvorrichtung 100 durch den Benutzer registriert werden. Das in 8 dargestellte Beispiel stellt konzeptionell die Position der Benutzerattributinformationen dar, wie z. B. „F01“, aber die Benutzerattributinformationen weisen tatsächlich Attributinformationen (Benutzerprofil) auf, wie z. B. Alter, Geschlecht, Wohnort, Familienstruktur des Benutzers und dergleichen. Außerdem können die Benutzerattributinformationen Informationen aufweisen, die zum Auswählen der Art der auszugebenden Informationen erforderlich sind, z. B. dass ein Benutzer eine Sehschwäche hat. Zum Beispiel, wenn die Sehbehinderung in den Benutzerattributinformationen registriert ist, kann die Antwortverarbeitungsvorrichtung 100 den Inhalt der Antwort, der normalerweise auf dem Bildschirm angezeigt wird, in Sprache umwandeln und die Sprache ausgeben. Für eine solche Umwandlung kann zum Beispiel eine bekannte Technologie wie die Text-to-Speech (TTS)-Verarbeitung verwendet werden.
  • Die „Historie-Information“ stellt eine Benutzungshistorie der Antwortverarbeitungsvorrichtung 100 durch den jeweiligen Benutzer dar. Das in 8 dargestellte Beispiel veranschaulicht konzeptionell das Element der Historie-Informationen, wie z. B. „G01“, aber die Historie-Informationen umfassen tatsächlich verschiedene Informationen, wie z. B. den Inhalt der Fragen des Benutzers an die Antwortverarbeitungsvorrichtung 100, eine Historie der Anfragen, eine Historie der Ausgabeantworten und dergleichen. Außerdem können die Historie-Informationen Stimmabdruck-Informationen, Wellenform-Informationen oder dergleichen aufweisen, um jeden Benutzer anhand seiner Stimme zu identifizieren. Außerdem können die in 8 dargestellten „Historie-Informationen“ Informationen aufweisen, die die Aktionen der einzelnen Benutzer in der Vergangenheit angeben. Beachten Sie, dass die Historie-Informationen später unter Bezugnahme auf 11 ausführlich beschrieben werden.
  • Mit anderen Worten, das in 8 dargestellte Beispiel zeigt, dass der durch die Benutzer-ID „U01“ identifizierte Benutzer Benutzerattributinformationen „F01“ und Historie-Informationen „G01“ besitzt.
  • Als Nächstes wird die Agententabelle 32 beschrieben. Die Agententabelle 32 speichert Informationen über den Agenten 10 in Kooperation mit der Antwortverarbeitungsvorrichtung 100.
  • 9 stellt ein Beispiel der Agententabelle 32 gemäß der ersten Ausführungsform dar. 9 ist ein Diagramm, das ein Beispiel der Agententabelle 32 gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellt. In dem in 9 dargestellten Beispiel enthält die Agententabelle 32 Elemente wie „Agenten-ID“, „Vorrichtungsinformationen“, „Eingabeformat“ und „Ausgabeformat“.
  • Die „Agenten-ID“ repräsentiert Identifikationsinformationen, die den Agenten 10 identifizieren. Beachten Sie, dass in der Beschreibung davon ausgegangen wird, dass die Agenten-ID und die Referenzziffern und -symbole des Agenten 10 gemeinsam verwendet werden. Beispielsweise bedeutet der durch die Agenten-ID „10A“ identifizierte Agent 10 den „Agenten 10A“.
  • Die „Vorrichtungsinformationen“ repräsentieren Informationen des Agenten 10 als Informationsvorrichtung. 9 stellt konzeptionell die konzeptionell beschriebene Informationsvorrichtung dar, wie z. B. „C01“, aber die Informationsvorrichtung speichert tatsächlich den Typ des Agenten 10 als Informationsvorrichtung (intelligenter Lautsprecher, Smartphone, Roboter usw.), die Art der Funktion, die der Agent 10 ausführen kann, und dergleichen.
  • Das „Eingabeformat“ repräsentiert Informationen, die angeben, welche Art von Format die Eingabeinformationen für den Agenten 10 haben. In dem in 9 dargestellten Beispiel wird das Element des Eingabeformats konzeptionell beschrieben, wie z. B. „D01“, aber das Element des Eingabeformats speichert tatsächlich den Typ des Sprachformats („mp3“, „wav“ usw.) der Daten (Sprache, Bild usw.), die vom Agenten 10 verarbeitet werden können, das Dateiformat des vom Agenten 10 erkennbaren Befehls und dergleichen.
  • Das „Ausgabeformat“ repräsentiert das Format der Daten, die vom Agenten 10 ausgegeben werden können. In dem in 9 dargestellten Beispiel ist das Element des Ausgabeformats konzeptionell beschrieben, wie z. B. „E01“, aber in Wirklichkeit speichert das Element des Ausgabeformats tatsächlich eine bestimmte Form, die der Agent 10 ausgeben kann, z. B. ob der Agent 10 zur Ausgabe von Sprache, zur Ausgabe eines Bildes oder zur Ausgabe eines bewegten Bildes ausgelegt ist.
  • Mit anderen Worten, das in 9 dargestellte Beispiel zeigt, dass der durch die Agenten-ID „10A“ identifizierte Agent 10A die Vorrichtungsinformation „C01“, das Eingabeformat „D01“ und das Ausgabeformat „E01“ hat.
  • Als Nächstes wird die Befehlstabelle 33 beschrieben. Die Befehlstabelle 33 speichert Informationen über die bestimmten Befehle, die von der Antwortverarbeitungsvorrichtung 100 erkannt werden.
  • 10 stellt ein Beispiel der Befehlstabelle 33 gemäß der ersten Ausführungsform dar. 10 ist ein Diagramm, das ein Beispiel der Befehlstabelle 33 gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellt. In dem in 10 dargestellten Beispiel enthält die Befehlstabelle 33 Elemente wie „Befehlsinhalt“, „bestimmte Befehlsanweisung“ und „Ergebnis der Befehlsanalyse“.
  • Der „Befehlsinhalt“ repräsentiert den Inhalt der Verarbeitung, die von der Antwortverarbeitungsvorrichtung 100 durchgeführt wird, wenn jeder bestimmte Befehl eingegeben wird. Die „bestimmte Befehlsanweisung“ repräsentiert eine Anweisung (Sprache oder Text), die jedem bestimmten Befehl entspricht. Das „Befehlsanalyseergebnis“ repräsentiert ein Ergebnis einer Analyse jedes bestimmten Befehls.
  • Mit anderen Worten, das in 10 dargestellte Beispiel zeigt, dass eine Anweisung, die dem Inhalt eines Befehls „andere Ergebnisse auslesen“ entspricht, Sprache oder Text ist, wie z. B. „Was sonst?“, „Sagen Sie mir andere Ergebnisse“ oder „Sonst noch etwas?“, und diese Anweisungen werden als Befehl (Inhalt der Verarbeitung) analysiert, wie z. B. „READ-RESULTS“.
  • Beachten Sie, dass die Stimmen oder Texte, die jeder bestimmten Befehlsanweisung entsprechen, nicht auf die in dem Beispiel in 10 dargestellten beschränkt sind und gegebenenfalls auf der Basis der Registrierung durch den Benutzer selbst aktualisiert werden können.
  • Als Nächstes wird die Historietabelle 34 beschrieben. Die Historietabelle 34 speichert die Historie-Informationen über die Interaktion zwischen der Antwortverarbeitungsvorrichtung 100 und jedem Benutzer.
  • 11 ist ein Diagramm, das ein Beispiel der Historietabelle 34 gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellt. In dem in 11 dargestellten Beispiel enthält die Historietabelle 34 Elemente wie „Eingabeinformations-ID“, „Eintrag“, „Agentenauswahlhistorie“ und „Ausgabeinhalt“.
  • Die „Eingabeinformations-ID“ repräsentiert Identifikationsinformationen, die die Eingabeinformationen identifizieren. Der „Eintrag“ repräsentiert den bestimmten Inhalt der Eingabeinformationen. In 11 wird das Element des Eintrags konzeptionell beschrieben, z. B. „Y01“, aber das Element des Eintrags speichert tatsächlich ein Ergebnis der Analyse der Sprache (Fragen usw.) eines Benutzers, einen gemäß dem Ergebnis der Analyse generierten Befehl und dergleichen.
  • Die „Agentenauswahlhistorie“ repräsentiert die Identifikationsinformationen des für bestimmte Eingabeinformationen von dem Benutzer ausgewählten Agenten 10, die Anzahl der Male, das Verhältnis, die Häufigkeit oder dergleichen der Auswahl jedes Agenten 10. Der „Ausgabeinhalt“ repräsentiert einen tatsächlichen Inhalt, der von dem Agenten 10 oder der Antwortverarbeitungsvorrichtung 100 für bestimmte Eingabeinformationen ausgegeben wird, die Art der ausgegebenen Informationen (Musik, Suchergebnis oder dergleichen), die Anzahl der Male, die Häufigkeit und dergleichen der tatsächlichen Ausgabe verschiedener Inhalte.
  • Mit anderen Worten, das in 11 dargestellte Beispiel zeigt, dass der Inhalt der Eingabeinformationen, die durch die Agenten-ID „X01“ identifiziert werden, „Y01“ ist, und die Historie des Agenten 10, der vom Benutzer für die Eingabeinformationen ausgewählt wurde, „H01“ ist, und die Historie des Ausgabeinhalts „101“ ist.
  • Wieder auf 7 Bezug nehmend, wird die Beschreibung fortgesetzt. Die Empfangseinheit 40, die Präsentationseinheit 50 und die Übertragungseinheit 54 dienen jeweils als eine Verarbeitungseinheit, die dazu ausgelegt ist, die von der Antwortverarbeitungsvorrichtung 100 durchgeführte Informationsverarbeitung auszuführen. Die Empfangseinheit 40, die Präsentationseinheit 50 und die Übertragungseinheit 54 werden durch die Ausführung von Programmen (z. B. ein Antwortverarbeitungsprogramm gemäß der vorliegenden Offenbarung) erreicht, die in der Antwortverarbeitungsvorrichtung 100 gespeichert sind, z. B. durch eine zentrale Verarbeitungseinheit (CPU), eine Mikroverarbeitungseinheit (MPU) oder eine Grafikverarbeitungseinheit (GPU), mit einem Direktzugriffsspeicher (RAM) oder dergleichen als Arbeitsbereich. Außerdem dienen die Empfangseinheit 40, die Präsentationseinheit 50 und die Übertragungseinheit 54 jeweils als Controller, was durch eine integrierte Schaltung wie einen anwendungsbestimmten integrierten Schaltkreis (ASIC) oder ein Field Programmable Gate Array (FPGA) realisiert werden kann.
  • Die Empfangseinheit 40 ist die Verarbeitungseinheit, die zum Empfangen verschiedener Informationen ausgelegt ist. Wie in 7 dargestellt, weist die Empfangseinheit 40 eine Erkennungseinheit 41, eine Registrierungseinheit 42 und eine Erfassungseinheit 43 auf.
  • Die Erkennungseinheit 41 erkennt verschiedene Informationen über den Sensor 20. Beispielsweise erkennt die Erkennungseinheit 41 die Sprache des Benutzers über den Spracheingabesensor 20A, der ein Beispiel für den Sensor 20 ist. Außerdem kann die Erkennungseinheit 41 über den Bildsensor 20B, einen Beschleunigungssensor, einen Infrarotsensor oder dergleichen verschiedene Informationen über die Bewegung des Benutzers erkennen, wie z. B. die Gesichtsinformationen des Benutzers, die Ausrichtung, die Neigung, die Bewegung oder die Bewegungsgeschwindigkeit des Körpers des Benutzers. Mit anderen Worten, die Erkennungseinheit 41 kann als Kontext verschiedene physikalische Größen wie Positionsinformationen, Beschleunigung, Temperatur, Schwerkraft, Rotation (Winkelgeschwindigkeit), Beleuchtungsstärke, Erdmagnetismus, Druck, Nähe, Feuchtigkeit und Rotationsvektor über den Sensor 20 erkennen.
  • Die Registrierungseinheit 42 akzeptiert die Registrierung von dem Benutzer über die Eingabeeinheit 21. Zum Beispiel empfängt die Registrierungseinheit 42 eine Registrierung, die sich auf den bestimmten Befehl des Benutzers bezieht, über ein Touchpanel oder eine Tastatur.
  • Außerdem kann die Registrierungseinheit 42 die Registrierung eines Zeitplans des Benutzers oder dergleichen akzeptieren. Beispielsweise empfängt die Registrierungseinheit 42 die Registrierung des Zeitplans von dem Benutzer mit einer Anwendungsfunktion, die in der Antwortverarbeitungsvorrichtung 100 integriert ist.
  • Die Erfassungseinheit 43 erfasst verschiedene Informationen. Beispielsweise erfasst die Erfassungseinheit 43 die Vorrichtungsinformationen jedes Agenten 10, Informationen über eine von jedem Agenten 10 generierte Antwort und dergleichen.
  • Außerdem kann die Erfassungseinheit 43 einen kommunikationsbezogenen Kontext empfangen. Beispielsweise kann die Erfassungseinheit 43 als Kontext einen Verbindungszustand zwischen der Antwortverarbeitungsvorrichtung 100 und jedem Agenten 10 oder verschiedenen Geräten (Server in einem Netzwerk, Haushaltsgeräte usw.) empfangen. Der Verbindungszustand mit verschiedenen Geräten repräsentiert zum Beispiel Informationen, die angeben, ob eine wechselseitige Kommunikation aufgebaut ist, ein zur Kommunikation verwendeter Kommunikationsstandard oder dergleichen.
  • Die Empfangseinheit 40 steuert jede der oben beschriebenen Verarbeitungseinheiten, um verschiedene Informationen zu empfangen. Beispielsweise erfasst die Empfangseinheit 40 die Eingabeinformationen, die Informationen sind, die die Generierung der Antwort durch den jeweiligen Agenten 10 vom Benutzer auslösen.
  • Beispielsweise erfasst die Empfangseinheit 40 die Sprachinformationen von dem Benutzer als Eingabeinformationen. Insbesondere erfasst die Empfangseinheit 40 die Sprache eines Benutzers, wie z. B. „Ich möchte „Sotsugyo“ hören‟, und erfasst eine Art von Absicht, die in der Sprache als Eingabeinformationen vorhanden ist.
  • Alternativ kann die Empfangseinheit 40 Erkennungsinformationen, die durch das Erkennen der Aktion des Benutzers erhalten werden, als Eingabeinformationen erfassen. Die Erkennungsinformationen sind Informationen, die von der Erkennungseinheit 41 über den Sensor 20 erkannt werden. Insbesondere handelt es sich bei den Erkennungsinformationen um die Aktion des Benutzers, die die Generierung der Antwort durch die Antwortverarbeitungsvorrichtung 100 auslöst, wie z. B. Informationen, die angeben, dass der Benutzer in die Kamera der Antwortverarbeitungsvorrichtung 100 blickt, Informationen, die angeben, dass sich der Benutzer von einem Raum zur Haustür in seiner Wohnung bewegt, oder ähnliches.
  • Außerdem kann die Empfangseinheit 40 die Texteingabe von dem Benutzer als Eingabeinformationen empfangen. Insbesondere erfasst die Empfangseinheit 40 die Texteingabe von dem Benutzer, wie z. B. „Ich möchte „Sotsugyo“ hören‟, über die Eingabeeinheit 21 und erfasst eine Art von Absicht, die in dem Text als Eingabeinformationen enthalten ist.
  • Außerdem akzeptiert die Empfangseinheit 40, nachdem die von jedem Agent 10 generierte Antwort von der Präsentationseinheit 50, die später beschrieben wird, präsentiert und eine beliebige der präsentierten Antworten ausgegeben wurde, den bestimmten Befehl des Benutzers, der die Änderung der auszugebenden Antwort angibt. Beispielsweise empfängt die Empfangseinheit 40 die Sprache des Benutzers wie „Was kommt als Nächstes?“ als bestimmten Befehl. In diesem Fall führt die Präsentationseinheit 50 die dem bestimmten Befehl entsprechende Informationsverarbeitung durch (z. B. die Steuerung eines anderen Agenten 10, der nach dem Agenten 10 registriert ist, der jetzt die Antwort ausgibt, um die Antwort auszugeben).
  • Außerdem kann die Empfangseinheit 40, nachdem die von jedem Agenten 10 generierte Antwort von der Präsentationseinheit 50, die später beschrieben wird, präsentiert wurde, den bestimmten Befehl empfangen, der die Anforderung einer von der präsentierten Antwort abweichenden Antwort des Benutzers angibt. Beispielsweise empfängt die Empfangseinheit 40 die Sprache des Benutzers wie „Was sonst noch?“ als bestimmten Befehl. In diesem Fall führt die Präsentationseinheit 50 die Verarbeitung der Informationen durch, die dem bestimmten Befehl entsprechen (z. B. die Steuerung jedes Agenten 10 zur Durchführung der zusätzlichen Suche).
  • Außerdem kann die Empfangseinheit 40 Informationen über verschiedene Kontexte erfassen. Bei dem Kontext handelt es sich um Informationen, die verschiedene Situationen angeben, wenn die Antwortverarbeitungsvorrichtung 100 die Antwort generiert. Beachten Sie, dass der Kontext „Informationen enthält, die die Situation des Benutzers angeben“, wie z. B. Aktionsinformationen, die angeben, dass der Benutzer die Antwortverarbeitungsvorrichtung 100 ansieht, und daher kann der Kontext auch als Eingabeinformation dienen.
  • Beispielsweise kann die Empfangseinheit 40 die von dem Benutzer im Voraus registrierten Benutzerattributinformationen als Kontext erfassen. Insbesondere erfasst die Empfangseinheit 40 Informationen wie das Geschlecht, das Alter oder den Wohnort des Benutzers. Außerdem kann die Empfangseinheit 40 Informationen erfassen, die in den Benutzerattributinformationen die Eigenschaften des Benutzers angeben, beispielsweise, dass der Benutzer eine Sehschwäche hat. Außerdem kann die Empfangseinheit 40 auf der Basis der Nutzungshistorie der Antwortverarbeitungsvorrichtung 100 oder dergleichen Informationen wie den Geschmack des Benutzers als Kontext erfassen.
  • Außerdem kann die Empfangseinheit 40 Positionsinformationen erfassen, die als Kontext die Position des Benutzers angeben. Bei den Positionsinformationen kann es sich um Informationen handeln, die eine bestimmte Position angeben, z. B. Längen- und Breitengrad, oder um Informationen, die angeben, in welchem Raum sich der Benutzer zu Hause aufhält. Bei den Positionsinformationen kann es sich beispielsweise um Informationen handeln, die die Position des Benutzers angeben, zum Beispiel, ob sich der Benutzer zu Hause in einem Wohnzimmer, Schlafzimmer oder Kinderzimmer befindet. Alternativ können die Positionsinformationen auch Informationen über einen bestimmten Ort sein, zu dem der Benutzer geht. Außerdem können die Informationen über einen bestimmten Ort, an den der Benutzer gegangen ist, Folgendes aufweisen: Der Benutzer befindet sich beispielsweise in einem Zug, fährt mit einem Auto oder geht zur Schule oder zur Arbeit. Die Empfangseinheit 40 kann zum Beispiel mit einem mobilen Endgerät wie einem Smartphone des Benutzers kommunizieren, um solche Informationen zu erhalten.
  • Außerdem kann die Empfangseinheit 40 Vorhersageinformationen erfassen, bei denen die Aktion oder Emotion des Benutzers als Kontext vorhergesagt wird. Beispielsweise erfasst die Empfangseinheit 40 Informationen zur Aktionsvorhersage, d. h. Informationen, die von der Aktion des Benutzers geschätzt werden und die die zukünftige Aktion des Benutzers als Kontext angeben. Insbesondere erfasst die Empfangseinheit 40 die Aktionsvorhersageinformationen, zum Beispiel „der Benutzer ist im Begriff, auszugehen“, als Informationen, die auf der Basis der Aktion des Benutzers vorhergesagt werden, die angibt, dass der Benutzer sich in seiner Wohnung vom Zimmer zur Haustür bewegt. Beispielsweise erfasst die Empfangseinheit 40 beim Erfassen der Aktionsvorhersageinformationen, wie zum Beispiel „der Benutzer ist im Begriff auszugehen“, auf der Basis der Information einen markierten Kontext wie „Ausgehen“.
  • Außerdem kann die Empfangseinheit 40 Planungsinformationen als Aktion des Benutzers erfassen, die im Voraus von dem Benutzer registriert wurden. Insbesondere erfasst die Empfangseinheit 40 Informationen über einen Zeitplan, der zur geplanten Zeit innerhalb eines bestimmten Zeitraums (z. B. innerhalb eines Tages) ab dem Zeitpunkt der Rede des Benutzers registriert wurde. Dies ermöglicht es der Empfangseinheit 40, Informationen oder dergleichen vorherzusagen, z. B. wohin der Benutzer zu einer bestimmten Zeit ausgehen wird.
  • Außerdem kann die Empfangseinheit 40 die Bewegungsgeschwindigkeit des Benutzers, die Position des Benutzers, die Geschwindigkeit der Sprache des Benutzers und dergleichen erfassen, die von dem Sensor 20 erfasst werden, um die Situation oder die Emotion des Benutzers vorherzusagen. Beispielsweise kann die Empfangseinheit 40 die Situation oder das Gefühl „der Benutzer hat es eilig“ vorhersagen, wenn der Benutzer mit einer Geschwindigkeit spricht, die über der des normalen Sprechens des Benutzers liegt. Wenn beispielsweise der Kontext erfasst wird, der angibt, dass der Benutzer es eiliger hat als gewöhnlich, kann die Antwortverarbeitungsvorrichtung 100 Anpassungen vornehmen, um beispielsweise eine kürzere Antwort auszugeben.
  • Beachten Sie, dass der oben beschriebene Kontext ein Beispiel ist und jede Information, die die Situation des Benutzers oder der Antwortverarbeitungsvorrichtung 100 angibt, der Kontext sein kann. Beispielsweise kann die Empfangseinheit 40 als Kontext verschiedene physikalische Größen wie die über den Sensor 20 erhaltenen Positionsinformationen, die Beschleunigung, die Temperatur, die Schwerkraft, die Rotation (Winkelgeschwindigkeit), die Beleuchtungsstärke, den Geomagnetismus, den Druck, die Nähe, die Feuchtigkeit und den Rotationsvektor der Antwortverarbeitungsvorrichtung 100 erfassen. Außerdem kann die Empfangseinheit 40 durch Verwenden einer Kommunikationsfunktion, die in der Empfangseinheit 40 verwendet wird, als Kontext den Verbindungszustand mit verschiedenen Vorrichtungen (z. B. Informationen über den Aufbau der Kommunikation und einen verwendeten Kommunikationsstandard) oder dergleichen erfassen.
  • Außerdem kann der Kontext Informationen über eine Unterhaltung zwischen dem Benutzer und einem anderen Benutzer oder zwischen dem Benutzer und der Antwortverarbeitungsvorrichtung 100 aufweisen. Beispielsweise kann der Kontext Folgendes aufweisen: Konversationskontextinformationen, die den Kontext der Konversation des Benutzers, den Bereich der Konversation (Wetter, Nachrichten, Zugstatusinformationen usw.), die Absicht der Rede des Benutzers, Attributinformationen oder dergleichen angeben.
  • Außerdem kann der Kontext Datums- und Zeitinformationen über das Gespräch aufweisen. Insbesondere handelt es sich bei den Datums- und Zeitangaben um Informationen über das Datum, die Uhrzeit, einen Wochentag, die Merkmale von Feiertagen (Weihnachten usw.), einen Zeitabschnitt (morgens, mittags, abends, um Mitternacht) oder dergleichen.
  • Außerdem kann die Empfangseinheit 40 als Kontext verschiedene Informationen erfassen, die die Situation des Benutzers angeben, wie z. B. Informationen über eine bestimmte Hausarbeit des Benutzers, Informationen über den Inhalt eines Fernsehprogramms, das der Benutzer sieht, Informationen darüber, was der Benutzer isst, oder Informationen über ein Gespräch mit einer bestimmten Person.
  • Außerdem kann die Empfangseinheit 40 durch die Kommunikation mit den Geräten (IoT-Gerät etc.) im Haus zum Beispiel Informationen darüber erhalten, welches Gerät aktiviert ist (z. B. ob der Strom ein- oder ausgeschaltet ist), oder welches Gerät welche Art von Verarbeitung durchführt.
  • Außerdem kann die Empfangseinheit 40 als Kontext eine Verkehrslage, Wetterinformationen oder ähnliches in einem Wohnbereich des Benutzers durch Kommunikation mit dem externen Dienst erfassen. Die Empfangseinheit 40 speichert jedes Stück der erfassten Informationen in der Benutzerinformationstabelle 31 oder dergleichen. Außerdem kann die Empfangseinheit 40 auf die Benutzerinformationstabelle 31 oder die Agententabelle 32 zurückgreifen, um entsprechend die für die Verarbeitung erforderlichen Informationen zu erhalten.
  • Als Nächstes wird die Präsentationseinheit 50 beschrieben. Wie in 7 dargestellt, weist die Präsentationseinheit 50 eine Analyseeinheit 51, eine Erzeugungseinheit 52 und eine Ausgabesteuereinheit 53 auf.
  • Beispielsweise analysiert die Eingabeeinheit 51 die Eingabeinformationen, damit jeder aus einer Vielzahl von ausgewählten Agenten 10 die Eingabeinformationen erkennen kann. Die Erzeugungseinheit 52 generiert den Befehl entsprechend der Eingabeinformationen auf der Basis des von der Analyseeinheit 51 analysierten Inhalts. Außerdem überträgt die Erzeugungseinheit 52 den generierten Befehl an die Übertragungseinheit 54 und veranlasst die Übertragungseinheit 54, den generierten Befehl an jeden Agenten 10 zu übertragen. Die Ausgabesteuereinheit 53 ist dazu ausgelegt, beispielsweise den Inhalt der vom Agenten 10 generierten Antwort auszugeben und den Agenten 10 zu steuern, um die Antwort auszugeben.
  • Mit anderen Worten, die Präsentationseinheit 50 präsentiert die von der Vielzahl der Agenten 10 generierten Präsentationsinformationen für die von der Empfangseinheit 40 empfangenen Eingabeinformationen auf der Basis von Informationen, die durch die von der Analyseeinheit 51, der Erzeugungseinheit 52 und der Ausgabesteuereinheit 53 durchgeführte Verarbeitung erhalten wurden.
  • Beispielsweise führt die Präsentationseinheit 50 eine Präsentation für den Benutzer durch, indem sie Sprache verwendet, die den Inhalt jeder der für die Eingabeinformationen generierten Antworten der Vielzahl von Agenten 10 enthält.
  • Außerdem steuert die Präsentationseinheit 50 einen Agenten 10, der eine von dem Benutzer aus den dem Benutzer präsentierten Antworten ausgewählte Antwort generiert, um die ausgewählte Antwort auszugeben. Wenn beispielsweise der bestimmte Befehl, der ein Ausgabeziel angibt, beispielsweise „Agent 10A, bitte“, vom Benutzer ausgegeben wird, überträgt die Präsentationseinheit 50 eine Aufforderung an den Agenten 10A, die tatsächlich generierte Antwort auszugeben. Dies ermöglicht es der Präsentationseinheit 50, den Agenten 10A so zu steuern, dass er die von dem Benutzer gewünschte Antwort ausgibt.
  • Beachten Sie, dass die Präsentationseinheit 50 die von dem Benutzer ausgewählte Antwort der präsentierten Antworten von dem Agenten 10, der die ausgewählte Antwort generiert hat, erfassen und die erfasste Antwort durch die Antwortverarbeitungsvorrichtung 100 ausgeben kann. Mit anderen Worten, die Präsentationseinheit 50 kann Daten der Antwort (z. B. Musikdaten von „Sotsugyo“) erfassen, um die Daten unter Verwendung der Ausgabeeinheit 60 der Antwortverarbeitungsvorrichtung 100 auszugeben, anstatt den Agenten 10A zu veranlassen, die von dem Agenten 10A generierte Antwort (z. B. das Abspielen der Musik „Sotsugyo“) auszugeben. Dies ermöglicht es der Präsentationseinheit 50, die vom Benutzer gewünschte Antwort auszugeben, anstatt des Agenten 10A, der beispielsweise an einer relativ weit vom Benutzer entfernten Position installiert ist, was den Komfort für den Benutzer erhöht.
  • Außerdem führt die Präsentationseinheit 50 eine Verarbeitung entsprechend dem bestimmten Befehl durch, der von der Empfangseinheit 40 empfangen wurde. Wenn beispielsweise eine beliebige der präsentierten Antworten ausgegeben wird und dann der bestimmte Befehl, der eine Änderung der auszugebenden Antwort angibt, vom Benutzer akzeptiert wird, ändert die Präsentationseinheit 50 die ausgegebene Antwort auf der Basis des bestimmten Befehls in eine andere Antwort.
  • Beachten Sie, dass, wenn die von der Vielzahl der Agenten 10 generierten Antworten auf die Eingabeinformationen den gleichen Inhalt aufweisen, die Präsentationseinheit 50 die Antworten, die den gleichen Inhalt aufweisen, gemeinsam präsentieren kann. Dies ermöglicht es der Präsentationseinheit 50, eine Situation zu vermeiden, bei der die Antworten mit gleichem Inhalt mehrfach an den Benutzer ausgegeben werden, wenn der bestimmte Befehl wie „Weiter, bitte“ von dem Benutzer empfangen wird.
  • Außerdem kann die Präsentationseinheit 50, wenn sie den bestimmten Befehl empfängt, der eine von der präsentierten Antwort abweichende Antwort des Benutzers anfordert, auf der Basis des bestimmten Befehls die Anforderung für die zusätzliche Suche in Bezug auf die Eingabeinformationen an die Vielzahl von Agenten 10 übertragen.
  • Außerdem kann sich die Präsentationseinheit 50 auf die Historietabelle 34 beziehen, um die auszugebende Antwort auf der Basis der Aktion des Benutzers in der Vergangenheit auszuwählen. Insbesondere gibt die Präsentationseinheit 50 an den Benutzer eine Antwort aus, die aus den von der Vielzahl von Agenten 10 generierten Antworten für die Eingabeinformationen ausgewählt wurde, auf der Basis einer Historie, die die von dem Benutzer in der Vergangenheit ausgewählten Antworten angibt, die von der Vielzahl von Agenten 10 generiert wurden.
  • Beispielsweise könnte die Antwortverarbeitungsvorrichtung 100 bei der Ausgabe der Antwort an den Benutzer, der eine Frage zu bestimmten Informationen stellt, eine Reaktion wie „Teile mir weitere Informationen mit“ vom Benutzer erhalten. In diesem Fall bestimmt die Antwortverarbeitungsvorrichtung 100, dass die ausgegebenen Informationen keine Informationen sind, die der Benutzer wünscht. Unterdessen bestimmt die Antwortverarbeitungsvorrichtung 100, wenn die nächste Informationsausgabe von dem Benutzer akzeptiert wird, dass die Informationen die vom Benutzer gewünschten Informationen sind.
  • In diesem Fall, wenn der Antwortverarbeitungsvorrichtung 100 als nächstes eine ähnliche Frage von dem Benutzer gestellt wird, kann die Antwortverarbeitungsvorrichtung 100 bevorzugt einen Agenten 10 auswählen, der in der Lage ist, die vom Benutzer gewünschte Antwort zu generieren. Außerdem kann die Antwortverarbeitungsvorrichtung 100 beispielsweise dann, wenn der Benutzer dazu neigt, eine Ausgabe von einem bestimmten Agenten 10 zu wünschen (wenn die Angabe eines bestimmten Agenten 10 als Ausgabeziel durch den Benutzer statistisch häufig ist usw.), die Antwort so steuern, dass sie bevorzugt von dem Agenten 10 ausgegeben wird. Auf diese Weise führt die Antwortverarbeitungsvorrichtung 100 ein Lernen auf der Basis einer Historie der Anweisungen oder Operationen des Benutzers durch, und so kann die Antwortverarbeitung, die ferner die Anforderung des Benutzers erfüllt, durchgeführt werden. Außerdem kann der Benutzer dadurch die Antwortverarbeitungsvorrichtung 100 veranlassen, die von dem Benutzer gewünschte Antwort auszugeben, ohne eine Anweisung zu geben.
  • Außerdem kann die Präsentationseinheit 50 bestimmen, ob jeder der Vielzahl von Agenten 10 die Antwort auf die Eingabeinformationen generieren kann, um einen Agenten 10, der kein Agent 10 ist, der bestimmt ist, keine Antwort auf die Eingabeinformationen zu generieren, als einen Agenten 10 auszuwählen, der die Antwort entsprechend der Eingabeinformationen generiert. Mit anderen Worten, die Präsentationseinheit 50 kann sich auf die Agententabelle 32 beziehen, um einen Agenten 10 auszuwählen, von dem erwartet wird, dass er die Antwort generieren kann. Dies ermöglicht es der Präsentationseinheit 50, den Aufwand zu reduzieren, die Anfrage wahllos an alle Agenten 10 zu übertragen.
  • Beachten Sie, dass die oben beschriebene Analyseeinheit 51 eine Verarbeitung zum Verstehen der Bedeutung der von der Empfangseinheit 40 erfassten Informationen durchführt. Insbesondere führt die Analyseeinheit 51 die Verarbeitung der automatischen Spracherkennung (ASR) oder des natürlichen Sprachverständnisses (NLU) an den Sprachinformationen und dergleichen durch die Empfangseinheit 40 durch. Beispielsweise unterteilt die Analyseeinheit 51 die erfasste Sprache durch die ASR oder NLU in Morpheme und bestimmt, ob jedes Morphem ein Element ist, das welche Art von Absicht oder Attribut hat.
  • Wenn die Absicht des Benutzers als Ergebnis der Analyse der Eingabeinformationen nicht verstanden werden kann, kann die Analyseeinheit 51 an die Ausgabesteuereinheit 53 übertragen, dass die Absicht des Benutzers nicht verstanden werden kann. Wenn beispielsweise die Sprache des Benutzers Informationen enthält, die als Ergebnis der Analyse nicht verstanden werden können, überträgt die Analyseeinheit 51 den Inhalt der Informationen an die Ausgabesteuereinheit 53. In diesem Fall kann die Ausgabesteuereinheit 53 die Antwort generieren, die den Benutzer auffordert, für die nicht verständlichen Informationen noch einmal genau zu sprechen.
  • Die Übertragungseinheit 54 überträgt verschiedene Informationen. Beispielsweise überträgt die Übertragungseinheit 54 die Reaktion des Benutzers (Feedback) auf die von der Präsentationseinheit 50 präsentierte Antwort an die Vielzahl der Agenten 10.
  • Insbesondere überträgt die Übertragungseinheit 54 als Reaktion des Benutzers eine Information über eine vom Benutzer aus den präsentierten Antworten ausgewählte Antwort an die Vielzahl der Agenten 10.
  • Beispielsweise überträgt die Übertragungseinheit 54 als Information über die vom Benutzer ausgewählte Antwort den Inhalt der vom Benutzer ausgewählten Antwort, die Identifikationsinformation des Agenten 10, der die vom Benutzer ausgewählte Antwort generiert hat, oder dergleichen, an die Vielzahl von Agenten 10.
  • Außerdem kann die Übertragungseinheit 54 als Reaktion des Benutzers Informationen, die angeben, dass keine der präsentierten Antworten vom Benutzer ausgewählt wurde, an die Vielzahl der Agenten 10 übertragen.
  • Außerdem kann die Übertragungseinheit 54 den Inhalt der Antworten an die Vielzahl von Agenten 10 übertragen, zusammen mit Informationen, die angeben, dass keine der präsentierten Antworten vom Benutzer ausgewählt wurde. Dies ermöglicht es der Übertragungseinheit 54, den Inhalt der von dem Benutzer ausgewählten Antwort oder den Inhalt der vom Benutzer nicht ausgewählten Antwort an die jeweiligen Agenten 10 zu übertragen, was ein effizientes Lernen der Agenten 10 ermöglicht.
  • Beachten Sie, dass die Übertragungseinheit 54 nicht nur die Reaktion des Benutzers, sondern auch verschiedene Informationen, wie z. B. einen Befehl und die Aufforderung zur Ausgabe der Antwort, die von der Präsentationseinheit 50 generiert werden, an den Agenten 10 überträgt. Beispielsweise kann die Übertragungseinheit 54, wenn sie den bestimmten Befehl von dem Benutzer empfängt, die dem bestimmten Befehl entsprechende Anforderung (z. B. die Anforderung der zusätzlichen Suche in Bezug auf die Eingabeinformationen, basierend auf dem bestimmten Befehl usw.) an den Agenten 10 übertragen.
  • Die Ausgabeeinheit 60 ist ein Mechanismus zum Ausgeben verschiedener Informationen. Die Ausgabeeinheit 60 kann beispielsweise ein Lautsprecher oder ein Display sein. Wenn beispielsweise die Antwort von der Ausgabesteuereinheit 53 ausgegeben wird, gibt die Ausgabeeinheit 60 den Namen oder dergleichen eines Agenten 10, der das Ausgabeziel ist, an den Benutzer per Sprache aus. Außerdem kann die Ausgabeeinheit 60 Bilddaten auf dem Display ausgeben. Außerdem, wenn die Antwortverarbeitungsvorrichtung 100 die Antwort selbst generiert, gibt die Ausgabeeinheit 60 die generierte Antwort per Sprache, als Bild oder dergleichen aus. Beachten Sie, dass die Ausgabeeinheit 60 die Antwort in verschiedenen Formen ausgeben kann, wie z. B. durch Anzeigen von Zeichen, die durch Zeichenerkennung der generierten Sprachdaten erhalten wurden, auf dem Display.
  • [1-5. Verfahren des Antwortprozesses gemäß der ersten Ausführungsform]
  • Als nächstes wird ein Verfahren des Antwortprozesses gemäß der ersten Ausführungsform unter Bezugnahme auf 12A und 12B beschrieben. 12A ist ein Flussdiagramm, das den Prozess gemäß der ersten Ausführungsform darstellt.
  • Wie in 12A dargestellt, bestimmt die Antwortverarbeitungsvorrichtung 100, ob die Eingabeinformationen empfangen werden (Schritt S101). Falls keine Eingabeinformationen empfangen werden (Schritt S101; Nein), wartet die Antwortverarbeitungsvorrichtung 100 auf den Empfang der Eingabeinformationen.
  • Falls die Eingabeinformationen empfangen werden (Schritt S101; Ja), analysiert die Antwortverarbeitungsvorrichtung 100 unterdessen die Eingabeinformationen und generiert den Befehl gemäß den Eingabeinformationen (Schritt S102). Insbesondere analysiert die Antwortverarbeitungsvorrichtung 100 die Eingabeinformationen und generiert den Befehl, der die Absicht des Benutzers, den Inhalt der Frage und dergleichen angibt, die in den Eingabeinformationen enthalten sind.
  • Anschließend bestimmt die Antwortverarbeitungsvorrichtung 100, ob der generierte Befehl mit dem bestimmten Befehl übereinstimmt (Schritt S103). Falls der generierte Befehl nicht der bestimmte Befehl ist (Schritt S103; Nein), sendet die Antwortverarbeitungsvorrichtung 100 den in Schritt S102 generierten Befehl an jeden Agenten 10 (Schritt S104).
  • Dann erfasst die Antwortverarbeitungsvorrichtung 100 ein Ergebnis der von jedem Agenten 10 generierten Antwort gemäß dem übertragenen Befehl (Schritt S105). Dabei speichert die Antwortverarbeitungsvorrichtung 100 das von jedem Agenten 10 generierte Ergebnis vorübergehend in der Speichereinheit 30 (Schritt S106).
  • Beachten Sie, dass, falls der generierte Befehl dem bestimmten Befehl in Schritt S103 entspricht (Schritt S103; Ja), die Antwortverarbeitungsvorrichtung 100 den Inhalt des bestimmten Befehls bestimmt (Schritt S107).
  • Anschließend führt die Antwortverarbeitungsvorrichtung 100 die Verarbeitung des bestimmten Befehls für das in Schritt S106 oder dergleichen gespeicherte Ergebnis durch (Schritt S108). Außerdem überträgt die Antwortverarbeitungsvorrichtung 100 die Rückmeldung an jeden Agenten 10 (Schritt S109).
  • Nach Schritt S106 oder Schritt S109 generiert die Antwortverarbeitungsvorrichtung 100 die Rückmeldung an den Benutzer (Schritt S110). Beispielsweise generiert die Antwortverarbeitungsvorrichtung 100 die Rückmeldung für die Präsentation jeder von jedem Agenten 10 generierten Antwort nach Schritt S106. Alternativ generiert die Antwortverarbeitungsvorrichtung 100 nach Schritt S109 die Rückmeldung, z. B. in Form von Sprache, um zu übertragen, dass die Antwort von welchem Agenten 10 ausgegeben werden soll.
  • Anschließend empfängt die Antwortverarbeitungsvorrichtung 100 beispielsweise eine Auswahl von dem Benutzer oder dergleichen und bestimmt eine Ausgabeform der Antwort (Schritt S111). Beachten Sie, dass die Ausgabeform der Antwort den Inhalt einer tatsächlichen Ausgabe repräsentiert, zum Beispiel, welche Antwort ausgegeben werden soll oder von welchem Agenten 10 die Antwort ausgegeben werden soll.
  • Anschließend gibt die Antwortverarbeitungsvorrichtung 100 die Antwort aus (Schritt S112). Beispielsweise steuert die Antwortverarbeitungsvorrichtung 100 den Agenten 10, der die Antwort generiert hat, um die Antwort auszugeben, oder sie gibt die Antwort von der Antwortverarbeitungsvorrichtung 100 aus.
  • Dabei überträgt die Antwortverarbeitungsvorrichtung 100 die Rückmeldung an jeden Agenten 10 über den Ausgabeinhalt oder dergleichen (Schritt S113). Dann bestimmt die Antwortverarbeitungsvorrichtung 100, die die Antwort an den Benutzer ausgegeben hat, ob der Gesprächsprozess mit dem Benutzer beendet ist (Schritt S114). Insbesondere bestimmt die Antwortverarbeitungsvorrichtung 100, ob eine Sitzung im Zusammenhang mit dem Gespräch mit dem Benutzer beendet ist.
  • Falls der Gesprächsprozess nicht beendet ist (Schritt S114; Nein), kehrt die Antwortverarbeitungsvorrichtung 100 zu Schritt S101 zurück und setzt den Gesprächsprozess fort. Falls andererseits bestimmt wird, dass der Gesprächsprozess beendet ist (Schritt S114; Ja), beendet die Antwortverarbeitungsvorrichtung 100 den Prozess.
  • Als Nächstes wird das Verfahren des Antwortprozesses gemäß der ersten Ausführungsform unter Bezugnahme auf 12B beschrieben, die ein Prozessblockdiagramm darstellt. 12B ist das Blockdiagramm, das den Prozess gemäß der ersten Ausführungsform darstellt.
  • Ein Anzeige-Eingabeprozess 111 ist dazu ausgelegt, die Eingabe eines Benutzers über das Display oder dergleichen der Antwortverarbeitungsvorrichtung 100 zu verarbeiten. Insbesondere werden im Anzeige-Eingabeprozess 111 die Eingabeinformationen über eine auf dem Touchpanel-Display angezeigte Benutzeroberfläche oder dergleichen an einen Prozess zur Generierung von Befehlen 115 übertragen. Der Anzeige-Eingabeprozess 111 entspricht beispielsweise dem in 7 dargestellten Bildeingabesensor 20B, der Erkennungseinheit 41 und dergleichen.
  • Ein Spracheingabeprozess 112 ist dazu ausgelegt, einen Prozess der Umwandlung einer Eingabe der Sprache des Benutzers in Zeicheninformationen (Text) durchzuführen. Der Spracheingabeprozess 112 kann eine Signalverarbeitungsfunktion zur Reduzierung externer Umgebungsgeräusche wie z. B. Rauschen aufweisen. Der Spracheingabeprozess 112 überträgt die Eingabeinformationen an einen Benutzereingabe-Analyseprozess 114. Der Spracheingabeprozess 112 entspricht beispielsweise dem in 7 dargestellten Spracheingabesensor 20A, der Erkennungseinheit 41 und dergleichen.
  • Eine Halteeinheit für bestimmte Befehlsdaten 113 ist ein Teil, der den Typ des bestimmten Befehls und eine entsprechende Zeichenkette in Verbindung miteinander hält. Beachten Sie, dass die Typen des bestimmten Befehls und der Zeichenkette so ausgelegt sind, dass sie von dem Benutzer bearbeitet werden können. Die Halteeinheit 113 für bestimmte Befehlsdaten entspricht beispielsweise der in 7 dargestellten Befehlstabelle 33.
  • In dem Benutzereingabe-Analyseprozess 114 wird bestimmt, ob die Eingabe von dem Benutzer dem bestimmten Befehl entspricht, wobei auf die Halteeinheit 113 für die bestimmten Befehlsdaten Bezug genommen wird. Wie oben beschrieben, weisen die Arten der bestimmten Befehle insbesondere „das Ergebnis von einem bestimmten Agenten 10 empfangen“ oder „das Ergebnis von einem anderen Agenten 10 hören“ auf. Mit anderen Worten, im Benutzereingabe-Analyseprozess 114 wird die Sprache des Benutzers und dergleichen analysiert, um zu bestimmen, ob diese Sprachen mit dem bestimmten Befehl übereinstimmen. Beachten Sie, dass im Benutzereingabe-Analyseprozess 114, wenn die empfangene Eingabe nicht dem bestimmten Befehl entspricht, zusammen mit den Eingabeinformationen (Text usw.) übertragen wird, dass kein bestimmter Befehl vorhanden ist (leeres Befehlsanalyseergebnis), und zwar an den Prozess der Befehlsgenerierung 115. Der Benutzereingabe-Analyseprozess 114 entspricht den Prozessen, die beispielsweise von der in 7 dargestellten Präsentationseinheit 50 und der Analyseeinheit 51 durchgeführt werden.
  • In dem Prozess der Befehlsgenerierung 115 wird der an jeden Agent 10 zu übertragende Befehl auf der Basis der vom Benutzer eingegebenen Informationen oder des im Benutzereingabe-Analyseprozess 114 analysierten Befehlsanalyseergebnisses generiert. Beachten Sie, dass der im Befehlsgenerierungsprozess 115 generierte Befehl auch an eine Befehlshistorie-Halteeinheit 117 übertragen und als Historie gehalten wird. Der Befehlsgenerierungsprozess 115 entspricht den Prozessen, die beispielsweise von der in 7 dargestellten Präsentationseinheit 50 und der Erzeugungseinheit 52 durchgeführt werden.
  • Ein Kommunikationsprozess 116 ist so ausgelegt, dass er den durch den Befehlsgenerierungsprozess 115 generierten Befehl in einen Befehl umwandelt, der ein Format hat, das mit einem Datenformat jedes an die Antwortverarbeitungsvorrichtung 100 angeschlossenen Agenten 10 übereinstimmt, und die nach der Umwandlung erhaltenen Informationen überträgt. Dann wird im Kommunikationsprozess 116 die Ergebnisausgabe von jedem Agenten 10 erhalten und das Ergebnis an einen Ergebnisverwaltungsprozess 118 übertragen. Dabei wird im Kommunikationsprozess 116 die erfasste Antwort in ein gemeinsames Format für die Ergebnisspeicherung umgewandelt und festgehalten, um zu zeigen, welche Art von Ergebnis mit welchem Agenten 10 verbunden ist.
  • Außerdem wird im Kommunikationsprozess 116, wenn der bestimmte Befehl erhalten wurde, der bestimmte Befehl an den Ergebnisverwaltungsprozess 118 übertragen. Außerdem werden im Kommunikationsprozess 116 die im Ergebnisverwaltungsprozess 118 verwalteten Informationen erfasst und der Inhalt der Informationen als Rückmeldung an jeden Agenten 10 übertragen. Diese Rückmeldung wirkt als positive Belohnung (positives Beispiel) oder negative Belohnung (negatives Beispiel), für jeden Agenten 10. Der Kommunikationsprozess 116 entspricht den Prozessen, die beispielsweise von der in 7 dargestellten Präsentationseinheit 50, der Ausgabesteuereinheit 53 und der Übertragungseinheit 54 durchgeführt werden.
  • Die Befehlshistorie-Halteeinheit 117 hält die im Befehlsgenerierungsprozess 115 erteilten Befehle in Zeitreihen fest. Beachten Sie, dass die Befehlshistorie-Halteeinheit 117 auch den Inhalt der empfangenen Befehle, die Häufigkeit der Ausgabe der Befehle oder dergleichen berechnen und festhalten kann. Die Befehlshistorie-Halteeinheit 117 entspricht beispielsweise der Benutzerinformationstabelle 31 und der Historietabelle 34.
  • Im Ergebnisverwaltungsprozess 118 wird das von jedem Agenten 10 erhaltene Ergebnis festgehalten und verwaltet. Mit anderen Worten, die durch das Gespräch mit dem Benutzer erhaltenen Informationen werden für eine bestimmte Zeit festgehalten und gemäß dem danach empfangenen bestimmten Befehl an einen Rückmeldungserzeugungsprozess 119 oder den Kommunikationsprozess 116 übertragen. Beachten Sie, dass nach Ablauf einer vorbestimmten Zeit das gehaltene Ergebnis entsprechend verworfen wird. Der Ergebnisverwaltungsprozess 118 entspricht den Prozessen, die beispielsweise von der in 7 dargestellten Präsentationseinheit 50, der Erzeugungseinheit 52 und der Übertragungseinheit 54 durchgeführt werden.
  • Im Rückmeldungserzeugungsprozess 119 wird der Inhalt der Rückmeldung an den Benutzer auf der Basis der im Ergebnisverwaltungsprozess 118 gehaltenen Informationen und der in der Befehlshistorie-Halteeinheit 117 gehaltenen Informationen über die Häufigkeit generiert. Beispielsweise kann im Rückmeldungserzeugungsprozess 119 bestimmt werden, dass das Ergebnis eines häufig verwendeten Agenten 10 bevorzugt ausgegeben wird, oder das Ergebnis kann jedes Mal wahllos ausgegeben werden. Außerdem kann der Benutzer solche Ausgabeeinstellungen gegebenenfalls bearbeiten. Außerdem kann der Rückmeldungserzeugungsprozess 119 bei der Ausgabe von Sprache oder, wenn der im Ergebnisverwaltungsprozess 118 gespeicherte Inhalt lang ist (Ergebnis eines Nachrichtenartikels usw.), den Inhalt zusammenfassen. Der Rückmeldungserzeugungsprozess 119 entspricht den Prozessen, die beispielsweise von der in 7 dargestellten Präsentationseinheit 50 und der Übertragungseinheit 54 durchgeführt werden.
  • Ein Anzeigeausgabeprozess 120 ist dazu ausgelegt, alle vom Agenten 10 ausgegebenen Ergebnisse, die im Rückmeldungserzeugungsprozess 119 generiert wurden, oder einen daraus ausgewählten Kandidaten zu formen und auf dem Display anzuzeigen. Der Anzeigeausgabeprozess 120 entspricht den Prozessen, die beispielsweise von der Ausgabesteuereinheit 53 und der in 7 dargestellten Ausgabeeinheit 60 durchgeführt werden.
  • Ein Sprachausgabeprozess 121 ist so ausgelegt, dass er aus allen vom Agenten 10 ausgegebenen Ergebnissen, die im Rückmeldungserzeugungsprozess 119 erzeugt wurden, oder dem daraus ausgewählten Kandidaten Sprachdaten generiert und diese von einer Vorrichtung wie dem Lautsprecher wiedergibt. Der Sprachausgabeprozess 121 entspricht dem Prozess, der beispielsweise von der in 7 dargestellten Ausgabesteuereinheit 53 und der Ausgabeeinheit 60 durchgeführt wird.
  • Beachten Sie, dass es sich bei den oben beschriebenen Prozessen um ein Beispiel handelt, und dass beispielsweise je nach Konfiguration der Antwortverarbeitungsvorrichtung 100 gegebenenfalls andere Prozesse durchgeführt werden können. Beispielsweise unterscheiden sich die Eingabe- und Ausgabeprozesse je nach Anwendung oder Dienst, so dass die Antwortverarbeitungsvorrichtung 100 nicht notwendigerweise beides, die Ausgabe auf dem Display und die Ausgabe der Sprache, durchführen muss.
  • [1-6. Modifikation der ersten Ausführungsform]
  • Der Antwortprozess gemäß der oben beschriebenen ersten Ausführungsform kann verschiedene Modifikationen aufweisen. Eine Modifikation der ersten Ausführungsform wird nachstehend beschrieben.
  • Beispielsweise kann die Antwortverarbeitungsvorrichtung 100 die in der Agententabelle 32 oder in der Befehlstabelle 33 gespeicherten Informationen periodisch aktualisieren. In einigen Fällen wird beispielsweise die Funktion eines Agenten 10 über ein Netzwerk erweitert. Insbesondere wird in einigen Fällen ein Agent 10 mit einer „Übersetzungs“-Funktion aktualisiert, um beispielsweise eine Sprache zu unterstützen, die zuvor nicht unterstützt wurde.
  • In diesem Fall empfängt die Antwortverarbeitungsvorrichtung 100 vom Agenten 10 in Zusammenarbeit mit der Antwortverarbeitungsvorrichtung 100 Informationen, die angeben, dass die Aktualisierung durchgeführt wurde, und aktualisiert die in der Agententabelle 32 oder der Befehlstabelle 33 gespeicherten Informationen auf der Basis der empfangenen Informationen. Dadurch kann der Benutzer in den Genuss der neuesten Funktionen kommen, ohne Rücksicht auf das Aktualisieren oder dergleichen der Funktionen der Vielzahl von Agenten 10 zu nehmen.
  • (2. Zweite Ausführungsform)
  • [2-1. Beispiel des Antwortprozesses gemäß der zweiten Ausführungsform]
  • Als Nächstes wird eine zweite Ausführungsform beschrieben. In dem Beispiel gemäß der ersten Ausführungsform gibt die Antwortverarbeitungsvorrichtung 100 die Ergebnisse oder dergleichen der Antwort hauptsächlich per Sprache aus. In einem Beispiel gemäß der zweiten Ausführungsform gibt die Antwortverarbeitungsvorrichtung 100 ein Ergebnis oder dergleichen einer Antwort an den Benutzer aus, indem sie andere Mittel als Sprache verwendet.
  • 13 ist ein Diagramm, das ein Beispiel eines Antwortprozesses gemäß der zweiten Ausführungsform darstellt. 13 stellt das Beispiel dar, bei dem der Benutzer Eingabeinformationen unter Verwendung des Displays der Antwortverarbeitungsvorrichtung 100 anstelle von Sprache eingibt, und die Antwortverarbeitungsvorrichtung 100 die Antwort unter Verwendung des Displays anstelle von Sprache präsentiert.
  • Der Benutzer gibt die Eingabeinformationen zunächst über das Touchpanel oder dergleichen der Antwortverarbeitungsvorrichtung 100 in die Antwortverarbeitungsvorrichtung 100 ein. Die in 13 dargestellte Eingabeinformation A81 zeigt, dass der Benutzer einen Text wie „Ich möchte „Sotsugyo“ hören‟ auf dem Display der Antwortverarbeitungsvorrichtung 100 eingegeben hat.
  • Der Benutzer gibt die Eingabeinformationen A81 über eine Eingabeoperation oder dergleichen auf dem Display in die Antwortverarbeitungsvorrichtung 100 ein (Schritt S81). Wie in der ersten Ausführungsform sendet die Antwortverarbeitungsvorrichtung 100 auf der Basis der Eingabeinformationen A81 (Schritt S82) eine Aufforderung an jeden Agenten 10 zur Generierung der Antwort.
  • Die Antwortverarbeitungsvorrichtung 100 generiert eine Rückmeldung A82, die dem Benutzer zu präsentieren ist, auf der Basis der von jedem Agenten 10 erhaltenen Antwort (Schritt S83). Die Rückmeldung A82 wird beispielsweise auf dem Display der Antwortverarbeitungsvorrichtung 100 angezeigt. Wie in 13 dargestellt, weist die Rückmeldung A82 Benutzeroberflächen auf, wie z. B. Schaltflächen zur Abfrage des Inhalts der von den einzelnen Agenten 10 generierten Antwort oder zur Anforderung einer zusätzlichen Suche.
  • Wie oben beschrieben, kann die Antwortverarbeitungsvorrichtung 100 gemäß der zweiten Ausführungsform dem Benutzer den Inhalt der Antwort präsentieren, indem sie eine Bildschirmanzeige verwendet, die den Inhalt jeder der von der Vielzahl der Agenten 10 generierten Antworten für die Eingabeinformationen enthält. Dies ermöglicht es der Antwortverarbeitungsvorrichtung 100, beispielsweise Informationen gemäß der Situation des Benutzers flexibel zu präsentieren.
  • [2-2. Variationen des Antwortprozesses gemäß der zweiten Ausführungsform]
  • Als nächstes wird ein Variationen der Antwortverarbeitung gemäß der zweiten Ausführungsform unter Bezugnahme auf 14 und 15 beschrieben. 14 ist ein Diagramm, das eine erste Variation des Antwortprozesses gemäß der zweiten Ausführungsform darstellt. Die erste Variante der Informationsverarbeitung gemäß der zweiten Ausführungsform zeigt eine Situation, bei der beispielsweise die von der Antwortverarbeitungsvorrichtung 100 angezeigten Antworten im Anzeigeverhältnis auf der Basis einer vorgegebenen Bedingung veränderbar sind.
  • 14 stellt ein Beispiel dar, bei dem der Benutzer beispielsweise als Eingabeinformation A91 eine Frage wie „Wie ist das Wetter morgen?“ eingibt (Schritt S91). Beim Empfangen der Eingabeinformation A91 überträgt die Antwortverarbeitungsvorrichtung 100 einen der Eingabeinformation A91 entsprechenden Befehl an jeden Agenten 10 und erfasst das Ergebnis jeder Antwort (Schritt S92) .
  • Hierbei greifen die jeweiligen Agenten 10 auf unterschiedliche Dienste (in diesem Beispiel Wetterinformationsdienste) zu, um Informationen zu erhalten, und es wird angenommen, dass die jeweiligen Agenten 10 unterschiedliche Antworten generieren. Die Antwortverarbeitungsvorrichtung 100 erfasst diese Antworten und generiert eine Rückmeldung A92, bei der die jeweiligen Antworten angezeigt werden (Schritt S93).
  • Wie in 14 dargestellt, enthält die Rückmeldung A92 Folgendes: Wetterinformationen A93, die eine von dem Agenten 10A generierte Antwort repräsentieren, Wetterinformationen A94, die eine von dem Agenten 10B generierte Antwort repräsentieren, Wetterinformationen A95, die eine von dem Agenten 10C generierte Antwort repräsentieren, und Wetterinformationen A96, die eine von dem Agenten 10D generierte Antwort repräsentieren.
  • Dies ermöglicht es der Antwortverarbeitungsvorrichtung 100, eine Liste der von den jeweiligen Agenten 10 generierten Antworten anzuzeigen, und somit können die Ergebnisse effizient präsentiert werden.
  • Außerdem kann die Antwortverarbeitungsvorrichtung 100 das Verhältnis der in der Rückmeldung A92 angezeigten Antworten auf der Basis von Informationen über jeden Agenten 10 oder von Informationen über jede Antwort ändern.
  • In einem Beispiel bestimmt die Antwortverarbeitungsvorrichtung 100 ein Bildschirm-Anzeigeverhältnis oder einen Bereich des Inhalts jeder Antwort, die von jedem der Vielzahl von Agenten 10 für die Eingabeinformationen generiert wird, auf der Basis einer Historie, die die von der Vielzahl von Agenten 10 generierten Antworten anzeigt, die vom Benutzer in der Vergangenheit ausgewählt wurden.
  • Beispielsweise kann die Antwortverarbeitungsvorrichtung 100 einen Anzeigebereich auf dem Bildschirm gemäß der Häufigkeit oder Rate der Auswahl eines Agenten 10 durch den Benutzer in der Vergangenheit vergrößern. Dies ermöglicht es der Antwortverarbeitungsvorrichtung 100, Anzeigeinformationen, die der Benutzer bevorzugt, weitgehend anzuzeigen.
  • Außerdem kann die Antwortverarbeitungsvorrichtung 100 das Bildschirm-Anzeigeverhältnis oder den Bereich des Inhalts jeder Antwort bestimmen, gemäß der Informationsmenge jeder der Antworten, die von der Vielzahl der Agenten 10 für die Eingabeinformationen generiert wurden.
  • Der obige Inhalt wird unter Bezugnahme auf 15 beschrieben. 15 ist eine Tabelle, die ein Beispiel einer Datenbank 35 gemäß der zweiten Ausführungsform darstellt. Die Datenbank 35 ist eine Datenbank, die den Inhalt (die Informationsmenge) der von den einzelnen Agenten 10 erfassten Wetterinformationen und die Informationen des Benutzers über die vergangene Auswahlhistorie in Verbindung miteinander speichert.
  • Wie oben beschrieben, beziehen der Agent 10A, der Agent 10B, der Agent 10C und der Agent 10D Informationen von verschiedenen Diensten, und dadurch unterscheiden sich die an die Antwortverarbeitungsvorrichtung 100 übertragenen Informationen trotz gleicher Wetterinformationen. Mit anderen Worten, die Antwortverarbeitungsvorrichtung 100 erhält unterschiedliche Antworten (Wetterinformationen) von dem Agenten 10A, dem Agenten 10B, dem Agenten 10C und dem Agenten 10D.
  • Beispielsweise zeigt die in 15 dargestellte Datenbank 35 Informationen, die in den Antworten enthalten sind, die von der Antwortverarbeitungsvorrichtung 100 erfasst wurden. Insbesondere zeigt das in 15 dargestellte Beispiel, dass die von dem Agenten 10A erfassten Wetterinformationen an die „Bildschirm-Anzeige“ und die „Sprachausgabe“ anpassbar sind und Folgendes aufweisen: „Niederschlagswahrscheinlichkeit“ und „Polleninformationen“, jedoch keine „Ultraviolett-Informationen“. Außerdem sind die vom Agenten 10B erfassten Wetterinformationen an „Bildschirm-Anzeige“ und „Sprachausgabe“ anpassbar, weisen „Niederschlagswahrscheinlichkeit“ auf und schließen „Ultraviolett-Informationen“ und „Pollen-Informationen“ aus.
  • Mit anderen Worten, das in 15 dargestellte Beispiel zeigt, dass der Agent 10A, wenn die von dem Agenten 10 bereitgestellte Information beispielsweise „Wettervorhersage“ ist, auf den Dienst „J01“ zugreift und Informationen mit Inhalten wie „allgemeine Wetterlage, Niederschlagswahrscheinlichkeit, Bildausgabe, Sprachausgabe, Pollen,...“ erwirbt, um die Wettervorhersage durchzuführen (d. h. Informationen über die Wettervorhersage zu erwerben). Außerdem zeigt das Beispiel, dass die Historie des Benutzers bei der Auswahl der Antwort, die von dem Agenten 10A präsentiert wird, wenn der Benutzer die Antwortverarbeitungsvorrichtung 100 veranlasst, die Funktion der Wettervorhersage auszuführen, „L01“ ist.
  • Beachten Sie, dass in 15 die „Wettervorhersage“ als Beispiel für bereitzustellende Informationen gezeigt wird, die bereitzustellenden Informationen jedoch nicht auf dieses Beispiel beschränkt sind und beispielsweise auch „Verkehrsinformationen“, „Nachrichten“, „Restaurantsuche“, „Fernsehprogrammsuche“, „Filmsuche“, „Veranstaltungssuche“ und dergleichen bereitgestellt werden können.
  • Die Antwortverarbeitungsvorrichtung 100 erfasst in der Datenbank 35 Informationen von jedem Agenten 10 und generiert die Rückmeldung A92 auf der Basis von beispielsweise der Informationsmenge in der Antwort. Insbesondere erhöht die Antwortverarbeitungsvorrichtung 100 das Anzeigeverhältnis eines Agenten 10, der eine Antwort präsentiert, bei der die Wetterinformationen eine größere Menge an Informationen aufweisen. Alternativ kann die Antwortverarbeitungsvorrichtung 100 das Anzeigeverhältnis eines Agenten 10 erhöhen, der in der Vergangenheit bereits mehrfach von dem Benutzer ausgewählt wurde.
  • Wenn beispielsweise, wie in 14 dargestellt, die Antworten zu den Wetterinformationen von der Vielzahl der Agenten 10 generiert werden, präsentiert die Antwortverarbeitungsvorrichtung 100 eine Antwort mit einer größeren Menge an Informationen in größerer Breite auf dem Bildschirm. Wenn sich die Antwortverarbeitungsvorrichtung 100 auf eine Historie der Konversation mit dem Benutzer bezieht und die Historie zeigt, dass der Benutzer mehr „Polleninformationen“ als „Ultraviolettinformationen“ angefordert hat, kann die Antwortverarbeitungsvorrichtung 100 alternativ Wetterinformationen einschließlich der Art der „Polleninformationen“ breiter auf dem Bildschirm präsentieren. Mit anderen Worten, wenn die Antwortverarbeitungsvorrichtung 100 über eine Vielzahl von Antworten verfügt, bestimmt die Antwortverarbeitungsvorrichtung 100 flexibel die Form der Antworten, die tatsächlich an den Benutzer ausgegeben werden, gemäß der Menge oder Art der Informationen jeder Antwort oder der Historie oder Situation des Benutzers in der Vergangenheit. Dies ermöglicht es der Antwortverarbeitungsvorrichtung 100, die Antwort auszugeben, die der Anforderung des Benutzers mehr entspricht. Außerdem ist die Antwortverarbeitungsvorrichtung 100 so ausgelegt, dass sie die von einer Vielzahl von Agenten 10 erfassten Antworten durch dynamisches Ändern des Anzeigeverhältnisses präsentiert und so eine visuell nicht ermüdende Bildschirmdarstellung ermöglicht.
  • Als Nächstes werden Variationen des Antwortprozesses gemäß der zweiten Ausführungsform unter Bezugnahme auf 16A und 16B beschrieben. 16A ist ein Diagramm, das eine zweite Variation des Antwortprozesses gemäß der zweiten Ausführungsform darstellt.
  • Beispielsweise stellt 16A eine Situation dar, bei der der Benutzer Eingabeinformationen A101 basierend auf der Sprache, wie „Zeige mir die Nachrichten“, in die Antwortverarbeitungsvorrichtung 100 eingibt. In diesem Fall generiert die Antwortverarbeitungsvorrichtung 100 einen Befehl, der der Sprache entspricht, wie z. B. „Zeige mir die Nachrichten“, überträgt den Befehl an jeden Agenten 10 und erfasst eine Antwort von jedem Agenten 10. Dann präsentiert die Antwortverarbeitungsvorrichtung 100 dem Benutzer die Antwort von jedem Agenten 10 als Rückmeldung A102. Dann, wenn der Benutzer einen bestimmten Befehl A103 ausgibt, wie z. B. „Agent 10B, bitte“, gibt die Antwortverarbeitungsvorrichtung 100 eine Sprachausgabe A104 aus, wie z. B. „Ich werde Agent 10B veranlassen, das auszuführen“, und veranlasst den Agenten 10B, den Inhalt der vom Agenten 10B vorgeschlagenen Antwort auszuführen.
  • Auf diese Weise ist die Antwortverarbeitungsvorrichtung 100 so ausgelegt, dass sie dem Benutzer verschiedene, von jedem Agenten 10 auszuführende Prozesse auf der Basis von nur einem Stück der vom Benutzer empfangenen Eingabeinformationen A101 präsentiert. Daher kann der Benutzer beispielsweise, wenn es sich bei den Agenten 10 um verschiedene Haushaltsgeräte handelt, einen der Agenten 10 veranlassen, den vom Benutzer gewünschten Prozess ohne Eingabe des Befehls an ein bestimmtes Haushaltsgerät auszuführen.
  • Als Nächstes wird ein Beispiel von 16B beschrieben. 16B ist ein Diagramm, das eine dritte Variation des Antwortprozesses gemäß der zweiten Ausführungsform darstellt.
  • Beispielsweise stellt 16B eine Situation dar, bei der der Benutzer Eingabeinformationen A111 basierend auf der Sprache, wie „Es ist heiß“, in die Antwortverarbeitungsvorrichtung 100 eingibt. In diesem Fall generiert die Antwortverarbeitungsvorrichtung 100 einen Befehl, der der Sprache entspricht, wie z. B. „Es ist heiß“, überträgt den Befehl an jeden Agenten 10 und erfasst eine Antwort von jedem Agenten 10. Dann präsentiert die Antwortverarbeitungsvorrichtung 100 dem Benutzer die Antwort von jedem Agenten 10 als Rückmeldung A112. Dann, wenn der Benutzer einen bestimmten Befehl A113 ausgibt, wie z. B. „Agent 10B, bitte“, gibt die Antwortverarbeitungsvorrichtung 100 eine Sprachausgabe A114 aus, wie z. B. „Ich werde Agent 10B veranlassen, das auszuführen“, und veranlasst den Agenten 10B, den Inhalt der vom Agenten 10B vorgeschlagenen Antwort auszuführen.
  • Auch in diesem Fall, wie in dem Beispiel von 16A, ist die Antwortverarbeitungsvorrichtung 100 so ausgelegt, dass sie dem Benutzer verschiedene, von jedem Agenten 10 auszuführende Prozesse auf der Basis von nur einem Stück der vom Benutzer empfangenen Eingabeinformationen A111 präsentiert. Daher kann der Benutzer effizient einen vom Benutzer gewünschten Prozess auswählen.
  • Beachten Sie, dass die Antwortverarbeitungsvorrichtung 100 zusätzlich zu den in 16A und 16B dargestellten Informationsvorrichtungen die Verarbeitung in Zusammenarbeit mit einem so genannten intelligenten Haushaltsgerät durchführen kann. Wenn die Antwortverarbeitungsvorrichtung 100 beispielsweise die Eingabeinformationen wie „Welche Lebensmittel sind enthalten?“ oder „Welche Lebensmittel werden wahrscheinlich verderben?“ von dem Benutzer erhält, sendet die Antwortverarbeitungsvorrichtung 100 den Befehl an einen Agenten 10, der an einem Kühlschrank angebracht ist. Dann präsentiert die Antwortverarbeitungsvorrichtung 100 dem Benutzer als Antwort des Agenten 10 Informationen, die aus einem Protokoll gewonnen wurden, das die Verwendung durch den Benutzer, das Produktkennzeichen oder ähnliches anzeigt. Wenn die Antwortverarbeitungsvorrichtung 100 die Eingabeinformationen wie „Habe ich die Tür verriegelt?“ oder „Bitte verriegele die Tür“ von dem Benutzer empfängt, sendet die Antwortverarbeitungsvorrichtung 100 den Befehl an einen Agenten 10, der an einem intelligenten Schlüssel angebracht ist. Dann präsentiert die Antwortverarbeitungsvorrichtung 100 dem Benutzer eine Antwort, wie z. B. Informationen über einen Verriegelungszustand der Wohnung oder das Verriegeln der Tür, als Antwort des Agenten 10. Alternativ dazu, wenn die Antwortverarbeitungsvorrichtung 100 die Eingabeinformation wie „Schalte das Licht im Wohnzimmer ein“ oder „Schalte das Licht im Schlafzimmer ein“ von dem Benutzer empfängt, überträgt die Antwortverarbeitungsvorrichtung 100 den Befehl an einen Agenten 10, der an einer Lampe angebracht ist. Dann präsentiert die Antwortverarbeitungsvorrichtung 100 dem Benutzer eine Antwort, wie z. B. das Einschalten des Lichts im Haus, als Antwort des Agenten 10. Auf diese Weise ist die Antwortverarbeitungsvorrichtung 100 in der Lage, den für den Benutzer nützlichen Antwortprozess nicht nur in Zusammenarbeit mit der Informationsvorrichtung wie dem intelligenten Lautsprecher, sondern auch mit verschiedenen Informationsvorrichtungen durchzuführen.
  • (3. Andere Ausführungsformen)
  • Die Prozesse gemäß den oben beschriebenen Ausführungsformen können in verschiedenen anderen Formen als in den oben beschriebenen Ausführungsformen ausgeführt werden.
  • [3-1. Variation der Antwortausgabe]
  • Wenn beispielsweise alle Agenten 10, die miteinander kooperieren, Antworten mit demselben Inhalt generieren, kann die Antwortverarbeitungsvorrichtung 100 jeden der Agenten 10 veranlassen, die Antwort auszugeben, ohne die Antworten dem Benutzer zu präsentieren.
  • [3-2. Zeitpunkt zum Übertragen der Reaktion des Benutzers]
  • Die Antwortverarbeitungsvorrichtung 100 kann die Reaktion des Benutzers nach einer vorbestimmten Zeitspanne übermitteln, ohne die Reaktion des Benutzers sofort an die Agenten 10 zu übermitteln, nachdem der Benutzer eine beliebige aus einer Vielzahl von präsentierten Antworten ausgewählt hat.
  • Mit anderen Worten, die Antwortverarbeitungsvorrichtung 100 bestimmt, ob der Benutzer eine Dienstleistung genießt, wartet eine Zeitspanne, die lang genug ist, um anzunehmen, dass der Benutzer die Dienstleistung genießt, und überträgt dann die Reaktion des Benutzers an jeden Agenten 10. Dies ermöglicht es der Antwortverarbeitungsvorrichtung 100, Informationen über die von dem Benutzer ausgewählte Antwort genau an jeden Agenten 10 zurückzumelden, selbst wenn der Benutzer versehentlich eine Antwort auswählt oder selbst wenn der Benutzer tatsächlich eine andere Antwort wünscht. Beachten Sie, dass die Antwortverarbeitungsvorrichtung 100 eine Registrierung von dem Benutzer über den Zeitpunkt akzeptieren kann, zu dem die Rückmeldung an jeden Agenten 10 übertragen wird.
  • [3-3. Gerätekonfiguration]
  • Die oben beschriebenen Ausführungsformen zeigen das Beispiel, bei dem die Antwortverarbeitungsvorrichtung 100 ein so genanntes Smartphone- oder Tablet-Gerät ist und den Prozess in eigenständiger Weise durchführt. Die Antwortverarbeitungsvorrichtung 100 kann jedoch die Antwortverarbeitung gemäß der vorliegenden Offenbarung in Zusammenarbeit mit einer über ein Netzwerk angeschlossenen Servervorrichtung (so genannter Cloud-Server usw.) durchführen. In dieser Konfiguration fungiert das Endgerät, z. B. das Smartphone oder das Tablet, als Schnittstelle, die hauptsächlich einen Konversationsprozess mit dem Benutzer durchführt, wie z. B. einen Prozess zum Sammeln der Sprache des Benutzers, einen Prozess zum Übertragen der gesammelten Sprache an die Servervorrichtung und einen Prozess zum Ausgeben der von der Servervorrichtung übertragenen Sprache.
  • Außerdem kann die Antwortverarbeitungsvorrichtung gemäß der vorliegenden Offenbarung in Form eines IC-Chips oder dergleichen realisiert werden, der in die Smartphone- oder Tablet-Vorrichtung eingebaut ist, anstatt einer eigenständigen Vorrichtung.
  • Außerdem können von den in den obigen Ausführungsformen beschriebenen Prozessen alle oder ein Teil der Prozesse, die als automatisch durchführbar beschrieben sind, manuell durchgeführt werden, oder alle oder ein Teil des als manuell durchführbar beschriebenen Prozesses können automatisch durch ein bekanntes Verfahren durchgeführt werden. Außerdem können die Prozessverfahren, spezifischen Bezeichnungen und Informationen, die verschiedene Daten und Parameter enthalten, die in der obigen Beschreibung oder den Zeichnungen dargestellt sind, entsprechend geändert werden, sofern nicht anders angegeben. Beispielsweise sind verschiedene, in den Zeichnungen dargestellte, Informationen nicht auf die dargestellten Informationen beschränkt.
  • Außerdem sind die Komponentenelemente der Vorrichtungen als funktionale Konzepte dargestellt und müssen nicht unbedingt physikalisch ausgebildet sein, wie dargestellt. Mit anderen Worten, die spezifischen Formen der Verteilung oder Integration der Vorrichtungen sind nicht auf die dargestellten beschränkt, und alle oder Teile davon können funktional oder physikalisch verteilt oder in beliebige Einheiten integriert konfiguriert werden, gemäß verschiedenen Belastungen oder Nutzungsbedingungen. Beispielsweise können die Analyseeinheit 51 und die Erzeugungseinheit 52 miteinander integriert werden.
  • Außerdem können die oben beschriebenen Ausführungsformen und Modifikationen innerhalb eines Bereichs, der mit dem Inhalt des Prozesses übereinstimmt, in geeigneter Weise kombiniert werden.
  • Außerdem sind die hier beschriebenen Effekte nur Beispiele und nicht beschränkt, und es können auch andere Effekte bereitgestellt werden.
  • (4. Effekte der Antwortverarbeitungsvorrichtung gemäß der vorliegenden Offenbarung)
  • Wie oben beschrieben, umfasst die Antwortverarbeitungsvorrichtung (die Antwortverarbeitungsvorrichtung 100 in den Ausführungsformen) gemäß der vorliegenden Offenbarung die Empfangseinheit (die Empfangseinheit 40 in den Ausführungsformen), die Präsentationseinheit (die Präsentationseinheit 50 in den Ausführungsformen) und die Übertragungseinheit (die Übertragungseinheit 54 in den Ausführungsformen). Die Empfangseinheit empfängt die Eingabeinformationen, die Informationen sind, die die Generierung der Antwort durch jede Informationsvorrichtung (jeden Agenten 10 in den Ausführungsbeispielen) auslösen. Die Präsentationseinheit präsentiert dem Benutzer die von einer Vielzahl von Informationsvorrichtungen generierten Antworten auf die Eingabeinformationen. Die Übertragungseinheit überträgt die Reaktion des Benutzers auf die präsentierten Antworten an die Vielzahl der Informationsvorrichtungen.
  • Wie oben beschrieben, übernimmt die Antwortverarbeitungsvorrichtung gemäß der vorliegenden Offenbarung beispielsweise die Rolle der Vermittlung, verhält sich als Front-End-Gerät für die Vielzahl der Informationsvorrichtungen, präsentiert dem Benutzer eine Vielzahl der Antworten und überträgt ein vom Benutzer ausgewähltes Ergebnis an die Informationsvorrichtungen. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, den Aufwand für eine Konversation zwischen dem Benutzer und jeder der Vielzahl von Informationsvorrichtungen zu reduzieren, wenn der Benutzer die Vielzahl von Informationsvorrichtungen verwendet, und dadurch den Komfort des Benutzers zu verbessern.
  • Außerdem steuert die Präsentationseinheit eine Informationsvorrichtung, die eine vom Benutzer aus den präsentierten Antworten ausgewählte Antwort generiert hat, um die ausgewählte Antwort auszugeben. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, die vom Benutzer gewünschte Antwort zu steuern, die von der vom Benutzer ausgewählten Informationsvorrichtung ausgegeben wird.
  • Außerdem übernimmt die Präsentationseinheit die von dem Benutzer aus den präsentierten Antworten ausgewählte Antwort von der Informationsvorrichtung, die die ausgewählte Antwort generiert hat, und gibt die übernommene Antwort aus. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, die vom Benutzer gewünschte Antwort auszugeben, anstatt der Informationsvorrichtung, die beispielsweise an einer relativ weit vom Benutzer entfernten Position installiert ist, was den Komfort für den Benutzer erhöht.
  • Außerdem akzeptiert die Empfangseinheit nach der Ausgabe einer beliebigen der präsentierten Antworten einen Befehl des Benutzers, der die Änderung der auszugebenden Antwort angibt. Die Präsentationseinheit ändert die ausgegebene Antwort auf der Basis des Befehls in eine andere Antwort. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, dem Benutzer die unterschiedliche Antwort mit einer einfachen Operation zu präsentieren, ohne das erste Gespräch mit dem Benutzer zu wiederholen, was den Komfort für den Benutzer erhöht.
  • Außerdem präsentiert die Präsentationseinheit kollektiv die Antworten mit demselben Inhalt, wenn die von der Vielzahl der Informationsvorrichtungen generierten Antworten auf die Eingabeinformationen denselben Inhalt enthalten. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, eine Situation zu vermeiden, bei der die Antworten mit gleichem Inhalt mehrfach an den Benutzer ausgegeben werden.
  • Außerdem akzeptiert die Empfangseinheit den Befehl, der eine andere Antwort als die präsentierte Antwort vom Benutzer verlangt. Die Übertragungseinheit überträgt die Anforderung einer zusätzlichen Suche bezüglich der Eingabeinformationen auf der Basis des Befehls an die Vielzahl von Informationsvorrichtungen. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, die Informationsvorrichtungen zu veranlassen, die zusätzliche Suche schnell durchzuführen, selbst wenn die vom Benutzer gewünschte Antwort nicht generiert wird.
  • Außerdem gibt die Präsentationseinheit an den Benutzer eine Antwort aus, die aus den von der Vielzahl von Informationsvorrichtungen für die Eingabeinformationen generierten Antworten ausgewählt wird, auf der Basis der Historie, die die von der Vielzahl von Informationsvorrichtungen generierten Antworten anzeigt, die vom Benutzer in der Vergangenheit ausgewählt wurden. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, eine Antwort ohne explizite Auswahl durch den Benutzer auszugeben, wodurch sich der Aufwand für den Benutzer verringert.
  • Außerdem überträgt die Übertragungseinheit als Reaktion des Benutzers eine Information über eine vom Benutzer aus den präsentierten Antworten ausgewählte Antwort an die Vielzahl der Informationsvorrichtungen. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, eine Vielzahl von Positiv- und Negativbeispielen in einem einzigen Gespräch an die Vielzahl von Informationsvorrichtungen zu übertragen, was ein effizientes Lernen der Informationsvorrichtungen ermöglicht.
  • Außerdem überträgt die Übertragungseinheit als Information über eine von dem Benutzer ausgewählte Antwort den Inhalt der vom Benutzer ausgewählten Antwort oder die Identifikationsinformation der Informationsvorrichtung, die die vom Benutzer ausgewählte Antwort generiert hat, an die Vielzahl von Informationsvorrichtungen. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, den Informationsvorrichtungen bestimmte Informationen darüber bereitzustellen, welche Art von Antwort der Benutzer wünscht.
  • Außerdem überträgt die Übertragungseinheit als Reaktion des Benutzers eine Information an die Vielzahl der Informationsvorrichtungen, die angibt, dass keine der präsentierten Antworten von dem Benutzer ausgewählt wurde. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, Informationen, die der Benutzer nicht wünscht, kollektiv an die Informationsvorrichtungen zu übermitteln, wodurch eine Situation vermieden wird, bei der die vom Benutzer nicht gewünschten Informationen dem Benutzer mehrfach präsentiert werden.
  • Außerdem überträgt die Übertragungseinheit den Inhalt der Antworten an die Vielzahl von Informationsvorrichtungen zusammen mit Informationen, die angeben, dass keine der präsentierten Antworten vom Benutzer ausgewählt wurde. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, Informationen, die der Benutzer nicht wünscht, kollektiv an die Informationsvorrichtungen zu übermitteln, wodurch eine Situation vermieden wird, bei der die vom Benutzer nicht gewünschten Informationen dem Benutzer mehrfach präsentiert werden.
  • Außerdem führt die Präsentationseinheit eine Präsentation für den Benutzer durch, indem sie die Sprache verwendet, die den Inhalt der Antworten enthält, die für die Eingabeinformationen von der Vielzahl der Informationsvorrichtungen generiert wurden. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, dem Benutzer die Vielzahl der Antworten auf eine leicht verständliche Weise zu präsentieren.
  • Außerdem führt die Präsentationseinheit eine Präsentation für den Benutzer durch, indem sie die Bildschirmanzeigen verwendet, die den Inhalt der Antworten enthält, die für die Eingabeinformationen von der Vielzahl der Informationsvorrichtungen generiert wurden. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, dem Benutzer die Vielzahl der Antworten auf einmal zu präsentieren, ohne Sprache zu verwenden.
  • Außerdem bestimmt die Präsentationseinheit das Bildschirm-Anzeigeverhältnis oder den Bereich des Inhalts jeder Antwort, die von jeder der Vielzahl von Informationsvorrichtungen für die Eingabeinformationen generiert wird, auf der Basis der Historie, die die von der Vielzahl von Informationsvorrichtungen generierten Antworten anzeigt, die der Benutzer in der Vergangenheit ausgewählt hat. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, dem Benutzer die von dem Benutzer erwarteten und gewünschten Informationen in einem gut sichtbaren Zustand zu präsentieren, wodurch die Benutzerfreundlichkeit des Antwortprozesses verbessert wird.
  • Außerdem bestimmt die Präsentationseinheit das Bildschirm-Anzeigeverhältnis oder den Bereich des Inhalts jeder Antwort gemäß der Informationsmenge jeder der von der Vielzahl der Informationsvorrichtungen generierten Antworten für die Eingabeinformationen. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, dem Benutzer eine Antwort mit einer größeren Menge an Informationen in einem gut sichtbaren Zustand zu präsentieren, wodurch die Benutzerfreundlichkeit des Antwortprozesses verbessert wird.
  • Außerdem empfängt die Empfangseinheit als Eingabeinformation die Sprachinformation von dem Benutzer. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, eine entsprechende Konversation gemäß der Situation des Benutzers in Sprachkommunikation mit dem Benutzer zu führen.
  • Außerdem empfängt die Empfangseinheit die Texteingabe von dem Benutzer als Eingabeinformationen. Dies ermöglicht es der Antwortverarbeitungsvorrichtung, eine entsprechende Antwort zu präsentieren, die der Texteingabe von dem Benutzer entspricht, ohne dass der Benutzer spricht.
  • (5. Hardware-Konfiguration)
  • Die Informationsvorrichtungen wie z. B. die Antwortverarbeitungsvorrichtung 100, die Agenten 10 und der externe Server 200 gemäß den oben beschriebenen Ausführungsformen werden beispielsweise durch einen Computer 1000 mit einer Konfiguration, wie sie in 17 dargestellt ist, realisiert. Im Folgenden wird ein Beispiel für die Antwortverarbeitungsvorrichtung 100 gemäß der ersten Ausführungsform beschrieben. 17 ist ein Hardware-Konfigurationsdiagramm, das ein Beispiel des Computers 1000 darstellt, der dazu ausgelegt ist, die Funktionen der Antwortverarbeitungsvorrichtung 100 zu erzielen. Der Computer 1000 umfasst eine CPU 1100, ein RAM 1200, einen Nur-Lese-Speicher (ROM) 1300, ein Festplattenlaufwerk (HDD) 1400, eine Kommunikationsschnittstelle 1500 und eine Eingabe/Ausgabe-Schnittstelle 1600. Die Komponenten des Computers 1000 sind über einen Bus 1050 verbunden.
  • Die CPU 1100 wird auf der Basis eines im ROM 1300 oder auf der HDD 1400 gespeicherten Programms betrieben und steuert die einzelnen Einheiten. Beispielsweise setzt die CPU 1100 Programme, die im ROM 1300 oder auf der Festplatte 1400 gespeichert sind, im RAM 1200 ein und führt eine Verarbeitung aus, die verschiedenen Programmen entspricht.
  • Das ROM 1300 speichert ein Boot-Programm, wie z. B. ein grundlegendes Eingabe-Ausgabe-System (BIOS), das von der CPU 1100 ausgeführt wird, wenn der Computer 1000 hochgefahren wird, ein von der Hardware des Computers 1000 abhängiges Programm und dergleichen.
  • Das Festplattenlaufwerk (HDD) 1400 ist ein computerlesbares Aufzeichnungsmedium, das durch die CPU 1100 ausgeführte Programme, von dem Programm verwendete Daten und dergleichen, nicht-flüchtig aufzeichnet. Insbesondere ist das HDD 1400 ein Aufzeichnungsmedium, das das Antwortverarbeitungsprogramm gemäß der vorliegenden Offenbarung aufzeichnet, wobei das Antwortverarbeitungsprogramm ein Beispiel für Programmdaten 1450 ist.
  • Die Kommunikationsschnittstelle 1500 ist eine Schnittstelle, die den Computer 1000 mit einem externen Netzwerk 1550 (z. B. dem Internet) verbindet. Beispielsweise empfängt die CPU 1100 Daten von einer anderen Vorrichtung oder überträgt von der CPU 1100 erzeugte Daten über die Kommunikationsschnittstelle 1500 zu einer anderen Vorrichtung.
  • Die Ein-/Ausgabe-Schnittstelle 1600 ist eine Schnittstelle, die eine Ein-/Ausgabe-Vorrichtung 1650 mit dem Computer 1000 verbindet. Beispielsweise empfängt die CPU 1100 Daten von einer Eingabevorrichtung, wie z. B. einer Tastatur oder Maus, über die Ein-/Ausgabe-Schnittstelle 1600. Außerdem überträgt die CPU 1100 über die Ein-/Ausgabeschnittstelle 1600 Daten an eine Ausgabevorrichtung wie z. B. ein Display, einen Lautsprecher oder einen Drucker. Außerdem kann die Ein-/Ausgabeschnittstelle 1600 als Medienschnittstelle fungieren, die ein auf einem vorbestimmten Aufzeichnungsmedium aufgezeichnetes Programm oder ähnliches liest. Das Medium umfasst beispielsweise ein optisches Aufzeichnungsmedium wie eine Digital Versatile Disc (DVD) oder eine wiederbeschreibbare Phasenwechselplatte (PD), ein magneto-optisches Aufzeichnungsmedium wie eine magnetooptische Platte (MO), ein Bandmedium, ein magnetisches Aufzeichnungsmedium, einen Halbleiterspeicher oder dergleichen.
  • Wenn beispielsweise der Computer 1000 gemäß der ersten Ausführungsform als Vorrichtung zur Verarbeitung von Antworten 100 fungiert, führt die CPU 1100 des Computers 1000 die Funktionen der Empfangseinheit 40 und dergleichen aus, indem sie das im RAM 1200 geladene Antwortverarbeitungsprogramm ausführt. Außerdem speichert das HDD 1400 das Antwortverarbeitungsprogramm gemäß der vorliegenden Offenbarung oder Daten in der Speichereinheit 30. Beachten Sie, dass die CPU 1100 die von dem HDD 1400 gelesenen Programmdaten 1450 ausführt, aber in einem anderen Beispiel kann die CPU 1100 diese Programme von einer anderen Vorrichtung über das externe Netzwerk 1550 beziehen.
  • Beachten Sie, dass die vorliegende Technologie auch die folgenden Konfigurationen verwenden kann.
    • (1) Antwortverarbeitungsvorrichtung, die Folgendes umfasst:
      • eine Empfangseinheit, die dazu ausgelegt ist, Eingabeinformationen zu empfangen, die Informationen sind, die die Generierung einer Antwort durch eine Informationsvorrichtung auslösen;
      • eine Präsentationseinheit, die dazu ausgelegt ist, einem Benutzer jede der von einer Vielzahl von Informationsvorrichtungen für die Eingabeinformation generierten Antworten zu präsentieren; und
      • eine Präsentationseinheit, die dazu ausgelegt ist, die Reaktion des Benutzers auf die präsentierten Antworten an die Vielzahl von Informationsvorrichtungen zu übertragen.
    • (2) Antwortverarbeitungsvorrichtung gemäß (1), wobei die Präsentationseinheit eine Informationsvorrichtung steuert, die eine vom Benutzer aus den präsentierten Antworten ausgewählte Antwort generiert hat, um die ausgewählte Antwort auszugeben.
    • (3) Antwortverarbeitungsvorrichtung gemäß (1) oder (2), wobei die Präsentationseinheit eine von dem Benutzer aus den präsentierten Antworten ausgewählte Antwort von einer Informationsvorrichtung erfasst, die die ausgewählte Antwort generiert hat, und die erfasste Antwort ausgibt.
    • (4) Antwortverarbeitungsvorrichtung gemäß einem der Punkte (1) bis (3), wobei die Empfangseinheit nach der Ausgabe einer beliebigen der präsentierten Antworten einen Befehl von dem Benutzer akzeptiert, der die Änderung der auszugebenden Antwort angibt, und die Präsentationseinheit die ausgegebene Antwort, basierend auf dem Befehl, in eine andere Antwort ändert.
    • (5) Antwortverarbeitungsvorrichtung gemäß einem der Punkte (1) bis (4), wobei die Präsentationseinheit, wenn die von der Vielzahl von Informationsvorrichtungen generierten Antworten auf die Eingabeinformation denselben Inhalt aufweisen, kollektiv die Antworten präsentiert, die denselben Inhalt aufweisen.
    • (6) Antwortverarbeitungsvorrichtung gemäß einem der Punkte (1) bis (5), wobei die Empfangseinheit einen Befehl akzeptiert, der eine andere Antwort als die präsentierte Antwort vom Benutzer anfordert, und die Übertragungseinheit eine Anforderung einer zusätzlichen Suche bezüglich der Eingabeinformationen auf der Basis des Befehls an die Vielzahl von Informationsvorrichtungen überträgt.
    • (7) Antwortverarbeitungsvorrichtung gemäß einem der Punkte (1) bis (6), wobei die Präsentationseinheit an den Benutzer eine Antwort ausgibt, die aus den von der Vielzahl von Informationsvorrichtungen für die Eingabeinformationen generierten Antworten ausgewählt wird, basierend auf einer Historie, die die von der Vielzahl von Informationsvorrichtungen generierten Antworten angibt, die vom Benutzer in der Vergangenheit ausgewählt wurden.
    • (8) Antwortverarbeitungsvorrichtung gemäß einem der Punkte (1) bis (7), wobei die Übertragungseinheit als Reaktion des Benutzers eine Information über eine vom Benutzer aus den präsentierten Antworten ausgewählte Antwort an die Vielzahl der Informationsvorrichtungen überträgt.
    • (9) Antwortverarbeitungsvorrichtung gemäß (8), wobei die Übertragungseinheit als Information über die von dem Benutzer ausgewählte Antwort den Inhalt der vom Benutzer ausgewählten Antwort oder Identifikationsinformationen der Informationsvorrichtung, die die vom Benutzer ausgewählte Antwort generiert hat, an die Vielzahl von Informationsvorrichtungen überträgt.
    • (10) Antwortverarbeitungsvorrichtung gemäß einem der Punkte (1) bis (9), wobei die Übertragungseinheit als Reaktion des Benutzers eine Information an die Vielzahl der Informationsvorrichtungen überträgt, die angibt, dass keine der präsentierten Antworten von dem Benutzer ausgewählt wurde.
    • (11) Antwortverarbeitungsvorrichtung gemäß (10), wobei die Übertragungseinheit den Inhalt der präsentierten Antworten an die Vielzahl von Informationsvorrichtungen überträgt, zusammen mit einer Information, die angibt, dass keine der präsentierten Antworten von dem Benutzer ausgewählt worden ist.
    • (12) Antwortverarbeitungsvorrichtung gemäß einem der Punkte (1) bis (11), wobei die Präsentationseinheit eine Präsentation für den Benutzer durchführt, indem sie die Sprache verwendet, die den Inhalt der Antworten enthält, die für die Eingabeinformationen von der Vielzahl der Informationsvorrichtungen generiert wurden.
    • (13) Antwortverarbeitungsvorrichtung gemäß einem der Punkte (1) bis (12), wobei die Präsentationseinheit eine Präsentation für den Benutzer durchführt, indem sie die Bildschirmanzeigen verwendet, die den Inhalt der Antworten enthält, die für die Eingabeinformationen von der Vielzahl der Informationsvorrichtungen generiert wurden.
    • (14) Antwortverarbeitungsvorrichtung gemäß (13), wobei die Präsentationseinheit ein Bildschirm-Anzeigeverhältnis oder den Bereich des Inhalts jeder Antwort bestimmt, die von jeder der Vielzahl von Informationsvorrichtungen für die Eingabeinformationen generiert wird, basierend auf einer Historie, die die von der Vielzahl von Informationsvorrichtungen generierten Antworten angibt, die vom Benutzer in der Vergangenheit ausgewählt wurden.
    • (15) Antwortverarbeitungsvorrichtung gemäß (13) oder (14), wobei die Präsentationseinheit ein Bildschirm-Anzeigeverhältnis oder den Bereich des Inhalts jeder Antwort gemäß einer Informationsmenge jeder der von der Vielzahl der Informationsvorrichtungen generierten Antworten für die Eingabeinformationen bestimmt.
    • (16) Antwortverarbeitungsvorrichtung gemäß einem der Punkte (1) bis (15), wobei die Empfangseinheit als Eingabeinformationen die Sprachinformationen von dem Benutzer empfängt.
    • (17) Antwortverarbeitungsvorrichtung gemäß einem der Punkte (1) bis (16), wobei die Empfangseinheit eine Texteingabe von dem Benutzer als Eingabeinformationen empfängt.
    • (18) Antwortverarbeitungsverfahren, ausgeführt durch einen Computer, das Folgendes umfasst:
      • Empfangen von Eingabeinformationen, die Informationen sind, die die Generierung einer Antwort durch eine Informationsvorrichtung auslösen;
      • Präsentieren, für einen Benutzer, jede der von einer Vielzahl von Informationsvorrichtungen für die Eingabeinformation generierten Antworten; und
      • Übertragen der Reaktion des Benutzers auf die präsentierten Antworten an die Vielzahl von Informationsvorrichtungen.
    • (19) Antwortverarbeitungsprogramm, das einen Computer veranlasst, als Folgendes zu funktionieren:
      • eine Empfangseinheit, die dazu ausgelegt ist, Eingabeinformationen zu empfangen, die Informationen sind, die die Generierung einer Antwort durch eine Informationsvorrichtung auslösen;
      • eine Präsentationseinheit, die dazu ausgelegt ist, einem Benutzer jede der von einer Vielzahl von Informationsvorrichtungen für die Eingabeinformation generierten Antworten zu präsentieren; und
      • eine Präsentationseinheit, die dazu ausgelegt ist, die Reaktion des Benutzers auf die präsentierten Antworten an die Vielzahl von Informationsvorrichtungen zu übertragen.
  • Bezugszeichenliste
  • 1
    ANTWORTVERARBEITUNGSSYSTEM
    10
    AGENT
    100
    ANTWORTVERARBEITUNGSVORRICHTUNG
    20
    SENSOR
    20A
    SPRACHEINGABESENSOR
    20B
    BILDEINGABESENSOR
    21
    EINGABEEINHEIT
    22
    KOMMUNIKATIONSEINHEIT
    30
    SPEICHEREINHEIT
    31
    BENUTZERINFORMATIONSTABELLE
    32
    AGENTENTABELLE
    33
    BEFEHLSTABELLE
    34
    HISTORIETABELLE
    40
    EMPFANGSEINHEIT
    41
    ERKENNUNGSEINHEIT
    42
    REGISTRIERUNGSEINHEIT
    43
    ERFASSUNGSEINHEIT
    50
    PRÄSENTATIONSEINHEIT
    51
    ANALYSEEINHEIT
    52
    ERZEUGUNGSEINHEIT
    53
    AUSGABESTEUEREINHEIT
    54
    ÜBERTRAGUNGSEINHEIT
    60
    AUSGABEEINHEIT
    200
    EXTERNER SERVER
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • JP H07004882 A [0004]

Claims (18)

  1. Antwortverarbeitungsvorrichtung, die Folgendes umfasst: eine Empfangseinheit, die dazu ausgelegt ist, Eingabeinformationen zu empfangen, die Informationen sind, die die Generierung einer Antwort durch eine Informationsvorrichtung auslösen; eine Präsentationseinheit, die dazu ausgelegt ist, einem Benutzer jede der von einer Vielzahl von Informationsvorrichtungen für die Eingabeinformation generierten Antworten zu präsentieren; und eine Präsentationseinheit, die dazu ausgelegt ist, die Reaktion des Benutzers auf die präsentierten Antworten an die Vielzahl von Informationsvorrichtungen zu übertragen.
  2. Antwortverarbeitungsvorrichtung gemäß Anspruch 1, wobei die Präsentationseinheit eine Informationsvorrichtung steuert, die eine vom Benutzer aus den präsentierten Antworten ausgewählte Antwort generiert hat, um die ausgewählte Antwort auszugeben.
  3. Antwortverarbeitungsvorrichtung gemäß Anspruch 1, wobei die Präsentationseinheit eine von dem Benutzer aus den präsentierten Antworten ausgewählte Antwort von einer Informationsvorrichtung erfasst, die die ausgewählte Antwort generiert hat, und die erfasste Antwort ausgibt.
  4. Antwortverarbeitungsvorrichtung gemäß Anspruch 1, wobei die Empfangseinheit nach der Ausgabe einer beliebigen der präsentierten Antworten einen Befehl von dem Benutzer akzeptiert, der die Änderung der auszugebenden Antwort angibt, und die Präsentationseinheit die ausgegebene Antwort, basierend auf dem Befehl, in eine andere Antwort ändert.
  5. Antwortverarbeitungsvorrichtung gemäß Anspruch 1, wobei die Präsentationseinheit, wenn die von der Vielzahl von Informationsvorrichtungen generierten Antworten auf die Eingabeinformation denselben Inhalt aufweisen, kollektiv die Antworten präsentiert, die denselben Inhalt aufweisen.
  6. Antwortverarbeitungsvorrichtung gemäß Anspruch 1, wobei die Empfangseinheit einen Befehl akzeptiert, der eine andere Antwort als die präsentierte Antwort vom Benutzer anfordert, und die Übertragungseinheit eine Anforderung einer zusätzlichen Suche bezüglich der Eingabeinformationen auf der Basis des Befehls an die Vielzahl von Informationsvorrichtungen überträgt.
  7. Antwortverarbeitungsvorrichtung gemäß Anspruch 1, wobei die Präsentationseinheit an den Benutzer eine Antwort ausgibt, die aus den von der Vielzahl von Informationsvorrichtungen für die Eingabeinformationen generierten Antworten ausgewählt wird, basierend auf einer Historie, die die von der Vielzahl von Informationsvorrichtungen generierten Antworten angibt, die vom Benutzer in der Vergangenheit ausgewählt wurden.
  8. Antwortverarbeitungsvorrichtung gemäß Anspruch 1, wobei die Übertragungseinheit als Reaktion des Benutzers eine Information über eine vom Benutzer aus den präsentierten Antworten ausgewählte Antwort an die Vielzahl der Informationsvorrichtungen überträgt.
  9. Antwortverarbeitungsvorrichtung gemäß Anspruch 8, wobei die Übertragungseinheit als Information über die von dem Benutzer ausgewählte Antwort den Inhalt der vom Benutzer ausgewählten Antwort oder Identifikationsinformationen einer Informationsvorrichtung, die die vom Benutzer ausgewählte Antwort generiert hat, an die Vielzahl von Informationsvorrichtungen überträgt.
  10. Antwortverarbeitungsvorrichtung gemäß Anspruch 1, wobei die Übertragungseinheit als Reaktion des Benutzers eine Information an die Vielzahl der Informationsvorrichtungen überträgt, die angibt, dass keine der präsentierten Antworten von dem Benutzer ausgewählt wurde.
  11. Antwortverarbeitungsvorrichtung gemäß Anspruch 10, wobei die Übertragungseinheit den Inhalt der präsentierten Antworten an die Vielzahl von Informationsvorrichtungen überträgt, zusammen mit einer Information, die angibt, dass keine der präsentierten Antworten von dem Benutzer ausgewählt worden ist.
  12. Antwortverarbeitungsvorrichtung gemäß Anspruch 1, wobei die Präsentationseinheit eine Präsentation für den Benutzer durchführt, indem sie die Sprache verwendet, die den Inhalt der Antworten enthält, die für die Eingabeinformationen von der Vielzahl der Informationsvorrichtungen generiert wurden.
  13. Antwortverarbeitungsvorrichtung gemäß Anspruch 1, wobei die Präsentationseinheit eine Präsentation für den Benutzer durchführt, indem sie die Bildschirmanzeige verwendet, die den Inhalt der Antworten enthält, die für die Eingabeinformationen von der Vielzahl der Informationsvorrichtungen generiert wurden.
  14. Antwortverarbeitungsvorrichtung gemäß Anspruch 13, wobei die Präsentationseinheit ein Bildschirm-Anzeigeverhältnis oder den Bereich des Inhalts jeder Antwort bestimmt, die von jeder der Vielzahl von Informationsvorrichtungen für die Eingabeinformationen generiert wird, basierend auf einer Historie, die die von der Vielzahl von Informationsvorrichtungen generierten Antworten angibt, die vom Benutzer in der Vergangenheit ausgewählt wurden.
  15. Antwortverarbeitungsvorrichtung gemäß Anspruch 13, wobei die Präsentationseinheit ein Bildschirm-Anzeigeverhältnis oder den Bereich des Inhalts jeder Antwort gemäß einer Informationsmenge jeder der von der Vielzahl der Informationsvorrichtungen generierten Antworten für die Eingabeinformationen bestimmt.
  16. Antwortverarbeitungsvorrichtung gemäß Anspruch 1, wobei die Empfangseinheit als Eingabeinformationen die Sprachinformationen von dem Benutzer empfängt.
  17. Antwortverarbeitungsvorrichtung gemäß Anspruch 1, wobei die Empfangseinheit eine Texteingabe von dem Benutzer als Eingabeinformationen empfängt.
  18. Antwortverarbeitungsverfahren, ausgeführt durch einen Computer, das Folgendes umfasst: Empfangen von Eingabeinformationen, die Informationen sind, die die Generierung einer Antwort durch eine Informationsvorrichtung auslösen; Präsentieren, für einen Benutzer, jede der von einer Vielzahl von Informationsvorrichtungen für die Eingabeinformation generierten Antworten; und Übertragen der Reaktion des Benutzers auf die präsentierten Antworten an die Vielzahl von Informationsvorrichtungen.
DE112019006677.3T 2019-01-16 2019-11-29 Antwortverarbeitungsvorrichtung und Antwortverarbeitungsverfahren Withdrawn DE112019006677T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019-005559 2019-01-16
JP2019005559 2019-01-16
PCT/JP2019/046876 WO2020149031A1 (ja) 2019-01-16 2019-11-29 応答処理装置及び応答処理方法

Publications (1)

Publication Number Publication Date
DE112019006677T5 true DE112019006677T5 (de) 2021-11-04

Family

ID=71613244

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112019006677.3T Withdrawn DE112019006677T5 (de) 2019-01-16 2019-11-29 Antwortverarbeitungsvorrichtung und Antwortverarbeitungsverfahren

Country Status (4)

Country Link
US (1) US20220108693A1 (de)
JP (1) JP7415952B2 (de)
DE (1) DE112019006677T5 (de)
WO (1) WO2020149031A1 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111724880A (zh) * 2020-06-09 2020-09-29 百度在线网络技术(北京)有限公司 用户情绪调节方法、装置、设备和可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH074882A (ja) 1993-06-11 1995-01-10 Hitachi Ltd 熱交換器

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7036128B1 (en) * 1999-01-05 2006-04-25 Sri International Offices Using a community of distributed electronic agents to support a highly mobile, ambient computing environment
US7398209B2 (en) * 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7181447B2 (en) * 2003-12-08 2007-02-20 Iac Search And Media, Inc. Methods and systems for conceptually organizing and presenting information
US20090024598A1 (en) * 2006-12-20 2009-01-22 Ying Xie System, method, and computer program product for information sorting and retrieval using a language-modeling kernel function
US8826322B2 (en) * 2010-05-17 2014-09-02 Amazon Technologies, Inc. Selective content presentation engine
US8392411B2 (en) 2010-05-20 2013-03-05 Google Inc. Automatic routing of search results
KR20140052155A (ko) 2012-10-19 2014-05-07 삼성전자주식회사 디스플레이 장치, 디스플레이 장치 제어 방법 및 디스플레이 장치의 제어를 위한 정보처리장치
US20160063012A1 (en) * 2014-08-29 2016-03-03 Neelakantan Sundaresan Multi-user search or recommendation
JP2016151928A (ja) * 2015-02-18 2016-08-22 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
US10970646B2 (en) * 2015-10-01 2021-04-06 Google Llc Action suggestions for user-selected content
CN114357128A (zh) 2016-04-18 2022-04-15 谷歌有限责任公司 适当的代理的自动化助理调用
US10115400B2 (en) * 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
JP6767206B2 (ja) * 2016-08-30 2020-10-14 シャープ株式会社 応答システム
US10853747B2 (en) * 2016-10-03 2020-12-01 Google Llc Selection of computational agent for task performance
JP6882463B2 (ja) * 2016-10-03 2021-06-02 グーグル エルエルシーGoogle LLC コンピュータによるエージェントのための合成音声の選択
US10777201B2 (en) * 2016-11-04 2020-09-15 Microsoft Technology Licensing, Llc Voice enabled bot platform
KR101889279B1 (ko) * 2017-01-16 2018-08-21 주식회사 케이티 음성 명령에 기반하여 서비스를 제공하는 시스템 및 방법
KR20200024511A (ko) * 2018-08-28 2020-03-09 삼성전자주식회사 대화 에이전트의 동작 방법 및 그 장치
RU2744029C1 (ru) * 2018-12-29 2021-03-02 Общество С Ограниченной Ответственностью "Яндекс" Система и способ формирования обучающего набора для алгоритма машинного обучения

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH074882A (ja) 1993-06-11 1995-01-10 Hitachi Ltd 熱交換器

Also Published As

Publication number Publication date
WO2020149031A1 (ja) 2020-07-23
JPWO2020149031A1 (ja) 2021-12-02
JP7415952B2 (ja) 2024-01-17
US20220108693A1 (en) 2022-04-07

Similar Documents

Publication Publication Date Title
CN110245213B (zh) 调查问卷生成方法、装置、设备和存储介质
DE102017012415B4 (de) Identifikation eines virtuellen Assistenten von nahgelegenen Rechenvorrichtungen
CN112073741B (zh) 直播信息的处理方法、装置、电子设备及存储介质
DE202016107300U1 (de) Auffindbarkeitssystem für Sprachaktionen
DE102017127239A1 (de) Vom Server gelieferte visuelle Ausgabe an einer Sprachschnittstellenvorrichtung
DE112016004863T5 (de) Parametersammlung und automatische Dialogerzeugung in Dialogsystemen
DE202017105819U1 (de) Mehrfachanwenderpersonalisierung bei einer Sprachschnittstellenvorrichtung
DE212017000329U1 (de) Selektives Sensorabfragen
DE112017000122T5 (de) Natürliche Sprachverarbeitung für den Sitzungsaufbau mit Serviceprovidern
DE202017106514U1 (de) Proaktive Aufnahme von nicht angefordertem Inhalt in Mensch-Computer-Dialoge
DE202017104849U1 (de) Systeme und Medien zum Darstellen einer Benutzerschnittstelle, die für eine vorhergesagte Benutzeraktivität kundenspezifisch ist
KR20100062940A (ko) 콘텍스트 및 액티비티―구동 콘텐트 전달 및 상호작용
DE112017006876T5 (de) Zugriffssteuerung in einer verbundenen umgebung
CN110992937B (zh) 语言离线识别方法、终端及可读存储介质
US11900933B2 (en) User-customizable and domain-specific responses for a virtual assistant for multi-dwelling units
DE212017000068U1 (de) Einrichten von audio-basierten Netzwerksitzungen mit nicht registrierten Ressourcen
DE202016008225U1 (de) Unterstützung bei der semantischen Offline-Bearbeitung durch ein Gerät mit begrenzten Möglichkeiten
DE102017111569A1 (de) Responsive, visuelle Darstellung von Kurzinformationen für vom Benutzer angefragte Themen
DE112019006677T5 (de) Antwortverarbeitungsvorrichtung und Antwortverarbeitungsverfahren
DE102017122216A1 (de) Mehrfachanwenderpersonalisierung bei einer Sprachschnittstellenvorrichtung
DE112020002743T5 (de) Informationsverarbeitungsvorrichtung
DE202018101233U1 (de) Systeme und Vorrichtungen zur Aktivitätsüberwachung über einen Home-Assistant
DE19747745C2 (de) Verfahren zum Führen von Personen
Rincon et al. Using emotions for the development of human-agent societies
KR100408536B1 (ko) 인터넷 기반의 사용자 맞춤 설문조사 시스템

Legal Events

Date Code Title Description
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee