DE112020002636T5 - Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm - Google Patents

Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm Download PDF

Info

Publication number
DE112020002636T5
DE112020002636T5 DE112020002636.1T DE112020002636T DE112020002636T5 DE 112020002636 T5 DE112020002636 T5 DE 112020002636T5 DE 112020002636 T DE112020002636 T DE 112020002636T DE 112020002636 T5 DE112020002636 T5 DE 112020002636T5
Authority
DE
Germany
Prior art keywords
processing
information
detail
unit
details
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE112020002636.1T
Other languages
English (en)
Inventor
Yuhei Taki
Hiro Iwase
Kunihito Sawai
Masaki Takase
Akira Miyashita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Group Corp
Original Assignee
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Group Corp filed Critical Sony Group Corp
Publication of DE112020002636T5 publication Critical patent/DE112020002636T5/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Eine Informationsverarbeitungsvorrichtung (1) umfasst eine Eingabeeinheit (101), eine Extraktionseinheit (104, 104a), eine Ausgabeeinheit (107, 108) und eine Spezifiziereinheit (104, 104a). Die Eingabeeinheit (101) empfängt eine Sprachoperation. Die Extraktionseinheit (104, 104a) extrahiert ein Verarbeitungsdetail entsprechend der durch die Eingabeeinheit (101) empfangenen Sprachoperation. Wenn das Verarbeitungsdetail entsprechend der durch die Eingabeeinheit (101) empfangenen Sprachoperation nicht spezifiziert werden kann, gibt die Ausgabeeinheit (107, 108) Antwortinformationen zum Treffen einer Auswahl zumindest eines Verarbeitungsdetails aus mehreren der durch die Extraktionseinheit (104, 104a) extrahierten Verarbeitungsdetails aus. Die Spezifiziereinheit (104, 104a) spezifiziert das aus den in den Antwortinformationen enthaltenen mehreren Verarbeitungsdetails ausgewählte Verarbeitungsdetail als das Verarbeitungsdetail entsprechend der durch die Eingabeeinheit (101) empfangenen Sprachoperation.

Description

  • Technisches Gebiet
  • Die vorliegende Offenbarung bezieht sich auf eine Informationsverarbeitungsvorrichtung, ein Informationsverarbeitungsverfahren und ein Programm.
  • Hintergrund
  • Informationsverarbeitungsvorrichtungen, die durch Sprache bedient werden, wie etwa intelligente Lautsprecher und Smartphones, sind bekannt.
  • Zitierliste
  • Patentliteratur
  • Patentliteratur 1: JP H06-223104 A
  • Kurzdarstellung
  • Technisches Problem
  • Im oben beschriebenen Stand der Technik wurde eine Technik zum Analysieren von durch Benutzer ausgegebene Äußerungen offenbart.
  • Wenn allerdings ein Benutzer eine uneindeutige Sprache von sich gibt, die zu abstrakt ist, kann eine solche Informationsverarbeitungsvorrichtung selbst bei Analyse der Äußerung keine Verarbeitung durchführen, wie vom Benutzer erwartet, da die Äußerung uneindeutig ist.
  • Die vorliegende Offenbarung schlägt daher eine Informationsverarbeitungsvorrichtung, ein Informationsverarbeitungsverfahren und ein Programm vor, die Verarbeitung von Interesse, angezeigt durch eine uneindeutige Sprachoperation, spezifizierbar machen.
  • Lösung für das Problem
  • Um die oben beschriebenen Probleme zu lösen, umfasst eine Informationsverarbeitungsvorrichtung gemäß einer Ausführungsform der vorliegenden Offenbarung eine Eingabeeinheit, eine Extraktionseinheit, eine Ausgabeeinheit und eine Spezifiziereinheit. Die Eingabeeinheit empfängt eine Sprachoperation. Die Extraktionseinheit extrahiert ein Verarbeitungsdetail entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation. Wenn das Verarbeitungsdetail entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation nicht spezifiziert werden kann, gibt die Ausgabeeinheit Antwortinformationen zum Treffen einer Auswahl zumindest eines Verarbeitungsdetails aus mehreren der durch die Extraktionseinheit extrahierten Verarbeitungsdetails aus. Die Spezifiziereinheit spezifiziert das aus den in den Antwortinformationen enthaltenen mehreren Verarbeitungsdetails ausgewählte Verarbeitungsdetail als das Verarbeitungsdetail entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation.
  • Figurenliste
    • 1 ist ein Diagramm, ein Beispiel einer Struktur einer Informationsverarbeitungsvorrichtung gemäß einer ersten Ausführungsform der vorliegenden Offenbarung darstellend.
    • 2 ist ein Diagramm, ein Beispiel einer Datenstruktur einer Verarbeitungsklassifizierungstabelle gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellend.
    • 3 ist ein Diagramm, ein Beispiel eines Flusses einer durch die Informationsverarbeitungsvorrichtung ausgeführten Verarbeitung gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellend.
    • 4 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung ausgeführten Verarbeitung gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellend.
    • 5 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung ausgeführten Verarbeitung gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellend.
    • 6 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung ausgeführten Verarbeitung gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellend.
    • 7 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung ausgeführten Verarbeitung gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellend.
    • 8 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung ausgeführten Verarbeitung gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellend.
    • 9 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung ausgeführten Verarbeitung gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellend.
    • 10 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung ausgeführten Verarbeitung gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellend.
    • 11 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung ausgeführten Verarbeitung gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellend.
    • 12 ist ein Flussdiagramm, ein Beispiel des Spezifizierens von durch die Informationsverarbeitungsvorrichtung ausgeführter Verarbeitung gemäß der ersten Ausführungsform der vorliegenden Offenbarung darstellend.
    • 13 ist ein Diagramm, ein Beispiel eines Flusses einer durch eine Informationsverarbeitungsvorrichtung ausgeführten Verarbeitung gemäß einer zweiten Ausführungsform der vorliegenden Offenbarung darstellend.
    • 14 ist ein Diagramm, ein Beispiel einer Datenstruktur von durch eine Verarbeitungsdetail-Ableiteeinheit extrahierten Daten gemäß der zweiten Ausführungsform der vorliegenden Offenbarung darstellend.
  • Beschreibung der Ausführungsformen
  • Im Folgenden werden Ausführungsformen der vorliegenden Offenbarung detailliert und Bezug nehmend auf die Zeichnungen beschrieben. Es ist anzumerken, dass, in jeder der folgenden Ausführungsformen, die gleichen Komponenten durch die gleichen Bezugszeichen bezeichnet werden, um zu verhindern, dass die Beschreibung redundant ist.
  • Beispielsweise empfängt eine Informationsverarbeitungsvorrichtung, wie etwa ein Smartphone oder ein intelligenter Lautsprecher, eine Sprachoperation, die eine Betätigung durch Sprache ist. Für die Sprachoperation betätigt der Benutzer die Informationsverarbeitungsvorrichtung durch eine beliebige gewünschte Äußerung. Wenn die Äußerung des Benutzers zu abstrakt ist, um ein klares Verständnis bereitzustellen, kann die Informationsverarbeitungsvorrichtung nicht die Verarbeitung ausführen, wie durch den Benutzer erwartet. Wenn der Benutzer beispielsweise sagt „Animation A abspielen“, hat die Äußerung des Benutzers keinen Inhalt, der entweder die Wiedergabe der Musik der Animation A oder die Wiedergabe des Videos der Animation A spezifiziert. Dadurch kann die Informationsverarbeitungsvorrichtung nicht in der Lage sein, die Verarbeitung auszuführen, wie durch den Benutzer erwartet.
  • Ferner kann die Informationsverarbeitungsvorrichtung eine Funktion aufweisen, ein Makro, eine Routine oder ein Befehl genannt, die eine spezifische Äußerung mit einer spezifischen Verarbeitung verknüpft. Eine solche Funktion ist konzipiert, um, beispielsweise, eine Verknüpfung zwischen einer Äußerung über das „morgige Wetter“ und dem morgigen Wetter für eine bestimmte Region zu registrieren und in Reaktion auf die Äußerung des Benutzers über das „morgige Wetter“ das morgige Wetter für die bestimmte Region auszugeben.
  • Hier wird davon ausgegangen, dass die Wortfolge „morgiges Wetter“ ursprünglich das morgige Wetter im ganzen Land bedeutet. Wenn in diesem Fall die Wortfolge „morgiges Wetter“ und eine Anforderung zum Ausgeben des morgigen Wetters für die bestimmte Region in Verknüpfung miteinander registriert werden, hat „morgiges Wetter“ zwei Bedeutungen: die Anforderung zum Ausgeben des morgigen Wetter für die bestimmte Region und eine Anforderung zum Ausgeben des morgigen Wetters für das gesamte Land. Dadurch kann die Informationsverarbeitungsvorrichtung nicht in der Lage sein, die Verarbeitung auszuführen, wie durch den Benutzer erwartet.
  • Nachfolgend wird eine Beschreibung einer Informationsverarbeitungsvorrichtung, eines Informationsverarbeitungsverfahrens und eines Programms, die Verarbeitung von Interesse, angezeigt durch eine uneindeutige Sprachoperation, spezifizierbar machen, gemäß den folgenden Ausführungsformen gegeben.
  • (Erste Ausführungsform)
  • [Struktur von Informationsverarbeitungsvorrichtung 1 gemäß der ersten Ausführungsform]
  • 1 ist ein Diagramm, ein Beispiel einer Struktur einer Informationsverarbeitungsvorrichtung 1 gemäß der ersten Ausführungsform darstellend. Die Informationsverarbeitungsvorrichtung 1 umfasst eine Steuerung 10, eine Speichereinheit 11, eine Spracheingabeeinheit 12, einen Sensor 13, eine Operationseinheit 14, eine Sprachausgabeeinheit 15 und eine Bildausgabeeinheit 16.
  • Die Steuerung 10 steuert die Informationsverarbeitungsvorrichtung 1 in einer zentralisierten Weise. Beispielsweise wird die Steuerung 10 durch einen Prozessor, wie etwa eine zentrale Verarbeitungseinheit (CPU) oder eine Mikroverarbeitungseinheit (MPU) umgesetzt. Beispielsweise führt die Steuerung 10 verschiedene Funktionen durch Ausführen verschiedener in der Speichereinheit 11 gespeicherter Programme oder ähnliches unter Verwendung eines Direktzugriffsspeichers (RAM) oder ähnliches als Arbeitsbereich durch. Es ist anzumerken, dass die Steuerung 10 durch eine integrierte Schaltung, wie etwa eine anwendungsspezifische integrierte Schaltung (ASIC) oder ein feldprogrammierbares Gate-Array (FPGA) umgesetzt sein kann.
  • Die Speichereinheit 11 ist, beispielsweise, durch ein Halbleiterspeicherelement, wie etwa einen Direktzugriffsspeicher (RAM) oder einen Flash-Speicher oder eine Speichervorrichtung, wie etwa eine Festplatte oder eine optische Platte umgesetzt. Die Speichereinheit 11 speichert, beispielsweise, eine Verarbeitungsklassifizierungstabelle 111.
  • 2 ist ein Diagramm, ein Beispiel einer Datenstruktur der Verarbeitungsklassifizierungstabelle 111 gemäß der ersten Ausführungsform darstellend. Die Verarbeitungsklassifizierungstabelle 111 ist eine Tabelle, wo die durch die Informationsverarbeitungsvorrichtung 1 auszuführende Verarbeitung in Kategorien klassifiziert wird. Wie in 2 dargestellt, ist eine Anwendungskategorie einer in der Informationsverarbeitungsvorrichtung 1 enthaltenen Anwendung mit einer Anwendung verknüpft, die zu der Anwendungskategorie gehört. Ferner ist jede Anwendung mit einer Verarbeitungskategorie verknüpft, die eine Kategorie von durch die Anwendung auszuführender entsprechender Verarbeitung anzeigt. Ferner ist jede Verarbeitungskategorie mit einem Verarbeitungsdetail verknüpft, das zu der Verarbeitungskategorie gehört. Ferner kann jedes Verarbeitungsdetail eine Hierarchie mit einzelner Ebene oder eine Hierarchie mit mehreren Ebenen aufweisen. Jedes Verarbeitungsdetail ist mit einer oder mehreren Phrasen verknüpft. Jede Phrase entspricht einer Wortfolge, die ein mit der Phrase verknüpftes Verarbeitungsdetail darstellt.
  • Die Spracheingabeeinheit 12 ist, beispielsweise, ein Mikrofon, das den Klang einer durch den Benutzer geäußerten Stimme aufnimmt.
  • Der Sensor 13 ist, beispielsweise, eine Kamera, die eine Aktion des Benutzers oder eine Sichtlinie des Benutzer als ein Bild erfasst.
  • Die Operationseinheit 14 ist eine Vorrichtung zur Verwendung beim Empfangen verschiedener Operationen vom Benutzer. Beispielsweise wird die Operationseinheit 14 durch einen Knopf, einen Touchscreen oder ähnliches umgesetzt.
  • Die Sprachausgabeeinheit 15 ist, beispielsweise, ein Lautsprecher, der Sprachdaten ausgibt.
  • Die Bildausgabeeinheit 16 ist, beispielsweise, eine Anzeige, die Bilddaten ausgibt.
  • Wie in 2 dargestellt, umfasst die Steuerung 10, als funktionale Module, einen semantischen Äußerungsanalysator 101, einen Sensorinformationsanalysator 102, eine Operationssteuerung 103, eine Verarbeitungsdetail-Ableiteeinheit 104, eine Verarbeitungsausführungseinheit 105, eine Antworterzeugungseinheit 106, eine Sprachsteuerung 107 und eine Anzeigesteuerung 108.
  • Der semantische Äußerungsanalysator 101 ist ein Beispiel für eine Eingabeeinheit. Der semantische Äußerungsanalysator 101 empfängt den Klang einer Stimme, aufgenommen durch die Spracheingabeeinheit 12. Beispielsweise empfängt der semantische Äußerungsanalysator 101 eine Sprachoperation. Dann analysiert der semantische Äußerungsanalysator 101 die Bedeutung von Äußerungen, die in der durch den Benutzer ausgegebenen Sprachoperation enthalten sind.
  • Der Sensorinformationsanalysator 102 analysiert die durch den Sensor 13 erhaltenen Informationen. Beispielsweise empfängt der Sensorinformationsanalysator 102 eine Operation durch Detektieren einer Aktion des Benutzers oder einer Sichtlinie des Benutzers aus den Informationen, wie etwa einem durch den Sensor 13 erhaltenen Bild. Beispielsweise empfängt der Sensorinformationsanalysator 102 eine Operation zum Auswählen zumindest eines Verarbeitungsdetails aus mehreren Verarbeitungsdetails.
  • Die Operationssteuerung 103 steuert die Operationseinheit 14 zum Empfangen verschiedener Operationen. Beispielsweise empfängt die Operationssteuerung 103 eine Operation zum Auswählen zumindest eines Verarbeitungsdetails aus mehreren Verarbeitungsdetails.
  • Die Verarbeitungsdetail-Ableiteeinheit 104 ist ein Beispiel einer Extraktionseinheit und ein Beispiel einer Spezifiziereinheit. Die Verarbeitungsdetail-Ableiteeinheit 104 leitet ein Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation ab. Noch spezieller extrahiert die Verarbeitungs-Ableiteeinheit 104 ein Verarbeitungsdetail entsprechend der Sprachoperation aus der Verarbeitungsklassifizierungstabelle 111 basierend auf dem Ergebnis der durch den semantischen Äußerungsanalysator 101 durchgeführten Analyse der Sprachoperation. Wenn nur ein Verarbeitungsdetail von der Verarbeitungsklassifizierungstabelle 111 extrahiert wird, spezifiziert die Verarbeitungs-Ableiteeinheit 104 das so extrahierte Verarbeitungsdetail als das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation. Wenn andererseits mehrere Verarbeitungsdetails von der Verarbeitungsklassifizierungstabelle 111 extrahiert werden, bestimmt die Verarbeitungs-Ableiteeinheit 104, dass das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation nicht spezifiziert werden kann.
  • Ferner spezifiziert die Verarbeitungs-Ableiteeinheit 104 ein aus mehreren in den durch die Antworterzeugungseinheit 106 erzeugten Antwortinformationen enthaltenen Verarbeitungsdetails ausgewähltes Verarbeitungsdetail, um später als das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation beschrieben zu werden. Noch spezieller spezifiziert die Verarbeitungs-Ableiteeinheit 104 das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation, ausgewählt aus den in den Antwortinformationen enthaltenen mehreren Verarbeitungsdetails, basierend auf der durch den semantischen Äußerungsanalysator 101, den Sensorinformationsanalysator 102 oder die Operationssteuerung 103 empfangenen Operation.
  • Die Verarbeitungsausführungseinheit 105 führt das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation aus.
  • Die Antworterzeugungseinheit 106 erzeugt die Antwortinformationen, wenn das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation nicht spezifiziert werden kann. Die Antwortinformationen werden verwendet, um mehrere durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierte Verarbeitungsdetails einzuengen. Das heißt, die Antwortinformationen werden verwendet, um eine Auswahl zumindest eines Verarbeitungsdetails aus mehreren durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails zu treffen.
  • Die Sprachsteuerung 107 und die Anzeigesteuerung 108 sind Beispiele einer Ausgabeeinheit. Die Sprachsteuerung 107 steuert die Sprachausgabeeinheit 15 zum Ausgeben der Antwortinformationen. Beispielsweise gibt die Sprachsteuerung 107 in den Antwortinformationen enthaltene Sprachinformationen aus.
  • Die Anzeigesteuerung 108 steuert die Bildausgabeeinheit 16 zum Ausgeben der Antwortinformationen. Beispielsweise gibt die Anzeigesteuerung 108 in den Antwortinformationen enthaltene Bildinformationen aus. Wenn ferner das Verarbeitungsdetail entsprechend der durch die Verarbeitungsdetail-Ableiteeinheit 104 empfangenen Sprachoperation nicht spezifiziert werden kann, gibt die Sprachsteuerung 107 oder die Anzeigesteuerung 108 die Antwortinformationen zum Treffen einer Auswahl zumindest eines Verarbeitungsdetails aus den mehreren durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails aus.
  • [Erstes Verarbeitungsbeispiel gemäß der ersten Ausführungsform]
  • Nachfolgend wird eine Beschreibung von spezifischen Beispielen von verschiedenen Typen von Verarbeitung Bezug nehmend auf 3 bis 11 gegeben. Wie in 3 bis 11 dargestellt, spezifiziert die Informationsverarbeitungsvorrichtung 1, basierend auf verschiedenen Typen von Informationen, das Verarbeitungsdetail entsprechend der durch den Benutzer ausgegebenen Sprachoperation.
  • 3 ist ein Diagramm, ein Beispiel eines Flusses einer durch die Informationsverarbeitungsvorrichtung 1 ausgeführten Verarbeitung gemäß der ersten Ausführungsform darstellend. Die Bildausgabeeinheit 16 zeigt einen Eingabebildschirm an, der eine Sprachoperation empfängt. Der Benutzer sagt „Animation A abspielen“. Mit anderen Worten, der semantische Äußerungsanalysator 101 empfängt eine Sprachoperation entsprechend mehreren Verarbeitungsdetails, die mit „Animation A abspielen“ verknüpft sind.
  • Die Verarbeitungsdetail-Ableiteeinheit 104 extrahiert die mehreren Verarbeitungsdetails entsprechend der durch den Benutzer ausgegebenen Sprachoperation. Hier sagt der Benutzer „Animation A abspielen“, aber die Äußerung des Benutzers hat keinen Inhalt, der entweder die Wiedergabe der Musik der Animation A oder die Wiedergabe des Videos der Animation A spezifiziert. Daher extrahiert die Verarbeitungsdetail-Ableiteeinheit 104, als Verarbeitungsdetails, Verarbeitung zum Abspielen eines Videos und Verarbeitung zum Abspielen von Musik aus der Verarbeitungsklassifizierungstabelle 111.
  • Die Antworterzeugungseinheit 106 erzeugt Antwortinformation, die Bildschirminformationen enthalten, umfassend ein Videowiedergabebild, wo ein Video abgespielt wird, und ein Musikwiedergabebild, wo Musik abgespielt wird, als das Operationsdetail entsprechend der Sprachoperation. Die Anzeigesteuerung 108 gibt die Antwortinformationen aus, die die Bildschirminformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus den mehreren durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails enthalten. Das heißt, die Anzeigesteuerung 108 veranlasst die Bildausgabeeinheit 16, die in den Antwortinformationen enthaltenen Bildschirminformationen anzuzeigen. Wenn ferner die Antwortinformationen die Sprachinformationen enthalten, veranlasst die Sprachsteuerung 107 die Sprachausgabeeinheit 15, den Klang einer entsprechenden Stimme auszugeben.
  • In Reaktion auf die Ausgabe der Antwortinformationen sagt der Benutzer „Ich höre mir das an“. Der semantische Äußerungsanalysator 101 empfängt eine Sprachoperation von „Ich höre mir das an“. Im Allgemeinen wird die Wortfolge „Ich höre mir das an“ beim Anhören von Musik geäußert. Daher spezifiziert die Verarbeitungsdetail-Ableiteeinheit 104, als das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation, die Verarbeitung zum Abspielen von Musik aus der Verarbeitung zum Abspielen eines Videos und der Verarbeitung zum Abspielen von Musik. Mit anderen Worten, die Verarbeitungsdetail-Ableiteeinheit 104 spezifiziert, als das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation, die Verarbeitung zum Abspielen eines Videos aus der Verarbeitung zum Abspielen eines Videos und der Verarbeitung zum Abspielen von Musik, die in den Antwortinformationen enthalten sind.
  • Dann führt die Verarbeitungsausführungseinheit 105 die Verarbeitung zum Abspielen der Musik der Animation A aus. Die Anzeigesteuerung 108 veranlasst die Bildausgabeeinheit 16, einen Wiedergabebildschirm der Musik der Animation A auszugeben. Ferner veranlasst die Sprachsteuerung 107 die Sprachausgabeeinheit 15, die Musik der Animation A auszugeben.
  • Wie oben beschrieben, kann, entsprechend dem ersten Verarbeitungsbeispiel, die Informationsverarbeitungsvorrichtung 1 Verarbeitung von Interesse, angezeigt durch eine uneindeutige Sprachoperation, spezifizieren, durch Veranlassen, dass das Verarbeitungsdetail aus den Auswahlmöglichkeiten der Verarbeitungsdetails entsprechend der Sprachoperation ausgewählt wird.
  • [Zweites Verarbeitungsbeispiel gemäß der ersten Ausführungsform]
  • 4 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung 1 ausgeführten Verarbeitung gemäß der ersten Ausführungsform darstellend. In 4 wird die Wortfolge „Zeig' mir das Wetter“ als ein Makro entsprechend der Verarbeitung zum Anzeigen des heutigen Wetters für den Bereich A registriert. Andererseits wird, in einem anfänglichen Zustand, in dem kein Makro registriert ist, davon ausgegangen, dass die Wortfolge „Zeig' mir das Wetter“ die Anzeige des morgigen Wetters im ganzen Land angibt.
  • Die Bildausgabeeinheit 16 zeigt einen Eingabebildschirm an, der eine Sprachoperation empfängt. Der semantische Äußerungsanalysator 101 empfängt die Äußerung „Zeig' mir das Wetter“ vom Benutzer. Der semantische Äußerungsanalysator 101 empfängt eine Sprachoperation, die eine spezifische Wortfolge angibt, die mit einem spezifischen Verarbeitungsdetail verknüpft ist. Mit anderen Worten, der semantische Äußerungsanalysator 101 empfängt eine Sprachoperation „Animation A abspielen“.
  • Die Verarbeitungsdetail-Ableiteeinheit 104 extrahiert ein mit der Wortfolge verknüpftes Verarbeitungsdetail und ein aus der Bedeutung der Wortfolge im anfänglichen Zustand abgeleitetes Verarbeitungsdetail, in dem die Wortfolge nicht mit dem Verarbeitungsdetail verknüpft ist. Hier sagt der Benutzer „Zeig' mir das Wetter“, aber die Äußerung des Benutzers hat keinen Inhalt, der entweder die als ein Makro registrierte Operation oder die Operation im anfänglichen Zustand spezifiziert. Daher extrahiert die Verarbeitungsdetail-Ableiteeinheit 104 der Informationsverarbeitungsvorrichtung 1, als Verarbeitungsdetails, die Verarbeitung zum Anzeigen des heutigen Wetters für den Bereich A, registriert als Makro, und die Verarbeitung zum Anzeigen des morgigen Wetters im ganzen Land im anfänglichen Zustand aus der Verarbeitungsklassifizierungstabelle 111.
  • Die Antworterzeugungseinheit 106 erzeugt Antwortinformationen, die Bildschirminformationen enthalten, umfassend ein Bild, das Ergebnis der Verarbeitung zum Anzeigen des heutigen Wetters für den Bereich A darstellend, und ein Bild, das Ergebnis der Verarbeitung zum Anzeigen des morgigen Wetters im ganzen Land darstellend. Die Anzeigesteuerung 108 gibt die Antwortinformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus dem mit der durch die Sprachoperation angegebenen Wortfolge verknüpften Verarbeitungsdetail und dem aus der Bedeutung der Wortfolge im anfänglichen Zustand abgeleiteten Verarbeitungsdetail aus, in dem die Sprachoperation nicht mit dem Verarbeitungsdetail verknüpft ist. Beispielsweise veranlasst die Anzeigesteuerung 108 die Bildausgabeeinheit 16, nebeneinander, das Bild, das Ergebnis der Verarbeitung zum Anzeigen des heutigen Wetters für den Bereich A darstellend, und das Bild, das Ergebnis der Verarbeitung zum Anzeigen des morgigen Wetters im ganzen Land darstellend, anzuzeigen. Wenn zu diesem Zeitpunkt die Antwortinformationen Sprachinformationen enthalten, veranlasst die Sprachsteuerung 107 die Sprachausgabeeinheit 15, den Klang einer entsprechenden Stimme auszugeben.
  • In Reaktion auf die Ausgabe der Antwortinformationen sagt der Benutzer „Wie sieht es morgen aus?“. Der semantische Äußerungsanalysator 101 der Informationsverarbeitungsvorrichtung 1 empfängt eine Sprachoperation „Wie sieht es morgen aus?“. Die Verarbeitungsdetail-Ableiteeinheit 104 spezifiziert, als das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation, die Verarbeitung zum Anzeigen des morgigen Wetters im ganzen Land aus der Verarbeitung zum Anzeigen des heutigen Wetters für den Bereich A und der Verarbeitung zum Anzeigen des morgigen Wetters im ganzen Land. Dann führt die Verarbeitungsausführungseinheit 105 die Verarbeitung zum Anzeigen des morgigen Wetters im ganzen Land aus. Die Anzeigesteuerung 108 veranlasst die Bildausgabeeinheit 16, den Bildschirm mit dem morgigen Wetter im ganzen Land auszugeben.
  • Ein Beispiel, in dem das Bild des heutigen Wetters für den Bereich A und das Bild des morgigen Wetters im ganzen Land nebeneinander angezeigt werden, wurde Bezug nehmend auf 4 beschrieben. Es ist anzumerken, dass die Anzeigesteuerung 108 alternierend das Bild des heutigen Wetters für den Bereich A und das Bild des morgigen Wetters im ganzen Land anzeigen kann.
  • 5 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung 1 ausgeführten Verarbeitung gemäß der ersten Ausführungsform darstellend. Wie in 5 dargestellt, kann die Anzeigesteuerung 108 alternierend das Bild des heutigen Wetters für den Bereich A und das Bild des morgigen Wetters im ganzen Land anzeigen. Beispielsweise kann die Anzeigesteuerung 108 die Antwortinformationen, die Bildschirminformationen enthalten, ausgeben, wobei mehrere durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierte Verarbeitungsdetails jeweils nach einer festen Zeitspanne alternierend angezeigt werden. Das heißt, dass die Anzeigesteuerung 108 jeweils nach einer festen Zeitspanne alternierend das Bild des heutigen Wetters für den Bereich A und das Bild des morgigen Wetters im ganzen Land anzeigt.
  • In Reaktion auf die Ausgabe der Antwortinformationen sagt der Benutzer „Nicht dieses“. Der semantische Äußerungsanalysator 101 der Informationsverarbeitungsvorrichtung 1 empfängt die Äußerung „Nicht dieses“. Die Verarbeitungsdetail-Ableiteeinheit 104 spezifiziert, als das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation, die Verarbeitung zum Anzeigen eines Bildes, das von dem Bild verschieden ist, das das aktuell angezeigte Ergebnis der Verarbeitung zum Anzeigen des heutigen Wetters für den Bereich A und der Verarbeitung zum Anzeigen des morgigen Wetters im ganzen Land darstellt. Das heißt, die Verarbeitungsdetail-Ableiteeinheit 104 spezifiziert die Verarbeitung zum Anzeigen des morgigen Wetters im ganzen Land als das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation. Dann führt die Verarbeitungsausführungseinheit 105 die Verarbeitung zum Anzeigen des morgigen Wetters im ganzen Land aus. Die Anzeigesteuerung 108 veranlasst die Bildausgabeeinheit 16, den Bildschirm mit dem morgigen Wetter im ganzen Land auszugeben.
  • Wie oben beschrieben, kann, entsprechend dem zweiten Verarbeitungsbeispiel, die Informationsverarbeitungsvorrichtung 1 Verarbeitung von Interesse, angezeigt durch eine uneindeutige Sprachoperation, spezifizieren, durch Veranlassen, dass das Verarbeitungsdetail aus den Auswahlmöglichkeiten der Verarbeitungsdetails entsprechend der Sprachoperation ausgewählt wird.
  • [Drittes Verarbeitungsbeispiel gemäß der ersten Ausführungsform]
  • 6 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung 1 ausgeführten Verarbeitung gemäß der ersten Ausführungsform darstellend. Ferner stellt 6 Verarbeitung zum Durchführen einer Internetsuche durch die Sprachoperation dar.
  • Wenn der Benutzer auf einem Suchbildschirm „Smartphone suchen“ sagt, zeigt die Anzeigesteuerung 108 einen Suchergebnisbildschirm an, der das Ergebnis der Suche nach einem Smartphone zeigt. Der Benutzer sagt auf dem Suchergebnisbildschirm ferner „Nach Hersteller A suchen“. Der semantische Äußerungsanalysator 101 empfängt eine Sprachoperation „Animation A abspielen“.
  • Die Verarbeitungsdetail-Ableiteeinheit 104 leitet ein Verarbeitungsdetail entsprechend der durch den Benutzer ausgegebenen Sprachoperation ab. Hier sagt der Benutzer „Nach Hersteller A suchen“, aber die Äußerung des Benutzers hat keinen Inhalt, der entweder die Hinzufügung eines Suchbegriffs oder eine neue Suche spezifiziert. Daher extrahiert die Verarbeitungsdetail-Ableiteeinheit 104, die Verarbeitungsdetail-Ableiteeinheit 104, als Verarbeitungsdetails, die Verarbeitung zum Suchen nach dem Hersteller A und die Verarbeitung zum Suchen nach einem Smartphone und dem Hersteller A aus der Verarbeitungsklassifizierungstabelle 111.
  • Die Antworterzeugungseinheit 106 erzeugt Antwortinformationen, die Bildschirminformationen enthalten, umfassend ein Bild, das das Ergebnis der Suche nach dem Hersteller A darstellt, und ein Bild, das das Ergebnis der Suche nach einem Smartphone und dem Hersteller A darstellt. Zu diesem Zeitpunkt erzeugt die Antworterzeugungseinheit 106 Antwortinformationen, die eine Identifizierungsnummer enthalten, die jedes Suchergebnis identifizierbar macht, dadurch das Suchergebnis spezifizierbar machend. Die Anzeigesteuerung 108 veranlasst die Bildausgabeeinheit 16, die in den Antwortinformationen enthaltenen Bildschirminformationen anzuzeigen. Wenn zu diesem Zeitpunkt die Antwortinformationen Sprachinformationen enthalten, veranlasst die Sprachsteuerung 107 die Sprachausgabeeinheit 15, den Klang einer entsprechenden Stimme auszugeben.
  • In Reaktion auf die Ausgabe der Antwortinformationen sagt der Benutzer „Zeig' mir die Nummer 4“. Der semantische Äußerungsanalysator 101 empfängt eine Sprachoperation „Zeig' mir die Nummer 4“. Das heißt, der semantische Äußerungsanalysator 101 empfängt eine Sprachoperation, die die Anzeige des Ergebnisses der Suche nach einem Smartphone und dem Hersteller A anfordert. Die Verarbeitungsdetail-Ableiteeinheit 104 spezifiziert, als das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation, die Verarbeitung zum Suchen nach einem Smartphone und dem Hersteller A aus der Verarbeitung zum Suchen nach dem Hersteller A und der Verarbeitung zum Suchen nach einem Smartphone und dem Hersteller A. Dann führt die Verarbeitungsausführungseinheit 105 die Verarbeitung zum Suchen nach einem Smartphone und dem Hersteller A aus. Die Anzeigesteuerung 108 veranlasst die Bildausgabeeinheit 16, Bildschirminformationen auszugeben, die das Ergebnis der Suche nach einem Smartphone und dem Hersteller A darstellen, das heißt, das Ergebnis der Suche nach der Nummer 4.
  • Wie oben beschrieben, kann, entsprechend dem dritten Verarbeitungsbeispiel, die Informationsverarbeitungsvorrichtung 1 Verarbeitung von Interesse, angezeigt durch eine uneindeutige Sprachoperation, spezifizieren, durch Veranlassen, dass das Verarbeitungsdetail aus den Auswahlmöglichkeiten der Verarbeitungsdetails entsprechend der Sprachoperation ausgewählt wird.
  • [Viertes Verarbeitungsbeispiel gemäß der ersten Ausführungsform]
  • 7 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung 1 ausgeführten Verarbeitung gemäß der ersten Ausführungsform darstellend. 7 stellt ferner eine Verarbeitung zum Eingeben verschiedener Typen von Informationen in eine Nachrichtenanwendung, wie etwa Mail, durch die Sprachoperation dar.
  • Die Anzeigesteuerung 108 zeigt einen Nachrichteneingabebildschirm an. Ferner hebt die Anzeigesteuerung 108 ein Adresseintragsfeld hervor, wo eine Adresse einer Nachricht eingegeben wird. Des Weiteren gibt die Sprachsteuerung 107 den Klang einer Stimme „Bitte Adresse eingeben“ aus. Dies veranlasst die Informationsverarbeitungsvorrichtung 1, den Eintrag einer Adresse anzufordern.
  • Die Anzeigesteuerung 108 hebt ein Titeleintragsfeld hervor, wo ein Titel eingegeben wird. Des Weiteren gibt die Sprachsteuerung 107 den Klang einer Stimme „Bitte Titel eingeben“ aus. Dies veranlasst die Informationsverarbeitungsvorrichtung 1, den Eintrag eines Titels anzufordern.
  • Die Anzeigesteuerung 108 hebt ein Nachrichteneintragsfeld hervor, wo eine Nachricht eingegeben wird, die als Nachrichtentext dient. Des Weiteren gibt die Sprachsteuerung 107 den Klang einer Stimme „Bitte Nachricht eingeben“ aus. Dies veranlasst die Informationsverarbeitungsvorrichtung 1, den Eintrag einer Nachricht anzufordern.
  • In einem solchen Zustand sagt der Benutzer „Adresse ändern“. Der semantische Äußerungsanalysator 101 empfängt eine Sprachoperation „Adresse ändern“. Hier sagt der Benutzer „Adresse ändern“, aber die Äußerung des Benutzers hat keinen Inhalt, der entweder eine Operation des Eingebens einer Nachricht „Adresse ändern“ oder eine Operation des Änderns der Adresse im Adresseintragsfeld spezifiziert. Daher extrahiert die Verarbeitungsdetail-Ableiteeinheit 104, als das Verarbeitungsdetail entsprechend der Sprachoperation, eine Verarbeitungsausführungsanweisung und einen Eintrag einer Zeichenfolge durch die Sprachoperation. Das heißt, die Verarbeitungsdetail-Ableiteeinheit 104 extrahiert die Verarbeitung zum Eingeben der Nachricht „Adresse ändern“ und der Verarbeitung zum Ändern der Adresse.
  • Die Antworterzeugungseinheit 106 erzeugt Antwortinformationen, die Bildschirminformationen enthalten, die ein Verfahren zum Auswählen eines Verarbeitungsdetails aus mehreren Verarbeitungsdetails darstellen. Beispielweise erzeugt die Antworterzeugungseinheit 106 Antwortinformationen, die Bildschirminformationen enthalten, umfassend ein Bild des Nachrichteneintragsfeldes, in dem eine Nachricht „Adresse ändern“ eingegeben wurde, und ein Benachrichtigungsbild, das zeigt „Zum Ändern der Adresse ,Jetzt ausführen' sagen“. Ferner können die Antwortinformationen Sprachinformationen enthalten, die das Verfahren zum Auswählen eines Verarbeitungsdetails aus mehreren Verarbeitungsdetails darstellen. Beispielsweise können die Antwortinformationen Sprachinformationen wie „Zum Ändern der Adresse ,Jetzt ausführen' sagen“ enthalten.
  • Die Anzeigesteuerung 108 gibt die Antwortinformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus der Verarbeitungsausführungsanweisung und zum Eintrag einer Zeichenfolge aus. Das heißt, die Anzeigesteuerung 108 veranlasst die Bildausgabeeinheit 16, die in den Antwortinformationen enthaltenen Bildschirminformationen anzuzeigen. Wenn ferner die Antwortinformationen die Sprachinformationen enthalten, veranlasst die Sprachsteuerung 107 die Sprachausgabeeinheit 15, den Klang einer entsprechenden Stimme auszugeben.
  • Wie oben beschrieben, kann, entsprechend dem vierten Verarbeitungsbeispiel, die Informationsverarbeitungsvorrichtung 1 Verarbeitung von Interesse, angezeigt durch eine uneindeutige Sprachoperation, spezifizieren, durch Ausgeben des Verfahrens zum Auswählen des Verarbeitungsdetails entsprechend der Sprachoperation.
  • [Fünftes Verarbeitungsbeispiel gemäß der ersten Ausführungsform]
  • 8 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung 1 ausgeführten Verarbeitung gemäß der ersten Ausführungsform darstellend. Der in 8 dargestellte Fluss der Verarbeitung veranschaulicht, dass, wenn die Anzahl von Verarbeitungsdetails, die in den Antwortinformationen enthalten sind, das heißt, die Anzahl von Verarbeitungsdetails entsprechend der Äußerung des Benutzers, gleich oder größer als eine Schwelle ist, eine Phrase angezeigt wird, die ein entsprechendes Verarbeitungsdetail spezifizierbar macht.
  • Der Benutzer sagt „Animation A abspielen“. Wie in dem in 3 dargestellten Fall extrahiert die Verarbeitungsdetail-Ableiteeinheit 104, als Verarbeitungsdetails, die Verarbeitung zum Abspielen eines Videos und die Verarbeitung zum Abspielen von Musik aus der Verarbeitungsklassifizierungstabelle 111. Die Anzeigesteuerung 108 zeigt einen Bildschirm an, der das Videowiedergabebild enthält, wo ein Video abgespielt wird, und das Musikwiedergabebild enthält, wo Musik abgespielt wird.
  • In einem solchen Zustand sagt der Benutzer „Wie sieht es morgen aus?“. Der semantische Äußerungsanalysator 101 empfängt eine Sprachoperation „Wie sieht es morgen aus?“. Hier hat die Äußerung des Benutzers keinen Inhalt, der einen Abbruch der Wiedergabe eines Videos oder einen Abbruch der Wiedergabe von Musik anzeigt. Daher extrahiert die Verarbeitungsdetail-Ableiteeinheit 104, als ein Verarbeitungsdetail, die Verarbeitung zum Anzeigen einer morgigen Planung aus der Verarbeitungsklassifizierungstabelle 111, zusätzlich zur Verarbeitung zum Abspielen eines Videos und der Verarbeitung zum Abspielen von Musik, extrahiert durch die erste Sprachoperation.
  • Es wird davon ausgegangen, dass die Anzahl von durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails im Ergebnis des Hinzufügens der Verarbeitung zum Anzeigen der morgigen Planung gleich oder größer als die Schwelle wird. Das heißt, es wird davon ausgegangen, dass die Anzahl von Verarbeitungsdetails entsprechend der Sprachoperation, ausgegeben durch den Benutzer, gleich oder größer als die Schwelle wird. In diesem Fall erzeugt die Antworterzeugungseinheit 106 Antwortinformationen, die Bildschirminformationen enthalten, die eine Phrase darstellen, die ein entsprechendes der mehreren Verarbeitungsdetails spezifizierbar macht. Daher enthalten die Antwortinformationen „Zeig' mir ein anderes Video“, was eine Phrase zum Spezifizieren der Verarbeitung zum Abspielen eines Videos ist, „Wie sieht es mit der Planung für morgen aus?“, was eine Phrase zum Spezifizieren der Verarbeitung zum Abspielen von Musik ist, und „Spiel' den Titel“, was eine Phrase zum Spezifizieren der Verarbeitung zum Anzeigen einer Planung ist. Dann veranlasst die Anzeigesteuerung 108 die Bildausgabeeinheit 16, in den Antwortinformationen enthaltene Bildschirminformationen anzuzeigen. Es ist anzumerken, dass solche Phrasen nicht nur über die Bildschirmanzeige ausgegeben werden können, sondern auch als Klang einer Stimme. In diesem Fall enthalten die Antwortinformationen Sprachinformationen zu den Phrasen.
  • Wie oben beschrieben, gibt, gemäß dem fünften Verarbeitungsbeispiel, die Informationsverarbeitungsvorrichtung 1 eine Phrase aus, die jedes Verarbeitungsdetail entsprechend der Sprachoperation anzeigt, um dem Benutzer zu ermöglichen, einfach ein Verarbeitungsdetail auszuwählen. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1, Verarbeitung von Interesse zu spezifizieren, angezeigt durch eine uneindeutige Sprachoperation.
  • [Sechstes Verarbeitungsbeispiel gemäß der ersten Ausführungsform]
  • 9 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung 1 ausgeführten Verarbeitung gemäß der ersten Ausführungsform darstellend. Der in 9 dargestellte Fluss von Verarbeitung veranschaulicht, dass Veranlassen, dass eine Anwendung, die die einzelnen Verarbeitungsdetails ausführt, ausgewählt wird, bewirkt, dass Verarbeitungsdetails eingeengt werden.
  • Wie in dem in 8 dargestellten Fall extrahiert die Verarbeitungsdetail-Ableiteeinheit 104, als Verarbeitungsdetails, die Verarbeitung zum Abspielen eines Videos, die Verarbeitung zum Abspielen von Musik und die Verarbeitung zum Anzeigen der morgigen Planung aus der Verarbeitungsklassifizierungstabelle 111. In diesem Fall wird davon ausgegangen, dass die Anzahl von Anwendungen, die jeweils ein entsprechendes Verarbeitungsdetail ausführen, drei ist: eine Anwendung, die ein Video abspielt, eine Anwendung, die Musik abspielt, und eine Anwendung, die die morgige Planung anzeigt. Dann wird davon ausgegangen, dass die Anzahl von Anwendungen, die jeweils ein entsprechendes der durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails ausführen, gleich oder größer als die Schwelle ist.
  • Wenn die Anzahl von Anwendungen, die jeweils eine entsprechende der durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails ausführen, gleich oder größer als die Schwelle ist, erzeugt die Antworterzeugungseinheit 106 Antwortinformationen, die Bildschirminformationen zum Treffen einer Auswahl einer Anwendung enthalten. Beispielsweise erzeugt die Antworterzeugungseinheit 106 Antwortinformationen, die Sprachinformationen enthalten, umfassend eine Phrase „Video abspielen, Musik abspielen oder eine Planung anzeigen?“, um eine Auswahl einer Anwendung zu treffen. Die Sprachsteuerung 107 veranlasst die Sprachausgabeeinheit 15, die so erzeugten Antwortinformationen auszugeben. Ferner kann die Antworterzeugungseinheit 106 Antwortinformationen erzeugen, die Bildschirminformationen enthalten, die veranlassen, dass die Phrase „Video abspielen, Musik abspielen oder eine Planung anzeigen?“ angezeigt wird, um eine Auswahl einer anzuzeigenden Anwendung zu treffen. In diesem Fall veranlasst die Anzeigesteuerung 108 die Bildausgabeeinheit 16, die in den Antwortinformationen enthaltenen Bildschirminformationen anzuzeigen. Das heißt, wenn die Anzahl von Anwendungen, die jeweils eine entsprechende der durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails ausführen, gleich oder größer als die Schwelle ist, gibt die Anzeigesteuerung 108 die Antwortinformationen zum Treffen einer Auswahl einer Anwendung aus.
  • In Reaktion auf die Ausgabe der Antwortinformationen sagt der Benutzer „Video abspielen“. Der semantische Äußerungsanalysator 101 empfängt eine vom Benutzer ausgegebene Sprachoperation „Video abspielen“. Dies veranlasst die Verarbeitungsdetail-Ableiteeinheit 104, die Anwendung, die ein Video abspielt, als die Anwendung zu spezifizieren, die das Verarbeitungsdetail entsprechend der durch den Benutzer ausgegebenen Sprachoperation ausführt. Daher spezifiziert die Verarbeitungsdetail-Ableiteeinheit 104, als das Verarbeitungsdetail entsprechend der durch den Benutzer ausgegebenen Sprachoperation, die Verarbeitung zum Abspielen eines Videos aus der Verarbeitung zum Abspielen eines Videos, der Verarbeitung zum Abspielen von Musik und der Verarbeitung zum Anzeigen der morgigen Planung. Die Verarbeitungsausführungseinheit 105 führt die Verarbeitung zum Abspielen eines Videos aus. Dann veranlasst die Anzeigesteuerung 108 die Bildausgabeeinheit 16, die Verarbeitung zum Abspielen eines Videos anzuzeigen.
  • Wie oben beschrieben, kann, gemäß dem sechsten Verarbeitungsbeispiel, die Informationsverarbeitungsvorrichtung 1 mehrere Verarbeitungsdetails einengen, durch Veranlassen, dass eine Anwendung, die das Verarbeitungsdetail entsprechend der Sprachoperation ausführt, ausgewählt wird. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1, Verarbeitung von Interesse zu spezifizieren, angezeigt durch eine uneindeutige Sprachoperation.
  • [Siebtes Verarbeitungsbeispiel gemäß der ersten Ausführungsform]
  • 10 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung 1 ausgeführten Verarbeitung gemäß der ersten Ausführungsform darstellend. Der in 10 dargestellte Fluss von Verarbeitung veranschaulicht, dass, wenn die Anzahl von Verarbeitungsdetails entsprechend der durch den Benutzer ausgegebenen Sprachoperation gleich oder größer als die Schwelle wird, Antwortinformationen, die Bildschirminformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus Verarbeitungsdetails entsprechend der vorher empfangenen Sprachoperation enthalten, ausgegeben werden.
  • Der Benutzer sagt „Zeig's mir“, während das Videowiedergabebild angezeigt wird. Der semantische Äußerungsanalysator 101 empfängt eine vom Benutzer ausgegebene Sprachoperation „Zeig's mir“. Der Benutzer sagt „Zeig's mir“, aber die Äußerung des Benutzers hat keinen Inhalt, der ein Objekt von Interesse spezifiziert. Daher extrahiert die Verarbeitungsdetail-Ableiteeinheit 104, als Verarbeitungsdetails, die Verarbeitung zum Abspielen eines Videos, die Verarbeitung zum Anzeigen einer Kurzfassung eines Videos und der Verarbeitung zum Anzeigen von Informationen zu einem Video aus der Verarbeitungsklassifizierungstabelle 111.
  • Die Antworterzeugungseinheit 106 erzeugt Antwortinformationen, die Bildschirminformationen enthalten, umfassend ein Videowiedergabebild, wo ein Video abgespielt wird, ein Kurzfassungsbild, wo eine Kurzfassung eines Videos angezeigt wird, und ein Videoinformationsbild, wo Informationen zu einem Video angezeigt werden. Die Anzeigesteuerung 108 veranlasst die Bildausgabeeinheit 16, die in den Antwortinformationen enthaltenen Bildschirminformationen anzuzeigen.
  • In einem solchen Zustand sagt der Benutzer „Mehr“. Der semantische Äußerungsanalysator 101 empfängt eine vom Benutzer ausgegebene Sprachoperation „Mehr“.
    Hier, da der Benutzer „Mehr“ sagt, leitet die Verarbeitungsdetail-Ableiteeinheit 104 ab, dass der Benutzer eine Anforderung zur weiteren Anzeige von etwas gegeben hat. Der Benutzer spezifiziert allerdings kein Objekt von Interesse aus dem Video, der Kurzfassung und den Videoinformationen.
  • Daher extrahiert die Verarbeitungsdetail-Ableiteeinheit 104 mehrere Verarbeitungsdetails im Zusammenhang mit dem Video, der Kurzfassung und den Videoinformationen aus der Verarbeitungsklassifizierungstabelle 111. Für das Video extrahiert die Verarbeitungsdetail-Ableiteeinheit 104, beispielsweise, die Verarbeitung zum Anzeigen eines anderen Videos. Für die Kurzfassung extrahiert die Verarbeitungsdetail-Ableiteeinheit 104, beispielsweise, die Verarbeitung zum Anzeigen einer Kurzfassung eines anderen Videos oder die Verarbeitung zum Anzeigen einer detaillierteren Kurzfassung. Für die Videoinformationen extrahiert die Verarbeitungsdetail-Ableiteeinheit 104, beispielsweise, die Verarbeitung zum Anzeigen einer Website, die das Video erklärt, oder die Verarbeitung zum Anzeigen von Informationen, wie etwa einer Geschichte.
  • Wie oben beschrieben, neigt, bei Empfang der Sprachoperation ohne Spezifizieren eines Objekts von Interesse, die Verarbeitungsdetail-Ableiteeinheit 104 dazu, eine große Anzahl von Verarbeitungsdetails zu extrahieren. Die Informationsverarbeitungsvorrichtung 1 ist, allerdings, im Anzeigebereich oder ähnlichem endlich und kann daher möglicherweise nicht alle der großen Anzahl von Verarbeitungsdetails anzeigen. Ferner ist es, selbst wenn es möglich ist, alle der großen Anzahl von Verarbeitungsdetails anzuzeigen, schwierig, ein gewünschtes Verarbeitungsdetail aus der großen Anzahl von Verarbeitungsdetails zu finden.
  • Wenn daher die Anzahl von durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails gleich oder größer als die Schwelle ist, erzeugt die Antworterzeugungseinheit 106 Antwortinformationen, die Bildschirminformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus den Verarbeitungsdetails entsprechend der vorher durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation enthalten. Beispielsweise erzeugt die Antworterzeugungseinheit 106 Antwortinformationen, die Sprachinformationen enthalten, zum Ausgeben des Klanges einer Stimme „Video, Kurzfassung oder Videoinformationen abspielen“. Wenn ferner die Antwortinformationen die Sprachinformationen enthalten, veranlasst die Sprachsteuerung 107 die Sprachausgabeeinheit 15, den Klang einer entsprechenden Stimme auszugeben. Das heißt, wenn die Anzahl von durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails gleich oder größer als die Schwelle ist, gibt die Sprachsteuerung 107 Antwortinformationen aus, die Bildschirminformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus den Verarbeitungsdetails entsprechend der vorher durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation enthalten.
  • In Reaktion auf die Ausgabe der Antwortinformationen sagt der Benutzer „Video abspielen“. Der semantische Äußerungsanalysator 101 empfängt eine vom Benutzer ausgegebene Sprachoperation „Video abspielen“. Dies veranlasst die Verarbeitungsdetail-Ableiteeinheit 104 zu spezifizieren, dass das Verarbeitungsdetail entsprechend der durch den Benutzer ausgegebenen Sprachoperation die Wiedergabe eines Videos ist. Dann veranlasst die Anzeigesteuerung 108 die Bildausgabeeinheit 16, die Verarbeitung zum Abspielen eines Videos anzuzeigen.
  • Wie oben beschrieben, kann, gemäß dem siebten Verarbeitungsbeispiel, die Informationsverarbeitungsvorrichtung 1 mehrere Verarbeitungsdetails einengen, durch Veranlassen, dass das Verarbeitungsdetail entsprechend der vorherigen Sprachoperation ausgewählt wird. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1, Verarbeitung von Interesse zu spezifizieren, angezeigt durch eine uneindeutige Sprachoperation.
  • [Achtes Verarbeitungsbeispiel gemäß der ersten Ausführungsform]
  • 11 ist ein Diagramm, ein Beispiel des Flusses einer durch die Informationsverarbeitungsvorrichtung 1 ausgeführten Verarbeitung gemäß der ersten Ausführungsform darstellend. Der in 11 dargestellte Fluss von Verarbeitung veranschaulicht, dass, wenn die Anzahl von Verarbeitungsdetails entsprechend der durch den Benutzer ausgegebenen Sprachoperation gleich oder größer als die Schwelle ist, Veranlassen, dass eine Verarbeitungskategorie ausgewählt wird, bewirkt, dass Verarbeitungsdetails eingeengt werden.
  • Der Benutzer sagt „Ich habe eine Bitte“, während das Videowiedergabebild im anfänglichen Zustand angezeigt wird. Der semantische Äußerungsanalysator 101 empfängt eine vom Benutzer ausgegebene Sprachoperation „Ich habe eine Bitte“. Hier sagt der Benutzer „Ich habe eine Bitte“, um etwas Verarbeitung anzufordern. Der Benutzer spezifiziert allerdings kein Objekt von Interesse. Die Verarbeitungsdetail-Ableiteeinheit 104 extrahiert mehrere Verarbeitungsdetails aus der Verarbeitungsklassifizierungstabelle 111.
  • Zu diesem Zeitpunkt wird davon ausgegangen, dass die Verarbeitungsdetail-Ableiteeinheit 104 eine Anzahl von Verarbeitungsdetails extrahiert hat, die gleich oder größer als die Schwelle ist. Da dies allerdings der anfängliche Zustand des Videowiedergabebilds ist, das heißt, das erste Mal, dass die Verarbeitungsdetails extrahiert werden, können die Verarbeitungsdetails entsprechend der Sprachoperation durch Spezifizieren von mehreren vorher extrahierten Verarbeitungsdetails nicht eingeengt werden. Wenn daher die Anzahl der mehreren durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails gleich oder größer als die Schwelle ist, erzeugt die Antworterzeugungseinheit 106 Antwortinformationen zum Treffen einer Auswahl einer Kategorie des Verarbeitungsdetails. Es ist anzumerken, dass dies, für die Antworterzeugungseinheit 106, nicht auf eine Kategorie begrenzt ist und eine Operation auf einer höheren Ebene als die extrahierte Operation, eine Anwendung oder eine Anmeldungskategorie sein kann.
  • Beispielsweise erzeugt die Antworterzeugungseinheit 106 Antwortinformationen, die Anzeigen eines Videos, Erstellen einer Wiedergabeliste und Ändern von Einstellungen als eine Kategorie von Verarbeitungsdetails enthält. Beispielsweise erzeugt die Antworterzeugungseinheit 106 Antwortinformationen, die Sprachinformationen enthalten, zum Ausgeben des Klanges einer Stimme, wie beispielsweise „Möchten Sie ein Video ansehen, eine Wiedergabeliste erstellen oder die Einstellungen ändern?“. Wenn dann die Anzahl der mehreren durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails gleich oder größer als die Schwelle ist, gibt die Sprachsteuerung 107 die Antwortinformationen zum Treffen einer Auswahl einer Kategorie des Verarbeitungsdetails aus. Das heißt, die Sprachsteuerung 107 gibt den Klang einer Stimme, wie beispielsweise „Möchten Sie ein Video ansehen, eine Wiedergabeliste erstellen oder die Einstellungen ändern?“ basierend auf den in den Antwortinformationen enthaltenen Sprachinformationen aus. Es ist anzumerken, dass die Antworterzeugungseinheit 106 Antwortinformationen erzeugen kann, die Bildschirminformationen enthalten. In diesem Fall veranlasst die Anzeigesteuerung 108 die Bildausgabeeinheit 16, einen Bildschirm zum Treffen einer Auswahl einer Kategorie des Verarbeitungsdetails basierend auf den in den Antwortinformationen enthaltenen Bildschirminformationen anzuzeigen.
  • In Reaktion auf die Ausgabe der Antwortinformationen sagt der Benutzer „Ich möchte ein Video ansehen“. Der semantische Äußerungsanalysator 101 empfängt eine vom Benutzer ausgegebene Sprachoperation „Ich möchte ein Video ansehen“. Dies veranlasst die Verarbeitungsdetail-Ableiteeinheit 104, eine Kategorie des Verarbeitungsdetails entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation zu spezifizieren. Ferner erzeugt die Verarbeitungsdetail-Ableiteeinheit 104 Antwortinformationen, die mehrere Verarbeitungsdetails enthalten, die zu der so spezifizierten Kategorie gehören. Das heißt, die Antworterzeugungseinheit 106 erzeugt Antwortinformationen, die Bildschirminformationen enthalten, umfassend ein Videowiedergabebild, wo ein Video abgespielt wird, ein Kurzfassungsbild, wo eine Kurzfassung eines Videos angezeigt wird, und ein Videoinformationsbild, wo Informationen zu einem Video angezeigt werden. Ferner veranlasst die Anzeigesteuerung 108 die Bildausgabeeinheit 16, die in den Antwortinformationen enthaltenen Bildschirminformationen anzuzeigen.
  • Wie oben beschrieben, kann, gemäß dem siebten Verarbeitungsbeispiel, die Informationsverarbeitungsvorrichtung 1 mehrere Verarbeitungsdetails einengen, durch Veranlassen, dass eine Kategorie des Verarbeitungsdetails entsprechend der Sprachoperation ausgewählt wird. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1, Verarbeitung von Interesse zu spezifizieren, angezeigt durch eine uneindeutige Sprachoperation.
  • [Fluss der Spezifizierverarbeitung gemäß der ersten Ausführungsform]
  • Als nächstes wird eine Beschreibung einer durch die Informationsverarbeitungsvorrichtung 1 ausgeführten Spezifizierverarbeitung gemäß der ersten Ausführungsform gegeben. Die Spezifizierverarbeitung ist Verarbeitung zum Spezifizieren eines Verarbeitungsdetails entsprechend einer Äußerung eines Benutzers. 12 ist ein Flussdiagramm, ein Beispiel der durch die Informationsverarbeitungsvorrichtung 1 ausgeführten Spezifizierverarbeitung gemäß der ersten Ausführungsform darstellend.
  • Der semantische Äußerungsanalysator 101 empfängt eine Operation in der Form einer Äußerung eines Benutzers (Schritt S1) . Mit anderen Worten, der semantische Äußerungsanalysator 101 empfängt eine Sprachoperation.
  • Die Verarbeitungsdetail-Ableiteeinheit 104 bestimmt, ob das Verarbeitungsdetail entsprechend der Äußerung des Benutzers spezifiziert werden kann (Schritt S2). Das heißt, die Verarbeitungsdetail-Ableiteeinheit 104 bestimmt, ob es mehrere Anwendungskategorien, Anwendungen, Verarbeitungskategorien oder Verarbeitungsdetails entsprechend der Sprachoperation gibt. Wenn das Verarbeitungsdetail spezifiziert werden kann, da es nur ein Verarbeitungsdetail entsprechend der durch den Benutzer ausgegebenen Sprachoperation (Schritt S2; Nein) gibt, fährt die Informationsverarbeitungsvorrichtung 1 mit Schritt S1 fort und empfängt die nächste durch den Benutzer ausgegebene Sprachoperation.
  • Wenn das Verarbeitungsdetail nicht spezifiziert werden kann, da es mehrere Verarbeitungsdetails entsprechend der durch den Benutzer ausgegebenen Sprachoperation gibt (Schritt S2; Ja), bestimmt die Verarbeitungsdetail-Ableiteeinheit 104, ob die Anzahl von extrahierten Anwendungen gleich oder größer als die Schwelle ist (Schritt S3). Wenn die Anzahl von Anwendungen kleiner als die Schwelle ist (Schritt S3; Nein), fährt die Informationsverarbeitungsvorrichtung 1 mit Schritt S6 fort.
  • Wenn die Anzahl von Anwendungen gleich oder größer als die Schwelle ist (Schritt S3; Ja), gibt die Anzeigesteuerung 108 oder die Sprachausgabeeinheit 15 Antwortinformationen zum Treffen einer Auswahl aus den Anwendungen aus (Schritt S4). Noch spezieller erzeugt die Antworterzeugungseinheit 106 Antwortinformationen zum Einengen der mehreren Anwendungen, die die mehreren durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails ausführen. Beispielsweise erzeugt die Antworterzeugungseinheit 106 Antwortinformationen zum Treffen einer Auswahl zumindest einer Anwendung aus den mehreren Anwendungen. Die Anzeigesteuerung 108 oder die Sprachausgabeeinheit 15 gibt die Antwortinformationen aus.
  • Der semantische Äußerungsanalysator 101, der Sensorinformationsanalysator 102 oder die Operationssteuerung 103 empfängt eine Operation zum Treffen einer Auswahl zumindest einer Anwendung aus den mehreren Anwendungen (Schritt S5).
  • Die Verarbeitungsdetail-Ableiteeinheit 104 bestimmt, ob die Anzahl von Verarbeitungsdetails entsprechend der Äußerung des Benutzers gleich oder größer als die Schwelle ist (Schritt S6). Wenn die Anzahl von Verarbeitungsdetails kleiner als die Schwelle ist (Schritt S6; Nein), fährt die Informationsverarbeitungsvorrichtung 1 mit Schritt S12 fort.
  • Wenn die Anzahl von Verarbeitungsdetails entsprechend der Äußerung des Benutzers gleich oder größer als die Schwelle ist (Schritt S6; Ja), bestimmt die Verarbeitungsdetail-Ableiteeinheit 104, ob es ein extrahiertes Verarbeitungsdetail entsprechend der vorherigen Sprachoperation gibt (Schritt S7).
  • Wenn es ein extrahiertes Verarbeitungsdetail entsprechend der vorherigen Sprachoperation gibt (Schritt S7; Ja), gibt die Anzeigesteuerung 108 oder die Sprachausgabeeinheit 15 Antwortinformationen zum Treffen einer Auswahl des vorherigen Verarbeitungsdetails aus (Schritt S8). Noch spezieller erzeugt die Antworterzeugungseinheit 106 Antwortinformationen zum Treffen einer Auswahl zumindest eines Verarbeitungsdetails aus mehreren der vorherigen Verarbeitungsdetails. Die Anzeigesteuerung 108 oder die Sprachausgabeeinheit 15 gibt die Antwortinformationen aus.
  • Der semantische Äußerungsanalysator 101, der Sensorinformationsanalysator 102 oder die Operationssteuerung 103 empfängt eine Operation zum Treffen einer Auswahl zumindest eines Verarbeitungsdetails aus den mehreren vorherigen Verarbeitungsdetails (Schritt S9).
  • Wenn es kein extrahiertes Verarbeitungsdetail entsprechend der vorherigen Sprachoperation gibt (Schritt S7; Nein), gibt die Anzeigesteuerung 108 oder die Sprachausgabeeinheit 15 Antwortinformationen zum Treffen einer Auswahl einer Kategorie eines durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails aus (Schritt S10). Noch spezieller erzeugt die Antworterzeugungseinheit 106 Antwortinformationen zum Treffen einer Auswahl zumindest einer Kategorie aus mehreren Kategorien von durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails. Die Anzeigesteuerung 108 oder die Sprachausgabeeinheit 15 gibt die Antwortinformationen aus.
  • Der semantische Äußerungsanalysator 101, der Sensorinformationsanalysator 102 oder die Operationssteuerung 103 empfängt eine Operation zum Treffen einer Auswahl zumindest einer Kategorie aus den mehreren Kategorien (Schritt S11).
  • Die Verarbeitungsdetail-Ableiteeinheit 104 bestimmt, ob die Anzahl von Anwendungen kleiner als die Schwelle ist und die Anzahl von Verarbeitungsdetails kleiner als die Schwelle ist (Schritt S12). Wenn die Anzahl von Anwendungen gleich oder größer als die Schwelle ist oder die Anzahl von Verarbeitungsdetails gleich oder größer als die Schwelle ist (Schritt S12; Nein), fährt die Informationsverarbeitungsvorrichtung 1 bei Schritt S3 fort.
  • Wenn die Anzahl von Anwendungen kleiner als die Schwelle ist und die Anzahl von Verarbeitungsdetails kleiner als die Schwelle ist (Schritt S12; Ja), bestimmt die Verarbeitungsdetail-Ableiteeinheit 104, ob es mehrere der Verarbeitungsdetails gibt (Schritt S13). Das heißt, die Verarbeitungsdetail-Ableiteeinheit 104 bestimmt, ob das Verarbeitungsdetail entsprechend der durch den Benutzer ausgegebenen Sprachoperation spezifiziert werden kann.
  • Wenn das Verarbeitungsdetail entsprechend der durch den Benutzer ausgegebenen Sprachoperation nicht spezifiziert werden kann, weil es mehrere Verarbeitungsdetails gibt (Schritt S13; Ja), gibt die Anzeigesteuerung 108 oder die Sprachausgabeeinheit 15 Antwortinformationen aus, die eine Phrase zum Spezifizieren der Operation enthalten (Schritt S14). Noch spezieller erzeugt die Antworterzeugungseinheit 106 Antwortinformationen, die eine Phrase zum Spezifizieren des Verarbeitungsdetails enthalten. Die Anzeigesteuerung 108 oder die Sprachausgabeeinheit 15 gibt die Antwortinformationen aus. Dann fährt die Informationsverarbeitungsvorrichtung 1 bei Schritt S1 fort.
  • Wenn das Verarbeitungsdetail entsprechend der durch den Benutzer ausgegebenen Sprachoperation spezifiziert werden kann, weil es nur ein Verarbeitungsdetail gibt (Schritt S13; Nein), führt die Verarbeitungsausführungseinheit 105 das so spezifizierte Verarbeitungsdetail aus (Schritt S15). Noch spezieller, wenn nur ein Verarbeitungsdetail extrahiert wird, spezifiziert die Verarbeitungsdetail-Ableiteeinheit 104 das so extrahierte Verarbeitungsdetail als das Verarbeitungsdetail entsprechend der Äußerung des Benutzers. Die Verarbeitungsausführungseinheit 105 führt das durch die Verarbeitungsdetail-Ableiteeinheit 104 spezifizierte Verarbeitungsdetail aus.
  • Wie oben beschrieben, empfängt, in der Informationsverarbeitungsvorrichtung 1 gemäß der ersten Ausführungsform, der semantische Äußerungsanalysator 101 eine durch den Benutzer ausgegebene Sprachoperation. Die Verarbeitungs-Ableiteeinheit 104 extrahiert das Verarbeitungsdetail entsprechend der Sprachoperation aus der Verarbeitungsklassifizierungstabelle 111 basierend auf dem Ergebnis der durch den semantischen Äußerungsanalysator 101 durchgeführten Analyse der Äußerung des Benutzers entsprechend der Sprachoperation. Wenn das Verarbeitungsdetail entsprechend der Sprachoperation nicht spezifiziert werden kann, weil durch die Verarbeitungsdetail-Ableiteeinheit 104 mehrere Verarbeitungsdetails extrahiert werden, erzeugt die Antworterzeugungseinheit 106 Antwortinformationen zum Einengen der mehreren Verarbeitungsdetails. Das heißt, die Antworterzeugungseinheit 106 erzeugt Antwortinformationen zum Treffen einer Auswahl zumindest eines Verarbeitungsdetails aus den mehreren durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails. Ferner gibt die Sprachsteuerung 107 oder die Anzeigesteuerung 108 die Antwortinformationen über den Klang einer Stimme oder eine Anzeige aus. Dann spezifiziert die Verarbeitungsdetail-Ableiteeinheit 104 das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation basierend auf einer Operation des Auswählens eines in den Antwortinformationen oder ähnlichem enthaltenen Verarbeitungsdetails. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1, Verarbeitung von Interesse zu spezifizieren, angezeigt durch eine uneindeutige Sprachoperation.
  • (Zweite Ausführungsform)
  • [Struktur von Informationsverarbeitungsvorrichtung 1a gemäß der zweiten Ausführungsform]
  • 13 ist ein Diagramm, ein Beispiel eines Flusses einer durch eine Informationsverarbeitungsvorrichtung 1a ausgeführten Verarbeitung gemäß einer zweiten Ausführungsform darstellend. Wenn es mehrere Verarbeitungsdetails entsprechend einer durch den Benutzer ausgegebenen Sprachoperation gibt, kann die Informationsverarbeitungsvorrichtung 1a kein Verarbeitungsdetail entsprechend einer Äußerung eines Benutzers spezifizieren. Daher gibt die Informationsverarbeitungsvorrichtung 1a eine Antwort aus, um den Benutzer zu veranlassen, die Verarbeitungsdetails einzuengen. Spezieller gibt die Informationsverarbeitungsvorrichtung 1a Antwortinformationen zum Treffen einer Auswahl zumindest eines Verarbeitungsdetails aus den mehreren extrahierten Verarbeitungsdetails aus. Dann wählt der Benutzer ein Verarbeitungsdetail in Übereinstimmung mit den Antwortinformationen aus. Wie oben beschrieben, interagiert die Informationsverarbeitungsvorrichtung 1a mit dem Benutzer, um das Verarbeitungsdetail entsprechend der Äußerung des Benutzers zu spezifizieren.
  • Die Interaktion zwischen dem Benutzer und der Informationsverarbeitungsvorrichtung 1a, ist allerdings lästig für den Benutzer, und es ist daher erforderlich, die Häufigkeit von Interaktionen weiter zu verringern.
  • Beispielsweise gibt die Informationsverarbeitungsvorrichtung 1a Antwortinformationen aus, die eine Liste von Auswahlmöglichkeiten des Verarbeitungsdetails entsprechend der durch den Benutzer ausgegebenen Sprachoperation darstellen. Dann wählt der Benutzer ein Verarbeitungsdetail aus der Liste der Auswahlmöglichkeiten des Verarbeitungsdetails aus. Dies kann, von Zeit zu Zeit, die Häufigkeit von Interaktionen zwischen der Informationsverarbeitungsvorrichtung 1a und dem Benutzer verringern.
  • Es ist allerdings im Anzeigebereich begrenzt, wo die Antwortinformationen angezeigt werden können. Wenn ferner die entsprechenden Informationen über den Klang einer Stimme ausgegeben werden und der Klang einer Stimme, der das Verarbeitungsdetail anzeigt, für eine lange Zeit ausgegeben wird, ist die Operabilität verringert. Die Informationsverarbeitungsvorrichtung 1a gemäß der zweiten Ausführungsform gibt Antwortinformationen aus, die eine effizientere Verringerung der Häufigkeit von Interaktionen mit dem Benutzer ermöglichen.
  • Wie in 13 dargestellt, umfasst die Informationsverarbeitungsvorrichtung 1a gemäß der zweiten Ausführungsform eine Trenneinheit 109. Die Trenneinheit 109 ist ein Beispiel einer Trenneinheit. Die Trenneinheit 109 trennt mehrere extrahierte Verarbeitungsdetails in mehrere Gruppen. Noch spezieller trennt die Trenneinheit 109 mehrere durch eine Verarbeitungsdetail-Ableiteeinheit 104a extrahierte Verarbeitungsdetails in Gruppen, sodass die Häufigkeit von Interaktionen mit dem Benutzer effizienter verringert werden kann. Insbesondere erhält die Trenneinheit 109 einen Erwartungswert basierend auf einem Gewichtskoeffizienten, der die Möglichkeit anzeigt, dass jedes durch die Verarbeitungsdetail-Ableiteeinheit 104a extrahierte Verarbeitungsdetail der Sprachoperation entspricht. Dann wählt die Trenneinheit 109 ein Verfahren zum Trennen der Gruppen basierend auf dem Erwartungswert, der die Anzahl von Verarbeitungsdetails anzeigt, von denen vorhergesagt wird, dass sie bleiben, nachdem die Auswahl aus den Gruppen getroffen wird.
  • Die Antworterzeugungseinheit 106 erzeugt Antwortinformationen zum Treffen einer Auswahl aus den Gruppen, erhalten als ein Ergebnis der durch die Trenneinheit 109 vorgenommenen Trennung. Ferner gibt die Sprachsteuerung 107 oder die Anzeigesteuerung 108 Antwortinformationen zum Treffen einer Auswahl aus den Gruppen aus, erhalten als ein Ergebnis der durch die Trenneinheit 109 vorgenommenen Trennung. Wie oben beschrieben, kann die Informationsverarbeitungsvorrichtung 1a gemäß der zweiten Ausführungsform die Häufigkeit von Interaktionen mit dem Benutzer effizienter verringern durch Veranlassen, dass eine als ein Ergebnis der entsprechend Bedingungen erhaltene Gruppe ausgewählt wird.
  • Wenn die Anzahl von durch die Verarbeitungsdetail-Ableiteeinheit 104a extrahierten Verarbeitungsdetails größer als ein oberer Grenzwert ist, trennt die Trenneinheit 109 die Verarbeitungsdetails in mehrere Gruppen. Zu diesem Zeitpunkt macht die Trenneinheit 109 die Anzahl von Gruppen kleiner als den oberen Grenzwert. Hier ist der obere Grenzwert ein Wert, der als Kriterium für eine Verringerung der Operabilität dient, wenn alle durch die Verarbeitungsdetail-Ableiteeinheit 104a extrahierten Verarbeitungsdetails präsentiert werden. Noch spezieller wird, wenn alle aus der großen Anzahl von Verarbeitungsdetails angezeigt werden, ein Anzeigebereich, der den einzelnen Verarbeitungsdetails zugeordnet ist, klein, wodurch es dem Benutzer schwierig wird, das Verarbeitungsdetail visuell zu erkennen und was daher die Operabilität verringert. Der obere Grenzwert ist ein Wert, der als ein Kriterium für eine solche Verringerung in der Operabilität dient.
  • Ferner kann der obere Grenzwert ein Wert sein, der in Übereinstimmung mit einem Typ der Informationsverarbeitungsvorrichtung 1a festgelegt ist, kann ein Wert sein, der durch den Benutzer oder ähnliches festgelegt ist, oder kann ein Wert sein, der durch ein anderes Verfahren festgelegt ist. Ferner kann der obere Grenzwert ein Wert sein, der in einer Weise variiert, die von einem Betriebszustand der Informationsverarbeitungsvorrichtung 1a abhängt. Wenn beispielsweise bereits eine Anwendung angezeigt wird, wird der Anzeigebereich der Antwortinformationen klein. Entsprechend wird auch der Anzeigebereich der einzelnen Verarbeitungsdetails klein. Ändern des oberen Grenzwerts entsprechend Bedingungen kann eine Verringerung der Operabilität verhindern. Wenn beispielsweise die Informationsverarbeitungsvorrichtung 1a nicht verwendet wird, ist der obere Grenzwert 4. Wenn andererseits die Informationsverarbeitungsvorrichtung 1a verwendet wird, ist der obere Grenzwert 2.
  • Hier ist, in einer Verarbeitungsklassifizierungstabelle 111a gemäß der zweiten Ausführungsform, ein Gewichtskoeffizient für jedes Verarbeitungsdetail festgelegt. Die Verarbeitungsdetail-Ableiteeinheit 104a extrahiert beim Extrahieren des Verarbeitungsdetails Daten, die den Gewichtskoeffizienten enthalten. Dann erhält die Trenneinheit 109 den Erwartungswert basierend auf dem Gewichtskoeffizienten für jedes durch die Verarbeitungsdetail-Ableiteeinheit 104a extrahierte Verarbeitungsdetail aus der Verarbeitungsklassifizierungstabelle 111a.
  • 14 ist ein Diagramm, ein Beispiel einer aus der Verarbeitungsklassifizierungstabelle 111a extrahierten Struktur von Daten gemäß der zweiten Ausführungsform darstellend. Die Verarbeitungsdetail-Ableiteeinheit 104a extrahiert das Verarbeitungsdetail, die Verarbeitungsdetailkategorie und den Gewichtskoeffizienten aus der Verarbeitungsklassifizierungstabelle 111a. Das Verarbeitungsdetail ist ein durch die Verarbeitungsdetail-Ableiteeinheit 104a extrahiertes Verarbeitungsdetail. Die Verarbeitungsdetailkategorie ist eine Kategorie des Verarbeitungsdetails. Der Gewichtskoeffizient ist ein festgelegter Wert, der die Möglichkeit anzeigt, dass ein verknüpftes Verarbeitungsdetail der Sprachoperation entspricht. Wenn sich beispielsweise die in 14 dargestellten Gewichtskoeffizienten vergrößern, erhöht sich die Wahrscheinlichkeit von Entsprechung. Beispielsweise ist der Gewichtskoeffizient ein Wert, der basierend auf einer Verwendungshäufigkeit des entsprechenden Verarbeitungsdetails festgelegt wird.
  • Es ist anzumerken, dass der Gewichtskoeffizient nicht auf einen Wert begrenzt ist, der basierend auf einer Verwendungshäufigkeit festgelegt ist und ein Wert sein kann, der durch den Benutzer oder ähnliches festgelegt wird oder ein anderer Wert sein kann. Wenn ferner der Gewichtskoeffizient basierend auf der Verwendungshäufigkeit des entsprechenden Verarbeitungsdetails festgelegt wird, kann die Informationsverarbeitungsvorrichtung 1a eine Messeinheit umfassen, die eine Verwendungshäufigkeit misst. Dann kann die Messeinheit den Gewichtskoeffizienten in der Verarbeitungsklassifizierungstabelle 111a basierend auf der so gemessenen Verwendungshäufigkeit festlegen.
  • Die Trenneinheit 109 erhält den Erwartungswert unter jedem Trennverfahren unter Verwendung des Gewichtskoeffizienten. Dann trennt die Trenneinheit 109 die mehreren Verarbeitungsdetails in Gruppen durch ein Trennverfahren, das den Erwartungswert am kleinsten macht, das heißt, ein Trennverfahren, durch das die Verarbeitungsdetails im größtmöglichen Ausmaß eingeengt werden können. Beispiele des Trennverfahrens umfassen ein gleichheitsbasiertes Trennverfahren zum gleichmäßigen Trennen von Verarbeitungsdetails, ein kategoriebasiertes Trennverfahren zum Trennen von Verarbeitungsdetails nach Kategorie und ein auf Gewichtskoeffizienten basierendes Trennverfahren zur Trennung von Verarbeitungsdetails basierend auf dem Gewichtskoeffizienten. Es ist anzumerken, dass diese Trennverfahren lediglich Beispiele sind und dass die Trennung durch ein anderes Verfahren vorgenommen werden kann.
  • Zuerst erhält die Trenneinheit 109 einen Gruppenerwartungswert für jede Gruppe unter Verwendung der folgenden Gleichung (1). Dann erhält die Trenneinheit 109 einen Erwartungswert durch Aufaddieren des Gruppenerwartungswerts für jede Gruppe. Der Gruppenerwartungswert wird durch Gleichung (1) erhalten.
  • Gruppenerwartungswert = Anzahl von gruppierten Verarbeitungsdetails * Gruppengewichtskoeffizient / Gesamtgewichtskoeffizient (1).
  • Die Anzahl von gruppierten Verarbeitungsdetails entspricht der Anzahl von Verarbeitungsdetails, die zu jeder Gruppe gehören.
  • Der Gruppengewichtskoeffizient entspricht der Summe von Gewichtskoeffizienten von Verarbeitungsdetails, die zu jeder Gruppe gehören.
  • Der Gesamtgewichtskoeffizient entspricht der Summe von Gewichtskoeffizienten von durch die Verarbeitungsdetail-Ableiteeinheit 104a extrahierten Verarbeitungsdetails.
  • Nachfolgend wird eine Beschreibung eines Falles, in dem die in 14 dargestellten Daten extrahiert werden, als ein Beispiel des Trennverfahrens durch die Trenneinheit 109 gegeben. 14 ist ein Diagramm, ein Beispiel einer Datenstruktur von durch die Verarbeitungsdetail-Ableiteeinheit 104a extrahierten Daten gemäß der zweiten Ausführungsform darstellend. In 14 extrahiert die Verarbeitungsdetail-Ableiteeinheit 104a „normale Wiedergabe“, „Kurzfassungs-Wiedergabe“, „Wiedergabe des Beginns für eine Minute“, „Miniaturwiedergabe“ , „Inhaltsinformationsanzeige“ und „Benutzerüberprüfungsanzeige“ als Verarbeitungsdetails.
    Die „normale Wiedergabe“ gehört zu einer Kategorie „Wiedergabe“ und hat einen Gewichtskoeffizienten gleich „10“. Die „Kurzfassungs-Wiedergabe“ gehört zu einer Kategorie „Kurzfassung“ und hat einen Gewichtskoeffizienten gleich „5“. Die „Wiedergabe des Beginns für eine Minute“ gehört zur Kategorie „Kurzfassung“ und hat einen Gewichtskoeffizienten gleich „4“. Die „Miniaturwiedergabe“ gehört zu einer Kategorie „Videoinformationen“ und hat einen Gewichtskoeffizienten gleich „2“. Die „Inhaltsinformationsanzeige“ gehört zur Kategorie „Videoinformationen“ und hat einen Gewichtskoeffizienten gleich „2“. Die „Benutzerüberprüfungsanzeige“ gehört zur Kategorie „Videoinformationen“ und hat einen Gewichtskoeffizienten gleich „2“.
  • Zuerst wird eine Beschreibung dafür gegeben, wie der Erwartungswert unter dem gleichheitsbasierten Trennverfahren erhalten wird. Unter dem gleichheitsbasierten Trennverfahren trennt die Trenneinheit 109 Verarbeitungsdetails gleichmäßig in Gruppen. Das heißt, dass, für die in 14 dargestellten Daten, die Trenneinheit 109 die Verarbeitungsdetails in drei Gruppen trennt, die jeweils zwei Verarbeitungsdetails umfassen. Beispielsweise trennt die Trenneinheit 109 die Verarbeitungsdetails in eine erste Gruppe, umfassend „normale Wiedergabe“ und „Kurzfassungs-Wiedergabe“, eine zweite Gruppe, umfassend „Wiedergabe des Beginns für eine Minute“ und „Miniaturwiedergabe“, und eine dritte Gruppe, umfassend „Inhaltsinformationsanzeige“ und „Benutzerüberprüfungsanzeige“.
  • Ferner erhält die Trenneinheit 109 einen Gruppenerwartungswert für jede Gruppe unter Verwendung der Gleichung (1). Dann erhält die Trenneinheit 109 einen Erwartungswert durch Aufaddieren des Gruppenerwartungswerts für jede Gruppe. Speziell ist, wenn die Verarbeitungsdetail-Ableiteeinheit 104a die in 14 dargestellten Verarbeitungsdetails extrahiert, der Erwartungswert unter dem gleichheitsbasierten Trennverfahren wie folgt: E r w a r t u n g s w e r t = ( 2 * 15 / 25 ) + ( 2 * 6 / 25 ) + ( 2 * 4 / 25 ) = 2,00.
    Figure DE112020002636T5_0001
  • Als nächstes wird eine Beschreibung dafür gegeben, wie ein Erwartungswert unter dem kategoriebasierten Trennverfahren erhalten wird. Für das kategoriebasierte Trennverfahren trennt die Trenneinheit 109 Verarbeitungsdetails in Gruppen auf einer kategoriellen Basis. Beispielsweise trennt die Trenneinheit 109 die Verarbeitungsdetails in eine Wiedergabegruppe, umfassend „normale Wiedergabe“, eine Kurzfassungsgruppe, umfassend „Kurzfassungs-Wiedergabe“ und „Wiedergabe des Beginns für eine Minute“, und eine Videoinformationsgruppe, umfassend „Miniaturanzeige“, „Inhaltsinformationsanzeige“ und „Benutzerüberprüfungsanzeige“.
  • Ferner erhält die Trenneinheit 109 einen Gruppenerwartungswert für jede Gruppe unter Verwendung der Gleichung (1). Dann erhält die Trenneinheit 109 einen Erwartungswert durch Aufaddieren des Gruppenerwartungswerts für jede Gruppe. Speziell ist, wenn die Verarbeitungsdetail-Ableiteeinheit 104a die in 14 dargestellten Verarbeitungsdetails extrahiert, der Erwartungswert unter dem kategoriebasierten Trennverfahren wie folgt: E r w a r t u n g s w e r t = ( 1 * 10 / 25 ) + ( 2 * 9 / 25 ) + ( 3 * 6 / 25 ) = 1,84.
    Figure DE112020002636T5_0002
  • Als nächstes wird eine Beschreibung dafür gegeben, wie ein Erwartungswert unter dem auf Gewichtskoeffizienten basierenden Trennverfahren erhalten wird. Unter dem auf Gewichtskoeffizienten basierenden Trennverfahren trennt die Trenneinheit 109 Verarbeitungsdetails in Gruppen basierend auf einem Gewichtskoeffizienten, der die Möglichkeit anzeigt, dass jedes der Verarbeitungsdetails der Sprachoperation entspricht. Beispielsweise trennt die Trenneinheit 109 die Verarbeitungsdetails in Gruppen in einer solchen Weise, dass Verarbeitungsdetails mit größeren Gewichtskoeffizienten jeweils eine entsprechende einzelne Gruppe bilden, und dass die verbleibenden Verarbeitungsdetails zusammen gruppiert werden.
  • Beispielsweise trennt die Trenneinheit 109 die Verarbeitungsdetails in eine als erste eingestufte Gruppe, umfassend „normale Wiedergabe“, eine als zweite eingestufte Gruppe, umfassend „Kurzfassungs-Wiedergabe“, und die andere Gruppe, umfassend „Wiedergabe des Beginns für eine Minute“, „Miniaturwiedergabe“, „Inhaltsinformationsanzeige“ und „Benutzerüberprüfungsanzeige“.
  • Ferner erhält die Trenneinheit 109 einen Gruppenerwartungswert für jede Gruppe unter Verwendung der Gleichung (1). Dann erhält die Trenneinheit 109 einen Erwartungswert durch Aufaddieren des Gruppenerwartungswerts für jede Gruppe. Speziell ist, wenn die Verarbeitungsdetail-Ableiteeinheit 104a die in 14 dargestellten Verarbeitungsdetails extrahiert, der Erwartungswert unter dem auf Gewichtskoeffizienten basierenden Trennverfahren wie folgt: E r w a r t u n g s w e r t = ( 1 * 10 / 25 ) + ( 1 * 5 / 25 ) + ( 4 * 10 / 25 ) = 2,24.
    Figure DE112020002636T5_0003
  • Wie oben beschrieben, ist, wenn die Verarbeitungsdetail-Ableiteeinheit 104a die in 14 dargestellten Verarbeitungsdetails extrahiert, der Erwartungswert unter dem gleichheitsbasierten Trennverfahren 2,00, der Erwartungswert unter dem kategoriebasierten Trennverfahren ist 1,84, und der Erwartungswert unter dem auf Gewichtskoeffizienten basierenden Trennverfahren ist 2,24. Daher wählt, da der Erwartungswert unter dem kategoriebasierten Trennverfahren der niedrigste ist, die Trenneinheit 109 das kategoriebasierte Trennverfahren aus. Die Antworterzeugungseinheit 106 erzeugt Antwortinformationen zum Treffen einer Auswahl von Verarbeitungsdetails aus mehreren Gruppen, getrennt durch die Trenneinheit 109 unter dem kategoriebasierten Trennverfahren. Dann gibt die Sprachsteuerung 107 oder die Anzeigesteuerung 108 die durch die Antworterzeugungseinheit 106 erzeugten Antwortinformationen aus.
  • Wie oben beschrieben, trennt, in der Informationsverarbeitungsvorrichtung 1a gemäß der zweiten Ausführungsform, die Trenneinheit 109 mehrere durch die Verarbeitungsdetail-Ableiteeinheit 104a extrahierte Verarbeitungsdetails in mehrere Gruppen. Beispielsweise trennt die Trenneinheit 109 die mehreren Verarbeitungsdetails in Gruppen basierend auf einem Erwartungswert, der die Anzahl von Verarbeitungsdetails anzeigt, von denen vorhergesagt wird, dass sie bleiben, nachdem die Auswahl aus den Gruppen getroffen wird. Ferner erzeugt die Antworterzeugungseinheit 106 Anwendungsinformationen zum Treffen einer Auswahl aus den Gruppen. Dann gibt die Sprachsteuerung 107 oder die Anzeigesteuerung 108 die Antwortinformationen aus. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1a gemäß der zweiten Ausführungsform, die Häufigkeit von Interaktionen mit dem Benutzer effizienter zu verringern.
  • Es ist anzumerken, dass, in der oben beschriebenen ersten Ausführungsform und zweiten Ausführungsform, ein Beispiel, in dem die Informationsverarbeitungsvorrichtung 1, 1a, beispielsweise, als ein intelligenter Lautsprecher oder ein Smartphone angewendet wird, beschrieben wurde. Es ist anzumerken, dass die Informationsverarbeitungsvorrichtung 1, 1a auf eine fahrzeuginterne Vorrichtung, wie etwa eine Navigationsvorrichtung, angewendet werden kann, auf eine interaktive UI, wie etwa einen Chatbot, angewendet werden kann, auf einen Online-Shop oder einen unbemannten Laden angewendet werden kann, auf eine interaktive digitale Beschilderung angewendet werden kann oder auf eine andere Vorrichtung angewendet werden kann.
  • (Effekte)
  • Die Informationsverarbeitungsvorrichtung 1, 1a umfasst den semantischen Äußerungsanalysator 101, die Verarbeitungsdetail-Ableiteeinheit 104, 104a, die Sprachsteuerung 107 oder die Anzeigesteuerung 108 und die Verarbeitungsdetail-Ableiteeinheit 104, 104a. Der semantische Äußerungsanalysator 101 empfängt eine Sprachoperation. Die Verarbeitungsdetail-Ableiteeinheit 104, 104a extrahiert ein Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation. Wenn das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation nicht spezifiziert werden kann, gibt die Sprachsteuerung 107 oder die Anzeigesteuerung 108 Antwortinformationen zum Treffen einer Auswahl zumindest eines Verarbeitungsdetails aus mehreren der durch die Verarbeitungsdetail-Ableiteeinheit 104, 104a extrahierten Verarbeitungsdetails aus. Die Verarbeitungsdetail-Ableiteeinheit 104, 104a spezifiziert das aus den in den Antwortinformationen enthaltenen mehreren Verarbeitungsdetails ausgewählte Verarbeitungsdetail als das Verarbeitungsdetail entsprechend der durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation.
  • Wie oben beschrieben, gibt die Informationsverarbeitungsvorrichtung 1, 1a die Antwortinformationen zum Treffen einer Auswahl zumindest eines Verarbeitungsdetails aus den mehreren durch die Verarbeitungsdetail-Ableiteeinheit 104, 104a extrahierten Verarbeitungsdetails aus. Das heißt, die Informationsverarbeitungsvorrichtung 1, 1a gibt die Antwortinformationen aus, die es den Verarbeitungsdetails ermöglichen, eingeengt zu werden. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1, 1a, Verarbeitung von Interesse zu spezifizieren, angezeigt durch eine uneindeutige Sprachoperation.
  • Die Informationsverarbeitungsvorrichtung 1a umfasst ferner die Trenneinheit 109, die die mehreren durch die Verarbeitungsdetail-Ableiteeinheit 104a extrahierten Verarbeitungsdetails in mehrere Gruppen trennt. Die Sprachsteuerung 107 oder die Anzeigesteuerung 108 gibt Antwortinformationen zum Treffen einer Auswahl der Gruppen aus, erhalten als ein Ergebnis der durch die Trenneinheit 109 vorgenommenen Trennung.
  • Wie oben beschrieben, trennt die Informationsverarbeitungsvorrichtung 1a mehrere Verarbeitungsdetails in mehrere Gruppen, das heißt, sie gibt Antwortinformationen aus, in denen die mehreren Verarbeitungsdetails gruppiert sind. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1a, den Benutzer über die mehreren Verarbeitungsdetails in einer kollektiven Weise zu fragen, sodass die Verarbeitungsdetails effizient eingeengt werden können.
  • Die Trenneinheit 109 wählt ein Verfahren zum Trennen der Gruppen basierend auf einem Erwartungswert aus, der die Anzahl von Verarbeitungsdetails anzeigt, von denen vorhergesagt wird, dass sie bleiben, nachdem die Auswahl aus den Gruppen getroffen wird.
  • Wie oben beschrieben, gibt die Informationsverarbeitungsvorrichtung 1a Antwortinformationen aus, die Verarbeitungsdetails enthalten, die basierend auf dem Erwartungswert in Gruppen getrennt sind. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1a, die Verarbeitungsdetails effizient einzuengen.
  • Die Trenneinheit 109 erhält den Erwartungswert basierend auf einem Gewichtskoeffizienten, der die Möglichkeit anzeigt, dass jedes durch die Verarbeitungsdetail-Ableiteeinheit 104a extrahierte Verarbeitungsdetail der Sprachoperation entspricht.
  • Dies ermöglicht der Informationsverarbeitungsvorrichtung 1a, die Verarbeitungsdetails effizient einzuengen.
  • Die Trenneinheit 109 trennt Verarbeitungsdetails gleichmäßig in Gruppen.
  • Wie oben beschrieben, trennt die Informationsverarbeitungsvorrichtung 1a die Verarbeitungsdetails gleichmäßig. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1a, die Verarbeitungsdetails effizient einzuengen.
  • Die Trenneinheit 109 trennt Verarbeitungsdetails in Gruppen auf einer kategoriellen Basis.
  • Wie oben beschrieben, trennt die Informationsverarbeitungsvorrichtung 1a die Verarbeitungsdetails in die Gruppen auf einer kategoriellen Basis. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1a, die Verarbeitungsdetails effizient einzuengen.
  • Die Trenneinheit 109 trennt die Verarbeitungsdetails in Gruppen basierend auf dem Gewichtskoeffizienten, der die Möglichkeit anzeigt, dass jedes der Verarbeitungsdetails der Sprachoperation entspricht.
  • Wie oben beschrieben, trennt die Informationsverarbeitungsvorrichtung 1a die Verarbeitungsdetails in Gruppen basierend auf dem Gewichtskoeffizienten, der die Möglichkeit anzeigt, dass jedes der Verarbeitungsdetails der Sprachoperation entspricht. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1a, die Verarbeitungsdetails effizient einzuengen.
  • Wenn die Anzahl von durch die Verarbeitungsdetail-Ableiteeinheit 104a extrahierten Verarbeitungsdetails größer als der obere Grenzwert ist, trennt die Trenneinheit 109 die Verarbeitungsdetails in Gruppen.
  • Wie oben beschrieben, trennt, wenn die Anzahl von Verarbeitungsdetails größer als der obere Grenzwert ist, die Informationsverarbeitungsvorrichtung 1a die Verarbeitungsdetails in Gruppen. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1a, die Verarbeitungsdetails effizient einzuengen, selbst wenn die Anzahl von Verarbeitungsdetails größer als der obere Grenzwert ist.
  • Der obere Grenzwert variiert in einer Weise, die von Betriebsbedingungen der Informationsverarbeitungsvorrichtung 1 abhängt.
  • Wie oben beschrieben, trennt, wenn ein Anzeigebereich, beispielsweise aufgrund der Anwesenheit einer momentan angezeigten Anwendung, klein ist, die Informationsverarbeitungsvorrichtung 1a mehrere Verarbeitungsdetails in Gruppen, um den Verarbeitungsdetails zu ermöglichen, in dem kleinen Anzeigebereich angezeigt zu werden. Dies ermöglicht der Informationsverarbeitungsvorrichtung 1a, die Verarbeitungsdetails in einer Weise, die von Bedingungen abhängt, in Gruppen zu trennen.
  • Der semantische Äußerungsanalysator 101 empfängt eine Sprachoperation entsprechend mehreren Verarbeitungsdetails. Die Verarbeitungsdetail-Ableiteeinheit 104 extrahiert mehrere Verarbeitungsdetails entsprechend der Sprachoperation. Die Anzeigesteuerung 108 gibt die Antwortinformationen aus, die die Bildschirminformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus den mehreren durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails enthalten.
  • Entsprechend ermöglicht die Informationsverarbeitungsvorrichtung 1 dem Verarbeitungsdetail entsprechend der Sprachoperation, auf einem Verarbeitungsdetail-Auswahlbildschirm ausgewählt zu werden.
  • Die Antwortinformationen enthalten Bildschirminformationen, die ein Verfahren zum Auswählen eines Verarbeitungsdetails aus mehreren Verarbeitungsdetails darstellen.
  • Dies ermöglicht dem Benutzer, das Verfahren zum Auswählen eines Verarbeitungsdetails zu verstehen.
  • Die Antwortinformationen enthalten Bildschirminformationen, die eine Phrase darstellen, die jedes der mehreren Verarbeitungsdetails spezifizierbar macht.
  • Dies ermöglicht dem Benutzer, einfach ein gewünschtes Verarbeitungsdetail auszuwählen, selbst wenn es mehrere Verarbeitungsdetails gibt.
  • Die Sprachsteuerung 107 oder die Anzeigesteuerung 108 gibt Antwortinformationen zum Treffen einer Auswahl einer Anwendung aus, wenn die Anzahl von Anwendungen, die mehrere durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierte Verarbeitungsdetails ausführen, gleich oder größer als die Schwelle ist.
  • Dies ermöglicht der Informationsverarbeitungsvorrichtung 1, effizient die Verarbeitungsdetails einzuengen durch Veranlassen, dass eine Anwendung ausgewählt wird, wenn die Anzahl von Anwendungen gleich oder größer als die Schwelle ist.
  • Wenn die Anzahl der mehreren durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails gleich oder größer als die Schwelle ist, gibt die Sprachsteuerung 107 oder die Anzeigesteuerung 108 die Antwortinformationen zum Treffen einer Auswahl einer Kategorie des Verarbeitungsdetails aus.
  • Dies ermöglicht der Informationsverarbeitungsvorrichtung 1, effizient die Verarbeitungsdetails einzuengen durch Veranlassen, dass eine Kategorie ausgewählt wird, wenn die Anzahl von Anwendungen gleich oder größer als die Schwelle ist.
  • Wenn die Anzahl von durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierten Verarbeitungsdetails gleich oder größer als die Schwelle ist, gibt die Sprachsteuerung 107 oder die Anzeigesteuerung 108 Antwortinformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus den Verarbeitungsdetails entsprechend der vorher durch den semantischen Äußerungsanalysator 101 empfangenen Sprachoperation aus.
  • Dies ermöglicht, selbst wenn die Extraktionseinheit mehrere Verarbeitungsdetails extrahiert, der Informationsverarbeitungsvorrichtung 1, effizient die Verarbeitungsdetails einzuengen, da die Verarbeitungsdetails entsprechend der vorher empfangenen Sprachoperation verfügbar sind.
  • Die Anzeigesteuerung 108 gibt die Antwortinformationen, die Bildschirminformationen enthalten, aus, um zu veranlassen, dass mehrere durch die Verarbeitungsdetail-Ableiteeinheit 104 extrahierte Verarbeitungsdetails jeweils nach einer festen Zeitspanne alternierend angezeigt werden.
  • Dies ermöglicht dem Benutzer, einfach ein gewünschtes Verarbeitungsdetail auszuwählen, selbst wenn es mehrere Verarbeitungsdetails gibt.
  • Der semantische Äußerungsanalysator 101 empfängt eine Sprachoperation, die eine spezifische Wortfolge angibt, die mit einem spezifischen Verarbeitungsdetail verknüpft ist. Die Verarbeitungsdetail-Ableiteeinheit 104 extrahiert ein mit der Wortfolge verknüpftes Verarbeitungsdetail und ein aus der Bedeutung der Wortfolge im anfänglichen Zustand abgeleitetes Verarbeitungsdetail, in dem die Wortfolge nicht mit dem Verarbeitungsdetail verknüpft ist. Die Sprachsteuerung 107 oder die Anzeigesteuerung 108 gibt die Antwortinformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus einem mit der durch die Sprachoperation angegebenen Wortfolge verknüpften Verarbeitungsdetail und einem aus der Bedeutung der Wortfolge im anfänglichen Zustand abgeleiteten Verarbeitungsdetail, in dem die Sprachoperation nicht mit dem Verarbeitungsdetail verknüpft ist.
  • Dies ermöglicht, selbst wenn der Klang einer durch den Benutzer geäußerten Stimme als ein Makro registriert ist, der Informationsverarbeitungsvorrichtung 1, das Verarbeitungsdetail entsprechend der ursprünglichen Bedeutung des Klanges einer geäußerten Stimme als das Verarbeitungsdetail entsprechend der Sprachoperation zu spezifizieren.
  • Die Verarbeitungsdetail-Ableiteeinheit 104 extrahiert, als das Verarbeitungsdetail entsprechend der Sprachoperation, eine Verarbeitungsausführungsanweisung und einen Eintrag einer Zeichenfolge durch die Sprachoperation. Die Sprachsteuerung 107 oder die Anzeigesteuerung 108 gibt Antwortinformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus der Verarbeitungsausführungsanweisung und zum Eintrag einer Zeichenfolge aus.
  • Dies ermöglicht der Informationsverarbeitungsvorrichtung 1, das Verarbeitungsdetail entsprechend der Sprachoperation aus der Verarbeitungsausführungsanweisung und dem Eintrag einer Zeichenfolge auszuwählen.
  • Es ist anzumerken, dass die hier beschriebenen Effekte lediglich Beispiele sind und nicht restriktiv ausgelegt sind, und dass andere Effekte bereitgestellt sein können.
  • Es ist anzumerken, dass die vorliegende Technologie auch die folgende Konfiguration aufweisen kann.
    1. (1) Eine Informationsverarbeitungsvorrichtung, die Folgendes umfasst:
      • eine Eingabeeinheit, ausgelegt zum Empfangen einer Sprachoperation;
      • eine Extraktionseinheit, ausgelegt zum Extrahieren
      eines Verarbeitungsdetails entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation;
      • eine Ausgabeeinheit, ausgelegt zum Ausgeben von Antwortinformationen zum Treffen, wenn das Verarbeitungsdetail entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation nicht spezifiziert werden kann, einer Auswahl von zumindest einem Verarbeitungsdetail aus mehreren der durch die Extraktionseinheit extrahierten Verarbeitungsdetails; und
      • eine Spezifiziereinheit, ausgelegt zum Spezifizieren des aus den in den Antwortinformationen enthaltenen mehreren Verarbeitungsdetails ausgewählten Verarbeitungsdetails als das Verarbeitungsdetail entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation.
    2. (2) Die Informationsverarbeitungsvorrichtung nach (1), die ferner Folgendes umfasst:
      • eine Trenneinheit, ausgelegt zum Trennen der mehreren durch die Extraktionseinheit extrahierten Verarbeitungsdetails in mehrere Gruppen, wobei
      • die Ausgabeeinheit die Antwortinformationen ausgibt zum Treffen einer Auswahl aus den Gruppen, erhalten als ein Ergebnis der durch die Trenneinheit vorgenommenen Trennung.
    3. (3) Die Informationsverarbeitungsvorrichtung nach (2), wobei:
      • die Trenneinheit ein Verfahren zum Trennen der Gruppen basierend auf einem Erwartungswert auswählt, der eine Anzahl der Verarbeitungsdetails anzeigt, von denen vorhergesagt wird, dass sie bleiben, nachdem die Auswahl aus den Gruppen getroffen wird.
    4. (4) Die Informationsverarbeitungsvorrichtung nach (3), wobei:
      • die Trenneinheit den Erwartungswert basierend auf einem Gewichtskoeffizienten erhält, der die Möglichkeit anzeigt, dass jedes der durch die Extraktionseinheit extrahierten Verarbeitungsdetails der Sprachoperation entspricht.
    5. (5) Die Informationsverarbeitungsvorrichtung nach (3), wobei:
      • die Trenneinheit die Verarbeitungsdetails gleichmäßig in die Gruppen trennt.
    6. (6) Die Informationsverarbeitungsvorrichtung nach (3), wobei:
      • die Trenneinheit die Verarbeitungsdetails in die Gruppen auf einer kategoriellen Basis trennt.
    7. (7) Die Informationsverarbeitungsvorrichtung nach (3), wobei:
      • die Trenneinheit die Verarbeitungsdetails in die Gruppen trennt, basierend auf einem Gewichtskoeffizienten, der eine Möglichkeit anzeigt, dass jedes der Verarbeitungsdetails der Sprachoperation entspricht.
    8. (8) Die Informationsverarbeitungsvorrichtung nach (3), wobei:
      • wenn die Anzahl der durch die Extraktionseinheit extrahierten Verarbeitungsdetails größer als ein oberer Grenzwert ist, die Trenneinheit die Verarbeitungsdetails in die Gruppen trennt.
    9. (9) Die Informationsverarbeitungsvorrichtung nach (8), wobei:
      • der obere Grenzwert in einer Weise variiert, die von Betriebsbedingungen der Informationsverarbeitungsvorrichtung abhängt.
    10. (10) Die Informationsverarbeitungsvorrichtung nach (1), wobei:
      • die Eingabeeinheit die Sprachoperation entsprechend den mehreren Verarbeitungsdetails empfängt,
      • die Extraktionseinheit die mehreren Verarbeitungsdetails entsprechend der Sprachoperation extrahiert, und
      • die Ausgabeeinheit die Antwortinformationen ausgibt, die Bildschirminformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus den mehreren durch die Extraktionseinheit extrahierten Verarbeitungsdetails enthalten.
    11. (11) Die Informationsverarbeitungsvorrichtung nach (10), wobei:
      • die Antwortinformationen die Bildschirminformationen enthalten, die ein Verfahren zum Auswählen des Verarbeitungsdetails aus den mehreren Verarbeitungsdetails darstellen.
    12. (12) Die Informationsverarbeitungsvorrichtung nach (10), wobei:
      • die Antwortinformationen die Bildschirminformationen enthalten, die eine Phrase darstellen, die jedes der mehreren Verarbeitungsdetails spezifizierbar macht.
    13. (13) Die Informationsverarbeitungsvorrichtung nach (1), wobei:
      • wenn eine Anzahl von Anwendungen, die ausgelegt sind zum Ausführen der mehreren durch die Extraktionseinheit extrahierten Verarbeitungsdetails, gleich oder größer als eine Schwelle ist, die Ausgabeeinheit die Antwortinformationen zum Treffen einer Auswahl aus den Anwendungen ausgibt.
    14. (14) Die Informationsverarbeitungsvorrichtung nach (1), wobei:
      • wenn die Anzahl der mehreren durch die Extraktionseinheit extrahierten Verarbeitungsdetails gleich oder größer als eine Schwelle ist, die Ausgabeeinheit die Antwortinformationen zum Treffen einer Auswahl einer Kategorie des Verarbeitungsdetails ausgibt.
    15. (15) Die Informationsverarbeitungsvorrichtung nach (1), wobei:
      • wenn die mehreren durch die Extraktionseinheit extrahierten Verarbeitungsdetails gleich oder größer als eine Schwelle sind, die Ausgabeeinheit die Antwortinformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus den Verarbeitungsdetails entsprechend der vorher durch die Eingabeeinheit empfangenen Sprachoperation ausgibt.
    16. (16) Die Informationsverarbeitungsvorrichtung nach (1), wobei:
      • die Ausgabeeinheit die Antwortinformationen ausgibt, die Bildschirminformationen enthalten, um zu veranlassen, dass die mehreren durch die Extraktionseinheit extrahierten Verarbeitungsdetails jeweils nach einer festen Zeitspanne alternierend angezeigt werden.
    17. (17) Die Informationsverarbeitungsvorrichtung nach (1), wobei:
      • die Eingabeeinheit die Sprachoperation empfängt, die eine spezifische Wortfolge anzeigt, die mit einem entsprechenden der Verarbeitungsdetails verknüpft ist,
      • die Extraktionseinheit das mit der Wortfolge verknüpfte Verarbeitungsdetail und das basierend auf einer Bedeutung der Wortfolge im anfänglichen Zustand abgeleitete Verarbeitungsdetail extrahiert, in dem die Wortfolge nicht mit dem Verarbeitungsdetail verknüpft ist, und
      • die Ausgabeeinheit die Antwortinformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus dem mit der durch die Sprachoperation angegebenen Wortfolge verknüpften Verarbeitungsdetail und dem basierend auf der Bedeutung der Wortfolge im anfänglichen Zustand abgeleiteten Verarbeitungsdetail ausgibt, in dem die Sprachoperation nicht mit dem Verarbeitungsdetail verknüpft ist.
    18. (18) Die Informationsverarbeitungsvorrichtung nach (1), wobei:
      • die Extraktionseinheit eine Verarbeitungsausführungsanweisung und einen Eintrag einer Zeichenfolge durch die Sprachoperation als das Verarbeitungsdetail entsprechend der Sprachoperation extrahiert, und
      • die Ausgabeeinheit die Antwortinformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus der Verarbeitungsausführungsanweisung und zum Eintrag einer Zeichenfolge ausgibt.
    19. (19) Informationsverarbeitungsverfahren, das Folgendes umfasst:
      • Empfangen einer Sprachoperation;
      • Extrahieren eines Verarbeitungsdetails entsprechend der empfangenen Sprachoperation;
      • Ausgeben von Antwortinformationen zum Treffen, wenn das Verarbeitungsdetail entsprechend der empfangenen Sprachoperation nicht spezifiziert werden kann, einer Auswahl von zumindest einem Verarbeitungsdetail aus mehreren der extrahierten Verarbeitungsdetails; und
      • Spezifizieren des aus den in den Antwortinformationen enthaltenen mehreren Verarbeitungsdetails ausgewählten Verarbeitungsdetails als das Verarbeitungsdetail entsprechend der Sprachoperation.
    20. (20) Programm, um einen in einer Informationsverarbeitungsvorrichtung enthaltenen Computer zu veranlassen, zu fungieren als:
      • eine Eingabeeinheit, ausgelegt zum Empfangen einer Sprachoperation;
      • eine Extraktionseinheit, ausgelegt zum Extrahieren eines Verarbeitungsdetails entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation;
      • eine Ausgabeeinheit, ausgelegt zum Ausgeben von Antwortinformationen zum Treffen, wenn das Verarbeitungsdetail entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation nicht spezifiziert werden kann, einer Auswahl von zumindest einem Verarbeitungsdetail aus mehreren der durch die Extraktionseinheit extrahierten Verarbeitungsdetails; und
      • eine Spezifiziereinheit, ausgelegt zum Spezifizieren des aus den in den Antwortinformationen enthaltenen mehreren Verarbeitungsdetails ausgewählten Verarbeitungsdetails als das Verarbeitungsdetail entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation.
  • Bezugszeichenliste
  • 1, 1a
    INFORMATIONSVERARBEITUNGSVORRICHTUNG
    10
    STEUERUNG
    11
    SPEICHEREINHEIT
    12
    SPRACHEINGABEEINHEIT
    13
    SENSOR
    14
    OPERATIONSEINHEIT
    15
    SPRACHAUSGABEEINHEIT
    16
    BILDAUSGABEEINHEIT
    101
    SEMANTISCHER ÄUSSERUNGSANALYSATOR
    102
    SENSORINFORMATIONSANALYSATOR
    103
    OPERATIONSSTEUERUNG
    104,
    104a VERARBEITUNGSDETAIL-ABLEITEEINHEIT
    105
    VERARBEITUNGSAUSFÜHRUNGSEINHEIT
    106
    ANTWORTERZEUGUNGSEINHEIT
    107
    SPRACHSTEUERUNG
    108
    ANZEIGESTEUERUNG
    109
    TRENNEINHEIT
    111, 111a
    VERARBEITUNGSKLASSIFIZIERUNGSTABELLE
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • JP H06223104 A [0003]

Claims (20)

  1. Informationsverarbeitungsvorrichtung, die Folgendes umfasst: eine Eingabeeinheit, ausgelegt zum Empfangen einer Sprachoperation; eine Extraktionseinheit, ausgelegt zum Extrahieren eines Verarbeitungsdetails entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation; eine Ausgabeeinheit, ausgelegt zum Ausgeben von Antwortinformationen zum Treffen, wenn das Verarbeitungsdetail entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation nicht spezifiziert werden kann, einer Auswahl von zumindest einem Verarbeitungsdetail aus mehreren der durch die Extraktionseinheit extrahierten Verarbeitungsdetails; und eine Spezifiziereinheit, ausgelegt zum Spezifizieren des aus den in den Antwortinformationen enthaltenen mehreren Verarbeitungsdetails ausgewählten Verarbeitungsdetails als das Verarbeitungsdetail entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation.
  2. Informationsverarbeitungsvorrichtung nach Anspruch 1, die ferner Folgendes umfasst: eine Trenneinheit, ausgelegt zum Trennen der mehreren durch die Extraktionseinheit extrahierten Verarbeitungsdetails in mehrere Gruppen, wobei die Ausgabeeinheit die Antwortinformationen ausgibt zum Treffen einer Auswahl aus den Gruppen, erhalten als ein Ergebnis der durch die Trenneinheit vorgenommenen Trennung.
  3. Informationsverarbeitungsvorrichtung nach Anspruch 2, wobei die Trenneinheit ein Verfahren zum Trennen der Gruppen basierend auf einem Erwartungswert auswählt, der eine Anzahl der Verarbeitungsdetails anzeigt, von denen vorhergesagt wird, dass sie bleiben, nachdem die Auswahl aus den Gruppen getroffen wird.
  4. Informationsverarbeitungsvorrichtung nach Anspruch 3, wobei die Trenneinheit den Erwartungswert basierend auf einem Gewichtskoeffizienten erhält, der die Möglichkeit anzeigt, dass jedes der durch die Extraktionseinheit extrahierten Verarbeitungsdetails der Sprachoperation entspricht.
  5. Informationsverarbeitungsvorrichtung nach Anspruch 3, wobei die Trenneinheit die Verarbeitungsdetails gleichmäßig in die Gruppen trennt.
  6. Informationsverarbeitungsvorrichtung nach Anspruch 3, wobei die Trenneinheit die Verarbeitungsdetails in die Gruppen auf einer kategoriellen Basis trennt.
  7. Informationsverarbeitungsvorrichtung nach Anspruch 3, wobei die Trenneinheit die Verarbeitungsdetails in die Gruppen trennt, basierend auf einem Gewichtskoeffizienten, der eine Möglichkeit anzeigt, dass jedes der Verarbeitungsdetails der Sprachoperation entspricht.
  8. Informationsverarbeitungsvorrichtung nach Anspruch 3, wobei wenn die Anzahl der durch die Extraktionseinheit extrahierten Verarbeitungsdetails größer als ein oberer Grenzwert ist, die Trenneinheit die Verarbeitungsdetails in die Gruppen trennt.
  9. Informationsverarbeitungsvorrichtung nach Anspruch 8, wobei der obere Grenzwert in einer Weise variiert, die von Betriebsbedingungen der Informationsverarbeitungsvorrichtung abhängt.
  10. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei die Eingabeeinheit die Sprachoperation entsprechend den mehreren Verarbeitungsdetails empfängt, die Extraktionseinheit die mehreren Verarbeitungsdetails entsprechend der Sprachoperation extrahiert, und die Ausgabeeinheit die Antwortinformationen ausgibt, die Bildschirminformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus den mehreren durch die Extraktionseinheit extrahierten Verarbeitungsdetails enthalten.
  11. Informationsverarbeitungsvorrichtung nach Anspruch 10, wobei die Antwortinformationen die Bildschirminformationen enthalten, die ein Verfahren zum Auswählen des Verarbeitungsdetails aus den mehreren Verarbeitungsdetails darstellen.
  12. Informationsverarbeitungsvorrichtung nach Anspruch 10, wobei die Antwortinformationen die Bildschirminformationen enthalten, die eine Phrase darstellen, die jedes der mehreren Verarbeitungsdetails spezifizierbar macht.
  13. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei wenn eine Anzahl von Anwendungen, die ausgelegt sind zum Ausführen der mehreren durch die Extraktionseinheit extrahierten Verarbeitungsdetails, gleich oder größer als eine Schwelle ist, die Ausgabeeinheit die Antwortinformationen zum Treffen einer Auswahl aus den Anwendungen ausgibt.
  14. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei wenn die Anzahl der mehreren durch die Extraktionseinheit extrahierten Verarbeitungsdetails gleich oder größer als eine Schwelle ist, die Ausgabeeinheit die Antwortinformationen zum Treffen einer Auswahl einer Kategorie des Verarbeitungsdetails ausgibt.
  15. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei wenn die mehreren durch die Extraktionseinheit extrahierten Verarbeitungsdetails gleich oder größer als eine Schwelle sind, die Ausgabeeinheit die Antwortinformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus den Verarbeitungsdetails entsprechend der vorher durch die Eingabeeinheit empfangenen Sprachoperation ausgibt.
  16. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei die Ausgabeeinheit die Antwortinformationen ausgibt, die Bildschirminformationen enthalten, um zu veranlassen, dass die mehreren durch die Extraktionseinheit extrahierten Verarbeitungsdetails jeweils nach einer festen Zeitspanne alternierend angezeigt werden.
  17. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei die Eingabeeinheit die Sprachoperation empfängt, die eine spezifische Wortfolge anzeigt, die mit einem entsprechenden der Verarbeitungsdetails verknüpft ist, die Extraktionseinheit das mit der Wortfolge verknüpfte Verarbeitungsdetail und das basierend auf einer Bedeutung der Wortfolge im anfänglichen Zustand abgeleitete Verarbeitungsdetail extrahiert, in dem die Wortfolge nicht mit dem Verarbeitungsdetail verknüpft ist, und die Ausgabeeinheit die Antwortinformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus dem mit der durch die Sprachoperation angegebenen Wortfolge verknüpften Verarbeitungsdetail und dem basierend auf der Bedeutung der Wortfolge im anfänglichen Zustand abgeleiteten Verarbeitungsdetail ausgibt, in dem die Sprachoperation nicht mit dem Verarbeitungsdetail verknüpft ist.
  18. Informationsverarbeitungsvorrichtung nach Anspruch 1, wobei die Extraktionseinheit eine Verarbeitungsausführungsanweisung und einen Eintrag einer Zeichenfolge durch die Sprachoperation als das Verarbeitungsdetail entsprechend der Sprachoperation extrahiert, und die Ausgabeeinheit die Antwortinformationen zum Treffen einer Auswahl des Verarbeitungsdetails aus der Verarbeitungsausführungsanweisung und zum Eintrag einer Zeichenfolge ausgibt.
  19. Informationsverarbeitungsverfahren, das Folgendes umfasst: Empfangen einer Sprachoperation; Extrahieren eines Verarbeitungsdetails entsprechend der empfangenen Sprachoperation; Ausgeben von Antwortinformationen zum Treffen, wenn das Verarbeitungsdetail entsprechend der empfangenen Sprachoperation nicht spezifiziert werden kann, einer Auswahl von zumindest einem Verarbeitungsdetail aus mehreren der extrahierten Verarbeitungsdetails; und Spezifizieren des aus den in den Antwortinformationen enthaltenen mehreren Verarbeitungsdetails ausgewählten Verarbeitungsdetails als das Verarbeitungsdetail entsprechend der Sprachoperation.
  20. Programm, um einen in einer Informationsverarbeitungsvorrichtung enthaltenen Computer zu veranlassen, zu fungieren als: eine Eingabeeinheit, ausgelegt zum Empfangen einer Sprachoperation; eine Extraktionseinheit, ausgelegt zum Extrahieren eines Verarbeitungsdetails entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation; eine Ausgabeeinheit, ausgelegt zum Ausgeben von Antwortinformationen zum Treffen, wenn das Verarbeitungsdetail entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation nicht spezifiziert werden kann, einer Auswahl von zumindest einem Verarbeitungsdetail aus mehreren der durch die Extraktionseinheit extrahierten Verarbeitungsdetails; und eine Spezifiziereinheit, ausgelegt zum Spezifizieren des aus den in den Antwortinformationen enthaltenen mehreren Verarbeitungsdetails ausgewählten Verarbeitungsdetails als das Verarbeitungsdetail entsprechend der durch die Eingabeeinheit empfangenen Sprachoperation.
DE112020002636.1T 2019-05-30 2020-03-02 Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm Withdrawn DE112020002636T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019-101736 2019-05-30
JP2019101736 2019-05-30
PCT/JP2020/008611 WO2020240958A1 (ja) 2019-05-30 2020-03-02 情報処理装置、情報処理方法、及びプログラム

Publications (1)

Publication Number Publication Date
DE112020002636T5 true DE112020002636T5 (de) 2022-02-24

Family

ID=73552885

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112020002636.1T Withdrawn DE112020002636T5 (de) 2019-05-30 2020-03-02 Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm

Country Status (3)

Country Link
JP (1) JPWO2020240958A1 (de)
DE (1) DE112020002636T5 (de)
WO (1) WO2020240958A1 (de)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06223104A (ja) 1993-01-28 1994-08-12 Matsushita Electric Ind Co Ltd 自然言語対話処理装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104871240A (zh) * 2012-12-28 2015-08-26 索尼公司 信息处理设备、信息处理方法、以及程序
JP2015052745A (ja) * 2013-09-09 2015-03-19 Necパーソナルコンピュータ株式会社 情報処理装置、制御方法、及びプログラム
US9639854B2 (en) * 2014-06-26 2017-05-02 Nuance Communications, Inc. Voice-controlled information exchange platform, such as for providing information to supplement advertising
EP3166023A4 (de) * 2014-07-04 2018-01-24 Clarion Co., Ltd. Fahrzeuginternes interaktives system und fahrzeuginterne informationsanwendung
WO2016157650A1 (ja) * 2015-03-31 2016-10-06 ソニー株式会社 情報処理装置、制御方法、およびプログラム
WO2019017027A1 (ja) * 2017-07-19 2019-01-24 ソニー株式会社 情報処理装置および情報処理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06223104A (ja) 1993-01-28 1994-08-12 Matsushita Electric Ind Co Ltd 自然言語対話処理装置

Also Published As

Publication number Publication date
US20220238108A1 (en) 2022-07-28
JPWO2020240958A1 (de) 2020-12-03
WO2020240958A1 (ja) 2020-12-03

Similar Documents

Publication Publication Date Title
DE102020001790A1 (de) Auf maschinellem Lernen basierende Text-in-Bild-Einbettungstechniken
DE60030920T2 (de) Verfahren zur Ermittlung von Persönlichkeitsmerkmalen unter Verwendung eines sprachbasierten Dialogs
DE102018007060A1 (de) Hervorheben von Schlüsselabschnitten eines Texts innerhalb eines Dokuments
DE202014011475U1 (de) Elektronisches Gerät
DE102016125508A1 (de) Auffindbarkeitssystem für Sprachaktionen
DE60313706T2 (de) Spracherkennungs- und -antwortsystem, Spracherkennungs- und -antwortprogramm und zugehöriges Aufzeichnungsmedium
DE102018113034A1 (de) Stimmenerkennungssystem und stimmenerkennungsverfahren zum analysieren eines befehls, welcher mehrere absichten hat
EP4170520A1 (de) Verfahren und vorrichtung zur konstruktion eines wissensgraphen, computervorrichtung und speichermedium
DE202017105901U1 (de) Erleichtern der Erzeugung und Wiedergabe von durch den Anwender aufgezeichneten Audiosignalen
DE112018006345T5 (de) Abrufen von unterstützenden belegen für komplexe antworten
EP3798922A1 (de) Vorrichtung und verfahren zum maschinenlernen und ansteuern einer maschine
DE102014118075A1 (de) Audio und Video synchronisierendes Wahrnehmungsmodell
DE112015006325T5 (de) Informations-Bereitstellsystem
DE112019007274T5 (de) Automatisches untertiteln hörbarer teile von inhalten auf einem computergerät
Brantner et al. Fractured Paradigm? Theories, concepts and methodology of visual framing research: a systematic review
EP2962296A2 (de) Wortwahlbasierte sprachanalyse und sprachanalyseeinrichtung
Draxler Online experiments with the Percy software framework-experiences and some early results.
DE112020002636T5 (de) Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm
DE112015003357T5 (de) Verfahren und System zum Erkennen einer eine Wortabfolge enthaltenden Sprachansage
DE102006027720A1 (de) Verfahren zur automatischen Aufbereitung von als Video vorliegenden sowie aus Bild- und/oder Scriptinhalten generierten Multimediapräsentationen für eine inhaltsbasierte Suche in diesen Videos
DE112020002743T5 (de) Informationsverarbeitungsvorrichtung
DE112019006199T5 (de) Datenverarbeitungsvorrichtung, Datenverarbeitungssystem und Datenverarbeitungsverfahren und Programm
Saito12 et al. VocalTurk: Exploring feasibility of crowdsourced speaker identification
DE112011105001T5 (de) Systeme und Verfahren zum Verknüpfen von Audiomaterial
JP2020091609A (ja) 学習支援装置、学習支援方法およびプログラム

Legal Events

Date Code Title Description
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee