JP7232485B1 - Information processing device, information processing system, information processing method and program - Google Patents

Information processing device, information processing system, information processing method and program Download PDF

Info

Publication number
JP7232485B1
JP7232485B1 JP2022107202A JP2022107202A JP7232485B1 JP 7232485 B1 JP7232485 B1 JP 7232485B1 JP 2022107202 A JP2022107202 A JP 2022107202A JP 2022107202 A JP2022107202 A JP 2022107202A JP 7232485 B1 JP7232485 B1 JP 7232485B1
Authority
JP
Japan
Prior art keywords
answer
question
sentence
feature
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022107202A
Other languages
Japanese (ja)
Other versions
JP2024006380A (en
Inventor
晶 季
博史 阿部
Original Assignee
株式会社ジョインポイントテック
ネブラ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ジョインポイントテック, ネブラ株式会社 filed Critical 株式会社ジョインポイントテック
Priority to JP2022107202A priority Critical patent/JP7232485B1/en
Application granted granted Critical
Publication of JP7232485B1 publication Critical patent/JP7232485B1/en
Publication of JP2024006380A publication Critical patent/JP2024006380A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】質問者の質問に対して適切な回答を提供する。【解決手段】情報処理装置100は、質問の特徴及び回答に関する情報が格納されている質問回答データDB200を用いて一連の質問に対して回答を順次提供する。情報処理装置100は、一連の質問のうち今回の質問に対応する第1文に基づいて第1文に関する特徴を抽出し、当該特徴と質問回答データDB200とに基づいて今回の質問に対する回答を決定する回答決定部130を備える。回答決定部130は、第1文に関する特徴に基づいて今回の質問に対する回答が決定できない場合には、今回の質問よりも前の過去の質問に対する回答に対応する第2文と第1文とに基づいて当該第1文及び当該第2文に関する各特徴を抽出し、これらの各特徴と質問回答データDB200とに基づいて今回の質問に対する回答を決定する。【選択図】図2An object of the present invention is to provide an appropriate answer to a question of an inquirer. An information processing apparatus (100) sequentially provides answers to a series of questions using a question and answer data DB (200) that stores information about features of questions and answers. The information processing apparatus 100 extracts features related to the first sentence of the series of questions based on the first sentence corresponding to the current question, and determines an answer to the current question based on the features and the question and answer data DB 200. An answer determination unit 130 is provided. If the answer to the current question cannot be determined based on the characteristics of the first sentence, the answer determination unit 130 determines the second sentence and the first sentence corresponding to the answers to the past questions before the current question. Based on this, each feature regarding the first sentence and the second sentence is extracted, and the answer to the current question is determined based on each feature and the question answer data DB 200 . [Selection drawing] Fig. 2

Description

本発明は、質問者の質問に対して回答を提供する情報処理装置、情報処理システム、情報処理方法及びプログラムに関する。 The present invention relates to an information processing device, an information processing system, an information processing method, and a program for providing answers to questioners' questions.

従来、質問者の質問に対して回答を提供する技術が存在する。例えば、人工知能を利用して質問に対する回答を自動で決定して出力する技術が提案されている(例えば、特許文献1参照)。 Conventionally, there exists a technology for providing answers to questions asked by questioners. For example, a technology has been proposed that uses artificial intelligence to automatically determine and output an answer to a question (see, for example, Patent Document 1).

特表2019-528512号公報Japanese Patent Publication No. 2019-528512

上述した従来技術では、質問に対する回答を自動で決定することが可能であるが、質問の内容によっては適切な回答を決定することが困難であることも想定される。例えば、質問に対する回答を出力した後に「なんでですか?」等の追加質問が質問者から発せられた場合には、この追加質問の内容から適切な回答を決定することができないおそれがある。 With the conventional technology described above, it is possible to automatically determine an answer to a question, but depending on the content of the question, it may be difficult to determine an appropriate answer. For example, if an additional question such as "Why?"

本発明は、質問者の質問に対して適切な回答を提供することを目的とする。 An object of the present invention is to provide an appropriate answer to the question of the questioner.

本発明の一態様は、質問の特徴及び回答に関する情報が格納されているデータベースを用いて一連の質問に対して回答を順次提供する情報処理装置である。この情報処理装置は、一連の質問のうち今回の質問に対応する第1文に基づいて第1文に関する特徴を抽出し、当該特徴とデータベースとに基づいて今回の質問に対する回答を決定する決定部を備える。決定部は、第1文に関する特徴に基づいて今回の質問に対する回答が決定できない場合には、今回の質問よりも前の過去の質問に対する回答に対応する第2文と第1文とに基づいて当該第1文及び当該第2文に関する各特徴を抽出し、これらの各特徴とデータベースとに基づいて今回の質問に対する回答を決定する。 One aspect of the present invention is an information processing device that sequentially provides answers to a series of questions using a database that stores information about features of questions and answers. This information processing device extracts features related to the first sentence of a series of questions based on the first sentence corresponding to the current question, and determines an answer to the current question based on the features and the database. Prepare. If the answer to the current question cannot be determined based on the characteristics of the first sentence, the determination unit determines based on the second sentence and the first sentence corresponding to the answers to the past questions before the current question. Features related to the first sentence and the second sentence are extracted, and an answer to the current question is determined based on these features and the database.

本発明によれば、質問者の質問に対して適切な回答を提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, an appropriate answer can be provided with respect to a questioner's question.

図1は、情報処理装置の使用する場合の使用例を簡略化して示す図である。FIG. 1 is a diagram showing a simplified example of use of an information processing apparatus. 図2は、情報処理装置の機能構成例を示すブロック図である。FIG. 2 is a block diagram illustrating a functional configuration example of an information processing apparatus. 図3は、動画DBに格納されている動画を模式的に示す図である。FIG. 3 is a diagram schematically showing moving images stored in the moving image DB. 図4は、質問回答データDBに格納されている質問回答データの格納内容を簡略化して示す図である。FIG. 4 is a diagram showing in simplified form the contents of the question-and-answer data stored in the question-and-answer data DB. 図5は、AIを用いた特徴を抽出する場合に用いられる特徴抽出器の構成例を示すブロック図である。FIG. 5 is a block diagram showing a configuration example of a feature extractor used when extracting features using AI. 図6は、入力文と特徴量との関係例を示す図である。FIG. 6 is a diagram showing an example of the relationship between an input sentence and feature amounts. 図7は、質問回答データDBに格納されている質問回答データの格納内容を簡略化して示す図である。FIG. 7 is a diagram showing in simplified form the contents of the question-and-answer data stored in the question-and-answer data DB. 図8は、新たな質問から特徴量を抽出する抽出処理の一例を模式的に示す図である。FIG. 8 is a diagram schematically showing an example of extraction processing for extracting feature amounts from new questions. 図9は、新たな質問から特徴量を抽出する抽出処理の一例を模式的に示す図である。FIG. 9 is a diagram schematically showing an example of extraction processing for extracting feature amounts from new questions. 図10は、情報処理装置における会話応答処理の一例を示すフローチャートである。FIG. 10 is a flowchart showing an example of conversation response processing in the information processing device. 図11は、情報処理システムの機能構成例を示すブロック図である。FIG. 11 is a block diagram showing a functional configuration example of an information processing system. 図12は、情報処理システムの機能構成例を示すブロック図である。FIG. 12 is a block diagram illustrating a functional configuration example of an information processing system.

以下、添付図面を参照しながら本発明の実施形態について説明する。 Embodiments of the present invention will be described below with reference to the accompanying drawings.

[情報処理装置の使用例]
図1は、情報処理装置100を使用する場合の使用例を簡略化して示す図である。情報処理装置100は、質問者U1が発した質問に対して、予め用意された回答者U2の動画を再生する会話応答装置である。すなわち、予め用意された回答者U2の動画が表示部141に表示され、予め用意された回答者U2の動画に関連付けられた音声情報が音声出力部142から出力される。例えば、比較的大きな表示装置に回答者U2を等身大で表示することにより、回答者U2と会話している雰囲気を出すことが可能となる。
[Usage example of information processing device]
FIG. 1 is a diagram showing a simplified usage example when using an information processing apparatus 100. As shown in FIG. The information processing device 100 is a conversation response device that reproduces a prepared moving image of a respondent U2 in response to a question posed by a questioner U1. That is, a previously prepared moving image of the respondent U2 is displayed on the display unit 141, and audio information associated with the previously prepared moving image of the respondent U2 is output from the audio output unit 142. FIG. For example, by displaying the respondent U2 life-size on a relatively large display device, it is possible to create an atmosphere of having a conversation with the respondent U2.

回答者U2の動画は、回答者U2を予め撮影して記録しておく。すなわち、本実施形態では、質問者U1からの質問に対する回答として、質問がされる毎に回答動画を画像処理技術により新たに生成することはせず、予め録画された回答動画の回答部分を再生することができる。ここで、例えば、画像処理により回答者U2の回答画像を新たに生成することも考えられる。しかし、画像処理により生成された回答者U2の回答画像は、ぎこちない表情となったり、ぎこちない回答となったりする可能性もある。これに対して、本実施形態では、予め撮影された回答者U2の回答動画を再生することが可能であるため、回答者U2がぎこちない表情となったり、回答者U2の回答がぎこちないものとなったりすることを防止することが可能となる。また、実際に撮影された回答者U2の回答動画を再生することにより、リアルな応答を実現することができる。 Respondent U2 is previously photographed and recorded as a moving image of respondent U2. That is, in the present embodiment, as an answer to the question from the questioner U1, the answer part of the pre-recorded answer movie is reproduced instead of generating a new answer movie by image processing technology every time the question is asked. can do. Here, for example, it is conceivable to generate a new answer image of the answerer U2 by image processing. However, the answer image of the respondent U2 generated by image processing may have an awkward expression or an awkward answer. On the other hand, in the present embodiment, it is possible to play back the reply video of the respondent U2, which has been shot in advance. It is possible to prevent it from slipping. In addition, by playing back an answer moving image of answerer U2 that was actually shot, a realistic response can be realized.

[情報処理装置の構成例]
図2は、情報処理装置100の機能構成例を示すブロック図である。
[Configuration example of information processing device]
FIG. 2 is a block diagram showing a functional configuration example of the information processing apparatus 100. As shown in FIG.

情報処理装置100は、入力部110と、音声認識部120と、回答決定部130と、回答応答部140と、質問回答データDB200と、動画DB300とを備える。 The information processing apparatus 100 includes an input unit 110, a voice recognition unit 120, an answer determination unit 130, an answer response unit 140, a question/answer data DB200, and a video DB300.

入力部110は、質問者U1が発する音声をリアルタイムで受け付ける入力部である。例えば、入力部110としてマイク、音声認識専用入力デバイス等の音声入力装置を用いることができる。また、例えば、画像を取得可能なカメラ、音声を入力可能なマイク等で構成される入力装置、例えば撮像装置を用いてもよい。また、例えば、文字を入力可能な入力装置、例えばキーボードを用いてもよい。なお、図2では、情報処理装置100に入力部110を設ける例を示すが、情報処理装置100とは異なる別体の入力装置を入力部110として用いてもよい。すなわち、マイク等の入力装置を情報処理システムに予め登録しておくことにより情報処理装置100の入力部として機能させることが可能である。情報処理装置100とは異なる別体の入力装置を設ける例については、図11に示す。 The input unit 110 is an input unit that receives the voice uttered by the questioner U1 in real time. For example, as the input unit 110, a voice input device such as a microphone or an input device dedicated to voice recognition can be used. Further, for example, an input device such as a camera capable of acquiring an image, a microphone capable of inputting sound, and the like, such as an imaging device, may be used. Also, for example, an input device capable of inputting characters, such as a keyboard, may be used. Note that FIG. 2 shows an example in which the information processing device 100 is provided with the input unit 110 , but an input device separate from the information processing device 100 may be used as the input unit 110 . That is, by registering an input device such as a microphone in the information processing system in advance, it can be made to function as an input unit of the information processing apparatus 100 . An example of providing an input device separate from the information processing apparatus 100 is shown in FIG.

入力部110は、質問者U1の質問を受け付けると、その質問の音声情報を音声認識部120に出力する。なお、入力部110は、回答応答部140から回答動画が再生されている間(すなわち回答中)に質問者U1から質問(例えば追加質問)があった場合でもその質問を受け付ける。 The input unit 110 outputs the voice information of the question to the voice recognition unit 120 when receiving the question from the questioner U1. Note that the input unit 110 accepts a question (for example, an additional question) from the questioner U1 while the answer video is being played back from the answer response unit 140 (that is, during answering).

音声認識部120は、入力部110から出力された音声情報に基づいて、質問者U1の質問の内容をテキストデータに変換するものであり、変換後のテキストデータを回答決定部130に出力する。なお、音声認識部120によるテキストデータへの変換方法については、公知の音声認識技術を採用することが可能である。例えば、API(Application Programming Interface)を用いることができる。なお、音声認識部120は、例えば、CPU(Central Processing Unit)等の処理回路により実現される。なお、文字を入力可能な入力装置を入力部110として用いる場合には、音声認識部120を省略することが可能である。なお、この場合に、入力部110は、文字入力により生成されたテキストデータを回答決定部130に直接出力する。 The speech recognition section 120 converts the content of the question asked by the questioner U1 into text data based on the speech information output from the input section 110, and outputs the converted text data to the answer determination section 130. It should be noted that a publicly known speech recognition technology can be employed as a method of conversion into text data by the speech recognition unit 120 . For example, an API (Application Programming Interface) can be used. Note that the speech recognition unit 120 is realized by, for example, a processing circuit such as a CPU (Central Processing Unit). Note that when an input device capable of inputting characters is used as the input unit 110, the speech recognition unit 120 can be omitted. In this case, input unit 110 directly outputs text data generated by character input to answer determination unit 130 .

回答決定部130は、入力部110又は音声認識部120から出力されたテキストデータに基づいて、質問者U1の質問に対する回答を決定するものであり、その決定された回答に関する回答情報を回答応答部140に出力する。例えば、回答決定部130は、入力部110又は音声認識部120から出力されたテキストデータに基づいて、質問者U1の質問に関する特徴を抽出する。質問に関する特徴として、例えば、図4等に示すように、質問に含まれる単語等を抽出してもよく、図7等に示すように、数値化された特徴量を抽出してもよい。そして、回答決定部130は、抽出された質問の特徴と似ている質問を質問回答データDB200から抽出し、その抽出された質問に関連付けられている回答に関する回答情報を回答応答部140に出力する。このように、回答決定部130は、予め用意された質問回答データDB200から質問者U1の質問の特徴と似ている質問を探し出し、その探し出した質問に関連付けられている回答に関する回答情報を回答応答部140に出力する。なお、これらの質問の特徴の抽出処理、回答の決定処理については、図4乃至図9等を参照して詳細に説明する。回答決定部130は、例えば、CPU等の処理回路により実現される。 The answer determination unit 130 determines an answer to the question of the questioner U1 based on the text data output from the input unit 110 or the speech recognition unit 120, and transmits answer information on the determined answer to the answer response unit. output to 140. For example, the answer determination unit 130 extracts features related to the question of the questioner U1 based on the text data output from the input unit 110 or the speech recognition unit 120. FIG. As the feature of the question, for example, words included in the question may be extracted as shown in FIG. 4 and the like, or numerical feature amounts may be extracted as shown in FIG. 7 and the like. Then, the answer determination unit 130 extracts questions similar to the features of the extracted question from the question/answer data DB 200, and outputs answer information related to answers associated with the extracted questions to the answer response unit 140. . In this way, the answer determination unit 130 searches for a question similar to the characteristics of the question asked by the questioner U1 from the question-and-answer data DB 200 prepared in advance, and provides answer information related to the answer associated with the searched question. Output to unit 140 . The process of extracting the characteristics of these questions and the process of determining answers will be described in detail with reference to FIGS. 4 to 9 and the like. The answer determination unit 130 is implemented by, for example, a processing circuit such as a CPU.

回答応答部140は、質問者U1に対して、質問者U1の質問に対する回答動画を提供する出力部である。具体的には、回答応答部140は、回答決定部130から出力された回答情報に基づいて、動画DB300における再生部分を抽出し、その抽出された動画を表示部141に表示させ、その動画に関連付けられている音声情報を音声出力部142から出力させる。このように、回答応答部140は、受け取った回答を再生する再生部として機能する。例えば、回答応答部140として画像及び音声を出力可能な表示ディスプレイ等の画像表示装置を用いることができる。また、例えば、画像及び音声のうちの少なくとも1つを出力可能な出力装置を用いてもよい。なお、図1、図2では、回答応答部140の一例として表示部141、音声出力部142を情報処理装置100に設ける例を示すが、情報処理装置100とは異なる別体の出力装置を回答応答部140として用いてもよい。情報処理装置100とは異なる別体の出力装置を設ける例については、図11に示す。 The answer response unit 140 is an output unit that provides the questioner U1 with an answer video to the question of the questioner U1. Specifically, the answer response unit 140 extracts the playback portion in the video DB 300 based on the answer information output from the answer determination unit 130, displays the extracted video on the display unit 141, and displays the video on the display unit 141. The associated audio information is output from the audio output unit 142 . In this way, the answer responding section 140 functions as a reproducing section that reproduces the received reply. For example, an image display device such as a display capable of outputting images and sounds can be used as the answer response unit 140 . Also, for example, an output device capable of outputting at least one of images and sounds may be used. 1 and 2 show an example in which the display unit 141 and the voice output unit 142 are provided in the information processing apparatus 100 as an example of the answer response unit 140. You may use as the response part 140. FIG. An example of providing an output device separate from the information processing device 100 is shown in FIG.

記憶部150は、各種情報を記憶する記憶媒体である。例えば、記憶部150には、音声認識部120、回答決定部130、回答応答部140が各種処理を行うために必要となる各種情報(例えば、制御プログラム、質問回答データDB200、動画DB300)が記憶される。記憶部150として、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、SSD(Solid State Drive)等の各種記憶媒体を用いることができる。 The storage unit 150 is a storage medium that stores various information. For example, the storage unit 150 stores various types of information (for example, control programs, question and answer data DB 200, video DB 300) necessary for the speech recognition unit 120, the answer determination unit 130, and the answer response unit 140 to perform various processes. be done. Various storage media such as ROM (Read Only Memory), RAM (Random Access Memory), HDD (Hard Disk Drive), and SSD (Solid State Drive) can be used as the storage unit 150 .

質問回答データDB200は、予め用意された質問と回答との組合せを格納するデータベースである。なお、質問回答データDB200については、図4を参照して詳細に説明する。 The question-and-answer data DB 200 is a database that stores combinations of prepared questions and answers. The question-and-answer data DB 200 will be described in detail with reference to FIG.

動画DB300は、予め用意された回答者U2の動画を格納するデータベースである。なお、動画DB300に格納されている動画については、図3を参照して詳細に説明する。 The moving image DB 300 is a database that stores previously prepared moving images of respondent U2. Note that the moving images stored in the moving image DB 300 will be described in detail with reference to FIG.

[動画の構成例]
図3は、動画DB300に格納されている動画310を模式的に示す図である。図3では、動画310の開始位置S1から終了位置E1までの再生時間の長さを左右方向に延びた矩形で示す。
[Video configuration example]
FIG. 3 is a diagram schematically showing a moving image 310 stored in the moving image DB 300. As shown in FIG. In FIG. 3, the length of the playback time from the start position S1 to the end position E1 of the moving image 310 is indicated by a rectangle extending in the horizontal direction.

動画DB300に格納されている動画310については、動画の位置を指定することにより各部分からの再生が可能である。図3では、動画の位置S11からS12までの動画部分と、動画の位置S21からS22までの動画部分と、動画の位置S31からS32までの動画部分と、これらの各動画部分の画像の一部との関係を簡略化して示す。これらの各動画部分については、図4を参照して詳細に説明する。 A moving image 310 stored in the moving image DB 300 can be reproduced from each part by specifying the position of the moving image. In FIG. 3, the moving image portion from the moving image positions S11 to S12, the moving image portion from the moving image positions S21 to S22, the moving image portion from the moving image positions S31 to S32, and part of the image of each of these moving image portions The relationship with is simplified and shown. Each of these animated portions will be described in detail with reference to FIG.

例えば、回答応答部140は、動画の位置S11からS12までを指定する回答情報が回答決定部130から出力された場合には、動画の位置S11からS12までの動画部分を再生可能である。 For example, when answer information specifying moving image positions S11 to S12 is output from the answer determining unit 130, the answer responding unit 140 can reproduce the moving image portion from the moving image positions S11 to S12.

[質問回答データDBの構成例]
図4は、質問回答データDB200に格納されている質問回答データの格納内容を簡略化して示す図である。
[Configuration example of question and answer data DB]
FIG. 4 is a diagram showing in simplified form the contents of the question-and-answer data stored in the question-and-answer data DB 200. As shown in FIG.

質問回答データDB200は、予め用意された回答者U2の動画310から、質問者U1からの質問に対する回答部分を抽出するための各種情報を格納するためのデータベースである。 The question-and-answer data DB 200 is a database for storing various kinds of information for extracting answers to questions from the questioner U1 from the video 310 of the answerer U2 prepared in advance.

具体的には、質問201と、回答202と、質問の特徴203と、回答動画の位置204とが関連付けて質問回答データDB200に格納される。 Specifically, a question 201 , an answer 202 , a feature 203 of the question, and a position 204 of the answer moving image are associated and stored in the question/answer data DB 200 .

質問201は、想定される質問の内容を示す情報である。この質問については、回答者U2の動画310の内容に基づいて、情報処理装置100側の管理者等が予め生成しておき、格納することが可能である。なお、人工知能(AI:Artificial Intelligent)等を用いて、回答者U2の動画310から質問を推定して格納してもよい。 The question 201 is information indicating the contents of an assumed question. This question can be generated in advance by an administrator or the like on the information processing apparatus 100 side based on the content of the moving image 310 of the respondent U2, and can be stored. In addition, artificial intelligence (AI) or the like may be used to estimate the question from the moving image 310 of the respondent U2 and store the question.

回答202は、質問201に対して回答する内容を示す情報である。この回答については、回答者U2の動画310の内容に基づいて、情報処理装置100側の管理者等が予め生成しておき、格納することが可能である。なお、人工知能等を用いて、回答者U2の動画310から回答を抽出して格納してもよい。 The answer 202 is information indicating the content of the answer to the question 201 . This answer can be generated in advance by an administrator or the like on the information processing apparatus 100 side based on the content of the moving image 310 of the respondent U2, and can be stored. An answer may be extracted from the moving image 310 of the answerer U2 using artificial intelligence or the like and stored.

質問の特徴203は、質問201に対応する文について、特徴となる単語等を示す情報である。例えば、質問201「出身地はどこですか?」に対しては、「出身地」「どこ」の単語が特徴となる。この質問の特徴については、質問201の内容に基づいて、情報処理装置100側の管理者等が予め生成しておき、格納することが可能である。なお、人工知能等を用いて、質問の特徴を抽出して格納してもよい。 The question feature 203 is information indicating a word or the like that is a feature of the sentence corresponding to the question 201 . For example, the question 201 "Where are you from?" features the words "where are you from" and "where are you from?" The characteristics of this question can be generated in advance by an administrator or the like on the information processing apparatus 100 side based on the content of the question 201 and stored. In addition, using artificial intelligence or the like, the feature of the question may be extracted and stored.

回答動画の位置204は、動画DB300に格納されている動画310における記録部分を示す情報である。例えば、質問201「出身地はどこですか?」に対応する回答動画の位置204「00:23:43-00:24:15」は、図3に示す動画の位置S11からS12までの動画部分に対応する。また、質問201「好きな食べ物は何ですか?」に対応する回答動画の位置204「01:19:01-01:19:06」は、図3に示す動画の位置S21からS22までの動画部分に対応する。また、質問201「なぜおむすびが好きなんですか?」に対応する回答動画の位置204「01:19:12-01:20:13」は、図3に示す動画の位置S31からS32までの動画部分に対応する。 The answer moving image position 204 is information indicating the recorded portion in the moving image 310 stored in the moving image DB 300 . For example, the position 204 "00:23:43-00:24:15" of the answer video corresponding to the question 201 "Where are you from?" handle. Also, the position 204 "01:19:01-01:19:06" of the answer video corresponding to the question 201 "What is your favorite food?" corresponding to the part. Also, the position 204 "01:19:12-01:20:13" of the answer video corresponding to the question 201 "Why do you like rice balls?" corresponds to

[回答の抽出例]
次に、回答決定部130が、質問回答データDB200を用いて質問者U1の質問に対する回答を抽出する抽出方法について説明する。
[Answer extraction example]
Next, a description will be given of an extraction method by which the answer determination unit 130 extracts an answer to the question of the questioner U1 using the question/answer data DB 200. FIG.

ここでは、質問者U1が質問「好きな食べ物は何ですか?」を発した場合を例にして説明する。このように、質問者U1が質問「好きな食べ物は何ですか?」を発した場合には、入力部110は、音声「好きな食べ物は何ですか?」を取得して、音声情報「好きな食べ物は何ですか?」を音声認識部120に出力する。 Here, a case where the questioner U1 asks the question "What is your favorite food?" will be described as an example. Thus, when the questioner U1 issues the question "What is your favorite food?", the input unit 110 acquires the voice "What is your favorite food?" What is your favorite food?” is output to the speech recognition unit 120.

音声認識部120は、入力部110から出力された音声情報「好きな食べ物は何ですか?」をテキストデータ「好きな食べ物は何ですか?」に変換し、テキストデータ「好きな食べ物は何ですか?」を回答決定部130に出力する。 The speech recognition unit 120 converts the speech information “What is your favorite food?” output from the input unit 110 into text data “What is your favorite food?” Is it?” is output to the answer determination unit 130.

回答決定部130は、音声認識部120から出力されたテキストデータ「好きな食べ物は何ですか?」に基づいて、質問の特徴を抽出する。この質問の特徴については、予め設定されている言葉、単語に基づいて抽出される。例えば、質問に対応する文に含まれる各単語が、その質問の特徴として抽出される。なお、文に含まれる単語の抽出方法については、公知の文章解析技術を用いることができる。 The answer determination unit 130 extracts features of the question based on the text data “What is your favorite food?” output from the speech recognition unit 120 . The features of this question are extracted based on preset words. For example, each word included in a sentence corresponding to a question is extracted as a feature of the question. Note that a known sentence analysis technique can be used as a method for extracting words contained in sentences.

図4に示す例では、テキストデータ「好きな食べ物は何ですか?」を構成する各単語「好き、食べ物、なに」が特徴として抽出される。 In the example shown in FIG. 4, each word "What is your favorite food?" which constitutes the text data "What is your favorite food?" is extracted as a feature.

次に、回答決定部130は、抽出された質問の特徴「好き、食べ物、なに」と同一又は似ている単語を、質問の特徴203から探し出す。図4に示す例では、点線の矩形211で示すように、抽出された質問の特徴「好き、食べ物、なに」と同一の特徴「好き、食べ物、なに」が、質問の特徴203に格納されている。このため、回答決定部130は、抽出された質問の特徴「好き、食べ物、なに」に対する回答として、回答202の「おむすびが好きです。」と、回答動画の位置204「01:19:01-01:19:06」を抽出する。 Next, the answer determining unit 130 searches the question features 203 for words that are the same as or similar to the extracted question features “like, food, what”. In the example shown in FIG. 4, as indicated by a dotted-line rectangle 211, the same feature “like, food, what” as the extracted question feature “like, food, what” is stored in the question feature 203. It is For this reason, the answer determination unit 130 selects the answer 202 "I like rice balls" and the answer video position 204 "01:19:01" as answers to the extracted question characteristics "like, food, what". -01:19:06”.

ここで、質問者U1の質問の特徴と同一又は似ている単語を、質問の特徴203から探し出す抽出処理について説明する。例えば、質問の特徴203に格納されている各単語の組合せのうちに、質問者U1の質問の特徴の全てが一致する各単語の組合せが存在する場合には、その全てが一致する各単語の組合せに対応する回答202及び回答動画の位置204が抽出される。また、例えば、質問の特徴203に格納されている各単語の組合せのうちに、質問者U1の質問の特徴の一部が一致する各単語の組合せが存在する場合には、その一部が一致する各単語の組合せに対応する回答202及び回答動画の位置204が抽出される。この場合には、所定の割合以上の単語が一致することを条件としてもよい。例えば、60%以上の単語が一致することを条件とすることができる。例えば、質問者U1の質問の特徴が「好き、食べ物、ある」である場合には、質問の特徴203の「好き、食べ物、なに」のうち「好き、食べ物」が一致する。この場合には、66%の単語が一致することになるため、質問の特徴203「好き、食べ物、なに」に対応する回答202及び回答動画の位置204が抽出される。なお、所定の割合以上の単語が一致する組合せが複数存在する場合には、その割合が最も高い組合せに対応する回答202及び回答動画の位置204が抽出される。このように、回答決定部130は、質問者U1の質問文に含まれる1又は複数の単語と、質問の特徴203に格納されている単語との一致度(又は類似度)に基づいて、今回の質問に対する回答を決定する。 Extraction processing for searching for words that are the same as or similar to the question feature of the questioner U1 from the question feature 203 will now be described. For example, among the combinations of words stored in the question features 203, if there is a combination of words that matches all of the features of questioner U1's question, the The answer 202 corresponding to the combination and the position 204 of the answer moving image are extracted. Further, for example, if there is a combination of words that partly matches the question feature of the questioner U1 among the word combinations stored in the question feature 203, the part matches. The answer 202 corresponding to each word combination and the position 204 of the answer animation are extracted. In this case, the condition may be that a predetermined percentage or more of the words match. For example, 60% or more words may be matched as a condition. For example, if the question feature of the questioner U1 is "likes, food, there is", "likes, food" of the question feature 203 "likes, food, what" matches. In this case, 66% of the words match, so the answer 202 and the position 204 of the answer moving image corresponding to the question feature 203 "like, food, what" are extracted. Note that if there are multiple combinations in which words match at a predetermined ratio or more, the answer 202 and the position 204 of the answer moving image corresponding to the combination with the highest ratio are extracted. In this way, the answer determination unit 130 determines the current determine the answer to the question.

一方、質問の特徴203に格納されている各単語の組合せのうちに、質問者U1の質問の特徴と一致する単語が存在しない場合、又は、質問者U1の質問の特徴の一部が一致するが、その一致が所定の割合未満である場合も想定される。この場合には、質問者U1の質問の特徴「好き、食べ物、なに」に対する回答が存在しないと判定される。このように、質問者U1の質問の特徴に対する回答が存在しない場合には、後述するように、今回の質問よりも前の回答を用いて、新たな質問を生成して回答を抽出することが可能である。 On the other hand, if there is no word that matches the characteristics of questioner U1's question among the combinations of words stored in the question characteristics 203, or if some of the characteristics of questioner U1's question match However, it is also envisioned that the match is less than a predetermined percentage. In this case, it is determined that there is no answer to the characteristics of questioner U1's question, 'What do you like, what is food?'. In this way, when there is no answer to the characteristics of questioner U1's question, as will be described later, it is possible to generate a new question and extract an answer using the answer before the current question. It is possible.

次に、回答決定部130は、抽出された回答202「おむすびが好きです。」と、回答動画の位置204「01:19:01-01:19:06」とを回答情報として回答応答部140に出力する。 Next, the answer determining unit 130 sets the extracted answer 202 “I like rice balls” and the position 204 of the answer moving image “01:19:01-01:19:06” as answer information to the answer responding unit 140. output to

回答応答部140は、回答決定部130から出力された回答202「おむすびが好きです。」と、回答動画の位置204「01:19:01-01:19:06」とに基づいて、質問者U1からの質問「好きな食べ物は何ですか?」に対する回答「おむすびが好きです。」を出力する。この場合に、回答応答部140は、動画DB300に格納されている動画310に基づいて、音声出力部142からの音声情報「おむすびが好きです。」を出力してもよく、回答動画の位置204「01:19:01-01:19:06」に対応する動画部分を抽出して再生してもよい。このように、質問者U1からの質問「好きな食べ物は何ですか?」に対する回答「おむすびが好きです。」が出力される。 The answer response unit 140 responds to the questioner based on the answer 202 “I like rice balls” output from the answer determination unit 130 and the position 204 “01:19:01-01:19:06” of the answer video. The answer "I like rice balls." to the question "What is your favorite food?" from U1 is output. In this case, the response response unit 140 may output the voice information “I like rice balls.” A moving image portion corresponding to "01:19:01-01:19:06" may be extracted and reproduced. Thus, the answer "I like rice balls." to the question "What is your favorite food?" from the questioner U1 is output.

[話の文脈を考慮した会話例]
ここで、質問者U1からの質問「好きな食べ物は何ですか?」に対する回答「おむすびが好きです。」が出力されている間、又は、その出力直後に、質問者U1から新たな質問が発されることも想定される。例えば、回答応答部140が回答「おむすびが好きです。」を出力している間に、質問者U1が質問「なんでですか?」を発する場合を想定する。この場合に、回答決定部130は、質問「なんでですか?」から特徴「なんで」を抽出するものとする。また、質問の特徴203には、特徴「なんで」と同一又は似ている特徴が存在しないものとする。
[Conversation example considering context]
Here, while the answer "I like rice balls." to the question "What is your favorite food?" is also expected to be issued. For example, it is assumed that the questioner U1 asks the question "Why?" while the answer response unit 140 is outputting the answer "I like rice balls." In this case, the answer determining unit 130 extracts the feature "why" from the question "why?". Also, it is assumed that the feature 203 of the question does not have a feature that is the same as or similar to the feature "why?".

このように、回答決定部130は、質問「なんでですか?」から抽出された質問の特徴「なんで」と同一又は似ている特徴が質問の特徴203に存在しない場合には、その質問「なんでですか?」よりも前に出力された回答を用いて新たな質問を生成する。具体的には、回答決定部130は、直前に出力された回答「おむすびが好きです。」と、今回の質問「なんでですか?」とを合成して、「おむすびが好きです。なんでですか?」を新たな質問として生成する。 In this way, if the question feature 203 does not have a feature identical or similar to the question feature “why?” extracted from the question “why?”, the answer determination unit 130 A new question is generated using the answers output before "Is it?". Specifically, the answer determining unit 130 synthesizes the immediately preceding answer “I like rice balls” with the current question “Why?” ?” is generated as a new question.

このように、合成して生成された新たな質問「おむすびが好きです。なんでですか?」についても同様に、上述した特徴の抽出処理、回答の抽出処理が順次実行される。この例では、質問「おむすびが好きです。」の特徴として「おむすび、好き」が抽出されるものとする。 Similarly, the above-described feature extraction process and answer extraction process are sequentially executed for the new question "I like rice balls. Why?" In this example, it is assumed that "I like rice balls" is extracted as a characteristic of the question "I like rice balls."

具体的には、回答決定部130は、テキストデータ「おむすびが好きです。なんでですか?」から特徴「おむすび、好き、なんで」を抽出する。また、回答決定部130は、抽出された質問の特徴「おむすび、好き、なんで」と同一又は似ている単語を、質問の特徴203から探し出す。図4に示す例では、点線の矩形212で示すように、抽出された質問の特徴「おむすび、好き、なんで」と似ている特徴「なぜ、おむすび、好き」が、質問の特徴203に格納されている。このため、回答決定部130は、抽出された質問の特徴「おむすび、好き、なんで」に対する回答として、回答202の「戦時中の物のない時代、配給のお米を少しずつ蓄えておいてお母さんが作ってくれたおむすびのことを思い出すからかなあ」と、回答動画の位置204「01:19:12-01:19:13」を抽出する。 Specifically, the answer determination unit 130 extracts the feature "I like rice balls, why" from the text data "I like rice balls. Why?". In addition, the answer determining unit 130 searches the question features 203 for words that are the same as or similar to the extracted question features “rice ball, like, why”. In the example shown in FIG. 4, as indicated by a dotted-line rectangle 212, the feature “Why, I like rice balls” similar to the extracted question feature “I like rice balls, why” is stored in the question features 203. ing. For this reason, the answer determination unit 130 selects the answer 202 as an answer to the characteristic of the extracted question, "I like rice balls, why?" Maybe it's because it reminds me of the rice ball that was made for me."

次に、回答決定部130は、抽出された回答202「戦時中の物のない時代、配給のお米を少しずつ蓄えておいてお母さんが作ってくれたおむすびのことを思い出すからかなあ」と、回答動画の位置204「01:19:12-01:19:13」とを回答応答部140に出力する。なお、回答応答部140から出力方法については、上述した出力方法と同様である。 Next, the answer determination unit 130 selects the extracted answer 202, "Maybe because it reminds me of the rice balls that my mother made while saving little by little the rationd rice during the wartime when there weren't many things." , the position 204 of the answer moving image “01:19:12-01:19:13” is output to the answer response unit 140 . The output method from the answer response unit 140 is the same as the output method described above.

なお、前回の回答「おむすびが好きです。」と、今回の質問「なんでですか?」とを合成して生成された新たな質問「おむすびが好きです。なんでですか?」を用いて、上述した特徴の抽出処理、回答の抽出処理を実行しても、今回の質問に対する回答が抽出されないことも想定される。このような場合には、前回の回答と、前々回の回答と、今回の質問「なんでですか?」とを合成して新たな質問を生成し、この新たな質問を用いて、上述した特徴の抽出処理、回答の抽出処理を実行する。ただし、前回の回答と、前々回の回答と、今回の質問「なんでですか?」とを合成して生成された新たな質問を用いても、今回の質問に対する回答が抽出されないことも想定される。このような場合には、1回前の回答から3回前の回答までの各回答と、今回の質問「なんでですか?」とを合成して新たな質問を生成し、この新たな質問を用いて、上述した特徴の抽出処理、回答の抽出処理を実行する。すなわち、今回の質問に対する回答が抽出されるまで、1回前の回答からN回(ただし、Nは2以上の整数)前の回答までの各回答を合成して新たな質問を生成し、この新たな質問を用いて、上述した特徴の抽出処理、回答の抽出処理を実行する。 In addition, using the new question “I like rice balls. Why?” generated by combining the previous answer “I like rice balls” and the question “Why?” Even if the feature extraction process and the answer extraction process described above are executed, it is assumed that the answer to the current question will not be extracted. In such a case, a new question is generated by synthesizing the previous answer, the answer from the time before last, and the question "Why?" Execute extraction processing and answer extraction processing. However, even if a new question generated by combining the previous answer, the answer before the previous one, and the current question "Why?" is used, it is assumed that the answer to the current question will not be extracted. . In such a case, a new question is generated by synthesizing each answer from the previous answer to the three previous answers and the current question "Why?" are used to execute the above-described feature extraction processing and answer extraction processing. That is, until the answer to the current question is extracted, each answer from the previous answer to the previous answer N times (where N is an integer equal to or greater than 2) is synthesized to generate a new question. Using the new question, the feature extraction process and answer extraction process described above are executed.

ただし、今回の質問を基準として、過去に遡りすぎると、今回の質問の内容とは大きく異なる内容の回答となることも想定される。そこで、閾値TH1を設定し、1回前の回答から閾値TH1回前の回答までの各回答を合成対象としてもよい。ここで、閾値TH1は、実験データ等で適宜設定可能な値である。例えば、閾値TH1として、2乃至5程度の値を採用することが可能である。なお、閾値TH1として、類似度が高い回答が継続している場合には、閾値TH1を高い値としてもよい。すなわち、合成対象となる回答の内容に応じて閾値TH1を可変とすることが可能である。なお、閾値TH1を用いる代わりに、合成して生成される新たな質問に対応する文の文字数を基準として、合成対象として過去に遡る回答を決定してもよい。例えば、合成して生成される新たな質問に対応する文の文字数が100文字を超えたことを条件に、新たな質問の生成処理を中止してもよい。 However, if we go back too far in the past based on this question, it is possible that the answer will be very different from the content of this question. Therefore, a threshold TH1 may be set, and each answer from the answer one time before to the answer one time before the threshold TH may be synthesized. Here, the threshold TH1 is a value that can be appropriately set based on experimental data or the like. For example, a value of about 2 to 5 can be used as the threshold TH1. As the threshold TH1, the threshold TH1 may be set to a high value when answers with a high degree of similarity continue. That is, it is possible to change the threshold TH1 according to the content of the answer to be synthesized. Instead of using the threshold TH1, the number of characters in a sentence corresponding to a new question generated by synthesis may be used as a reference to determine an answer that goes back to the past as a synthesis target. For example, the process of generating a new question may be stopped on condition that the number of characters in a sentence corresponding to a new question generated by synthesis exceeds 100 characters.

ここで、例えば、質問者U1からの質問「好きな食べ物は何ですか」が発せられ、これに対する回答「おむすびが好きです。」が出力されている間に、質問者U1からの追加質問「なんでですか?」が発せられた場合を想定する。この場合には、従来の技術では、追加質問「なんでですか?」のみを用いて回答を決定するため、追加質問「なんでですか?」に対する適切な回答を生成することが困難であると想定される。すなわち、追加質問「なんでですか?」以外にも、回答の生成に用いることが可能な他の要素が必要となる。そこで、他の要素の入力を促すため、追加質問に対する回答として「質問内容が解りません。もう一度お願いします。」が出力されることが考えられる。 Here, for example, the question "What is your favorite food?" is issued by the questioner U1, and while the answer "I like rice balls." Why?" is assumed. In this case, with the conventional technology, it is assumed that it is difficult to generate an appropriate answer to the additional question "Why?" because the answer is determined using only the additional question "Why?" be done. That is, besides the additional question "why?", we need other elements that can be used to generate an answer. Therefore, it is conceivable that "I do not understand the content of the question. Please try again." is output as an answer to the additional question in order to prompt the input of other elements.

これに対して、本実施形態では、質問者U1からの追加質問「なんでですか?」が発せられた場合には、前回の回答「おむすびが好きです。」と、今回の質問「なんでですか?」とを合成して生成された新たな質問「おむすびが好きです。なんでですか?」を用いて回答することが可能である。このため、追加質問に対する回答として「戦時中の物のない時代、配給のお米を少しずつ蓄えておいてお母さんが作ってくれたおむすびのことを思い出すからかなあ」を出力することが可能となる。 On the other hand, in this embodiment, when the questioner U1 issues an additional question "Why?", the previous answer "I like rice balls." ?” to generate a new question “I like rice balls. Why?” For this reason, as an answer to the additional question, it is possible to output "I wonder if it reminds me of the omusubi that my mother made while saving little by little rice from the ration during the wartime when there was nothing." Become.

また、近くのラーメン屋に関する会話をする場合を想定する。例えば、質問者U1からの質問「近所のラーメン屋を教えて」が発せられ、これに対する回答「近くに3件のラーメン屋があります。表示しますか?」が出力されている間に、質問者U1からの追加質問「一番人気はどこ?」が発せられた場合を想定する。この場合には、従来の技術では、追加質問「一番人気はどこ?」のみを用いて回答を決定するため、追加質問「一番人気はどこ?」に対する適切な回答を生成することが困難であると想定される。すなわち、追加質問「一番人気はどこ?」以外にも、回答の生成に用いることが可能な他の要素が必要となる。そこで、他の要素の入力を促すため、追加質問に対する回答として「質問内容が解りません。もう一度お願いします。」が出力されることが考えられる。 It is also assumed that the user will have a conversation about a nearby ramen shop. For example, the question "Tell me about a nearby ramen shop" is issued by the questioner U1, and the answer "There are three ramen shops nearby. Do you want to display them?" It is assumed that an additional question "Where is the most popular?" is issued by person U1. In this case, with conventional technology, it is difficult to generate an appropriate answer to the additional question "Where is the most popular?" because the answer is determined using only the additional question "Where is the most popular?" is assumed to be That is, besides the additional question "Where is the most popular?", we need other factors that can be used to generate an answer. Therefore, it is conceivable that "I do not understand the content of the question. Please try again." is output as an answer to the additional question in order to prompt the input of other elements.

これに対して、本実施形態では、質問者U1からの追加質問「一番人気はどこ?」が発せられた場合には、前回の回答「近くに3件のラーメン屋があります。表示しますか?」と、今回の質問「一番人気はどこ?」とを合成して生成された新たな質問「近くに3件のラーメン屋があります。表示しますか?一番人気はどこ?」を用いて回答することが可能である。このため、追加質問に対する回答として「評価が高いのはA店ですが、一番近いのはBのお店です。」を出力することが可能となる。 On the other hand, in this embodiment, when the additional question "Where is the most popular?" and a new question "There are three ramen shops nearby. Do you want to display them? Where is the most popular?" It is possible to answer using Therefore, it is possible to output "store A has the highest evaluation, but store B is the closest" as an answer to the additional question.

[AIを用いた回答の抽出例]
以上では、質問者U1からの質問の特徴として、単語等を用いて特徴の抽出処理、回答の抽出処理を実行する例を示した。ここで、人工知能を用いて、質問者U1からの質問の特徴を抽出し、この特徴を用いて回答を抽出することも考えられる。そこで、以下では、AIを用いる例を示す。
[Example of extracting answers using AI]
In the above, an example of executing the feature extraction process and the answer extraction process using words or the like as the feature of the question from the questioner U1 has been shown. Here, it is also conceivable to use artificial intelligence to extract the features of the question from questioner U1, and to use these features to extract answers. Therefore, an example using AI will be shown below.

[AIを用いた特徴の抽出例]
図5は、AIを用いた特徴を抽出する場合に用いられる特徴抽出器131の構成例を示すブロック図である。特徴抽出器131は、回答決定部130に含まれるものとする。なお、本実施形態で示す学習は、多量のデータに基づいて、これらのデータの背後にある規則性を見出すことを意味するものとする。また、本実施形態で示す学習により生成される学習データは、各種の学習アルゴリズムにより生成される。
[Example of feature extraction using AI]
FIG. 5 is a block diagram showing a configuration example of the feature extractor 131 used when extracting features using AI. It is assumed that feature extractor 131 is included in answer determination section 130 . It should be noted that the learning shown in this embodiment means finding the regularity behind the data based on a large amount of data. Learning data generated by learning shown in this embodiment is generated by various learning algorithms.

特徴抽出器131は、予め学習された学習データを用いて、入力された文135から特徴量136を抽出するものである。すなわち、特徴抽出器131は、質問者U1からの質問に対応する文に関する特徴量を抽出するものである。ここで示す特徴量は、質問の文をコンピュータが扱えるようにするため、質問の文を数値化したものである。この数値化を行う場合の代表的なものとして、単語の共起関係に着目した数値化を行うword2vec、ディープラーニング等を用いることができる。また、word2vec、ディープラーニング等を用いて学習することにより、文の特徴が内包された数値を特徴量として取得可能となる。例えば、word2vec、ディープラーニング等を用いて各種の文を予め学習して学習データを生成しておき、この学習データを特徴量の抽出に用いるようにする。例えば、食べ物に関する文、乗り物に関する文、感情に関する文等の各文を教師データとして読み込ませ、学習データを生成することが可能である。この学習データを用いて抽出される特徴量については、文に含まれる単語(又は単語が有する意味)が似ているものは、似た数値の特徴量となる性質がある。そこで、特徴抽出器131は、その性質を利用して文の特徴量を抽出する。このように、本実施形態では、ディープラーニング、word2vec等によって予め学習された学習データを特徴量の抽出に用いることが可能である。 The feature extractor 131 extracts a feature quantity 136 from an input sentence 135 using learning data learned in advance. That is, the feature extractor 131 extracts a feature amount relating to the sentence corresponding to the question from the questioner U1. The feature amounts shown here are obtained by digitizing the question sentences so that the computer can handle the question sentences. Typical examples of this quantification include word2vec, which performs quantification focusing on the co-occurrence relationship of words, deep learning, and the like. Also, by learning using word2vec, deep learning, etc., it is possible to obtain numerical values that include sentence features as feature amounts. For example, various sentences are learned in advance using word2vec, deep learning, or the like to generate learning data, and this learning data is used for extracting feature amounts. For example, it is possible to generate learning data by reading each sentence such as a sentence about food, a sentence about a vehicle, a sentence about emotion, etc. as teacher data. Regarding feature amounts extracted using this learning data, similar words (or meanings of words) contained in sentences have the property of being similar numerical feature amounts. Therefore, the feature extractor 131 extracts the feature amount of the sentence using the property. Thus, in the present embodiment, it is possible to use learning data previously learned by deep learning, word2vec, or the like for extracting feature amounts.

[入力文と特徴量との関係例]
図6は、入力文161と特徴量162との関係例を示す図である。例えば、入力文161として「リンゴは好きですか」が特徴抽出器131に入力された場合には、特徴量162として「0.9 0 0.7 0 0 0.3」が出力される。
[Example of relationship between input sentence and feature quantity]
FIG. 6 is a diagram showing an example of the relationship between the input sentence 161 and the feature quantity 162. As shown in FIG. For example, when the feature extractor 131 receives the input sentence 161 "Do you like apples?"

なお、図6では、説明を容易にするため、単純化した例として、1つの入力文161に対して6組の数値の組み合わせからなる特徴量162を抽出する例を示す。ただし、実際には、1つの入力文161に対して多数(例えば1000組程度)の数値の組合せからなる特徴量162を抽出することになる。 Note that FIG. 6 shows, as a simplified example, an example of extracting a feature quantity 162 consisting of six combinations of numerical values for one input sentence 161 in order to facilitate the explanation. However, in practice, feature quantities 162 consisting of a large number (for example, about 1000 sets) of combinations of numerical values are extracted for one input sentence 161 .

このように抽出された特徴量には、何らかのカテゴリに関連する所定範囲の値(例えば0乃至1、-1乃至1)が含まれることになる。なお、図6乃至図9では、説明を容易にするため、0乃至1の値が抽出される例を示す。 The feature values extracted in this manner include values within a predetermined range (eg, 0 to 1, -1 to 1) related to some category. Note that FIGS. 6 to 9 show examples in which values of 0 to 1 are extracted in order to facilitate the explanation.

図6に示す例では、1番目の数値は「食」に関連する数値を示し、2番目の数値は「乗物」に関連する数値を示し、3番目の数値は「感情」に関連する数値を示し、4番目の数値は「動作」に関連する数値を示し、5番目の数値は「場所」に関連する数値を示し、6番目の数値は「疑問」に関連する数値を示すものとする。なお、0に近い値になるほど関連性が低くなることを意味し、1に近い値になるほど関連性が高くなることを意味するものとする。 In the example shown in FIG. 6, the first numerical value indicates a numerical value related to "food", the second numerical value indicates a numerical value related to "vehicle", and the third numerical value indicates a numerical value related to "emotion". , the fourth number indicates a number associated with "action", the fifth number indicates a number associated with "place", and the sixth number indicates a number associated with "question". Note that the closer the value is to 0, the lower the relevance, and the closer the value is to 1, the higher the relevance.

例えば、入力文「りんごは好きですか」の特徴量のうち、「食」に関連する数値は0.9であり、「感情」に関連する数値は0.7であるため、入力文「りんごは好きですか」は、食及び感情との関連性が高いものと推定可能である。また、入力文「りんごは好きですか」の特徴量のうち、「疑問」に関連する数値は0.3であるため、入力文「りんごは好きですか」は、疑問との関連性がある程度あるものと推定可能である。一方、入力文「りんごは好きですか」の特徴量のうち、「乗り物」、「動作」、「場所」に関連する各数値は0であるため、入力文「りんごは好きですか」は、乗り物、動作、場所との関連性はないと推定可能である。 For example, among the feature values of the input sentence "Do you like apples?" Do you like?" can be presumed to be highly related to food and emotions. In addition, among the feature values of the input sentence “Do you like apples?”, the numerical value related to “question” is 0.3. It can be assumed that there is On the other hand, among the feature quantities of the input sentence "Do you like apples?", since each numerical value related to "vehicle", "movement", and "place" is 0, the input sentence "Do you like apples?" It can be assumed that there is no relation to vehicle, action, or place.

なお、上述したように、実際には、1つの入力文161に対して多数(例えば1000組程度)の数値の組合せからなる特徴量162が抽出されるため、これらの多数の数値の組合せについては人間が意味を読み取ることは困難である。ただし、各数値については、何らかの関連性を示すものとなる。 As described above, in practice, feature quantities 162 composed of a large number (for example, about 1000 sets) of combinations of numerical values are extracted for one input sentence 161. It is difficult for humans to read the meaning. However, each numerical value indicates some relevance.

[質問回答データDBの構成例]
図7は、質問回答データDB200に格納されている質問回答データの格納内容を簡略化して示す図である。なお、図7に示す例では、図4の一部を変形したものであり、質問の特徴205が図4とは異なる。このため、質問の特徴205以外については、図4と同一の符号を付してこれらの説明を省略する。
[Configuration example of question and answer data DB]
FIG. 7 is a simplified diagram showing the contents of the question-and-answer data stored in the question-and-answer data DB 200. As shown in FIG. Note that the example shown in FIG. 7 is a partial modification of FIG. 4, and the feature 205 of the question is different from that in FIG. For this reason, the same reference numerals as those in FIG. 4 are assigned to the features other than the feature 205 of the question, and the description thereof is omitted.

質問回答データDB200は、質問201と、回答202と、質問の特徴205と、回答動画の位置204とが関連付けて質問回答データDB200に格納される。 The question and answer data DB 200 stores questions 201, answers 202, question features 205, and answer moving image positions 204 in association with each other.

質問の特徴205は、質問201に対応する文について抽出された特徴量を示す情報である。これらの特徴量については、上述したように、特徴抽出器131を用いて抽出が可能である。なお、回答202に関する特徴量を質問回答データDB200に保持してもよい。これにより、後述する、新たな質問の特徴量の抽出処理での演算量を削減することが可能となる。 The question feature 205 is information indicating the feature amount extracted for the sentence corresponding to the question 201 . These feature quantities can be extracted using the feature extractor 131 as described above. It should be noted that the feature amount related to the answer 202 may be held in the question/answer data DB 200 . As a result, it is possible to reduce the amount of calculation in the process of extracting the feature amount of a new question, which will be described later.

[回答の抽出例]
次に、回答決定部130が、質問回答データDB200を用いて質問者U1の質問に対する回答を抽出する抽出方法について説明する。
[Answer extraction example]
Next, a description will be given of an extraction method by which the answer determination unit 130 extracts an answer to the question of the questioner U1 using the question/answer data DB 200. FIG.

ここでは、上述した例と同様に、質問者U1が質問「好きな食べ物はありますか?」を発した場合を例にして説明する。また、この場合の質問者U1の質問「好きな食べ物はありますか?」に対する入力部110による音声入力、音声認識部120によるテキストデータ「好きな食べ物はありますか?」への変換については、上述した各処理と同様である。 Here, as in the above example, the case where the questioner U1 asks the question "Do you have a favorite food?" will be described as an example. In this case, voice input by the input unit 110 in response to questioner U1's question "Do you have any favorite food?" It is the same as each processing performed.

回答決定部130の特徴抽出器131は、音声認識部120から出力されたテキストデータ「好きな食べ物はありますか?」に基づいて、特徴量「0.6 0 0.7 0 0 0.39」を抽出する。 The feature extractor 131 of the answer determination unit 130 extracts the feature amount "0.6 0 0.7 0 0 0.39" based on the text data "Do you have any favorite food?" output from the speech recognition unit 120. to extract

次に、回答決定部130は、抽出された特徴量「0.6 0 0.7 0 0 0.39」と同一又は数値が近い特徴量を、質問の特徴205から探し出す。図7に示す例では、点線の矩形213で示すように、抽出された特徴量「0.6 0 0.7 0 0 0.39」と数値が近い特徴量「0.6 0 0.7 0 0 0.4」が、質問の特徴205に格納されている。このため、回答決定部130は、抽出された特徴量「0.6 0 0.7 0 0 0.39」に対する回答として、回答202の「おむすびが好きです。」と、回答動画の位置204「01:19:01-01:19:06」を抽出する。 Next, the answer determination unit 130 searches for a feature amount that is the same as or close to the extracted feature amount “0.6 0 0.7 0 0 0.39” from the feature 205 of the question. In the example shown in FIG. 7, as indicated by a dotted-line rectangle 213, the extracted feature amount "0.6 0 0.7 0 0 0.39" is close to the feature amount "0.6 0 0.7 0 0 0.4” is stored in the question feature 205 . Therefore, the answer determination unit 130 determines the answer 202 "I like rice balls" and the answer video position 204 " 01:19:01-01:19:06”.

ここで、質問者U1の質問の特徴量と同一又は数値が近い特徴量を、質問の特徴205から探し出す抽出処理について説明する。この抽出処理では、質問者U1の質問の特徴量と、質問の特徴205に格納されている各特徴量とが完全に一致する場合には、その完全に一致する特徴量が質問の特徴205から抽出される。一方、質問の特徴205に格納されている各特徴量のうちに、質問者U1の質問の特徴量と完全に一致するものが存在しない場合には、これらのうちの少なくとも一部が同一であり、他の値との差分値が所定値以内となる特徴量が質問の特徴205から抽出される。例えば、質問者U1の質問の6組の特徴量のうち、少なくとも4組の値が質問の特徴205の対応する値と同一であり、かつ、他の組の値と質問の特徴205の対応する値との差分値が所定値以内、例えば、0.1以内である場合に、似ていると判定される。例えば、上述した例では、質問者U1の質問の特徴量「0.6 0 0.7 0 0 0.39」と質問の特徴205「0.6 0 0.7 0 0 0.4」とについて、最初の5列の各値が同一であり、最後の6列の値の差分値が0.01である。このため、両者は似ていると判定される。 Here, an extraction process for searching the question features 205 for feature amounts that are the same as or close in numerical value to the question feature amount of questioner U1 will be described. In this extraction process, when the question feature quantity of the questioner U1 completely matches each feature quantity stored in the question feature 205, the completely matching feature quantity is extracted from the question feature 205. extracted. On the other hand, if none of the feature quantities stored in the question feature 205 completely match the feature quantity of questioner U1's question, at least some of them are the same. , is extracted from the feature 205 of the question such that the difference value from other values is within a predetermined value. For example, among the six sets of feature amounts of the question of questioner U1, at least four sets of values are the same as the corresponding values of the question feature 205, and the other sets of values correspond to the question feature 205. Similarity is determined when the difference value from the value is within a predetermined value, for example, within 0.1. For example, in the above-described example, the question feature amount "0.6 0 0.7 0 0 0.39" of the questioner U1 and the question feature 205 "0.6 0 0.7 0 0 0.4" , the values in the first five columns are identical, and the difference value of the values in the last six columns is 0.01. Therefore, both are determined to be similar.

また、例えば、質問者U1の質問の6組の特徴量と、質問の特徴205の対応する値との差分値を列毎に順次算出し、これらの列毎の6組の差分値の合計を算出し、その列毎の6組の差分値の合計値が所定値以内、例えば、0.2以内である場合に、似ていると判定してもよい。例えば、上述した例では、質問者U1の質問の特徴量「0.6 0 0.7 0 0 0.39」と質問の特徴205「0.6 0 0.7 0 0 0.4」とについて、最初の5列の各値が同一であるため、最初の5列の差分値の合計は0である。また、最後の6列の値の差分値が0.01であるため、列毎の6組の差分値の合計は0.01である。この場合には、両者は似ていると判定される。なお、質問の特徴205に格納されている各特徴量のうちに、似ていると判定される特徴量が複数存在する場合には、列毎の6組の差分値の合計値が最も小さい組合せに対応する回答202及び回答動画の位置204が抽出される。このように、回答決定部130は、質問者U1の質問文に関する特徴量と質問の特徴205に格納されている特徴量との一致度(又は類似度)に基づいて、今回の質問に対する回答を決定する。 Further, for example, the difference values between the six sets of feature amounts of the question of questioner U1 and the corresponding values of the question feature 205 are sequentially calculated for each column, and the sum of the six sets of difference values for each column is calculated. If the total value of the six sets of difference values for each column is within a predetermined value, for example, within 0.2, it may be determined that they are similar. For example, in the above-described example, the question feature amount "0.6 0 0.7 0 0 0.39" of the questioner U1 and the question feature 205 "0.6 0 0.7 0 0 0.4" , the sum of the difference values in the first five columns is zero because each value in the first five columns is the same. Also, since the difference value of the values in the last six columns is 0.01, the sum of the six sets of difference values for each column is 0.01. In this case, both are determined to be similar. Note that if there are a plurality of feature amounts determined to be similar among the feature amounts stored in the question feature 205, the combination with the smallest total value of the six sets of difference values for each column The answer 202 corresponding to , and the position 204 of the answer moving image are extracted. In this way, the answer determination unit 130 determines an answer to the current question based on the degree of matching (or similarity) between the feature amount related to the question sentence of the questioner U1 and the feature amount stored in the feature 205 of the question. decide.

次に、回答決定部130は、抽出された回答202「おむすびが好きです。」と、回答動画の位置204「01:19:01-01:19:06」とを回答応答部140に出力する。なお、回答応答部140から出力方法については、上述した出力方法と同様である。 Next, the answer determining unit 130 outputs the extracted answer 202 “I like rice balls” and the answer moving image position 204 “01:19:01-01:19:06” to the answer responding unit 140. . The output method from the answer response unit 140 is the same as the output method described above.

[話の文脈を考慮した会話例]
ここで、質問者U1からの質問「好きな食べ物はありますか?」に対する回答「おむすびが好きです。」が出力されている間、又は、その出力直後に、質問者U1から新たな質問が発されることも想定される。例えば、回答応答部140が回答「おむすびが好きです。」を出力している間に、質問者U1が質問「なんでですか?」を発する場合を想定する。この場合に、回答決定部130は、質問「なんでですか?」から抽出された特徴量と同一又は数値が近い特徴量が質問の特徴205に存在しないものとする。
[Conversation example considering context]
Here, while the answer "I like rice balls." to the question "Do you have a favorite food?" It is also assumed that For example, it is assumed that the questioner U1 asks the question "Why?" while the answer response unit 140 is outputting the answer "I like rice balls." In this case, the answer determination unit 130 assumes that there is no feature quantity in the feature 205 of the question that is the same as or close in value to the feature quantity extracted from the question “Why?”.

このように、回答決定部130は、質問「なんでですか?」から特徴量と同一又は数値が近い特徴量が、質問の特徴205に存在しない場合には、上述した例と同様に、その質問「なんでですか?」よりも前に出力された回答を用いて新たな質問を生成する。具体的には、回答決定部130は、直前に出力された回答「おむすびが好きです。」と、今回の質問「なんでですか?」とを合成して、「おむすびが好きです。なんでですか?」を新たな質問として生成する。 In this way, if there is no feature quantity that is the same as or numerically close to the feature quantity from the question "Why?" A new question is generated using the answers output before "Why?". Specifically, the answer determining unit 130 synthesizes the immediately preceding answer “I like rice balls” with the current question “Why?” ?” is generated as a new question.

図8は、新たな質問から特徴量を抽出する抽出処理の一例を模式的に示す図である。図8(A)に示すように、新たな質問「おむすびが好きです。なんでですか?」を構成する各文「おむすびが好きです。」「なんでですか?」の各特徴量について、各列の数値を加算して新たな質問「おむすびが好きです。なんでですか?」の特徴量を抽出する。図8(B)には、各列の数値を加算した加算結果を示す。 FIG. 8 is a diagram schematically showing an example of extraction processing for extracting feature amounts from new questions. As shown in FIG. 8A, for each feature value of each sentence "I like rice balls." are added to extract the feature quantity of a new question “I like rice balls. Why?”. FIG. 8B shows the result of adding the numerical values in each column.

具体的には、点線の矩形171で示すように、特徴量の「食」に関する数値「0.8」と数値「0」とを加算して数値「0.8」を算出する。また、点線の矩形172で示すように、特徴量の「感情」に関する数値「0.7」と数値「0」とを加算して数値「0.7」を算出する。また、点線の矩形173で示すように、特徴量の「疑問」に関する数値「0」と数値「0.29」とを加算して数値「0.29」を算出する。なお、これら以外の各列については、特徴量に関する数値が「0」であるため、各列の加算値としてそれぞれ数値「0」が算出される。なお、各列の数値のうち、加算値が1を超える列が出ることも想定される。このように、加算値が1を超えた列については、その列の加算値を1に変換して用いるようにする。なお、特徴抽出器131を用いて新たな質問から特徴量を抽出してもよい。 Specifically, as indicated by a dotted-line rectangle 171, the numerical value “0.8” is calculated by adding the numerical value “0.8” and the numerical value “0” relating to the feature amount “food”. Further, as indicated by a dotted-line rectangle 172, the numerical value “0.7” is calculated by adding the numerical value “0.7” and the numerical value “0” regarding the “emotion” of the feature quantity. Further, as indicated by a dotted-line rectangle 173, the numerical value “0.29” is calculated by adding the numerical value “0” and the numerical value “0.29” relating to the feature amount “questionable”. For each column other than these, since the numerical value related to the feature amount is "0", the numerical value "0" is calculated as the added value for each column. Note that it is assumed that there may be columns in which the added value exceeds 1 among the numerical values in each column. In this way, for a column whose added value exceeds 1, the added value of that column is converted to 1 and used. Note that the feature extractor 131 may be used to extract feature amounts from new questions.

次に、回答決定部130は、各列の数値が加算された特徴量「0.8 0 0.7 0 0 0.29」と同一又は数値が近い特徴量を、質問の特徴205から探し出す。図7に示す例では、点線の矩形214で示すように、各列の数値が加算された特徴量「0.8 0 0.7 0 0 0.29」と数値が近い特徴量「0.8 0 0.7 0 0 0.3」が、質問の特徴205に格納されている。このため、回答決定部130は、各列の数値が加算された特徴量「0.8 0 0.7 0 0 0.29」に対する回答として、回答202の「戦時中の物のない時代、配給のお米を少しずつ蓄えておいてお母さんが作ってくれたおむすびのことを思い出すからかなあ」と、回答動画の位置204「01:19:12-01:20:13」を抽出する。 Next, the answer determination unit 130 searches for a feature amount that is the same as or close to the feature amount “0.8 0 0.7 0 0 0.29” obtained by adding the numerical values in each column from the question feature 205 . In the example shown in FIG. 7, as indicated by a dotted-line rectangle 214, the feature amount "0.8 0 0.7 0 0 0.29" obtained by adding the numerical values in each column and the feature amount "0.8 0 0.7 0 0 0.3” is stored in the question features 205 . For this reason, the answer determination unit 130 determines the answer 202, "A wartime era without goods, rations Maybe it's because I'm saving rice little by little and it reminds me of the rice balls my mother made for me."

このように、合成して生成された新たな質問「おむすびが好きです。なんでですか?」を用いて、回答決定部130は、回答202「戦時中の物のない時代、配給のお米を少しずつ蓄えておいてお母さんが作ってくれたおむすびのことを思い出すからかなあ」と、回答動画の位置204「01:19:12-01:20:13」とを抽出することが可能となる。 Using the synthesized and generated new question "I like rice balls. Why?" Maybe it's because I remember the rice balls that my mother made by saving little by little." .

次に、回答決定部130は、抽出された回答202「戦時中の物のない時代、配給のお米を少しずつ蓄えておいてお母さんが作ってくれたおむすびのことを思い出すからかなあ」と、回答動画の位置204「01:19:12-01:19:13」とを回答応答部140に出力する。これにより、質問者U1からの質問「なんでですか?」に対する回答「戦時中の物のない時代、配給のお米を少しずつ蓄えておいてお母さんが作ってくれたおむすびのことを思い出すからかなあ」が再生される。 Next, the answer determination unit 130 selects the extracted answer 202, "Maybe because it reminds me of the rice balls that my mother made while saving little by little the rationd rice during the wartime when there weren't many things." , the position 204 of the answer moving image “01:19:12-01:19:13” is output to the answer response unit 140 . As a result, the answer to the question from questioner U1, "Why?" Naa" is played.

なお、前回の回答「おむすびが好きです。」と、今回の質問「なんでですか?」とを合成して生成された新たな質問「おむすびが好きです。なんでですか?」を用いて、上述した特徴量の抽出処理、回答の抽出処理を実行しても、回答が抽出されないことも想定される。このような場合には、前回の回答と、前々回の回答と、今回の質問「なんでですか?」とを合成して新たな質問を生成し、この新たな質問を用いて、上述した特徴量の抽出処理、回答の抽出処理を実行する。以降も同様に、回答が抽出されない場合には、さらに1つ前の回答を順次用いて、上述した特徴量の抽出処理、回答の抽出処理を実行する。ただし、上述したように、閾値TH1、新たな質問に対応する文の文字数等を用いて、合成対象として過去に遡る回答を制限してもよい。 In addition, using the new question “I like rice balls. Why?” generated by combining the previous answer “I like rice balls” and the question “Why?” It is conceivable that the answer may not be extracted even if the feature quantity extraction process and the answer extraction process are executed. In such a case, a new question is generated by synthesizing the previous answer, the answer before last, and the question "Why?" , and the answer extraction process. Likewise, if no answer is extracted, the previous answer is used in sequence to execute the above-described feature quantity extraction process and answer extraction process. However, as described above, the threshold TH1, the number of characters in the sentence corresponding to the new question, or the like may be used to limit the answers that go back to the past to be synthesized.

[特徴量の加算処理の変形例]
以上では、新たな質問を構成する各文の特徴量の各列を加算して、新たな質問の特徴量を算出する例を示した。ここで、時間軸において今回の質問を基準として今回の質問から遠い過去の回答は、今回の質問との関連性が低くなることも想定される。そこで、新たな質問の特徴量を算出する場合に、今回の質問から遠い過去の回答ほど影響度を小さくすることにより、直近の回答の特徴をより重視することが考えられる。そこで、以下では、今回の質問から遠い過去の回答ほど影響度を小さくして、新たな質問の特徴量を算出する例を示す。
[Modified example of feature amount addition processing]
An example of calculating the feature amount of the new question by adding each column of the feature amount of each sentence constituting the new question has been described above. Here, it is assumed that past answers far from the current question on the time axis will be less relevant to the current question than the current question. Therefore, when calculating the feature amount of a new question, it is conceivable to give greater importance to the features of the most recent answer by reducing the degree of influence of an answer in the past that is farther from the current question. Therefore, below, an example of calculating the feature amount of a new question by decreasing the degree of influence for answers in the past that are farther from the current question will be shown.

図9は、新たな質問から特徴量を抽出する抽出処理の一例を模式的に示す図である。図9では、前回の回答と、前々回の回答と、今回の質問とを合成して新たな質問を生成する場合の特徴量の抽出処理の一例を示す。 FIG. 9 is a diagram schematically showing an example of extraction processing for extracting feature amounts from new questions. FIG. 9 shows an example of feature amount extraction processing when a new question is generated by synthesizing the previous answer, the answer before last, and the current question.

図9(A)に示すように、新たな質問「車にのります。おむすびが好きです。なんでですか」を構成する各文「車にのります。」「おむすびが好きです。」「なんでですか?」の各特徴量を用いて特徴量を抽出する。なお、「車にのります。」は前々回の回答であり、「おむすびが好きです。」は前回の回答であり、「なんでですか?」は今回の質問であるものとする。この場合に、今回の質問から遠い過去の回答ほど影響度を小さくして新たな質問の特徴量を算出する。具体的には、図9(B)に示すように、前回の回答には係数0.9を乗算し、前々回の回答には係数0.8を乗算して、乗算後の各列の数値を加算して新たな質問「車にのります。おむすびが好きです。なんでですか」の特徴量を抽出する。なお、ここで示す係数は一例であり、他の数値を用いてもよい。 As shown in FIG. 9(A), each of the sentences "I'll ride in the car.", "I like rice balls.", "Why?" ?” is used to extract the feature quantity. It is assumed that "I will ride in a car" is the answer from the last time, "I like rice balls" is the answer from the previous time, and "Why?" is the question from this time. In this case, the feature amount of a new question is calculated by reducing the degree of influence of a past answer that is farther from the current question. Specifically, as shown in FIG. 9B, the previous answer is multiplied by a coefficient of 0.9, the answer before the previous one is multiplied by a coefficient of 0.8, and the numerical values in each column after multiplication are The addition is performed to extract the feature quantity of a new question "I ride in a car. I like rice balls. Why?". Note that the coefficients shown here are only examples, and other numerical values may be used.

具体的には、点線の矩形181で示すように、特徴量の「食」に関する前回の質問の数値「0.8」に係数0.9を乗算して数値「0.72」を算出する。また、特徴量の「食」に関する他の数値は「0」であるため、特徴量の「食」に関する数値「0.72」が算出される。また、点線の矩形182乃至185で示すように、他の特徴量についても同様に係数を用いて新たな質問の特徴量が算出される。図9(C)には、各列の数値を加算した加算結果を示す。 Specifically, as indicated by a dotted-line rectangle 181, the numerical value "0.72" is calculated by multiplying the numerical value "0.8" of the previous question regarding the feature amount "food" by a coefficient of 0.9. In addition, since the other numerical value related to the feature quantity “food” is “0”, the numerical value related to the feature quantity “food” is calculated as “0.72”. In addition, as indicated by dotted-line rectangles 182 to 185, the feature amount of the new question is calculated similarly using the coefficients for the other feature amounts. FIG. 9C shows the addition result of adding the numerical values in each column.

このように算出された新たな質問の特徴量については、『「おむすびが好き」+「なんで」+「車にのる」』ことを意味的に抱合するが、車に乗ることは若干小さく抱合することが可能となる。このように、新たな質問の特徴量を算出することにより、直近の回答を重視したより適切な質問を合成することが可能となる。図9に示す例では、「乗物に乗っているときには何を食べたいと思いますか」に対応した回答等を導き出せることが可能となる。 Regarding the features of the new questions calculated in this way, ``I like rice balls'' + ``Why'' + ``Get in a car'' It becomes possible to By calculating the feature amount of the new question in this way, it is possible to synthesize a more appropriate question that emphasizes the most recent answer. In the example shown in FIG. 9, it is possible to derive an answer or the like corresponding to "What do you want to eat while riding a vehicle?"

このように、回答決定部130は、第1回答(前回の回答)乃至第N回答(N回前の回答)(ただし、Nは2以上の整数)に関する各文に基づいて、当該各文に関する特徴量を算出する。そして、回答決定部130は、第1回答から第N回答に遡るのに応じて、当該各文に関する特徴量の影響度を低下させる。例えば、第1回答に関する特徴量を構成する各数値に係数0.9を乗算し、第2回答に関する特徴量を構成する各数値に係数0.8を乗算し、第3回答に関する特徴量を構成する各数値に係数0.7を乗算することにより、第1回答から第3回答に遡るのに応じて、当該各文に関する特徴量の影響度を低下させる。なお、第4回答以降の各文に関する特徴量を構成する各数値についても同様に所定の係数(0.7未満の値)を乗算することにより、当該各文に関する特徴量の影響度を低下させる。ただし、N回の閾値TH1が設定されている場合には、1回前の回答から閾値TH1回前の回答までの各回答を合成対象として用いる。 In this way, the answer determination unit 130, based on each sentence about the first answer (previous answer) to N-th answer (answer N times before) (where N is an integer of 2 or more), Calculate the feature amount. Then, the answer determination unit 130 reduces the degree of influence of the feature amount regarding each sentence in response to the first answer to the Nth answer. For example, each numerical value that constitutes the feature amount for the first answer is multiplied by a coefficient of 0.9, each numerical value that constitutes the feature amount for the second answer is multiplied by a coefficient of 0.8, and a feature amount for the third answer is constituted. By multiplying each numerical value by a coefficient of 0.7, the degree of influence of the feature amount related to each sentence is reduced from the first answer to the third answer. In addition, by similarly multiplying each numerical value constituting the feature amount for each sentence after the fourth answer by a predetermined coefficient (value less than 0.7), the degree of influence of the feature amount for each sentence is reduced. . However, when the threshold TH1 of N times is set, each answer from the answer one time before to the answer one time before the threshold TH1 is used as a composition target.

なお、この例では、第1回答乃至第N回答に関する特徴量のそれぞれに係数を乗算する例を示した。ここで、上述したように、各特徴量は、多数(例えば1000組程度)の数値の組合せからなるため、各特徴量のそれぞれに係数を乗算する場合には、その演算処理の負荷が高くなることが想定される。そこで、演算処理の負荷を軽減させるため、第1回答に関する特徴量には係数を乗算せずに回答を決定する試みをしてもよい。そして、第1回答に関する特徴量を用いても今回の質問に対する決定ができない場合に、第2回答以降の各特徴量には係数を乗算して回答を決定する試みをする。なお、演算処理の負荷をさらに軽減させるため、第1回答及び第2回答に関する各特徴量には係数を乗算せずに回答を決定する試みをしてもよい。そして、第1回答及び第2回答に関する各特徴量を用いても今回の質問に対する決定ができない場合に、第3回答以降の特徴量には係数を乗算して回答を決定する試みをしてもよい。このように、第1回答(又は第1回答及び第2回答)に関する特徴量を用いても今回の質問に対する決定ができない場合に、第2回答以降(又は第3回答以降)の各特徴量の影響度を低下させて回答を決定する試みをすることも可能である。これにより、現在の質問に対する回答を適切に決定することができるとともに、その回答の決定処理に係る演算処理の負荷を軽減することが可能となる。 Note that this example shows an example in which each of the feature amounts relating to the first to N-th answers is multiplied by a coefficient. Here, as described above, each feature amount consists of a large number (for example, about 1000 sets) of combinations of numerical values. Therefore, when each feature amount is multiplied by a coefficient, the computational load increases. is assumed. Therefore, in order to reduce the computational processing load, an attempt may be made to determine the answer without multiplying the feature amount related to the first answer by a coefficient. If the question cannot be determined using the feature amount related to the first answer, each feature amount after the second answer is multiplied by a coefficient to try to determine the answer. In order to further reduce the computational processing load, an attempt may be made to determine an answer without multiplying each feature amount relating to the first answer and the second answer by a coefficient. Then, if it is not possible to determine the current question using each feature amount related to the first and second answers, even if an attempt is made to determine the answer by multiplying the feature amount of the third and subsequent answers by a coefficient. good. In this way, if the feature amount related to the first answer (or the first and second answers) cannot be determined for this question, It is also possible to try to determine the answer with less impact. As a result, it is possible to appropriately determine the answer to the current question, and to reduce the computational processing load associated with the process of determining the answer.

[情報処理装置の動作例]
図10は、情報処理装置100における会話応答処理の一例を示すフローチャートである。また、この会話応答処理は、記憶部150に記憶されているプログラムに基づいて実行される。また、この会話応答処理は、制御周期毎に常時実行される。また、この会話応答処理では、図1乃至図9を適宜参照して説明する。
[Example of operation of information processing device]
FIG. 10 is a flowchart showing an example of conversation response processing in the information processing apparatus 100. As shown in FIG. Also, this conversation response processing is executed based on a program stored in the storage unit 150 . Also, this conversation response processing is always executed in each control cycle. Also, this conversation response processing will be described with reference to FIGS. 1 to 9 as appropriate.

ステップS501において、音声認識部120は、質問者U1から質問が発せられたか否かを判定する。質問者U1から質問が発せられた場合には、入力部110は、質問者U1から発せられた質問の音声を音声認識部120に出力し、ステップS502に進む。一方、質問者U1から質問が発せられていない場合には、継続して監視が行われる。 In step S501, the speech recognition unit 120 determines whether or not the questioner U1 has posed a question. When questioner U1 has posed a question, input unit 110 outputs the voice of the question uttered by questioner U1 to voice recognition unit 120, and proceeds to step S502. On the other hand, when the questioner U1 has not issued a question, monitoring is continued.

ステップS502において、音声認識部120は、入力部110から出力された質問の音声をテキストデータに変換する。 In step S502, the voice recognition unit 120 converts the voice of the question output from the input unit 110 into text data.

ステップS503において、回答決定部130は、音声認識部120から出力されたテキストデータに基づいて質問者U1の質問の文の特徴を抽出し、その特徴に基づいて質問者U1の質問に対する回答を決定する。上述したように、回答決定部130は、質問の文の特徴として単語を用いる場合には、質問者U1の質問の文に含まれる単語を特徴として抽出する。この場合には、質問者U1の質問の文から抽出された特徴(1又は複数の単語)を用いて、質問者U1の質問に対する回答を質問回答データDB200(図4参照)から抽出し、この抽出された回答を質問者U1の質問に対する回答として決定する。また、回答決定部130は、質問の文の特徴として数値化された特徴量を用いる場合には、質問者U1の質問の文から特徴量(図6参照)を抽出する。この場合には、質問者U1の質問の文から抽出された特徴量を用いて、質問者U1の質問に対する回答を質問回答データDB200(図7参照)から抽出し、この抽出された回答を質問者U1の質問に対する回答として決定する。なお、ステップS506で新たな質問が生成された場合には、回答決定部130は、その新たな質問を用いて、質問者U1の今回の質問に対する回答の決定を試みる。すなわち、回答決定部130は、その新たな質問に対する回答の抽出を試みて、その新たな質問に対する回答が抽出された場合には、その抽出された回答を質問者U1の今回の質問に対する回答として決定する。 In step S503, the answer determination unit 130 extracts the features of the question sentence of the questioner U1 based on the text data output from the speech recognition unit 120, and determines the answer to the question of the questioner U1 based on the features. do. As described above, when using a word as a feature of the question sentence, the answer determination unit 130 extracts the word included in the question sentence of the questioner U1 as a feature. In this case, using the feature (one or more words) extracted from the question sentence of the questioner U1, the answer to the question of the questioner U1 is extracted from the question answer data DB 200 (see FIG. 4), and this The extracted answer is determined as an answer to questioner U1's question. Further, when using a numerical feature amount as the feature of the question sentence, the answer determination unit 130 extracts the feature amount (see FIG. 6) from the question sentence of the questioner U1. In this case, using the feature amount extracted from the question sentence of the questioner U1, the answer to the question of the questioner U1 is extracted from the question answer data DB 200 (see FIG. 7), and the extracted answer is used as the question determined as an answer to the question of person U1. Note that when a new question is generated in step S506, the answer determination unit 130 attempts to determine an answer to questioner U1's current question using the new question. That is, the answer determination unit 130 tries to extract an answer to the new question, and if an answer to the new question is extracted, the extracted answer is used as an answer to the questioner U1's current question. decide.

ステップS504において、回答決定部130は、質問者U1の今回の質問に対する回答が質問回答データDB200から抽出できたか否かを判定する。今回の質問に対する回答が質問回答データDB200から抽出できた場合には、ステップS505に進む。一方、今回の質問に対する回答が質問回答データDB200から抽出できなかった場合には、ステップS506に進む。 In step S<b>504 , the answer determination unit 130 determines whether or not the answer to the current question of the questioner U<b>1 has been extracted from the question/answer data DB 200 . If the answer to the current question can be extracted from the question/answer data DB 200, the process proceeds to step S505. On the other hand, if the answer to the current question could not be extracted from the question/answer data DB 200, the process proceeds to step S506.

ステップS505において、回答応答部140は、ステップS503で抽出された今回の質問に対する回答に対応する動画部分を再生する再生処理を実行する。 In step S505, the answer response unit 140 executes a reproduction process of reproducing the moving image portion corresponding to the answer to the current question extracted in step S503.

ステップS506において、回答決定部130は、今回の質問と前回の質問に対する回答とを合成して新たな質問を生成する。なお、この新たな質問に基づいて、今回の質問に対する回答が質問回答データDB200から抽出できなかった場合には、ステップS506の処理を繰り返すことになる。この場合には、今回の質問に対する回答が質問回答データDB200から抽出できるまで、1回前の回答からN回(ただし、Nは2以上の整数)前の回答までの各回答を順次合成して新たな質問を生成する。ただし、閾値TH1前の回答までの各回答を順次合成して新たな質問を生成しても、今回の質問に対する回答が質問回答データDB200から抽出できなかった場合には、質問者に対して異なる表現での新たな質問を促すようにしてもよい。 In step S506, answer determination unit 130 synthesizes the current question and the answer to the previous question to generate a new question. Based on this new question, if the answer to the current question cannot be extracted from the question/answer data DB 200, the process of step S506 is repeated. In this case, until the answer to the current question can be extracted from the question/answer data DB 200, each answer from the previous answer to the previous answer N times (where N is an integer of 2 or more) is sequentially synthesized. Generate new questions. However, even if a new question is generated by sequentially synthesizing each answer up to the answer before the threshold value TH1, if the answer to the current question cannot be extracted from the question answer data DB 200, the questioner will receive a different answer. You may make it prompt the new question by expression.

[情報処理システムの構成例]
以上では、音声認識処理、回答決定処理、回答応答処理等を情報処理装置100において実行する例を示したが、それらの各処理の全部または一部を他の機器において実行してもよい。この場合には、それらの各処理の一部を実行する各機器により情報処理システムが構成される。例えば、サーバ、質問者U1が使用可能な機器(例えば、スマートフォン、タブレット端末、パーソナルコンピュータ)、インターネット等の所定のネットワークを介して接続可能なサーバ等の各種情報処理装置、各種電子機器を用いて各処理の少なくとも一部を実行させることができる。これらの例を図11、図12に示す。
[Configuration example of information processing system]
In the above, an example in which voice recognition processing, answer determination processing, answer response processing, and the like are executed in the information processing apparatus 100 has been shown, but all or part of each of these processes may be executed in another device. In this case, an information processing system is configured by each device that executes part of each of these processes. For example, using a server, a device that can be used by the questioner U1 (for example, a smartphone, a tablet terminal, a personal computer), various information processing devices such as a server that can be connected via a predetermined network such as the Internet, and various electronic devices At least part of each process can be executed. Examples of these are shown in FIGS.

また、情報処理装置100の機能を実行可能な情報処理システムの一部(または全部)については、インターネット等の所定のネットワークを介して提供可能なアプリケーションにより提供されてもよい。このアプリケーションは、例えばSaaS(Software as a Service)である。 A part (or all) of the information processing system capable of executing the functions of the information processing apparatus 100 may be provided by an application that can be provided via a predetermined network such as the Internet. This application is, for example, SaaS (Software as a Service).

図11は、情報処理システム600の機能構成例を示すブロック図である。 FIG. 11 is a block diagram showing a functional configuration example of the information processing system 600. As shown in FIG.

情報処理システム600は、情報処理装置610、入力装置620、出力装置630、記憶装置640等により構成される。なお、入力装置620は、図2に示す入力部110に対応し、出力装置630は、図2に示す回答応答部140に対応し、記憶装置640は、図2に示す記憶部150に対応する。情報処理装置610における音声認識部120、回答決定部130は、図2に示す音声認識部120、回答決定部130に対応するため、これらと同一の符号を付して示す。ただし、図11で示す回答決定部130は、決定された回答に関する回答情報に基づいて、動画DB300から動画部分を抽出し、その動画部分を出力装置630に出力する再生処理を実行する。なお、この例では、1つの入力装置620、1つの出力装置630、1つの記憶装置640を情報処理装置610に接続する例を示すが、これらの機器として複数の機器を情報処理装置610に接続して用いてもよい。この場合に、複数の記憶装置640には、異なる回答動画を格納して用いてもよい。 The information processing system 600 includes an information processing device 610, an input device 620, an output device 630, a storage device 640, and the like. Note that the input device 620 corresponds to the input unit 110 shown in FIG. 2, the output device 630 corresponds to the answer response unit 140 shown in FIG. 2, and the storage device 640 corresponds to the storage unit 150 shown in FIG. . The speech recognition unit 120 and the answer determination unit 130 in the information processing device 610 correspond to the speech recognition unit 120 and the answer determination unit 130 shown in FIG. However, the answer determination unit 130 shown in FIG. 11 extracts the moving image part from the moving image DB 300 based on the answer information regarding the determined answer, and executes the reproduction process of outputting the moving image part to the output device 630 . In this example, one input device 620, one output device 630, and one storage device 640 are connected to the information processing device 610. However, a plurality of devices may be connected to the information processing device 610 as these devices. may be used as In this case, a plurality of storage devices 640 may store and use different answer animations.

図12は、情報処理システム700の機能構成例を示すブロック図である。 FIG. 12 is a block diagram showing a functional configuration example of the information processing system 700. As shown in FIG.

情報処理システム700は、ネットワーク701、情報処理装置710、電子機器720、730等により構成される。例えば、情報処理装置710、電子機器720、730等がネットワーク701を介して接続される。なお、これらの各器機間の通信については、有線通信を利用した通信又は無線通信を利用した通信が行われる。また、これらの各器機間の通信については、ネットワーク701を経由した通信以外に機器間で直接通信するようにしてもよい。 The information processing system 700 includes a network 701, an information processing device 710, electronic devices 720 and 730, and the like. For example, an information processing device 710 and electronic devices 720 and 730 are connected via a network 701 . It should be noted that communication using wired communication or communication using wireless communication is performed between these devices. Further, as for communication between these devices, direct communication may be performed between the devices other than communication via the network 701 .

ネットワーク701は、公衆回線網、インターネット等のネットワークである。また、情報処理システム700を構成する各機器は、無線通信を利用した通信方式又は有線通信を利用した通信方式の何れかの方式、又は双方の方式によってネットワーク701に接続される。 A network 701 is a network such as a public line network or the Internet. Further, each device constituting the information processing system 700 is connected to the network 701 by either a communication method using wireless communication or a communication method using wired communication, or both methods.

情報処理装置710は、図2に示す情報処理装置100に対応する。また、情報処理装置100における各部は、図2に示す同一名所の各部に対応する。情報処理装置710は、例えば、各種情報を提供可能なサーバとすることが可能である。 The information processing device 710 corresponds to the information processing device 100 shown in FIG. Each unit in the information processing apparatus 100 corresponds to each unit of the same sight shown in FIG. The information processing device 710 can be, for example, a server capable of providing various types of information.

通信部711は、有線通信又は無線通信の少なくとも1つを利用して、他の機器との間で各種情報のやりとりを行うものである。例えば、通信部711は、電子機器720、730からの質問に関する質問情報を受信する受信処理、その質問に対する回答に関する回答情報を電子機器720、730に送信する送信処理等を実行する。 The communication unit 711 uses at least one of wired communication and wireless communication to exchange various types of information with other devices. For example, the communication unit 711 executes reception processing for receiving question information regarding questions from the electronic devices 720 and 730, transmission processing for transmitting answer information regarding answers to the questions to the electronic devices 720 and 730, and the like.

電子機器720、730は、質問者U1、U3が所持する固定型又は携帯型の情報処理装置であり、例えばスマートフォン、タブレット端末、スマートウォッチ、パーソナルコンピュータ等の情報処理装置である。また、電子機器720、730は、情報処理装置710との間で有線通信又は無線通信が可能な機器とする。また、電子機器720、730は、情報処理装置710への質問に関する質問情報を送信する送信処理、その質問に対する回答に関する回答情報を情報処理装置710から受信する受信処理等を実行する。また、例えば、電子機器720、730は、その回答情報に基づいて、質問に対する回答を表示部721、731に表示したり、その回答を音声出力したりすることが可能である。 Electronic devices 720 and 730 are fixed or portable information processing devices possessed by interrogators U1 and U3, such as smart phones, tablet terminals, smart watches, and personal computers. Also, the electronic devices 720 and 730 are devices capable of wired communication or wireless communication with the information processing apparatus 710 . Further, the electronic devices 720 and 730 execute transmission processing for transmitting question information regarding questions to the information processing device 710, reception processing for receiving answer information regarding answers to the questions from the information processing device 710, and the like. Further, for example, the electronic devices 720 and 730 can display the answers to the questions on the display units 721 and 731 and output the answers by voice based on the answer information.

例えば、質問者U1は、電子機器720を用いて回答者U2に質問をして、回答者U2からの回答を電子機器720を用いて見たり聞いたりすることが可能である。また、例えば、質問者U3は、電子機器730を用いて回答者U2に質問をして、回答者U2からの回答を電子機器730を用いて見たり聞いたりすることが可能である。 For example, questioner U1 can use electronic device 720 to ask respondent U2 a question, and use electronic device 720 to view and hear answers from respondent U2. Further, for example, the questioner U3 can use the electronic device 730 to ask the respondent U2 a question, and use the electronic device 730 to view and listen to the reply from the respondent U2.

なお、本実施形態では、質問方法としては、質問者U1が質問を音声で発する例を示したが、これに限定されない。例えば、質問者U1が質問をテキスト情報で入力してもよく、映像で入力してもよい。また、他の機器からの電文を、質問者U1からの質問として入力してもよい。 In addition, in this embodiment, as a questioning method, an example in which the questioner U1 asks a question by voice is shown, but the questioning method is not limited to this. For example, the questioner U1 may input the question as text information or as an image. Also, a telegram from another device may be input as a question from the questioner U1.

また、本実施形態では、情報処理装置100からの応答方法として、動画310の回答部分を再生することにより、画像表示及び音声出力で出力する例を示したが、これに限定されない。例えば、動画310の回答部分を再生する場合に、画像表示とともに、音声に対応する文字を表示して出力してもよく、画像表示を省略して音声出力のみとしてもよい。また、例えば、質問者U1に対する回答をテキスト情報で出力(例えば、文字表示、音声出力)してもよい。また、質問者U1に対する回答を他の機器に電文として出力し、その機器において質問者U1に対する回答を出力させてもよい。 In addition, in the present embodiment, as a method of responding from the information processing apparatus 100, by reproducing the answer part of the moving image 310, an example of displaying an image and outputting an audio is shown, but the method is not limited to this. For example, when reproducing the answer part of the moving image 310, the characters corresponding to the voice may be displayed and output together with the image display, or the image display may be omitted and only the voice output may be performed. Further, for example, the answer to questioner U1 may be output as text information (for example, character display, voice output). Alternatively, the answer to the questioner U1 may be output as a telegram to another device, and the device may output the answer to the questioner U1.

また、本実施形態では、情報処理装置100、710等に1つの動画310を格納しておき、動画310の回答部分を再生する例を示したが、これに限定されない。例えば、情報処理装置100、710等に複数の回答動画を格納しておき、質問者からの要求に応じて質問者が所望する回答動画を用いて、質問者からの質問に回答してもよい。また、本実施形態では、質問の特徴として、質問文の単語、特徴量を用いる例を示したが、これに限定されない。質問文から抽出可能な他の特徴を用いてもよい。 Further, in the present embodiment, an example in which one moving image 310 is stored in the information processing apparatus 100, 710, etc., and the answer portion of the moving image 310 is played back has been described, but the present invention is not limited to this. For example, a plurality of answer videos may be stored in the information processing device 100, 710, etc., and the question from the questioner may be answered using the answer video desired by the questioner in response to a request from the questioner. . In addition, in the present embodiment, an example in which words and feature amounts of the question sentence are used as the feature of the question is shown, but the present invention is not limited to this. Other features that can be extracted from the question may be used.

[本実施形態の効果]
このように、本実施形態によれば、質問者U1からの質問と、情報処理装置100からの回答との会話の連続性に着目して、話の文脈を考慮した会話を実現することができる。具体的には、質問者U1からの質問のテキストと、予め用意した質問回答データDB200の質問とに基づいて、質問者U1からの質問の特徴と似ているものを探し出し、該当する回答部分の動画を再生する。また、回答再生中に入力部110からの入力を受付けることにより、回答途中でも質問者U1は質問をすることができる。これらにより、質問者U1は回答をさえぎって質問するような自然な会話をすることができる。すなわち、会話の文脈を考慮し、それまでの会話内容も考慮した応答ができる質問回答システムを実現することができる。
[Effect of this embodiment]
Thus, according to the present embodiment, focusing on the continuity of the conversation between the question from the questioner U1 and the answer from the information processing device 100, it is possible to realize a conversation that takes into consideration the context of the conversation. . Specifically, based on the text of the question from the questioner U1 and the question in the question answer data DB 200 prepared in advance, a similar feature to the question from the questioner U1 is searched, and the corresponding answer part is searched. Play video. Further, by accepting an input from the input unit 110 during answer reproduction, the questioner U1 can ask a question even during answering. As a result, the questioner U1 can have a natural conversation by interrupting an answer and asking a question. That is, it is possible to realize a question-answering system that considers the context of the conversation and can respond in consideration of the contents of the conversation up to that point.

また、本実施形態では、質問者U1からの質問に対して、予め用意された回答者U2の回答動画から、質問の特徴を用いて回答を探し出し、その回答に対応する部分を再生する会話応答システムを実現することができる。 In addition, in this embodiment, in response to a question from questioner U1, an answer is searched for from an answer video prepared in advance by answerer U2 using the characteristics of the question, and a part corresponding to the answer is reproduced. system can be realized.

また、本実施形態では、今回の質問に関する特徴に基づいて今回の質問に対する回答が抽出できない場合には、前回の質問に対する回答に関する特徴と、今回の質問に関する特徴とを抽出し、これらの特徴を用いて質問に対する回答を抽出することができる。また、この特徴に基づいて今回の質問に対する回答が抽出できない場合には、さらに、今回の質問の1回前からN(ただし、Nは2以上の整数)回前までの各質問に対する回答に対応する各文に関する特徴と、今回の質問に関する特徴とを抽出し、これらの特徴を用いて質問に対する回答を抽出することができる。これにより、例えば「なんでですか?」等の追加質問が質問者U1から発せられたような場合でも、その追加質問の内容から適切な回答を抽出することが可能となる。例えば、回答再生中も入力部110の入力を受付けることにより回答途中でも質問者U1は質問することができる。この場合に、回答をさえぎって質問するような場合でも、その質問に対する適切な回答を出力することができるため、自然な会話を実現することができる。言い換えると、会話内容の前後関係を考慮した自然な応答ができる。 Further, in the present embodiment, when the answer to the current question cannot be extracted based on the features of the current question, the features of the answer to the previous question and the features of the current question are extracted, and these features are can be used to extract answers to questions. In addition, if the answer to the current question cannot be extracted based on this feature, respond to the answers to each question from 1 time before the current question to N times (where N is an integer of 2 or more) before the current question. It is possible to extract the features related to each sentence and the features related to the current question, and use these features to extract the answer to the question. As a result, even when the questioner U1 issues an additional question such as "Why?", it is possible to extract an appropriate answer from the content of the additional question. For example, by accepting input from the input unit 110 even during answer reproduction, the questioner U1 can ask a question even in the middle of answering. In this case, even if the question is interrupted by the answer, an appropriate answer to the question can be output, so natural conversation can be realized. In other words, it is possible to give a natural response considering the context of the content of the conversation.

また、従来の質問回答システムでは、回答に対する追加質問をすると、正常に回答ができないおそれがあった。すなわち、従来の質問回答システムでは、1問1答での応答しかできないおそれがあった。これに対して、本実施形態では、回答に対する追加質問をした場合でも、適切に返答できるようになる。すなわち、それまでの回答に対するさらなる質問に答えることが可能となる。 Moreover, in the conventional question answering system, if additional questions were asked to the answers, there was a possibility that the answers would not be able to be given normally. In other words, the conventional question-answering system may only be able to respond with one question and one answer. On the other hand, in this embodiment, even if an additional question is asked in response to the answer, the answer can be appropriately answered. That is, it becomes possible to answer further questions in response to the previous answers.

また、従来の質問回答システムでは、膨大な質問回答データから学習された学習データを用いて回答を生成している。これに対して、本実施形態では、前回よりも前の回答に関する特徴を用いて今回の質問に対する回答を抽出することが可能であるため、少ない質問回答データから学習された学習データを用いて回答を生成できるようになる。すなわち、本実施形態では、少ないデータ量でも適切な回答を実現できる。 In addition, conventional question-answering systems generate answers using learning data learned from a huge amount of question-answer data. On the other hand, in the present embodiment, it is possible to extract the answer to the current question by using the features related to the answer before the previous one. will be able to generate That is, in this embodiment, an appropriate answer can be realized even with a small amount of data.

[本実施形態の構成例及びその効果]
情報処理装置100は、質問の特徴及び回答に関する情報が格納されている質問回答データDB200(データベースの一例)を用いて一連の質問に対して回答を順次提供する情報処理装置である。情報処理装置100は、一連の質問のうち今回の質問に対応する第1文に基づいて第1文に関する特徴を抽出し、当該特徴と質問回答データDB200とに基づいて今回の質問に対する回答を決定する回答決定部130(決定部の一例)を備える。回答決定部130は、第1文に関する特徴に基づいて今回の質問に対する回答が決定できない場合には、今回の質問よりも前の過去の質問に対する回答に対応する第2文と第1文とに基づいて当該第1文及び当該第2文に関する各特徴を抽出し、これらの各特徴と質問回答データDB200とに基づいて今回の質問に対する回答を決定する。
[Configuration example of the present embodiment and its effect]
The information processing apparatus 100 is an information processing apparatus that sequentially provides answers to a series of questions using a question-and-answer data DB 200 (an example of a database) that stores information about features of questions and answers. The information processing apparatus 100 extracts features related to the first sentence of the series of questions based on the first sentence corresponding to the current question, and determines an answer to the current question based on the features and the question and answer data DB 200. An answer determination unit 130 (an example of a determination unit) is provided. If the answer to the current question cannot be determined based on the characteristics of the first sentence, the answer determination unit 130 determines the second sentence and the first sentence corresponding to the answers to the past questions before the current question. Based on this, each feature regarding the first sentence and the second sentence is extracted, and the answer to the current question is determined based on each feature and the question answer data DB 200 .

この構成によれば、今回の質問に関する特徴を用いてこれに対する回答が決定できない場合でも、前の過去の質問に対する回答に関する特徴(第2文に関する特徴)を用いて、今回の質問に対する回答を決定することができる。これにより、例えば「なんでですか?」等の追加質問が質問者U1から発せられたような場合でも、その追加質問の内容から適切な回答を質問者U1に提供することが可能となる。すなわち、質問者U1の質問に対して適切な回答を提供することができる。 According to this configuration, even if the answer to this question cannot be determined using the features related to the current question, the answer to the current question is determined using the features related to the answers to the previous past question (features related to the second sentence). can do. As a result, even when an additional question such as "Why?" is issued by the questioner U1, an appropriate answer can be provided to the questioner U1 based on the content of the additional question. That is, it is possible to provide an appropriate answer to the question of questioner U1.

回答決定部130は、第1文(今回の質問に関する文)に関する特徴に基づいて今回の質問に対する回答が決定できない場合には、今回の質問の1回前の質問に対する回答(第1回答)に関する第2文と、その第1文とに基づいて当該第1文及び当該第2文に関する各特徴を抽出し、これらの各特徴と質問回答データDB200とに基づいて今回の質問に対する回答の決定を試みる。 If the answer to the current question cannot be determined based on the characteristics of the first sentence (the sentence about the current question), the answer determination unit 130 determines the answer (the first answer) to the question one time before the current question. Extract the second sentence and features related to the first sentence and the second sentence based on the first sentence, and determine the answer to the current question based on these features and the question answer data DB 200 try.

この構成によれば、今回の質問に関する特徴を用いてこれに対する回答が決定できない場合でも、今回の質問の1回前の質問に対する回答(第1回答)に関する特徴(第2文に関する特徴)を用いて、今回の質問に対する回答を決定することができる。 According to this configuration, even if the answer to this question cannot be determined using the features related to the current question, the features related to the answer (first answer) to the question one time before the current question (features related to the second sentence) are used. can determine the answer to this question.

回答決定部130は、今回の質問の1回前からN-1(ただし、Nは3以上の整数)回前までの各質問に対する回答である第1回答乃至第N-1回答に対応する各文と第1文(今回の質問に関する文)とを用いても今回の質問に対する回答が決定できない場合には、今回の質問の1回前からN回前までの各質問に対する回答(第1回答乃至第N回答)に対応する各文と、その第1文とに基づいて当該各文及び当該第1文に関する各特徴を抽出し、これらの各特徴と質問回答データDB200とに基づいて今回の質問に対する回答の決定を試みる。 The answer determination unit 130 is the answer to each question from 1 time before the current question to N-1 (where N is an integer of 3 or more) times before. If the answer to this question cannot be determined using the sentence and the first sentence (sentence related to this question), the answers to each question from 1 to N times before this question (first answer to N-th answers) and based on the first sentence, extract each feature related to each sentence and the first sentence, and based on these features and the question and answer data DB 200, this time Attempt to determine the answer to the question.

この構成によれば、今回の質問に関する特徴を用いてこれに対する回答が決定できない場合でも、今回の質問の1回前からN回前までの各質問に対する回答に関する各特徴を用いて、今回の質問に対する回答を決定することができる。 According to this configuration, even if the answer to this question cannot be determined using the features related to the current question, using each feature related to the answers to each question from 1 to N times before the current question can determine the answer to

回答決定部130は、第1回答乃至第N回答に対応する各文に基づいて当該各文に関する特徴量を算出し、第1回答から第N回答に遡るのに応じて、当該各文に関する特徴量の影響度を低下させ、当該影響度を低下させた特徴量と質問回答データDB200とに基づいて今回の質問に対する回答の決定を試みる。 The answer determination unit 130 calculates the feature amount for each sentence based on each sentence corresponding to the first to Nth answers, and calculates the feature amount for each sentence as it goes back from the first answer to the Nth answer. The degree of influence of the quantity is reduced, and an attempt is made to determine the answer to the current question based on the feature quantity with the degree of influence reduced and the question-answer data DB 200 .

この構成によれば、第1回答から第N回答に遡るのに応じて影響度を低下させた特徴量を用いて、今回の質問に対する回答を決定することができる。なお、演算処理の負荷を軽減させるため、第1回答(又は第1回答及び第2回答)に関する特徴量には係数を乗算せずに回答を決定する試みをしてもよい。この場合には、第1回答(又は第1回答及び第2回答)に関する特徴量を用いても今回の質問に対する決定ができない場合に、第2回答以降(又は第3回答以降)の各特徴量には係数を乗算して回答を決定する試みをする。これにより、現在の質問に対する回答を適切に決定することができるとともに、その回答の決定処理に係る演算処理の負荷を軽減することが可能となる。 According to this configuration, it is possible to determine the answer to the current question by using the feature amount whose influence degree is lowered according to going back from the first answer to the Nth answer. In order to reduce the computational processing load, an attempt may be made to determine the answer without multiplying the feature amount relating to the first answer (or the first answer and the second answer) by a coefficient. In this case, if the feature amount related to the first answer (or the first answer and the second answer) cannot be determined for this question, each feature amount after the second answer (or after the third answer) is multiplied by a factor to attempt to determine the answer. As a result, it is possible to appropriately determine the answer to the current question, and to reduce the computational processing load associated with the process of determining the answer.

質問回答データDB200は、質問に含まれる1又は複数の単語と、その質問に対する回答に関する回答情報とが関連付けて格納されるデータベースである。回答決定部130は、第1文に含まれる1又は複数の単語を第1文に関する特徴として抽出し、その1又は複数の単語と質問回答データDB200に格納されている単語との一致度に基づいて、今回の質問に対する回答を決定する。 The question-and-answer data DB 200 is a database in which one or more words included in a question and answer information relating to the answer to the question are stored in association with each other. The answer determination unit 130 extracts one or more words included in the first sentence as features related to the first sentence, and based on the degree of matching between the one or more words and the words stored in the question and answer data DB 200 to determine the answer to this question.

この構成によれば、今回の質問の文(第1文)に含まれる1又は複数の単語を特徴として用いて、今回の質問に対する回答を決定することができる。 According to this configuration, one or more words included in the sentence (first sentence) of the current question can be used as features to determine the answer to the current question.

質問回答データDB200は、質問に関する特徴量と、その質問に対する回答に関する回答情報とが関連付けて格納されるデータベースである。回答決定部130は、第1文に関する特徴量を第1文に関する特徴として抽出し、その特徴量と質問回答データDB200に格納されている特徴量との一致度に基づいて、今回の質問に対する回答を決定する。 The question-and-answer data DB 200 is a database in which feature values relating to questions and answer information relating to answers to the questions are stored in association with each other. The answer determination unit 130 extracts the feature amount related to the first sentence as the feature amount related to the first sentence, and based on the degree of matching between the feature amount and the feature amount stored in the question/answer data DB 200, determines the answer to the current question. to decide.

この構成によれば、今回の質問の文(第1文)に関する特徴量を用いて、今回の質問に対する回答を決定することができる。 According to this configuration, it is possible to determine the answer to the current question using the feature amount related to the sentence (first sentence) of the current question.

情報処理装置100は、一連の質問に対する回答者U2からの回答が記録されている回答動画のうちから、回答決定部130により決定された回答に対応する部分を再生して出力させる回答応答部140をさらに備える。 The information processing apparatus 100 includes an answer response unit 140 that reproduces and outputs a portion corresponding to the answer determined by the answer determination unit 130 from the answer moving image in which the answers from the respondent U2 to the series of questions are recorded. further provide.

この構成によれば、予め撮影された回答者U2の回答動画を再生することが可能であるため、回答者U2がぎこちない表情となったり、回答者U2の回答がぎこちないものとなったりすることを防止することが可能となる。また、実際に撮影された回答者U2の回答動画を再生することにより、リアルな応答を実現することができる。 According to this configuration, since it is possible to play back the response video of the respondent U2 that has been shot in advance, it is possible to prevent the respondent U2 from having an awkward facial expression or an awkward response from the respondent U2. can be prevented. In addition, by playing back an answer moving image of answerer U2 that was actually shot, a realistic response can be realized.

情報処理システム600は、質問の特徴及び回答に関する情報が格納されている質問回答データDB200を用いて一連の質問に対して回答を順次提供する情報処理システムである。情報処理システム600は、質問者U1からの一連の質問を入力する入力装置620(入力部の一例)と、一連の質問のうち今回の質問に対応する第1文に基づいて第1文に関する特徴を抽出し、その特徴と質問回答データDB200とに基づいて今回の質問に対する回答を決定する回答決定部130(決定部の一例)と、回答決定部130により決定された回答を出力させる出力装置630(出力部の一例)とを備える。回答決定部130は、第1文に関する特徴に基づいて今回の質問に対する回答が決定できない場合には、今回の質問よりも前の過去の質問に対する回答に対応する第2文と、その第1文とに基づいて第1文及び第2文に関する各特徴を抽出し、これらの各特徴と質問回答データDB200とに基づいて今回の質問に対する回答を決定する。 The information processing system 600 is an information processing system that sequentially provides answers to a series of questions using the question-and-answer data DB 200 that stores information about the characteristics of questions and answers. The information processing system 600 includes an input device 620 (an example of an input unit) for inputting a series of questions from the questioner U1, and based on the first sentence corresponding to the current question among the series of questions, , and based on the feature and the question/answer data DB 200, the answer determination unit 130 (an example of the determination unit) that determines the answer to the current question, and the output device 630 that outputs the answer determined by the answer determination unit 130 (an example of an output unit). If the answer to the current question cannot be determined based on the characteristics of the first sentence, the answer determination unit 130 determines the second sentence corresponding to the answer to the past question before the current question and the first sentence. , and based on these features and the question/answer data DB 200, the answer to the current question is determined.

この構成によれば、今回の質問に関する特徴を用いてこれに対する回答が決定できない場合でも、前の過去の質問に対する回答に関する特徴(第2文に関する特徴)を用いて、今回の質問に対する回答を決定することができる。すなわち、質問者U1の質問に対して適切な回答を提供することが可能な情報処理システム600を実現することができる。 According to this configuration, even if the answer to this question cannot be determined using the features related to the current question, the answer to the current question is determined using the features related to the answers to the previous past question (features related to the second sentence). can do. That is, it is possible to realize an information processing system 600 capable of providing an appropriate answer to the question of questioner U1.

本実施形態に係る情報処理方法は、質問の特徴及び回答に関する情報が格納されている質問回答データDB200を用いて一連の質問に対して回答を順次提供する情報処理方法である。この情報処理方法は、一連の質問のうち今回の質問に対応する第1文に基づいて第1文に関する特徴を抽出し、その特徴と質問回答データDB200とに基づいて今回の質問に対する回答を決定する決定処理(ステップS503、S504、S506)を含む。この決定処理(ステップS503、S504、S506)では、第1文に関する特徴に基づいて今回の質問に対する回答が決定できない場合には、今回の質問よりも前の過去の質問に対する回答に対応する第2文と、その第1文とに基づいて第1文及び第2文に関する各特徴を抽出し、これらの各特徴と質問回答データDB200とに基づいて今回の質問に対する回答を決定する。また、本実施形態に係るプログラムは、これらの各処理をコンピュータに実行させるプログラムである。言い換えると、本実施形態に係るプログラムは、情報処理装置100が実行可能な各機能をコンピュータに実現させるプログラムである。 The information processing method according to the present embodiment is an information processing method for sequentially providing answers to a series of questions using the question-and-answer data DB 200 that stores information about the characteristics of questions and answers. This information processing method extracts features related to the first sentence of a series of questions based on the first sentence corresponding to the current question, and determines an answer to the current question based on the features and the question/answer data DB 200. decision processing (steps S503, S504, S506). In this determination process (steps S503, S504, S506), if the answer to the current question cannot be determined based on the characteristics of the first sentence, the second question corresponding to the answer to the past question before the current question is selected. Based on the sentence and the first sentence, features of the first and second sentences are extracted, and the answer to the current question is determined based on these features and the question/answer data DB 200 . Also, the program according to the present embodiment is a program that causes a computer to execute each of these processes. In other words, the program according to the present embodiment is a program that causes a computer to implement each function executable by the information processing apparatus 100 .

この構成によれば、今回の質問に関する特徴を用いてこれに対する回答が決定できない場合でも、前の過去の質問に対する回答に関する特徴(第2文に関する特徴)を用いて、今回の質問に対する回答を決定することができる。すなわち、質問者U1の質問に対して適切な回答を提供することが可能な情報処理方法及びプログラムを実現することができる。 According to this configuration, even if the answer to this question cannot be determined using the features related to the current question, the answer to the current question is determined using the features related to the answers to the previous past question (features related to the second sentence). can do. That is, it is possible to realize an information processing method and program capable of providing an appropriate answer to the question of questioner U1.

なお、本実施形態で示した各処理手順は、本実施形態を実現するための一例を示したものであり、本実施形態を実現可能な範囲で各処理手順の一部の順序を入れ替えてもよく、各処理手順の一部を省略したり他の処理手順を追加したりしてもよい。 Each processing procedure shown in this embodiment is an example for realizing this embodiment. Often, part of each processing procedure may be omitted or other processing procedures may be added.

なお、本実施形態で示した各処理は、各処理手順をコンピュータに実行させるためのプログラムに基づいて実行されるものである。このため、本実施形態は、それらの各処理を実行する機能を実現するプログラム、そのプログラムを記憶する記録媒体の実施形態としても把握することができる。例えば、情報処理装置に新機能を追加するためのアップデート処理により、そのプログラムを情報処理装置の記憶装置に記憶させることができる。これにより、そのアップデートされた情報処理装置に本実施形態で示した各処理を実施させることが可能となる。 Each process shown in this embodiment is executed based on a program for causing a computer to execute each processing procedure. Therefore, the present embodiment can also be understood as an embodiment of a program that realizes the function of executing each process and a recording medium that stores the program. For example, the program can be stored in the storage device of the information processing device by update processing for adding a new function to the information processing device. This enables the updated information processing apparatus to perform each process shown in this embodiment.

以上、本発明の実施形態について説明したが、上記実施形態は本発明の適用例の一部を示したに過ぎず、本発明の技術的範囲を上記実施形態の具体的構成に限定する趣旨ではない。 Although the embodiments of the present invention have been described above, the above embodiments merely show a part of application examples of the present invention, and the technical scope of the present invention is not limited to the specific configurations of the above embodiments. do not have.

100、610、710 情報処理装置、110 入力部、120 音声認識部、130 回答決定部、140 回答応答部、150 記憶部、200 質問回答データDB、300 動画DB、400 情報処理システム、410 ネットワーク、430、440 電子機器、600、700 情報処置システム、620 入力装置、630 出力装置、640 記憶装置、701 ネットワーク、711 通信部、720、730 電子機器 100, 610, 710 information processing device, 110 input unit, 120 speech recognition unit, 130 answer determination unit, 140 answer response unit, 150 storage unit, 200 question and answer data DB, 300 video DB, 400 information processing system, 410 network, 430, 440 electronic equipment, 600, 700 information processing system, 620 input device, 630 output device, 640 storage device, 701 network, 711 communication unit, 720, 730 electronic equipment

Claims (8)

質問の特徴及び回答に関する情報が格納されているデータベースを用いて一連の質問に対して回答を順次提供する情報処理装置であって、
前記一連の質問のうち今回の質問に対応する第1文に基づいて前記第1文に関する特徴を抽出し、当該特徴と前記データベースとに基づいて前記今回の質問に対する回答を決定する決定部を備え、
前記決定部は、
前記第1文に関する特徴に基づいて前記今回の質問に対する回答が決定できない場合には、前記今回の質問の1回前の質問に対する回答である第1回答に対応する第2文と前記第1文とに基づいて当該第1文及び当該第2文に関する各特徴を抽出し、当該各特徴と前記データベースとに基づいて前記今回の質問に対する回答の決定を試み、
前記今回の質問の1回前からN-1(ただし、Nは3以上の整数)回前までの各質問に対する回答である第1回答乃至第N-1回答に対応する各文と前記第1文とを用いても前記今回の質問に対する回答が決定できない場合には、前記今回の質問の1回前からN回前までの各質問に対する回答である第1回答乃至第N回答に対応する各文と前記第1文とに基づいて当該各文及び当該第1文に関する各特徴を抽出し、当該各特徴と前記データベースとに基づいて前記今回の質問に対する回答の決定を試みる、
情報処理装置。
An information processing device that sequentially provides answers to a series of questions using a database that stores information about the characteristics of questions and answers,
a determination unit for extracting a feature related to the first sentence based on the first sentence corresponding to the current question among the series of questions, and determining an answer to the current question based on the feature and the database; ,
The decision unit
If the answer to the current question cannot be determined based on the characteristics of the first sentence, the second sentence and the first sentence corresponding to the first answer, which is the answer to the question one question before the current question. Extract each feature related to the first sentence and the second sentence based on and try to determine the answer to the current question based on each feature and the database,
Each sentence and the first If the answer to the current question cannot be determined even by using the sentence, each of the first to N-th answers, which are the answers to the questions from 1 to N times before the current question Based on the sentence and the first sentence, each feature related to each sentence and the first sentence is extracted, and an attempt is made to determine an answer to the current question based on each feature and the database.
Information processing equipment.
請求項に記載の情報処理装置であって、
前記決定部は、前記第1回答乃至前記第N回答に対応する各文に基づいて当該各文に関する特徴量を算出し、前記第1回答から前記第N回答に遡るのに応じて、当該各文に関する特徴量の影響度を低下させ、当該影響度を低下させた特徴量と前記データベースとに基づいて前記今回の質問に対する回答の決定を試みる、
情報処理装置。
The information processing device according to claim 1 ,
The determining unit calculates a feature amount related to each sentence based on each sentence corresponding to the first to Nth answers, and calculates each of the sentences corresponding to the first answer to the Nth answer. Attempt to determine the answer to the current question based on the feature amount with the reduced influence and the database,
Information processing equipment.
請求項1又は2に記載の情報処理装置であって、
前記データベースは、前記質問に含まれる1又は複数の単語と、当該質問に対する回答に関する回答情報とが関連付けて格納されるデータベースであり、
前記決定部は、前記第1文に含まれる1又は複数の単語を前記第1文に関する特徴として抽出し、当該1又は複数の単語と前記データベースに格納されている単語との一致度に基づいて、前記今回の質問に対する回答を決定する、
情報処理装置。
The information processing device according to claim 1 or 2 ,
The database is a database in which one or more words included in the question and answer information related to the answer to the question are stored in association with each other,
The determination unit extracts one or more words included in the first sentence as features related to the first sentence, and based on the degree of matching between the one or more words and words stored in the database , to determine the answer to the current question;
Information processing equipment.
請求項1又は2に記載の情報処理装置であって、
前記データベースは、前記質問に関する特徴量と、当該質問に対する回答に関する回答情報とが関連付けて格納されるデータベースであり、
前記決定部は、前記第1文に関する特徴量を前記第1文に関する特徴として抽出し、当該特徴量と前記データベースに格納されている特徴量との一致度に基づいて、前記今回の質問に対する回答を決定する、
情報処理装置。
The information processing device according to claim 1 or 2 ,
The database is a database in which the feature amount related to the question and the answer information related to the answer to the question are stored in association with each other,
The determining unit extracts a feature amount related to the first sentence as a feature related to the first sentence, and responds to the current question based on a degree of matching between the feature amount and the feature amount stored in the database. determine the
Information processing equipment.
請求項1又は2に記載の情報処理装置であって、
前記一連の質問に対する回答者からの回答が記録されている回答動画のうちから、前記決定部により決定された回答に対応する部分を再生して出力させる回答応答部をさらに備える、
情報処理装置。
The information processing device according to claim 1 or 2 ,
An answer response unit that reproduces and outputs a portion corresponding to the answer determined by the determination unit from among the response videos in which the answers from the respondent to the series of questions are recorded,
Information processing equipment.
質問の特徴及び回答に関する情報が格納されているデータベースを用いて一連の質問に対して回答を順次提供する情報処理システムであって、
前記一連の質問を入力する入力部と、
前記一連の質問のうち今回の質問に対応する第1文に基づいて前記第1文に関する特徴を抽出し、当該特徴と前記データベースとに基づいて前記今回の質問に対する回答を決定する決定部と、
前記決定部により決定された回答を出力させる出力部とを備え、
前記決定部は、
前記第1文に関する特徴に基づいて前記今回の質問に対する回答が決定できない場合には、前記今回の質問の1回前の質問に対する回答である第1回答に対応する第2文と前記第1文とに基づいて当該第1文及び当該第2文に関する各特徴を抽出し、当該各特徴と前記データベースとに基づいて前記今回の質問に対する回答の決定を試み、
前記今回の質問の1回前からN-1(ただし、Nは3以上の整数)回前までの各質問に対する回答である第1回答乃至第N-1回答に対応する各文と前記第1文とを用いても前記今回の質問に対する回答が決定できない場合には、前記今回の質問の1回前からN回前までの各質問に対する回答である第1回答乃至第N回答に対応する各文と前記第1文とに基づいて当該各文及び当該第1文に関する各特徴を抽出し、当該各特徴と前記データベースとに基づいて前記今回の質問に対する回答の決定を試みる、
情報処理システム。
An information processing system that sequentially provides answers to a series of questions using a database that stores information about question features and answers,
an input unit for inputting the series of questions;
a determination unit that extracts features related to the first sentence based on the first sentence corresponding to the current question among the series of questions, and determines an answer to the current question based on the features and the database;
An output unit for outputting the answer determined by the determination unit,
The decision unit
If the answer to the current question cannot be determined based on the characteristics of the first sentence, the second sentence and the first sentence corresponding to the first answer, which is the answer to the question one question before the current question. Extract each feature related to the first sentence and the second sentence based on and try to determine the answer to the current question based on each feature and the database,
Each sentence and the first If the answer to the current question cannot be determined even by using the sentence, each of the first to N-th answers, which are the answers to the questions from 1 to N times before the current question Based on the sentence and the first sentence, each feature related to each sentence and the first sentence is extracted, and an attempt is made to determine an answer to the current question based on each feature and the database.
Information processing system.
コンピュータにより実行され、質問の特徴及び回答に関する情報が格納されているデータベースを用いて一連の質問に対して回答を順次提供する情報処理方法であって、
前記一連の質問のうち今回の質問に対応する第1文に基づいて前記第1文に関する特徴を抽出し、当該特徴と前記データベースとに基づいて前記今回の質問に対する回答を決定する決定処理を含み、
前記決定処理では、
前記第1文に関する特徴に基づいて前記今回の質問に対する回答が決定できない場合には、前記今回の質問の1回前の質問に対する回答である第1回答に対応する第2文と前記第1文とに基づいて当該第1文及び当該第2文に関する各特徴を抽出し、当該各特徴と前記データベースとに基づいて前記今回の質問に対する回答の決定を試み、
前記今回の質問の1回前からN-1(ただし、Nは3以上の整数)回前までの各質問に対する回答である第1回答乃至第N-1回答に対応する各文と前記第1文とを用いても前記今回の質問に対する回答が決定できない場合には、前記今回の質問の1回前からN回前までの各質問に対する回答である第1回答乃至第N回答に対応する各文と前記第1文とに基づいて当該各文及び当該第1文に関する各特徴を抽出し、当該各特徴と前記データベースとに基づいて前記今回の質問に対する回答の決定を試みる、
情報処理方法。
An information processing method for sequentially providing answers to a series of questions using a database in which information about question characteristics and answers is stored , which is executed by a computer ,
Determination processing of extracting features related to the first sentence based on the first sentence corresponding to the current question among the series of questions, and determining an answer to the current question based on the features and the database ,
In the decision process,
If the answer to the current question cannot be determined based on the characteristics of the first sentence, the second sentence and the first sentence corresponding to the first answer, which is the answer to the question one question before the current question. Extract each feature related to the first sentence and the second sentence based on and try to determine the answer to the current question based on each feature and the database,
Each sentence and the first If the answer to the current question cannot be determined even by using the sentence, each of the first to N-th answers, which are the answers to the questions from 1 to N times before the current question Based on the sentence and the first sentence, each feature related to each sentence and the first sentence is extracted, and an attempt is made to determine an answer to the current question based on each feature and the database.
Information processing methods.
質問の特徴及び回答に関する情報が格納されているデータベースを用いて一連の質問に対して回答を順次提供するコンピュータに実行させるためのプログラムであって、
前記一連の質問のうち今回の質問に対応する第1文に基づいて前記第1文に関する特徴を抽出し、当該特徴と前記データベースとに基づいて前記今回の質問に対する回答を決定する決定処理を前記コンピュータに実行させ、
前記決定処理では、
前記第1文に関する特徴に基づいて前記今回の質問に対する回答が決定できない場合には、前記今回の質問の1回前の質問に対する回答である第1回答に対応する第2文と前記第1文とに基づいて当該第1文及び当該第2文に関する各特徴を抽出し、当該各特徴と前記データベースとに基づいて前記今回の質問に対する回答の決定を試み、
前記今回の質問の1回前からN-1(ただし、Nは3以上の整数)回前までの各質問に対する回答である第1回答乃至第N-1回答に対応する各文と前記第1文とを用いても前記今回の質問に対する回答が決定できない場合には、前記今回の質問の1回前からN回前までの各質問に対する回答である第1回答乃至第N回答に対応する各文と前記第1文とに基づいて当該各文及び当該第1文に関する各特徴を抽出し、当該各特徴と前記データベースとに基づいて前記今回の質問に対する回答の決定を試みる
プログラム。
A program to be executed by a computer that sequentially provides answers to a series of questions using a database that stores information about question characteristics and answers,
a determination process for extracting a feature related to the first sentence based on the first sentence corresponding to the current question among the series of questions, and determining an answer to the current question based on the feature and the database; let the computer run
In the decision process,
If the answer to the current question cannot be determined based on the characteristics of the first sentence, the second sentence and the first sentence corresponding to the first answer, which is the answer to the question one question before the current question. Extract each feature related to the first sentence and the second sentence based on and try to determine the answer to the current question based on each feature and the database,
Each sentence and the first If the answer to the current question cannot be determined even by using the sentence, each of the first to N-th answers, which are the answers to the questions from 1 to N times before the current question Based on the sentence and the first sentence, each feature related to each sentence and the first sentence is extracted, and an attempt is made to determine an answer to the current question based on each feature and the database.
program.
JP2022107202A 2022-07-01 2022-07-01 Information processing device, information processing system, information processing method and program Active JP7232485B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022107202A JP7232485B1 (en) 2022-07-01 2022-07-01 Information processing device, information processing system, information processing method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022107202A JP7232485B1 (en) 2022-07-01 2022-07-01 Information processing device, information processing system, information processing method and program

Publications (2)

Publication Number Publication Date
JP7232485B1 true JP7232485B1 (en) 2023-03-03
JP2024006380A JP2024006380A (en) 2024-01-17

Family

ID=85383483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022107202A Active JP7232485B1 (en) 2022-07-01 2022-07-01 Information processing device, information processing system, information processing method and program

Country Status (1)

Country Link
JP (1) JP7232485B1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000242640A (en) 1999-02-23 2000-09-08 Atr Interpreting Telecommunications Res Lab Interactive system
CN111428055A (en) 2020-04-20 2020-07-17 神思电子技术股份有限公司 Industry-oriented context omission question-answering method
WO2021117180A1 (en) 2019-12-12 2021-06-17 日本電信電話株式会社 Dialog processing device, learning device, dialog processing method, learning method, and program
CN113806508A (en) 2021-09-17 2021-12-17 平安普惠企业管理有限公司 Multi-turn dialogue method and device based on artificial intelligence and storage medium
US20220075958A1 (en) 2019-05-21 2022-03-10 Huawei Technologies Co., Ltd. Missing semantics complementing method and apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000242640A (en) 1999-02-23 2000-09-08 Atr Interpreting Telecommunications Res Lab Interactive system
US20220075958A1 (en) 2019-05-21 2022-03-10 Huawei Technologies Co., Ltd. Missing semantics complementing method and apparatus
WO2021117180A1 (en) 2019-12-12 2021-06-17 日本電信電話株式会社 Dialog processing device, learning device, dialog processing method, learning method, and program
CN111428055A (en) 2020-04-20 2020-07-17 神思电子技术股份有限公司 Industry-oriented context omission question-answering method
CN113806508A (en) 2021-09-17 2021-12-17 平安普惠企业管理有限公司 Multi-turn dialogue method and device based on artificial intelligence and storage medium

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
片山薫ほか3名,VIEW Classroom(遠隔分散教育システム)における教師生徒間の対話支援,情報処理学会研究報告,社団法人情報処理学会,1995年01月27日,Vol.95,No.12,pp.9-16

Also Published As

Publication number Publication date
JP2024006380A (en) 2024-01-17

Similar Documents

Publication Publication Date Title
US8972265B1 (en) Multiple voices in audio content
WO2022095380A1 (en) Ai-based virtual interaction model generation method and apparatus, computer device and storage medium
KR20210110620A (en) Interaction methods, devices, electronic devices and storage media
US7160112B2 (en) System and method for language education using meaning unit and relational question
JP2023545543A (en) Information generation method, device, computer equipment, storage medium and computer program
US20200175457A1 (en) Evaluation of actor auditions
JP4568144B2 (en) Information presentation device and information presentation program
CN110505498A (en) Processing, playback method, device and the computer-readable medium of video
KR101375119B1 (en) Virtual interview mothod and mobile device readable recording medium for executing application recorded the method
Skukauskaite Transcribing as analysis: Logic-in-use in entextualizing interview conversations
CN109389427A (en) Questionnaire method for pushing, device, computer equipment and storage medium
CN112287168A (en) Method and apparatus for generating video
CN112765460A (en) Conference information query method, device, storage medium, terminal device and server
JP7232485B1 (en) Information processing device, information processing system, information processing method and program
JP6367748B2 (en) Recognition device, video content presentation system
CN111726693A (en) Audio and video playing method, device, equipment and medium
CN116881412A (en) Chinese character multidimensional information matching training method and device, electronic equipment and storage medium
CN116013274A (en) Speech recognition method, device, computer equipment and storage medium
WO2019171027A1 (en) Ability classification
CN113301362B (en) Video element display method and device
JP6656529B2 (en) Foreign language conversation training system
CN115392227A (en) Emotion curve generation method of virtual object
CN110136719B (en) Method, device and system for realizing intelligent voice conversation
JP6838739B2 (en) Recent memory support device
JP6930781B1 (en) Learning method and content playback device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220701

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230210

R150 Certificate of patent or registration of utility model

Ref document number: 7232485

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150