JP5728527B2 - Utterance candidate generation device, utterance candidate generation method, and utterance candidate generation program - Google Patents
Utterance candidate generation device, utterance candidate generation method, and utterance candidate generation program Download PDFInfo
- Publication number
- JP5728527B2 JP5728527B2 JP2013101382A JP2013101382A JP5728527B2 JP 5728527 B2 JP5728527 B2 JP 5728527B2 JP 2013101382 A JP2013101382 A JP 2013101382A JP 2013101382 A JP2013101382 A JP 2013101382A JP 5728527 B2 JP5728527 B2 JP 5728527B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- module
- candidate
- user
- generated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、発話候補生成装置、発話候補生成方法、及び発話候補生成プログラムにかかり、特に、ユーザ発話に応答する対話システムにおけるシステム発話のための発話候補生成装置、発話候補生成方法、及び発話候補生成プログラムに関する。 The present invention relates to an utterance candidate generation device, an utterance candidate generation method, and an utterance candidate generation program, and more particularly to an utterance candidate generation device, an utterance candidate generation method, and an utterance candidate for system utterance in an interactive system that responds to user utterances. It relates to the generation program.
一般に、ユーザと対話を行う対話システムでは、人間らしい応答を実現するために、ユーザ発話についての応答を発話ペアとして手作業で大量に構築しておき、対話システム10の応答として用いることが多い。発話ペアの例としては、ユーザ発話:「ありがとう」、応答:「どういたしまして」等が挙げられる。このような手法で応答を生成するシステムがある(例えば、非特許文献1参照)。
In general, in a dialogue system that interacts with a user, in order to realize a human-like response, a large number of responses regarding user utterances are manually constructed as utterance pairs and used as responses of the
また、ユーザとの対話における現在の話題について、インターネットを利用してウェブ検索エンジンを用いて関連する文を抽出し、抽出した文の中から一つ以上の文を発話として用いて応答を行う対話システムがある(例えば、非特許文献2参照)。 In addition, regarding the current topic in dialogue with the user, the relevant sentence is extracted using a web search engine using the Internet, and one or more sentences are extracted as utterances from among the extracted sentences. There exists a system (for example, refer nonpatent literature 2).
上記非特許文献1に記載の技術、及び非特許文献2に記載の技術のいずれも単一のアルゴリズムで応答を生成するが、ユーザ発話は様々であり、単一のアルゴリズムのみで対話システムが適切に応答することは難しい。例えば、非特許文献1の技術では、開発者が想定したユーザ発話に対しては、的確に答えられるが、開発者が想定していないユーザ発話に対しては、応答することができない。また、非特許文献2の技術では、インターネットの検索エンジンを用いるため、様々な話題について応答を返すことができるが、雑多な内容を含むインターネットからの検索結果は発話として用いるには質が低く、また、挨拶に挨拶で返すといった定型応答に対応することが難しい。加えて、非特許文献1及び非特許文献2による応答手法を組み合わせたとしても、それぞれが適切に応答できるシステム発話は限られており、ユーザ発話に対して、常に適切な応答ができるとは限らない。
Both the technique described in
本発明は上記問題点を考慮してなされたものであり、対話システムにおいてユーザ発話に応じて適切な応答を行うことができる発話候補生成装置、発話候補生成方法、及び発話候補生成プログラムを提供することを目的とする。 The present invention has been made in consideration of the above-described problems, and provides an utterance candidate generation device, an utterance candidate generation method, and an utterance candidate generation program capable of appropriately responding to a user utterance in a dialog system. For the purpose.
上記目的を達成するために、本発明の発話候補生成装置は、ユーザ発話に対して応答を行うことによりユーザと対話を行う対話システムにおける応答に用いる発話候補を生成する発話候補生成装置であって、ユーザ発話と前記ユーザ発話に対する応答とからなる予め定められた複数の発話ペアから、入力されたユーザ発話と一致すると判断される発話ペアを選択し、選択された発話ペアの前記応答を用いて、発話候補を生成する第1モジュール、ユーザ発話の話題を表す単語の各々について予め定められた、前記単語に関連する関連語を用いた発話から、前記入力されたユーザ発話から抽出される前記ユーザ発話の話題を表す単語に関連する前記関連語を用いた発話を選択し、選択した前記発話を用いて発話候補を生成する第2モジュール、複数の発話を格納した発話データベースから、前記入力されたユーザ発話から抽出される単語を用いた検索クエリで検索し、前記検索された発話を用いて発話候補を生成する第3モジュール、予め定められた、ユーザ発話の話題によらず発話可能と判断される複数の発話のうちの少なくとも1つの発話を用いて発話候補を生成する第4モジュール、及び予め定められた、ユーザ発話の話題を変更するための複数の発話のうちの少なくとも1つの発話を用いて発話候補を生成する第5モジュールを備え、前記第1モジュールによって前記発話候補が生成されない場合に、前記第2モジュールへ進み、前記第2モジュールによって前記発話候補が生成されない場合に、前記第3モジュールへ進み、前記第3モジュールによって前記発話候補が生成されない場合に、前記第4モジュールへ進むことにより、前記第1モジュールによって生成された前記発話候補、前記第2モジュールによって生成された前記発話候補、前記第3モジュールによって生成された前記発話候補、前記第4モジュールによって生成された前記発話候補、及び前記第5モジュールによって生成された前記発話候補の順に優先して、前記発話候補を出力する。 In order to achieve the above object, an utterance candidate generation device of the present invention is an utterance candidate generation device that generates an utterance candidate used for a response in an interactive system that interacts with a user by responding to a user utterance. Selecting an utterance pair determined to match the input user utterance from a plurality of predetermined utterance pairs consisting of a user utterance and a response to the user utterance, and using the response of the selected utterance pair The first module for generating utterance candidates, the user extracted from the input user utterance from utterances using related words related to the word predetermined for each word representing the topic of user utterance A second module for selecting an utterance using the related word related to a word representing an utterance topic, and generating an utterance candidate using the selected utterance; A third module, which searches for a search query using a word extracted from the input user utterance from an utterance database storing a number of utterances and generates utterance candidates using the searched utterance; In addition, a fourth module that generates an utterance candidate using at least one utterance out of a plurality of utterances that are determined to be utterable regardless of the topic of the user utterance, and changes a predetermined topic of the user utterance comprising a fifth module for generating an utterance candidate with at least one utterance of a plurality of utterances for, when the utterance candidate by the first module is not generated, the process proceeds to the second module, the second When the utterance candidate is not generated by two modules, the process proceeds to the third module, and the utterance candidate is generated by the third module. If not, the utterance candidate generated by the first module, the utterance candidate generated by the second module, the utterance candidate generated by the third module, by proceeding to the fourth module, The utterance candidate is output in preference to the utterance candidate generated by the fourth module and the utterance candidate generated by the fifth module.
また、本発明の発話候補生成装置の前記第1モジュール〜前記第5モジュールのうちの少なくとも1つは、前記ユーザの発話の意図を表す対話行為を推定した対話行為推定情報に基づいて決定される、前記対話システムの対話行為に基づいて、前記発話候補を生成することが好ましい。 In addition, at least one of the first module to the fifth module of the utterance candidate generation device of the present invention is determined based on dialogue action estimation information obtained by estimating a dialogue action representing the user's utterance intention. Preferably, the utterance candidate is generated based on an interactive action of the interactive system.
本発明の発話候補生成方法は、ユーザ発話に対して応答を行うことによりユーザと対話を行う対話システムにおける応答に用いる発話候補を生成する発話候補生成方法であって、第1モジュールにより、ユーザ発話と前記ユーザ発話に対する応答とからなる予め定められた複数の発話ペアから、入力されたユーザ発話と一致する発話ペアを選択し、選択された発話ペアの前記応答を用いて、発話候補を生成するステップ、第2モジュールにより、ユーザ発話の話題を表す単語の各々について予め定められた、前記単語に関連する関連語を用いた発話から、前記入力されたユーザ発話から抽出される前記ユーザ発話の話題を表す単語に関連する前記関連語を用いた発話を選択し、選択した前記発話を用いて発話候補を生成するステップ、第3モジュールにより、複数の発話を格納した発話データベースから、前記入力されたユーザ発話から抽出される単語を用いた検索クエリで検索し、前記検索された発話を用いて発話候補を生成するステップ、第4モジュールにより、予め定められた、ユーザ発話の話題によらず発話可能な複数の発話のうちの少なくとも1つの発話を用いて発話候補を生成するステップ、及び第5モジュールにより、予め定められた、ユーザ発話の話題を変更するための複数の発話のうちの少なくとも1つの発話を用いて発話候補を生成するステップを備え、前記第1モジュールによって前記発話候補が生成されない場合に、前記第2モジュールへ進み、前記第2モジュールによって前記発話候補が生成されない場合に、前記第3モジュールへ進み、前記第3モジュールによって前記発話候補が生成されない場合に、前記第4モジュールへ進むことにより、前記第1モジュールによって生成された前記発話候補、前記第2モジュールによって生成された前記発話候補、前記第3モジュールによって生成された前記発話候補、前記第4モジュールによって生成された前記発話候補、及び前記第5モジュールによって生成された前記発話候補の順に優先して、前記発話候補を出力する。 An utterance candidate generation method according to the present invention is an utterance candidate generation method for generating an utterance candidate used for a response in an interactive system that interacts with a user by responding to a user utterance. The utterance candidate generation method includes: And a response to the user utterance, a utterance pair that matches the input user utterance is selected from a plurality of predetermined utterance pairs, and an utterance candidate is generated using the response of the selected utterance pair The topic of the user utterance extracted from the input user utterance from the utterance using a related word related to the word, which is predetermined for each word representing the topic of the user utterance by the second module. Selecting an utterance using the related word related to the word representing, and generating an utterance candidate using the selected utterance; Searching by a search query using a word extracted from the input user utterance from an utterance database storing a plurality of utterances, and generating utterance candidates using the searched utterances; A step of generating an utterance candidate using at least one utterance of a plurality of utterances that can be uttered regardless of a topic of the user utterance determined by the module, and a user predetermined by the fifth module A step of generating an utterance candidate using at least one utterance of a plurality of utterances for changing a topic of utterance, and when the utterance candidate is not generated by the first module, the process proceeds to the second module If the utterance candidate is not generated by the second module, the process proceeds to the third module, and the third module If the utterance candidate is not generated by the process, the utterance candidate generated by the first module, the utterance candidate generated by the second module, and the third module are advanced to the fourth module. The utterance candidate is output in the order of the generated utterance candidate, the utterance candidate generated by the fourth module, and the utterance candidate generated by the fifth module .
本発明の発話候補生成プログラムは、コンピュータを、本発明の発話候補生成装置の各モジュールとして機能させるためのものである。 The utterance candidate generation program of the present invention is for causing a computer to function as each module of the utterance candidate generation device of the present invention.
本発明の発話候補生成装置、発話候補生成方法、及び発話候補生成プログラムによれば、対話システムにおいてユーザ発話に応じて適切な応答を行うことができる、という効果が得られる。 According to the utterance candidate generation device, the utterance candidate generation method, and the utterance candidate generation program of the present invention, it is possible to obtain an effect that an appropriate response can be made according to the user utterance in the dialog system.
以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、本実施の形態は本発明を限定するものではない。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Note that this embodiment does not limit the present invention.
本実施の形態の対話システム10は、ユーザの発話に対してシステムが発話を行うことによりユーザと雑談等の対話を行う対話システムであって、ユーザ発話と、ユーザ発話から推定した対話行為に基づいて決定された対話システム10の対話行為とに基づいて発話候補46を生成し、生成した発話候補46から選択した発話によりユーザに対して応答を行う機能を有している。
The
まず、本実施の形態の対話システム10の構成について説明する。図1には、本実施の形態の対話システム10の概略構成の一例を表した構成図を示す。本実施の形態の対話システム10は、入力部12、対話制御部14、出力部18、及び発話候補生成装置20を備える。
First, the configuration of the
入力部12は、ユーザによって入力されたユーザ発話を発話候補生成装置20に出力する機能を有している。また、本実施の形態の入力部12は、入力されたユーザ発話を対話制御部14にも出力する機能を有している。さらに、本実施の形態の入力部12は、ユーザとの対話履歴を発話候補生成装置20に出力する機能を有している。
The
対話制御部14は、対話行為推定器16を備えており、入力されたユーザ発話の対話行為を対話行為推定器16により推定し、推定した対話行為に応じて、対話システムの発話意図を決定する機能を有している。対話システム10側の発話意図を表す情報をシステムの対話行為と呼ぶ。なお、本実施の形態において「対話行為」とは、発話の意図を表すシンボルのことをいう。
The
本実施の形態の対話行為は、対話行為IDと対話行為名のセットからなる。図2には、具体的な一例として本実施の形態で使用する、対話行為のセットと、対応する発話の例との関係を表したテーブルを示す。なお、対話行為のセットとしては、図2に示したものに限らず、談話研究で一般的なDAMSLタグセット等を用いてもよい。 The dialogue act of this embodiment is composed of a set of dialogue act ID and dialogue act name. FIG. 2 shows a table representing a relationship between a set of dialogue actions and a corresponding utterance example used in the present embodiment as a specific example. The dialogue action set is not limited to the one shown in FIG. 2, and a DAMSL tag set or the like generally used in discourse research may be used.
また、対話行為推定器16は、発話中の単語を元に対話行為を推定する推定器であり、機械学習の手法で構築される。例えば、対話行為推定器16を、文書分類で一般的に用いられる手法である、サポートベクトルマシン等を用いて構築することができる。本実施の形態では、約数万の発話について手作業で対話行為を付与し、このデータを学習データとして、サポートベクトルマシンによって、発話からその対話行為を推定する、多クラス分類器を学習した。
The
また、システムの対話行為の決定には、例えば、文献(目黒豊美,南泰浩,東中竜一郎,堂坂浩二,POMDPを用いた聞き役対話制御部のWizard of Oz実験による評価,人工知能学会第26 回全国大会オーガナイズドセッション「OS-18 知的対話システム」, 2012.参照)に記されたような手作業で作成されたルールを用いてもよい。また、その他には、近年一般的になっているMDPやPOMDPと呼ばれる統計的な対話制御の手法を用いて、システムの対話行為を決定してもよい。 In addition, for the determination of the dialogue action of the system, for example, the literature (Toyomi Meguro, Yasuhiro Minami, Ryuichiro Higashinaka, Koji Dosaka, Evaluation of the hearing dialogue control unit using POMDP by the Wizard of Oz experiment, The 26th Annual Meeting of the Japanese Society for Artificial Intelligence Manual rules such as those described in the National Conference Organized Session “OS-18 Intelligent Dialogue System”, 2012.) may be used. In addition, the interactive action of the system may be determined using a statistical dialog control technique called MDP or POMDP which has become common in recent years.
対話制御部14により決定されたシステムの対話行為は、発話候補生成装置20に出力される。なお、発話候補生成装置20における発話候補の生成において、システムの対話行為は、必須ではない。発話候補生成装置20が対話行為を用いずに発話候補を生成する場合は、対話制御部14は、対話行為推定器16を備えなくてもよく、推定した対話行為を発話候補生成装置20に出力する機能を有していなくてもよい。
The dialogue action of the system determined by the
出力部18は、発話候補生成装置20により出力された発話候補46から一つ以上の発話を選択して、システム発話としてユーザに応答(提示)する機能を有している。
The
本実施の形態の発話候補生成装置20は、複数のモジュールを用いて、入力部12から入力されたユーザ発話に応答するための発話候補46を生成して出力部18へ出力する機能を有する。本実施の形態の発話候補生成装置20は、5つのモジュールを備えている。発話候補生成装置20では、発話ペア選択部22が第1モジュールに対応し、関連発話選択部26が第2モジュールに対応し、発話サーチ部32が第3モジュールに対応し、バーサタイル発話選択部38が第4モジュールに対応し、新規話題発話選択部42が第5モジュールに対応している。なお、以下では、発話ペア選択部22、関連発話選択部26、発話サーチ部32、バーサタイル発話選択部38、及び新規話題発話選択部42を総称する場合は、「モジュール」という。
The utterance
また、本実施の形態の発話候補生成装置20は、各モジュールで用いられるデータベースとして、発話ペア24、単語−発話ペア30、発話データベース36、発話リスト40、及び発話リスト44を備える。
In addition, the utterance
なお、発話候補生成装置20におけるこれら各処理部、及び上記各処理部(入力部12、対話制御部14、及び出力部18)は、CPU(Central Processing Unit)、RAM(Random Access Memory)、及びROM(Read Only Memory)等を備えたコンピュータにより実現されており、CPUが、ROMに記憶されているプログラムを実行することにより、詳細を後述する各処理部における処理が実行される。
Each of these processing units and the above-described processing units (
発話ペア選択部22は、ユーザ発話そのものに対する応答を予め与えられた発話ペア24から選択することにより、発話候補を生成する機能を有している。
The utterance
発話ペア24には、ユーザ発話と当該ユーザ発話に対する応答とのペア(発話ペア)が一つ以上格納されている。発話ペア24のデータ(発話ペア)は、例えば手作業により予め作成されたものである。図3には、本実施の形態の発話ペア24の具体的な一例を示す。なお、本実施の形態では、発話ペアの応答の対話行為を発話ペアに付与して発話ペア24に格納している。なお、応答の対話行為は、上述の対話行為推定器16と同様の対話行為推定器を用いて推定した対話行為を付与すればよい。図3に示した「0:挨拶」の場合は、「0」が対話行為IDであり、「挨拶」が対話行為名を示している。なお、本実施の形態では、後述するようにシステムの対話行為も用いて発話候補46を生成しているため、このように各発話ペアの対話行為についても発話ペア選択部22に格納しているが、対話行為を用いずに発話候補46を生成する場合には、対話行為については、発話ペア選択部22に格納しなくてもよい。
The
発話ペア選択部22は、入力されたユーザ発話に一致するユーザ発話を含む発話ペアの応答を発話ペア選択部22から各々抽出し、各々抽出した応答からなる発話リストを発話候補46として生成する。なお、発話ペア選択部22が抽出する応答の数は特に限定されない。また、本実施の形態の発話ペア選択部22では、ユーザ発話に加えてシステムの対話行為が入力された場合は、入力されたユーザ発話に一致し、かつ、入力された対話行為と対話行為が一致する発話ペアにおける応答を発話ペア24から各々抽出し、各々抽出した応答からなる発話リストを発話候補46として生成する。対話行為を用いることにより、対話システム10の発話意図に沿った発話候補46を生成することができる。
The utterance
発話ペア選択部22が生成する発話候補46は、ユーザ発話そのものに対応した発話であるため、ユーザ発話に対して適切な応答を期待することができる。
Since the
関連発話選択部26は、入力されたユーザ発話から、ユーザとの対話における現在の話題を示す単語を抽出し、抽出した単語に対応した発話を単語−発話ペア30から選択することにより、発話候補46を生成する機能を有する。なお、本実施の形態において「入力されたユーザ発話」とは、直前に入力された発話のみが対象となるのではなく、複数(例えば、予め定められた数)のこれまでに入力されたユーザ発話を対象としてもよい。
The related
単語−発話ペア30には、話題を示す単語と当該単語に関連する関連語を用いた発話との組み合わせからなる単語−発話のデータが一つ以上格納されている。単語−発話のデータは、例えば、手作業により予め作成されたものである。図4には、本実施の形態の単語−発話ペア30の具体的な一例を示す。なお、本実施の形態では、発話ペアの発話の対話行為を各データに付与して単語−発話ペア30に格納している。なお、発話の対話行為は、上述の対話行為推定器16と同様の対話行為推定器を用いて推定した対話行為を付与すればよい。
The word-
関連発話選択部26は、入力されたユーザ発話に対して形態素解析器28により形態素解析を行い、形態素解析結果に基づいて、ユーザとの対話における話題を示す単語を抽出する。例えば、話題を示す単語とは、ユーザ発話に含まれる名詞であってもよい。具体的な一例として、「ラーメンが好きです」というユーザ発話が入力された場合は、当該ユーザ発話を形態素解析器34により形態素解析を行うことで、「ラーメン」を名詞として判定することができる。この場合、関連発話選択部26は、「ラーメン」を、話題を示す単語として抽出する。さらに関連発話選択部26は、抽出した話題を示す単語と一致する単語に対応した発話を単語−発話ペア30から各々抽出し、各々抽出した発話からなる発話リストを発話候補46として生成する。本実施の形態では、具体的な一例として、図4に示した発話からなる発話リストを発話候補46として生成する。なお、関連発話選択部26が抽出する発話の数は特に限定されない。また、本実施の形態の関連発話選択部26では、ユーザ発話に加えてシステムの対話行為が入力された場合は、抽出した話題を示す単語と一致し、かつ、入力された対話行為と対話行為とが一致するデータにおける発話を単語−発話ペア30から各々抽出し、各々抽出した発話からなる発話リストを発話候補46として生成する。対話行為を用いることにより、対話システム10の発話意図に沿った発話候補46を生成することができる。
The related
関連発話選択部26が生成する発話候補46は、ユーザ発話そのものではなく、ユーザとの対話における話題に対応しているため、発話ペア選択部22(第1モジュール)よりもユーザ発話に直接的に対応したものではなくなるものの、対話の話題に即した応答を実現することができる。
Since the
発話サーチ部32は、入力されたユーザ発話から単語を抽出し、抽出した単語が含まれる発話を、発話データベース36から検索することにより、発話候補46を生成する機能を有する。
The
本実施の形態の発話データベース36としては、具体的な一例として、ツイッター(登録商標)のサイトのデータを独自にクロールし、これらを句点や記号によって文分割した上で、一文(発話)を一レコードとして登録したものを用いているが、特に限定されない。なお、発話データベース36は全文検索が可能なように転置インデックスを保持している。当該発話データベース36の構築方法は特に限定されず、例えば、一般的な全文検索エンジンのデータベースを構築する手順を踏めばよく、フリーソフトのLuceneやNamazu等を用いて構築すればよい。本実施の形態では、具体的な一例として、Luceneを用いて構築した発話データベース36を用いている。なお、本実施の形態では、発話の対話行為を当該発話に付与して発話データベース36に格納している。なお、発話の対話行為は、上述の対話行為推定器16と同様の対話行為推定器を用いて推定した対話行為を付与すればよい。
As a specific example, the
発話サーチ部32は、入力されたユーザ発話に対して形態素解析器34により形態素解析を行い、形態素解析結果に基づいて、ユーザ発話から単語を抽出し、抽出した単語を用いて検索クエリを構成して、発話データベース36を検索する。具体的な一例として、「ラーメンが好きです」というユーザ発話が入力された場合は、当該ユーザ発話を形態素解析器34により形態素解析を行うことで、発話文に含まれる単語を抽出することができる。当該ユーザ発話文においては、内容語(名詞、動詞、及び形容詞)として、「ラーメン」及び「好き」を抽出することができる。なお、これら二つの単語からなる検索クエリを作成してもよいし、「ラーメン」及び「好き」のいずれか一方からなる検索クエリを作成してもよい。このようにして得られた検索クエリによって発話データベース36を検索し、上位N件の検索結果である発話を発話リストとして取得して発話候補46を生成する。なお、発話サーチ部32が取得する発話の数は特に限定されない。また、本実施の形態の発話サーチ部32では、ユーザ発話に加えてシステムの対話行為が入力された場合は、検索クエリにシステムの対話行為を含めることにより、システムの対話行為が一致する発話のみを検索結果として得ることができる。図5には、具体的な一例として、「ラーメン」を検索クエリとして発話データベース36から得られる発話リストを示す。また、図6には、具体的な一例として、「ラーメン」及びシステムの対話行為である「5:自己開示評価+」を検索クエリとして発話データベース36から得られる発話リストを示す。
The
発話サーチ部32が生成する発話候補46は、関連発話選択部26(第2モジュール)が生成する発話候補46に比べて、ユーザとの対話における話題に直接対応する発話を用いて応答できるとは限らないが、適切な検索結果が得られることにより、話題に即した応答を実現することができる。
The
バーサタイル発話選択部38は、発話リスト40から発話を選択することで発話候補46を生成する機能を有する。一般に、「バーサタイル」とは、多様という意味であり、種々の意味を含むという意味である。そのため、どのような意味にでも解釈でき、いつ発話しても文脈上大きな問題の起きにくい発話のことを、本実施の形態では、「バーサタイル発話」という。
The versatile
発話リスト40は、ユーザとの対話における現在の話題によらず、いつ発話しても対話の内容に大きな影響を与えない複数の発話からなる発話リストである。バーサタイル発話を発話リスト40に格納しておくことにより、対話システム10は発話に窮した場合にこれらの発話を用いてその場を繋ぐことが可能となる。発話リスト40には、例えば、「はい」や「ええ」のような相槌や、具体的な内容を持たない、「すごいですね」や「いいですね」等の共感を表す発話等が格納されている。発話リスト40は、例えば手作業により予め作成されてものである。図7には、本実施の形態の発話リスト40の具体的な一例を示す。なお、本実施の形態では、発話の対話行為を各発話に付与して発話リスト40に格納している。発話の対話行為は、上述の対話行為推定器16と同様の対話行為推定器を用いて推定した対話行為を付与すればよい。
The
バーサタイル発話選択部38は、発話リスト40から発話を選択することで発話候補46を生成する。なお、バーサタイル発話選択部38は、発話リスト40の全体を発話候補46としてもよいし、発話リスト40の中から一つ以上を適宜選択して発話候補46としてもよい。また、本実施の形態では、発話の対話行為を当該発話に付与して発話リスト40に格納している。また、本実施の形態のバーサタイル発話選択部38では、システムの対話行為が入力された場合は、発話リスト40から、システムの対話行為と一致する対話行為が付与された発話を選択し、発話候補46を生成する。
The versatile
バーサタイル発話選択部38が生成する発話候補46は、発話ペア選択部22(第1モジュール)、関連発話選択部26(第2モジュール)、及び発話サーチ部32(第3モジュール)のようにユーザ発話や、ユーザとの対話における現在の話題に即した発話は応答できないが、現在の話題を継続することができる応答を実現することができる。
The
新規話題発話選択部42は、発話リスト44から発話を選択することで発話候補46を生成する機能を有する。
The new topic
発話リスト44は、ユーザとの対話における現在の話題を変更するために、新規な話題にユーザを誘導するための発話が含まれた発話リストである。発話リスト44は例えば手作業により予め作成したものである。図8には、本実施の形態の発話リスト44の具体的な一例を示す。なお、本実施の形態では、発話の対話行為を各発話に付与して発話リスト44に格納している。発話の対話行為は、上述の対話行為推定器16と同様の対話行為推定器を用いて推定した対話行為を付与すればよい。
The
新規話題発話選択部42は、発話リスト44から発話を選択することで発話候補46を生成する。なお、新規話題発話選択部42は、発話リスト44の全体を発話候補46としてもよいし、発話リスト44の中から一つ以上を適宜選択して発話候補46としてもよい。また、本実施の形態の新規話題発話選択部42では、システムの対話行為が入力された場合は、発話リスト44から、入力されたシステムの対話行為と一致する対話行為が付与された発話を選択し、発話候補46を生成する。
The new topic
新規話題発話選択部42が生成する発話候補46は、発話ペア選択部22(第1モジュール)、関連発話選択部26(第2モジュール)、発話サーチ部32(第3モジュール)、及びバーサタイル発話選択部38(第4モジュール)とは異なり、新規な話題にユーザを誘導する応答を行うことにより、ユーザ発話や、ユーザとの対話における現在の話題に即した応答ができない状況を打開することができる応答を実現することができる。
The
次に、本実施の形態の発話候補生成装置20の動作の流れについて説明する。本実施の形態の発話候補生成装置20では、複数(第1〜第5)のモジュールを使い分けることにより、常にユーザ発話に応じて適切な、質が高い応答を行っている。また、本実施の形態の発話候補生成装置20では、第1モジュール(発話ペア選択部22)から第5モジュール(新規話題発話選択部42)の順で順次、発話候補46を生成する。このような順番で発話候補46を生成することにより、ユーザ発話に対して、より適切な応答ができるモジュールの順で順次、発話候補46を生成するため、ユーザの発話に対して、より的確な応答を実現することが可能となっている。なお、発話候補46を生成するモジュールの順番は、本実施の形態の順番に限定されないが、上述の理由から、本実施の形態のように、番号が小さいモジュールから大きいモジュールへ進む順番とすることが好ましい。
Next, the flow of operation of the utterance
図9及び図10には、発話候補生成装置20における発話候補生成処理の流れの一例のフローチャートを示す。当該発話候補生成処理は、入力部12からユーザ発話及び対話履歴が発話候補生成装置20に入力されると実行される。なお、対話履歴の入力は必須ではないが、入力された一つのユーザ発話から話題を示す単語を抽出できなかった場合等、各モジュールが、発話候補46を生成できない場合に、入力されたユーザ発話に替わり、当該ユーザ発話より過去に発話されたユーザ発話を用いて発話候補46を生成することができるため、本実施の形態のように、対話履歴を入力することが好ましい。
FIG. 9 and FIG. 10 show a flowchart of an example of the flow of the utterance candidate generation process in the utterance
まず、発話ペア選択部22が、発話候補46の生成を行う。そのため、ステップS100では、発話ペア選択部22にユーザ発話が入力される。次のステップS102では、発話ペア選択部22が、入力されたユーザ発話に一致するユーザ発話を含む発話ペアが発話ペア24に格納されているか否か判断する。なお、本実施の形態では、発話ペア選択部22は、完全一致のみではなく、一致するとみなされるユーザ発話を含む発話ペアが発話ペア24に格納されているか否か判断している。具体的には、例えば、編集距離や単語集合の類似度を用いて、予め設けておいた閾値に基づいて当該閾値を超えるか否かにより、一致するか否かを判断している。このように発話ペア選択部22は、入力されたユーザ発話に完全に一致するユーザ発話を含む発話ペアのみではなく、一致するとみなされるユーザ発話を含む発話ペアが発話ペア24に格納されているか否か判断することが好ましい。
First, the utterance
入力されたユーザ発話に一致するユーザ発話を含む発話ペアが発話ペア24に格納されていない場合は、発話候補46が生成できないため、次のモジュール(本実施の形態では関連発話選択部26)による発話候補46の生成を行うために、ステップS112へ進む。一方、入力されたユーザ発話に一致するユーザ発話を含む発話ペアが発話ペア24に格納されている場合は、ステップS104へ進む。
If an utterance pair including a user utterance that matches the input user utterance is not stored in the
ステップS104では、対話制御部14から入力された対話行為が有るか否か判断する。対話行為が有る場合は、ステップS106へ進み、入力されたユーザ発話と対話行為と一致する発話ペアから発話候補46を生成した後、ステップS110へ進む。具体的には、発話ペア24から、入力されたユーザ発話を含み、かつ入力された対話行為が付与された発話ペアを抽出し、抽出した発話ペアの応答を発話候補46として生成する。一方、対話行為が無い場合は、ステップS104からステップS108へ進む。ステップS108では、入力されたユーザ発話と一致する発話ペアから発話候補46を生成した後、ステップS110へ進む。具体的には、発話ペア24から、入力されたユーザ発話と一致するユーザ発話を含む発話ペアを抽出し、抽出した発話ペアの応答を発話候補46として生成する。
In step S104, it is determined whether or not there is a dialogue action input from the
ステップS110では、次のモジュールで発話候補46を生成するか否か判断する。本実施の形態では、上述したように、第1モジュール(発話ペア選択部22)から第5モジュール(新規話題発話選択部42)の順で順次、発話候補46を生成するが、全てのモジュールで発話候補46を生成しないようにしてもよい。例えば、一つ以上のモジュールをスキップしてもよいし、予め定められた数以上の応答や発話を含む発話候補46を生成した時点で、後段のモジュールによる発話候補46の生成を行わないようにしてもよい。これらの場合は、予め発話候補生成装置20内に発話候補46の生成について設定しておき、設定に応じて、各モジュールで発話候補46の生成を行うか否か判断するようにすればよい。
In step S110, it is determined whether or not the
また、本実施の形態では、発話ペア選択部22で、対話行為として「相槌」が付与されている応答のみを発話候補46として生成した場合は、次のモジュールで発話候補46を生成するように判断している。
In the present embodiment, when the utterance
ステップS110では、設定等に応じて、次のモジュールで発話候補46を生成しない場合は、ステップS162へ進む。一方、次のモジュールで発話候補46を生成する場合は、ステップS112へ進む。なお、本実施の形態の発話候補生成装置20では、順次、後段のモジュールで発話候補46を生成するため次の番号のモジュールで発話候補46を生成するようにしているが、上述したようにモジュールをスキップするように設定されている場合は、設定先のモジュールで発話候補46を生成するようにする。
In step S110, if the
次に、関連発話選択部26が、発話候補46の生成を行う。そのため、ステップS112では、関連発話選択部26にユーザ発話が入力される。次のステップS114では、関連発話選択部26によりユーザ発話の形態素解析を行い、入力されたユーザ発話から、話題を示す単語を抽出する。
Next, the related
次のステップS116では、抽出した単語と一致する単語に対応した発話が単語−発話ペア30に有るか否か判断する。抽出した単語と一致する単語に対応した発話が単語−発話ペア30に無い場合は、ステップS126へ進む。一方、抽出した単語と一致する単語に対応した発話が単語−発話ペア30に有る場合は、ステップS118へ進む。
In the next step S116, it is determined whether or not the word-
ステップS118では、対話制御部14から入力された対話行為が有るか否か判断する。対話行為が有る場合は、ステップS120へ進み、抽出した単語と入力された対話行為とに一致する発話から発話候補46を生成した後、ステップS124へ進む。具体的には、単語−発話ペア30から、抽出された単語と一致する単語に対応し、かつ入力された対話行為と一致する対話行為が付与された発話を抽出し、抽出した発話を発話候補46として生成する。一方、対話行為が無い場合は、ステップS118からステップS122へ進む。ステップS122では、抽出した単語と一致する単語に対する発話から発話候補46を生成した後、ステップS124へ進む。具体的には、単語−発話ペア30から、抽出された単語と一致する単語に対応する発話を抽出し、抽出した発話により発話候補46として生成する。
In step S118, it is determined whether or not there is a dialogue action input from the
次のステップS124では、上述したステップS110と同様に、次のモジュールで発話候補46を生成するか否か判断する。次のモジュールで発話候補46を生成しない場合は、ステップS162へ進む。一方、次のモジュールで発話候補46を生成する場合は、ステップS126へ進む。
In the next step S124, as in step S110 described above, it is determined whether or not the
次に、発話サーチ部32が、発話候補46の生成を行う。そのため、ステップS126では、発話サーチ部32にユーザ発話が入力される。次のステップS128では、発話サーチ部32によりユーザ発話の形態素解析を行い、ユーザ発話から単語を抽出する。
Next, the
次のステップS130では、対話制御部14から入力された対話行為が有るか否か判断する。対話行為が有る場合は、ステップS132へ進み、ステップS132では、抽出した単語と入力された対話行為とにより検索クエリを構成する。一方、対話制御部14から入力された対話行為が無い場合は、ステップS134へ進み、ステップS134では、抽出した単語により検索クエリを構成する。さらに次のステップS136では、当該検索クエリを用いて、発話データベース36を検索し、検索結果を取得する。
In the next step S <b> 130, it is determined whether or not there is a dialogue action input from the
次のステップS138では、検索結果に発話が含まれているか否か判断する。検索結果に発話が含まれていない場合、すなわち検索結果が0件であった場合は、ステップS144へ進む。一方、検索結果に発話が含まれている場合、すなわち検索結果が0件で無い場合は、ステップS140へ進む。ステップS140では、検索結果に含まれる発話からなる発話リストから、発話候補46を生成した後、ステップS142へ進む。
In the next step S138, it is determined whether or not an utterance is included in the search result. If the search result does not include an utterance, that is, if the search result is zero, the process proceeds to step S144. On the other hand, if the search result includes an utterance, that is, if the search result is not 0, the process proceeds to step S140. In step S140, the
ステップS142では、上述したステップS110と同様に、次のモジュールで発話候補46を生成するか否か判断する。次のモジュールで発話候補46を生成しない場合は、ステップS162へ進む。一方、次のモジュールで発話候補46を生成する場合は、ステップS144へ進む。
In step S142, as in step S110 described above, it is determined whether or not to generate the
次に、バーサタイル発話選択部38が、発話候補46の生成を行う。そのため、ステップS144では、バーサタイル発話選択部38にユーザ発話が入力される。次のステップS146では、対話制御部14から入力された対話行為が有るか否か判断する。対話行為が有る場合は、ステップS148へ進み、ステップS148では、発話リスト40と入力された対話行為とから発話候補46を生成する。具体的には、発話リスト40から、入力された対話行為と一致する対話行為が付与された発話を選択して発話候補46を生成する。一方、対話制御部14から入力された対話行為が無い場合は、ステップS150へ進み、発話リスト40から発話候補46を生成する。
Next, the versatile
次のステップS152では、上述したステップS110と同様に、次のモジュールで発話候補46を生成するか否か判断する。次のモジュールで発話候補46を生成しない場合は、ステップS162へ進む。一方、次のモジュールで発話候補46を生成する場合は、ステップS154へ進む。
In the next step S152, as in step S110 described above, it is determined whether or not to generate the
次に、新規話題発話選択部42が、発話候補46の生成を行う。そのため、ステップS154では、新規話題発話選択部42にユーザ発話が入力される。次のステップS156では、対話制御部14から入力された対話行為が有るか否か判断する。対話行為が有る場合は、ステップS158へ進み、ステップS158では、発話リスト44と入力された対話行為とから発話候補46を生成する。具体的には、発話候補46から、入力された対話行為と一致する対話行為が付与された発話を選択して発話候補46を生成する。一方、対話制御部14から入力された対話行為が無い場合は、ステップS160へ進み、発話リスト44から発話候補46を生成する。
Next, the new topic
次のステップS162では、各モジュールにより生成された発話候補46を出力部18へ出力した後、本処理を終了する。なお、本実施の形態では、このように各モジュールで生成された発話候補46をまとめて出力部18に出力しているがこれに限らず、各モジュールで生成された発話候補46を順次、出力部18に出力するようにしてもよい。
In the next step S162, the
出力部18は、発話候補生成装置20で生成され、出力された発話候補46から発話を選択しユーザに対して応答する。
The
また、本実施の形態の対話システム10では、内容がない発話(応答)のみを応答しないように、対話としての内容が不十分であるとみなされる「相槌」等の対話行為が付与された発話(応答)のみを用いた応答をしないようにしている。具体的には、本実施の形態の対話システム10の出力部18により、対話行為として「相槌」が付与されている発話(応答)を発話候補46から選択してユーザに対して応答した場合は、続けて別の発話を発話候補46から選択してユーザに対して応答するようにする。なお、対話システム10において、「相槌」等の対話行為が付与された発話のみを応答しないようにする方法としては、特に限定されないが、例えば、このような発話(応答)に対してフラグを付与して発話候補46を生成しておき、出力部18は、当該フラグが付与された発話を発話候補46から選択してユーザに対して応答した場合は、続けて別の発話を発話候補46から選択してユーザに対して応答すればよい。
Further, in the
対話システム10によって、図11に示した対話例のような対話が行われる。
The
図11には、ユーザと対話システム10との間で実現できる対話の具体例を示す。図11に示した対話例では、まず、対話システム10(system)が、システムのプロンプト(初期発話)である、「こんにちは」をユーザに提示する。
FIG. 11 shows a specific example of a dialog that can be realized between the user and the
当該提示に応じて、ユーザ(you)が、「どうも」とユーザ発話を行うと、当該ユーザ発話入力部12から発話候補生成装置20に入力される。当該ユーザ発話に応じて、当該ユーザ発話に応じて発話ペア選択部22が発話ペア24から選択された応答により生成された発話候補46から出力部18が選択した「いえいえ」をユーザに対して発話する。
In response to the presentation, when the user (you) makes a user utterance “Tomo”, the user is input from the user
さらに、当該応答に対して、ユーザが「イタリア行きたいな」とユーザ発話を行うと、当該ユーザ発話が入力部12から発話候補生成装置20に入力される。このようにユーザが発話を行うと、順次、ユーザ発話が入力部12から発話候補生成装置20に入力され、各モジュールで、上述したように入力されたユーザ発話や対話履歴を参照して、発話候補46が生成される。出力部18は、生成された発話候補46から発話を選択してユーザに対して応答する。
Further, when the user utters “I want to go to Italy” in response to the response, the user utterance is input from the
図11に示した対話例では、「イタリア行きたいな」というユーザ発話に対して、出力部18は、関連発話選択部26(第2モジュール)が生成した発話候補46から選択した「イタリア行くの?」を応答する。また、「行きたい」というユーザ発話に対して、出力部18は、発話ペア選択部22(第1モジュール)が生成した発話候補46から選択した「行きたい」を応答する。また、「だね」というユーザ発話に対して、出力部18は、発話ペア選択部22(第1モジュール)が生成した発話候補46から選択した「うん」を応答する。この場合、「うん」には、対話行為として「相槌」が付与されているため、出力部18は、続けて、関連発話選択部26(第2モジュール)及び発話サーチ部32(第3モジュール)が生成した発話候補46の中から選択した発話サーチ部32が生成した発話候補46による「イタリアワインいいなぁ」を応答する。また、「美味しいよね」というユーザ発話に対して、出力部18は、発話ペア選択部22(第1モジュール)が生成した発話候補46から選択した「うん」を応答する。この場合、「うん」には、対話行為として「相槌」が付与されているため、出力部18は、続けて、関連発話選択部26(第2モジュール)及び発話サーチ部32(第3モジュール)が生成した発話候補46の中から選択した発話サーチ部32が生成した発話候補46による「イタリア料理美味しい」を応答する。また、「パスタも」というユーザ発話に対して、出力部18は、関連発話選択部26(第2モジュール)及び発話サーチ部32(第3モジュール)が生成した発話候補46の中から選択した発話サーチ部32が生成した発話候補46による「イタリアのアイテムはやはりパスタになるんですかね」を応答する。また、「だと思うよ」というユーザ発話に対して、出力部18は、バーサタイル発話選択部38(第4モジュール)が生成した発話候補46から選択した「なるほど」を応答する。さらに、「何がなるほどなの?」というユーザ発話に対して、出力部18は、新規話題発話選択部42(第5モジュール)が生成した発話候補46から選択した「ところで今日は何を食べましたか」を応答する。
In the dialogue example shown in FIG. 11, in response to the user utterance “I want to go to Italy”, the
上記図11では、ユーザ発話が行われる度に、入力部12から発話候補生成装置20にユーザ発話が入力され、各モジュールで発話候補46を生成し、生成された発話候補46から選択した発話により出力部18がユーザに対して応答を行っている。なお、出力部18は、ユーザとの対話における所定のタイミング(例えば、話題が変わったとみなせるタイミング)まで、発話候補生成装置20が生成した発話候補46から発話を繰り返し選択してユーザに対して応答するようにしてもよい。
In FIG. 11, each time a user utterance is performed, a user utterance is input from the
以上説明したように、本実施の形態の対話システム10では、ユーザとの対話において、入力部12からユーザ発話が発話候補生成装置20に入力される。また、対話制御部14がユーザ発話の対話行為を対話行為推定器16により推定し、推定した結果に応じて決定した対話システム10の対話行為を発話候補生成装置20に出力する。発話候補生成装置20では、発話ペア選択部22、関連発話選択部26、発話サーチ部32、バーサタイル発話選択部38、及び新規話題発話選択部42が、順次、入力されたユーザ発話及び対話行為に応じた発話候補46を生成する。発話ペア選択部22は、入力されたユーザ発話に応じて発話ペア24から選択された応答により発話候補46を生成する。関連発話選択部26は、入力されたユーザ発話を形態素解析器28により形態素解析して、話題を示す単語を抽出し、抽出した単語に対応し、かつ入力された対話行為が付与された発話を単語−発話ペア30から取得して発話候補46を生成する。発話サーチ部32は、入力されたユーザ発話を形態素解析器34により形態素解析して、単語を抽出し、抽出した単語及び入力された対話行為を検索クエリとして発話データベース36を検索して、検索結果に基づいて発話候補46を生成する。バーサタイル発話選択部38は、入力された対話行為と一致する対話行為が付与された発話を発話リスト40から選択して、発話候補46を生成する。新規話題発話選択部42は、入力された対話行為と一致する対話行為が付与された発話を発話リスト44から選択して、発話候補46を生成する。出力部18は、発話候補生成装置20で生成され、出力された発話候補46から発話を選択しユーザに対して応答する。
As described above, in the
このように、本実施の形態の対話システム10の発話候補生成装置20では、ユーザ発話に対応し、ユーザ発話に対してより適切な発話候補46を生成するモジュールから順に、発話候補46を生成することができる。また、発話候補生成装置20では、複数のモジュールを備えることで、発話の質が異なる発話候補46を生成することができる。従って、対話システム10においてユーザ発話に応じて適切な応答を行うことができる。
As described above, the utterance
これにより、質の高い応答を行う対話システム10を実現することができる。雑談等の対話は人間同士では会話の潤滑油として用いられる。質の高い対話を実現可能にすることによって、人間と対話システムとのやりとりがより円滑になり、コンピュータとユーザの共同作業の効率を高めることができる。
Thereby, the
なお、本実施の形態では、5つのモジュール(発話ペア選択部22、関連発話選択部26、発話サーチ部32、バーサタイル発話選択部38、及び新規話題発話選択部42)を備えているがこれに限らず、これらのうち、少なくとも2つ以上備えて入ればよい。
In the present embodiment, five modules (the utterance
また、本実施の形態に限らず、発話ペア24、単語−発話ペア30、発話データベース36、発話リスト40、及び発話リスト44は、発話候補生成装置20の外部に備えられていてもよい。
In addition, the
また、本実施の形態について図面を参照して詳述に説明したが、本実施の形態は一例であり、具体的な構成は本実施の形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計等も含まれ、状況に応じて変更可能であることは言うまでもない。 Although the present embodiment has been described in detail with reference to the drawings, the present embodiment is an example, and the specific configuration is not limited to the present embodiment, and departs from the gist of the present invention. Needless to say, the range of designs that are not included is included and can be changed according to the situation.
10 対話システム
22 発話ペア選択部
24 発話ペア
26 関連発話選択部
30 単語-発話ペア
32 発話サーチ部
36 発話データベース
38 バーサタイル発話選択部
40 発話リスト
42 新規話題発話選択部
44 発話リスト
DESCRIPTION OF
Claims (4)
ユーザ発話と前記ユーザ発話に対する応答とからなる予め定められた複数の発話ペアから、入力されたユーザ発話と一致すると判断される発話ペアを選択し、選択された発話ペアの前記応答を用いて、発話候補を生成する第1モジュール、
ユーザ発話の話題を表す単語の各々について予め定められた、前記単語に関連する関連語を用いた発話から、前記入力されたユーザ発話から抽出される前記ユーザ発話の話題を表す単語に関連する前記関連語を用いた発話を選択し、選択した前記発話を用いて発話候補を生成する第2モジュール、
複数の発話を格納した発話データベースから、前記入力されたユーザ発話から抽出される単語を用いた検索クエリで検索し、前記検索された発話を用いて発話候補を生成する第3モジュール、
予め定められた、ユーザ発話の話題によらず発話可能と判断される複数の発話のうちの少なくとも1つの発話を用いて発話候補を生成する第4モジュール、及び
予め定められた、ユーザ発話の話題を変更するための複数の発話のうちの少なくとも1つの発話を用いて発話候補を生成する第5モジュールを備え、
前記第1モジュールによって前記発話候補が生成されない場合に、前記第2モジュールへ進み、前記第2モジュールによって前記発話候補が生成されない場合に、前記第3モジュールへ進み、前記第3モジュールによって前記発話候補が生成されない場合に、前記第4モジュールへ進むことにより、前記第1モジュールによって生成された前記発話候補、前記第2モジュールによって生成された前記発話候補、前記第3モジュールによって生成された前記発話候補、前記第4モジュールによって生成された前記発話候補、及び前記第5モジュールによって生成された前記発話候補の順に優先して、前記発話候補を出力する、発話候補生成装置。 An utterance candidate generation device that generates an utterance candidate for use in a response in a dialog system that interacts with a user by responding to a user utterance,
From a plurality of predetermined utterance pairs consisting of a user utterance and a response to the user utterance, select an utterance pair determined to match the input user utterance, and using the response of the selected utterance pair, A first module for generating utterance candidates;
The word related to the word representing the topic of the user utterance extracted from the input user utterance from the utterance using the related word related to the word predetermined for each word representing the topic of the user utterance. A second module for selecting an utterance using a related word and generating an utterance candidate using the selected utterance;
A third module that searches an utterance database storing a plurality of utterances using a search query using a word extracted from the input user utterance and generates an utterance candidate using the searched utterance;
A fourth module that generates an utterance candidate using at least one utterance of a plurality of utterances determined to be utterable regardless of a predetermined user utterance topic, and a predetermined user utterance topic comprising a fifth module for generating an utterance candidate with at least one utterance of a plurality of utterances for changing,
If the utterance candidate is not generated by the first module, the process proceeds to the second module. If the utterance candidate is not generated by the second module, the process proceeds to the third module, and the utterance candidate is generated by the third module. Is not generated, the utterance candidate generated by the first module, the utterance candidate generated by the second module, and the utterance candidate generated by the third module by proceeding to the fourth module An utterance candidate generation device that outputs the utterance candidates in preference to the utterance candidates generated by the fourth module and the utterance candidates generated by the fifth module .
第1モジュールにより、ユーザ発話と前記ユーザ発話に対する応答とからなる予め定められた複数の発話ペアから、入力されたユーザ発話と一致する発話ペアを選択し、選択された発話ペアの前記応答を用いて、発話候補を生成するステップ、
第2モジュールにより、ユーザ発話の話題を表す単語の各々について予め定められた、前記単語に関連する関連語を用いた発話から、前記入力されたユーザ発話から抽出される前記ユーザ発話の話題を表す単語に関連する前記関連語を用いた発話を選択し、選択した前記発話を用いて発話候補を生成するステップ、
第3モジュールにより、複数の発話を格納した発話データベースから、前記入力されたユーザ発話から抽出される単語を用いた検索クエリで検索し、前記検索された発話を用いて発話候補を生成するステップ、
第4モジュールにより、予め定められた、ユーザ発話の話題によらず発話可能な複数の発話のうちの少なくとも1つの発話を用いて発話候補を生成するステップ、及び
第5モジュールにより、予め定められた、ユーザ発話の話題を変更するための複数の発話のうちの少なくとも1つの発話を用いて発話候補を生成するステップを備え、
前記第1モジュールによって前記発話候補が生成されない場合に、前記第2モジュールへ進み、前記第2モジュールによって前記発話候補が生成されない場合に、前記第3モジュールへ進み、前記第3モジュールによって前記発話候補が生成されない場合に、前記第4モジュールへ進むことにより、前記第1モジュールによって生成された前記発話候補、前記第2モジュールによって生成された前記発話候補、前記第3モジュールによって生成された前記発話候補、前記第4モジュールによって生成された前記発話候補、及び前記第5モジュールによって生成された前記発話候補の順に優先して、前記発話候補を出力する、発話候補生成方法。 An utterance candidate generation method for generating an utterance candidate for use in a response in a dialog system that interacts with a user by responding to a user utterance,
The first module selects an utterance pair that matches the input user utterance from a plurality of predetermined utterance pairs including a user utterance and a response to the user utterance, and uses the response of the selected utterance pair Generating utterance candidates,
The second module represents the topic of the user utterance extracted from the input user utterance from the utterance using a related word related to the word, which is predetermined for each word representing the topic of the user utterance. Selecting an utterance using the related word related to a word, and generating an utterance candidate using the selected utterance;
Searching with a search query using a word extracted from the input user utterance from an utterance database storing a plurality of utterances according to the third module, and generating utterance candidates using the searched utterances;
A step of generating an utterance candidate using at least one utterance of a plurality of utterances that can be uttered regardless of a topic of user utterance determined in advance by the fourth module; and predetermined by a fifth module Generating an utterance candidate using at least one utterance of a plurality of utterances for changing the topic of the user utterance ,
If the utterance candidate is not generated by the first module, the process proceeds to the second module. If the utterance candidate is not generated by the second module, the process proceeds to the third module, and the utterance candidate is generated by the third module. Is not generated, the utterance candidate generated by the first module, the utterance candidate generated by the second module, and the utterance candidate generated by the third module by proceeding to the fourth module The utterance candidate generation method of outputting the utterance candidate in preference to the utterance candidate generated by the fourth module and the utterance candidate generated by the fifth module .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013101382A JP5728527B2 (en) | 2013-05-13 | 2013-05-13 | Utterance candidate generation device, utterance candidate generation method, and utterance candidate generation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013101382A JP5728527B2 (en) | 2013-05-13 | 2013-05-13 | Utterance candidate generation device, utterance candidate generation method, and utterance candidate generation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014222402A JP2014222402A (en) | 2014-11-27 |
JP5728527B2 true JP5728527B2 (en) | 2015-06-03 |
Family
ID=52121904
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013101382A Active JP5728527B2 (en) | 2013-05-13 | 2013-05-13 | Utterance candidate generation device, utterance candidate generation method, and utterance candidate generation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5728527B2 (en) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6257368B2 (en) * | 2014-02-18 | 2018-01-10 | シャープ株式会社 | Information processing device |
JP2017021125A (en) * | 2015-07-09 | 2017-01-26 | ヤマハ株式会社 | Voice interactive apparatus |
JP6730090B2 (en) * | 2016-05-19 | 2020-07-29 | 国立大学法人東北大学 | Dialog processing device |
JP6719741B2 (en) * | 2016-05-20 | 2020-07-08 | 日本電信電話株式会社 | Dialogue method, dialogue device, and program |
JP6910002B2 (en) * | 2016-06-23 | 2021-07-28 | パナソニックIpマネジメント株式会社 | Dialogue estimation method, dialogue activity estimation device and program |
JP6671020B2 (en) * | 2016-06-23 | 2020-03-25 | パナソニックIpマネジメント株式会社 | Dialogue act estimation method, dialogue act estimation device and program |
JP2018021987A (en) * | 2016-08-02 | 2018-02-08 | ユニロボット株式会社 | Conversation processing device and program |
JP6697373B2 (en) | 2016-12-06 | 2020-05-20 | カシオ計算機株式会社 | Sentence generating device, sentence generating method and program |
CN108288468B (en) * | 2017-06-29 | 2019-07-19 | 腾讯科技(深圳)有限公司 | Audio recognition method and device |
JP2018198097A (en) * | 2018-09-20 | 2018-12-13 | カシオ計算機株式会社 | Sentence generation device, sentence generation method, and program |
EP3859568A4 (en) * | 2018-09-28 | 2021-09-29 | Fujitsu Limited | Dialogue device, dialogue method and dialogue program |
JP7212888B2 (en) * | 2019-05-20 | 2023-01-26 | 日本電信電話株式会社 | Automatic dialogue device, automatic dialogue method, and program |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3472194B2 (en) * | 1999-05-25 | 2003-12-02 | 日本電信電話株式会社 | Automatic response method and device, and medium recording the program |
JP4027550B2 (en) * | 1999-11-04 | 2007-12-26 | 株式会社リコー | Electronic conference system |
JP2001175657A (en) * | 1999-12-21 | 2001-06-29 | Ricoh Co Ltd | Natural language conversation device and its method and storage medium |
JP2001188782A (en) * | 1999-12-28 | 2001-07-10 | Sony Corp | Device and method for processing information and recording medium |
JP2001357053A (en) * | 2000-06-12 | 2001-12-26 | Matsushita Electric Ind Co Ltd | Dialog device |
US6731307B1 (en) * | 2000-10-30 | 2004-05-04 | Koninklije Philips Electronics N.V. | User interface/entertainment device that simulates personal interaction and responds to user's mental state and/or personality |
JP2004145541A (en) * | 2002-10-23 | 2004-05-20 | Inosu:Kk | Chat system |
JP4826275B2 (en) * | 2006-02-16 | 2011-11-30 | 株式会社豊田中央研究所 | Response generating apparatus, method, and program |
JP5300497B2 (en) * | 2009-01-07 | 2013-09-25 | 株式会社東芝 | Dialogue device, dialogue program, and dialogue method |
-
2013
- 2013-05-13 JP JP2013101382A patent/JP5728527B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014222402A (en) | 2014-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5728527B2 (en) | Utterance candidate generation device, utterance candidate generation method, and utterance candidate generation program | |
Zhong et al. | Knowledge-enriched transformer for emotion detection in textual conversations | |
CN110209897B (en) | Intelligent dialogue method, device, storage medium and equipment | |
CN108763510B (en) | Intention recognition method, device, equipment and storage medium | |
CN107944027B (en) | Method and system for creating semantic key index | |
Malandrakis et al. | Distributional semantic models for affective text analysis | |
Ma et al. | Challenging reading comprehension on daily conversation: Passage completion on multiparty dialog | |
US11113335B2 (en) | Dialogue system and computer program therefor | |
US20140122407A1 (en) | Chatbot system and method having auto-select input message with quality response | |
WO2018169001A1 (en) | Interactive system, interactive device and computer program therefor | |
KR20160026892A (en) | Non-factoid question-and-answer system and method | |
JP2015219583A (en) | Topic determination device, utterance device, method, and program | |
CN110555440B (en) | Event extraction method and device | |
CN112632242A (en) | Intelligent conversation method and device and electronic equipment | |
JP2016001242A (en) | Question sentence creation method, device, and program | |
Young et al. | A microtext corpus for persuasion detection in dialog | |
KR101333485B1 (en) | Method for constructing named entities using online encyclopedia and apparatus for performing the same | |
JP2014219872A (en) | Utterance selecting device, method and program, and dialog device and method | |
CN109408621B (en) | Dialogue emotion analysis method and system | |
Dehghani et al. | Sentiment analysis of Persian political tweets using ParsBERT embedding model with convolutional neural network | |
Malandrakis et al. | Sail: Sentiment analysis using semantic similarity and contrast features | |
Ye et al. | A sentiment based non-factoid question-answering framework | |
JP6220762B2 (en) | Next utterance candidate scoring device, method, and program | |
JP5258056B2 (en) | Question sentence candidate presentation device | |
Kumar et al. | Empowering multilingual insensitive language detection: Leveraging transformers for code-mixed text analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140902 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150310 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150406 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5728527 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |