WO2022249946A1

WO2022249946A1 - 対話装置及びその訓練装置

Info

Publication number: WO2022249946A1
Application number: PCT/JP2022/020648
Authority: WO
Inventors: 健太郎鳥澤; 龍飯田; 淳太水野; 鍾勲呉; ジュリアンクロエツェー; 仁彦淺尾; まな鎌倉
Original assignee: 国立研究開発法人情報通信研究機構
Priority date: 2021-05-28
Filing date: 2022-05-18
Publication date: 2022-12-01
Also published as: JPWO2022249946A1

Abstract

訓練データ生成装置５４及び訓練装置５６は、対話装置への入力として想定される複数個の想定入力を記憶する想定入力記憶部７８と、複数の因果関係表現を記憶する拡張因果関係ＤＢ７４と、想定入力記憶部７８に記憶された複数個の想定入力の各々について、当該想定入力として所定の関係を持つ因果関係表現を複数の因果関係表現から抽出し、当該想定入力を入力、抽出された因果関係表現を回答とする訓練データサンプルを作成して訓練データ記憶部８４に記憶する訓練データ作成部８２と、自然言語の入力文に対して出力文を生成するよう設計された応答生成ニューラルネットワーク１００を、訓練データ記憶部８４に記憶された訓練データサンプルを使用して訓練するための訓練部８６とを含む。

Description

対話装置及びその訓練装置

　この発明はコンピュータを用いてユーザと対話する対話装置及びその訓練装置、並びにコンピュータプログラムに関し、特に、ユーザ入力から話題を発展させることが可能な対話装置、及びそのように対話装置を訓練する訓練装置に関する。この出願は2021年5月28日出願の日本出願第2021-090300号に基づく優先権を主張し、前記日本出願に記載された全ての記載内容を援用するものである。

　近年、深層学習に基づく対話システム研究への関心が高まり、多様な対話システム技術の研究開発が進められている。従来の対話システム技術は大きく以下の３つに分類できる。

　１）検索ベースのアプローチで、ユーザ入力を受けて、対話のためのものとは限らない何らかのデータベースからそのユーザ入力から得た情報に基づいて情報検索し、その結果を利用するもの。検索結果の選択及び加工には深層学習の技術が使われることがある。

　２）ユーザ入力から応答文を自動生成するもの。深層学習を用いたｅｎｄ－ｔｏ－ｅｎｄの手法はこれに該当する。後掲の特許文献１がこの手法を採用している。この手法では、オンラインのチャットサービスなどの対話ログから対話データを取得する。この対話データを用いて、入力に対する応答をシステムが自動的に生成するように、主に深層学習の技術を用いた学習を行う。

　３）シナリオベースのアプローチによるもの。いわゆるＡＩ（Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ）スピーカの多くはこの手法を採用している。

特開２０１８－１５６２７２号公報

　上記１番目の手法では、応答として得られる情報はあくまでデータベースの範囲内にとどまる。しかもユーザ入力と応答との関係がユーザにとって明確とはいえず、ユーザとの対話が発展しないという問題がある。

　上記２番目の手法では、応答として出力される生成結果を制御できないという問題がある。もともと深層学習では、入力から応答を生成する過程が外からは見えないという問題がある。そのため、応答を制御しようとしてもどのようにすればよいかが明確でない。さらにこの手法では、大量の対話データを収集する必要がある。そのカバーする範囲も広いものである必要がある。一般にそのようなデータの収集は極めて困難であることが知られている。

　そのため、上記２番目の手法では、ユーザからの入力に対して会話を発展させるような応答を生成させるように応答装置の訓練を行うことが難しいという問題があった。

　さらに３番目の手法では、準備されたシナリオの範囲内に応答がとどまるという制約がある。その制約の中で対話を発展させようとしても自ずから限界がある。

　したがって、この発明は、ユーザの入力に対して話題を発展させることができるような応答を出力可能な対話装置、及びそのように対話装置を訓練する訓練装置を提供することを主な目的とする。

　本発明の第１の局面に係る対話装置の訓練装置は、各々が対話装置への入力として想定される、複数個の想定入力を記憶する想定入力記憶手段と、複数の因果関係表現を記憶する因果関係記憶手段と、を含み、複数の因果関係表現の各々は、原因表現と結果表現とを含み、想定入力記憶手段に記憶された複数個の想定入力の各々について、当該想定入力として所定の関係を持つ因果関係表現を複数の因果関係表現から抽出するための因果関係表現抽出手段と、当該想定入力を入力、因果関係表現抽出手段により抽出された因果関係表現を回答とする訓練データサンプルを作成し、所定の記憶装置に記憶する訓練データ作成手段と、自然言語の入力文に対して出力文を生成するよう設計された、ニューラルネットワークからなる対話装置を訓練データ作成手段に記憶された訓練データサンプルを使用して訓練するための訓練手段とを含む。

　好ましくは、因果関係表現抽出手段は、想定入力が持つ名詞句を原因表現に持つ因果関係を複数の因果関係表現から抽出するための特定因果関係表現抽出手段を含む。

　より好ましくは、訓練装置は、さらに、単語が与えられると、当該単語の周辺単語の分布確率を、あらかじめ定めた語彙中の単語の各々について出力するようあらかじめ訓練されたトピックワードモデルと、所定の記憶装置に記憶される訓練データサンプルの因果関係表現の各々について、当該因果関係表現に含まれる単語に対する分布確率の高い単語をトピックワードモデルの出力に基づいて特定し、当該訓練データサンプルの入力に付加して新たな訓練データサンプルを生成し所定の記憶装置に追加するための第１の訓練データサンプル追加手段とを含む。

　さらに好ましくは、訓練装置は、さらに、トピックワードモデルの出力に基づいて、所定の記憶装置に記憶される訓練データサンプルの因果関係表現の各々について、当該因果関係表現の周辺単語の分布確率と類似した周辺単語の分布確率を持つ文を所定のコーパスから抽出し、当該訓練データサンプルの入力に付加して新たな訓練データサンプルを生成し所定の記憶装置に追加するための第２の訓練データサンプル追加手段を含む。

　本発明の第２の局面に係るコンピュータプログラムは、コンピュータを、各々が対話装置への入力として想定される、複数個の想定入力を記憶する想定入力記憶手段と、複数の因果関係表現を記憶する因果関係記憶手段として機能させるコンピュータプログラムであって、複数の因果関係表現の各々は、原因表現と結果表現とを含み、コンピュータプログラムは、さらに、コンピュータを、想定入力記憶手段に記憶された複数個の想定入力の各々について、当該想定入力と所定の関係を持つ因果関係表現を複数の因果関係表現から抽出するための因果関係表現抽出手段と、当該想定入力を入力、因果関係表現抽出手段により抽出された因果関係表現を回答とする訓練データサンプルを作成し、所定の記憶装置に記憶する訓練データ作成手段として機能させ、さらに、自然言語の入力文に対して出力文を生成するよう設計された、ニューラルネットワークからなる対話装置を訓練データ作成手段に記憶された訓練データサンプルを使用して訓練するための訓練手段として機能させる。

　本発明の第３の局面に係る対話装置は、自然言語の入力文に対して出力文を生成するよう設計されたニューラルネットワークを含む、自然言語による対話装置であって、ニューラルネットワークは、出力文が、入力文に対する潜在的帰結を表すものとなるように訓練されている。

　好ましくは、対話装置はさらに、入力文が与えられたことに応答して、入力文内の語句に関連する単語又は文を含む表現である関連表現を入力文に付加してニューラルネットワークに入力する関連表現付加手段を含む。

　この発明の第４の局面に係る対話装置は、ユーザの過去の発話を記憶する発話記憶部と、入力された単語に対する周辺単語の生起の確率分布を出力するトピックモデルと、ユーザ発話を入力として、発話記憶部に記憶されたユーザの発話と、トピックモデルとを用いて、ユーザ発話に対する応答を生成するための応答生成部とを含む。

　この発明の第５の局面に係る対話装置は、ユーザの過去の発話を記憶する発話記憶部と、入力された単語に対する周辺単語の生起の確率分布を出力するトピックモデルと、ユーザの発話を入力として、その発話に対する応答を生成する応答生成部と、ユーザの発話に対するトピックモデルの出力により、応答生成部による応答の生成を調整する応答生成調整部とを含む。

　この発明の上記及び他の目的、特徴、局面及び利点は、添付の図面と関連して理解されるこの発明に関する次の詳細な説明から明らかとなるであろう。

図１は、この発明の第１実施形態に係る対話装置を訓練する対話システムのブロック図である。図２は、図１に示す対話装置の一部である訓練データ作成部のブロック図である。図３は、コンピュータを図１に示す対話システムの訓練データの作成装置として機能させるコンピュータプログラムの制御構造を示すフローチャートである。図４は、この発明の第２実施形態に係る対話装置を訓練するための対話システムのブロック図である。図５は、図４に示す訓練データ追加部のブロック図である。図６は、図４に示す関連表現検索部のブロック図である。図７は、コンピュータを、第２実施形態に係る対話システムの訓練データの作成装置として機能させるためのコンピュータプログラムの制御構造を示すフローチャートである。図８は、図７の関連表現追加処理を実現するルーチンの制御構造を示すフローチャートである。図９は、この発明の第３実施形態に係る対話装置及びその対話装置を訓練する訓練装置のブロック図である。図１０は、第３実施形態に係る訓練装置が準備する訓練データの１例を示す模式図である。図１１は、コンピュータを、第３実施形態に係る対話システムの訓練データの作成装置として機能させるためのコンピュータプログラムの制御構造を示すフローチャートである。図１２は、図１１に示す関連単語追加処理を実現するようコンピュータを機能させるコンピュータルーチンの制御構造を示すフローチャートである。図１３は、この発明の第４実施形態に係る対話装置のブロック図である。図１４は、この発明の第５実施形態に係る対話装置のブロック図である。図１５は、上記各実施形態を実現するコンピュータシステムの外観図である。図１６は、図１５に示すコンピュータシステムのハードウェアの構成を示すブロック図である。

　以下の説明及び図面では、同一の部品には同一の参照番号を付してある。したがって、それらについての詳細な説明は繰返さない。

　第１　第１実施形態
　１　構成
　（１）　対話システム５０
　図１にこの発明の第１実施形態に係る対話システム５０の構成をブロック図形式で示す。図１を参照して、対話システム５０は、対話装置５２と、インターネット６０に接続され、インターネット６０から抽出した因果関係表現を用いて対話装置５２を訓練するための訓練データを生成するための訓練データ生成装置５４とを含む。対話システム５０はさらに、訓練データ生成装置５４により生成された訓練データを用いて対話装置５２の訓練を行うための訓練装置５６を含む。

　以下、対話システム５０の各要素についてその構成を説明する。なお、以下の実施形態で使用する自然言語文を構成する各単語は、あらかじめ単語ベクトルに変換されているものとする。すなわち、各自然言語文は単語ベクトルからなる単語ベクトル列として表現されている。

　（２）　対話装置５２
　対話装置５２は、自然言語の文などからなるユーザ入力１０２を受けて応答文を生成する、ニューラルネットワークからなる応答生成ニューラルネットワーク１００を含む。対話装置５２はさらに、応答生成ニューラルネットワーク１００の生成する応答文に対し、ユーザ入力１０２に対する応答として適切な形となるような整形処理を行って応答発話１０６として出力するための発話整形部１０４を含む。

　応答生成ニューラルネットワーク１００は、いわゆるｅｎｄ－ｔｏ－ｅｎｄ型で、自然言語文の入力に対して自然言語文の応答を生成するようあらかじめ事前学習が行われているものを使用する。訓練装置５６による応答生成ニューラルネットワーク１００の訓練は、いわゆるファインチューニングに相当する。

　応答生成ニューラルネットワーク１００としては、トランスフォーマー・エンコーダとトランスフォーマー・デコーダの組み合わせからなる生成用のネットワーク、又はＢＥＲＴを生成用にさらに追加事前学習したＵｎｉＬＭ等を利用することができる。しかしこれらに限らず、任意の生成用のネットワークで応答生成ニューラルネットワーク１００の実装が可能である。また、生成学習用のデータが多くあれば、通常の生成用の学習だけでも実装は可能である。（ＢＥＲＴモデルについては、文献　Jacob　Devlin,　Ming-Wei　Chang,　Kenton　Lee,　and　Kristina　Toutanova.　BERT:　Pre-training　of　deep　bidirectional　transformers　for　language　understanding.を参照）
　（３）　訓練データ生成装置５４
　訓練データ生成装置５４は、インターネット６０から公知の方法により因果関係表現を抽出するための因果関係抽出部６２と、因果関係抽出部６２により抽出された因果関係表現を記憶するための因果関係ＤＢ（Ｄａｔａｂａｓｅ）６４とを含む。訓練データ生成装置５４はさらに、因果関係ＤＢ６４に記憶された因果関係表現の中で、ある因果関係（第１の因果関係）の帰結部と、他の因果関係（第２の因果関係）の原因部とが意味的に一致するときに、第１の因果関係の原因部と第２の因果関係の帰結部とを連鎖させたり、さらにこのようにして生成された新たな因果関係と他の因果関係とを連鎖させたりすることで、新たな因果関係の候補を連鎖的に生成する連鎖因果関係生成部６６と、連鎖因果関係生成部６６により生成された因果関係の候補を記憶するための生成因果関係ＤＢ６８とを含む。因果関係抽出部６２による因果関係の抽出には、例えば、特開２０１８－６０３６４号公報に開示の因果関係の認識手法が利用できる。因果関係を連鎖させて新たな因果関係の候補を生成する手法としては、例えば、特開２０１５－１２１８９７号公報に開示された技術を利用できる。

　訓練データ生成装置５４はさらに、生成因果関係ＤＢ６８に記憶された因果関係の候補の中で適切な因果関係を表すものを選択する連鎖因果関係選択部７０と、連鎖因果関係選択部７０により選択された因果関係を記憶するための連鎖因果関係ＤＢ７２と、因果関係ＤＢ６４に記憶された因果関係、及び連鎖因果関係ＤＢ７２に記憶された因果関係を統合して記憶する拡張因果関係ＤＢ７４とを含む。

　訓練データ生成装置５４はまた、インターネット６０から、対話装置５２に対するユーザ入力１０２になると想定される表現を抽出する想定入力抽出部７６と、想定入力抽出部７６が抽出した想定入力と、コンソール８０から手操作により追加された想定入力とを記憶するための想定入力記憶部７８とを含む。訓練データ生成装置５４はさらに、想定入力記憶部７８に記憶された想定入力のいずれかを入力、拡張因果関係ＤＢ７４に記憶された因果関係の中で想定入力に対する回答となり得る帰結部を持つ因果関係を正解とする訓練データサンプルを作成して訓練装置５６に向けて出力するための訓練データ作成部８２を含む。

　訓練データ作成部８２は、後述するように、想定入力記憶部７８から読み出した想定入力の各々に対し、その想定入力が持つ名詞句を原因部に持つような因果関係を拡張因果関係ＤＢ７４から読み出して訓練データサンプルを作成する。

　図２を参照して、訓練データ作成部８２は、想定入力記憶部７８から想定入力を順番に読み出す想定入力読出部１５０と、想定入力読出部１５０により読み出された想定入力に含まれる名詞句を特定するための名詞句特定部１５２とを含む。訓練データ作成部８２はさらに、名詞句特定部１５２が特定した名詞句を帰結部に含むような因果関係を全て拡張因果関係ＤＢ７４で検索し読み出すための因果関係検索部１５４と、因果関係検索部１５４が読み出した因果関係の各々について、想定入力を入力、因果関係を出力とする訓練データサンプルを作成し訓練データ記憶部８４に格納するための訓練データサンプル作成部１５６とを含む。

　（４）　訓練装置５６
　訓練装置５６は、訓練データ作成部８２が出力した訓練データサンプルを記憶するための訓練データ記憶部８４と、訓練データ記憶部８４に記憶された訓練データサンプルを用いて応答生成ニューラルネットワーク１００の訓練を行うための訓練部８６とを含む。訓練部８６が応答生成ニューラルネットワーク１００に対して行う処理は、前述したように応答生成ニューラルネットワーク１００のファインチューニングである。具体的には訓練部８６は、各訓練データサンプルについて、応答生成ニューラルネットワーク１００に想定入力を与え、その想定入力を原因とする因果関係の帰結となるような出力を生成するよう、誤差逆伝搬法により応答生成ニューラルネットワーク１００の訓練を行う。

　（５）　訓練データ生成プログラム
　図３に、コンピュータを訓練データ生成装置５４として機能させるためのコンピュータプログラムの制御構造をフローチャート形式で示す。図３を参照して、このプログラムは、プログラムの起動後、記憶領域の確保及び初期化、関係するファイルのオープン及びデータベースへの接続などを行うステップ２００と、図１に示す想定入力記憶部７８から想定入力を全て読み出すステップ２０２とを含む。このプログラムはさらに、ステップ２０２で読み出された想定入力の各々についてステップ２０６を実行するステップ２０４と、ステップ２０４が完了した後に、所定の終了処理を実行してプログラムの実行を終了するステップ２０８とを含む。

　ステップ２０６は、処理される想定入力の中に存在する名詞句を全て特定するステップ２３０と、ステップ２３０で特定された名詞句の各々について、ステップ２３４を実行するステップ２３２とを含む。

　ステップ２３４は、処理中の名詞句を原因部に持つ因果関係を図１に示す拡張因果関係ＤＢ７４から全て読み出すステップ２６０と、ステップ２６０で読み出された因果関係の各々について処理中の想定入力との組合せからなる訓練データサンプルを作成するステップ２６４を実行するステップ２６２とを含む。

　ステップ２６４は、具体的には、処理中の想定入力を入力、処理中の因果関係を回答とする訓練データサンプルを作成し、図１に示す訓練データ記憶部８４に保存する。

　２　動作
　上に構造を説明した対話システム５０は以下のように動作する。

　（１）　訓練データの作成
　最初に訓練データ生成装置５４は以下のように動作し、応答生成ニューラルネットワーク１００のための訓練データを作成する。まず、因果関係抽出部６２がインターネット６０から多数の因果関係を抽出し因果関係ＤＢ６４に格納する。因果関係ＤＢ６４は、様々な検索が可能な形式でこれら因果関係を記憶する。例えば、上記特開２０１８－６０３６４号公報に開示の技術では、因果関係の原因部と帰結部とを区別できる。因果関係ＤＢ６４が各因果関係についてその原因部と帰結部とを別々のカラムに記憶するように因果関係ＤＢ６４を設計すれば、例えば特定の単語を原因部に含む因果関係のみを容易に抽出できる。

　連鎖因果関係生成部６６は、因果関係ＤＢ６４に記憶された因果関係のうち、第１の因果関係の帰結部が第２の因果関係の原因部と実質的に同じ意味を示すような２つの因果関係の候補の全てを生成する。さらに同様の処理をすることで、複数の因果関係を連鎖させることにより新たな因果関係の候補を生成する。この実施形態では、因果関係を所定の上限回数まで連鎖させることにより多数の因果関係候補を生成する。これら因果関係候補は全て生成因果関係ＤＢ６８に記憶される。生成因果関係ＤＢ６８は例えば、因果関係ＤＢ６４と同じ形式で因果関係候補を記憶する。生成因果関係ＤＢ６８の場合、因果関係候補を生成するもとになった因果関係を特定する情報を一緒に保存するようにしてもよい。

　連鎖因果関係生成部６６により生成された因果関係候補は、あくまで連鎖の中の連続する２つの因果関係の間で、一方の帰結部と他方の原因部とが意味的に同じものであることに基づいている。しかし上記特開２０１５－１２１８９７号公報でも開示されているように、このような因果関係の連鎖により得られた因果関係候補の中には、全体として正しい因果関係を表すものではないものが存在する。そこで連鎖因果関係選択部７０が生成因果関係ＤＢ６８に記憶された因果関係候補の中から正しいと考えられるものを選択し連鎖因果関係ＤＢ７２に格納する。ここでの因果関係候補の選択手法としては、特開２０１５－１２１８９７号公報に開示されたものを用いる。また、ＢＥＲＴなどの事前学習済みの自然言語モデルをファインチューニングし、因果関係候補の選択を行わせることも可能である。

　拡張因果関係ＤＢ７４は、因果関係ＤＢ６４と連鎖因果関係ＤＢ７２とを統合した因果関係を記憶する。すなわち拡張因果関係ＤＢ７４は、因果関係抽出部６２によりインターネット６０から抽出された因果関係と、連鎖因果関係生成部６６及び連鎖因果関係選択部７０によりこれら因果関係から生成された因果関係とを記憶する。拡張因果関係ＤＢ７４もまた、因果関係ＤＢ６４と同様のフォーマットで因果関係を記憶する。

　一方、想定入力抽出部７６は、因果関係抽出部６２と同様、インターネット６０の多数のウェブページから、応答生成ニューラルネットワーク１００への入力として考えられるような表現を応答生成ニューラルネットワーク１００への想定入力として抽出する。例えばインターネット６０に存在する多数のＦＡＱ（Ｆｒｅｑｕｅｎｔｌｙ　Ａｓｋｅｄ　Ｑｕｅｓｔｉｏｎｓ）サイトの質問文を初めとし、様々な情報を提供するサイトに掲げられている質問形式の文などが候補として考えられる。これ以外にも、通常の文を抽出し、その中の名詞句が回答となるような質問文を生成したりすることも可能である。想定入力抽出部７６が抽出した想定入力は想定入力記憶部７８に記憶される。

　一方、利用者が、コンソール８０を用いて想定入力を補充してもよい。ただしこの補充は必須というわけではない。

　以上のようにして拡張因果関係ＤＢ７４に因果関係が、想定入力記憶部７８に想定入力が、それぞれ準備できると、訓練データ作成部８２が以下のようにして訓練データを作成する。具体的には、コンピュータが図３に制御構造を示すプログラムを実行することで訓練データを作成する。

　図３を参照して、このプログラムが起動されると、まずステップ２００で初期処理を実行し、ステップ２０２で想定入力記憶部７８に記憶された想定入力を全て読み出しメモリにロードする。ステップ２０４で、想定入力が終了するまで、これら想定入力の各々に対して以下に説明するようにステップ２０６を実行することで訓練データを作成する。

　ステップ２０６ではまず、処理中の想定入力中の名詞句を全て特定し（ステップ２３０）、ステップ２３２でそれら名詞句の各々についてステップ２３４の処理を実行する。

　ステップ２３４では、処理中の名詞句について、その名詞句を原因部に持つ因果関係を拡張因果関係ＤＢ７４から全て読み出す（ステップ２６０）。さらにステップ２６２では、これら各因果関係について、処理中の想定入力を入力、因果関係の帰結部を回答とする訓練データサンプルを作成し図１の訓練データ記憶部８４に保存するというステップ２６４の処理を、全ての因果関係に対して完了するまで実行する。

　こうしてステップ２３０で特定した名詞句の全てに対して、ステップ２３２の処理を完了すると、ある想定入力に対するステップ２０６が完了し、次の想定入力に対してまたステップ２０６の処理を実行する。

　ステップ２０２で読み出された全ての想定入力に対してステップ２０４が完了すると、訓練データの作成が終わる。訓練データは図１の訓練データ記憶部８４に保存されている。

　（２）　訓練
　以上のようにして訓練データが準備できれば訓練装置５６の訓練部８６が訓練データ記憶部８４に準備されたこの訓練データを用いて応答生成ニューラルネットワーク１００の訓練を行う。

　応答生成ニューラルネットワーク１００の訓練そのものは、通常の誤差逆伝搬法による。すなわち、応答生成ニューラルネットワーク１００に想定入力を与え、応答生成ニューラルネットワーク１００の出力を得る。このとき、応答生成ニューラルネットワーク１００の出力は、順次、単語ベクトルの形で出力される。これら単語ベクトルにより形成される単語ベクトル列が、訓練データの回答である因果関係の帰結部（の単語ベクトル列）となるように応答生成ニューラルネットワーク１００のパラメータの修正を行う。この訓練は既存の手法によるため、ここではその詳細は繰り返さない。

　（３）　対話処理
　応答生成ニューラルネットワーク１００の訓練が完了すると、対話装置５２を利用できる。ユーザが何らかの入力を自然言語により行うと、この入力は単語ベクトル列に変換されユーザ入力１０２として応答生成ニューラルネットワーク１００に与えられる。応答生成ニューラルネットワーク１００はこのユーザ入力１０２に対して応答を生成し発話整形部１０４に出力する。発話整形部１０４は、応答生成ニューラルネットワーク１００から与えられた応答に対して、ユーザ入力１０２に対する応答としてふさわしい整形（例えばユーザ入力１０２にあわせて何らかの文言を先頭に付加する、ユーザ入力１０２の一部を繰り返す、文末表現を会話的に変形する、など）を行って応答発話１０６として出力する。この整形については、ルールベースで行ってもよいし、文とその語尾を修正したものを訓練データとして訓練したニューラルネットワークを用いてもよい。

　ユーザが音声による発話をし、その発話を音声認識した上でユーザ入力１０２として応答生成ニューラルネットワーク１００に入力するようにしてもよい。その場合、応答発話１０６についても音声合成により音声として出力してもよい。

　３　効果
　応答生成ニューラルネットワーク１００を因果関係に基づいて訓練するので、ユーザ入力１０２に対して応答生成ニューラルネットワーク１００が生成するのは、ユーザ入力１０２に対する何らかの因果的帰結に関連する文となる。訓練データには因果関係を連鎖させて生成した因果関係もあり、通常はユーザ入力１０２から直ちに導出できるような回答だけではなく、ユーザ入力１０２から導かれる潜在的なリスク又はチャンスに関する文が応答生成ニューラルネットワーク１００の出力として得られる可能性が高い。その結果、従来の対話システムのようにある枠組みの中で回答を探索する場合と比較して、対話が発展しやすくなる。

　この実施形態では因果関係を用いて訓練データを作成している。従来技術で行われているように、一般的な対話データを大量に入手するのは困難だが、因果関係であればインターネットから既存の手法を用いて大量に取得できる。そのため、大量の訓練データが準備でき、応答生成ニューラルネットワーク１００をより精度高くできる。すなわち、応答生成ニューラルネットワーク１００は、ユーザ入力１０２に対し、因果関係に基づいた、対話をさらに発展させる可能性の高い回答が生成できる。

　従来のニューラルネットワークを用いた対話システムでは、ニューラルネットワーク自体はブラックボックス化している。そのため、対話システムの出力する応答がどのような意図でなされているのかについて、ユーザに説明することが難しいという問題がある。それに対してこの実施形態に係る応答生成ニューラルネットワーク１００のように、因果関係を用いて訓練したニューラルネットワークの場合、ユーザの発話から導かれる潜在的チャンス及びリスクをユーザに教えてあげているのです、と説明できる。そのため、単なる対話の相手として対話システムを考えるのではなく、ユーザの思考を発展させるツール、又はユーザの行動を方向づけるツールとして対話システムの利用領域を広げることができる。

　第２　第２実施形態
　１　構成
　（１）　対話システム３００
　図４に、この発明の第２実施形態に係る対話システム３００の構成をブロック図形式で示す。図４を参照して、この対話システム３００は、第１実施形態と同様の訓練データ生成装置５４及び訓練装置５６を含む。対話システム３００はさらに、訓練装置５６の訓練データ記憶部８４と訓練データ生成装置５４の想定入力記憶部７８とに接続され、各訓練データサンプルについて、その想定入力に関連する何らかの語句をトピックとして想定入力に付加した新たな訓練データサンプルを作成し訓練データ記憶部８４に追加する訓練データ拡張部５８と、この拡張された訓練データを用いて訓練装置５６により訓練された応答生成ニューラルネットワーク３４０を用いる対話装置３０２とを含む。

　これらのうち、訓練データ拡張部５８と対話装置３０２とについて以下に順番にその構成を説明する。

　（２）　訓練データ拡張部５８
　ア　構成
　訓練データ拡張部５８は、単語が与えられると、その単語の周辺に各単語が発生する確率を要素とする周辺単語分布ベクトルを出力するように、コーパスの統計を用いてあらかじめ準備されたトピックワードモデル３３０を含む。訓練データ拡張部５８はさらに、単語が与えられると、その単語に対する周辺単語分布ベクトルと類似した周辺単語分布ベクトルを持つ単語をトピックワードモデル３３０の出力に基づいて特定し、またその単語の周辺単語分布ベクトルと類似した単語ベクトルを持つ単語を含むような想定入力を想定入力記憶部７８から抽出したりする関連表現検索部３３２を含む。訓練データ拡張部５８はさらに、訓練データ記憶部８４に記憶された各訓練データサンプルについて、その持つ因果関係表現の帰結部に含まれる単語を抽出して関連表現検索部３３２に与え、それに応答して関連表現検索部３３２から出力される単語及び想定入力の組合せを訓練データサンプルの想定入力に付加して新たな訓練データサンプルを展開し訓練データ記憶部８４に追加するための訓練データ追加部３３４とを含む。

　イ　訓練データ追加部３３４
　図５を参照して、訓練データ追加部３３４の構成は以下のとおりである。訓練データ追加部３３４は、訓練データ記憶部８４に記憶されている訓練データサンプルを１つずつ読み出し、その中の因果関係の帰結部に含まれる単語を取り出す訓練データ読出部３６０と、訓練データ読出部３６０が取り出した単語の各々について、関連表現検索部３３２に対して関連表現を問い合わせるための関連表現問合部３６２とを含む。

　訓練データ追加部３３４はさらに、関連表現問合部３６２からの問合せに対して関連表現検索部３３２が出力する関連表現を受け、それらの所定の組合せを訓練データ読出部３６０が読み出した訓練データサンプルの中の想定入力に付加して新たな訓練データサンプルを生成するための関連表現付加部３６６を含む。訓練データ追加部３３４はさらに、関連表現付加部３６６により生成された新たな訓練データサンプルを訓練データ記憶部８４に追加して書き込むための訓練データ書込部３６４とを含む。

　ウ　トピックワードモデル３３０
　上記したように、トピックワードモデル３３０は、単語が与えられると、その単語の周囲（例えばその単語の前後、又は前後とも２つの範囲など）に各単語が出現する確率を要素とする周辺単語分布ベクトルを出力するよう、あらかじめ所定のコーパスに対する統計処理を行うことにより得られる。周辺単語分布ベクトルは、対象となる言語から選択された一定数の単語に応じた数の要素を持つ。この周辺単語分布ベクトルから、ある単語の周辺に出現する確率の高い単語がわかる。また、互いに類似した状況に出現する単語の周辺単語分布ベクトルは互いに類似する。したがって、互いに類似した状況に出現する単語もこのトピックワードモデル３３０を用いて推定できる。なお、２つの周辺単語分布ベクトルが類似しているか否かは、両者のコサイン類似度により定めればよい。

　このようなＷｏｒｄ２Ｖｅｃのようなワード・エンベディングを計算するトピックワードモデルのほかに、事前学習済みのＢＥＲＴモデルをファインチューニングして、入力された文に対して、この入力文もしくはその近傍の文に出現する単語の確率分布を推定するトピックワードモデルを採用することも可能である。

　エ　関連表現検索部３３２
　図６を参照して、関連表現検索部３３２は、図５に示す関連表現問合部３６２から単語が与えられると、トピックワードモデル３３０からその単語に関する周辺単語分布ベクトルを受け、さらに想定入力記憶部７８に記憶されている想定入力の中で、この周辺単語分布ベクトルに類似した周辺単語分布ベクトルを持つ単語を含む想定入力を検索し、関連想定入力として取り出すための関連想定入力検索部４００を含む。関連表現検索部３３２はさらに、関連表現問合部３６２から単語が与えられると、トピックワードモデル３３０からその単語の周辺単語分布ベクトルを得て、この周辺単語分布ベクトルから、入力された単語の周囲で使用される確率の高い単語を関連単語として選択するための関連単語検索部４０２を含む。関連表現検索部３３２はさらに、関連想定入力検索部４００が取り出した関連想定入力と、関連単語検索部４０２が選択した関連単語との種々の組合せを生成するための関連表現展開部４０４と、関連表現展開部４０４により生成された組合せの各々を図５の関連表現付加部３６６に向けて出力するための関連表現出力部４０６とを含む。

　（３）　対話装置３０２
　ア　構成
　図４を参照して、対話装置３０２は、図１の応答生成ニューラルネットワーク１００と同様の構成を持つ応答生成ニューラルネットワーク３４０であって、応答生成ニューラルネットワーク１００とは異なり訓練データ拡張部５８により拡張された訓練データにより訓練された応答生成ニューラルネットワーク３４０を含む。対話装置３０２はさらに、対話装置３０２へのユーザ入力１０２に、ユーザが過去に対話の中で発した表現又はユーザとの対話のトピックを表す単語を１又は複数個付加して応答生成ニューラルネットワーク３４０に入力する情報付加装置３３８とを含む。

　情報付加装置３３８は、訓練データ拡張部５８のトピックワードモデル３３０と同様のトピックワードモデル３４４と、過去のユーザ発話を記憶するためのユーザ入力記憶部３４６と、ユーザ入力１０２を受けて、ユーザ入力１０２に含まれる単語を抽出し、トピックワードモデル３４４を参照してその単語に関連する確率が高い単語をいくつか選択するための単語選択部３４８とを含む。情報付加装置３３８はさらに、ユーザ入力記憶部３４６に記憶されたユーザ入力のうちで、ユーザ入力１０２と関連する発話をいくつか選択するための発話選択部３５０と、ユーザ入力１０２に対して、単語選択部３４８が選択した単語と発話選択部３５０が選択したユーザ入力との任意の組合せ（何も選択しない場合も含む）を選択してユーザ入力１０２に付加し、応答生成ニューラルネットワーク３４０に入力として与えるための情報付加部３５２とを含む。

　イ　トピックワードモデル３４４
　トピックワードモデル３４４は図４のトピックワードモデル３３０と同様である。

　ウ　単語選択部３４８
　単語選択部３４８は、ユーザ入力１０２に含まれる単語を抽出し、その単語の各々についてトピックワードモデル３４４を参照して周辺単語分布ベクトルを得る。そして、それら周辺単語分布ベクトルの中で最も高い確率を持つ所定個数の要素に対応する単語を選択する機能を持つ。

　エ　ユーザ入力記憶部３４６
　ユーザ入力記憶部３４６は、ユーザが過去に入力したユーザ入力のうち、最新のものを所定個数だけ記憶する。ユーザ入力にその入力時刻を付加して記憶しておいてもよい。

　オ　発話選択部３５０
　発話選択部３５０は、ユーザ入力１０２とユーザ入力記憶部３４６に記憶された過去のユーザ入力とを所定の分離トークンを介して結合した単語ベクトル列を受け、両者が関連している程度を示す値を出力するようにあらかじめ訓練されたニューラルネットワークを持ち、このニューラルネットワークが出力する値が最も高いいくつかの過去のユーザ発話を選択する機能を持つ。なお、ユーザ入力の入力時刻を記憶している場合、現在から所定時間だけ前から現在までのユーザ入力に選択対象を限定してもよいし、ユーザ入力が選択される確率を、その入力があった時間からの経過時間と逆相関を持たせるようにしてもよい。

　カ　情報付加部３５２
　情報付加部３５２は、単語選択部３４８が選択した全ての単語と、発話選択部３５０が選択した全てのユーザ発話とを受け、これらの全ての組合せの集合を生成し、その中からランダムに１つの組合せを選択してユーザ入力１０２に付加する機能を持つ。組合せの中にはどの単語も過去の入力も含まない組合せも含む。したがって情報付加部３５２の出力は、ユーザ入力１０２のみ、ユーザ入力１０２＋単語、ユーザ入力１０２＋過去の入力、ユーザ入力１０２＋２つの単語、ユーザ入力１０２＋単語＋過去の入力など、様々な形となり得る。

　（４）　訓練データ生成プログラム
　ア　全体構成
　図７は、図４の訓練データ生成装置５４、訓練装置５６及び訓練データ拡張部５８としてコンピュータを機能させるためのプログラムの制御構造を示す。

　図７を参照して、このプログラムが図３に示す第１実施形態のものと異なるのは、ステップ２０４とステップ２０８との間に、ユーザ入力１０２に対してその関連表現を追加する処理が実行されるステップ４５０を含む点である。

　イ　関連表現追加処理
　図８に、図７のステップ４５０を実行するようコンピュータを機能させるプログラムルーチンの制御構造を示す。

　図８を参照して、このルーチンは、ルーチンの実行開始時に所定の初期処理を実行するステップ５００と、訓練データサンプルの終了まで、各訓練データサンプルについて、後述するステップ５０４の処理を実行するステップ５０２と、ステップ５０２の終了後に所定の終了処理をしてこのルーチンの実行を完了し制御を図７に示す親ルーチンに戻すステップ５０６とを含む。

　ステップ５０４は、処理すべき訓練データサンプルに含まれる因果関係の帰結部から単語を抽出するステップ５３０と、ステップ５３０で抽出された単語が終了するまで、各単語についてステップ５３４を実行することにより、想定入力に付すべき単語候補の集合を生成するステップ５３２とを含む。ステップ５０４はさらに、ステップ５３２が完了した後に、ステップ５３２で生成された単語の集合に含まれる単語の可能な組合せを全て生成し、各組合せについて、処理すべき訓練データサンプルに含まれる想定入力にその組合せを付加することで新たな訓練データサンプルを生成し、訓練データに追加するステップ５３８を実行するステップ５３６とを含む。

　ステップ５３４は、トピックワードモデル３３０を用いて、処理中の単語の周辺単語分布ベクトルを算出するステップ５６０と、ステップ５６０で算出された確率が上位の所定個数の単語を選択するステップ５６２とを含む。ステップ５３４はさらに、ステップ５６０で算出された周辺単語分布ベクトルに基づいて、この周辺単語分布ベクトルと類似した周辺単語分布ベクトルを持つ単語を持つ所定個数の想定入力を図４の想定入力記憶部７８から選択するステップ５６４とを含む。

　なお、この実施形態においては、ステップ５６２での単語の選択時には、確率が上位でも、しきい値以上の確率を持つ単語のみを選択する。ステップ５６４でも同様で、周辺単語分布ベクトルの類似度が所定以上となる単語のみを選択する。しきい値については実験により適切な値を定めればよい。このような制約を設けなくてもよい。

　２　動作
　（１）　訓練データの作成
　ア　基本的訓練データの作成
　基本的訓練データの作成は、図７のステップ２００からステップ２０４までで行われる。この場合のこの実施形態の動作は第１実施形態と同様である。

　イ　訓練データの拡張
　訓練データの拡張は図７のステップ４５０で行われる。具体的は、図４及び図５を参照して、訓練データ追加部３３４の訓練データ読出部３６０が訓練データ記憶部８４から訓練データを一つずつ読み出して（図８のステップ５０２）、その訓練データ内の因果関係に帰結部から単語を抽出し（ステップ５３０）関連表現問合部３６２に与える。関連表現問合部３６２が、それら単語の各々について（ステップ５３２）、関連表現検索部３３２に対して関連表現を問い合わせる（ステップ５３４）。

　図６を参照して、関連表現検索部３３２の関連想定入力検索部４００は、関連表現問合部３６２から単語が与えられると、トピックワードモデル３３０からその単語に関する周辺単語分布ベクトルを算出する（ステップ５６０）。関連単語検索部４０２は、この周辺単語分布ベクトルから、入力された単語の周囲で使用される確率の高い所定個数の単語を関連単語として選択する（ステップ５６２）。関連想定入力検索部４００はさらに、想定入力記憶部７８に記憶されている想定入力の中で、この周辺単語分布ベクトルに類似した周辺単語分布ベクトルを持つ単語を含む想定入力を検索し、関連想定入力として取り出す（ステップ５６４）。この処理が各単語に対して行われる。

　関連表現展開部４０４は、関連想定入力検索部４００が取り出した関連想定入力と、関連単語検索部４０２が選択した関連単語との可能な組合せを生成する（ステップ５３６）。関連表現出力部４０６が、関連表現展開部４０４により生成された組合せの各々を図５の関連表現付加部３６６に向けて、因果関係に関連する関連表現として出力する。

　再び図５を参照して、関連表現付加部３６６は、関連表現検索部３３２が出力する関連表現の組合せを受け、それらの組合せを処理中の訓練データサンプルの中の想定入力に付加して、新たな訓練データサンプルを生成する。訓練データ書込部３６４が、このようにして関連表現付加部３６６により生成された新たな訓練データサンプルを訓練データ記憶部８４に追加して書き込む（ステップ５３８）。

　以上の処理により訓練データの拡張が行われる。

　（２）　訓練
　この第２実施形態で行われる応答生成ニューラルネットワーク３４０の訓練は、第１実施形態で応答生成ニューラルネットワーク１００に対して行われるものと同様である。ただし訓練データが第２実施形態では第１実施形態とは異なるので、訓練終了時の応答生成ニューラルネットワーク３４０の内部のパラメータは第１実施形態の応答生成ニューラルネットワーク１００の内部のパラメータとかなり異なってくる。

　（３）　対話処理
　対話処理時、対話装置３０２は以下のように動作する。まずユーザ入力１０２が対話装置３０２に与えられると、単語選択部３４８が、ユーザ入力１０２に含まれる単語を抽出し、トピックワードモデル３４４を参照してその単語に関連する確率が高い単語をいくつか選択する。発話選択部３５０が、ユーザ入力記憶部３４６に記憶された過去のユーザ入力のうちで、ユーザ入力１０２と関連する発話をいくつか選択する。情報付加部３５２が、ユーザ入力１０２に対して、単語選択部３４８が選択した単語と発話選択部３５０が選択したユーザ入力との任意の組合せ（何も選択しない場合も含む）の中の１つを何らかの方法で、例えばランダムに選択してユーザ入力１０２に付加し、応答生成ニューラルネットワーク３４０に入力として与える。

　この入力を受けた後の応答生成ニューラルネットワーク３４０の内部的動作自体は第１実施形態の応答生成ニューラルネットワーク１００と同様である。ただし両者は内部のパラメータが異なるため、同じユーザ入力１０２が与えられたとしても、応答生成ニューラルネットワーク３４０の出力は応答生成ニューラルネットワーク１００の出力と異なってくる可能性が高い。ユーザ入力１０２に単語などを付加することによりさらにその可能性は高くなる。特に応答生成ニューラルネットワーク３４０の場合には、回答を生成する上で、ユーザ入力１０２のみに依存するのではなく、ユーザ入力１０２が含む単語を帰結部に含むような因果関係、又はユーザ入力１０２よりも以前のユーザ入力と関連する表現を帰結部に含むような因果関係に基づいて応答を生成する可能性が高い。したがって、ユーザとの対話が継続性を持ちながら、因果関係の連鎖に基づく潜在的なチャンス又はリスクを反映することによりユーザが想定していなかったような話題を提供できる。

　例えばユーザ入力１０２が「人工知能が発達してきたね？」というものだと想定する。過去のユーザ入力に「高齢者が心配だ」というものがあり、この過去のユーザ入力がユーザ入力１０２に付加され、「人工知能が発達してきたね？＋高齢者が心配だ」という形で応答生成ニューラルネットワーク３４０に与えられた場合をさらに想定する。この場合、例えば、応答生成ニューラルネットワーク３４０の出力として「ロボットを活用して介護サービスを提供し、高齢者を支援しよう」のように、ユーザ入力１０２から話題を発展させ、ユーザ入力１０２を発した時点でユーザが考えていなかったような方向に対話を進めていくことができる。

　３　効果
　以上のようにこの実施形態では、因果関係に基づいてユーザ入力に対する応答を生成できる。このような応答を生成するためにはニューラルネットワークを多数の因果関係表現を用いて訓練する必要がある。しかし因果関係表現は、通常の対話データと異なり、インターネット上から容易に大量に収集できる。その上、その量は日々さらに増加していく。したがって、対話に使用するニューラルネットワークによる応答の生成精度を容易に高めることができる。その上、因果関係に基づいて応答が生成されるので、従来のニューラルネットワークを用いた対話システムと異なり、因果関係及び因果関係の連鎖を反映して、ユーザが意識していないような潜在的なチャンス及びリスクに基づいた応答を生成できる。その結果、従来と比較して、ユーザとの対話をより有益な形で発展させることができる。

　第３　第３実施形態
　１　構成
　図９は、この発明の第３実施形態に係る対話システム６００の構成を示すブロック図である。図９を参照して、対話システム６００は、対話システムの訓練データを作成するための訓練データ生成装置６１０と、ニューラルネットワークを含む対話装置６１２とを含む。対話システム６００はさらに、訓練データ生成装置６１０により作成された各訓練データサンプルに、その想定入力に関連する何らかの語句をトピックとして想定入力に付加した新たな訓練データサンプルを作成し追加する、図４に示すものと同様の訓練データ拡張部５８と、訓練データ生成装置６１０により生成され訓練データ拡張部５８により拡張された訓練データを用いて対話装置６１２の訓練を行うための訓練装置５６とを含む。

　訓練データ生成装置６１０が図１に示す訓練データ生成装置５４と異なるのは、図１の連鎖因果関係選択部７０の後に、連鎖因果関係選択部７０により選択された連鎖因果関係の各々から、先頭の因果関係の原因部と、その連鎖因果関係に含まれる因果関係の帰結部のみを取り出して順に連鎖させた文字列（ここでは因果的帰結連鎖という。）を生成するための因果的帰結連鎖生成部６２０を含む点と、図１の連鎖因果関係ＤＢ７２に替えて、因果的帰結連鎖生成部６２０により生成された因果的帰結連鎖を記憶するための因果的帰結連鎖記憶部６２２を含む点と、図１に示す拡張因果関係ＤＢ７４に替えて、因果関係ＤＢ６４に記憶された単独の因果関係と、因果的帰結連鎖記憶部６２２に記憶された因果的帰結連鎖とを記憶するための因果的帰結連鎖ＤＢ６２４とを含む点である。因果関係ＤＢ６４に記憶された単独の因果関係は、因果的帰結が１個だけからなる因果的帰結連鎖と考えることができる。訓練データ生成装置６１０はさらに、図１に示す訓練データ作成部８２に替えて、因果的帰結連鎖ＤＢ６２４に記憶された因果的帰結連鎖と想定入力記憶部７８に記憶された想定入力とを用いて対話装置６１２の訓練のための訓練データを作成する訓練データ作成部６２６を含む点でも図１に示す訓練データ生成装置５４と異なっている。

　この第３実施形態では、ユーザは、因果的帰結連鎖の連鎖数を指定する自然数Ｎを指定してユーザ入力６３０を対話装置６１２に入力する点が第１実施形態及び第２実施形態と異なる。

　対話装置６１２は、訓練装置５６により訓練された応答生成ニューラルネットワーク６３２と、ユーザ入力６３０の入力を受け、ユーザとの会話のトピックを表す単語を抽出し、ユーザ入力６３０にそれらの単語の任意の組合せを追加して応答生成ニューラルネットワーク６３２に入力する、図４に示す情報付加装置３３８の中のトピックワードモデル３４４、単語選択部３４８及び情報付加部３５２を含む情報付加装置６４２とを含む。これら追加された単語の任意の組み合わせは、ユーザ入力６３０と自然数Ｎとの間に挿入される。すなわち、応答生成ニューラルネットワーク６３２への入力は、「ユーザ入力６３０」＋「情報付加装置３３８が追加した単語の組み合わせ」＋「連鎖数を指定する自然数Ｎ」という形式となる。後述するように応答生成ニューラルネットワーク６３２は、上のような形式の入力が与えられると、Ｎ個の因果的帰結連鎖からなる文字列であって、かつ最後の因果的帰結連鎖には情報付加装置３３８が追加した単語のいずれかが含まれるようなものを出力するように訓練される。

　対話装置６１２はさらに、情報付加装置３３８から与えられた入力に対する応答生成ニューラルネットワーク６３２の出力結果から質問文を生成する質問生成部６３４と、質問生成部６３４が生成した質問を外部の質問応答システム６１４に与えてその応答を得るための応答取得部６３６と、応答取得部６３６が得た応答を対話文として整形し、応答発話６４０として出力するための発話整形部６３８とを含む。

　この実施形態では（他の実施形態でも）、質問生成部６３４での処理は、応答生成ニューラルネットワーク６３２の出力する因果関係表現の先頭に疑問詞を付し、さらに末尾を何らかの形で疑問形式に整形することで疑問文を作成する。これらの疑問文の作成は、別途学習されたニューラルネットワーク又はルールベースの整形手段を用いることができる。

　例えば応答生成ニューラルネットワーク６３２の出力する因果関係表現が「奈良に行く」→「鹿に会う」であったと仮定する。この得られた因果関係表現に対して、（１）「どのように」Ｈｏｗを付すことで、「どのように奈良に行くと鹿に会う？」という疑問文を作成する。（２）この結果に加えて、「と良い？」という語をさらに末尾に付加して、「どのように奈良に行くと鹿に会うと良い？」という疑問文を作成する。

　応答取得部６３６は、これらの疑問文のいずれか又は双方を質問応答システム６１４に入力し、出力である回答とその回答が抽出されたテキストを得る。発話整形部６３８は、はこの回答を単独で、又は回答が抽出されたテキストと組み合わせて利用して、ユーザとの対話における応答にふさわしい整形を行って最終的な応答発話６４０を出力する。

　ここで、質問応答システム６１４として想定しているのは、入力に基づいて内部データベース又は外部の情報源（例えばインターネット上の文書）等の検索処理を行い、入力された質問文と関係が認められる記述であって、事実に基づく又は根拠がある記述などを抽出し応答として出力するシステムである。このような質問応答システムとしては、国立研究開発法人情報通信研究機構が運営する質問応答システムＷＩＳＤＯＭ　Ｘ（https://www.wisdom-nict.jp/）が例として考えられる。このような質問応答システム６１４を縦続させることにより、応答の生成過程において、根拠となる記述やテキストを利用することができるため、ユーザへの応答発話６４０に根拠を持たせることが可能となる。なお、ＷＩＳＤＯＭ　Ｘに限らず、通常の検索エンジンの出力を利用することも可能である。

　上記したように、応答生成ニューラルネットワーク６３２への入力が「ユーザ入力６３０」＋「情報付加装置３３８が追加した発話及び単語の組み合わせ」＋「連鎖数を指定する自然数Ｎ」という形式であるため、応答生成ニューラルネットワーク６３２のための訓練データとしては図１０に示すようなものが必要となる。

　図１０を参照して、この訓練データを構成する訓練サンプルの各々は、入力として「想定入力＋関連単語（群）＋自然数Ｎ」を持ち、出力としては自然数Ｎで指定された数だけの因果的帰結からなる因果的帰結連鎖を含む。このとき、各訓練サンプルの出力の末尾の因果的帰結には、関連単語（群）に含まれる単語のいずれかが含まれている。

　図１１は、図９に示す訓練データ作成部６２６としてコンピュータを機能させるコンピュータプログラムの制御構造を示すフローチャートである。図１１を参照して、このプログラムは図７に示す第２実施形態のものに類似している。しかし図１１に示すプログラムが、図７に示すものと異なるのは、図７のステップ２０６に替えてステップ６７０を含むこと、及び図７のステップ４５０に替えて、関連表現ではなく関連単語を入力に追加するステップ６７２を含むことである。

　ステップ６７０は図７のステップ２０６と類似している。しかしステップ６７０は、図７のステップ２３４に替えて、ステップ６８０を含む点でステップ２３４と異なる。

　ステップ６８０は、処理中の名詞句を原因部（因果的帰結連鎖の先頭）に持つ因果的帰結連鎖をすべて読み出すステップ６９０と、ステップ６９０で読み出された各因果的帰結連鎖についてステップ６９４を実行するステップ６９２とを含む。

　ステップ６９４は、処理中の想定入力及び因果的帰結連鎖の組み合わせについて、想定入力と、因果的帰結連鎖の回数とを入力とし、因果的帰結連鎖を回答とする訓練データサンプルを作成し保存するためのものである。

　すなわち、ステップ６８０の処理によって、図１０に示す訓練データサンプルから「関連単語（群）」を取り除いた訓練データサンプルが得られる。「関連単語（群）」はステップ６７２において追加される。

　図１２は、図１１のステップ６７２を実現するプログラムルーチンの制御構造を示す。図１２を参照して、このプログラムは、所定の初期処理を実行するステップ７００と、各訓練データサンプルについてステップ７０４を実行するステップ７０２と、ステップ７０２が完了した後に、所定の終了処理を実行してこのルーチンの実行を終了するステップ７０６とを含む。

　ステップ７０４は、処理中の訓練データサンプルの因果関係連鎖の最後の帰結部から単語を抽出するステップ７１０と、ステップ７１０で抽出された単語の組み合わせをすべて生成するステップ７１１と、ステップ７１１で生成された各組み合わせについてステップ７１４を実行するステップ７１２とを含む。

　ステップ７１４は、処理中の訓練データサンプルの想定入力と、連鎖回数を示す自然数Ｎとの間に、処理中の単語の組み合わせを挿入し、新たなサンプルを作成するステップ７２０と、ステップ７２０で作成された新たなサンプルを図９に示す訓練データ記憶部８４に書き出してステップ７１４の実行を終了するステップ７２２とを含む。

　２　動作及び効果
　図１１及び図１２に制御構造を示すプログラムをコンピュータに実行させることにより、図１０に示すような構成の訓練データを得ることができる。ここで注意すべきは、訓練データの入力部の「関連単語（群）」に含まれる単語が、出力の因果的帰結連鎖の末尾の因果的帰結に含まれていること、及び出力部分の因果的帰結の数が入力部の自然数により指定された数であることである。

　この訓練データを用いて図９に示す応答生成ニューラルネットワーク６３２を訓練する。その結果、図１０の「入力」として示した構成の入力が応答生成ニューラルネットワーク６３２に与えられると、応答生成ニューラルネットワーク６３２が、入力で指定された想定入力と関連を持つ原因部を持つ因果的帰結連鎖であって、入力で指定された数だけの因果的帰結を持ち、最後の因果的帰結には入力で指定された関連単語又は関連単語に近い単語を持つ因果的帰結連鎖を出力するように、応答生成ニューラルネットワーク６３２のパラメータが設定される。

　したがって、実際の推論時にユーザがユーザ入力６３０と自然数Ｎとを対話装置６１２に入力すると、ユーザ入力６３０に対して対話のトピックを示す単語が関連単語として選択されて入力に付加される。この入力が応答生成ニューラルネットワーク６３２に与えられると、応答生成ニューラルネットワーク６３２は、指定された数だけの因果的帰結を持つ因果的帰結連鎖であって、その末尾の因果的帰結には関連単語として指定された単語又はその単語に近い単語が含まれるものを出力する。その原因部は入力と関連したものとなっている。その因果的帰結連鎖は第１及び２実施形態にいう「因果関係表現」である。この因果関係表現から質問生成部６３４が質問文を生成する。応答取得部６３６がその質問文を質問応答システム６１４に与えてその応答を得る。発話整形部６３８がその応答をユーザ入力６３０に対する応答としてふさわしい形に整形し応答発話６４０として出力する。

　この実施形態では、ユーザ入力＋関連単語＋自然数Ｎを応答生成ニューラルネットワーク６３２に入力し、各々がＮ個の因果的帰結からなる複数の因果的帰結連鎖を得る。例えば、ユーザ入力として「人工知能が発達する。」が与えられ、その関連語として「高齢者」という単語が発見された場合について考える。自然数Ｎの値として１、２及び３を想定すると以下のような出力が得られることが想定される。

　Ｎ＝１：高齢者を支援する。

　Ｎ＝２：ロボットを活用する→高齢者を支援する。

　Ｎ＝３：ロボットを活用する→介護サービスが提供できる→高齢者を支援する。

　したがって、自然数Ｎの値により、入力と最終的な帰結との間の関連がより詳細に分かるという効果がある。すなわち、応答発話６４０は、入力と出力との間に介在する、ユーザが指定した数だけの因果的帰結を含む。したがってユーザ入力６３０を発したときにユーザが想定していなかったような帰結が、その過程も含めて得られ、いわば対話における対話装置６１２の思考過程を明確にでき、対話が発展する契機となる。

　なお、生成時において、応答生成ニューラルネットワークへ６３２の入力には、必ずしも、情報付加装置６４２からの追加の単語が入力されるわけではなく、省略される場合も含まれる。

　第４　第４実施形態
　１　構成
　第３実施形態で訓練された応答生成ニューラルネットワーク６３２を用いると、以下のような実施形態も可能になる。図１３に第４実施形態に係る対話装置７３０の構成を示す。

　図１３を参照して、この対話装置７３０は、上記した応答生成ニューラルネットワーク６３２と、ユーザ入力７４０を受けて、ユーザ入力７４０に対してトピックを示す関連単語（群）を付して出力するための情報付加装置６４２とを含む。対話装置７３０はさらに、情報付加装置６４２の出力に対して第３実施形態において述べた因果的帰結の連鎖数を示す自然数Ｎとして外部から与えられたものを付加して応答生成ニューラルネットワーク６３２に入力するための連鎖回数付加部７４２を含む。対話装置７３０はさらに、連鎖回数の上限を記憶する上限記憶部７４６と、自然数Ｎを１から上限記憶部７４６に記憶された上限まで、１ずつ増分しながら連鎖回数付加部７４２に与えて情報付加装置６４２の出力にその自然数Ｎが付されたものを順次出力させるための計数部７４４とを含む。

　対話装置７３０はさらに、これら入力に対して応答生成ニューラルネットワーク６３２から次々に出力される一連の因果的帰結連鎖を記憶するための出力記憶部７４８と、出力記憶部７４８に記憶された一連の因果的帰結連鎖をランキングするためのランキング部７５０とを含む。対話装置７３０はさらに、ランキング部７５０により最も高くランクされた因果的帰結連鎖を発話候補として選択するための発話選択部７５２と、発話選択部７５２により選択された因果的帰結連鎖をユーザ入力７４０に対する応答にふさわしく整形し応答発話７５６として出力するための発話整形部７５４とを含む。

　ランキング部７５０としては、予め学習済のニューラルネットワークを使用できる。このニューラルネットワークの訓練には、ユーザ入力と関連単語との組み合わせに対する因果的帰結連鎖の組を人手で評価したものを用いればよい。

　２　効果
　この実施形態によれば以下のような効果が得られる。例えば、入力として「人工知能が発達する」というものがあり、付加的単語として、「高齢者」が選ばれると仮定したときに、最終帰結が「高齢者を支援する」ではあるが、その間に、複数の因果的帰結が介在する連鎖が考えられる。しかもその複数の因果的帰結の数があらかじめ分かるわけではない。しかしこの実施形態では、入力された自然数の範囲内のすべての数についてその数の因果的帰結を含む因果的帰結連鎖を生成し、その中で最もランクの高いものを応答発話７５６として出力できる。その結果、ユーザ入力７４０を発した時点でユーザが考えていなかったような因果的な帰結であってしかも応答として適切なものが選択できる。

　なお、推論時の因果的帰結の連鎖の数は、学習時のデータの自然数Ｎに制限される必要はない。例えば、学習データの自然数Ｎの最大値が１０であっても、推論時に自然数Ｎを１０に制限する必要はない。所定の精度が得られる限り、自然数Ｎを１５などにして推論処理を行わせることも可能である。

　第５　第５実施形態
　１　構成
　上記第４実施形態は、複数の自然数Ｎに対して生成された複数の応答因果的帰結を事後評価し、スコアが最も高いものを選択する。しかし、この発明はそのような実施形態には限定されない。事前に同様の評価を行い対話システムにその結果を利用する方法をとることも考えられる。第５実施形態はそのような例である。具体的には、この例では例えば、想定入力とその関連語の各組み合わせに対して、１個からＮ個の因果的帰結からなる複数の因果的帰結連鎖を予め人手又は第４実施形態の応答生成ニューラルネットワーク６３２を使用して作成する。そして人手によりその結果をランキングする。そして、想定入力と、その関連語との組み合わせを入力とし、その組み合わせから得られた因果的帰結連鎖のうちで最も高いランクが得られたときの自然数Ｎを正解データとする訓練データを作成する。この訓練データを用いることで、ユーザ入力を与えると自然数Ｎが出力されるニューラルネットワーク（Ｎ評価用ニューラルネットワーク）を学習させる。そして、この学習済みのＮ評価用ニューラルネットワークに対して、入力と関連語を入力して自然数Ｎを得て、「入力＋関連語＋Ｎ」を応答生成ニューラルネットワークに与えて出力を得る。

　具体的には、図１４を参照して、第５実施形態に係る対話システム７７０は、ユーザ入力７８０に対して関連単語を付与する情報付加装置６４２と、情報付加装置６４２の出力を得てその出力に含まれるユーザ入力と関連単語との組み合わせに対する最適な自然数Ｎの値を出力する、上記したＮ評価用ニューラルネットワークを含む連鎖回数推定部７８２とを含む。対話システム７７０はさらに、情報付加装置６４２の出力にさらに連鎖回数推定部７８２の出力した連鎖回数である自然数Ｎを付与する連鎖回数付加部７８４を含む。

　対話システム７７０はさらに、連鎖回数付加部７８４の出力である、ユーザ入力と関連単語と自然数Ｎとを入力として受け、指定されたＮ個の因果的帰結を含む因果的帰結連鎖を出力する応答生成ニューラルネットワーク６３２と、応答生成ニューラルネットワーク６３２の出力する因果的帰結連鎖に対し、ユーザ入力７８０に対する応答としてふさわしくなるような整形を行って応答発話７８８を出力する発話整形部７８６とを含む。

　２　効果
　この第５実施形態によれば、ユーザがユーザ入力７８０を入力（発話）するだけで、対話システム７７０が関連単語を推定し、連鎖回数推定部７８２が自然数Ｎを推定して応答生成ニューラルネットワーク６３２に与える。したがってユーザとしては関連単語を考える必要も、自然数Ｎを指定する必要もない。また応答生成ニューラルネットワーク６３２からは適切な応答発話７８８が得られ、しかもユーザが応答発話７８８の中の因果的帰結から対話システム７７０の思考過程に相当するものを容易に理解できる。その結果、対話システム７７０による対話をユーザにとって有意義な形で発展させることができる。

　なお、ここまでの第３、第４、第５の実施形態の説明では、末尾の因果的帰結には、関連単語として指定された単語又はその単語に近い単語が含まれることを想定しているが、このことは、必ずしも必須ではなく、話題を表す表現が帰結連鎖に含まれない場合も学習してもよい。

　第６　コンピュータによる実現
　図１５は、上記各実施形態を実現するコンピュータシステムの外観図である。図１６は、図１５に示すコンピュータシステムのハードウェアブロック図である。

　図１５を参照して、このコンピュータシステム９５０は、ＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）ドライブ１００２を有するコンピュータ９７０と、いずれもコンピュータ９７０に接続された、ユーザと対話するためのキーボード９７４、マウス９７６、及びモニタ９７２とを含む。もちろんこれらはユーザ対話が必要となったときのための構成の一例であって、ユーザ対話に利用できる一般のハードウェア及びソフトウェア（例えばタッチパネル、音声入力、ポインティングデバイス一般）であればどのようなものも利用できる。

　図１６を参照して、コンピュータ９７０は、ＤＶＤドライブ１００２に加えて、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉt）９９０と、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）９９２と、ＣＰＵ９９０、ＧＰＵ９９２、ＤＶＤドライブ１００２に接続されたバス１０１０とを含む。コンピュータ９７０はさらに、バス１０１０に接続され、コンピュータ９７０のブートアッププログラムなどを記憶するＲＯＭ（Ｒｅａｄ－Ｏｎｌｙ　Ｍｅｍｏｒｙ）９９６と、バス１０１０に接続され、プログラムを構成する命令、システムプログラム、及び作業データなどを記憶するＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）９９８と、バス１０１０に接続された不揮発性メモリであるＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）１０００とを含む。ＳＳＤ１０００は、ＣＰＵ９９０及びＧＰＵ９９２が実行するプログラム、並びにＣＰＵ９９０及びＧＰＵ９９２が実行するプログラムが使用するデータなどを記憶するためのものである。コンピュータ９７０はさらに、他端末との通信を可能とするネットワーク９８６への接続を提供するネットワークＩ／Ｆ（Ｉｎｔｅｒｆａｃｅ）１００８と、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）メモリ９８４が着脱可能で、ＵＳＢメモリ９８４とコンピュータ９７０内の各部との通信を提供するＵＳＢポート１００６とを含む。

　コンピュータ９７０はさらに、マイクロフォン９８２及びスピーカ９８０とバス１０１０とに接続された音声Ｉ／Ｆ１００４を含む。音声Ｉ／Ｆ１００４は、ＣＰＵ９９０により生成されＲＡＭ９９８又はＳＳＤ１０００に保存された音声信号、映像信号及びテキストデータをＣＰＵ９９０の指示にしたがって読み出し、アナログ変換及び増幅処理をしてスピーカ９８０を駆動したり、マイクロフォン９８２からのアナログの音声信号をデジタル化し、ＲＡＭ９９８又はＳＳＤ１０００の、ＣＰＵ９９０により指定される任意のアドレスに保存したりするためのものである。

　上記実施形態では、対話システム５０、３００、６００、及び７７０又はそれらの一部である訓練データ生成装置５４及び６１０、訓練装置５６、対話装置５２、３０２、６１２、７３０及び訓練データ拡張部５８などを実現するためのプログラム、ニューラルネットワークのパラメータ及びニューラルネットワークプログラム、並びに訓練データ、因果関係、因果的帰結連鎖、及び想定入力などは、いずれも例えば図１６に示すＳＳＤ１０００、ＲＡＭ９９８、ＤＶＤ９７８又はＵＳＢメモリ９８４、若しくはネットワークＩ／Ｆ１００８及びネットワーク９８６を介して接続された図示しない外部装置の記憶媒体などに格納される。典型的には、これらのデータ及びパラメータなどは、例えば外部からＳＳＤ１０００に書込まれコンピュータ９７０による実行時にはＲＡＭ９９８にロードされる。場合によっては、プログラムが実行する一部のコードは、その実行時に、コンピュータ９７０の外部から、ネットワーク９８６を介してＲＡＭ９９８にロードされることもあり得る。

　このコンピュータシステムを、上記した各実施形態のシステム及びその各構成要素の機能を実現するよう動作させるためのコンピュータプログラムは、ＤＶＤドライブ１００２に装着されるＤＶＤ９７８に記憶され、ＤＶＤドライブ１００２からＳＳＤ１０００に転送される。又は、これらのプログラムはＵＳＢメモリ９８４に記憶され、ＵＳＢメモリ９８４をＵＳＢポート１００６に装着し、プログラムをＳＳＤ１０００に転送する。又は、このプログラムはネットワーク９８６を通じてコンピュータ９７０に送信されＳＳＤ１０００に記憶されてもよい。

　プログラムは実行のときにＲＡＭ９９８にロードされる。もちろん、キーボード９７４、モニタ９７２及びマウス９７６を用いてソースプログラムを入力し、コンパイルした後のオブジェクトプログラムをＳＳＤ１０００に格納してもよい。スクリプト言語の場合には、キーボード９７４などを用いて入力したスクリプトをＳＳＤ１０００に格納してもよい。仮想マシン上で動作するプログラムの場合には、仮想マシンとして機能するプログラムを予めコンピュータ９７０にインストールしておく必要がある。ニューラルネットワークの訓練及びテストには大量の計算が伴うため、スクリプト言語ではなくコンピュータのネイティブなコードからなるオブジェクトプログラムとして本発明の実施形態の各部を実現する方が好ましい。

　ＣＰＵ９９０は、その内部のプログラムカウンタと呼ばれるレジスタ（図示せず）により示されるアドレスにしたがってＲＡＭ９９８からプログラムを読み出して命令を解釈し、命令の実行に必要なデータを命令により指定されるアドレスにしたがってＲＡＭ９９８、ＳＳＤ１０００又はそれ以外の機器から読み出して命令により指定される処理を実行する。ＣＰＵ９９０は、実行結果のデータを、ＲＡＭ９９８、ＳＳＤ１０００、ＣＰＵ９９０内のレジスタなど、プログラムにより指定されるアドレスに格納する。このとき、プログラムカウンタの値もプログラムによって更新される。コンピュータプログラムは、ＤＶＤ９７８から、ＵＳＢメモリ９８４から、又はネットワークを介して、ＲＡＭ９９８に直接にロードしてもよい。なお、ＣＰＵ９９０が実行するプログラムの中で、一部のタスク（主として数値計算）については、プログラムに含まれる命令により、又はＣＰＵ９９０による命令実行時の解析結果にしたがって、ＧＰＵ９９２にディスパッチされる。

　コンピュータ９７０により上記した各実施形態に係るシステム及びその各部の機能を実現するプログラムは、それら機能を実現するようコンピュータ９７０を動作させるように記述され配列された複数の命令を含む。この命令を実行するのに必要な基本的機能のいくつかはコンピュータ９７０上で動作するオペレーティングシステム（ＯＳ）若しくはサードパーティのプログラム、又はコンピュータ９７０にインストールされる各種ツールキットのモジュールにより提供される。したがって、このプログラムはこの実施形態のシステム及び方法を実現するのに必要な機能全てを必ずしも含まなくてよい。このプログラムは、命令の中で、所望の結果が得られるように制御されたやり方で適切な機能又は「プログラム・ライブラリ」の機能を静的にリンクすることで、又はプログラムの実行時に動的に呼出すことにより、上記した各装置及びその構成要素としての動作を実行する命令のみを含んでいればよい。そのためのコンピュータ９７０の動作方法は周知であるので、ここでは繰返さない。

　なお、ＧＰＵ９９２は並列処理を行うことが可能であり、機械学習に伴う多量の計算を同時並列的又はパイプライン的に実行できる。例えばプログラムのコンパイル時にプログラム中で発見された並列的計算要素、又はプログラムの実行時に発見された並列的計算要素は、随時、ＣＰＵ９９０からＧＰＵ９９２にディスパッチされ、実行され、その結果が直接に、又はＲＡＭ９９８の所定アドレスを介してＣＰＵ９９０に返され、プログラム中の所定の変数に代入される。

　第７　変形例
　上記実施形態では、ウェブから収集した因果関係はそのまま使用し、拡張因果関係についてはその中で適切なもののみを使用している。しかしこの発明はそのような実施形態には限定されない。例えば、訓練に使用する因果関係は何らかの形でフィルタリングしてもよい。１例として、感情極性（ｓｅｎｔｉｍｅｎｔ　ｐｏｌａｒｉｔｙ）がポジティブ又はネガティブに偏った因果関係を選択してもよい。特定の話題との類縁性がトピックワードモデルにより判明した因果関係のみを使用してもよい。そもそも対話の応答として適切なものか否かを手動又は自動でラベル付けし、適切と判定されたものだけを使用してもよい。

　上記実施形態で使用しているニューラルネットワークは、事前学習済のニューラルネットワーク（例えば前述のＢＥＲＴ）を、因果関係から準備した訓練データでファインチューニングしたものである。しかしニューラルネットワークとしては、こうした形式のものに限定されず、例えば以下の文献に記載されたＧＰＴ－３のように何らかの特殊な形式の入力を与えることで因果的帰結を出すようなものを使用してもよい。

　参考文献：Tom　B.　Brown　et　al.,　Language　Models　are　Few-Shot　Learners,　https://arxiv.org/pdf/2005.14165.pdf
　なお、応答生成時には例えば、ユーザ入力を繰り返して、さらに文末表現など深層学習によるニューラルネットワーク又はルールにしたがって変形し応答を返してもよい。対話システムの応答に対してユーザが発する合いの手にあわせて、さらなる因果関係をたどってその帰結を応答の形で提示してもよい。合いの手をどのように解釈するかについては別途学習データを作成し、深層学習により訓練したニューラルネットワークで判定すればよい。　対話システムの応答に対してユーザが否定的な反応をした場合には、なぜ型質問応答をし、さらに応答に使われた文言を帰結部に持つ因果関係を検索してその原因部を提示してもよい。同様に応答生成の経緯をユーザに対して説明してもよい。

　逆に対話システムの応答に対してユーザが肯定的な反応をした場合には、やはり応答の文言を帰結部に持つ因果関係を検索し、その原因部から応答を生成してもよい。

　さらに上記第２実施形態から第５実施形態では、ユーザ入力１０２、６３０、７４０，７８０に対して単語又は想定入力を付加している。しかしこの発明はそのような実施形態には限定されない。付加すべき単語及び想定入力の組合せをニューラルネットワークからなるエンコーダにより固定長の特徴ベクトルに変換し、この特徴ベクトルをユーザ入力１０２、６３０、７４０、７８０に付加したものを応答生成ニューラルネットワーク３４０、６３２への入力としてもよい。

　今回開示された実施形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味及び範囲内での全ての変更を含む。

５０、３００、６００、７７０　対話システム
５２、３０２、６１２、７３０　対話装置
５４、６１０　訓練データ生成装置
５６　訓練装置
５８　訓練データ拡張部
６０　インターネット
６２　因果関係抽出部
６４　因果関係ＤＢ
６６　連鎖因果関係生成部
６８　生成因果関係ＤＢ
７０　連鎖因果関係選択部
７２　連鎖因果関係ＤＢ
７４　拡張因果関係ＤＢ
７６　想定入力抽出部
７８　想定入力記憶部
８０　コンソール
８２、６２６　訓練データ作成部
８４　訓練データ記憶部
８６　訓練部
１００、３４０、６３２　応答生成ニューラルネットワーク
１０２、６３０、７４０、７８０　ユーザ入力
１０４、６３８、７５４、７８６　発話整形部
１０６、６４０、７５６、７８８　応答発話
１５０　想定入力読出部
１５２　名詞句特定部
１５４　因果関係検索部
１５６　訓練データサンプル作成部
３３０、３４４　トピックワードモデル
３３２　関連表現検索部
３３４　訓練データ追加部
３３８、６４２　情報付加装置
３４６　ユーザ入力記憶部
３４８　単語選択部
３５０、７５２　発話選択部
３５２　情報付加部
３６０　訓練データ読出部
３６２　関連表現問合部
３６４　訓練データ書込部
３６６　関連表現付加部
４００　関連想定入力検索部
４０２　関連単語検索部
４０４　関連表現展開部
４０６　関連表現出力部
６１４　質問応答システム
６２０　因果的帰結連鎖生成部
６２２　因果的帰結連鎖記憶部
６２４　因果的帰結連鎖ＤＢ
６３４　質問生成部
７５０　ランキング部
７８２　連鎖回数推定部

Claims

　各々が対話装置への入力として想定される、複数個の想定入力を記憶する想定入力記憶手段と、
　複数の因果関係表現を記憶する因果関係記憶手段と、を含み、
　前記複数の因果関係表現の各々は、原因表現と結果表現とを含み、
　前記想定入力記憶手段に記憶された前記複数個の想定入力の各々について、
　　当該想定入力として所定の関係を持つ因果関係表現を前記複数の因果関係表現から抽出するための因果関係表現抽出手段と、
　　当該想定入力を入力、前記因果関係表現抽出手段により抽出された因果関係表現を回答とする訓練データサンプルを作成し、所定の記憶装置に記憶する訓練データ作成手段と、
　自然言語の入力文に対して出力文を生成するよう設計された、ニューラルネットワークからなる対話装置を前記訓練データ作成手段に記憶された訓練データサンプルを使用して訓練するための訓練手段とを含む、対話装置の訓練装置。
　前記因果関係表現抽出手段は、前記想定入力が持つ名詞句を原因表現に持つ因果関係を前記複数の因果関係表現から抽出するための特定因果関係表現抽出手段を含む、請求項１に記載の訓練装置。
　さらに、単語が与えられると、当該単語の周辺単語の分布確率を、あらかじめ定めた語彙中の単語の各々について出力するようあらかじめ訓練されたトピックワードモデルと、
　前記所定の記憶装置に記憶される訓練データサンプルの因果関係表現の各々について、当該因果関係表現に含まれる単語に対する分布確率の高い単語を前記トピックワードモデルの出力に基づいて特定し、当該訓練データサンプルの前記入力に付加して新たな訓練データサンプルを生成し前記所定の記憶装置に追加するための第１の訓練データサンプル追加手段とを含む、請求項１又は請求項２に記載の訓練装置。
　さらに、前記トピックワードモデルの出力に基づいて、前記所定の記憶装置に記憶される訓練データサンプルの因果関係表現の各々について、当該因果関係表現の周辺単語の分布確率と類似した周辺単語の分布確率を持つ文を所定のコーパスから抽出し、当該訓練データサンプルの前記入力に付加して新たな訓練データサンプルを生成し前記所定の記憶装置に追加するための第２の訓練データサンプル追加手段を含む、請求項３に記載の訓練装置。
　自然言語の入力文に対して出力文を生成するよう設計されたニューラルネットワークを含む、自然言語による対話装置であって、
　前記ニューラルネットワークは、前記出力文が、前記入力文に対する潜在的帰結を表すものとなるように訓練されている、対話装置。
　前記対話装置はさらに、入力文が与えられたことに応答して、前記入力文内の語句に関連する単語又は文を含む表現である関連表現を前記入力文に付加して前記ニューラルネットワークに入力する関連表現付加手段を含む、請求項５に記載の対話装置。
　ユーザの過去の発話を記憶する発話記憶部と、
　入力された単語に対する周辺単語の生起の確率分布を出力するトピックモデルと、
　ユーザ発話を入力として、発話記憶部に記憶された前記ユーザの発話と、トピックモデルとを用いて、前記ユーザ発話に対する応答を生成するための応答生成部とを含む、対話装置。
　ユーザの過去の発話を記憶する発話記憶部と、
　入力された単語に対する周辺単語の生起の確率分布を出力するトピックモデルと、
　ユーザの発話を入力として、その発話に対する応答を生成する応答生成部と、
　前記ユーザの発話に対する前記トピックモデルの出力により、前記応答生成部による前記応答の生成を調整する応答生成調整部とを含む、対話装置。