JP2024011901A

JP2024011901A - 発話フィルタリング装置、対話システム、文脈モデルの学習データの生成装置及びコンピュータプログラム

Info

Publication number: JP2024011901A
Application number: JP2022114229A
Authority: JP
Inventors: 健太郎鳥澤; Kentaro Torisawa; 淳太水野; Junta MIZUNO; ジュリアンクロエツェー; Kloetzer Julien; まな鎌倉; Mana Kamakura
Original assignee: National Institute of Information and Communications Technology
Current assignee: National Institute of Information and Communications Technology
Priority date: 2022-07-15
Filing date: 2022-07-15
Publication date: 2024-01-25
Also published as: WO2024014230A1

Abstract

【課題】対話形式により発話を出力する対話形式システムにおいて、問題となり得る表現が出力されることを防止する発話フィルタリング装置を提供する。【解決手段】発話フィルタリング装置は、発話を表す単語ベクトル列が入力されると、当該発話が置かれた文脈に、所定の単語群に含まれる単語の各々が現れる確率を要素とする確率ベクトルを出力するように予め学習済の文脈モデルと、発話を表す単語ベクトル列を文脈モデルに入力し、当該入力に応答して文脈モデルが出力する確率ベクトルの所定関数として定まる値がしきい値以上か否かに従って、発話を破棄すべきか承認すべきかを判定するための判定部４５６とを含む。【選択図】図６

Description

この発明は、対話装置に関し、特に、対話装置の生成するシステム発話が不適切な表現を含むか否かを判定するための技術に関する。

検索エンジン、質問応答システム、及び対話システムなど、ユーザとシステムとが何らかの対話形式で交信するシステムが普及しつつある。こうしたシステムでは、システムの応答（以下、「システム発話」という。）が、不適切な表現を含まないようにすることが望ましい。

こうした問題に対処するための直接手段は、問題のあるキーワードなどをリストしておくことである。システム発話候補の先頭から、そうしたキーワードのいずれかが含まれていないかどうかを調べる。もしもシステム発話候補がそうしたキーワードを１つでも含んでいればそのシステム発話候補を棄却し、次のシステム発話候補を選択する。こうして、リストされたキーワードを１つも含まないシステム発話候補が見つかれば、そのシステム発話候補を出力する。

後掲の特許文献１にそうした技術が開示されている。特許文献１に開示の技術は、ブラウザにより動的コンテンツを表示する場合に、ブラウザがその動的コンテンツにヘイトスピーチなどの問題となる表現が存在するか否かを判定する。

特開２０２２－０８２５３８号公報

特許文献１に開示された技術は、ブラウザが動的コンテンツを表示する場合、その動的コンテンツをブラウザがアプリケーションから受信したときに、コンテンツの内容をチェックするサーバに送信し、サーバからそのチェック結果を受信する、というものである。サーバにおける判定には、上記したとおり、問題のあるキーワードのリストが用いられる。

特許文献１に開示された技術は、コンテンツ全体に対する判定である。したがって、コンテンツの中に問題のある表現があれば、その一部のみの表示を止めたり、コンテンツ全体の表示を止めたりできる。

これに対し、一般に対話システムなどの出力は１発話である。そのため、仮に特許文献１に開示の技術を対話システムに適用する場合、システムの発話に問題となるキーワードが含まれていればその発話は出力されず、そうでなければ、その発話は出力される。

しかし、現実の発話においては、発話自体に問題となるキーワードが含まれていなくても、その文脈によっては問題とされるような発話もあり得る。例えば、例えば「肌の色」や「出身地」等の表現を問題ある表現として挙げた後、その表現について論評を加える、又は言外に悪意を含む発話をする、というような場合である。この場合、論評自体が悪意ではない場合、又は表現そのものが悪意とはいえない場合でも、問題となる表現を出力すること自体が問題となる可能性がある。例えば公共的なサービスを提供するサイト、又は企業が運営するサイトにおいてそのような表現が出力されると、その前後を見れば問題とはすべきでないよう表現であってもユーザから批判される危険性がある。質問応答システム、対話システムなどの出力は短い表現のみとなることがあり、特許文献１に記載のシステムのようにコンテンツ全体を検査してその出力の可否を決める技術によっては、問題となる可能性がある表現の出力が防止できない。

それ故に、この発明は、対話形式により発話を出力する対話形式システムにおいて、問題となり得る表現が出力されることを防止する発話フィルタリング装置を提供することを目的とする。

この発明の第１の局面に係る発話フィルタリング装置は、発話を表す単語ベクトル列が入力されると、当該発話が置かれた文脈に、所定の単語群に含まれる単語の各々が現れる確率を要素とする確率ベクトルを出力するように予め学習済の文脈モデルと、発話を表す単語ベクトル列を文脈モデルに入力し、当該入力に応答して文脈モデルが出力する確率ベクトルの少なくとも１つの要素が所定の条件を充足するか否かに従って、発話を破棄すべきか承認すべきかを判定するための判定手段とを含む。

好ましくは、判定手段は、確率ベクトルの少なくとも１つの要素の所定関数として定まる値が所定のしきい値以上か否かに従って、発話を破棄すべきか承認すべきかを判定するための手段を含む。

この発明の第２の局面に係る対話システムは、対話装置と、対話装置の出力する発話候補を入力として受けるように対話装置に結合された、上記した発話フィルタリング装置と、発話フィルタリング装置による判定結果に従って、対話装置の出力する発話をフィルタリングするための発話フィルタリング手段とを含む。

この発明の第３の局面に係るコンピュータプログラムは、コンピュータを、発話を表す単語ベクトル列が入力されると、当該発話が置かれた文脈に、所定の単語群に含まれる単語の各々が現れる確率を要素とする確率ベクトルを出力するように予め学習済の文脈モデルと、発話を表す単語ベクトル列を文脈モデルに入力し、当該入力に応答して文脈モデルが出力する確率ベクトルに基づいて、所定の単語群に含まれるいずれかの単語の確率がしきい値以上か否かに従って、発話を破棄すべきか承認すべきかを判定するための判定手段として機能させる。

この発明の第４の局面に係る学習データの生成装置は、コーパスに格納された各発話について、当該発話の文脈を抽出するための文脈抽出手段と、所定の単語群に含まれる単語の各々が、少なくとも文脈に出現しているか否かを示す文脈ベクトルを生成するための文脈ベクトル生成手段と、コーパスに格納された各発話について、当該発話を入力とし、文脈ベクトルを出力として組み合わせた学習データを生成するための学習データ生成手段とを含む。

好ましくは、文脈抽出手段は、コーパスに格納された各発話の文脈として、当該発話の前後の発話を抽出するための前後発話抽出手段を含む。

より好ましくは、文脈抽出手段は、コーパスに格納された各発話の文脈として、当該発話の直後に後続する発話を抽出するための後続発話抽出手段を含む。

さらに好ましくは、コーパスは、各々が原因部と結果部とを含む複数の因果関係表現を含み、文脈抽出手段は、複数の因果関係表現の各々について、当該因果関係表現の原因部を発話とし、因果関係表現の結果部を発話の文脈として抽出するための結果部抽出手段を含む。

この発明の第５の局面に係るコンピュータプログラムは、コンピュータを、コーパスに格納された各発話について、当該発話の文脈を抽出するための文脈抽出手段と、所定の単語群に含まれる単語の各々が、少なくとも文脈に出現しているか否かを示す文脈ベクトルを生成するための文脈ベクトル生成手段と、コーパスに格納された各発話について、当該発話を入力とし、文脈ベクトルを出力として組み合わせた学習データを生成するための学習データ生成手段と、学習データ生成手段により生成された学習データを用いて、ニューラルネットワークからなる文脈モデルの学習を行うための学習手段として機能させる。

この発明の上記及び他の目的、特徴、局面及び利点は、添付の図面と関連して理解されるこの発明に関する次の詳細な説明から明らかとなるであろう。

図１は、この発明の第１実施形態に係る対話システムの構成を示すブロック図である。図２は、図１に示す学習データ作成部を実現するコンピュータプログラムの制御構造を示すフローチャートである。図３は、図２に示すステップを実現するコンピュータプログラムの制御構造を示すフローチャートである。図４は、図１に示す文脈モデルの構成を示すブロック図である。図５は、図４に示す文脈モデルの学習の仕組みを示すブロック図である。図６は、図１に示す対話装置を実現するコンピュータプログラムの制御構造を示すフローチャートである。図７は、第１実施形態の変形例における、図６に対応するコンピュータプログラムの制御構造を示すフローチャートである。図８は、この発明の第２実施形態に係る対話システムの構成を示すブロック図である。図９は、図８に示す学習データ作成部を実現するコンピュータプログラムの制御構造を示すフローチャートである。図１０は、図９に示す処理の一部を実現するコンピュータプログラムの制御構造を示すフローチャートである。図１１は、この発明の第３実施形態に係る対話システムの構成を示すブロック図である。図１２は、図１１に示す対話システムを実現するコンピュータプログラムの制御構造を示すフローチャートである。図１３は、この発明の各実施形態を実現するコンピュータの外観図である。図１４は、図１３に外観を示すコンピュータシステムのハードウェアブロック図である。

以下の説明及び図面においては、同一の部品には同一の参照番号を付してある。したがって、それらについての詳細な説明は繰返さない。

１．第１実施形態
Ａ．構成
図１を参照して、この発明の第１実施形態に係る対話システム５０は、対話装置６２と、対話装置６２において、システム発話の候補のフィルタリングを行う際に使用される文脈モデル８０と、複数のパッセージを記憶するパッセージＤＢ（Ｄａｔａｂａｓｅ）７０と、パッセージＤＢ７０に記憶された各パッセージを使用して文脈モデル８０の学習を行うための文脈モデル学習システム６０とを含む。

対話装置６２は、入力発話８２を受けて、入力発話８２に対する応答として複数の応答候補を生成して出力するための対話エンジン８４と、文脈モデル８０を使用して対話エンジン８４が出力する複数の応答候補をフィルタリングし、文脈モデル８０によって問題がないと判定された応答候補であって入力発話８２に対する応答として最適と判定された応答候補をシステム発話８８として出力するためのフィルタリング部８６とを含む。

この実施形態においては、対話エンジン８４は、インターネットから収集した文の中から入力発話８２に対する応答として適切と考えられる複数個の文を選択し、それぞれに入力発話８２に対する応答として適切さを示すスコアを算出し、そのスコアの上位の所定個数を応答候補として出力する機能を持つ。対話エンジン８４としては例えば、特開２０１９－１９７４９８に開示の対話システムを使用できる。上記文献に記載の対話システムにおいては、システム発話の候補は予め収集された多数の文から選択される。特に、予め収集された文の数が多いほど、入力発話８２に対して適切な応答が見つけられる可能性が高くなる。したがって、これら多数の文は予めインターネット上から収集される。周知のように、インターネット上に存在する文の中には、表現として問題となり得るものも多い。したがって、実際にシステム発話としてどのような文を選択すべきかが問題となる。

パッセージＤＢ７０は、複数のパッセージを記憶する。複数のパッセージの各々は、文章の一部である連続する複数の文を含む。各パッセージが含む文は、例えば３文から９文程度である。この実施形態においては、パッセージＤＢ７０が記憶する各パッセージが含む文の数は様々である。これらパッセージは、上述したようにいずれも予めインターネットから収集されたものである。

文脈モデル学習システム６０は、問題となり得る、又は問題を指し示す表現、キーワード、概念などを含む、予め準備されたトピック単語を列挙したトピック単語リスト７４と、パッセージＤＢ７０に記憶された各パッセージに基づき、トピック単語リスト７４に記憶されたトピック単語の各々を使用して、文脈モデル８０の学習データを生成するための学習データ作成部７２とを含む。この実施形態においては、トピック単語リスト７４は、例えば問題となるキーワードを所定のデリミタにより区切って、コンピュータ読取可能な記憶媒体に記録したファイルを想定する。またトピック単語の数はＮとする。

文脈モデル学習システム６０はさらに、学習データ作成部７２により生成された学習データを記憶するための学習データ記憶部７６と、学習データ記憶部７６に記憶された学習データを用いて学習部７８の学習を実行するための学習部７８とを含む。

図１に示す学習データ作成部７２は、コンピュータハードウェアと、コンピュータハードウェアにより実行されるコンピュータプログラムとにより実現される。図２を参照して、そのコンピュータプログラムは、起動後、プログラムが使用する記憶領域の確保及び初期化、使用するファイルのオープン、初期パラメータの読み込み、データベースにアクセスするためのパラメータの設定などの初期化処理を実行するステップ１５０と、図１に示すトピック単語リスト７４をファイルから読み出し、デリミタにより示される箇所において分離して、メモリにそれらを配列Ｔの各要素として展開し記憶するためのステップ１５２とを含む。

このプログラムはさらに、変数ＭＡＸ_Ｔに配列Ｔの添字の最大値を代入するステップ１５４と、図１に示すパッセージＤＢ７０に接続するステップ１５６とを含む。この実施形態においては、配列Ｔの添字は０から開始するものとする。すなわち、配列Ｔの要素数は変数ＭＡＸ_Ｔの値＋１である。

このプログラムはさらに、パッセージＤＢ７０に記憶された各パッセージに対して以下のステップ１６０を実行して文脈モデル８０の学習データを生成するステップ１５８と、ステップ１５８において生成された学習モデルを学習データ記憶部７６に保存してこのプログラムの実行を終了するステップ１６２とを含む。

ステップ１６０は、処理対象のパッセージを文に分割し、各文を配列Ｓに展開するステップ２００と、変数ＭＡＸ_Ｓに配列Ｓの最大添字の値を代入するステップ２０２とを含む。ステップ１６０はさらに、繰り返し制御変数ｊ＝１からｊ＝ＭＡＸ_Ｓ－１までの変数ｊの各値に対してステップ２０６の学習データを作成する処理を実行するステップ２０４とを含む。

図３を参照して、図２に示すステップ２０６は、要素数Ｎ＋１の、要素が全て零のベクトルＺを生成するステップ２５０と、文字列変数Ｓ３にＳ［ｊ－１］、Ｓ［ｊ］、及びＳ［ｊ＋１］を連結した文字列を代入するステップ２５２と、繰り返し変数ｉ＝０からＮ－１まで、変数ｉの１を１ずつ増分しながらステップ２５６を繰り返し実行するステップ２５４とを含む。ベクトルＺは、要素Ｚ_０から要素Ｚ_ＮまでのＮ＋１個の要素を持つ。Ｎは前述したとおり、トピック単語リスト７４（図１を参照）にリストされたトピック単語の数である。

ステップ２５６は、処理対象のトピックワード、すなわち配列Ｔの添字＝０の要素Ｔ［ｉ］が文字列変数Ｓ３の表す文字列の中に存在するか否かに従って制御の流れを分岐させるステップ３００と、ステップ３００における判定が肯定的なときに、ベクトルＺのｉ番目の要素Ｚ_ｉに１を代入するステップ３０２とを含む。ステップ３００における判定が否定的なとき、及びステップ３０２の後にはステップ２５６は終了する。

ステップ２０６はさらに、ステップ２５４の完了後に、ベクトルＺの要素のうち、非零の要素数を変数Ｍに代入するステップ２５８と、変数Ｍの値が０か否かに従って制御の流れを分岐させるステップ２６０とを含む。ステップ２０６はさらに、ステップ２６０における判定が肯定的なときに、ベクトルＺのＮ＋１番目の要素に１を代入するステップ２６２と、ステップ２６０における判定が否定的なときに、ベクトルＺを変数Ｍの値により除算するステップ２６４と、ステップ２６２及び２６４の後に、入力が配列Ｓのｊ番目の成分、すなわちＳ［ｊ］であり、出力がベクトルＺである学習データのレコードを学習データに追加してステップ２０６を終了するステップ２６６とを含む。

ステップ２６２の処理が実行される場合、ベクトルＺの成分のうち、Ｎ＋１番目の要素Ｚ_Ｎの値のみが１となり、他の全ての要素Ｚ_ｋ（ｋ＝０からＮ－１）の値は０となる。ステップ２６４が実行される場合、ベクトルＺの要素のうち、要素Ｚｋ（ｋ＝０からＮ－１）は、文字列変数Ｓ３に代入された文字列の中に、その要素に対応するトピック単語が存在する場合には１／Ｍ、そうでない場合には０の値をとる。一方、要素Ｚ_Ｎの値は、文字列変数Ｓ３に代入された文字列の中に、その要素に対応するトピック単語が１つも存在しない場合には１、そうでない場合には０の値をとる。

図４に文脈モデル８０の概略構成を示す。図４を参照して、文脈モデル８０は、先頭に入力の先頭を示すＣＬＳトークン３４０が、末尾に文の区切りを示すＳＥＰトークン３４２が、それぞれ付された発話３５０を入力として受ける、ニューラルネットワークであるＢＥＲＴ（ＢｉｄｉｒｅｃｔｉｏｎａｌＥｎｃｏｄｅｒＲｅｐｒｅｓｅｎｔａｔｉｏｎｓｆｒｏｍＴｒａｎｓｆｏｒｍｅｒｓ）３５２と、ＢＥＲＴ３５２の最終隠れ層３５４の、ＣＬＳトークン３４０に対応するトランスフォーマ層であるＣＬＳ対応層３５６の内容をベクトルとして受けるように接続された、Ｎ＋１個の出力を持つ全結合層３５８とを含む。文脈モデル８０はさらに、全結合層３５８からのＮ＋１個の出力に対してｓｏｆｔＭａｘ演算を実行し、確率ベクトル３６２を出力するためのＳｏｆｔＭａｘ層３６０を含む。ＢＥＲＴ３５２は、この実施形態においては事前学習済のＢＥＲＴ_{Ｌａｒｇｅ}である。

図５は、ＢＥＲＴ３５２の学習時の、ＢＥＲＴ３５２と学習データとの関係を図示する。図５を参照して、学習データ４００は、前述したとおり、入力として文（学習データ作成時における要素Ｓ［ｊ］）を含み、出力（正解データ）としてベクトルＺを持つ。

学習時には、学習データ４００内の文の先頭にＣＬＳトークン３４０、末尾にＳＥＰトークン３４２を付してＢＥＲＴ３５２に入力する。この入力に応答してＳｏｆｔＭａｘ層３６０の出力には確率ベクトル３６２が得られる。この確率ベクトル３６２の各要素と学習データ４００内の正解ラベルベクトル４０４との間の誤差を用いた誤差逆伝播法によりＢＥＲＴ３５２及び全結合層３５８の学習が行われる。

図６を参照して、図１に示すフィルタリング部８６を実現するプログラムは、入力発話８２を対話エンジン８４に入力するステップ４５０と、ステップ４５０における処理に応答して対話エンジン８４から出力されるシステム発話候補リストを取得するステップ４５２とを含む。

このプログラムはさらに、ステップ４５２において取得されたシステム発話候補リストの中の候補の各々について、システム発話として適切か否かを判定し、適切なら承認して残し、不適切なら棄却するステップ４５６を実行するステップ４５４と、ステップ４５４が完了した後に、承認された候補に対して入力発話８２に対するシステム発話として適切な形式となる修正を行い、改めてスコアリングして再ランキングし、最もスコアの高いシステム発話候補をシステム発話８８（図１）として出力するステップ４５８とを含む。

ステップ４５６は、対象となるシステム発話候補を文脈モデル８０に入力するステップ４８０と、ステップ４８０における処理の結果、文脈モデル８０から出力される確率ベクトル３６２を取得するステップ４８２と、ステップ４８２において取得された確率ベクトルのうち、予め好ましくない単語として指定されていた１又は複数の単語に対応する要素の最大値を取得するステップ４８４とを含む。

ステップ４５６はさらに、ステップ４８４において取得された値が所定のしきい値より大きいか否かを判定し、判定に従って制御の流れを分岐させるステップ４８６と、ステップ４８６における判定が肯定的なら、処理対象のシステム発話候補を破棄してステップ４５６を終了するステップ４８８と、ステップ４８６における判定が否定的なら、処理対象のシステム発話候補を承認し残してステップ４５６を終了するステップ４９０とを含む。

Ｂ．動作
上記第１実施形態に係る対話システム５０は以下のように動作する。対話システム５０の動作は、学習フェーズと対話フェーズとを含む。以下、最初に学習フェーズにおける対話システム５０（文脈モデル学習システム６０）の動作につき説明する。その後、対話フェーズにおける対話システム５０（対話装置６２）の動作につき説明する。

Ｂ１．学習フェーズ
学習フェーズにおいては、まず、パッセージＤＢ７０が準備される。パッセージＤＢ７０に記憶される各パッセージは、この実施形態においてはインターネット上から収集される。同様にトピック単語リスト７４も準備される。トピック単語リスト７４は、例えばパッセージＤＢ７０に記憶されたパッセージ群において出現する頻度が所定のしきい値より高い単語のリストである。すなわちこのリストは、しきい値を指定すればパッセージＤＢ７０などから自動的に抽出できる。なお、この実施形態においては、トピック単語リスト７４は、各単語を所定のデリミタにより区分した文字列を格納したファイルである。

学習データ作成部７２は、トピック単語リスト７４を参照しながら、パッセージＤＢ７０から以下のようにして学習データを生成する。

図１を参照して、文脈モデル学習システム６０が起動すると、学習データ作成部７２は、コンピュータの各部を初期化する（図２のステップ１５０。以下、特に図面番号を指定しない限り、ステップ番号は図２に示すものである。）。この処理において学習データ作成部７２は、パッセージＤＢ７０にアクセスするためのパラメータを設定し、トピック単語リスト７４をオープンする。対話装置６２はまた、配列Ｔ及びＳ、変数Ｓ３及びＭ、繰り返し制御変数ｉ及びｊ、並びにベクトルＺの記憶領域を確保する。

続いて学習データ作成部７２は、トピック単語リスト７４を読み、所定のデリミタで分離しながらその内容を配列Ｔの各要素に格納する（ステップ１５２）。学習データ作成部７２はさらに、変数ＭＡＸ_Ｔに配列Ｔの添字の最大値を代入する（ステップ１５４）。学習データ作成部７２はその後、図１に示すパッセージＤＢ７０に接続する（ステップ１５６）。この実施形態においては、配列Ｔの添字は０から変数ＭＡＸ_Ｔの値までである。

学習データ作成部７２はさらに、パッセージＤＢ７０に記憶された各パッセージに対して以下のステップ１６０を実行することにより、学習データのレコードを生成する（ステップ１５８）。

ステップ１６０において学習データ作成部７２は、まず、処理対象のパッセージを文に分割し、各文を配列Ｓの各要素に格納する（ステップ２００）。さらに学習データ作成部７２は、変数ＭＡＸ_Ｓに配列Ｓの最大添字の値を代入する（ステップ２０２）。学習データ作成部７２はさらに、ステップ２０４において、繰り返し制御変数ｊ＝１からｊ＝ＭＡＸ_Ｓ－１までの変数ｊの各値に対してステップ２０６を実行し、学習データの新たなレコードを作成する。

図３を参照して、ステップ２０６においては、学習データ作成部７２は、要素が全て零のベクトルＺを生成する（図３のステップ２５０）。すなわち、このステップにおいて、ベクトルＺが初期化される。続いて学習データ作成部７２は、文字列変数Ｓ３にＳ［ｊ－１］、Ｓ［ｊ］、及びＳ［ｊ＋１］を連結した文字列を代入する（図３のステップ２５２）。さらに学習データ作成部７２は、繰り返し変数ｉ＝０からＮ－１まで、変数ｉの１を１ずつ増分しながらステップ２５６を繰り返し実行する（図３のステップ２５４）。

学習データ作成部７２は、ステップ２５６において、処理対象の配列Ｔの要素Ｔ［ｉ］が文字列変数Ｓ３の表す文字列の中に存在するか否かを判定する（図３のステップ３００）。学習データ作成部７２は、ステップ３００における判定が肯定的なときに、ベクトルＺのｉ番目の要素Ｚ_ｉに１を代入する（図３のステップ３０２）。ステップ３００における判定が否定的なときには何も行わない。

繰り返し変数ｉ＝０からＮ－１まで、変数ｉの１を１ずつ増分しながら文脈モデル学習システム６０がステップ２５６を実行する。この処理により、要素Ｔ［ｉ］が文字列変数Ｓ３の表す文字列の中に存在する場合には、ベクトルＺのｉ番目の要素Ｚ_ｉの値が１となり、さもなければ要素Ｚｉの値は０となる。

ステップ２５４が完了した後、学習データ作成部７２は、ベクトルＺの要素のうち、非零の要素数を変数Ｍに代入する（図３のステップ２５８）。学習データ作成部７２は、変数Ｍの値が０か否かを判定する（図３のステップ２６０）。学習データ作成部７２は、ステップ２６０における判定が肯定的なとき、すなわちベクトルＺの要素の中に非零の要素が１個もなければ、ベクトルＺのＮ＋１番目の要素に１を代入する（図３のステップ２６２）。学習データ作成部７２は、ステップ２６０における判定が否定的ならば、すなわちベクトルＺの中に非零の要素が１個でもあれば、ベクトルＺを変数Ｍの値により除算する（図３のステップ２６４）。

文脈モデル学習システム６０がこの図３に示すステップ２０６を実行することにより、あるパッセージの、変数ｊのある値（１≦ｊ≦ＭＡＸ_Ｓ－１）により示される文と、その前後の文とを結合した文字列内（文字列変数Ｓ３の値）に、トピック単語リスト７４の単語が１つでも存在していれば、ベクトルＺのそれらの単語に対応する要素の値が１／Ｍとなり、それ以外の要素の値が０となるようなベクトルＺが得られる。もしもトピック単語リスト７４のいずれの単語も文字列変数Ｓ３が表す文字列内に存在していなければ、ベクトルＺのＮ番目の要素Ｚ_Ｎは１となり、他の全ての要素の値は０となる。

この後、学習データ作成部７２は、要素Ｓ［ｊ］を入力とし、ベクトルＺを出力として組み合わせることにより、要素Ｓ［ｊ］に対応する学習データの新たなレコードを生成し、学習データ記憶部７６に追加する（ステップ２６６）。

学習部７８は、学習データの作成が完了した後、この学習データを用いて文脈モデル８０の学習を行う。

図５を参照して、学習部７８による文脈モデル８０の学習について説明する。学習データ４００は、前述したとおり、入力として文（学習データ作成時における要素Ｓ［ｊ］）を含み、出力（正解データ）としてベクトルＺを持つ。図１に示す学習部７８は、学習データ４００の１レコードを読み、文の先頭にＣＬＳトークン３４０を、末尾にＳＥＰトークン３４２を付して学習用発話４０２を生成し、ＢＥＲＴ３５２に入力する。ＢＥＲＴ３５２はこの入力に対する演算を行い、その各隠れ層の内部状態を変化させる。全結合層３５８は、ＢＥＲＴ３５２の最終隠れ層のＣＬＳ対応層３５６の出力ベクトルを受け、Ｎ＋１個の出力をＳｏｆｔＭａｘ層３６０に入力する。全結合層３５８の各位置の出力は、学習用発話４０２が、トピック単語リスト７４にリストされた単語の中において、その位置に対応する単語と関連している確率を表す数値である。正解ラベルベクトル４０４は、これらＮ＋１個の数値に対してｓｏｆｔＭａｘ演算を行い、Ｎ＋１個の要素Ｐ（０）からＰ（Ｎ）からなる確率ベクトル３６２を出力する。

学習部７８は、この確率ベクトル３６２と、学習用発話４０２に対応する正解ラベルベクトル４０４の各要素との誤差を用いて、誤差逆伝播法によりＢＥＲＴ３５２及び全結合層３５８のパラメータの学習を行う。学習部７８は、実際には上記した処理を学習データから選択したミニバッチごとに繰り返し実行する処理を所定の終了条件が成立するまで実行する。なお、この実施形態においては、この学習は以下に示す損失関数Ｌの値を最小化することにより行われる。

このようにして学習が終了すると、文脈モデル８０を対話装置６２において使用できるようになる。

Ｂ２．対話フェーズ
図１を参照して、ユーザが入力発話８２を対話エンジン８４に入力する。対話エンジン８４は、入力発話８２に応答して、予めインターネットから収集した多数の文の中から入力発話８２に対する応答として適切と思われる複数のシステム発話候補を選択する。入力発話８２は、これら複数のシステム発話候補の各々に対し所定のスコアリング方法によりスコアを演算し、スコアに基づいてこれらシステム発話候補をランキングする。入力発話８２は、このランキングによる上位の所定個数のシステム発話候補をフィルタリング部８６に与える。

この実施形態においては、フィルタリング部８６は、対話エンジン８４から受けた各システム発話候補を文脈モデル８０に入力し、その出力として確率ベクトル３６２を得る。フィルタリング部８６は、この確率ベクトル３６２のうち、システム発話としてふさわしくないとして予め定められた要素の確率値が所定のしきい値より大きいか否かを判定する（ステップ４８６）。もしもこの判定が肯定的ならフィルタリング部８６はそのシステム発話候補を破棄する（ステップ４８８）。もしもこの判定が否定的ならフィルタリング部８６はそのシステム発話候補を承認し残す（ステップ４９０）。

フィルタリング部８６は、このようにして残ったシステム発話候補に対し、入力発話８２に対する応答としてふさわしい形にするための修正を行う。フィルタリング部８６は、修正後のシステム発話候補を改めてスコアリングし、最も高いスコアのシステム発話候補をシステム発話８８として出力する。

以上のようにこの実施形態によれば、システム発話候補のテキストそのものだけではなく、その文脈に出現する単語の可能性まで考慮して対話におけるシステム発話を選択する。システム発話は通常は１文であり、その前後の文脈は実際には存在しない。そのため、その発話が問題を生じ得る発話か否かをそのシステム発話のみから判定することはむずかしい。しかしこの実施形態によれば、システム発話がその前後の文脈とどのような関係を持ちうるかという情報を用いてシステム発話の選択を行うため、システム発話を出力することにより何らかの問題が生じる確率を低く抑えることができる。

Ｃ．変形例
上記第１実施形態においては、図６のステップ４８４からステップ４９０において示すように、出力確率ベクトルの中の指定された要素の値の最大値がしきい値より大きいか否かに従って、候補を破棄するか残すかを決めている。すなわち、出力確率ベクトルの要素の値をそのまま判定に用いている。しかしこの発明はそのような実施形態に限定されるわけではない。システム発話としてふさわしくないとしてあらかじめ定められた要素の確率値が所定のしきい値か否かを判定する際、確率ベクトルの１つの要素のみではなく、複数の要素を使用して判定してもよい。複数の要素を用いて判定する場合、例えば２つの要素の値がともにそれぞれ所定のしきい値以下か、あるいは他の要素がその所定のしきい値以上のどちらかが成り立つときは肯定的な判定をするというような、複数の要素に対する条件の論理式の値により判定することも可能であるし、より一般的に確率ベクトルの１又は複数の要素を所定関数に代入した値を用いて判定を行ってもよい。以下に説明するのはそのような変形例である。

図７に、第１実施形態の変形例について、図６に示す処理に対応する処理を実現するプログラムの制御構造を示す。このプログラムが図６に示すのと異なるのは、図６のステップ４５４に代えて、各候補についてステップ５０２を実行するステップ５００を含む点である。

図７を参照して、ステップ５０２は、図６に示すものと同じステップ４８０及びステップ４８２と、出力ベクトルの要素の間で所定の演算を実行するステップ５１０と、ステップ５１０における演算の結果が１か否かに従って制御の流れを分岐させるステップ５１２とを含む。ステップ５１２における判定が肯定的なら、すなわちステップ５１０における論理演算の結果が１ならステップ４８８において処理中の候補は破棄される。ステップ５１２における判定が否定的なら、ステップ４９０において処理中の候補は承認され残される。

ステップ５１０における演算は、この実施形態においては予め出力確率ベクトルの要素が満たすべき条件に従って論理を組んでおくことにより実現される。出力確率ベクトルのｉ番目の要素をａ_ｉと表せば、ａ_ｉは、トピック単語リストのｉ番目の単語がシステム発話候補の周辺に出現する確率を表す。したがって、この出力確率ベクトルの複数の要素に対して所定の論理演算を行うことにより、対象となるシステム発話候補を破棄すべきか残すべきかに関する複合的な条件が判定できる。

例えば、「トピック単語リストのｉ１番目の単語とｉ２番目の単語とがシステム発話候補の周辺に同時に出現する確率がしきい値より高いときにはそのシステム発話候補を破棄する」という条件に対しては、「もしもａ_ｉ１＊ａ_ｉ２＞しきい値ならシステム発話候補を破棄」というロジックを組んでおけばよい。

すなわち、この変形例によっても、第１実施形態と同様の効果を得ることができる。変形例においては、さらに第１実施形態よりも複雑な条件が設定できるので、よりシステム開発者の意図を明確に対話システムの動作に反映させることができる。

なお、第１実施形態においては、出力確率ベクトルはＳｏｆｔＭＡＸ関数により全要素の値の和が１となるように正規化されている。しかし、上記したような演算を行う場合、しきい値を適切に調整できれば、ＳｏｆｔＭＡＸ関数への入力前のＢＥＲＴの出力ベクトルをそのまま使用してもよい。また、第１実施形態と上記変形例とを組み合わせることもできる。

２．第２実施形態
Ａ．構成
第１実施形態においては、図１に示すようにパッセージＤＢ７０に格納された各パッセージについて、対象となる文と、その直前の文と直後の文とを文脈として文脈モデル８０の学習を行っている。しかしこの第２実施形態においては、対象となる表現に後続する表現のみを対象の表現の文脈として文脈モデルの学習を行う。

この第２実施形態においてはさらに、第１実施形態と異なり、対象となる表現と、その文脈である直後の表現との関係が因果関係を構成するようにして文脈モデルのための学習データを作成する点においても第１実施形態と異なる。

図８を参照して、第２実施形態に係る対話システム５５０は、文脈モデル５８０と、文脈モデル学習システム５６０と、学習後の文脈モデル５８０を利用してシステム発話のフィルタリングをして、入力発話８２に対するシステム発話５８４を出力する対話装置５６２とを含む。

文脈モデル学習システム５６０は、インターネットから収集した多数の表現を記憶するコーパス５７０とコーパス５７０から因果関係を表す文又は表現を抽出するための因果関係抽出部５７２と、因果関係抽出部５７２が抽出因果関係を記憶するための因果関係コーパス５７４とを含む。

因果関係とは、因果関係の原因を表す表現である原因フレーズと、その結果を表す表現である結果フレーズとを含むフレーズ対をいう。そしてこの実施形態においては、原因フレーズに対し、対応する結果フレーズをその原因フレーズに対する文脈として文脈モデル５８０の学習データを生成する。

文脈モデル学習システム５６０はさらに、トピック単語リスト７４と、トピック単語リスト７４を参照しながら因果関係コーパス５７４に格納された各フレーズ対を用いて学習データの各レコードを作成するための学習データ作成部５７６と、学習データ作成部５７６により作成された学習データの各レコードを格納するための学習データ記憶部５７８とを含む。

文脈モデル学習システム５６０はさらに、学習データ記憶部５７８に格納された学習データにより文脈モデル５８０の学習を行うための学習部７８を含む。

対話装置５６２は、第１実施形態と同じく、入力発話８２を受けて複数個のシステム発話候補を出力するための対話エンジン８４と、文脈モデル５８０を使用して対話エンジン８４が出力する複数の応答候補をフィルタリングし、文脈モデル５８０によって問題がないと判定された応答候補であって入力発話８２に対する応答として最適と判定された応答候補をシステム発話５８４として出力するためのフィルタリング部５８２とを含む。

因果関係抽出部５７２のように大量の文書を含むコーパスから因果関係を抽出する処理については、例えば特開２０１８－６０３６４号公報に開示の技術を適用できる。

図９を参照して、図８に示す文脈モデル学習システム５６０を実現するためにコンピュータにより実行されるプログラムは、起動直後の初期化を行うステップ６２０と、図８に示すトピック単語リスト７４をファイルから読み出し、デリミタにより示される箇所において分離して、メモリにそれらを配列Ｔの各要素として展開し記憶するためのステップ１５２とを含む。

このプログラムはさらに、変数ＭＡＸ_Ｔに配列Ｔの添字の最大値を代入するステップ１５４と、図８に示す因果関係コーパス５７４に接続するステップ６２２と、因果関係コーパス５７４に格納されている各因果関係に対してステップ６２６を実行することにより学習データを作成するステップ６２４と、ステップ６２４により作成された学習データを図８に示す学習データ記憶部５７８に保存し処理を終了するステップ６２８とを含む。

図１０を参照して、図９に示すステップ６２６は、図３に示す第１実施形態のステップ２０６を実現するプログラムとほぼ同様の制御構造を持つ。ステップ２０６と異なり、ステップ６２６は、図３のステップ２５２に代えて、文字列変数Ｓ３に、処理対象の因果関係の結果フレーズを代入するステップ６５０を含む。ステップ２０６とさらに異なり、ステップ６２６は、図３のステップ２６６に代えて、入力が処理対象の因果関係の原因フレーズであり、出力がベクトルＺである学習データのレコードを学習データに追加してステップ６２６を終了するステップ６５４を含む。

Ｂ．動作
上記第２実施形態に係る図８に示す対話システム５５０は以下のように動作する。対話システム５５０の動作は、学習フェーズと対話フェーズとを含む。これらのうち、対話フェーズにおける対話装置５６２の構成は、使用する文脈モデルが異なる点を除き第１実施形態における対話装置６２と同じであり、動作も同じである。したがって、以下においては、学習フェーズにおける対話システム５５０（文脈モデル学習システム５６０）の動作につき説明する。

Ｂ１．学習フェーズ
学習フェーズに先立ち、コーパス５７０には大量のテキストが蓄積されている。これらのテキストは、例えばインターネットから収集するようにしてもよい。因果関係抽出部５７２がこれらの大量のテキストから因果関係を抽出し、因果関係コーパス５７４に蓄積する。

学習データ作成部５７６がトピック単語リスト７４を参照しながら因果関係コーパス５７４に記憶された各因果関係を使用して学習データを作成し学習データ記憶部５７８に蓄積する。

図８を参照して、文脈モデル学習システム５６０が起動すると、学習データ作成部５７６は、コンピュータの各部を初期化する（図９のステップ６２０。以下、特に図面番号を指定しない限り、ステップ番号は図９に示すものである。）。この処理において学習データ作成部５７６は、因果関係コーパス５７４にアクセスするためのパラメータを設定し、トピック単語リスト７４をオープンする。学習データ作成部５７６はまた、配列Ｔ及びＳ、変数Ｓ３及びＭ、繰り返し制御変数ｉ及びｊ、並びにベクトルＺの記憶領域を確保する。

続いて学習データ作成部５７６は、トピック単語リスト７４を読み、所定のデリミタにより分離しながらその内容を配列Ｔの各要素に格納する（ステップ１５２）。学習データ作成部５７６はさらに、変数ＭＡＸ_Ｔに配列Ｔの添字の最大値を代入する（ステップ１５４）。学習データ作成部５７６はその後、図８に示す因果関係コーパス５７４に接続する（ステップ６２２）。この実施形態においても、配列Ｔの添字は０から変数ＭＡＸ_Ｔの値までである。

学習データ作成部５７６はさらに、因果関係コーパス５７４に記憶された各因果関係に対して以下のステップ６２６を実行することにより、学習データのレコードを生成する（ステップ６２４）。

図１０を参照して、ステップ６２６において、学習データ作成部５７６は、要素が全て零のベクトルＺを生成する（図１０のステップ２５０）。すなわち、このステップにおいて、ベクトルＺが初期化される。続いて学習データ作成部５７６は、文字列変数Ｓ３に処理対象の因果関係の結果フレーズの文字列を代入する（図１０のステップ６５０）。さらに学習データ作成部５７６は、繰り返し変数ｉ＝０からＮ－１まで、変数ｉの１を１ずつ増分しながらステップ２５６を繰り返し実行する（図１０のステップ６５２）。

学習データ作成部５７６は、ステップ２５６において、処理対象の配列Ｔの要素Ｔ［ｉ］が文字列変数Ｓ３の表す文字列の中に存在するか否かを判定する（図１０のステップ３００）。学習データ作成部５７６は、ステップ３００における判定が肯定的なときに、ベクトルＺのｉ番目の要素Ｚ_ｉに１を代入する（ステップ３０２）。ステップ３００における判定が否定的なときには学習データ作成部５７６は何も行わない。

繰り返し変数ｉ＝０からＮ－１まで、変数ｉの１を１ずつ増分しながら学習データ作成部５７６がステップ２５６を実行する。この処理により、要素Ｔ［ｉ］が文字列変数Ｓ３の表す文字列の中に存在する場合には、ベクトルＺのｉ番目の要素Ｚ_ｉの値が１となり、さもなければ要素Ｚ_ｉの値は０となる。

ステップ２５４が完了した後、学習データ作成部５７６は、ベクトルＺの要素の中で非零の要素の数を変数Ｍに代入する（図１０のステップ２５８）。学習データ作成部５７６は、変数Ｍの値が０か否かを判定する（ステップ２６０）。学習データ作成部５７６は、ステップ２６０における判定が肯定的なとき、すなわちベクトルＺの要素の中に非零の要素が１個もなければ、ベクトルＺのＮ＋１番目の要素Ｚ_Ｎに１を代入する（図１０のステップ２６２）。学習データ作成部５７６は、ステップ２６０における判定が否定的ならば、すなわちベクトルＺの中に非零の要素が１個でもあれば、ベクトルＺを変数Ｍの値により除算する（図１０のステップ２６４）。すなわち、ベクトルＺの各要素を変数Ｍの値により除算する。

学習データ作成部５７６がこの図１０に示すステップ６２６を実行することにより、ある因果関係の結果フレーズに、トピック単語リスト７４の単語が１つでも存在していれば、ベクトルＺのそれらの単語に対応する要素の値が１／Ｍとなり、それ以外の要素の値が０となるようなベクトルＺが得られる。もしもトピック単語リスト７４のいずれの単語も文字列変数Ｓ３が表す文字列内に存在していなければ、ベクトルＺのＮ番目の要素Ｚ_Ｎは１となり、他の全ての要素の値は０となる。

この後、学習データ作成部５７６は、処理対象の因果関係の原因フレーズを入力とし、ベクトルＺを出力として組み合わせることにより、処理対象の因果関係に対応する学習データの新たなレコードを生成し、図８に示す学習データ記憶部５７８に追加する（ステップ６５４）。

対話装置５６２は、このようにして作成された学習データを使用して文脈モデル５８０の学習を行う。学習部７８による処理は、使用する学習データが異なるだけで、図１に示す学習部７８によるものと異なるところはない。

Ｂ２．対話フェーズ
第２実施形態に係る対話装置５６２による対話処理も、第１実施形態において使用する文脈モデル８０に代えて、上に述べた方法により学習した文脈モデル５８０を使う点を除き、第１実施形態に係るフィルタリング部８６と異なるところはない。

このように第２実施形態によれば、予め大量の因果関係を準備しておいて、各因果関係の結果フレーズを原因フレーズの文脈とみなして第１実施形態と同様に学習データを準備する。この学習データを使用して文脈モデル５８０の学習を行うことにより、第１実施形態と同様、システム発話候補のテキストそのものだけではなく、文脈に出現する単語の可能性まで考慮して、システム発話が妥当なものか否かを判定する。対話におけるシステム発話は通常は１文であり、その前後の文脈は実際には存在しない。そのため、その発話が問題を生じ得る発話か否かをそのシステム発話のみから判定することはむずかしい。しかしこの実施形態によれば、システム発話がその前後の文脈とどのような関係を持ちうるかという情報を用いてシステム発話の選択を行うため、システム発話を出力することにより何らかの問題が生じる確率を低く抑えることができる。

３．第３実施形態
Ａ．構成
上記第１実施形態及び第２実施形態においては、システム発話候補が入力されたときに、基本的にはそのシステム発話候補に対する文脈モデルの出力のみを使用して、そのシステム発話候補を破棄するか残すかを決定している。しかしこの発明はそのような実施形態には限定されない。この第３実施形態においては、システム発話候補に対する文脈モデルの出力するベクトルと、予め準備した複数の対照用ベクトルとの類似度を調べ、その類似度がある条件を満たしたときにそのシステム発話候補を破棄する。

図１１に、この発明の第３実施形態に係る対話システム７００のブロック図を示す。図１１を参照して、対話システム７００は、第１実施形態において使用したものと同様の対話エンジン８４及び文脈モデル８０と、対話エンジン８４が出力するシステム発話候補に対して文脈モデル８０が出力する出力確率ベクトルと、予め準備した複数の対照用ベクトルとのコサイン類似度を調べ、コサイン類似度が所定のしきい値以上となる対照用ベクトルの数がしきい値未満ならそのシステム発話候補を残し、そうでないならシステム発話候補を破棄して、最終的なスコアリングに基づいてシステム発話７１４を出力するフィルタリング部７１２を含む。文脈モデル８０は第１実施形態に関する説明において説明した方法に従って学習済だとする。

対話システム７００はさらに、フィルタリング部７１２がフィルタリング用に使用する対照用ベクトルを予め生成し記憶しておくフィルタリングベクトル生成部７１０を含む。

より具体的には、フィルタリングベクトル生成部７１０は、周辺に好ましくない表現が出現しやすいと考えられる複数の表現を記憶するためのフィルタリング用表現記憶部７２０と、フィルタリング用表現記憶部７２０に記憶されている各表現を文脈モデル８０に入力することにより、各表現に対する文脈モデル８０の出力確率ベクトルからなる対照用ベクトルを生成するための対照用ベクトル生成部７２２と、対照用ベクトル生成部７２２により生成された対照用ベクトルを記憶するための対照用ベクトル記憶部７２４とを含む。対照用ベクトル記憶部７２４はフィルタリング部７１２からアクセス可能なようにフィルタリング部７１２に接続される。

この実施形態は、周囲に好ましくない表現が出現する確率が高い表現から得られた出力確率ベクトルと、システム発話候補から得られた出力確率ベクトルとの類似度が高い場合には、そのシステム発話候補の周辺に好ましくない表現が出現する確率が高いという発見に基づくものである。すなわち、そのようなシステム発話候補を対話システムの出力とすることは望ましくないという思想は、そのような発見がなければ得ることができない。

図１２に、図１１に示すフィルタリング部７１２をコンピュータにより実現するコンピュータプログラムの制御構造をフローチャートにより示す。図１２を参照して、このプログラムは、図６に示すものと同様のステップ４５０及びステップ４５２と、各システム発話候補に対してステップ８０２を実行するステップ８００とを含む。

ステップ８０２は、図６に示すものと同様のステップ４８０及びステップ４８２と、ステップ４８２に続き、カウンタを表す変数に０を代入するステップ８２０とを含む。このカウンタは、以下の処理において、システム発話候補から得られた確率ベクトルとの類似度がしきい値以上であるフィルタリング用表現の数を計数するために使用される。

ステップ８０２はさらに、各対照用ベクトルについて、システム発話候補から得られた確率ベクトルと類似していればカウンタを１だけ増分する処理を行うステップ８２４と、ステップ８２２の処理の終了後に、カウンタの値が第２しきい値未満か否かに従って制御の流れを分岐させるステップ８２６と、ステップ８２６における判定が肯定的なときに対象となるシステム発話候補を残し、ステップ８２６における判定が否定的なときに、システム発話候補を破棄するステップ８３０とを含む。ステップ８２８及びステップ８３０によりステップ８０２は終了する。

ステップ８２４は、対象ベクトルとシステム発話候補から得られた確率ベクトルとのコサイン類似度を計算するステップ８４０と、ステップ８４０において計算されたコサイン類似度が第１しきい値以上か否かに従って制御の流れを分岐させるステップ８４２と、ステップ８４２における判定が肯定的なときに、カウンタの値を１増分してステップ８２４の実行を終了するステップ８４４とを含む。ステップ８４２の判定が否定的なときには、カウンタを増分することなくステップ８２４の実行を終了する。

第１しきい値の値は実験により定めることが望ましい。第２しきい値については１以上であればよいが、典型的には第２しきい値を１とすることが望ましいと考えられる。ただし、第２しきい値の値も、フィルタリング用の表現としてどのようなものを使用したかに依存するため、実験により定める方が望ましいと考えられる。

Ｂ．動作
この第３実施形態に係る対話システム７００には、３つの動作フェーズがある。第１は対話システム７００の学習フェーズである。第２は対照用ベクトルの生成フェーズである。第３はフィルタリング部７１２を使用する対話フェーズである。これらのうち、学習フェーズは第１実施形態に関連して説明したとおりである。したがって、ここでは対照用ベクトルの生成フェーズと、対話フェーズとを順に説明する。

Ｂ１．対照用ベクトルの生成フェーズ
図１１を参照して、予め周辺に好ましくない表現が出現する確率の高い表現が、フィルタリング用表現として収集され、フィルタリング用表現記憶部７２０に記憶される。対照用ベクトル生成部７２２は、これらフィルタリング用表現の各々を文脈モデル８０に与え、文脈モデル８０がそれに応答して出力する確率ベクトルを得て、対照用ベクトルとして対照用ベクトル記憶部７２４に記憶させる。このようにして、フィルタリング用表現記憶部７２０に記憶されている全てのフィルタリング用表現に対し、対照用ベクトルが生成され対照用ベクトル記憶部７２４に記憶されれば対照用ベクトルの生成フェーズは終了である。

もちろん、この実施形態においては、フィルタリング部７１２の稼働後に新たに見つけられたフィルタリング用表現から対照用ベクトルを生成し対照用ベクトル記憶部７２４に追加してもよい。

Ｂ２．対話フェーズ
対話エンジン８４は、入力発話８２（図１２のステップ４５０）に対して複数のシステム発話候補を生成しシステム発話候補リストとしてフィルタリング部７１２に与える（ステップ４５２）。

フィルタリング部７１２は、これら各システム発話候補について（ステップ８００）以下の処理（ステップ８０２）を行う。フィルタリング部７１２はまず、各システム発話候補を文脈モデル８０に入力することにより（ステップ４８０）、その出力確率ベクトルを取得する（ステップ４８２）。フィルタリング部７１２はカウンタを表す変数に０を代入し（ステップ８２０）、各対照ベクトルに対して（ステップ８２４）、ステップ８２４に示す処理を行う。

ステップ８２４においては、フィルタリング部７１２は、処理中のシステム発話候補と処理中の対照用ベクトルとのコサイン類似度を計算し（ステップ８４０）、その値が第１しきい値以上か否かを判定する（ステップ８４２）。コサイン類似度が第１しきい値以上ならステップ８４４においてカウンタに１を加算し、次の対照用ベクトルの処理に進む。コサイン類似度が第１しきい値未満なら何もせず、次の対照用ベクトルの処理に進む。

このようにしてステップ８２４の処理が全ての対照用ベクトルに対して完了すると、カウンタには、処理中のシステム発話候補とのコサイン類似度が第１しきい値以上の対照用ベクトルの数が保存されている。

フィルタリング部７１２はさらに、カウンタの値が第２しきい値未満か否かを判定する（ステップ８２６）。フィルタリング部７１２は、カウンタの値が第２しきい値未満なら処理中のシステム発話候補を残して（ステップ８２８）、次のシステム発話候補の処理を開始する。フィルタリング部７１２は、カウンタの値が第２しきい値以上なら、処理中のシステム発話候補を破棄し（ステップ８３０）、次のシステム発話候補の処理を開始する。

このようにフィルタリング部７１２は、全てのシステム発話候補について破棄するか残すかの判定をした後、残ったシステム発話候補について再ランキングの処理を実行し、最もスコアの高いシステム発話候補をシステム発話７１４（図１１）として出力する。

以上のようにこの実施形態に係る対話システム７００においては、文脈モデル８０の出力する確率ベクトルの値のみを用いるのではなく、予め準備された複数の対照用ベクトルの各々と、システム発話候補との類似度を計算する。計算された類似度が高い対照用ベクトルの数が所定個数（第２しきい値）以上ある場合にはシステム発話候補は破棄され、そうでないシステム発話候補は残される。第２しきい値は１以上の数であればよく、簡略には第２しきい値は１としてもよい。

以上のようにこの第３実施形態においては、第１実施形態及び第２実施形態と同様の文脈モデルを用いながら、フィルタリング方法としては第１実施形態とも第２実施形態との異なるものを用いる。この第３実施形態によっても、第１実施形態及び第２実施形態と同様の効果を得ることができる。

なお、上記第３実施形態においては、対照用ベクトルとシステム発話候補との比較にベクトル類似度を用いている。しかしこの発明はそのような実施形態に限定されるわけではない。２つのベクトルの間の類似性の尺度になる値であればどのようなものを用いてもよい。例えば２つのベクトルを正規化した後に、両者を位置ベクトルと見て、両者の先端の間の距離を類似性の尺度としてもよい。又はベクトルの正規化後の対応する各要素の間の２乗誤差の和を類似性の尺度としてもよい。

４．コンピュータによる実現
図１３は、上記各実施形態を実現するコンピュータシステムの１例の外観図である。図１４は、図１３に示すコンピュータシステムのハードウェア構成の１例を示すブロック図である。

図１３を参照して、このコンピュータシステム９５０は、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）ドライブ１００２を有するコンピュータ９７０と、いずれもコンピュータ９７０に接続された、ユーザと対話するためのキーボード９７４、マウス９７６、及びモニタ９７２とを含む。もちろんこれらはユーザ対話が必要となったときのための構成の一例であって、ユーザ対話に利用できる一般のハードウェア及びソフトウェア（例えばタッチパネル、音声入力、ポインティングデバイス一般）であればどのようなものも利用できる。

図１４を参照して、コンピュータ９７０は、ＤＶＤドライブ１００２に加えて、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）９９０と、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）９９２と、ＣＰＵ９９０、ＧＰＵ９９２、ＤＶＤドライブ１００２に接続されたバス１０１０と、バス１０１０に接続され、コンピュータ９７０のブートアッププログラムなどを記憶するＲＯＭ（Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ）９９６と、バス１０１０に接続され、プログラムを構成する命令、システムプログラム、及び作業データなどを記憶するＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）９９８と、バス１０１０に接続された不揮発性メモリであるＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）１０００とを含む。ＳＳＤ１０００は、ＣＰＵ９９０及びＧＰＵ９９２が実行するプログラム、並びにＣＰＵ９９０及びＧＰＵ９９２が実行するプログラムが使用するデータなどを記憶するためのものである。コンピュータ９７０はさらに、他端末との通信を可能とするネットワーク９８６への接続を提供するネットワークＩ／Ｆ（Ｉｎｔｅｒｆａｃｅ）１００８と、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）メモリ９８４が着脱可能で、ＵＳＢメモリ９８４とコンピュータ９７０内の各部との通信を提供するＵＳＢポート１００６とを含む。

コンピュータ９７０はさらに、マイクロフォン９８２、スピーカ９８０及びバス１０１０に接続され、ＣＰＵ９９０により生成されＲＡＭ９９８又はＳＳＤ１０００に保存された音声信号、映像信号及びテキストデータをＣＰＵ９９０の指示に従って読み出し、アナログ変換及び増幅処理をしてスピーカ９８０を駆動したり、マイクロフォン９８２からのアナログの音声信号をデジタル化し、ＲＡＭ９９８又はＳＳＤ１０００の、ＣＰＵ９９０により指定される任意のアドレスに保存したりするための音声Ｉ／Ｆ１００４を含む。

上記実施形態において、図１に示す対話システム５０及び図８に示す対話システム５５０の各部を実現するためのプログラム、ニューラルネットワークのパラメータ並びにニューラルネットワークプログラムなどは、いずれも例えば図１４に示すＳＳＤ１０００、ＲＡＭ９９８、ＤＶＤ９７８又はＵＳＢメモリ９８４、若しくはネットワークＩ／Ｆ１００８及びネットワーク９８６を介して接続された図示しない外部装置の記憶媒体などに格納される。典型的には、これらのデータ及びパラメータなどは、例えば外部からＳＳＤ１０００に書込まれコンピュータ９７０による実行時にはＲＡＭ９９８にロードされる。

このコンピュータシステムを、図１及び図８にそれぞれ示す対話システム５０及び５５０並びにそれらの各構成要素の機能を実現するよう動作させるためのコンピュータプログラムは、ＤＶＤドライブ１００２に装着されるＤＶＤ９７８に記憶され、ＤＶＤドライブ１００２からＳＳＤ１０００に転送される。又は、これらのプログラムはＵＳＢメモリ９８４に記憶され、ＵＳＢメモリ９８４をＵＳＢポート１００６に装着し、プログラムをＳＳＤ１０００に転送する。又は、このプログラムはネットワーク９８６を通じてコンピュータ９７０に送信されＳＳＤ１０００に記憶されてもよい。

もちろん、キーボード９７４、モニタ９７２及びマウス９７６を用いてソースプログラムを入力し、コンパイルした後のオブジェクトプログラムをＳＳＤ１０００に格納してもよい。スクリプト言語の場合には、キーボード９７４などを用いて入力したスクリプトをＳＳＤ１０００に格納してもよい。仮想マシン上で動作するプログラムの場合には、仮想マシンとして機能するプログラムを予めコンピュータ９７０にインストールしておく必要がある。ニューラルネットワークの訓練及びテストには大量の計算が伴うため、特に数値計算を行う実体であるプログラム部分はスクリプト言語ではなくコンピュータのネイティブなコードからなるオブジェクトプログラムとして本発明の実施形態の各部を実現する方が好ましい。

プログラムは実行のときにＲＡＭ９９８にロードされる。ＣＰＵ９９０は、その内部のプログラムカウンタと呼ばれるレジスタ（図示せず）により示されるアドレスに従ってＲＡＭ９９８からプログラムを読み出して命令を解釈し、命令の実行に必要なデータを命令により指定されるアドレスに従ってＲＡＭ９９８、ＳＳＤ１０００又はそれ以外の機器から読み出して命令により指定される処理を実行する。ＣＰＵ９９０は、実行結果のデータを、ＲＡＭ９９８、ＳＳＤ１０００、ＣＰＵ９９０内のレジスタなど、プログラムにより指定されるアドレスに格納する。このとき、プログラムカウンタの値もプログラムによって更新される。コンピュータプログラムは、ＤＶＤ９７８から、ＵＳＢメモリ９８４から、又はネットワークを介して、ＲＡＭ９９８に直接にロードしてもよい。なお、ＣＰＵ９９０が実行するプログラムの中で、一部のタスク（主として数値計算）については、プログラムに含まれる命令により、又はＣＰＵ９９０による命令実行時の解析結果に従って、ＧＰＵ９９２にディスパッチされる。

コンピュータ９７０との協働により上記した実施形態に係る各部の機能を実現するプログラムは、それら機能を実現するようコンピュータ９７０を動作させるように記述され配列された複数の命令を含む。この命令を実行するのに必要な基本的機能のいくつかはコンピュータ９７０上で動作するオペレーティングシステム（ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ））若しくはサードパーティのプログラム、又はコンピュータ９７０にインストールされる各種ツールキットのモジュールにより提供される。したがって、このプログラムはこの実施形態のシステム及び方法を実現するのに必要な機能全てを必ずしも含まなくてよい。このプログラムは、命令の中で、所望の結果が得られるように制御されたやり方で適切な機能又は「プログラミング・ツール・キット」の機能を静的にリンクすることで、又はプログラムの実行時に動的にそれら機能に動的リンクことにより、上記した各装置及びその構成要素としての動作を実行する命令のみを含んでいればよい。そのためのコンピュータ９７０の動作方法は周知であるので、ここでは繰返さない。

なお、ＧＰＵ９９２は並列処理を行うことが可能であり、機械学習に伴う多量の計算を同時並列的又はパイプライン的に実行できる。例えばプログラムのコンパイル時にプログラム中で発見された並列的計算要素、又はプログラムの実行時に発見された並列的計算要素は、随時、ＣＰＵ９９０からＧＰＵ９９２にディスパッチされ、実行され、その結果が直接に、又はＲＡＭ９９８の所定アドレスを介してＣＰＵ９９０に返され、プログラム中の所定の変数に代入される。

４．変形例
上記実施形態においては、トピック単語リスト７４はパッセージ群などにおける出現頻度がしきい値より高い単語をリストしたものである。しかしこの発明はそのような実施形態には限定されない。たとえば、パッセージ群などにおける出現頻度が上位の所定個数の単語をリストしてもよい。そうした手法ではなく、予め手作業により収集した注意すべき表現に含まれる単語を抽出することによりトピック単語リスト７４を作成してもよい。又は、パッセージ群などにおける出現頻度がしきい値より高い単語、又は出現頻度の順位が上位の所定個数の単語と、予め手作業により作成した注意すべき単語のリストとの和集合又は積集合の単語をトピック単語リスト７４としてもよい。

さらに、上記実施形態においては特に単語の品詞などの種類については制限していない。しかしこの発明はそのような実施形態に限定されるわけではない。特定の品詞（例えば動詞、形容詞及び名詞）などにより単語を制限してもよいし、いわゆる内容語のみに単語を限定してもよい。またトピック単語リスト７４には、単語に限らずいわゆるフレーズなどを追加してもよい。

上記実施形態においては、文脈モデルとしてＢＥＲＴを使用している。しかしこの発明はそのような実施形態には限定されないＢＥＲＴ以外のアーキテクチャによるモデルを文脈モデルとして使用してもよい。

上記実施形態は、対話システムに関するものである。しかしこの発明はそのような実施形態には限定されない。質問応答システム、対話型タスク志向システム、ユーザからの連絡に対する応答システムなど、人と何らかのシステムとの間のコミュニケーションを対話型で行うものであればどのようなものにも適用できる。

上記第１実施形態においては、学習データを作成するために使用されるパッセージとしては特に限定を設けている訳ではない。しかし、第２実施形態のように、因果関係から学習データを作成することにより、良好な結果が得られている。したがって、第１実施形態において、例えば因果関係などの特定の表現を含むパッセージを用いて学習データを作成してもよい。

また、第２実施形態には因果関係を用いている。因果関係は、原因フレーズと結果フレーズとの組み合わせである。ある因果関係の結果フレーズと、別の因果関係の原因フレーズとが類似している場合には、２つの因果関係を連鎖させることができる。そのような因果関係の連鎖により、最初の因果関係の原因フレーズから２つの結果フレーズが得られる。同様に３個以上の結果フレーズを最初の原因フレーズと関係付けることもできる。このような関係を使用し、第２実施形態における文脈として、１つの結果フレーズだけでなく、連鎖する２個以上の結果フレーズを使用して学習データを作成してもよい。

今回開示された実施形態は単に例示であって、本発明が上記した実施形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味及び範囲内での全ての変更を含む。

５０、５５０、７００対話システム
６０、５６０文脈モデル学習システム
６２、５６２対話装置
７０パッセージＤＢ
７２、５７６学習データ作成部
７４トピック単語リスト
７６、５７８学習データ記憶部
７８学習部
８０、５８０文脈モデル
８２入力発話
８４対話エンジン
８６、５８２、７１２フィルタリング部
８８、５８４、７１４システム発話
３４０ＣＬＳトークン
３４２ＳＥＰトークン
３５０発話
３５２ＢＥＲＴ
３５４最終隠れ層
３５６ＣＬＳ対応層
３５８全結合層
３６０ＳｏｆｔＭａｘ層
３６２確率ベクトル
４００学習データ
４０２学習用発話
４０４正解ラベルベクトル
５７０コーパス
５７２因果関係抽出部
５７４因果関係コーパス
７１０フィルタリングベクトル生成部
７２２対照用ベクトル生成部

Claims

発話を表す単語ベクトル列が入力されると、当該発話が置かれた文脈に、所定の単語群に含まれる単語の各々が現れる確率を要素とする確率ベクトルを出力するように予め学習済の文脈モデルと、
発話を表す単語ベクトル列を前記文脈モデルに入力し、当該入力に応答して前記文脈モデルが出力する前記確率ベクトルの少なくとも１つの要素が所定の条件を充足するか否かに従って、前記発話を破棄すべきか承認すべきかを判定するための判定手段とを含む、発話フィルタリング装置。
前記判定手段は、前記確率ベクトルの少なくとも１つの要素の所定関数として定まる値が所定のしきい値以上か否かに従って、前記発話を破棄すべきか承認すべきかを判定するための手段を含む、請求項１に記載の発話フィルタリング装置。
対話装置と、
前記対話装置の出力する発話候補を入力として受けるように前記対話装置に結合された、請求項１に記載の発話フィルタリング装置と、
前記発話フィルタリング装置による判定結果に従って、前記対話装置の出力する前記発話をフィルタリングするための発話フィルタリング手段とを含む、対話システム。
コンピュータを、
発話を表す単語ベクトル列が入力されると、当該発話が置かれた文脈に、所定の単語群に含まれる単語の各々が現れる確率を要素とする確率ベクトルを出力するように予め学習済の文脈モデルと、
発話を表す単語ベクトル列を前記文脈モデルに入力し、当該入力に応答して前記文脈モデルが出力する前記確率ベクトルに基づいて、所定の単語群に含まれるいずれかの単語の確率がしきい値以上か否かに従って、前記発話を破棄すべきか承認すべきかを判定するための判定手段として機能させる、コンピュータプログラム。
コーパスに格納された各発話について、当該発話の文脈を抽出するための文脈抽出手段と、
所定の単語群に含まれる単語の各々が、少なくとも前記文脈に出現しているか否かを示す文脈ベクトルを生成するための文脈ベクトル生成手段と、
コーパスに格納された各発話について、当該発話を入力とし、前記文脈ベクトルを出力として組み合わせた学習データを生成するための学習データ生成手段とを含む、学習データの生成装置。
前記コーパスは、各々が原因部と結果部とを含む複数の因果関係表現を含み、
前記文脈抽出手段は、前記複数の因果関係表現の各々について、当該因果関係表現の前記原因部を前記発話とし、前記因果関係表現の前記結果部を前記発話の前記文脈として抽出するための結果部抽出手段を含む、請求項５に記載の学習データの生成装置。