JP7327647B2

JP7327647B2 - 発話生成装置、発話生成方法、プログラム

Info

Publication number: JP7327647B2
Application number: JP2022508637A
Authority: JP
Inventors: 宏美成松; 弘晃杉山; 雅博水上; 庸浩有本
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2020-03-17
Filing date: 2020-03-17
Publication date: 2023-08-16
Anticipated expiration: 2040-03-17
Also published as: WO2021186525A1; JPWO2021186525A1; US20230140480A1

Description

特許法第３０条第２項適用（１）ウェブサイトの掲載日２０１９年５月２７日ウェブサイトのアドレスｈｔｔｐｓ：／／ｗｗｗ．ｋｅｃｌ．ｎｔｔ．ｃｏ．ｊｐ／ｏｐｅｎｈｏｕｓｅ／２０１９／（２）発行日２０１９年９月１日刊行物ＮＴＴ技術ジャーナルＶｏｌ．３１Ｎｏ．９ｐ２２～２５（３）展示日２０１９年１１月１２日～１５日（公知日：２０１９年１１月１２日）展示会名、開催場所ＮＴＴＲ＆Ｄフォーラム２０１９ＮＴＴ武蔵野研究開発センタ（東京都武蔵野市緑町３－９－１１）（４）ウェブサイトの掲載日２０１９年１１月１４日ウェブサイトのアドレスｈｔｔｐｓ：／／ｗｗｗ．ｎｔｔ－ｒｅｖｉｅｗ．ｊｐ／ａｒｃｈｉｖｅ／ｎｔｔｔｅｃｈｎｉｃａｌ．ｐｈｐ？ｃｏｎｔｅｎｔｓ＝ｎｔｒ２０１９１１ｆａ５．ｈｔｍｌｈｔｔｐｓ：／／ｗｗｗ．ｎｔｔ－ｒｅｖｉｅｗ．ｊｐ／ａｒｃｈｉｖｅ＿ｊａ／２０１９／２０１９１１．ｈｔｍｌ（５）発行日２０１９年１１月２０日刊行物人工知能学会第８７回言語・音声理解と対話処理研究会資料（第１０回対話システムシンポジウム）ＳＩＧ－ＳＬＵＤ－Ｂ９０２－１４ｐ６８－７３（６）発行日２０１９年１１月２０日刊行物人工知能学会第８７回言語・音声理解と対話処理研究会資料（第１０回対話システムシンポジウム）ＳＩＧ－ＳＬＵＤ－Ｂ９０２－１２ｐ５８－６１

本発明は、発話を生成する技術に関する。

現在、ユーザと対話するシステムの実現に向けた研究が盛んに行われている。例えば、非特許文献１に記載の方法では、発話とその応答のペアを大規模に学習させることにより、ユーザとシステムとの対話を実現する。しかし、この方法では、システムが少しずれた応答をしてしまうことがあり、ユーザにシステムが理解していないことが伝わってしまうという問題がある。

そこで、システムがユーザの発話を理解していることをユーザに示すために、“直前のユーザの発話の一部を繰り返す”という方法を用いることがある（非特許文献２参照）。この方法は、人と人とのコミュニケーションにおいて用いられる方法を模倣したものであり、その有効性も知られている（非特許文献３参照）。

目黒豊美, 杉山弘晃, 東中竜一郎, 南泰浩, "ルールベース発話生成と統計的発話生成の融合に基づく対話システムの構築", 人工知能学会全国大会論文集第28回全国大会, 一般社団法人人工知能学会, 2014. Ryuichiro Higashinaka, Kohji Dohsaka, and Hideki Isozaki, "Effects of self-disclosure and empathy in human-computer dialogue,"2008 IEEE Spoken Language Technology Workshop, IEEE, 2008. Tatsuya Kawahara, "Spoken dialogue system for a human-like conversational robot ERICA," 9th International Workshop on Spoken Dialogue System Technology, Springer, Singapore, 2019.

確かに、非特許文献２に記載の方法は、ユーザに発話を理解していることを示す有効な方法ではある。しかし、この方法では、不適切な発話の一部を取り上げ繰り返してしまうことがあり、その場合、ユーザに“理解していない”という印象を与えてしまうという問題がある。また、この方法では、システムは文脈をそもそも理解しているわけではないため、直前の発話よりも前の発話についての内容が反映されない応答をしてしまうという問題もある。

そこで本発明では、対話の文脈を示すデータを生成し、対話の文脈を示すデータに基づいて発話を生成する技術を提供することを目的とする。

本発明の一態様は、体験の時期を示す項目である体験時期と、体験の場所を示す項目である体験場所と、体験を共有した者を示す項目である体験者と、体験の内容を示す項目である体験内容と、体験に関する感想を示す項目である体験感想とを含むデータ構造を文脈クラス、文脈クラスに含まれる項目（以下、文脈項目という）である体験時期、体験場所、体験者、体験内容、体験感想と、体験に関する感想の根拠を示す項目である体験感想理由とを含むデータ構造を体験クラス、発話の生成に用いるテンプレート（以下、発話テンプレートという）を識別するための情報（以下、テンプレートIDという）と、発話テンプレートと、発話テンプレートの種別を示す発話カテゴリと、発話テンプレートの焦点を示す文脈項目（以下、焦点項目という）とを含むデータ構造を発話テンプレートクラスとし、体験クラスのデータから構成される体験データベースと、発話テンプレートクラスのデータから構成される発話テンプレートデータベースとを記録する記録部と、ユーザの発話を表す入力テキストから抽出される、文脈項目とその値の組を含むデータ（以下、フレーズという）を要素とする集合であるフレーズ集合を生成するフレーズ抽出部と、前記フレーズ集合を用いて、現時点における対話の文脈を示す文脈クラスのデータ（以下、更新前文脈理解結果という）から、最新の対話の文脈を示す文脈クラスのデータ（以下、更新後文脈理解結果という）を生成する文脈理解結果更新部と、前記更新後文脈理解結果と体験データベースに含まれる体験クラスのデータとの間で計算される類似度に基づいて１以上の体験クラスのデータを類似体験として選択し、前記更新前文脈理解結果と前記更新後文脈理解結果とを用いて発話テンプレートデータベースから発話テンプレートクラスのデータを発話テンプレート候補として選択する対話制御部と、前記更新後文脈理解結果と前記類似体験と前記発話テンプレート候補とを用いて、前記入力テキストに対する応答となる発話を表す出力テキストを生成する発話生成部と、を含む。

本発明によれば、対話の文脈を示すデータに基づいて発話を生成することが可能となる。

従来の対話システムにおける対話の例を示す図である。本願発明に基づく対話システムで目指す対話の例を示す図である。本願発明のアプローチを説明する図である。本願発明のアプローチを説明する図である。発話テンプレートの一例を示す図である。発話生成装置１００の構成を示すブロック図である。発話生成装置１００の動作を示すフローチャートである。文脈理解結果の一例を示す図である。類似度を説明する図である。発話テンプレートから発話を生成する際に用いる更新後文脈理解結果と類似体験の一例を示す図である。発話テンプレートから発話を生成する際に用いる更新後文脈理解結果と類似体験の一例を示す図である。本発明の実施形態における各装置を実現するコンピュータの機能構成の一例を示す図である。

以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

各実施形態の説明に先立って、この明細書における表記方法について説明する。

^（キャレット）は上付き添字を表す。例えば、x^{y^z}はy^zがxに対する上付き添字であり、x_y^zはy^zがxに対する下付き添字であることを表す。また、_（アンダースコア）は下付き添字を表す。例えば、x^y_zはy_zがxに対する上付き添字であり、x_{y_z}はy_zがxに対する下付き添字であることを表す。

ある文字xに対する^xや~xのような上付き添え字の”^”や”~”は、本来”x”の真上に記載されるべきであるが、明細書の記載表記の制約上、^xや~xと記載しているものである。

＜技術的背景＞
ここでは、まず、従来の対話システムにおける対話においてユーザがどのような経緯で対話システムの対話能力に疑念をいだくようになるかについて、例を用いて説明する。そして、次に、本願発明に基づく対話システムで目指す対話の例について説明し、その実現のために採用するアプローチについて説明する。

（従来の対話システムにおける対話の例）
図１は、一問一答ベースの雑談対話システムにおける対話の例を示す。図１では、便宜上、ユーザの発話について、U1, U2, …、対話システムの発話について、S1, S2, …といった符号を付している。また、ユーザの発話中にある括弧はユーザの内心を描写したものである。

図１の対話では、対話システムは、S2において、“たこ焼きといえば大阪だね。大阪には行ったことがある？”と発話している。しかし、ユーザは、U1において、“夏休みに大阪行ったよ。”と発話している。そのため、対話システムは、過去に言及があった内容について質問をしていることになり、ユーザがその理解力に疑問を感じる一因になっている。

また、対話システムは、S3において、“いいね。大阪は道頓堀が賑やか。”と発話し、突然道頓堀に話題をふっている。つまり、対話システムは、その時点の文脈である、たこ焼きの話題からずれた発話をしていることになり、これもユーザがその理解力に疑問を感じる一因になっている。

さらに、対話システムは、S4において、特に理由を提示することもなく、“道頓堀もいいね。”と発話している。そのため、ユーザは対話システムが共感を示してくれているように感じることができなくなり、最終的に無言になっている。

上記対話では、対話システムは文脈を理解することなく、発話を繰り返しているため、既に言及した内容に関する質問をしてしまったり、対話の流れに沿わない不自然な発話をしてしまったりしている。そのため、ユーザが対話システムに対話能力がないと感じ、対話システムによる発話への信用が低下する結果を招いている。

（本願発明に基づく対話システムで目指す対話の例）
図２は、本願発明に基づく対話システムで目指す対話の例を示す。図２では、図１と同様、便宜上、ユーザの発話について、U1, U2, …、対話システムの発話について、S1, S2, …といった符号を付している。

図２の対話では、対話システムは、S1において、“大阪、いいね。海遊館とか行った？”と発話している。対話システムは、相槌をうった後、具体的な観光施設の名前を挙げ文脈に整合した質問をしている。

また、対話システムは、S2において、“行けなくて残念だったね。たこ焼きとか食べた？”と発話し、対話システムは、文脈に沿って話題を展開するような発話をしている。

さらに、対話システムは、S3において、“いいよね。僕も食べたよ。熱々とろとろで美味しかった。”と発話し、対話システムは、ユーザが気持ちを理解している感じることができるような共感を示す発話をしている。

上記対話では、対話システムは、文脈を踏まえて発話することにより、対話全体を通して、ユーザの気持ちを理解した発話、あるいは、対話システムは気持ちが理解できる相手であるとユーザに感じてもらえるような発話をしている。

（本願発明のアプローチ）
本願発明では、対話の文脈を“いつ”、“どこで”、“誰と”、“何を”、“感想”という構造で理解するとともに、当該構造を包含する構造を有する体験に関するデータベース（以下、体験データベースという）を用いることで、共感を示す発話や文脈に沿った質問をするアプローチを採用する。以下、図を用いて説明する。

図３、図４は、ある対話において、対話システムがどのように文脈を理解し、その結果どのような発話をしているのかを示した図である。図３、図４においても、便宜上、ユーザの発話について、U1, U2, …、対話システムの発話について、S1, S2, …といった符号を付している。さらに、図３、図４では、対話システムが理解した文脈（以下、文脈理解結果という）については、C1, C2, …、体験を示すデータ（以下、体験データという）については、E1, E2, …といった符号を付している。

図３の対話では、ユーザは、U1において、“夏休みにたこ焼き食べたよ。”と発話している。それに対し、対話システムは当該発話を文脈理解結果C1として理解する。そして、対話システムは、文脈理解結果C1の項目“どこで”が空であることから、S1において“どこで食べたの？”という発話をしている。

そして、ユーザは、S1の応答となるU2において、“大阪で食べたよ。”と発話している。対話システムは、文脈理解結果C1をふまえた上で、ユーザの新たな発話U2を文脈理解結果C2として理解する。そして、対話システムは、体験データベースを用いて、文脈理解結果C2に類似する体験データE1を検索結果として得、S2において“僕もなんばで友達と食べたよ。たこ焼き美味しいよね。”と発話し、体験を根拠とした共感をユーザに示している。

さらに、図４の対話では、ユーザは、対話システムによる発話S2に対する応答として、U3において、“食べたんだね。美味しいよね。”と発話している。対話システムは、文脈理解結果C2をふまえた上で、ユーザの新たな発話U3を文脈理解結果C3として理解する。そして、対話システムは、体験データベースを用いて、文脈理解結果C3に類似する体験データE2を検索結果として得、S3において“夏に大阪だと、海遊館とか行った？”と発話し、“夏”、“大阪”という文脈にそった質問をユーザにしている。

＜第１実施形態＞
発話生成装置１００は、対話中のユーザの発話に対する応答となる発話を生成する。その際、発話生成装置１００は、ユーザとの対話の流れである文脈を理解するために、文脈クラスと呼ぶデータ構造を用い、文脈クラスのデータである文脈理解結果を生成する。ここで、文脈クラスは、体験の時期を示す項目である体験時期と、体験の場所を示す項目である体験場所と、体験を共有した者を示す項目である体験者と、体験の内容を示す項目である体験内容と、体験に関する感想を示す項目である体験感想とを含むデータ構造である。体験時期、体験場所、体験者、体験内容、体験感想は、＜技術的背景＞で説明した“いつ”、“どこで”、“誰と”、“何をした”、“感想”の５つの項目にそれぞれ対応する。

また、発話生成装置１００は、自らがあたかも体験したり、体験を伝え聞いたりしたかのような発話を生成するために、体験データベースを用いる。ここで、体験データベースとは、体験クラスのデータから構成されるデータベースであり、体験クラスとは、文脈クラスに含まれる項目（以下、文脈項目という）である体験時期、体験場所、体験者、体験内容、体験感想と、体験に関する感想の根拠を示す項目である体験感想理由とを含むデータ構造のことである。

また、発話生成装置１００は、発話を生成するために、発話テンプレートデータベースを用いる。ここで、発話テンプレートとは、発話のひな型となるテンプレートのことである。また、発話テンプレートデータベースとは、発話テンプレートクラスのデータから構成されるデータベースであり、発話テンプレートクラスとは、発話テンプレートを識別するための情報（以下、テンプレートIDという）と、発話テンプレートと、発話テンプレートの種別を示す発話カテゴリと、発話テンプレートの焦点を示す文脈項目（以下、焦点項目という）とを含むデータ構造のことである。

図５は、発話テンプレートデータベースの一例を示す。ここで、テンプレートIDは単にIDと略記している。図５の発話テンプレートクラスは、テンプレートID、発話テンプレート、発話カテゴリ、焦点項目の他、発話テンプレートの口調を示す口調ラベルと、感想の種別を示す感想カテゴリとを含む。

発話カテゴリの値には、質問、事前共感、関連質問、共感がある。事前共感とは、ユーザの体験に類似する自らの体験がある場合に後の発話にて自らの体験に基づいた発話するために、事前にユーザに共感を示すための発話のことである。ここで、ユーザの体験に類似する自らの体験がある場合とは、後述する、類似度が所定の閾値より大きいかそれ以上である類似体験がある場合のことである。

データベース発話カテゴリの値が関連質問または共感である場合、発話テンプレートは少なくとも１つ以上の文脈項目に関する補充欄がある。ここで、類似体験の体験時期、類似体験の体験場所、類似体験の体験者、類似体験の体験内容、類似体験の体験感想、類似体験の体験感想理由といった補充欄には、発話テンプレートから発話を生成する際に、後述する類似体験における体験時期、体験場所、体験者、体験内容、体験感想、体験感想理由の値が設定される。また、文脈理解結果の体験時期、文脈理解結果の体験場所、文脈理解結果の体験者、文脈理解結果の体験内容、文脈理解結果の体験感想といった補充欄には、発話テンプレートから発話を生成する際に、文脈理解結果における体験時期、体験場所、体験者、体験内容、体験感想、体験感想理由の値が設定される。

例えば、図５のテンプレートIDが3の発話テンプレートには、類似体験の体験場所、類似体験の体験内容、類似体験の体験感想理由、類似体験の体験感想の４つの補充欄がある。また、テンプレートIDが7の発話テンプレートには、文脈理解結果の体験感想、類似体験の体験感想理由、類似体験の体験感想の３つの補充欄がある。

一方、発話カテゴリの値が質問または事前共感である場合、発話テンプレートには文脈項目に関する補充欄はないことがある。図５のテンプレートIDが0, 1, 2の発話テンプレートは、いずれもその発話カテゴリの値が質問であるが、補充欄はない。それに対して、図５のテンプレートIDが8, 9, 10, 11の発話テンプレートは、その発話カテゴリの値が質問または事前共感であるが、それぞれ１つの補充欄があるものとなっている。

また、感想カテゴリの値には、肯定、否定がある。

以下、図６～図７を参照して発話生成装置１００を説明する。図６は、発話生成装置１００の構成を示すブロック図である。図７は、発話生成装置１００の動作を示すフローチャートである。図６に示すように発話生成装置１００は、初期化部１１０と、発話入力部１２０と、フレーズ抽出部１３０と、文脈理解結果更新部１４０と、対話制御部１５０と、発話生成部１６０と、発話出力部１７０と、記録部１９０を含む。記録部１９０は、発話生成装置１００の処理に必要な情報を適宜記録する構成部である。記録部１９０は、体験データベースと発話テンプレートデータベースをあらかじめ記録しておく。また、記録部１９０には、ユーザとの対話の履歴を記録するために、ユーザの発話に相当する入力テキストと発話生成装置１００の発話に相当する出力テキストとを時系列に記録するデータベース（以下、発話履歴データベースという）を記録するようにしてもよい。なお、発話履歴データベースに出力テキストを記録する際、当該出力テキストの生成に用いたテンプレートIDをあわせて記録するようにしてもよい。

図７に従い発話生成装置１００の動作について説明する。

Ｓ１１０において、初期化部１１０は、ユーザとの対話を開始するために必要な初期化処理を行う。初期化処理は、例えば、発話生成装置１００を起動する信号を対話開始の合図として開始されるのでもよいし、ユーザによる最初の発話を対話開始の合図として開始されるのでもよい。この初期化処理では、例えば、文脈理解結果が初期化される。具体的には、文脈理解結果の各文脈項目の値を、例えば、”NULL”のような空を示す値にする。

Ｓ１２０において、発話入力部１２０は、ユーザの発話を入力とし、ユーザの発話から、ユーザの発話を表すテキスト（以下、入力テキストという）を生成し、出力する。ユーザの発話のデータ形式には、任意のものを用いることができ、ユーザの発話は、例えば、テキスト、音声（音声信号）、バイナリデータとすることができる。ユーザの発話がテキストとして入力される場合、発話入力部１２０は、当該テキストをそのまま入力テキストとする。また、ユーザの発話が音声として入力される場合、発話入力部１２０は、所定の音声認識技術を用いて音声認識を行い、音声認識結果を入力テキストとして生成する。なお、音声認識技術には、音声から当該音声に対応するテキストを生成することができる任意のものを用いることができる。また、音声認識結果として複数の候補が得られる場合、発話入力部１２０は、当該候補とその信頼度の組をリストとしたものをフレーズ抽出部１３０の入力となるように出力してもよい。この場合、フレーズ抽出部１３０は、信頼度が最も高い候補を用いて、フレーズ抽出処理を実行するが、フレーズの抽出に失敗する場合には、次点の候補を用いて、フレーズ抽出処理を実行する。

Ｓ１３０において、フレーズ抽出部１３０は、Ｓ１２０で生成した入力テキストを入力とし、入力テキストから抽出される、文脈項目とその値の組を含むデータ（以下、フレーズという）を要素とする集合であるフレーズ集合を生成し、出力する。例えば、入力テキストが“道頓堀でたこ焼きを食べたよ”である場合、フレーズ抽出部１３０は、{(体験場所, ‘道頓堀’), (体験内容, ‘たこ焼きを食べた’)}をフレーズ集合として生成する。この例では、フレーズを(体験内容, ‘たこ焼きを食べた’)のように、文脈項目とその値の組としたが、その他の付随情報を含むようにしてもよい。例えば、(体験内容, [4:11], ‘たこ焼きを食べた’)のように、文脈項目と文字列の区間と当該文脈項目の値としてもよい。ここで、文字列の区間とは、入力テキストに含まれる文字を頭から順に0, 1, …と数えるものとし、当該文字列の最初の文字の位置と最後の文字の位置の組のことである。

なお、フレーズ抽出部１３０が体験感想とその値の組を含むフレーズを要素するフレーズ集合を生成する場合、フレーズ抽出部１３０は、入力テキストの感想カテゴリ、つまり、肯定なのか否定なのかを特定し、出力するようにしてもよい。この場合、発話生成部１６０は、入力テキストの感想カテゴリに基づいて、適切な相槌（例えば、“いいね”や“そっか”）を発話として生成することができる。

Ｓ１４０において、文脈理解結果更新部１４０は、Ｓ１３０で生成したフレーズ集合を入力とし、フレーズ集合を用いて、現時点における対話の文脈を示す文脈クラスのデータ（以下、更新前文脈理解結果という）から、最新の対話の文脈を示す文脈クラスのデータ（以下、更新後文脈理解結果という）を生成し、出力する。その際、文脈理解結果更新部１４０は、例えば、記録部１９０に記録している更新前文脈理解結果を読み出し、更新後文脈理解結果を記録部１９０に書き出す。この更新後文脈理解結果は、今回処理対象となっている入力テキストの次に発話生成装置１００が生成する入力テキストが処理対象となったときの、更新前文脈理解結果となる。

以下、文脈理解結果の更新処理について詳しく説明する。

（１）文脈理解結果更新部１４０は、フレーズ集合の要素であるフレーズを１つ取り出す。

（２）文脈理解結果更新部１４０は、取り出したフレーズに含まれる文脈項目に対応する更新前文脈理解結果の文脈項目の値が空を示す値である場合は、フレーズに含まれる文脈項目の値を更新後文脈理解結果の文脈項目の値として書き出す。一方、文脈理解結果更新部１４０は、取り出したフレーズに含まれる文脈項目に対応する更新前文脈理解結果の文脈項目の値が空を示す値でない（すなわち、既に文脈項目の値が書き込まれている）場合は、フレーズに含まれる文脈項目の値を更新後文脈理解結果の文脈項目に追記する形で書き出す。

（３）文脈データ更新部１４０は、（１）、（２）の処理を繰り返し、フレーズ集合のすべての要素についての処理が終わったら、更新後文脈理解結果を記録部１９０に書き出し、処理を終了する。

例えば、フレーズ集合が{(体験場所, ‘道頓堀’), (体験内容, ‘たこ焼きを食べた’)}であり、更新前文脈理解結果が図８(a)のデータである場合、文脈理解結果更新部１４０は、図８(b)の更新後文脈理解結果を生成する。

Ｓ１５０において、対話制御部１５０は、記録部１９０に記録している更新前文脈理解結果とＳ１４０で生成した更新後文脈理解結果を入力とし、更新前文脈理解結果と更新後文脈理解結果とを用いて、類似体験と発話テンプレート候補を選択し、出力する。具体的には、対話制御部１５０は、更新後文脈理解結果と体験データベースに含まれる体験クラスのデータとの間で計算される類似度に基づいて１以上の体験クラスのデータを類似体験として選択する。また、対話制御部１５０は、更新前文脈理解結果と更新後文脈理解結果とを用いて発話テンプレートデータベースから発話テンプレートクラスのデータを発話テンプレート候補として選択する。

以下、類似体験の選択処理と発話テンプレート候補の選択処理について説明する。まず、類似体験の選択処理について詳しく説明する。

（類似体験の選択方法）
（１）対話制御部１５０は、体験データベースに含まれる体験クラスのデータを１つ取り出す。

（２）対話制御部１５０は、更新後文脈理解結果と取り出した体験クラスのデータとの類似度を計算する。類似度は、例えば、更新後文脈理解結果と体験クラスのデータにおける文脈項目ごとの文字列としての一致率に基づいて計算することができ、一致率が所定の割合（例えば、0.9）より大きいかそれ以上である文脈項目の数が多い体験クラスのデータの類似度の値が高くなるようにしてもよい（図９参照）。なお、文字列としての一致率の代わりに、形態素の列としての一致率を用いるようにしてもよい。ここで、形態素の列としての一致率とは、更新後文脈理解結果の文脈項目の文字列、体験クラスのデータにおける文脈項目の文字列をそれぞれ形態素解析して得られる２つの形態素の列に基づいて計算される一致率のことをいう。形態素の列としての一致率を用いる理由は、例えば、“東京都”と“京都”のように異なる場所を示す文字列であっても、文字列としては一致率が高くなってしまう場合もあり、このような場合でも形態素の列としては一致率は低くなり、誤判断を回避できるためである。また、すべての文脈項目について一致率を計算する代わりに、体験場所と体験内容の２つの文脈項目についてのみ一致率を計算するようにしてもよい。体験場所と体験内容の２つの文脈項目のみを用いて類似度を計算する理由は、場所と内容が体験を考えるうえで特に有益なものであり、体験場所と体験内容の２つの文脈項目を用いて計算される類似度が高い体験に基づく発話は、その他の文脈項目も用いて計算される類似度が高い体験に基づく発話よりもユーザの共感が得やすい（つまり、システムが共感したことをユーザにわかってもらいやすい）と考えられるからである。

（３）対話制御部１５０は、（１）、（２）の処理を繰り返し、体験データベースに含まれるすべての体験クラスのデータについての処理が終了した場合、類似度が大きい順に１以上の体験クラスのデータを類似体験として選択し出力後、処理を終了する。また、対話制御部１５０は、出力に際して、類似体験にあわせて当該類似体験の類似度を出力するようにしてもよい。

次に、発話テンプレート候補の選択処理について詳しく説明する。

（発話テンプレート候補の選択方法）
（１）対話制御部１５０は、更新前文脈理解結果と更新後文脈理解結果とに基づいて、更新された文脈理解結果の文脈項目を特定する。例えば、対話制御部１５０は、更新前文脈理解結果と更新後文脈理解結果の文脈項目を文字列として比較することで更新された文脈理解結果の文脈項目を特定することができる。

（２）対話制御部１５０は、更新された文脈理解結果の文脈項目に応じた方法により、発話テンプレート候補を選択する。以下、いくつか例を示す。これらの例は、いずれも、対話制御部１５０が、文脈理解結果の更新に関する条件判断を行い、その判断結果に応じた処理を実行する例となっている。

（２－１）対話制御部１５０が、更新前文脈理解結果と更新後文脈理解結果とに基づいて文脈理解結果の体験感想が更新されたと判断した場合
更新後文脈理解結果の体験場所の値が空を示す値であるときは、対話制御部１５０は、発話カテゴリが質問であり、焦点項目が体験場所を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。更新後文脈理解結果の体験内容の値が空を示す値であるときは、対話制御部１５０は、発話カテゴリが質問であり、焦点項目が体験内容を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。更新後文脈理解結果の体験場所の値、体験内容の値がいずれも空を示す値でないときは、対話制御部１５０は、発話カテゴリが共感であり、焦点項目が少なくとも体験場所、体験内容のいずれか一方を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。

なお、対話制御部１５０は、更新後文脈理解結果の体験場所の値、体験内容の値がいずれも空を示す値でない場合に選択した発話テンプレート候補が過去の発話において用いられたものでないかを発話履歴データベースを用いてチェックするようにしてもよい。選択した発話テンプレート候補が過去の発話において用いられたものである場合、対話制御部１５０は、発話カテゴリが質問であり、更新後文脈理解結果の文脈項目の値が空を示す値である発話テンプレートクラスのデータを発話テンプレート候補として選択するとよい。

（２－２）更新前文脈理解結果と更新後文脈理解結果とに基づいて文脈理解結果の体験内容が更新されたと判断した場合
類似度が所定の閾値より大きいかそれ以上である類似体験があるときは、対話制御部１５０は、発話カテゴリが事前共感である発話テンプレートクラスのデータを発話テンプレート候補として選択する。それ以外のときは、対話制御部１５０は、以下の３つの場合に応じて、処理を実行する。更新後文脈理解結果の体験場所の値が空を示す値であるときは、対話制御部１５０は、発話カテゴリが質問であり、焦点項目が体験場所を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。更新後文脈理解結果の体験感想の値が空を示す値であるときは、対話制御部１５０は、発話カテゴリが質問であり、焦点項目が体験感想を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。更新後文脈理解結果の体験場所の値、体験感想の値がいずれも空を示す値でないときは、対話制御部１５０は、発話カテゴリが共感であり、焦点項目が少なくとも体験場所、体験感想のいずれか一方を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。

なお、対話制御部１５０は、（２－１）と同様、選択した発話テンプレート候補が過去の発話において用いられたものでないかを発話履歴データベースを用いてチェックするようにしてもよい。

（２－３）更新前文脈理解結果と更新後文脈理解結果とに基づいて文脈理解結果の体験場所が更新されたと判断した場合
類似度が所定の閾値より大きいかそれ以上である類似体験があるときは、対話制御部１５０は、発話カテゴリが事前共感である発話テンプレートクラスのデータを発話テンプレート候補として選択する。それ以外のときは、対話制御部１５０は、以下の３つの場合に応じて、処理を実行する。更新後文脈理解結果の体験内容の値が空を示す値であるときは、対話制御部１５０は、発話カテゴリが質問であり、焦点項目が体験内容を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。更新後文脈理解結果の体験感想の値が空を示す値であるときは、対話制御部１５０は、発話カテゴリが質問であり、焦点項目が体験感想を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。更新後文脈理解結果の体験内容の値、体験感想の値がいずれも空を示す値でないときは、対話制御部１５０は、発話カテゴリが共感であり、焦点項目が少なくとも体験内容、体験感想のいずれか一方を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。

（２－４）更新前文脈理解結果と更新後文脈理解結果とに基づいて文脈理解結果の体験時期が更新されたと判断した場合
更新後文脈理解結果の体験場所の値、体験内容の値がいずれも空を示す値でないときは、対話制御部１５０は、発話カテゴリが質問であり、焦点項目が体験時期と体験感想を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。更新後文脈理解結果の体験場所の値が空を示す値であるときは、対話制御部１５０は、発話カテゴリが関連質問であり、焦点項目が体験場所を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。更新後文脈理解結果の体験内容の値が空を示す値であるときは、対話制御部１５０は、発話カテゴリが関連質問であり、焦点項目が体験内容を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。

（２－５）更新前文脈理解結果と更新後文脈理解結果とに基づいて文脈理解結果の体験者が更新されたと判断した場合
更新後文脈理解結果の体験場所の値、体験内容の値がいずれも空を示す値でないときは、対話制御部１５０は、発話カテゴリが質問であり、焦点項目が体験者と体験感想を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。更新後文脈理解結果の体験場所の値が空を示す値であるときは、対話制御部１５０は、発話カテゴリが関連質問であり、焦点項目が体験場所を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。更新後文脈理解結果の体験内容の値が空を示す値であるときは、対話制御部１５０は、発話カテゴリが関連質問であり、焦点項目が体験内容を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する。

（２－６）対話制御部１５０が更新後文脈理解結果と体験データベースに含まれる体験クラスのデータにおける体験場所、または、体験内容の文字列または形態素の列としての一致率に基づいて計算される類似度を用いており、更新前文脈理解結果と更新後文脈理解結果とに基づいて文脈理解結果の体験場所が更新されたと判断した場合
対話制御部１５０は、発話カテゴリが共感であり、発話テンプレートには類似体験の体験場所、類似体験の体験感想、類似体験の体験感想理由に関する補充欄がある発話テンプレートクラスのデータを発話テンプレート候補として選択する。

（２－７）対話制御部１５０が更新後文脈理解結果と体験データベースに含まれる体験クラスのデータにおける体験場所、または、体験内容の文字列または形態素の列としての一致率に基づいて計算される類似度を用いており、更新前文脈理解結果と更新後文脈理解結果とに基づいて文脈理解結果の体験内容が更新されたと判断した場合
対話制御部１５０は、発話カテゴリが共感であり、発話テンプレートには類似体験の体験内容、類似体験の体験感想、類似体験の体験感想理由に関する補充欄がある発話テンプレートクラスのデータを発話テンプレート候補として選択する。

以上説明した（２－１）～（２－７）の各処理は、例えば、“（２－１）→（２－２）→（２－３）→（２－４）→（２－５）→（２－６）→（２－７）”のように、予め定めた順序に従い、文脈理解結果の更新に関する条件判断の結果に基づいて、処理を実行するようにしてもよい。

（３）対話制御部１５０は、発話テンプレート候補を出力する。なお、（１）の処理において特定された文脈理解結果の文脈項目が２以上ある場合、対話制御部１５０は、テンプレートを適用する順番を示す優先度を計算し、発話テンプレート候補とあわせて優先度を出力するようにしてもよい。また、優先度を出力する代わりに、対話制御部１５０は、発話テンプレート候補をリストにして出力することとし、当該リストでの出現順を優先度に対応させるようにしてもよい。

以下、優先度の計算方法について説明する。対話制御部１５０は、例えば、類似体験を用いて発話を生成する発話テンプレート（つまり、発話カテゴリが共感または関連質問である発話テンプレート）の優先度が高くなるように優先度を計算する。また、対話制御部１５０は、例えば、発話カテゴリが質問である発話テンプレートと発話カテゴリが共感である発話テンプレートができる限り交互に用いられるように、発話履歴データベースを用いて優先度を計算する。

Ｓ１６０において、発話生成部１６０は、記録部１９０に記録している更新後文脈理解結果とＳ１５０で選択した類似体験と発話テンプレート候補とを入力とし、更新後文脈理解結果と類似体験と発話テンプレート候補とを用いて、入力テキストに対する応答となる発話を表す出力テキストを生成、出力する。

以下、発話生成処理について詳しく説明する。

（１）発話テンプレート候補の発話カテゴリが共感である場合
発話生成部１６０は、類似体験の文脈項目、更新後文脈理解結果の文脈項目に基づいて発話テンプレート候補の補充欄を補充したうえで、出力テキストを生成する。つまり、発話生成部１６０は、発話テンプレート候補の補充欄に対応する文脈項目の値を設定する。例えば、更新後文脈理解結果が図１０(a)のデータであり、類似体験が図１０(b)のデータである場合、発話生成部１６０は、発話テンプレート“私も［類似体験の体験場所］で［類似体験の体験内容］よ。［類似体験の体験感想理由］ので［類似体験の体験感想］よ。”から発話“私もなんばでたこ焼きを食べたよ。熱々だったので美味しかったよ。”を生成する。

なお、類似度が所定の閾値より大きいかそれ以上である類似体験がある場合に限り、例えば、“私も［類似体験の体験場所］で［類似体験の体験内容］よ。［類似体験の体験感想理由］ので［類似体験の体験感想］よね。”のような、発話カテゴリが事前共感である発話テンプレート候補を用いるようにしてもよい。発話を生成する際、補充欄を文脈項目の文言のまま埋めてしまうと、“私もなんばでたこ焼きを食べたよ。熱々だったので美味しかったよね。”という不自然な文になることもあるため、“私もなんばでたこ焼きを食べたよ。熱々で美味しいよね。”という自然な文になるように変換する必要がある。当該変換を実現するための一例は、例えば、「だったので→で」、「しかったよね→しいよね」のような変換ルールを事前に作成しておくことである。これらの変換ルールに基づいて文字列置換を実行することで、自然な文を生成することが可能となる。

（２）発話テンプレート候補の発話カテゴリが関連質問である場合
発話生成部１６０は、類似体験の文脈項目、更新後文脈理解結果の文脈項目に基づいて発話テンプレート候補の補充欄を補充したうえで、出力テキストを生成する。つまり、発話生成部１６０は、発話テンプレート候補の補充欄に対応する文脈項目の値を設定する。例えば、更新後文脈理解結果が図１１(a)のデータであり、類似体験が図１１(b)のデータである場合、発話生成部１６０は、発話テンプレート“私も［類似体験の体験時期］に［類似体験の体験内容］よ。もしかして［類似体験の体験場所］とか行った？”から発話“私も７月に大阪行ったよ。もしかして海遊館とか行った？”を生成する。

（３）発話テンプレート候補の発話カテゴリが質問または事前共感である場合
発話テンプレート候補に補充欄がある場合は、発話生成部１６０は、類似体験の文脈項目、更新後文脈理解結果の文脈項目に基づいて発話テンプレート候補の補充欄を補充したうえで、出力テキストを生成する。また、発話テンプレート候補に補充欄がない場合は、発話生成部１６０は、類似体験、文脈理解結果を用いることなく、発話テンプレート候補そのものを出力テキストとする。

なお、Ｓ１５０の説明における（２－６）、（２－７）の場合、発話生成部１６０は、類似体験の体験場所、体験感想、体験感想理由に基づいて発話テンプレート候補から出力テキストを生成する。

Ｓ１７０において、発話出力部１７０は、Ｓ１６０で生成した出力テキストを入力とし、出力テキストから、ユーザの発話に対する応答となる発話（以下、出力データという）を生成、出力し、処理の制御をＳ１２０に戻す。発話出力部１７０は、出力テキストをそのまま出力データとして出力してもよいし、音声変換により出力テキストから生成される音声（音声信号）を出力データとして出力してもよい。すなわち、出力データのデータ形式には、人間が理解することができる任意のデータ形式を用いることができる。

本発明の実施形態によれば、対話の文脈を示すデータに基づいて発話を生成することが可能となる。

＜補記＞
図１２は、上述の各装置を実現するコンピュータの機能構成の一例を示す図である。上述の各装置における処理は、記録部２０２０に、コンピュータを上述の各装置として機能させるためのプログラムを読み込ませ、制御部２０１０、入力部２０３０、出力部２０４０などに動作させることで実施できる。

本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置（例えば通信ケーブル）が接続可能な通信部、ＣＰＵ（Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい）、メモリであるＲＡＭやＲＯＭ、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、ＣＰＵ、ＲＡＭ、ＲＯＭ、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、ＣＤ－ＲＯＭなどの記録媒体を読み書きできる装置（ドライブ）などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。

ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている（外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるＲＯＭに記憶させておくこととしてもよい）。また、これらのプログラムの処理によって得られるデータなどは、ＲＡＭや外部記憶装置などに適宜に記憶される。

ハードウェアエンティティでは、外部記憶装置（あるいはＲＯＭなど）に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にＣＰＵで解釈実行・処理される。その結果、ＣＰＵが所定の機能（上記、…部、…手段などと表した各構成部）を実現する。

本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。

既述のように、上記実施形態において説明したハードウェアエンティティ（本発明の装置）における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ－ＲＡＭ（Random Access Memory）、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ－Ｒ（Recordable）／ＲＷ（ReWritable）等を、光磁気記録媒体として、ＭＯ（Magneto-Optical disc）等を、半導体メモリとしてＥＥＰ－ＲＯＭ（Electronically Erasable and Programmable-Read Only Memory）等を用いることができる。

また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

上述の本発明の実施形態の記載は、例証と記載の目的で提示されたものである。網羅的であるという意思はなく、開示された厳密な形式に発明を限定する意思もない。変形やバリエーションは上述の教示から可能である。実施形態は、本発明の原理の最も良い例証を提供するために、そして、この分野の当業者が、熟考された実際の使用に適するように本発明を色々な実施形態で、また、色々な変形を付加して利用できるようにするために、選ばれて表現されたものである。すべてのそのような変形やバリエーションは、公正に合法的に公平に与えられる幅にしたがって解釈された添付の請求項によって定められた本発明のスコープ内である。

Claims

体験の時期を示す項目である体験時期と、体験の場所を示す項目である体験場所と、体験を共有した者を示す項目である体験者と、体験の内容を示す項目である体験内容と、体験に関する感想を示す項目である体験感想とを含むデータ構造を文脈クラス、文脈クラスに含まれる項目（以下、文脈項目という）である体験時期、体験場所、体験者、体験内容、体験感想と、体験に関する感想の根拠を示す項目である体験感想理由とを含むデータ構造を体験クラス、発話の生成に用いるテンプレート（以下、発話テンプレートという）を識別するための情報（以下、テンプレートIDという）と、発話テンプレートと、発話テンプレートの種別を示す発話カテゴリと、発話テンプレートの焦点を示す文脈項目（以下、焦点項目という）とを含むデータ構造を発話テンプレートクラスとし、
体験クラスのデータから構成される体験データベースと、発話テンプレートクラスのデータから構成される発話テンプレートデータベースとを記録する記録部と、
ユーザの発話を表す入力テキストから抽出される、文脈項目とその値の組を含むデータ（以下、フレーズという）を要素とする集合であるフレーズ集合を生成するフレーズ抽出部と、
前記フレーズ集合を用いて、現時点における対話の文脈を示す文脈クラスのデータ（以下、更新前文脈理解結果という）から、最新の対話の文脈を示す文脈クラスのデータ（以下、更新後文脈理解結果という）を生成する文脈理解結果更新部と、
前記更新後文脈理解結果と体験データベースに含まれる体験クラスのデータとの間で計算される類似度に基づいて１以上の体験クラスのデータを類似体験として選択し、前記更新前文脈理解結果と前記更新後文脈理解結果とを用いて発話テンプレートデータベースから発話テンプレートクラスのデータを発話テンプレート候補として選択する対話制御部と、
前記更新後文脈理解結果と前記類似体験と前記発話テンプレート候補とを用いて、前記入力テキストに対する応答となる発話を表す出力テキストを生成する発話生成部と、
を含む発話生成装置。
請求項１に記載の発話生成装置であって、
前記対話制御部は、
前記更新前文脈理解結果と前記更新後文脈理解結果とに基づいて文脈理解結果の体験感想が更新されたと判断した場合において、
前記更新後文脈理解結果の体験場所の値が空を示す値であるときは、発話カテゴリが質問であり、焦点項目が体験場所を含む発話テンプレートクラスのデータを発話テンプレート候補として選択し、
前記更新後文脈理解結果の体験内容の値が空を示す値であるときは、発話カテゴリが質問であり、焦点項目が体験内容を含む発話テンプレートクラスのデータを発話テンプレート候補として選択し、
前記更新後文脈理解結果の体験場所の値、体験内容の値がいずれも空を示す値でないときは、発話カテゴリが共感であり、焦点項目が少なくとも体験場所、体験内容のいずれか一方を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する
ことを特徴とする発話生成装置。
請求項１に記載の発話生成装置であって、
前記対話制御部は、
前記更新前文脈理解結果と前記更新後文脈理解結果とに基づいて文脈理解結果の体験内容が更新されたと判断した場合において、
類似度が所定の閾値より大きいかそれ以上である類似体験があるときは、発話カテゴリが事前共感である発話テンプレートクラスのデータを発話テンプレート候補として選択し、
それ以外のときは、更新後文脈理解結果の体験場所の値が空を示す値であれば、発話カテゴリが質問であり、焦点項目が体験場所を含む発話テンプレートクラスのデータを発話テンプレート候補として選択し、更新後文脈理解結果の体験感想の値が空を示す値であれば、発話カテゴリが質問であり、焦点項目が体験感想を含む発話テンプレートクラスのデータを発話テンプレート候補として選択し、更新後文脈理解結果の体験場所の値、体験感想の値がいずれも空を示す値でないのであれば、発話カテゴリが共感であり、焦点項目が少なくとも体験場所、体験感想のいずれか一方を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する
ことを特徴とする発話生成装置。
請求項１に記載の発話生成装置であって、
前記対話制御部は、
前記更新前文脈理解結果と前記更新後文脈理解結果とに基づいて文脈理解結果の体験場所が更新されたと判断した場合において、
類似度が所定の閾値より大きいかそれ以上である類似体験があるときは、発話カテゴリが事前共感である発話テンプレートクラスのデータを発話テンプレート候補として選択し、
それ以外のときは、更新後文脈理解結果の体験内容の値が空を示す値であれば、発話カテゴリが質問であり、焦点項目が体験内容を含む発話テンプレートクラスのデータを発話テンプレート候補として選択し、更新後文脈理解結果の体験感想の値が空を示す値であれば、発話カテゴリが質問であり、焦点項目が体験感想を含む発話テンプレートクラスのデータを発話テンプレート候補として選択し、更新後文脈理解結果の体験内容の値、体験感想の値がいずれも空を示す値でないのであれば、発話カテゴリが共感であり、焦点項目が少なくとも体験内容、体験感想のいずれか一方を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する
ことを特徴とする発話生成装置。
請求項１に記載の発話生成装置であって、
前記対話制御部は、
前記更新前文脈理解結果と前記更新後文脈理解結果とに基づいて文脈理解結果の体験時期が更新されたと判断した場合において、
前記更新後文脈理解結果の体験場所の値、体験内容の値がいずれも空を示す値でないときは、発話カテゴリが質問であり、焦点項目が体験時期と体験感想を含む発話テンプレートクラスのデータを発話テンプレート候補として選択し、
前記更新後文脈理解結果の体験場所の値が空を示す値であるときは、発話カテゴリが関連質問であり、焦点項目が体験場所を含む発話テンプレートクラスのデータを発話テンプレート候補として選択し、
前記更新後文脈理解結果の体験内容の値が空を示す値であるときは、発話カテゴリが関連質問であり、焦点項目が体験内容を含む発話テンプレートクラスのデータを発話テンプレート候補として選択する
ことを特徴とする発話生成装置。
請求項１に記載の発話生成装置であって、
前記対話制御部は、
前記更新後文脈理解結果と体験データベースに含まれる体験クラスのデータにおける体験場所、または、体験内容の文字列または形態素の列としての一致率に基づいて計算される類似度を用いるものであり、
前記更新前文脈理解結果と前記更新後文脈理解結果とに基づいて文脈理解結果の体験場所が更新されたと判断した場合は、発話カテゴリが共感であり、発話テンプレートには類似体験の体験場所、類似体験の体験感想、類似体験の体験感想理由に関する補充欄がある発話テンプレートクラスのデータを発話テンプレート候補として選択し、
前記発話生成部は、
前記類似体験の体験場所、体験感想、体験感想理由に基づいて前記発話テンプレート候補から前記出力テキストを生成する
ことを特徴とする発話生成装置。
体験の時期を示す項目である体験時期と、体験の場所を示す項目である体験場所と、体験を共有した者を示す項目である体験者と、体験の内容を示す項目である体験内容と、体験に関する感想を示す項目である体験感想とを含むデータ構造を文脈クラス、文脈クラスに含まれる項目（以下、文脈項目という）である体験時期、体験場所、体験者、体験内容、体験感想と、体験に関する感想の根拠を示す項目である体験感想理由とを含むデータ構造を体験クラス、発話の生成に用いるテンプレート（以下、発話テンプレートという）を識別するための情報（以下、テンプレートIDという）と、発話テンプレートと、発話テンプレートの種別を示す発話カテゴリと、発話テンプレートの焦点を示す文脈項目（以下、焦点項目という）とを含むデータ構造を発話テンプレートクラスとし、
体験クラスのデータから構成される体験データベースと、発話テンプレートクラスのデータから構成される発話テンプレートデータベースとを記録する記録部を含む発話生成装置が、ユーザの発話を表す入力テキストから抽出される、文脈項目とその値の組を含むデータ（以下、フレーズという）を要素とする集合であるフレーズ集合を生成するフレーズ抽出ステップと、
前記発話生成装置が、前記フレーズ集合を用いて、現時点における対話の文脈を示す文脈クラスのデータ（以下、更新前文脈理解結果という）から、最新の対話の文脈を示す文脈クラスのデータ（以下、更新後文脈理解結果という）を生成する文脈理解結果更新ステップと、
前記発話生成装置が、前記更新後文脈理解結果と体験データベースに含まれる体験クラスのデータとの間で計算される類似度に基づいて１以上の体験クラスのデータを類似体験として選択し、前記更新前文脈理解結果と前記更新後文脈理解結果とを用いて発話テンプレートデータベースから発話テンプレートクラスのデータを発話テンプレート候補として選択する対話制御ステップと、
前記発話生成装置が、前記更新後文脈理解結果と前記類似体験と前記発話テンプレート候補とを用いて、前記入力テキストに対する応答となる発話を表す出力テキストを生成する発話生成ステップと、
を含む発話生成方法。
請求項１ないし６のいずれか１項に記載の発話生成装置としてコンピュータを機能させるためのプログラム。