JPWO2014073613A1

JPWO2014073613A1 - 会話文生成装置、会話文生成方法及び会話文生成プログラム

Info

Publication number: JPWO2014073613A1
Application number: JP2014545753A
Authority: JP
Inventors: 貴士大西; 千穂井木
Original assignee: NEC Corp; NEC Solutions Innovators Ltd
Current assignee: NEC Corp; NEC Solutions Innovators Ltd
Priority date: 2012-11-08
Filing date: 2013-11-07
Publication date: 2016-09-08
Also published as: US20150279350A1; US9679553B2; WO2014073613A1

Abstract

本願発明の会話文生成装置は、ユーザからエージェントへ向けた会話文と、エージェントの物理状態および心理状態を推定する第１の手掛かり情報と、ユーザの物理状態および心理状態を推定する第２の手掛かり情報と、を入力情報として受け付け、エージェントの物理状態および心理状態をエージェント状態として記憶し、ユーザの物理状態および心理状態をユーザ状態として記憶し、入力情報と、エージェント状態とから新たなエージェント状態を推定し、入力情報と、ユーザ状態とから新たなユーザ状態を推定し、入力情報と、エージェント状態とユーザ状態とから、エージェントのユーザに対する発話意図を生成し、入力情報とエージェント状態とユーザ状態と発話意図とからエージェントのユーザに対する会話文を生成して出力する。

Description

本発明は、会話文生成装置、会話文生成方法及び会話文生成プログラムに関し、特にユーザとの擬人的な会話を行う仮想的なエージェントの会話文を生成する会話文生成装置、会話文生成方法及び会話文生成プログラムに関する。

人間は誰かとコミュニケーションをとりたい、共感を得たいという欲求を持っており、そのようなコミュニケーションの相手は、対人間だけのものでなく、対機械や対動物のようにあらゆる対象との間で成り立つものであると考えられる。そのような人間と機械が対話的にインタラクションを行うシステムとしてこれまで多くの対話システムが提案されている。

そのような対話システムの一例として特許文献１がある。特許文献１では、交流分析（たとえば、杉田峰泰：「交流分析」，日本文化科学社，１９８５）に基づいて自我状態を自我状態推定部で推定し、推定した自我状態を用いて対話制御部で応答用のテキストを出力し、人間と機械とがスムーズに対話する対話システムを開示している。

特開２００６−７１９３６号公報

しかし、従来の対話システムは、あらかじめ決められたシナリオに沿ってユーザと機械とが対話を行うことで決められたタスクを達成することを志向したものであり、そこでの対話は画一的なものが多く、人間同士の雑談のような自由な会話を志向したものではなかった。

従来の人間と機械の対話システムは、人間からの要求に対して、対話制御部で要求内容を判別し、要求内容に合わせた対話シナリオに沿って人間との対話を行うことで決められたタスクを達成するものであった。そこでの対話は画一的なものが多く、人間同士の会話のようなバリエーションのある会話文やユーザの状況に合わせた会話文を生成することはできなかった。人間同士の会話では会話相手を飽きさせないために同じ意図の発言をする場合でも様々なバリエーションのある発話を行っているし、会話相手がそれぞれ物理状態、心理状態を持ち、それに合わせた発話を行っている、また、過去の発言を記憶し、過去の発言内容と一貫した会話を行っている。従来の対話システムでは、そうした人間らしい会話を実現することが困難であった。

本発明は、上記問題点に鑑みてなされたもので、人間らしい会話を実現することができる会話文生成装置、会話文生成方法及び会話文生成プログラムを提供することを目的とする。

本発明は、ユーザとの擬人的な会話を行う仮想的なエージェントの会話文を生成する会話文生成装置であって、ユーザからエージェントへ向けた会話文と、エージェントの物理状態および心理状態を推定する第１の手掛かり情報と、ユーザの物理状態および心理状態を推定する第２の手掛かり情報と、を入力情報として受け付ける入力部と、エージェントの物理状態および心理状態をエージェント状態として記憶するエージェント状態記憶部と、ユーザの物理状態および心理状態をユーザ状態として記憶するユーザ状態記憶部と、入力情報と、エージェント状態とから新たなエージェント状態を推定するエージェント状態推定部と、入力情報と、ユーザ状態とから新たなユーザ状態を推定するユーザ状態推定部と、入力情報と、エージェント状態とユーザ状態とから、エージェントのユーザに対する発話意図を生成する発話意図生成部と、入力情報と、エージェント状態と、ユーザ状態と、発話意図とから、エージェントのユーザに対する会話文を生成する会話文生成部と、会話文生成部で生成した会話文を出力する出力部と、を備えることを特徴とする会話文生成装置である。

以上のような構成にすることで、本発明では、会話文生成を状態推定、発話意図生成、会話文生成の３つのフェーズに分けて行う。発話意図生成と会話文生成を分けて扱うことで同じ発話意図に対して複数の会話文を生成しバリエーションのある会話文を生成することが可能になる。エージェントの状態推定、またはユーザの状態推定を行うことで、エージェント、ユーザの物理状態、心理状態を推定し、推定した物理状態、心理状態に合わせた会話文を生成することが可能になる。また、状態推定を行い、その結果を状態記憶部で記憶することで過去の発言内容と一貫した会話文を生成することが可能になる。

本発明は、ユーザとの擬人的な会話を行う仮想的なエージェントの会話文を生成する会話文生成方法であって、ユーザからエージェントへ向けた会話文と、エージェントの物理状態および心理状態を推定する第１の手掛かり情報と、ユーザの物理状態および心理状態を推定する第２の手掛かり情報と、を入力情報として受け付け、エージェントの物理状態および心理状態をエージェント状態として記憶し、ユーザの物理状態および心理状態をユーザ状態として記憶し、入力情報と、エージェント状態とから新たなエージェント状態を推定し、入力情報と、ユーザ状態とから新たなユーザ状態を推定し、入力情報と、エージェント状態とユーザ状態とから、エージェントのユーザに対する発話意図を生成し、入力情報と、エージェント状態と、ユーザ状態と、発話意図とから、エージェントのユーザに対する会話文を生成し、会話文生成部で生成した会話文を出力することを特徴とする会話文生成方法である。

本発明は、コンピュータに、ユーザからエージェントへ向けた会話文と、エージェントの物理状態および心理状態を推定する第１の手掛かり情報と、ユーザの物理状態および心理状態を推定する第２の手掛かり情報と、を入力情報として受け付ける処理、エージェントの物理状態および心理状態をエージェント状態として記憶する処理、ユーザの物理状態および心理状態をユーザ状態として記憶する処理、入力情報と、エージェント状態とから新たなエージェント状態を推定する処理、入力情報と、ユーザ状態とから新たなユーザ状態を推定する処理、入力情報と、エージェント状態とユーザ状態とから、エージェントのユーザに対する発話意図を生成する処理、入力情報と、エージェント状態と、ユーザ状態と、発話意図とから、エージェントのユーザに対する会話文を生成する会話文生成処理、前記会話文生成処理で生成した会話文を出力する処理、を実行させることを特徴とするプログラムである。

本発明によれば、人間らしい会話を実現する会話文を生成することができる。

図１は本発明の第１の実施形態の構成を示すブロック図である。図２は本発明の第２の実施形態の構成を示すブロック図である。図３は本発明の実施形態の動作を説明するためのフローチャートである。

以下、本発明の実施形態について図面を参照して説明する。本発明は、機械や動物を擬人化したエージェントとして扱い、ユーザである人間との間で会話を行うシステムに関するものである。

（第１の実施形態）
第１の実施形態に係る会話文生成装置の構成例を示すブロック図を図１に示す。本発明の第１の実施の形態は、入力部１と、エージェント状態推定部２と、発話意図生成部３と、会話文生成部４と、出力部５と、エージェント状態記憶部６から構成される。

入力部１は、ユーザからエージェントへ向けた会話文と、エージェントの物理状態および心理状態を推定する手掛かり情報とを入力情報として受け付け、それらをエージェント状態推定部２に渡す。

入力情報は、属性名と属性値のペアで与えられる。ユーザからエージェントへ向けた会話文は、会話文そのままを用いてもよいし、会話文を解析し要点のみを抽出して用いてもよい。例えば、ユーザからエージェントへ「（帰りが）遅くなる」との内容のメールを送った際に属性名が「メール」、属性値が「遅くなる」との要点のみを入力情報としても良い。また、エージェントが自らの状態を表明し、会話の発端となる場合は、ユーザからの会話文は入力されなくてもよい。その他、入力情報としては、ユーザ、エージェントの呼び名や性別といったユーザ、エージェントに固有の属性（以下、ユーザ属性、エージェント属性と呼ぶ）や、会話文作成時の時間や天気のような動的な属性（以下、動的属性と呼ぶ）が挙げられる。表１、表２、表３に入力情報の例を示す。

エージェント状態推定部２は、入力部１から受け取った入力情報と、エージェント状態記憶部６で記憶されたエージェント状態とから新たなエージェント状態を推定し、推定されたエージェント状態をエージェント状態記憶部６に格納し、入力情報を発話意図生成部３に渡す。

エージェント状態はエージェントの物理状態および心理状態を表したものであり、入力情報と同様に属性名と属性値のペアで表現される。例えば、エージェントの感情を数値で表した「感情値」は、エージェントがうれしい、楽しい場合は、「感情値」の値を正の値として表現し、逆にエージェントが悲しい、つらい場合は、負の値として表現し、値の絶対値を感情の強さとして定義する。

エージェント状態の推定は、状態推定ルールを用いて行う。状態推定ルールは、条件部と、状態記述部とからなる。状態記述部は、エージェントの物理状態および心理状態を記述したものである。条件部は、入力情報と、エージェント状態記憶部６に記憶されたエージェント状態とから、エージェントが前記状態にあるかどうかを判定する条件を記述したものである。入力情報とエージェント状態が条件部に一致するとエージェントが状態記述部に記述されたエージェント状態であると推定される。状態推定ルールを表４に例示する。

発話意図生成部３は、エージェント状態推定部２から受け取った入力情報と、エージェント状態とから、エージェントのユーザに対する発話意図を生成し、生成した発話意図を入力情報と共に会話文生成部４に渡す。発話意図は「寂しさ表明」、「ユーザなぐさめ」のようなラベルと意図の強さを表すスコアで定義され、１回の会話文生成時に１又は複数の発話意図を生成する。

発話意図の生成は、発話意図生成ルールを用いて行う。発話意図生成ルールは、条件部と、発話意図記述部とからなる。発話意図記述部は、エージェントのユーザに対する発話意図を記述したものである。条件部は、入力情報と、エージェント状態と、ユーザ状態とから、エージェントが前記発話意図にあるかどうかを判定する条件を記述したものである。入力情報とエージェント状態が条件部に一致すると発話意図記述部に記述された発話意図が生成される。発話意図のスコアは条件部に付与されたスコアの合計値とする。また、直近に状態変化があった場合は、変化があった状態に関する意図が強くなると考えられるため、状態変化からの時間が閾値以内の状態を用いた条件にはスコアにボーナスを加え、意図のスコアを大きくしてもよい。

会話文生成部４は、発話意図生成部３から受け取った入力情報、エージェント状態、発話意図を用いて、エージェントのユーザに対する会話文を生成し、生成した会話文を出力部５に渡す。

会話文の生成は、会話文生成ルールを用いて行う。会話文生成ルールは、条件部と、会話文記述部とからなる。会話文記述部は、エージェントのユーザに対する会話文を記述したものである。条件部は、入力情報と、エージェント状態と、発話意図とから、エージェントのユーザに対する会話文として前記会話文が適切かどうかを判定する条件を記述したものである。入力情報とエージェント状態と発話意図が条件部に一致すると、会話文記述部に記述された会話文が選択される。会話文は、文章をそのまま記述してもよいし、ユーザ属性、エージェント属性等の値を変数として埋め込んだテンプレート形式で記述してもよい。その場合、会話文生成時に変数部分をユーザ属性、エージェント属性等の値に置き換えて会話文を生成する。これによって、ユーザ名やエージェント名を文章に埋め込んだ文章を生成することが可能となる。

会話文の生成は発話意図ごとに行い、１つの発話意図からは１つの文章を生成する。１つの発話意図に対して複数の会話文生成ルールが適合する場合は、意図生成時と同様に、条件部に付与されたスコアを合計し、合計スコアがもっとも大きなルールを採用する。直近に使用されたテンプレートを連続して使用するとワンパターンな応答となり、ユーザが飽きることになるため、前回使用時からの時間が閾値以内のルールはスコアにペナルティを付けて連続して同じルールが採用されないようにしてもよい。

出力部５は、会話文生成部４から受け取った会話文をユーザに対して出力する。例えば、文字の色、サイズを編集し、メール送信したりＳＮＳ（social networking service）に投稿する。または、音声合成器を用いて音声でユーザに提示してもよい。

エージェント状態記憶部６は、エージェント状態推定部２で推定したエージェント状態を、生成を行った時刻と紐づけて格納する。エージェント状態は状態推定による変更がない場合でも前回の会話文生成時の状態を継続して保持しておくことで過去の会話文との一貫性のある会話文を生成することが可能となる。

（第２の実施形態）
第２の実施形態に係る会話文生成装置の構成例を示すブロック図を図２に示す。本発明の第２の実施の形態は、エージェント状態の推定だけでなく、ユーザ状態の推定を行う。ユーザ状態の推定が追加されることにより、第２の実施形態では、図１の構成からユーザ状態推定部２２、ユーザ状態記憶部６２が追加される。ユーザ状態の推定、利用はエージェント状態の推定、利用と同様の手法で実現される。

ユーザ状態は、ユーザの物理状態および心理状態を表したものであり、例えば、「ポジティブ」か「ネガティブ」かの属性値を持つ「ポジネガ状態」がある。「ポジネガ状態」は、ユーザからのメール等の内容からユーザの精神状態を「ポジティブ」か「ネガティブ」の２値で表したものである。

次に、図３のフローチャートを参照して第１及び第２の実施の形態の動作について詳細に説明する。まず、入力部１で、ユーザからエージェントへ向けた会話文と、エージェントの物理状態および心理状態を推定する手掛かり情報とを入力情報として受け付ける（ステップＡ１）。

次に、エージェント状態推定部２、又は、エージェント状態推定部２１とユーザ状態推定部２２で、入力部１から受け取った入力情報と、エージェント状態記憶部６、又は、エージェント状態記憶部６１とユーザ状態記憶部６２で記憶されたエージェント状態とから新たなエージェント状態、ユーザ状態を推定し、推定されたエージェント状態、ユーザ状態をエージェント状態記憶部６、又は、エージェント状態記憶部６１とユーザ状態記憶部６２に格納する（ステップＡ２）。

次に、発話意図生成部３で、エージェント状態推定部２から受け取った入力情報と、エージェント状態、ユーザ状態とから、エージェントのユーザに対する発話意図を生成する（ステップＡ３）。

次に、会話文生成部４で、発話意図生成部３から受け取った入力情報、エージェント状態、発話意図を用いて、エージェントのユーザに対する会話文を生成する（ステップＡ４）。

最後に、出力部５で会話文を出力し（ステップＡ５）、処理を終える。

次に、本実施の形態の効果について説明する。本実施の形態では、発話意図生成部で発話意図を生成し、生成された発話意図に沿った会話文を会話文生成部で生成する。１つの発話意図に対して複数の会話文生成ルールを用意することでバリエーションのある会話文を生成することが可能になる。また、エージェント状態推定部、ユーザ状態推定部でエージェントやユーザの物理状態、心理状態を推定し、それに応じて会話文を生成することでエージェントに感情を持たせたり、ユーザの心理に応じた会話を実現できる。また、状態推定の結果を状態記憶部で記憶することで過去の発言内容と一貫した会話文を生成することが可能になる。

次に、具体的な実施例を用いて本発明を実施するための最良の形態の動作を説明する。本実施例では、エージェントとしてペットである犬と会話を行う会話システムを例に説明する。

（実施例１）
入力として表１１、表１２、表１３のようなユーザ属性、エージェント属性、動的属性が与えられた場合の会話文の生成について説明する。まず、エージェント状態推定部２において、表１４のようなエージェント状態推定ルールを参照することによって、動的属性「メール＝遅くなる」という入力によりエージェント状態の「状況」が「留守番」、「感情」が「寂しい」と推定される。

次に、発話意図生成部３で、表１５のような発話意図生成ルールを参照することによって、エージェント状態推定部２で決定されたエージェント状態の「感情＝寂しい」によって留守番に対する「寂しさ表明」の発話意図を生成する。

次に、会話文生成部４で、表１６のような会話文生成ルールを参照することによって、「発話意図＝寂しさ表明」かつ「状況＝留守番」の条件を満たすため、表１６にあるような３通りのテンプレートが選択され、３通りの会話文が生成される。実際に採用される会話文は１つのみのため、上記３通りの会話文がランダムもしくは順繰りに生成されることにより、ユーザを飽きさせない、バリエーションのある会話を実現することが可能となる。

本例では、３パターンの会話文生成ルールを記載しているが、このパターンを増やすことで同じテンプレートの出現頻度を下げることができ、よりバリエーションの豊富な会話を実現することが可能となる。

（実施例２）
入力として表２１、表２２、表２３のようなユーザ属性、エージェント属性、動的属性が与えられた場合の会話文の生成について説明する。

まず、エージェント状態推定部２において、表２４のようなエージェント状態推定ルールを参照することによって、動的属性「メール＝遅くなる」という入力によりエージェント状態の「状況」が「留守番」、「感情値」が「−１」と推定される。また、エージェント状態の感情値が「正値（０以上）」であればエージェントの感情がふつう〜良好と判断され、エージェント状態の感情は「寂しい」と推定される。エージェント状態の感情値が「負値（−１以下）」であればエージェントの感情が不良と判断され、エージェント状態の感情は「嫌悪」と推定される。

次に、発話意図生成部３で、表２５のような発話意図生成ルールを参照することによって、エージェント状態の「感情」をもとに発話意図を生成する。「感情＝寂しい」の場合は発話意図「寂しさ表明」を、「感情＝嫌悪」の場合は発話意図「嫌悪表明」を生成する。

次に、会話文生成部４で、発話意図に沿ったテンプレートを定義しておくことで、「寂しさ表明」の場合は「寂しい気持ち」を、「嫌悪表明」の場合は「嫌悪の気持ち」を表す文章を生成する。表２６のような会話文生成ルールを参照すると、「発話意図＝寂しさ表明」の場合は、「コロ、お留守番寂しいよぉ〜o(；_；)oエーン」が、「発話意図＝嫌悪表明」の場合は、「お留守番なんか、大っきらいだぁ〜！」が会話文として生成される。

以上のように、エージェントの状態として「感情値」という値を定義し、「感情値」に応じて生成する会話文を変化させることにより、非人間のエージェントがあたかも感情を持っているかのような会話を実現することが可能となる。

（実施例３）
入力として表３１、表３２、表３３のようなユーザ属性、エージェント属性、動的属性が与えられた場合の会話文の生成について説明する。

まず、エージェント状態推定部２１において、表３４１のようなエージェント状態推定ルールを参照することによって、動的属性「メール＝遅くなる」という入力によりエージェント状態の状況が「留守番」、感情値が「−１」と推定される。また、エージェント状態の感情値が「正値（０以上）」であればエージェントの感情がふつう〜良好と判断され、エージェント状態の感情は「寂しい」と推定される。エージェント状態の感情値が「負値（−１以下）」であればエージェントの感情が不良と判断され、エージェント状態の感情は「嫌悪」と推定される。

さらに、ユーザ状態推定部２２において、表３４２のようなユーザ状態推定ルールを参照することによって、動的属性「ユーザ状況＝残業中」という入力により、ユーザの現在置かれている状況(残業中)からユーザの精神状態はネガティブと推定され、ユーザ状態のポジネガ状態は「ネガティブ」と推定される。逆にユーザの置かれている状況がユーザにとってポジティブな精神状態になると推定されるもの（デート中、遊び中など）であれば、ユーザ状態のポジネガ状態は「ポジティブ」と推定される。

次に、発話意図生成部３で、表３５のような発話意図生成ルールを参照することによって、エージェント状態の感情とユーザ状態のポジネガ状態をもとに発話意図を生成する。

エージェント状態が「感情＝寂しい」の場合は発話意図「寂しさ表明」を、「感情＝嫌悪」の場合は発話意図「嫌悪表明」を生成する。また、ユーザ状態が「ポジネガ状態＝ネガティブ」の場合はネガティブな精神状態となっているユーザをなぐさめるために発話意図「ユーザなぐさめ」を、「ポジネガ状態＝ポジティブ」の場合はポジティブな精神状態となっているユーザと喜びを共有するために発話意図「ユーザ喜び同調」を生成する。

次に、会話文生成部４で、表３６のような会話文生成ルールを参照し、各会話意図に対応する会話文を生成する。

例えば、発話意図として、「寂しさ表明」と「ユーザなぐさめ」があり、エージェント状態の「状況＝留守番」、「感情＝寂しい」、ユーザ状態の「状況＝残業中」の場合は、以下のような会話文が生成される。

以上のように、「ポジネガ状態」のようなユーザの状態を定義し、ユーザ状態に応じて生成する会話文を変化させることにより、ユーザが期待する会話文を生成することが可能となる。

（実施例４）
入力として表４１、表４２、表４３のようなユーザ属性、エージェント属性、動的属性が与えられた場合の会話文の生成について説明する。本実施例は、ユーザとエージェントが１対１の会話だけでなく、複数のユーザとエージェントが会話する場合である。

まず、エージェント状態推定部２１、ユーザ状態推定部２２において、表４４のようなエージェント状態推定ルール、ユーザ状態推定ルールを参照することによって、ユーザＰ１からの動的属性「土産＝たべもの」という入力により、エージェント状態の状況が「土産待ち」、感情値が「＋１」、ユーザ状態の親密度が「＋１」で生成される。また、ユーザ状態の感情値が「閾値以上（−２以上）」であればエージェントとユーザとの関係はふつう〜良好と判断され、エージェント状態の感情は「とてもうれしい」で生成される。ユーザ状態の感情値が「閾値以下（−３以下）」であればエージェントとユーザとの関係は不良と判断され、エージェント状態の感情は「うれしい」で生成される。

ユーザＰ２からの動的属性「メール＝病院に行く」という入力により、エージェント状態の状況が「通院」、感情値が「−２」、ユーザ状態の親密度が「−２」で生成される。また、ユーザ状態の感情値が「閾値以上（−２以上）」であればエージェントとユーザとの関係はふつう〜良好と判断され、エージェント状態の感情は「悲しい」で生成される。ユーザ状態の感情値が「閾値以下（−３以下）」であればエージェントとユーザとの関係は不良と判断され、エージェント状態の感情は「嫌悪」で生成される。

次に、発話意図生成部３で、表４５のような発話意図生成ルールを参照することによって、エージェント状態とユーザ状態をもとに発話意図を生成する。ユーザＰ１の場合、「感情＝とてもうれしい」の場合は発話意図「歓喜表明」を、「感情＝うれしい」の場合は発話意図「うれしさ表明」を生成する。ユーザＰ２の場合、「感情＝悲しい」の場合は発話意図「悲しみ表明」を、「感情＝嫌悪」の場合は発話意図「嫌悪表明」を生成する。

次に、会話文生成部４で、表４６のような会話文生成ルールを参照し、会話対象となるユーザとエージェントの親密度を加味した上で、各会話意図に対応する会話文を生成する。

例えば、エージェントにとってネガティブなことを重ねた親密度の低いユーザに対しては、ポジティブな動的属性（「土産＝たべもの」）を与えられても余所余所しい形式ばった応答となるよう定義する。逆にポジティブなことを重ねた親密度の高いユーザに対しては、ネガティブな動的属性を与えられても甘えた応答を返すようテンプレートに変化をもたせておくことで、エージェントの感情に沿った応答となるよう定義する。

以上のように、各ユーザとのやりとりによって発生したエージェントの感情によって、各ユーザとエージェントの親密度を数値で定義する。エージェントにとってポジティブな動的属性を与えた場合は親密度を加算、ネガティブな動的属性を与えた場合は減算し、各ユーザごとに保持、管理することで、与えられる動的属性が同じであっても、親密度の高いユーザと親密度の低いユーザとで発生するエージェントの感情を変化させることで、各ユーザとの親密度を踏まえた応答を生成することが可能となる。

（実施例５）
入力として表５１、表５２、表５３のようなユーザ属性、エージェント属性、動的属性が与えられた場合の会話文の生成について説明する。本実施例は、過去の会話の流れに沿った会話を行う場合の例である。

状況として、入力１の時点でエージェントは空腹状態にあったが、入力２で満腹状態となる。その状況で、入力３または入力４が与えられるとする。

まず、エージェント状態推定部２１、ユーザ状態推定部２２において、入力１では、動的属性「メール＝遅くなる」という入力によりエージェント状態の状況が「留守番」、感情値が「−１」、感情が「寂しい」で生成される。

また、動的属性「ユーザ状況＝デート中」という入力によりユーザ状態のポジネガ状態は「ポジティブ」で生成される。さらに、帰りが遅いという状況から、食事も遅くなり、お腹を空かせていると判断され、エージェント状態の体調が「空腹」で生成される。

入力２では、動的属性「ごはん＝完食」という入力によりエージェント状態の状況が「食後」、感情値が「＋１」、感情が「うれしい」、体調が「満腹」で生成される。

入力３、入力４では、動的属性「土産＝たべもの」という入力によりエージェント状態の感情が「うれしい」に変化するが、体調を変化させる動的属性はないため、入力２の状態である「体調＝満腹」をそのまま引き継ぐ。この段階で入力３、入力４の差分はない。

発話意図生成部３では、エージェント状態と過去から引き継がれたエージェント状態に従って発話意図を決定する。

入力１において、エージェント状態が「感情＝寂しい」によって留守番に対する「寂しさ表明」と「体調＝空腹」によって「空腹表明」を生成する。また、ユーザ状態の「ポジネガ状態＝ポジティブ」から「ユーザ喜び同調」を生成する。

入力２においては、エージェント状態の「感情＝うれしい」によって「うれしさ表明」、「体調＝満腹」によって「満腹表明」を生成する。

入力３、入力４においては、エージェント状態の「感情＝うれしい」によって「うれしさ表明」、「体調＝満腹」によって「満腹表明」を生成する。この段階でも入力３、入力４の差分はない。

会話文生成部４では、過去時点の動的属性、エージェント状態、ユーザ状態の履歴情報を参照した上で、過去の内容に触れる会話文生成ルールとなるよう定義する。

入力３は、履歴情報を参照することなく現在のエージェント状態（満腹）に従った文章を生成するが、入力４は、動的属性で指定された過去のある時点の履歴情報から過去時点のエージェント状態（空腹）を参照し、「空腹だった」ことを踏まえた応答を行うよう定義する。入力４では、動的属性として「履歴ポインタ」が「（入力１）」として与えられており、その情報を用いてエージェント状態記憶部６１から入力1時点でのエージェント状態を参照できるようにする。参照時には「履歴:Ａ状態−＞体調」のような記述で過去の入力1時点のエージェント状態の「体調」を参照する。

以上のように、過去の状態推定結果を利用したルールを用いることで過去との一貫性を保った会話文を生成することが可能となる。

なお、状態推定ルールと発話意図生成ルールと会話文生成ルールは、例えば会話文生成装置の記憶部に記憶されてもよく、また、会話文生成装置が接続可能な他の装置に記憶されてもよい。

本発明の活用例として、動物や機械のような非人間の対象を擬人化してユーザと会話を行う会話システム、ソーシャルメディアサービス等に適用できる。

上述した本発明の実施形態に係る会話文生成装置は、ＣＰＵ（Central Processing Unit）が記憶部に格納された動作プログラム等を読み出して実行することにより実現されてもよく、また、ハードウェアで構成されてもよい。上述した実施の形態の一部の機能のみをコンピュータプログラムにより実現することもできる。

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

（付記１）
ユーザとの擬人的な会話を行う仮想的なエージェントの会話文を生成する会話文生成装置であって、
ユーザからエージェントへ向けた会話文と、エージェントの物理状態および心理状態を推定する第１の手掛かり情報と、ユーザの物理状態および心理状態を推定する第２の手掛かり情報と、を入力情報として受け付ける入力部と、
エージェントの物理状態および心理状態をエージェント状態として記憶するエージェント状態記憶部と、
ユーザの物理状態および心理状態をユーザ状態として記憶するユーザ状態記憶部と、
入力情報と、エージェント状態とから新たなエージェント状態を推定するエージェント状態推定部と、
入力情報と、ユーザ状態とから新たなユーザ状態を推定するユーザ状態推定部と、
入力情報と、エージェント状態とユーザ状態とから、エージェントのユーザに対する発話意図を生成する発話意図生成部と、
入力情報と、エージェント状態と、ユーザ状態と、発話意図とから、エージェントのユーザに対する会話文を生成する会話文生成部と、
会話文生成部で生成した会話文を出力する出力部と、
を備えることを特徴とする会話文生成装置。

（付記２）
前記ユーザ状態推定部は、
ユーザの物理状態および心理状態を記述した状態記述部と、入力情報と、前記ユーザ状態記憶部に記憶されたユーザ状態とから、ユーザが前記状態にあるかどうかを判定する条件を記述した条件部とからなる状態推定ルールを用いて、新たなユーザ状態を推定する
ことを特徴とする付記１に記載の会話文生成装置。

（付記３）
前記発話意図生成部は、ユーザ状態を条件に含む発話意図生成ルールを用いて発話意図を生成し、
前記会話文生成部は、ユーザ状態を条件に含む会話文生成ルールを用いて会話文を生成することで、ユーザ状態に応じた会話文を生成する
ことを特徴とする付記１又は付記２に記載の会話文生成装置。

（付記４）
複数のユーザとの会話を行う場合に、
前記ユーザ状態記憶部は、ユーザごとに固有のユーザ状態を記憶し、
前記会話文生成部は、前記入力部で入力されるユーザを特定する情報を用いてユーザ状態を切り替えることで、会話を行うユーザに応じた会話文を生成する
ことを特徴とする付記１から３のいずれかに記載の会話文生成装置。

（付記５）
ユーザとの擬人的な会話を行う仮想的なエージェントの会話文を生成する会話文生成方法であって、
ユーザからエージェントへ向けた会話文と、エージェントの物理状態および心理状態を推定する第１の手掛かり情報と、ユーザの物理状態および心理状態を推定する第２の手掛かり情報と、を入力情報として受け付け、
エージェントの物理状態および心理状態をエージェント状態として記憶し、
ユーザの物理状態および心理状態をユーザ状態として記憶し、
入力情報と、エージェント状態とから新たなエージェント状態を推定し、
入力情報と、ユーザ状態とから新たなユーザ状態を推定し、
入力情報と、エージェント状態とユーザ状態とから、エージェントのユーザに対する発話意図を生成し、
入力情報と、エージェント状態と、ユーザ状態と、発話意図とから、エージェントのユーザに対する会話文を生成し、
生成した会話文を出力する
ことを特徴とする会話文生成方法。

（付記６）
ユーザの物理状態および心理状態を記述した状態記述部と、入力情報と、前記記憶されたユーザ状態とから、ユーザが前記状態にあるかどうかを判定する条件を記述した条件部とからなる状態推定ルールを用いて、新たなユーザ状態を推定する
ことを特徴とする付記５に記載の会話文生成方法。

（付記７）
ユーザ状態を条件に含む発話意図生成ルールを用いて発話意図を生成し、
ユーザ状態を条件に含む会話文生成ルールを用いて会話文を生成することで、ユーザ状態に応じた会話文を生成する
ことを特徴とする付記５又付記６に記載の会話文生成方法。

（付記８）
複数のユーザとの会話を行う場合に、
ユーザごとに固有のユーザ状態を記憶し、
前記入力されるユーザを特定する情報を用いてユーザ状態を切り替えることで、会話を行うユーザに応じた会話文を生成する
ことを特徴とする付記５から７のいずれかに記載の会話文生成方法。

（付記９）
コンピュータに、
ユーザからエージェントへ向けた会話文と、エージェントの物理状態および心理状態を推定する第１の手掛かり情報と、ユーザの物理状態および心理状態を推定する第２の手掛かり情報と、を入力情報として受け付ける入力処理、
エージェントの物理状態および心理状態をエージェント状態として記憶する処理、
ユーザの物理状態および心理状態をユーザ状態として記憶するユーザ状態記憶処理、
入力情報と、エージェント状態とから新たなエージェント状態を推定する処理、
入力情報と、ユーザ状態とから新たなユーザ状態を推定するユーザ状態推定処理、
入力情報と、エージェント状態とユーザ状態とから、エージェントのユーザに対する発話意図を生成する発話意図生成処理、
入力情報と、エージェント状態と、ユーザ状態と、発話意図とから、エージェントのユーザに対する会話文を生成する会話文生成処理、
前記会話文生成処理で生成した会話文を出力する処理、
を実行させることを特徴とするプログラム。

（付記１０）
前記ユーザ状態推定処理は、
ユーザの物理状態および心理状態を記述した状態記述部と、入力情報と、前記憶されたユーザ状態とから、ユーザが前記状態にあるかどうかを判定する条件を記述した条件部とからなる状態推定ルールを用いて、新たなユーザ状態を推定する
ことを特徴とする付記９に記載のプログラム。

（付記１１）
前記発話意図生成処理は、ユーザ状態を条件に含む発話意図生成ルールを用いて発話意図を生成し、
前記会話文生成処理は、ユーザ状態を条件に含む会話文生成ルールを用いて会話文を生成することで、ユーザ状態に応じた会話文を生成する
ことを特徴とする付記９又は付記１０に記載のプログラム。

（付記１２）
複数のユーザとの会話を行う場合に、
前記ユーザ状態記憶処理は、ユーザごとに固有のユーザ状態を記憶し、
前記会話文生成処理は、前記入力処理で入力されるユーザを特定する情報を用いてユーザ状態を切り替えることで、会話を行うユーザに応じた会話文を生成する
ことを特徴とする付記９から１１のいずれかに記載のプログラム。

以上、好ましい実施の形態をあげて本発明を説明したが、本発明は必ずしも上記実施の形態に限定されるものではなく、その技術的思想の範囲内において様々に変形し実施することが出来る。
この出願は、２０１２年１１月８日に出願された日本出願特願２０１２−２４６２６２を基礎とする優先権を主張し、その開示の全てをここに取り込む。

１入力部
２エージェント状態推定部
３発話意図生成部
４会話文生成部
５出力部
６エージェント状態記憶部
２１エージェント状態推定部
２２ユーザ状態推定部
６１エージェント状態記憶部
６２ユーザ状態記憶部

Claims

ユーザとの擬人的な会話を行う仮想的なエージェントの会話文を生成する会話文生成装置であって、
ユーザからエージェントへ向けた会話文と、エージェントの物理状態および心理状態を推定する第１の手掛かり情報と、ユーザの物理状態および心理状態を推定する第２の手掛かり情報と、を入力情報として受け付ける入力部と、
エージェントの物理状態および心理状態をエージェント状態として記憶するエージェント状態記憶部と、
ユーザの物理状態および心理状態をユーザ状態として記憶するユーザ状態記憶部と、
入力情報と、エージェント状態とから新たなエージェント状態を推定するエージェント状態推定部と、
入力情報と、ユーザ状態とから新たなユーザ状態を推定するユーザ状態推定部と、
入力情報と、エージェント状態とユーザ状態とから、エージェントのユーザに対する発話意図を生成する発話意図生成部と、
入力情報と、エージェント状態と、ユーザ状態と、発話意図とから、エージェントのユーザに対する会話文を生成する会話文生成部と、
会話文生成部で生成した会話文を出力する出力部と、
を備えることを特徴とする会話文生成装置。
前記ユーザ状態推定部は、
ユーザの物理状態および心理状態を記述した状態記述部と、入力情報と、前記ユーザ状態記憶部に記憶されたユーザ状態とから、ユーザが前記状態にあるかどうかを判定する条件を記述した条件部とからなる状態推定ルールを用いて、新たなユーザ状態を推定する
ことを特徴とする請求項１に記載の会話文生成装置。
前記発話意図生成部は、ユーザ状態を条件に含む発話意図生成ルールを用いて発話意図を生成し、
前記会話文生成部は、ユーザ状態を条件に含む会話文生成ルールを用いて会話文を生成することで、ユーザ状態に応じた会話文を生成する
ことを特徴とする請求項１又は請求項２に記載の会話文生成装置。
複数のユーザとの会話を行う場合に、
前記ユーザ状態記憶部は、ユーザごとに固有のユーザ状態を記憶し、
前記会話文生成部は、前記入力部で入力されるユーザを特定する情報を用いてユーザ状態を切り替えることで、会話を行うユーザに応じた会話文を生成する
ことを特徴とする請求項１から請求項３のいずれかに記載の会話文生成装置。
ユーザとの擬人的な会話を行う仮想的なエージェントの会話文を生成する会話文生成方法であって、
ユーザからエージェントへ向けた会話文と、エージェントの物理状態および心理状態を推定する第１の手掛かり情報と、ユーザの物理状態および心理状態を推定する第２の手掛かり情報と、を入力情報として受け付け、
エージェントの物理状態および心理状態をエージェント状態として記憶し、
ユーザの物理状態および心理状態をユーザ状態として記憶し、
入力情報と、エージェント状態とから新たなエージェント状態を推定し、
入力情報と、ユーザ状態とから新たなユーザ状態を推定し、
入力情報と、エージェント状態と、ユーザ状態とから、エージェントのユーザに対する発話意図を生成し、
入力情報と、エージェント状態と、ユーザ状態と、発話意図とから、エージェントのユーザに対する会話文を生成し、
生成した会話文を出力する
ことを特徴とする会話文生成方法。
コンピュータに、
ユーザからエージェントへ向けた会話文と、エージェントの物理状態および心理状態を推定する第１の手掛かり情報と、ユーザの物理状態および心理状態を推定する第２の手掛かり情報と、を入力情報として受け付ける処理、
エージェントの物理状態および心理状態をエージェント状態として記憶する処理、
ユーザの物理状態および心理状態をユーザ状態として記憶する処理、
入力情報と、エージェント状態と、から新たなエージェント状態を推定する処理、
入力情報と、ユーザ状態とから新たなユーザ状態を推定する処理、
入力情報と、エージェント状態とユーザ状態とから、エージェントのユーザに対する発話意図を生成する処理、
入力情報と、エージェント状態と、ユーザ状態と、発話意図とから、エージェントのユーザに対する会話文を生成する会話文生成処理、
前記会話文生成処理で生成した会話文を出力する処理、
を実行させることを特徴とするプログラム。