WO2017130497A1

WO2017130497A1 - 通信システムおよび通信制御方法

Info

Publication number: WO2017130497A1
Application number: PCT/JP2016/081986
Authority: WO
Inventors: 正道飛鳥井
Original assignee: ソニー株式会社
Priority date: 2016-01-28
Filing date: 2016-10-28
Publication date: 2017-08-03
Also published as: US11159462B2; JPWO2017130497A1; US20190020609A1; JP6859959B2; JP2021096873A; JP7056780B2

Abstract

【課題】ユーザ同士の実際の会話から生成した会話構造を用いてユーザを所定の感情に導くことが可能な通信システムおよび通信制御方法を提供する。【解決手段】ユーザの会話を受信する通信部と、前記通信部を介して収集されたユーザの会話に基づき生成された会話の構造を記述する会話フレームを蓄積する蓄積部と、前記収集される会話単位でその会話を発信するユーザの感情に関わる感情パラメータを求め；前記感情パラメータに基づき、前記会話から前記会話フレームを抽出して前記蓄積部に蓄積する制御部と、を備える、通信システム。

Description

通信システムおよび通信制御方法

　本開示は、通信システムおよび通信制御方法に関する。

　近年、通信技術の発達により、ネットワークを介したメッセージのやり取りが頻繁に行われている。ユーザは、スマートフォンや携帯電話端末、タブレット端末等の情報処理端末を用いて、他端末から送信されたメッセージを確認したり、メッセージを送信したりすることができる。

　また、情報処理端末を用いて、ユーザのメッセージに対して自動で応答を行うエージェントシステムが提案されている。このようなシステムに関し、例えば下記特許文献１では、利用者との間で会話した内容に基づいて利用者が抱く感情を把握し、その把握した感情を表現した言語に含まれる特定のキーワードを抽出して、その抽出したキーワードに基づいて検索を行うことで、より利用者の要求に合致した情報を検索するシステムが開示されている。

　また、下記特許文献２では、エージェントからのお薦めに対するユーザの音声応答を音声認識して認識文字列を特定し、認識文字列の内容に基づいて概略的な感情の種類を判定し、そのお薦めに対するユーザの感情を学習する装置が開示されている。

特開２００３－１７３３４９号公報特開２００１－１１７５８１号公報

　ここで、エージェントによる自動応答の音声は、ユーザとの問答を想定して予め生成された会話データに基づくものであって、会話を通してユーザがどのような感情になるかは考慮されていなかった。

　そこで、本開示では、ユーザ同士の実際の会話から生成した会話構造を用いてユーザを所定の感情に導くことが可能な通信システムおよび通信制御方法を提案する。

　本開示によれば、ユーザの会話を受信する通信部と、前記通信部を介して収集されたユーザの会話に基づき生成された会話の構造を記述する会話フレームを蓄積する蓄積部と、前記収集される会話単位でその会話を発信するユーザの感情に関わる感情パラメータを求め、前記感情パラメータに基づき、前記会話から前記会話フレームを抽出して前記蓄積部に蓄積する制御部と、を備える、通信システムを提案する。

　本開示によれば、プロセッサが、ユーザの会話を通信部により受信することと、前記通信部を介して収集されたユーザの会話に基づき生成された会話の構造を記述する会話フレームを蓄積部に蓄積することと、前記収集される会話単位でその会話を発信するユーザの感情に関わる感情パラメータを求め、前記感情パラメータに基づき、前記会話から前記会話フレームを抽出して前記蓄積部に蓄積することと、を含む、通信制御方法を提案する。

　以上説明したように本開示によれば、ユーザ同士の実際の会話から生成した会話構造を用いてユーザを所定の感情に導くことが可能となる。

　なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。

本開示の一実施形態による通信制御システムの概要について説明する図である。本実施形態による通信制御システムの全体構成を示す図である。本実施形態による音声エージェントサーバの構成の一例を示すブロック図である。本実施形態による対話処理部の構成例を示す図である。本実施形態による会話ＤＢの生成処理を示すフローチャートである。本実施形態による音素ＤＢの生成処理を示すフローチャートである。本実施形態による対話制御処理を示すフローチャートである。本実施形態による会話ＤＢのデータ構成例について説明する図である。本実施形態による会話ＤＢの更新処理を示すフローチャートである本実施形態による個人化レイヤーから共通レイヤーへの会話データ移行処理を示すフローチャートである。本実施形態による基本対話用会話ＤＢへの会話データの移行について説明する図である。本実施形態による基本対話用ＤＢへの会話データ移行処理を示すフローチャートである。本実施形態による広告ＤＢに登録されている広告情報の一例を示す図である。本実施形態による広告内容の挿入処理を示すフローチャートである。第１の実施形態による会話ＤＢ生成部の構成例を示す図である。第１の実施形態による会話フレーム生成処理を示すフローチャートである。第１の実施形態によるハピネス度算出処理を示すフローチャートである。第１の実施形態による特徴的なキーワードにおける４つの因子の評価値の一例を示す図である。第１の実施形態による会話履歴ＤＢに蓄積される会話データの一例を示す図である。第１の実施形態による会話フレーム生成処理を示すフローチャートである。第１の実施形態による形容詞の感情値テーブルの一例を示す図である。第１の実施形態による会話フレームの一例を示す図である。第１の実施形態による対話処理部の構成例を示す図である。第１の実施形態による応答処理を示すフローチャートである。第１の実施形態による応答文生成処理を示すフローチャートである。第１の実施形態による応答文データの出力処理を示すフローチャートである。気質パラメータによる３次元空間について説明する図である。第２の実施形態による会話ＤＢ生成部の構成例を示す図である。第２の実施形態による会話フレーム生成処理を示すフローチャートである。第２の実施形態による性格解析処理を示すフローチャートである。第２の実施形態による特徴的なキーワードにおける３つの性格パラメータ寄与値の一例を示す図である。第２の実施形態による会話履歴に蓄積される会話データの一例を示す。第２の実施形態による性格ＤＢに蓄積される発話者の性格データの一例を示す。第２の実施形態による性格パラメータ寄与値と性格タイプの３次元空間の一例を示す図である。第２の実施形態による会話フレームに登録される会話フレームの一例を示す図である。第２の実施形態による対話処理部の構成例を示す図である。第２の実施形態による応答文生成処理を示すフローチャートである。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　また、説明は以下の順序で行うものとする。
　１．本開示の一実施形態による通信制御システムの概要
　２．構成
　　２－１．システム構成
　　２－２．サーバの構成
　３．システム動作処理
　　３－１．会話データ登録処理
　　３－２．音素ＤＢ生成処理
　　３－３．対話制御処理
　　３－４．会話ＤＢ更新処理
　　３－５．広告挿入処理
　４．第１の実施形態による対話制御処理
　　４－１．会話フレームの生成
　　　（４－１－１．会話ＤＢ生成部５０Ａの構成）
　　　（４－１－２．会話フレームの生成処理）
　　　（４－１－３．ハピネス度算出処理）
　　　（４－１－４．会話フレーム生成処理）
　　４－２．応答文の生成
　　　（４－２－１．対話処理部３００Ａの構成）
　　　（４－２－２．応答処理）
　　　（４－２－３．応答文生成処理）
　　　（４－２－４．応答文出力処理）
　５．第２の実施形態による対話制御処理
　　５－１．会話フレームの生成
　　　（５－１－１．会話ＤＢ生成部５０Ｂの構成）
　　　（５－１－２．会話フレームの生成処理）
　　　（５－１－３．性格解析処理）
　　５－２．応答文の生成
　　　（５－２－１．対話処理部３００Ｂの構成）
　　　（５－２－２．応答文生成処理）
　６．まとめ

　＜＜１．本開示の一実施形態による通信制御システムの概要＞＞
　本開示の一実施形態による通信制御システムは、ユーザ同士の実際の会話から生成した会話構造を用いてユーザを所定の感情に導くことを可能とする。以下、図１を参照して本実施形態による通信制御システムの概要について説明する。

　図１は、本開示の一実施形態による通信制御システムの概要について説明する図である。エージェントとの音声対話は、例えばユーザが所有するスマートフォン、携帯電話端末、またはウェアラブル端末等のクライアント端末１を介して行われ得る。クライアント端末１は、マイクロホンおよびスピーカを有し、ユーザの音声を集音し、また、エージェントの音声を再生することで、ユーザとエージェントとの対話を可能とする。

　ここで、エージェント側は、例えば予め想定されたユーザとの問答データを蓄積したデータベースを備え、ユーザの発話音声に応じた応答音声（予め登録されている応答データ）を出力することで、自動応答を実現することができる。

　しかしながら、このような自動応答の方法では、会話を通じてユーザがどのような感情になるかは考慮されていなかった。

　そこで、本実施形態による通信制御システム（すなわちエージェントシステム）は、ユーザ同士の実際の会話から生成した会話構造を用いてユーザを所定の感情に導くことを可能とする。具体的には、まず、通信制御システムは、図１に示すように、ネットワークを介してやり取りされたユーザ同士による実際の会話データを多数収集した会話群１００を解析する。このような会話データの収集は、例えばソーシャルメディアでのメッセージのやり取りや音声による会話から収集される。次いで、通信制御システムは、ユーザが所定の感情、例えば「幸福な感情」（本明細書では、「ハピネス」と称す）を抱いた一連の会話１０１（「昨日ね、美味しいシチューを作れたよ。」「美味しいシチューを作れるんだ！すごいね！」）に基づいて、ユーザが「幸福な感情」になる会話フレーム（ハピネス会話フレーム１１０）を生成する。本明細書において、「会話フレーム」とは、会話の構造を記述したものである。

　そして、通信制御システムは、ユーザからの発話、例えば「美味しいグラタンを作れた！」（言語解析結果：『〈形容詞〉〈名詞〉を作れた』）に対して、対応するハピネス会話フレーム１１０、例えば「〈形容詞〉〈名詞〉を作れるんだ！すごいね！」を当てはめて、「美味しいグラタンを作れるんだ！すごいね！」といった応答音声１２０を生成し、エージェントの発言として再生する。

　このように、本実施形態による通信制御システムでは、ユーザとエージェントとの会話において、ユーザが幸福な感情になる応答をエージェントの発言として出力させることができる。

　なお、本実施形態による通信制御システム（エージェントシステム）は、音声により応答を行う音声エージェントに限定されず、クライアント端末１においてテキストベースで応答を行うテキスト対応エージェントであってもよい。

　＜＜２．構成＞＞
　　＜２－１．システム構成＞
　続いて、上述した本実施形態による通信制御システムの全体構成について図２を参照して説明する。図２は、本実施形態による通信制御システムの全体構成を示す図である。

　図２に示すように、本実施形態による通信制御システムは、クライアント端末１およびエージェントサーバ２を含む。

　エージェントサーバ２は、ネットワーク３を介してクライアント端末１と接続し、データの送受信を行う。具体的には、エージェントサーバ２は、クライアント端末１で収音され、送信された発話音声に対する応答音声を生成し、クライアント端末１に送信する。エージェントサーバ２は、１以上のエージェントに対応する音素ＤＢ（データベース）を有し、特定のエージェントの音声で応答音声を生成することが可能である。ここで、エージェントとは、漫画、アニメ、ゲーム、ドラマ、映画等のキャラクターや、芸能人、著名人、歴史上の人物等であってもよいし、また、個人に特定せず、例えば世代別の平均的な人物であってもよい。また、エージェントは、動物や擬人化されたキャラクターであってもよい。また、エージェントは、ユーザ本人の性格を反映した人物や、ユーザの友人、家族、知人等の性格を反映した人物であってもよい。

　また、エージェントサーバ２は、各エージェントの性格を反映した応答内容を生成することが可能である。エージェントサーバ２は、エージェントを介して、ユーザのスケジュール管理、メッセージの送受信、情報提供等、様々なサービスをユーザとの対話を通じて提供し得る。

　なおクライアント端末１は、図２に示すようなスマートフォンに限定されず、例えば携帯電話端末、タブレット端末、ＰＣ（パーソナルコンピュータ）、ゲーム機、ウェアラブル端末（スマートアイグラス、スマートバンド、スマートウォッチ、スマートネック等）等であってもよい。また、クライアント端末１は、ロボットであってもよい。

　以上、本実施形態による通信制御システムの概要について説明した。続いて、本実施形態による通信制御システムのエージェントサーバ２の構成について図３を参照して具体的に説明する。

　　＜２－２．エージェントサーバ２＞
　図３は、本実施形態によるエージェントサーバ２の構成の一例を示すブロック図である。図３に示すように、エージェントサーバ２は、音声エージェントＩ／Ｆ（インタフェース）２０、対話処理部３０、音素記憶部４０、会話ＤＢ生成部５０、音素ＤＢ生成部６０、広告挿入処理部７０、広告ＤＢ７２、およびフィードバック取得処理部８０を有する。

　音声エージェントＩ／Ｆ２０は、音声データの入出力部、音声認識部、および音声生成部として機能する。入出力部としては、ネットワーク３を介してクライアント端末１と送受信を行う通信部が想定される。音声エージェントＩ／Ｆ２０は、クライアント端末１からユーザの発話音声を受信し、音声認識によりテキスト化することが可能である。また、音声エージェントＩ／Ｆ２０は、対話処理部３０から出力されたエージェントの回答文データ（テキスト）を、当該エージェントに対応する音素データを用いて音声化し、生成したエージェントの応答音声をクライアント端末１に送信する。

　対話処理部３０は、演算処理装置および制御装置として機能し、各種プログラムに従ってエージェントサーバ２内の動作全般を制御する。対話処理部３０は、例えばＣＰＵ（Central　Processing　Unit）、マイクロプロセッサ等の電子回路によって実現される。また、本実施形態による対話処理部３０は、基本対話処理部３１、キャラクターＡ対話処理部３２、人物Ｂ対話処理部３３、人物Ｃ対話処理部３４として機能する。

　キャラクターＡ対話処理部３２、人物Ｂ対話処理部３３、人物Ｃ対話処理部３４は、エージェント毎に特化された対話を実現する。ここでは、エージェントの一例として「キャラクターＡ」「人物Ｂ」「人物Ｃ」を挙げているが、本実施形態は当然これに限定されず、さらに多数のエージェントに特化した対話を実現する各対話処理部を有していてもよい。基本対話処理部３１は、エージェント毎に特化されていない、汎用の対話を実現する。

　ここで、基本対話処理部３１、キャラクターＡ対話処理部３２、人物Ｂ対話処理部３３、および人物Ｃ対話処理部３４に共通する基本構成について図４を参照して説明する。

　図４は、本実施形態による対話処理部３００の構成例を示す図である。図４に示すように、対話処理部３００は、質問文検索部３１０、回答文生成部３２０、音素データ取得部３４０、および会話ＤＢ３３０を有する。会話ＤＢ３３０は、質問文データと回答文データが組になった会話データが保存されている。エージェントに特化した対話処理部では、かかる会話ＤＢ３３０にエージェントに特化した会話データが保存され、汎用の対話処理部では、かかる会話ＤＢ３３０にエージェントに特化しない汎用の会話データ（すなわち、基本会話データ）が保存されている。

　質問文検索部３１０は、音声エージェントＩ／Ｆ２０から出力された、ユーザの質問音声（発話音声の一例）を認識してテキスト化した質問文と一致する質問文データを会話ＤＢ３３０から検索する。回答文生成部３２０は、質問文検索部３１０により検索した質問文データに対応付けて保存されている回答文データを会話ＤＢ３３０から抽出し、回答文データを生成する。音素データ取得部３４０は、回答文生成部３２０により生成された回答文を音声化するための音素データを、対応するエージェントの音素記憶部４０から取得する。例えば、キャラクターＡ対話処理部３２の場合、キャラクターＡ音素ＤＢ４２から、回答文データをキャラクターＡの音声で再生するための音素データを取得する。そして、対話処理部３００は、生成した回答文データおよび取得した音素データを音声エージェントＩ／Ｆ２０に出力する。

　音素記憶部４０は、エージェント毎の音声を生成するための音素データベースを格納する。音素記憶部４０は、ＲＯＭ（Read　Only　Memory）およびＲＡＭ（Random　Access　Memory）により実現され得る。図３に示す例では、基本音素ＤＢ４１、キャラクターＡ音素ＤＢ４２、人物Ｂ音素ＤＢ４３、人物Ｃ音素ＤＢ４４を格納する。各音素ＤＢには、音素データとして、例えば音素片とその制御情報である韻律モデルが記憶されている。

　会話ＤＢ生成部５０は、対話処理部３００の会話ＤＢ３３０を生成する機能を有する。例えば会話ＤＢ生成部５０は、想定される質問文データを収集し、各質問に対応する回答文データを収集した後に、質問文データと回答文データとを組にして保存する。そして、会話ＤＢ生成部５０は、所定数の会話データ（質問文データと回答文データとの組、例えば１００組）が集まったら、エージェントの会話データセットとして会話ＤＢ３３０に登録する。

　音素ＤＢ生成部６０は、音素記憶部４０に格納されている音素ＤＢを生成する機能を有する。例えば音素ＤＢ生成部６０は、所定のテキストを読み上げた音声情報を解析して、音素片とその制御情報である韻律モデルに分解し、所定数以上の音声情報が収集できたら音素データとして音素ＤＢに登録する処理を行う。

　広告挿入処理部７０は、エージェントの対話に広告情報を挿入する機能を有する。挿入する広告情報は、広告ＤＢ７２から抽出し得る。広告ＤＢ７２には、企業等の提供側（ベンダー、サプライヤー）から依頼された広告情報（例えばテキスト、画像、音声等の広告内容、広告主、広告期間、広告対象者等の情報）が登録されている。

　フィードバック取得処理部８０は、エージェントの対話に、フィードバックを取得するための質問を挿入し、ユーザからフィードバックを得るための機能を有する。

　以上、本実施形態によるエージェントサーバ２の構成について具体的に説明した。なお、本実施形態によるエージェントサーバ２の構成は、図３に示す例に限定されない。例えば、エージェントサーバ２が有する各構成は、各々ネットワーク上の他サーバで構成されていてもよい。

　続いて、本実施形態による通信制御システムの基本的な動作処理について図５～図１４を参照して説明する。

　＜＜３．システム動作処理＞＞
　＜３－１．会話データ登録処理＞
　図５は、本実施形態による会話ＤＢ３３０の生成処理を示すフローチャートである。図５に示すように、まず、会話ＤＢ生成部５０は、想定される質問文を保存する（ステップＳ１０３）。

　次に、会話ＤＢ生成部５０は、質問文に対応する（対の）回答文を保存する（ステップＳ１０６）。

　次いで、会話ＤＢ生成部５０は、質問文と回答文のペア（会話データとも称す）が所定数集まったか否かを判断する（ステップＳ１０９）。

　そして、質問文と会話文のペアが所定数集まった場合（ステップＳ１０９／Ｙｅｓ）、会話ＤＢ生成部５０は、質問文および回答文の多数のペアから成るデータセットを会話ＤＢ３３０に登録する（ステップＳ１１２）。質問文および回答文のペアの一例としては、例えば下記のようなものが想定される。

　質問文および回答文のペア例
　ペア１
　　質問文：おはよう。
　　回答文：今日の調子はどうですか？
　ペア２
　　質問文：今日の天気は？
　　回答文：今日の天気は○○です。

　このようなペアが、会話データとして会話ＤＢ３３０に登録され得る。

　＜３－２．音素ＤＢ生成処理＞
　図６は、本実施形態による音素ＤＢの生成処理を示すフローチャートである。図６に示すように、まず、音素ＤＢ生成部６０は、例文の表示を行う（ステップＳ１１３）。例文の表示は、例えば図示しない情報処理端末のディスプレイに、音素データ生成のために必要な例文を表示する。

　次に、音素ＤＢ生成部６０は、例文を読み上げた音声を録音し（ステップＳ１１６）、録音音声を分析する（ステップＳ１１９）。例えば、エージェントの音声を担当する人物により読み上げられた音声情報が情報処理端末のマイクロホンにより収集され、音素ＤＢ生成部６０がこれを受信し、記憶し、さらに音声分析を行う。

　次いで、音素ＤＢ生成部６０は、音声情報に基づいて、韻律モデルを生成する（ステップＳ１２２）。韻律モデルとは、音声の韻律的特徴（例えば音の高低、音の強弱、発話速度等）を示す韻律パラメータを抽出するものであって、個人毎に異なる。

　次に、音素ＤＢ生成部６０は、音声情報に基づいて、音素片（音素データ）を生成する（ステップＳ１２５）。

　次いで、音素ＤＢ生成部６０は、韻律モデルおよび音素片を保存する（ステップＳ１２８）。

　続いて、音素ＤＢ生成部６０は、韻律モデルおよび音素片が所定数集まったか否かを判断する（ステップＳ１３１）。

　そして、韻律モデルおよび音素片が所定数集まった場合（ステップＳ１３１／Ｙｅｓ）、音素ＤＢ生成部６０は、韻律モデルおよび音素片を、所定のエージェント用の音素データベースとして音素記憶部４０に登録する（ステップＳ１３４）。

　＜３－３．対話制御処理＞
　図７は、本実施形態による対話制御処理を示すフローチャートである。図７に示すように、まず、音声エージェントＩ／Ｆ２０は、ユーザの質問音声およびエージェントＩＤを取得したか否かを確認する（ステップＳ１４３）。エージェントＩＤは、キャラクターＡ、人物Ｂ、人物Ｃといった特定のエージェントを示す識別情報である。ユーザは、エージェント毎の音素データを購入することができ、例えば購入処理時に購入したエージェントのＩＤがクライアント端末１に保存される。

　次に、ユーザの質問音声およびエージェントＩＤを取得すると（ステップＳ１４６／Ｙｅｓ）、音声エージェントＩ／Ｆ２０は、質問音声を音声認識し、テキスト化する（ステップＳ１４９）。音声エージェントＩ／Ｆ２０は、テキスト化した質問文を、エージェントＩＤで指定された特定エージェントの対話処理部に出力する。例えば「エージェントＩＤ：キャラクターＡ」の場合、音声エージェントＩ／Ｆ２０は、テキスト化した質問文をキャラクターＡ対話処理部３２に出力する。

　次いで、対話処理部３０は、エージェントＩＤで指定された特定エージェントの会話ＤＢから、テキスト化した質問文と一致する質問文を検索する（ステップＳ１５２）。

　次に、一致する質問があった場合（ステップＳ１５５／Ｙｅｓ）、キャラクターＡ対話処理部３２は、質問に対応する（対になって保存されている）回答文データを特定エージェントの会話ＤＢから取得する（ステップＳ１５８）。

　一方、一致する質問がなかった場合（ステップＳ１５５／Ｎｏ）、基本対話処理部３１の会話ＤＢから、テキスト化した質問文と一致する質問文が検索される（ステップＳ１６１）。

　一致する質問文があった場合（ステップＳ１６１／Ｙｅｓ）、基本対話処理部３１は、質問に対応する（対になって保存されている）回答文データを基本対話処理部３１の会話ＤＢから取得する（ステップＳ１６７）。

　一方、一致する質問文がなかった場合（ステップＳ１６４／Ｎｏ）、基本対話処理部３１は、一致する質問文が無い場合の回答文データ（例えば、「質問が解りません」といった回答文）を取得する（ステップＳ１７０）。

　次いで、キャラクターＡ対話処理部３２により、エージェントＩＤで指定された特定エージェントの音素ＤＢ（ここでは、キャラクターＡ音素ＤＢ４２）を参照し、回答文データの音声を生成するためのキャラクターＡの音素データが取得される（ステップＳ１７３）。

　次に、取得された音素データと回答文データが音声エージェントＩ／Ｆ２０に出力される（ステップＳ１７６）。

　そして、音声エージェントＩ／Ｆ２０は、回答文データ（テキスト）を音素データを用いて音声化（音声合成）し、クライアント端末１に送信する（ステップＳ１７９）。クライアント端末１では、キャラクターＡの音声で回答文が再生される。

　＜３－４．会話ＤＢ更新処理＞
　次に、各対話処理部３００の会話ＤＢ３３０の更新処理について説明する。本実施形態では、ユーザとの会話によって会話ＤＢ３３０を成長させることが可能である。

　まず、会話ＤＢ３３０のデータ構成例について図８を参照して補足説明を行う。図８は、本実施形態による会話ＤＢ３３０のデータ構成例について説明する図である。図８に示すように、各会話ＤＢ３３０は、個人化レイヤー３３１と共通レイヤー３３２という２つのレイヤーを有する。例えばキャラクターＡ用会話ＤＢ３３０Ａの場合、共通レイヤー３３２Ａには、キャラクターＡの性格や特徴が反映された会話データが保持される。一方、個人化レイヤー３３１Ａには、ユーザとの会話により当該ユーザ向けにカスタマイズされた会話データが保持される。すなわち、キャラクターＡ音素ＤＢ４２およびキャラクターＡ対話処理部３２がセットでユーザに提供（販売）されるところ、あるユーザＸと、ユーザＹは、最初は同じキャラクターＡと対話を行う（共通レイヤー３３２Ａに保持されている会話データが使用される）が、対話を続けるにつれて、各ユーザ向けにカスタマイズされた会話データが、ユーザ毎の個人化レイヤー３３１Ａに蓄積される。これにより、ユーザＸ、ユーザＹそれぞれの好みに応じたキャラクターＡとの対話を提供できるようになる。

　またエージェント「人物Ｂ」が、キャラクターＡのような特定の性格を有さない平均的な世代別の人物の場合も、会話データがユーザ向けにカスタマイズされ得る。すなわち、例えば「人物Ｂ」が『２０代の人物』の場合、共通レイヤー３３２Ｂには２０代の平均的な会話データが保持され、ユーザとの対話を続けることでカスタマイズされた会話データがユーザ毎の個人化レイヤー３３１Ｂに保持される。また、ユーザは、人物Ｂの音声として「男性」、「女性」、「高い声」、「低い声」といった好きな音素データを人物Ｂ音素ＤＢ４３から選択し、購入することも可能である。

　このような会話ＤＢ３３０のカスタマイズを行う際の具体的な処理について、図９を参照して説明する。図９は、本実施形態による会話ＤＢ３３０の更新処理を示すフローチャートである。

　図９に示すように、まず、音声エージェントＩ／Ｆ２０は、クライアント端末１からユーザの質問音声を取得（受信）し、これを音声認識によりテキスト化する（ステップＳ１８３）。テキスト化されたデータ（質問文データ）は、エージェントＩＤにより指定されている特定エージェントの対話処理部（ここでは、例えばキャラクターＡ対話処理部３２）に出力される。

　次に、キャラクターＡ対話処理部３２は、質問文データが所定のコマンドであるか否かを判断する（ステップＳ１８６）。

　次いで、所定のコマンドである場合（ステップＳ１８６／Ｙｅｓ）、キャラクターＡ対話処理部３２は、ユーザ指定の回答文データを、会話ＤＢ３３０Ａの個人化レイヤー３３１Ａに質問文データと対で登録する（ステップＳ１８９）。所定のコマンドとは、例えば「ＮＧ」、「設定」といった言葉であってもよい。例えば以下のような会話の流れにより、キャラクターＡの会話ＤＢをカスタマイズすることができる。

　ユーザ：「おはよう」
　キャラクターＡ：「おはよう」
　ユーザ：「ＮＧ。元気で頑張ってと答えて」
　キャラクターＡ：「元気で頑張って」

　上記の会話の流れでは、『ＮＧ』が所定のコマンドであって、キャラクターＡ対話処理部３２は、ユーザから『ＮＧ』と発せられた後、ユーザ指定の回答文データ『元気で頑張って』を、質問文データ『おはよう』と対にして会話ＤＢ３３０Ａの個人化レイヤー３３１Ａに登録する。

　一方、所定のコマンドでない場合（ステップＳ１８６／Ｎｏ）、キャラクターＡ対話処理部３２は、質問文データと対になって保持されている回答文データをキャラクターＡ用会話ＤＢ３３０Ａから検索する。質問文データと対になって保持されている回答文データがキャラクターＡ用会話ＤＢ３３０Ａに保持されていない場合、すなわち、ユーザの質問が回答文の無い質問であった場合（ステップＳ１９２／Ｙｅｓ）、キャラクターＡ対話処理部３２は、ユーザ指定の回答文データを、質問文と対にして個人化レイヤー３３１Ａに登録する（ステップＳ１９５）。例えば以下のような会話の流れにより、キャラクターＡの会話ＤＢをカスタマイズすることができる。

　ユーザ：「元気？」
　キャラクターＡ：「質問がわかりません」（該当する回答が無い場合の回答データ例）
　ユーザ：「『元気？』と聞いたら、『今日も元気だよ』と答えて」
　キャラクターＡ：「今日も元気だよ」

　上記会話の流れでは、『元気？』と対になって保持される回答文データが無いため、該当する回答が無い場合の回答データ例である『質問がわかりません』がキャラクターＡ対話処理部３２により取得され、対応するキャラクターＡの音素データと共に音声エージェントＩ／Ｆ２０に出力され、クライアント端末１で再生される。次いで、ユーザ指定の回答文『今日も元気だよ』が入力されると、キャラクターＡ対話処理部３２は、質問文データ『元気？』と対にして個人化レイヤー３３１Ａに登録する。

　なお、回答文の有る質問であった場合（ステップＳ１９２／Ｎｏ）、キャラクターＡ対話処理部３２は、当該回答文データを取得し、対応するキャラクターＡの音素データと共に音声エージェントＩ／Ｆ２０に出力し、クライアント端末１で回答文がキャラクターＡの音声で再生される（ステップＳ１９８）。

　次いで、個人化レイヤーから共通レイヤーへの会話データ移行について、図１０を参照して説明する。図１０は、本実施形態による個人化レイヤーから共通レイヤーへの会話データ移行処理を示すフローチャートである。ここでは、一例としてキャラクターＡ対話処理部３２の個人化レイヤー３３１Ａから共通レイヤー３３２Ａへの会話データ移行処理について説明する。

　図１０に示すように、まず、キャラクターＡ対話処理部３２は、ユーザ毎の個人化レイヤー３３１Ａを定期的にサーチし（ステップＳ２０３）、実質的に同じ内容の会話ペア（質問文データと回答文データのペア）を抽出する（ステップＳ２０６）。実質的に同じ内容の会話ペアとは、例えば質問文「元気？」と回答文「今日も元気だよ！」のペアと、質問文「元気ですか？」と回答文「今日も元気だよ！」のペアは、質問文が丁寧語か否かの違いのみであって、実質的に同じ内容の会話ペアと判断され得る。

　次に、キャラクターＡ対話処理部３２は、ユーザ毎の個人化レイヤー３３１Ａから会話ペアが所定数以上抽出された場合（ステップＳ２０９／Ｙｅｓ）、当該会話ペアを（ユーザ毎の）共通レイヤー３３２Ａに登録する（ステップＳ２１２）。

　このように、ユーザ毎の個人化レイヤー３３１において実質的に内容が同じ会話ペアを共通レイヤー３３２に移行することで、共通レイヤー３３２を成長（会話ペアを拡充）させることが可能となる。

　また、本実施形態では、特定エージェントの会話ＤＢ（具体的には共通レイヤー）から基本対話用の会話ＤＢへ会話データを移行して基本対話用の会話ＤＢを成長させることも可能である。図１１は、本実施形態による基本対話用会話ＤＢ３３０Ｆへの会話データの移行について説明する図である。例えば、ユーザＸおよびユーザＹが各々エージェント「キャラクターＡ」を選択（購入）し、ユーザＺがエージェント「人物Ｂ」を選択（購入）している場合、図１１に示すように、ユーザＸのキャラクターＡ用会話ＤＢ３３０Ａ－Ｘ、ユーザＹのキャラクターＡ用会話ＤＢ３３０Ａ－Ｙ、およびユーザＺの人物Ｂ用会話ＤＢ３３０Ｂ－Ｚが対話処理部３０に存在し得る。この場合、各個人化レイヤー３３１Ａ－Ｘ、３３１Ａ－Ｙ、３３１Ｂ－Ｚには、各ユーザＸ、ユーザＹ、ユーザＺとの対話に応じて独自の（カスタマイズされた）会話ペアが登録されていく（図９参照）。次いで、同じエージェントの個人化レイヤー３３１Ａ－Ｘ、３３１Ａ－Ｙにおいて実質同じ会話ペアが所定数あると、ユーザ毎の共通レイヤー３３２Ａ－Ｘ、３３２Ａ－Ｙに各々登録される（図１０参照）。

　そして、対話処理部３０は、複数のエージェント（異なるエージェントを含んでもよい）の共通レイヤー３３２Ａ－Ｘ、３３２Ａ－Ｙ、３３２Ｂ－Ｚから実質同じ会話ペアが所定数以上抽出された場合、上位の基本対話用会話ＤＢ３３０Ｆに会話ペアを移行する。基本対話用会話ＤＢ３３０Ｆは、基本対話処理部３１が有する会話ＤＢである。これにより、基本対話用会話ＤＢ３３０Ｆを成長（会話ペアを拡充）させることが可能となる。かかるデータ移行処理について、図１２を参照して具体的に説明する。図１２は、本実施形態による基本対話用ＤＢ３３０Ｆへの会話データ移行処理を示すフローチャートである。

　図１２に示すように、まず、対話処理部３０は、定期的に会話ＤＢ３３０の複数の共通レイヤー３３２をサーチし（ステップＳ２２３）、実質同じ会話ペアを抽出する（ステップＳ２２６）。

　次に、対話処理部３０は、複数の共通レイヤー３３２から実質同じ会話ペアが所定数以上抽出された場合（ステップＳ２２９／Ｙｅｓ）、当該会話ペアを基本対話用会話ＤＢ３３０Ｆに登録する（ステップＳ２３２）。

　このように、複数のエージェントにおける会話ＤＢ３３０の共通レイヤー３３２において実質的に内容が同じ会話ペアを、基本対話用会話ＤＢ３３０Ｆに移行することで、基本対話用会話ＤＢ３３０Ｆを成長（会話ペアを拡充）させることが可能となる。

　＜３－５．広告出力処理＞
　続いて、広告挿入処理部７０による広告情報の挿入処理について図１３～図１４を参照して説明する。本実施形態では、広告挿入処理部７０により、エージェントの発言に広告ＤＢ７２に格納されている広告情報の挿入を行うことが可能である。広告ＤＢ７２には、予め広告情報が登録され得る。図１３は、本実施形態による広告ＤＢ７２に登録されている広告情報の一例を示す図である。

　図１３に示すように、広告情報６２１は、例えばエージェントＩＤ、質問文、広告内容、条件、および確率を含む。エージェントＩＤは広告内容を発言するエージェントを指定し、質問文は広告内容を挿入するトリガとなるユーザの質問文を指定し、広告内容はエージェントの対話に挿入する広告文章である。また、条件は、広告内容を挿入する条件であって、確率は広告内容を挿入する確率を示す。例えば図１３の１段目に示す例では、エージェント「キャラクターＡ」との対話において、３０歳以下のユーザからの質問文に「チョコレート」という単語が含まれている場合に、「ＢＢ社の新しく発売されたチョコはミルクがたくさん入っていて美味しいよ」といった広告内容が回答文に挿入される。また、トリガとなる質問文が発せられた際に毎回広告内容を挿入するとユーザが煩わしく思ってしまうこともあるため、本実施形態では、広告を挿入する確率を設定するようにしてもよい。かかる確率は広告料に応じて決定されてもよい。例えば広告料が高いほど確率が高く設定される。

　このような広告内容の挿入処理について図１４を参照して具体的に説明する。図１４は、本実施形態による広告内容の挿入処理を示すフローチャートである。

　図１４に示すように、まず、広告挿入処理部７０は、ユーザとエージェントとの対話（具体的には、対話処理部３０による対話処理）を監視する（ステップＳ２４３）。

　次に、広告挿入処理部７０は、ユーザとエージェントとの対話に、広告ＤＢ７２に登録されている質問文と同一の内容の質問文が登場したか否かを判断する（ステップＳ２４６）。

　次いで、同一の内容の質問文が登場した場合（ステップＳ２４６／Ｙｅｓ）、広告挿入処理部７０は、該当する質問文と対応付けられている広告挿入の条件および確率を確認する（ステップＳ２４９）。

　続いて、広告挿入処理部７０は、条件および確率に基づいて、現在、広告が出せる状態であるか否かを判断する（ステップＳ２５２）。

　次に、広告が出せる状態である場合（ステップＳ２５２／Ｙｅｓ）、広告挿入処理部７０は、対話処理部３０による対話処理を一時停止させ（ステップＳ２５５）、広告内容を対話に挿入する（ステップＳ２５８）。具体的には、例えばユーザの質問文に対するエージェントの回答文に、広告内容を挿入させる。

　そして、広告内容を含む対話（会話文データ）が対話処理部３０から音声エージェントＩ／Ｆ２０に出力され、音声エージェントＩ／Ｆ２０からクライアント端末１に送信され、エージェントの音声で再生される（ステップＳ２６１）。具体的には、例えば以下のような会話により、キャラクターＡの発言としてユーザに広告内容を提示することができる。

　ユーザ：「おはよう」
　キャラクターＡ：「おはよう！今日の調子はどうですか？」
　ユーザ：「元気だよ。何か美味しい物食べたいな」
　キャラクターＡ：「ＣＣ店の焼肉が美味しいらしいよ」

　上記会話では、まず、ユーザの質問文「おはよう」に対して、キャラクターＡの会話ＤＢから検索された対応する回答文「おはよう！今日の調子はどうですか？」が音声出力される。次いで、ユーザの質問文「元気だよ。何か美味しい物食べたいな」に、広告挿入のトリガとなる質問文「何か美味しい物食べたいな」が含まれているため（図１３の２段目参照）、広告挿入処理部７０は広告挿入処理を行い、キャラクターＡの音声で広告内容「ＣＣ店の焼肉が美味しいらしいよ」といった回答文が出力される。

　以上、本実施形態による通信制御システムの基本的な動作処理として、会話データ登録処理、音素ＤＢ生成処理、対話制御処理、会話ＤＢ更新処理、および広告挿入処理について説明した。

　なお、本実施形態による対話制御処理は、上述した例に限定されない。本実施形態による対話処理部３０は、ユーザを所定の感情に導く会話フレームを用いてエージェントの応答を生成することが可能である。以下、図１５～図３７を参照して具体的に説明する。

　＜＜４．第１の実施形態による対話制御処理＞＞
　＜４－１．会話フレームの生成＞
　まず、会話フレームの生成について説明する。会話フレームの生成は、会話ＤＢ生成部５０により行われ得る。上述したように、本実施形態による会話ＤＢ生成部５０は、予め想定された質問文データと回答文データとを組にした会話文データを保存し、会話文データが一定量（例えば１００組）集まると、会話文のデータセットとして対話処理部３０に出力し、会話文のデータセットが所定の会話ＤＢ３３０（図４参照）に格納される。本実施形態による会話ＤＢ生成部５０の生成処理はこれに限定されず、会話フレームの生成を行うことも可能である。以下、図１５を参照して、会話フレームの生成を行う会話ＤＢ生成部５０Ａの主要構成について説明する。

　（４－１－１．会話ＤＢ生成部５０Ａの構成）
　図１５は、第１の実施形態による会話ＤＢ生成部５０Ａの構成例を示す図である。図１５に示すように、会話ＤＢ生成部５０Ａは、制御部５００、通信部５１０、会話履歴ＤＢ５１１、および会話フレームＤＢ５１２を有する。

　通信部５１０は、外部装置と有線または無線により接続し、データの送受信を行う機能を有する。例えば通信部５１０は、インターネットに接続し、ネットワーク上の各種ソーシャルメディアサーバやメールサーバからユーザ間のメッセージのやり取りや音声による会話を収集する。

　会話履歴ＤＢ５１１は、通信部５１０により収集されたユーザ間の会話を格納する。なお音声会話の場合、音声会話を音声解析によりテキスト化したデータも併せて蓄積するようにしてもよい。音声会話の音声解析は、例えば制御部５００により行われる。また、会話履歴ＤＢ５１１には、音声エージェントＩ／Ｆ２０を介して行われたユーザとエージェントとの音声会話やユーザ間の音声会話をテキスト化した会話データも蓄積されてもよい。会話履歴ＤＢ５１１では、会話データの内容と、会話日時、会話者ＩＤ、後述するハピネス度等のパラメータが紐付けて格納される。

　制御部５００は、演算処理装置および制御装置として機能し、各種プログラムに従って会話ＤＢ生成部５０Ａ内の動作全般を制御する。制御部５００は、例えばＣＰＵ、マイクロプロセッサ等の電子回路によって実現される。また、本実施形態による制御部５００は、ハピネス算出部５０１、および会話フレーム生成部５０２として機能する。

　ハピネス算出部５０１は、会話履歴ＤＢ５１１に蓄積された会話データに基づいて、会話毎の発話者の幸福度合いを算出し、算出した値をハピネス度として会話データに紐付けて会話履歴ＤＢ５１１に保存する。ハピネス度の算出は、例えば会話に含まれる特徴的なキーワードに基づいて算出され得る。ハピネス度の詳細な算出方法については、後述する。

　会話フレーム生成部５０２は、ユーザを所定の感情（ここでは、一例として「幸福な感情」）に導くための会話の構造を記述した会話フレームを生成する。例えば会話フレーム生成部５０２は、会話履歴ＤＢ５１１に蓄積されている会話データを参照し、発話者のハピネス度が上昇した会話を抽出し、ハピネス度上昇より時系列的に前に行われた会話のやり取りに基づいて会話フレームを生成し、会話フレームＤＢ５１２に蓄積する。会話フレームの詳細な生成方法については、後述する。

　会話フレームＤＢ５１２には、会話フレーム生成部５０２で生成された会話フレームが蓄積される。

　制御部５００は、会話フレームＤＢ５１２に蓄積された会話フレームを、対話処理部３０に出力する。当該会話フレームは、対話処理部３０によりエージェントの応答文を生成する際に用いられる。

　以上、第１の実施形態による会話ＤＢ生成部５０Ａの構成について具体的に説明した。続いて、第１の実施形態による会話ＤＢ生成部５０Ａの動作処理について説明する。

　（４－１－２．会話フレームの生成処理）
　図１６は、第１の実施形態による会話フレーム生成処理を示すフローチャートである。図１６に示すように、まず、会話ＤＢ生成部５０Ａは、通信部５１０を介して、例えばネットワーク上のソーシャルメディアからユーザ間の会話データを取得する（ステップＳ３０３）。取得された会話データは、会話履歴ＤＢ５１１に蓄積される。

　次に、ハピネス算出部５０１は、会話履歴ＤＢ５１１に蓄積された会話データに基づいて、会話毎の発話者のハピネス度を算出する（ステップＳ３０６）。ハピネス度の定義は様々考えられるが、本実施形態では一例として慶應義塾大学大学院教授の前野隆司著『幸せのメカニズム』（講談社現代新書）で定義されている「幸福になるための因子」を用いる。ここでは、「幸福になるための因子」として以下の４つの因子が挙げられる。
　　・目的を達成するための自己成長と自身に向かう特徴の「自己実現と成長」因子
　　・感謝傾向と他者に向かう特徴の「つながりと感謝」因子
　　・楽観的・ポジティブで精神的に安定している「前向きと楽観」因子
　　・自己を確立し他者と比較しない性質である「独立とマイペース」因子

　本実施形態では、これら４つの因子のそれぞれの値が大きいほど幸福度が高いと推定する。したがって、例えば各因子に対応する特徴的なキーワードが会話データに含まれる頻度に基づいてハピネス度（幸福度合い）を算出し得る。各因子に対応する特徴的なキーワードの一例は、図１８を参照して後述する。

　算出したハピネス度は、各会話に紐付けられて会話履歴ＤＢ５１１に格納される。

　次いで、会話フレーム生成部５０２は、会話毎のハピネス度を参照して、ユーザが幸福な感情になる会話フレームを生成する（ステップＳ３０９）。生成された会話フレームは、会話フレームＤＢ５１２に蓄積される。

　そして、上記ステップＳ３０３～Ｓ３０９が、終了指示があるまで繰り返される（ステップＳ３１２）。上記ステップＳ３０３～Ｓ３０９は、例えば定期的（１日１回、６時間に１回等）に行われる。

　（４－１－３．ハピネス度算出処理）
　次に、上記ステップＳ３０６で行われるハピネス度算出処理について詳述する。図１７は、第１の実施形態によるハピネス度算出処理を示すフローチャートである。

　図１７に示すように、まず、ハピネス算出部５０１は、会話履歴ＤＢ５１１に蓄積された会話データの言語解析を行う（ステップＳ３２３）。例えばハピネス算出部５０１は、会話データ（テキスト）を形態素解析する。

　次いで、ハピネス算出部５０１は、解析結果に基づいて会話データの表現検索を行い（ステップＳ３２６）、ハピネス度を算出する（ステップＳ３２９）。ここで、上述したように、本実施形態では、幸福の度合いを表すハピネス度を算出する際に、主観的幸福の心的要因の因子分析に基づく「幸福の因子」を用いる。具体的には、「幸福の因子」である４つの因子に対応する特徴的なキーワードが会話データに含まれる頻度に基づいてハピネス度を算出する。ここで、図１８に特徴的なキーワードにおける４つの因子の評価値の一例を示す。図１８に示すテーブルは、例えばハピネス算出部５０１が有する。

　図１８に示す４つの因子は、因子１：自己実現と成長因子、因子２：つながりと感謝の因子、因子３：前向きと楽観因子、因子４：独立とマイペース因子である。また、４つの因子の評価値（すなわちハピネス度寄与値）は、０～１で表現されている。例えば１段目の「自己実現」というキーワード（すなわち会話表現）が会話データに含まれている場合、自己実現と成長因子（因子１）の評価値が「１」、他の因子の評価値は「０」である。また、４段目の「ありがとう」というキーワードが会話データに含まれている場合、つながりと感謝の因子（因子２）の評価値が「１」、他の因子の評価値は「０」である。

　したがって、ハピネス算出部５０１は、会話データの形態素解析（単語の抽出）の結果に基づいて、図１８に示すテーブルに含まれる全ての表現（キーワード）を会話データから検索し、発見した表現についてそれぞれの因子の寄与値を加算したハピネス度のベクトルを求める。各因子の寄与値をｆ_１～４とすると、ハピネス度のベクトルは下記式１により求められる。

　例えば、「それほどでも。ありがとうね。」という会話データには、ハピネス度寄与値のテーブルの「ありがとう」という表現が含まれ、図１８に示すテーブルを参照すると、ハピネス度寄与値は、happiness = [0,1,0,0]となる（因子２の値が「１」）。

　次いで、ハピネス算出部５０１は、算出したハピネス度を会話履歴ＤＢ５１１の各会話データのメタデータとして保存する（ステップＳ３３２）。ここで、図１９に、会話履歴ＤＢ５１１に蓄積される会話データの一例を示す。会話データは、会話ＩＤ、会話日時、会話者ＩＤ、テキスト（会話内容）、およびハピネス度が紐付けられているデータである。図１９に示す会話ＩＤ：C02-03は、会話内容の中に「計画」という特徴的なキーワードが含まれているため、図１８に示すテーブルを参照して、因子１の値が「0.5」と判断され、ハピネス度寄与値は、happiness = [0.5,0,0,0]となっている。

　そして、上記ステップＳ３２３～Ｓ３３２が、終了指示があるまで繰り返される（ステップＳ３３５）。上記ステップＳ３２３～Ｓ３３２は、例えば定期的（１日１回、６時間に１回等）に行われる。

　（４－１－４．会話フレーム生成処理）
　続いて、上記ステップＳ３０９で行われる会話フレーム生成処理について詳述する。図２０は、第１の実施形態による会話フレーム生成処理を示すフローチャートである。

　図２０に示すように、まず、会話フレーム生成部５０２は、会話履歴ＤＢ５１１から、ハピネス度上昇の要因となった会話データを抽出する（ステップＳ３４３）。具体的には、会話フレーム生成部５０２は、会話履歴ＤＢ５１１に蓄積されている会話データのうち、一連の会話の中で同じ発話者ＩＤの会話データのハピネス度が上昇している場合、上昇した会話データの直近にやり取りされた会話データを抽出する。ハピネス度上昇の判定には、例えば所定の閾値を用いてもよい。例えば、図１９に示す会話データのうち、一例の会話（例えば会話ＩＤ：C01）の中で、発話者ＩＤ：U01の会話ＩＤ：C01-01のハピネス度［0,0,0,0］と会話ＩＤ：C01-03のハピネス度［0,1,0,0］とを比較すると、ハピネス度が「１」上昇しているのが分かる。この場合、会話フレーム生成部５０２は、上昇した会話データの直近にやり取りされた会話データ、すなわち会話ＩＤ：C01-01の会話データ（発話者ＩＤ：U01）と会話ＩＤ：C01-02の会話データ（発話者ＩＤ：U02）を抽出する。

　なお、会話データに含まれる、感情を表す特徴的なキーワード（以下、「感情語」と称す）に基づいて算出された感情値（感情を表す値）が各会話データに付与されている場合には、ハピネス度のみならず、感情値が上昇している会話を抽出してもよい。かかる感情値の算出は、ハピネス算出部５０１によりハピネス度の算出の際に行われてもよい。ハピネス算出部５０１は、感情語毎の感情値を示す感情値テーブルを有し、会話データの形態素解析結果から会話データに含まれる感情語を検索し、感情語が含まれている場合は感情語の感情値を加算することで、会話データの感情値を算出する。なお、感情語としては、ポジティブ／ネガティブな修飾語や感嘆詞が挙げられる。

　以上、ハピネス度上昇の要因となった会話データの抽出について説明した。

　次に、会話フレーム生成部５０２は、抽出した会話データの構文解析を行う（ステップＳ３４６）。具体的には、会話フレーム生成部５０２は、抽出した会話データの文字列を形態素に分け、単語間の文法的な関係（主語－述語、修飾－被修飾等）を解析する。

　次いで、会話フレーム生成部５０２は、構文解析結果に基づいて、抽出した会話データの名詞句を抽象化し（ステップＳ３４９）、動詞と抽象化された名詞句から成る会話フレームを生成する（ステップＳ３５２）。なお、名詞句が形容詞を含んでいる場合には、図２１に示すような形容詞の感情値テーブルを参照して、対応する形容詞の感情値に応じた値（感情値
１；「ポジティブ」、感情値－１；「ネガティブ」、感情値０；「中立」）を会話フレームに入れておいてもよい。以下、会話フレームの生成について具体例を挙げて説明する。

　例えば、会話フレーム生成部５０２は、抽出された会話データが、「昨日、美味しいグラタンを作れた！」（会話ＩＤ:C01-01）と、「美味しいグラタンを作れるんだ。すごいね」（会話ＩＤ:C01-02）の場合、各会話データを構文解析し、共通する名詞句（ここでは「美味しいグラタン（形容詞＋名詞）」）を抽象化して下記のような会話フレームを生成する。
　　条件フレーム：「〈形容詞：ポジティブ〉〈名詞〉を作れた。」
　　応答フレーム：「〈形容詞：ポジティブ〉〈名詞〉を作れるんだ。すごいね！」

　会話フレームは、上記のように当該会話フレームが使われる“条件（条件フレーム）”と、その“応答（応答フレーム）”から成る。また、会話フレームには、形容詞の感情値に応じた値（ここでは、「美味しい」の感情値「１」に対応する値『ポジティブ』）も入れられる。これにより、当該会話フレームは、ポジティブな物を作ったという発話への応答に使われることが分かる。

　次いで、会話フレーム生成部５０２は、生成した会話フレームを会話フレームＤＢ５１２に登録する（ステップＳ３５５）。ここで、会話フレームＤＢ５１２に登録される会話フレームの一例を図２２に示す。図２２に示すように、各会話フレームにはフレームＩＤが付与されている。

　そして、上記ステップＳ３４３～Ｓ３５５が、終了指示があるまで繰り返される（ステップＳ３５８）。上記ステップＳ３４３～Ｓ３５５は、例えば定期的（１日１回、６時間に１回等）に行われる。

　＜４－２．応答文の生成＞
　続いて、第１の実施形態による会話フレームを用いた応答文の生成について説明する。本実施形態による会話ＤＢ生成部５０Ａは、上述したように会話フレームを生成し、会話フレームが所定数（例えば１００組）に達すると、会話フレームのデータセットとして対話処理部３０に出力する。対話処理部３０は、音声エージェントＩ／Ｆ２０を介して入力されたユーザの発話（質問音声）に対してエージェントの応答（回答音声）を生成する際に、予め生成された会話フレームを用いる。ここでは、このような会話フレームを用いて応答を生成する対話処理部３００Ａの構成および動作処理について具体的に説明する。なお、対話処理部３００Ａの構成は、基本対話処理部３１、キャラクターＡ対話処理部３２、人物Ｂ対話処理部３３、および人物Ｃ対話処理部３４に共通する。

　（４－２－１．対話処理部３００Ａの構成）
　図２３は、第１の実施形態による対話処理部３００Ａの構成例を示す図である。図２３に示すように、対話処理部３００Ａは、質問文検索部３１０、回答文生成部３２０、会話ＤＢ３３０、音素データ取得部３４０、会話解析部３５０、会話履歴ＤＢ３６０、応答文生成部３７０、および会話フレームＤＢ３８０を有する。

　質問文検索部３１０、回答文生成部３２０、会話ＤＢ３３０、および音素データ取得部３４０は、図４を参照して説明した同符号の構成と同様であるので、ここでの説明は省略する。

　会話解析部３５０は、音声エージェントＩ／Ｆ２０により取得され、テキスト化されたユーザの会話文を取得し、構文解析を行う。なお、会話解析部３５０は、当該会話文を会話履歴ＤＢ３６０に蓄積してもよい。会話履歴ＤＢ３６０に蓄積された会話文は、会話ＤＢ生成部５０Ａにより収集される。

　応答文生成部３７０は、会話解析部３５０による解析結果に基づいて、構文が一致する会話フレームを会話フレームＤＢ３８０から検索する。会話フレームＤＢ３８０には、会話ＤＢ生成部５０Ａの会話フレームＤＢ５１２に蓄積された会話フレームのデータセットが保存されている。会話フレームＤＢ３８０に保存されている会話フレームは、会話ＤＢ生成部５０Ａにより定期的に更新されてもよい。

　例えば、応答文生成部３７０は、ユーザの会話文が「やった！美しい生け花を作れたよ！」の場合、名詞句を抽象化する構文解析結果「やった！<形容詞：ポジティブ><名詞>を作れたよ！」と一致する条件（発話条件フレーム）を会話フレームＤＢ３８０から検索する。例えば図２２に示すような会話フレームが保存されている場合、フレームＩＤ：F01の条件フレームが一致する。したがって、応答文生成部３７０は、当該条件フレームに対応する応答フレーム「<形容詞：ポジティブ><名詞>を作れるんだ。すごいね！」を用いて、「美しい生け花を作れるんだ。すごいね！」を応答文データとして生成する。なお、複数の条件フレームが検索された場合には、例えば最初に検索されたものを選択するようにしてもよいし、検索した全ての条件フレームからランダムに選択するようにしてもよい。

　応答文生成部３７０により生成された応答文データは、音素データ取得部３４０に出力され、音素データ取得部３４０により特定エージェントの音素が取得され、応答文データおよび音素データが音声エージェントＩ／Ｆ２０に出力される。そして、音声エージェントＩ／Ｆ２０により応答文データが特定エージェントの音声で音声化され、クライアント端末１から特定エージェントの発言として出力される。

　以上、第１の実施形態による対話処理部３００Ａの構成について説明した。続いて、本実施形態による対話処理部３００Ａの動作処理について説明する。

　（４－２－２．応答処理）
　図２４は、第１の実施形態による応答処理を示すフローチャートである。図２４に示すように、まず、会話解析部３５０は、音声エージェントＩ／Ｆ２０により取得され、テキスト化されたユーザの会話文を取得する（ステップＳ３６３）。

　次いで、会話解析部３５０は、会話文の構文解析を行う（ステップＳ３６６）。

　次に、会話解析部３５０は、会話文を会話履歴として会話履歴ＤＢ３６０に保存する（ステップＳ３６９）。

　次いで、応答文生成部３７０は、会話解析部３５０による解析結果に基づき、また、会話フレームＤＢ３８０を参照し、応答文データの生成を行う（ステップＳ３７２）。応答文生成処理の詳細については後述する。

　そして、応答文生成部３７０は、生成した応答文データを音素データ取得部３４０に出力する（ステップＳ３７５）。

　（４－２－３．応答文生成処理）
　次いで、上記ステップＳ３７２に示す応答文の生成処理について図２５を参照して説明する。図２５は、第１の実施形態による応答文生成処理を示すフローチャートである。

　図２５に示すように、まず、応答文生成部３７０は、会話解析部３５０による会話文の解析結果と、会話フレームＤＢ３８０に保存されている会話フレームとをマッチングする（ステップＳ３８３）。

　次いで、応答文生成部３７０は、会話文の解析結果とマッチする条件フレームを含む会話フレームを選択する（ステップＳ３８６）。

　そして、応答文生成部３７０は、選択した会話フレームの応答フレームを用いて、応答文データを生成する（ステップＳ３８９）。

　（４－２－４．応答文出力処理）
　次に、応答文生成部３７０により生成された応答文データの出力処理について図２６を参照して説明する。図２６は、第１の実施形態による応答文データの出力処理を示すフローチャートである。

　図２６に示すように、まず、音素データ取得部３４０は、応答文生成部３７０により生成された応答文データを構文解析し（ステップＳ３９３）、それぞれの要素に対応する特定エージェントの音素データを取得する（ステップＳ３９６）。

　次に、音素データ取得部３４０は、取得した音素データと応答文データとを音声エージェントＩ／Ｆ２０へ出力する（ステップＳ３９９）。

　次いで、音声エージェントＩ／Ｆ２０は、音素データから音声スペクトルを生成し、応答文データの音声化（音声合成）を行う（ステップＳ４０２）。

　そして、音声エージェントＩ／Ｆ２０は、生成した応答音声をクライアント端末１へ送信し、クライアント端末１において応答音声が出力される（ステップＳ４０５）。

　＜＜５．第２の実施形態による対話制御処理＞＞
　＜５－１．会話フレームの生成＞
　上述した第１の実施形態では、会話フレームの生成において、会話ＤＢ５１１から会話データのハピネス度（幸福の度合い）を抽出し、ハピネス度が上昇した際の会話フレームを学習する方法について説明した。

　ここで、人にはそれぞれ性格があり、幸福を感じる会話が異なる場合がある。そこで、第２の実施形態では、会話者の性格を解析し、性格毎に会話フレームを学習することで、ユーザの性格に応じた会話フレームを用いてユーザへの応答を生成し、より効果的な応答を提供することを可能とする。

　まず、本実施形態による性格の定義について説明する。人の性格を説明する際には、類型論と特性論の２つの考え方が用いられる。類型論では、性格をいくつかの典型的な類型で説明し、特性論では、性格をいくつかの特性の組合せとして説明する。また、広義の性格であるパーソナリティを、先天的な気質と後天的な性格に分類することもある。本実施形態では、一例として、クロニンジャー(Robert Cloninger)の特性論であるパーソナリティ理論を用いる。かかるパーソナリティ理論では、４つの気質パラメータ「新規性探究、報酬依存、損害回避、固執」と３つの性格パラメータ「自己志向性、協調性、自己超越性」の合計７つの特性から性格を分類する（パーソナリティ７次元モデル）。気質パラメータのそれぞれの特徴と神経伝達物質との関連性については、新規性探究が神経伝達物質のドーパミンと関連し、報酬依存がノルエピネフリンと関連し、損害回避がセロトニンと関連するといった研究がなされている。本実施形態では、新規性探究、報酬依存、損害回避といった３つの気質パラメータを軸とした３次元空間を考え、図２７に示すように、それぞれの軸の値の大小により８つの性格（冒険家、激情家、情熱家、神経質、独立した、論理的、生真面目、慎重）に分類する。

　（５－１－１．会話ＤＢ生成部５０Ａの構成）
　次に、図２８を参照して、会話フレームの生成を行う会話ＤＢ生成部５０Ｂの主要構成について説明する。図２８は、第２の実施形態による会話ＤＢ生成部５０Ｂの構成例を示す図である。図２８に示すように、会話ＤＢ生成部５０Ｂは、制御部５２０、通信部５１０、会話履歴ＤＢ５１１、会話フレームＤＢ５１２、および性格ＤＢ５１３を有する。

　通信部５１０、会話履歴ＤＢ５１１、および会話フレームＤＢ５１２は、図１５を参照して説明した第１の実施形態による同符号の構成と同様であるため、ここでの説明は省略する。

　制御部５２０は、演算処理装置および制御装置として機能し、各種プログラムに従って会話ＤＢ生成部５０Ｂ内の動作全般を制御する。制御部５２０は、例えばＣＰＵ、マイクロプロセッサ等の電子回路によって実現される。また、本実施形態による制御部５２０は、ハピネス算出部５０１、会話フレーム生成部５０２、および性格解析部５０３として機能する。

　ハピネス算出部５０１および会話フレーム生成部５０２の機能は、図１５を参照して説明した第１の実施形態による同符号の構成と同様である。

　性格解析部５０３は、会話履歴ＤＢ５１１に蓄積されている会話データを参照して、会話データ毎に発話者の性格パラメータを算出する。算出した性格パラメータは、会話データに紐付けられて会話履歴ＤＢ５１１に蓄積される。また、性格解析部５０３は、発話者ＩＤ毎の会話データの性格パラメータを会話履歴ＤＢ５１１から抽出し、これに基づいて発話者ＩＤ毎の性格タイプを解析し、性格ＤＢ５１３に蓄積する。性格解析の詳細については、後述する。

　性格ＤＢ５１３には、性格解析部５０３により解析された発話者毎の性格タイプに関する情報が蓄積される。

　以上、第２の実施形態による会話ＤＢ生成部５０Ｂの構成について具体的に説明した。続いて、第２の実施形態による会話ＤＢ生成部５０Ｂの動作処理について説明する。

　（５－１－２．会話フレームの生成処理）
　図２９は、第２の実施形態による会話フレーム生成処理を示すフローチャートである。図１６に示すように、まず、会話ＤＢ生成部５０Ａは、通信部５１０を介して、例えばネットワーク上のソーシャルメディアからユーザ間の会話データを取得する（ステップＳ４１３）。取得された会話データは、会話履歴ＤＢ５１１に蓄積される。

　次いで、性格解析部５０３は、会話履歴ＤＢ５１１に蓄積された会話データに基づいて、会話毎の発話者の性格パラメータを算出する（ステップＳ４１６）。算出された性格パラメータは会話データに紐付けて会話履歴ＤＢ５１１に保存される。性格パラメータの算出については、図３０を参照して詳述する。

　次に、ハピネス算出部５０１は、会話履歴ＤＢ５１１に蓄積された会話データに基づいて、会話毎の発話者のハピネス度を算出する（ステップＳ４１９）。算出されたハピネス度は会話データに紐付けて会話履歴ＤＢ５１１に保存される。ハピネス度の算出については、図１７を参照して説明した通りである。

　次いで、会話フレーム生成部５０２は、会話毎のハピネス度を参照して、ユーザが幸福な感情になる会話フレームを生成する（ステップＳ４２２）。生成された会話フレームは、会話フレームＤＢ５１２に蓄積される。会話フレームの生成については、図２０を参照して説明した通りである。なお、第２の実施形態では、会話フレームの使用が適切とされる性格タイプがメタデータとして紐付けられる。具体的には、会話フレーム生成部５０２は、会話フレームを生成する際に用いた会話データにおいて、ハピネス度が上昇した発話者ＩＤの性格タイプを性格ＤＢ５１３から取得し、生成した会話フレームにメタデータとして紐付ける。

　そして、上記ステップＳ４１３～Ｓ４２２が、終了指示があるまで繰り返される（ステップＳ４２５）。上記ステップＳ４１３～Ｓ４２２は、例えば定期的（１日１回、６時間に１回等）に行われる。

　（５－１－３．性格解析処理）
　次に、上記ステップＳ４１６で行われる性格解析処理について詳述する。図３０は、第２の実施形態による性格解析処理を示すフローチャートである。

　図３０に示すように、まず、性格解析部５０３は、会話履歴ＤＢ５１１に蓄積された会話データの言語解析を行う（ステップＳ４３３）。例えば性格解析部５０３は、会話データ（テキスト）を形態素解析する。

　次いで、性格解析部５０３は、解析結果に基づいて会話データの表現検索を行い（ステップＳ４３６）、性格パラメータを算出する（ステップＳ４３９）。ここで、本実施形態では、図２７を参照して上述したように、新規性探究、報酬依存、損害回避といった３つの軸による３次元空間を考え、それぞれの軸の値の大小により８つの性格（冒険家、激情家、情熱家、神経質、独立した、論理的、生真面目、慎重）に分類する。性格解析部５０３は、これら３つの軸に対応する特徴的なキーワードが会話データに含まれる頻度に基づいて性格パラメータを算出する。ここで、図３１に特徴的なキーワードにおける３つの性格パラメータ寄与値の一例を示す。図３１に示すテーブルは、例えば性格解析部５０３が有する。

　図３１に示す３つの性格パラメータ寄与値（新規性探究、報酬依存、存在回避）は、０～１で表現されている。例えば１段目の「刺激が快感」というキーワード（すなわち会話表現）が会話データに含まれている場合、新規性探究の値が「１」、他の値は「０」である。また、４段目の「癖になる」というキーワードが会話データに含まれている場合、報酬依存の値が「１」、他の値は「０」である。

　したがって、性格解析部５０３は、会話データの形態素解析（単語の抽出）の結果に基づいて、図３１に示すテーブルに含まれる全ての表現（キーワード）を会話データから検索し、発見した表現についてそれぞれの性格パラメータ寄与値を加算した性格パラメータのベクトルを求める。各性格パラメータ寄与値をｇ_１～３とすると、性格パラメータのベクトルは下記式２により求められる。

　例えば、「今日は勉強を２時間しかできなかった。受験に間に合うか心配だ。」（発話者ＩＤ：U03）という会話データには、性格パラメータ寄与値のテーブルの「間に合うか心配」という表現が含まれ、図３１に示すテーブルを参照すると、性格パラメータ寄与値は、c = [0.0,0.0,1.0]となる（損害回避の値が「1.0」）。

　次いで、性格解析部５０３は、算出した性格パラメータを会話履歴ＤＢ５１１の各会話データのメタデータとして保存する（ステップＳ４４２）。ここで、図３２に、会話履歴ＤＢ５１１に蓄積される会話データの一例を示す。会話データは、会話ＩＤ、会話日時、会話者ＩＤ、テキスト（会話内容）、ハピネス度、および性格パラメータが紐付けられているデータである。

　次に、性格解析部５０３は、性格ＤＢ５１３を更新する（ステップＳ４４５）。性格ＤＢ５１３には、発話者毎の性格タイプに関する情報が蓄積されている。発話者の性格タイプは、図２７を参照して説明した３次元空間の中の８つの分類に基づいて判断され得る。ここで、図３３に、性格ＤＢ５１３に蓄積される発話者の性格データの一例を示す。性格ＤＢ５１３の性格データは、図３３に示すように、発話者ＩＤ、発話数、性格パラメータ、および性格タイプが紐付けられている。性格解析部５０３は、例えば上記会話データ（「今日は勉強を２時間しかできなかった。受験に間に合うか心配だ。」）の発話者ＩＤ：U03の発話数に「１」を加算すると共に、当該発話者の性格パラメータの「損害回避」に「1.0」を加算する。

　発話者の性格タイプは、図２７を参照して説明した３次元空間の中の８つの分類に基づいて判断され得る。具体的には、性格解析部５０３は、例えば各性格パラメータの値（総和）を発話数（総数）で除算して発話１つ当たりの３つの性格パラメータ（新規性探究、報酬依存、損害回避）を算出し、図２７に示す８つの分類のうちどの分類に該当するかを判断する。なお性格解析部５０３は、各性格パラメータの値を閾値0.5で分類して性格タイプを判断してもよい。ここで、図３４に、性格パラメータ寄与値と性格タイプの３次元空間の一例を示す。

　図３４に示す例では、３つの軸における性格パラメータが閾値0.5で分類された場合における８つの性格タイプが３次元空間で表されている。これにより、各性格タイプの特徴が下記の通りであることが分かる。

　・性格タイプ000－新規性探究、報酬依存、及び損害回避が低い「独立」タイプ
　・性格タイプ001－新規性探究及び報酬依存が低く、損害回避が高い「論理的」タイプ
　・性格タイプ011－新規性探究が低く、報酬依存及び損害回避が高い「慎重」タイプ
　・性格タイプ111－新規性探究、報酬依存、及び損害回避が高い「神経質」タイプ
　・性格タイプ010－新規性探究及び損害回避が低く、報酬依存が高い「生真面目」タイプ
　・性格タイプ110－新規性探究及び報酬依存が高く、損害回避が低い「情熱家」タイプ
　・性格タイプ100－新規性探究が高く、報酬依存及び損害回避が低い「冒険家」タイプ
　・性格タイプ101－新規性探究及び損害回避が高く、報酬依存が低い「激情家」タイプ

　例えば図３３の１段目に示す発話者ＩＤ：U01の性格タイプを判断する際、性格解析部５０３は、まず、発話１つ当たりの性格パラメータを下記のように算出する。
　・新規性探究　127.9/2736 = 0.046
　・報酬依存　　354.2/2736 = 0.13
　・損害回避　　2012.4/2736 = 0.73

　これにより、性格解析部５０３は、算出した性格パラメータを閾値0.5で分類し、新規性探究および報酬依存が低く、損害回避が高い「性格タイプ001」であると判断できる。

　このように判断された性格タイプは、上記ステップＳ４２２（図２９参照）で生成される会話フレームにメタデータとして紐付けられる。すなわち、会話学習部５０２は、生成した会話フレームの元となった会話データにおいて、ハピネス値が上昇した発話者ＩＤに対応する性格タイプを性格ＤＢ５１３から取得し、生成した会話フレームに紐付ける。例えば、「昨日、美味しいグラタンを作れた！」（発話者ＩＤ:U01）、「美味しいグラタンを作れるんだ。すごいね」（発話者ＩＤ:U02）、「それほどでも。ありがとうね」（発話者ＩＤ:U01）といった一連の会話（会話ID：C01）に基づいて会話フレームを生成した場合を例に説明する。この場合、ハピネス度が上昇した「それほどでも。ありがとうね」という発話を行った発話者ＩＤ:U01に対応する性格タイプ001が、会話フレームに紐付けられる。図３５に、会話フレームＤＢ５１２に登録される会話フレームの一例を示す。図２５に示すように、各会話フレームには性格タイプが紐付けられている。これにより、本実施形態では、ユーザの性格タイプに応じて使用する会話フレームを選択することができ、より効果的にユーザの感情を所定の感情（ここでは、幸福な感情）に導くことができる。

　そして、上記ステップＳ４３３～Ｓ４４５が、終了指示があるまで繰り返される（ステップＳ４４８）。上記ステップＳ４３３～Ｓ４４５は、例えば定期的（１日１回、６時間に１回等）に行われる。

　＜５－２．応答文の生成＞
　（５－２－１．対話処理部３００Ｂの構成）
　続いて、第２の実施形態による対話処理部３００Ｂの構成について説明する。図３６は、第２の実施形態による対話処理部３００Ｂの構成例を示す図である。図３６に示すように、対話処理部３００Ｂは、質問文検索部３１０、回答文生成部３２０、会話ＤＢ３３０、音素データ取得部３４０、会話解析部３５０、会話履歴ＤＢ３６０、応答文生成部３７０、会話フレームＤＢ３８０、性格タイプＤＢ３９０を有する。

　質問文検索部３１０、回答文生成部３２０、会話ＤＢ３３０、音素データ取得部３４０、会話解析部３５０、会話履歴ＤＢ３６０は、図２３に示す第１の実施形態と同様であるので、ここでの説明は省略する。

　応答文生成部３７０は、会話解析部３５０による解析結果に基づいて、構文が一致する会話フレームを会話フレームＤＢ３８０から検索する。会話フレームＤＢ３８０には、会話ＤＢ生成部５０Ｂの会話フレームＤＢ５１２に蓄積された会話フレームのデータセットが保存されている。なお、会話フレームＤＢ３８０には、第１の実施形態で説明した内容に加えて、その会話フレームが使用される性格タイプが記述されている（図３５参照）。本実施形態では、この性格タイプと同じ性格タイプの人にのみ、この会話フレームが使用される。

　例えば、応答文生成部３７０は、ユーザの会話文が「やった！美しい生け花を作れたよ！」の場合、名詞句を抽象化する構文解析結果「やった！<形容詞：ポジティブ><名詞>を作れたよ！」と一致する条件（発話条件フレーム）を会話フレームＤＢ３８０から検索する。この際、ユーザの性格タイプを性格タイプＤＢ３９０から取得し、検索の際に用いる。例えば図３５に示すような会話フレームが保存されている場合、フレームＩＤ：F01、F04、F05の条件フレームが一致する。

　応答文生成部３７０は、ユーザの性格タイプが、損害回避が強いタイプ：001の場合、F01の会話フレームを選択して下記の応答文を生成する。
　「美しい生け花を作れるんだ。すごいね！」

　一方、ユーザの性格タイプが、報酬依存が強いタイプ：010の場合、応答文生成部３７０は、F04の会話フレームを選択して下記の応答文を生成する。
　「美しい生け花を作るって面白いよね。もっと作ろう！」

　また、ユーザの性格タイプが、新規性探究が強いタイプ：100の場合、応答文生成部３７０は、F05の会話フレームを選択して下記の応答文を生成する。
　「君ならもっと美しい生け花を作れるよ。頑張れ！」

　以上、第１の実施形態による対話処理部３００Ｂの構成について説明した。続いて、本実施形態による対話処理部３００Ｂの動作処理について説明する。

　（５－２－２．応答文生成処理）
　図３７は、第２の実施形態による応答文生成処理を示すフローチャートである。図３７に示すように、まず、応答文生成部３７０は、会話者ＩＤを取得する（ステップＳ４５３）。会話者ＩＤは、例えばユーザのクライアント端末１から送信され得る。

　次に、応答文生成部３７０は、会話者ＩＤの性格タイプを性格タイプＤＢ３９０から取得する（ステップＳ４５６）。

　次いで、応答文生成部３７０は、会話解析部３５０により解析された会話文（ユーザの発話音声）の解析結果と、会話フレームＤＢ３８０に蓄積される会話フレームとのマッチングを行う（ステップＳ４５９）。会話解析部３５０では、第１の実施形態と同様に、音声エージェントＩ／Ｆ２０により取得され、テキスト化されたユーザの会話文の構文解析が行われる。

　次に、応答文生成部３７０は、解析結果とマッチする条件フレームを含む会話フレームのうち、さらに会話者（ユーザ）の性格タイプにマッチする会話フレームを選択する（ステップＳ４６２）。

　そして、応答文生成部３７０は、選択した会話フレームの応答フレームを用いて、応答文データを生成する（ステップＳ４６５）。

　以上、本実施形態による応答文生成処理について説明した。なお、第２の実施形態による応答文出力処理は、図２６を参照して説明した第１の実施形態による応答文出力処理と同様のため、ここでの説明は省略する。

　　＜＜６．まとめ＞＞
　上述したように、本開示の実施形態による通信制御システムでは、ユーザ同士の実際の会話から生成した会話構造を用いてユーザを所定の感情に導くことが可能となる。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本技術はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　例えば、上述したクライアント端末１、またはエージェントサーバ２に内蔵されるＣＰＵ、ＲＯＭ、およびＲＡＭ等のハードウェアに、クライアント端末１、またはエージェントサーバ２の機能を発揮させるためのコンピュータプログラムも作成可能である。また、当該コンピュータプログラムを記憶させたコンピュータ読み取り可能な記憶媒体も提供される。

　また、上述した実施形態では、インターネット上のエージェントサーバ２で各種機能が実現される構成を示したが、本実施形態はこれに限定されず、図３に示すエージェントサーバ２の構成のうち少なくとも一部が、ユーザのクライアント端末１（スマートホンやウェアラブル端末等）にあってもよい。また、図３に示すエージェントサーバ２の構成全てがクライアント端末１に設けられ、クライアント端末１で全ての処理を行えるようにしてもよい。

　また、上述した実施形態では、応答文データを、所定の音素データを用いて音声エージェントＩ／Ｆ２０で音声化し、クライアント端末１に送信してエージェントの発言として出力する旨を説明したが、本実施形態はこれに限定されない。例えば音声エージェントＩ／Ｆ２０は、応答文データおよび音素データをクライアント端末１に送信し、クライアント端末１において音素データを用いて応答文データの音声化が行われ、エージェントの発言として出力してもよい。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、本技術は以下のような構成も取ることができる。
（１）
　ユーザの会話を受信する通信部と、
　前記通信部を介して収集されたユーザの会話に基づき生成された会話の構造を記述する会話フレームを蓄積する蓄積部と、
　前記収集される会話単位でその会話を発信するユーザの感情に関わる感情パラメータを求め；
　前記感情パラメータに基づき、前記会話から前記会話フレームを抽出して前記蓄積部に蓄積する制御部と、
を備える、通信システム。
（２）
　前記制御部は、
　　クライアント端末から前記通信部を介して受信したユーザの会話の構造を解析し、
　　前記解析された構造に一致する、前記蓄積部に蓄積された前記会話フレームに基づき、エージェントによる応答テキストを生成する、前記（１）に記載の通信システム。
（３）
　前記制御部は、
　　前記会話フレームに、その会話フレームの元となる会話を行ったユーザの性格情報を関連付けて前記蓄積部に蓄積し；
　　前記解析された前記ユーザの会話の構造に一致する構造および前記クライアント端末のユーザの性格情報に対応する前記会話フレームを前記蓄積部から抽出し、抽出した会話フレームに基づいて応答テキストを生成する、前記（２）に記載の通信システム。
（４）
　前記制御部は、前記生成した応答テキストを、前記通信部を介してクライアント端末に送信する、前記（２）または（３）に記載の通信システム。
（５）
　前記制御部は、前記応答テキストを音声合成して音声合成データを生成し、前記通信部を介してクライアント端末に送信する、前記（２）または（３）に記載の通信システム。
（６）
　前記制御部は、第１ユーザの会話に対応する前記感情パラメータのレベルの上昇の要因と推定される第２ユーザの会話の構造を記述する会話応答フレームと、その要因と推定される第２のユーザの会話より時系列的に前の第１のユーザの会話の構造を記述する会話条件フレームとを対応付けて前記蓄積部に蓄積する、前記（１）～（５）のいずれか１項に記載の通信システム。
（７）
　前記制御部は、
　　クライアント端末から前記通信部を介して受信したユーザの会話の構造を解析し；
　　前記蓄積部から、前記解析した構造に一致する前記会話条件フレームを検出すると、検出した会話条件フレームに対応付けて蓄積される会話応答フレームを特定し、当該会話応答フレームに基づいてエージェントによる応答テキストを生成する、前記（６）に記載の通信システム。
（８）
　前記制御部は、
　　前記会話条件フレームおよび前記会話応答フレームに、前記第１ユーザの性格情報を関連付けて前記蓄積部に蓄積し；
　　前記蓄積部から、前記解析した構造および前記ユーザの性格情報に対応する前記会話条件フレームを検出すると、検出した会話条件フレームに対応付けて蓄積される会話応答フレームを特定し、当該会話応答フレームに基づいてエージェントによる応答テキストを生成する、前記（７）に記載の通信システム。
（９）
　前記制御部は、第１ユーザの会話に対応する前記感情パラメータのレベルとしてのハピネス度の上昇の要因と推定される第２ユーザの会話の構造を記述する会話応答フレームと、その要因と推定される第２のユーザの会話より時系列的に前の第１のユーザの会話の構造を記述する会話条件フレームとを対応付けて前記蓄積部に蓄積する、前記（６）～（８）のいずれか１項に記載の通信システム。
（１０）
　前記ハピネス度は、幸福に関わる４つの因子に基づいて算出される、前記（９）に記載の通信システム。
（１１）
　前記制御部は、前記通信部を介して、ソーシャルメディア上でのユーザの会話を収集する、前記（１）～（１０）のいずれか１項に記載の通信システム。
（１２）
　前記制御部は、前記通信部を介して、前記ユーザの音声会話を収集する、前記（１１）に記載の通信システム。
（１３）
　プロセッサが、
　ユーザの会話を通信部により受信することと、
　前記通信部を介して収集されたユーザの会話に基づき生成された会話の構造を記述する会話フレームを蓄積部に蓄積することと、
　前記収集される会話単位でその会話を発信するユーザの感情に関わる感情パラメータを求め；
　前記感情パラメータに基づき、前記会話から前記会話フレームを抽出して前記蓄積部に蓄積することと、
を含む、通信制御方法。

　　１　　クライアント端末
　　２　　エージェントサーバ
　　３０　対話処理部
　　　３００、３００Ａ、３００Ｂ　対話処理部
　　　３１０　質問文検索部
　　　３２０　回答文生成部
　　　３３０　　会話ＤＢ
　　　３４０　　音素データ取得部
　　　３５０　　会話解析部
　　　３６０　　会話履歴ＤＢ
　　　３７０　　応答文生成部
　　　３８０　　会話フレームＤＢ
　　　３９０　　性格タイプＤＢ
　　３１　基本対話処理部
　　３２　キャラクターＡ対話処理部
　　３３　人物Ｂ対話処理部
　　３４　人物Ｃ対話処理部
　　４０　音素記憶部
　　４１　基本用音素ＤＢ
　　４２　　キャラクターＡ音素ＤＢ
　　４３　　人物Ｂ音素ＤＢ
　　４４　　人物Ｃ音素ＤＢ
　　５０、５０Ａ、５０Ｂ　　会話ＤＢ生成部
　　　５００、５２０　　制御部
　　　５０１　　ハピネス解析部
　　　５０２　　会話学習部
　　　５０３　　性格解析部
　　　５１０　　通信部
　　　５１１　　会話履歴ＤＢ
　　　５１２　　会話フレームＤＢ
　　　５１３　　性格ＤＢ
　　６０　　音素ＤＢ生成部
　　７０　　広告挿入処理部
　　７２　　広告ＤＢ
　　８０　フィードバック取得処理部
　　３　　ネットワーク

Claims

　ユーザの会話を受信する通信部と、
　前記通信部を介して収集されたユーザの会話に基づき生成された会話の構造を記述する会話フレームを蓄積する蓄積部と、
　前記収集される会話単位でその会話を発信するユーザの感情に関わる感情パラメータを求め；
　前記感情パラメータに基づき、前記会話から前記会話フレームを抽出して前記蓄積部に蓄積する制御部と、
を備える、通信システム。
　前記制御部は、
　　クライアント端末から前記通信部を介して受信したユーザの会話の構造を解析し、
　　前記解析された構造に一致する、前記蓄積部に蓄積された前記会話フレームに基づき、エージェントによる応答テキストを生成する、請求項１に記載の通信システム。
　前記制御部は、
　　前記会話フレームに、その会話フレームの元となる会話を行ったユーザの性格情報を関連付けて前記蓄積部に蓄積し；
　　前記解析された前記ユーザの会話の構造に一致する構造および前記クライアント端末のユーザの性格情報に対応する前記会話フレームを前記蓄積部から抽出し、抽出した会話フレームに基づいて応答テキストを生成する、請求項２に記載の通信システム。
　前記制御部は、前記生成した応答テキストを、前記通信部を介してクライアント端末に送信する、請求項２に記載の通信システム。
　前記制御部は、前記応答テキストを音声合成して音声合成データを生成し、前記通信部を介してクライアント端末に送信する、請求項２に記載の通信システム。
　前記制御部は、第１ユーザの会話に対応する前記感情パラメータのレベルの上昇の要因と推定される第２ユーザの会話の構造を記述する会話応答フレームと、その要因と推定される第２のユーザの会話より時系列的に前の第１のユーザの会話の構造を記述する会話条件フレームとを対応付けて前記蓄積部に蓄積する、請求項１に記載の通信システム。
　前記制御部は、
　　クライアント端末から前記通信部を介して受信したユーザの会話の構造を解析し；
　　前記蓄積部から、前記解析した構造に一致する前記会話条件フレームを検出すると、検出した会話条件フレームに対応付けて蓄積される会話応答フレームを特定し、当該会話応答フレームに基づいてエージェントによる応答テキストを生成する、請求項６に記載の通信システム。
　前記制御部は、
　　前記会話条件フレームおよび前記会話応答フレームに、前記第１ユーザの性格情報を関連付けて前記蓄積部に蓄積し；
　　前記蓄積部から、前記解析した構造および前記ユーザの性格情報に対応する前記会話条件フレームを検出すると、検出した会話条件フレームに対応付けて蓄積される会話応答フレームを特定し、当該会話応答フレームに基づいてエージェントによる応答テキストを生成する、請求項７に記載の通信システム。
　前記制御部は、第１ユーザの会話に対応する前記感情パラメータのレベルとしてのハピネス度の上昇の要因と推定される第２ユーザの会話の構造を記述する会話応答フレームと、その要因と推定される第２のユーザの会話より時系列的に前の第１のユーザの会話の構造を記述する会話条件フレームとを対応付けて前記蓄積部に蓄積する、請求項６に記載の通信システム。
　前記ハピネス度は、幸福に関わる４つの因子に基づいて算出される、請求項９に記載の通信システム。
　前記制御部は、前記通信部を介して、ソーシャルメディア上でのユーザの会話を収集する、請求項１に記載の通信システム。
　前記制御部は、前記通信部を介して、前記ユーザの音声会話を収集する、請求項１１に記載の通信システム。
　プロセッサが、
　ユーザの会話を通信部により受信することと、
　前記通信部を介して収集されたユーザの会話に基づき生成された会話の構造を記述する会話フレームを蓄積部に蓄積することと、
　前記収集される会話単位でその会話を発信するユーザの感情に関わる感情パラメータを求め；
　前記感情パラメータに基づき、前記会話から前記会話フレームを抽出して前記蓄積部に蓄積することと、
を含む、通信制御方法。