JP6120927B2

JP6120927B2 - 対話システム、対話を制御する方法、およびコンピュータを対話システムとして機能させるためのプログラム

Info

Publication number: JP6120927B2
Application number: JP2015187055A
Authority: JP
Inventors: 礼徳永; 上田　徹; 徹上田
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2015-09-24
Filing date: 2015-09-24
Publication date: 2017-04-26
Anticipated expiration: 2035-09-24
Also published as: CN108140030A; JP2017062602A; US10657960B2; WO2017051601A1; US20180277110A1

Description

本開示は機器を用いて対話を実現する技術に関し、より特定的には、発話者に固有な情報と一般的な情報とを用いて対話を実現する技術に関する。

対話するロボットや家電が商品化されている（例えば、非特許文献１参照）。対話には疲労を回復する効果があることが分かってきている（例えば、非特許文献２参照）。非特許文献２は、ロボット家電との対話を行うことにより、ストレスを低減する効果があり、特に高齢者に効果が高いことを示している。

ところで、高齢者を中心に認知症患者が増えている。この認知症に対して、回想法とよばれる手法が存在する（例えば、非特許文献３〜５参照）。回想法はアメリカの精神科医、ロバート・バトラー氏によって提唱された心理療法である。過去の懐かしい思い出を語り合ったり、誰かに話したりすることで脳が刺激され、精神状態を安定させる効果が期待できる。長く続けることで認知機能が改善することも明らかになり、日本でも認知症患者のリハビリテーションに利用されるようになってきている。要するに、この手法は、主として人との会話により過去を想起させ、それにより精神状態を改善させるものである。高齢者の認知障害への治療法に利用されることが多いが、うつ病の治療にも利用されることもある。

認知症の改善を支援する技術に関し、特開２０１１−２２３３６９号公報（特許文献１）は、「認知症患者の笑顔を検出し、それに応じて適切な会話を提供できる認知症患者用会話システム」を開示している（［要約］参照）。特許文献１に開示された技術によると、認知症患者に対する対話装置において、会話データ群に応じて笑顔を検出した回数をカウントすることで、患者が興味を持つ会話を選択的に提供可能なシステムが実現される。

特開２００４−１０９３２３号公報（特許文献２）は、「ユーザとの対話状況に応じて発話内容を臨機応変に変えることができ、知的で自然な音声対話を実現する音声対話装置」を開示している（［要約］参照）。

特開２０１１−２２３３６９号公報特開２００４−１０９３２３号公報

http://www.sharp.co.jp/cocorobo/products/rxv200-feature.html 「エンタテインメントコンピューティングシンポジウム（EC2015）」2015 年 9 月「ロボット家電との音声会話がユーザに与える効果」 https://ja.wikipedia.org/wiki/%E5%9B%9E%E6%83%B3%E6%B3%95 http://www.izumo-hp.com/coop/recollection.html http://www.ninchisho-forum.com/iryou/knowledge/071001_08.html

病気や疲労に対してのみならず、自分の経験に根差す話題の会話をすると親しみを感じることは日常体験することであり、このような機能を実現すると、より親しみ深い対話ができるシステムが実現可能となる。たとえば、「小学校の頃Ａ小学校の前にはＢ公園があるよね。Ｂ公園でよく遊んだね」といった対話が出てくると、親しみが湧く。

非特許文献３〜５は、回想法とは、人が人に対して行う治療手法であることが前提とされており、機械が介在することは想定されていない。

特許文献１に開示された技術は、会話を行っているときの患者の笑顔を検出することで、患者が興味を持つ会話を選び、治療効果を高めるものである。ここでは、会話一般について評価を行うだけで、新たな学習という観点はない。

特許文献２に開示された技術は、対話シナリオにないものをシナリオと語彙の両方記憶するもので、次回から記憶したシナリオについて対話を行うことが可能になる。しかし、ここではそのシステムで学習したもののみを次回発話の対象とするものであり、それ以外の要素の学習を行うものではない。

上記のように個人の情報とグローバルな情報を組み合わせて対話を作るシステムはまだない。したがって、個人に固有な情報と特定の個人に固有でない情報（グローバルな情報）とを組み合わせて対話を生成する技術が必要とされている。

本開示は、上述のような問題点を解決するためになされたものであって、ある局面における目的は、個人に固有な情報と個人に固有でない情報とに基づいて対話を実現するための対話システムを提供することである。

他の局面における目的は、個人に固有な情報と個人に固有でない情報とに基づいて対話を実現するようにコンピュータを制御するための方法を提供することである。

他の局面における目的は、個人に固有な情報と個人に固有でない情報とに基づいて対話を実現するための端末を提供することである。

さらに他の局面における目的は、個人に固有な情報と個人に固有でない情報とに基づいて対話を実現するようにコンピュータを制御するためのプログラムを提供することである。

一実施の形態に従うと、対話システムが提供される。この対話システムは、エピソードを記憶するためのエピソード記憶部と、ユーザの情報を記憶するための個人情報記憶部と、対話システムと対話しているユーザを同定するための個人同定部と、当該ユーザとの対話から、当該対話に関連する一つ以上の事象を抽出し、抽出された一つ以上の事象に関連するエピソードをエピソード記憶部から抽出するための抽出部と、抽出されたエピソードと、同定されたユーザの個人情報とに基づいて、同定されたユーザに応じた対話内容を生成するための生成部と、生成された対話内容を出力するための出力部とを備える。

ある局面によると、そのユーザに合わせた対話が実現できるので、疲労回復、うつ症状の改善、または親しみの向上等の効果を実現できる。

この発明の上記および他の目的、特徴、局面および利点は、添付の図面と関連して理解されるこの発明に関する次の詳細な説明から明らかとなるであろう。

対話型の家電システムが使用される局面を表わす図である。対話システム２０が備える構成を表すブロック図である。グローバルエピソード記憶部２２４におけるデータの格納の一態様を概念的に表す図である。グローバルエピソード記憶部２２４におけるデータの格納の一態様を概念的に表す図である。ローカルエピソード記憶部２２３におけるデータの格納の一態様を概念的に表す図である。個人情報記憶部２２５におけるデータの格納の一態様を概念的に表す図である。対話システム２０が実行する処理の一部を表わすフローチャートである。対話の解析結果とグローバルエピソード記憶部２２４に保存されているデータの一部を表わす図である。各グローバルエピソードの各スコアを表わす図である。別の局面に従う対話システムが実行する処理の一部を表わすフローチャートである。他の局面に従う対話システムによって生成されるデータ構造を概念的に表す図である。他の局面に従う対話システムによって生成される各エピソードごとのスコアを表す図である。システム発話およびユーザ発話から事象が抽出される態様を概念的に表す図である。端末とサーバとが実行する処理の流れを表すシーケンスチャートである。対話システムがローカルエピソードに関してイベントを学習するために実行する処理の一部を表すフローチャートである。

以下、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。

［家電システムの使用態様］
図１を参照して、本実施の形態に係る技術思想について説明する。図１は、対話型の家電システムが使用される局面を表わす図である。ある局面において、家電システムは、家電機器の一態様である掃除ロボット１１１，１２１として実現される。

本人の家１１０において、掃除ロボット１１１は、ルータ１１２を介して、冷蔵庫１１３と照明１１４とテレビ１１５とエアコン１１６とにそれぞれ通信可能に接続される。冷蔵庫１１３と照明１１４とテレビ１１５とエアコン１１６とは、それぞれネットワーク機能を備えており、掃除ロボット１１１から送られる信号に基づいて固有の動作を実行する。当該固有の動作は、例えば冷蔵庫１１３の中身を表示する処理、照明１１４の明るさを調節する処理、テレビ１１５のチャンネルまたは音量を調節する処理、エアコン１１６の温度の調節などを含み得る。

家１１０は、インターネット３０に接続されている。インターネット３０には、さらに他人の家１２０と、医療機関サーバ１３０と、自治体サーバ１４０と、事業者サーバ１５０と、スマートフォン１６０，１７０と、自動車１８０とがそれぞれ通信可能に接続されている。

他人の家１２０は、例えば家１１０の住人の親戚の家である。家１２０には、掃除ロボット１２１が存在する。掃除ロボット１２１は、ルータ１２２を介して、冷蔵庫１２３と照明１２４とテレビ１２５とエアコン１２６とにそれぞれ通信可能に接続されている。冷蔵庫１２３と照明１２４とテレビ１２５とエアコン１２６は、それぞれ冷蔵庫１１３と照明１１４とテレビ１１５とエアコン１１６と同様の機能を有する。したがって、それらの詳細な説明は繰り返さない。

医療機関サーバ１３０は、例えば、本人、その家族または親戚が通院する病院その他医療機関によって使用される。自治体サーバ１４０は、本人、その家族または親戚が居住する自治体によって使用される。事業者サーバ１５０は、掃除ロボット１１１，２１１にそれぞれ情報を送信するための情報提供事業者によって運営され使用される。医療機関サーバ１３０と自治体サーバ１４０と事業者サーバ１５０は、それぞれ、例えば周知の構成を有するコンピュータ装置によって実現される。

スマートフォン１６０，１７０は、情報処理通信端末として、本人の家族あるいは本人に医療サービスを提供する事象者のメンバーによって使用される。なお、情報処理通信端末はスマートフォンに限られず、タブレット端末、ＰＤＡ（Personal Digital Assistant）その他の端末が家族あるいは事業者のメンバーによって使用されてもよい。スマートフォン１６０，１７０の構成は当業者が容易に理解できるものである。したがって、当該構成の説明は繰り返さない。

自動車１８０は、ネットワーク通信機能を備えており、掃除ロボット１１１，１２１その他の通信機能を有する機器によって制御され得る。

［対話システムの構成］
図２を参照して、本実施の形態に係る対話システム２０の構成について説明する。図２は、対話システム２０が備える構成を表すブロック図である。ある局面において、対話システム２０は、サーバ２１０と、家電機器２５０とを備える。

一実施の形態において、サーバ２１０は、通信部２１１と、機器制御信号送信部２１２と、機器制御部２１３と、機器状態・制御指示受信部２１４と、全体制御部２１５と、音声認識部２１６と、対話制御部２１７と、音声合成部２１８と、個人同定部２１９と、機器状態発話生成部２２０と、情報発話生成部２２１と、外部情報取得部２２２と、ローカルエピソード記憶部２２３と、グローバルエピソード記憶部２２４と、個人情報記憶部２２５と、事象抽出部２２６と、エピソード評価・学習部２２７とを備える。

ある局面において、サーバ２１０は、例えば周知の構成を有するコンピュータによって実現される。サーバ２１０において、通信部２１１は、例えば家電機器２５０と通信するためのインターフェイスを含む。機器制御信号送信部２１２は、家電機器２５０を制御するための信号を生成し、その信号を通信部２１１を介して家電機器２５０に送信する。

機器制御部２１３は、予め設定された条件が成立した場合に、あるいは、命令を受信した場合に、家電機器２５０を制御するように構成されている。当該条件は、例えば、対話から抽出された事象が家電機器２５０の動作に固有な事象である場合等である。当該命令は、サーバ２１０と通信可能な他の情報通信端末（例えば、掃除ロボット１１１，１２１、スマートフォン１６０等）によって送信され得る。

機器状態・制御指示受信部２１４は、外部サービスから家電機器２５０を制御するための指示を受信する。例えば、機器状態・制御指示受信部２１４は、掃除ロボット１１１に発話させるための音声信号を受信する。他の局面において、機器状態・制御指示受信部２１４は、家電機器２５０によって送信された機器の状態を示す信号を受信する。

全体制御部２１５は、サーバ２１０の動作を制御する。別の局面において、全体制御部２１５は、サーバ２１０に与えられる信号に基づいて、家電機器２５０その他サーバと通信可能な家電機器の動作を制御する。

音声認識部２１６は、家電機器２５０から受信した音声信号を解析し、解析結果に基づいて、意味内容を認識する。当該音声信号は、例えば、掃除ロボット１１１や自動車１８０に対するユーザやドライバの会話を示す信号を含む。

対話制御部２１７は、家電機器２５０に対して行なわれる発話と発話者との対話を制御する。より具体的には、対話制御部２１７は、音声認識部２１６による認識の結果に基づいて、次に家電機器２５０が出力するべき発話の内容を、予め準備されたデータベースから選択し、選択した発話を実現するためのデータ（音声信号、発話の識別番号等）を家電機器２５０に送信する。選択は、たとえば音声認識部２１６による認識結果を構文解析、意味解析を行い、予め準備されたデータベースにある意味とマッチングを行い、対応する意味に対する応答文を選択する。簡易の処理としては、認識結果とデータベースの平仮名文字列をマッチングし、編集距離が少ない文字列を選択し、その文字列に対応する複数の応答から、確率的に応答文を選択しても構わない。別の局面において、家電機器２５０が出力するべき発話の内容は、対話システム２０との対話によって蓄積された対話の履歴から選択されてもよい。

音声合成部２１８は、家電機器２５０に発話させるための音声を対話制御部２１７から送られる信号に基づいて生成する。生成された信号は、通信部２１１を介して家電機器２５０に送られる。

個人同定部２１９は、家電機器２５０から受信した信号に基づいて、あるいは外部サービスから与えられるデータに基づいて、家電機器２５０のユーザがサーバ２１０において予め登録されたユーザであるか否かを判断する。判断の結果は、対話制御部２１７に送られる。対話制御部２１７は、その判断の結果に基づいて、家電機器２５０を介したユーザとの対話を制御する。

機器状態発話生成部２２０は、家電機器２５０の状態に応じて家電機器２５０に発話させるための内容を生成する。当該状態は、家電機器２５０に与えられる命令に基づいて特定される。

情報発話生成部２２１は、外部サービスから送られるデータに基づいて家電機器２５０に発話させるための内容を生成する。例えば、情報発話生成部２２１は、家電機器２５０のユーザの体調を問う発話、ユーザの体感温度を問う発話、ユーザの行動を問う発話（たとえば、テレビを見たか否か）等を含む。

外部情報取得部２２２は、情報を提供する外部サービスから情報を取得する。取得される情報は、例えば、過去のニュースである。ニュースは、例えば、スポーツ、芸能、社会一般、ビジネス、政治などのジャンルごとに取得され得る。取得されるニュースは、サーバ２１０の内部の記憶装置または外部の記憶装置のいずれであってもよい。

ローカルエピソード記憶部２２３は、ローカルエピソードを記憶している。本実施の形態において、ローカルエピソードとは、ユーザ、ユーザの家族、または友人等しか記憶しない、ユーザに身近な情報である。ローカルエピソードの一例は、例えば、「Ａさんは、Ｂ小学校に１９９０年〜１９９５年まで通っていた」というようなものである。本実施の形態において、ローカルエピソード記憶部２２３は、例えば、対話システム２０とユーザとの対話の中で出てきた事象を記憶していく。別の局面において、外部情報取得部２２２が、サーバ２１０が接続されているネットワーク上の他の情報機器にアクセスして、当該情報機器が有するスケジュール、メモ帳、メールなどに出てくる情報に基づいて、ローカルエピソードを取得し、取得したローカルエピソードをローカルエピソード記憶部２２３に格納する。本実施の形態において、ローカルエピソード記憶部２２３は、例えば、フラッシュメモリ、ハードディスクその他の不揮発性のデータ記録装置として実現される。他の局面において、ローカルエピソード記憶部２２３は、サーバ２１０に接続された外部のデータ記録装置として実現され得る。

グローバルエピソード記憶部２２４は、グローバルエピソードを記憶する。本実施の形態において、グローバルエピソードとは、一般にインターネット等で幅広く記憶される事象をいう。当該事象がユーザに記憶されているかどうかは問わない。本実施の形態において、グローバルエピソード記憶部２２４は、例えば、フラッシュメモリ、ハードディスクその他の不揮発性のデータ記録装置として実現される。他の局面において、グローバルエピソード記憶部２２４は、サーバ２１０に接続された外部のデータ記録装置として実現され得る。

ある局面において、グローバルエピソードを記憶するためには、あらかじめグローバル事象データベースを構築しておき、特定の事象に対してそれに対応する事象をデータベースから取得することで実現可能である。グローバル事象データベースは、サーバ２１０がネットワークを介してアクセスできる。

例えば、「東京オリンピック」という項目に対して以下のような知識が蓄えられ得る。
（項目１）東京オリンピック(1964) 1964年10月10日開会式、10月24日閉会式
（事象１）マラソンはアベべが金メダル。柔道重量級は猪熊功が金メダル
（事象２）日本は16個の金メダルを獲得
（事象３）東京オリンピックに合わせて東海道新幹線が開業
（事象４）10月10日はその後体育の日として祝日に制定。

（項目２）東京オリンピック（2020） 2020年7月24日〜8月9日開催
（事象１）トルコ・イスタンブール、スペイン・マドリードとの投票の末決定。
（事象２）フリーアナウンサーの滝川クリステルさんが、東京招致プレゼンテーションの中で説明した「おもてなし」という言葉が脚光を浴びた。

他の手法としては、たとえばウィキペディアなどインターネット上にある知識を検索することで、上記のような情報を動的に生成してもよい。

なお、この事象に関して出力されるものは、事象に付随した事実をベースにした文章（例「1964年の東京オリンピックでは、アベべがマラソンで金メダルを取ったんだよね」）であるが、さらにこれに付随して、東京オリンピックマーチ（音楽）や、オリンピック開会式映像が記憶されていて、出力されてもよい。

個人情報記憶部２２５は、対話システム２０を利用するユーザの個人情報を格納する。当該個人情報の一例は、氏名、住所その他の当該ユーザを特定するための情報である。本実施の形態において、個人情報は、上記で例示されたものに限られず、例えば、当該ユーザの趣味、嗜好等の情報も含み得る。

事象抽出部２２６は、当該ユーザとの対話から、当該対話に関連する一つ以上の事象を抽出し、上記抽出された一つ以上の事象に関連するエピソードを、ローカルエピソード記憶部２２３またはグローバルエピソード記憶部２２４から抽出する。

エピソード評価・学習部２２７は、予め規定された評価基準に基づいてエピソードを評価し、評価値を算出する。評価されるエピソードは、たとえば、事象抽出部２２６によって抽出されたエピソードである。エピソード評価・学習部２２７は、評価値を当該エピソードに関連付ける。関連付けられる評価値は、ローカルエピソード記憶部２２３またはグローバルエピソード記憶部２２４に格納される。さらに、エピソード評価・学習部２２７は、過去の対話出力に含まれる事象を当該エピソードに関連付けることにより、サーバ２１０に保存されているエピソードを学習する。

サーバ２１０によって実現される各機能は、一つ以上のプロセッサと、各構成を実現するための命令と、通信インターフェイスとによって実現される。ある局面において、各機能は、プログラムモジュールのようなソフトウェアとプロセッサとの組み合わせにより実現され得る。別の局面において、各機能の一部または全部は、当該機能を実現するための回路素子のようなハードウェアによって実現され得る。

［家電機器の構成］
図２を再び参照して、家電機器２５０は、通信部２５１と、全体制御部２５２と、制御指示受信部２５３と、状態取得部２５４と、個人情報取得部２５５と、機器制御部２５６と、音声取得制御部２５７と、発話制御部２５８と、状態表示部２５９と、機器情報記憶部２６０と、音声入力部２６１と、音声出力部２６２とを備える。

通信部２５１は、サーバ２１０の通信部２１１と通信可能に構成されている。全体制御部２５２は、家電機器２５０の動作を制御する。制御指示受信部２５３は、家電機器２５０のユーザによる操作の入力を受け付ける。別の局面において、制御指示受信部２５３は、サーバ２１０から送られた制御信号を受信する。

状態取得部２５４は、家電機器２５０の動作の状態を取得する。ここで状態とは、機器の内部動作状況（例えば、洗濯機がすすぎをしていること、テレビが「ｘｘｘ」の番組を受信していること等）に加え、温度センサ等機器が取得できる状態を指す。取得された情報は、全体制御部２５２によって通信部２５１からサーバ２１０に送信され得る。

個人情報取得部２５５は、家電機器２５０に対する操作あるいは入力に基づいて、家電機器２５０のユーザの個人情報を取得する。個人情報は、ユーザの声紋、顔画像、指紋その他の当該ユーザに固有の生体情報と、ユーザの名前その他の文字情報とを含み得る。ある局面において、個人情報取得部２５５は、ユーザの声紋を取得するために、マイクと音声認識処理プログラムとによって実現され得る。別の局面において、個人情報取得部２５５は、カメラと顔認識プログラムとによって実現され得る。さらに別の局面において、個人情報取得部２５５は、指紋センサによって実現され得る。

機器制御部２５６は、サーバ２１０から送られる信号に基づいて作動する全体制御部２５２の制御に従って、家電機器２５０の動作を制御する。他の局面において、機器制御部２５６は、家電機器２５０のユーザによる操作あるいは発話の内容に応答して、当該操作あるいは内容ごとに予め規定された動作を実行する。

音声取得制御部２５７は、家電機器２５０に対するユーザの発話を取得し、その発話を音声処理して音声信号を取得する。音声取得制御部２５７は、取得した信号を全体制御部２５２に送信する。全体制御部２５２は、通信部２５１を介して、家電機器２５０に対して行なわれた発話の内容をサーバ２１０に送信し得る。

発話制御部２５８は、通信部２５１によって受信された信号に基づいて、サーバ２１０の命令に応答して発話を実行する。他の局面において、発話制御部２５８は、予め準備された対話シナリオに従って、掃除ロボット１１１その他の家電機器２５０による最初の問いかけを実現してもよい。

状態表示部２５９は、全体制御部２５２の命令に基づいて家電機器２５０の動作を示す表示を実行する。当該表示は、例えばＬＥＤ（Light Emitting Diode）による表示、あるいは液晶モニタにおける表示などを含み得る。表示の内容は、家電機器２５０が通常の家電機能を実現していることを示す表示、ユーザと対話していることを示す表示、家電機器２５０がユーザへの対話を開始して、動作モードがストレスや疲労の状態を診断するモードであることを示す表示等を含み得る。

機器情報記憶部２６０は、家電機器２５０の情報を保持する。当該情報は、例えば、家電機器２５０の名称、製造番号その他の識別情報、登録されたユーザの識別情報、運転開始年月日等を含み得る。

音声入力部２６１は、家電機器２５０に対する音声の入力を受け付ける。入力された音声に応じた電気信号は、音声取得制御部２５７に入力される。音声入力部２６１は、例えば、内蔵マイク、音声入力端子として実現される。

音声出力部２６２は、発話制御部２５８から送られる信号に基づいて、音声を出力する。音声出力部２６２は、例えば、スピーカ、音声出力端子等として実現される。

［データ構造］
図３および図４を参照して、対話システム２０のデータ構造について説明する。図３および図４は、グローバルエピソード記憶部２２４におけるデータの格納の一態様を概念的に表す図である。

図３に示されるように、グローバルエピソード記憶部２２４は、項目３１０〜３５０を保持している。より具体的には、項目３１０は、グローバルエピソードのＩＤである。項目３２０は、グローバルエピソードの名前である。項目３３０は、当該グローバルエピソードが発生した年月日を表す。項目３４０は、グローバルエピソードの内容を含む。本実施の形態において、項目３２０で特定されるグローバルエピソードについて、複数の内容が項目３４０に含まれてもよい。グローバルエピソードのデータ形式は、音声、音楽、映像、およびテキストのいずれであってもよい。

項目３５０は、項目３１０のＩＤで特定されるレコードが更新された年月日を含む。
図４に示されるように、グローバルエピソード記憶部２２４は、さらに、項目４１０〜４５０を含む。項目４１０は、ユーザ名である。項目４２０は、グローバルエピソードのＩＤである。項目４３０は、当該グローバルエピソードが対話に使用されるためにサーバ２１０から出力された回数である。項目４４０は、評価値である。評価値は、予め定められた基準に基づいて、各グローバルエピソードごとに算出される。項目４５０は、最後に出力された日時である。

図４に示されるデータは、個人情報記憶部２２５に保持されているユーザ情報を用いて生成される。なお、ユーザ毎のグローバルエピソードの出力回数を保持する態様は、図４に例示される態様に限られない。例えば、各データは、関係データベースとして別個の記憶領域に保持されており、必要に応じてデータが抽出される態様が使用されてもよい。

図５は、ローカルエピソード記憶部２２３におけるデータの格納の一態様を概念的に表す図である。ローカルエピソード記憶部２２３は、項目５１０〜５８０を含む。

項目５１０は、ローカルエピソードのＩＤを示す。項目５２０は、当該ローカルエピソードが関連付けられるユーザを表す。項目５３０は、当該ローカルエピソードがサーバ２１０に入力された日時を表す。項目５４０は、当該ローカルエピソードが実際に生じた時を表す。項目５５０は、当該ローカルエピソードの具体的な内容を表す。項目５６０は、当該ローカルエピソードが出力された回数を表す。項目５７０は、当該ローカルエピソードの評価値を表す。項目５８０は、当該ローカルエピソードが直近に出力された日時を表す。

図６は、個人情報記憶部２２５におけるデータの格納の一態様を概念的に表す図である。個人情報記憶部２２５は、項目６１０〜６７０を含む。

項目６１０は、ユーザの名前を表す。項目６２０は、当該ユーザの性別を表す。項目６３０は、当該ユーザの年齢を表す。項目６４０は、当該ユーザの居所を表す。項目６５０は、当該ユーザの嗜好のうち一つ目の嗜好を表す。項目６６０は、当該ユーザの嗜好のうち二つ目の嗜好を表す。項目６６０は、当該ユーザの嗜好のうち三つ目の嗜好を表す。さらに他の嗜好が当該ユーザに関連付けられてもよい。

［制御構造］
図７を参照して、本実施の形態に係る対話システム２０の制御構造について説明する。図７は、対話システム２０が実行する処理の一部を表わすフローチャートである。

ステップＳ７１０にて、対話システム２０は、ユーザと対話する。例えば、サーバ２１０は、家電機器２５０のユーザと対話する。ユーザが家電機器２５０に対して発話すると、家電機器２５０は、通信部２５１を介して、発話を表わす信号をサーバ２１０の通信部２１１に送信する。サーバ２１０において、音声認識部２１６は、その信号に基づいて音声認識処理を実行する。

ステップＳ７２０にて、サーバ２１０は、そのユーザを識別する。より具体的には、個人同定部２１９は、音声認識処理の結果と個人情報記憶部２２５に保存されている情報とに基づいて、発話を行なったユーザを特定する。当該発話から得られる情報が個人情報記憶部２２５に保存されている場合には、個人同定部２１９は、当該ユーザが対話システム２０に登録されていると判断する。他方、その情報が個人情報記憶部２２５に保存されていない場合には、個人同定部２１９は、当該ユーザが対話システム２０に登録されていないと判断する。

ステップＳ７２１にて、サーバ２１０は、特定されたユーザについての個人情報を個人情報記憶部２２５から取得する。例えば、対話制御部２１７は、個人情報記憶部２２５から、当該ユーザの年齢、性別、経歴、嗜好その他の情報を読み出す。

ステップＳ７３０にて、サーバ２１０は、ユーザとの対話を解析する。例えば、対話制御部２１７は、音声認識部２１６の出力に基づいて、対話の内容を取得し、固有名詞、日時その他のデータであって、対話の内容を事象として特徴付け得るデータを取得する。対話制御部２１７によって取得されるデータは、事象抽出部２２６によって使用される。

ステップＳ７３１にて、サーバ２１０は、解析した対話から事象を抽出する。例えば、事象抽出部２２６は、対話制御部２１７から出力されるデータ（例えば、固有名詞、日時その他のデータ）を用いて事象を抽出する。

ステップＳ７３２にて、サーバ２１０は、ステップＳ７３０における対話解析の結果に基づいて、一般対話辞書７３３を用いて、一般的な対話のパターンを検索する。一般対話辞書７３３はサーバ２１０の不揮発領域に予め保存されている。

ステップＳ７４０にて、サーバ２１０は、取得された個人情報と、抽出された事象とに基づいて、エピソードを検索する。例えば、エピソード評価・学習部２２７は、対話制御部２１７によって取得された個人情報と、事象抽出部２２６によって抽出された事象とを用いて、グローバルエピソード記憶部２２４から、当該個人情報および事象に関連するグローバルエピソードを検索する。なお、検索結果が得られない場合には、事象抽出部２２６は、一般対話辞書７３３からエピソードを検索し得る。

ステップＳ７５０にて、サーバ２１０は、検索結果を評価する。例えば、エピソード評価・学習部２２７は、検索によって得られた１つ以上のグローバルエピソードの各々について、予め定められた評価基準に従って、当該グローバルエピソードの評価値を算出する。

ステップＳ７６０にて、サーバ２１０は、対話データを生成する。例えば、対話制御部２１７は、音声認識部２１６による音声認識の結果を用いて得られたグローバルエピソードと、一般的な対話のために予め準備された対話テンプレートとを用いて、ユーザの発話に応答するための対話データを生成する。

ステップＳ７７０にて、サーバ２１０は、対話を出力する。より具体的には、対話制御部２１７は、通信部２１１を介して、ステップ７６０で生成された対話データを家電機器２５０に送信する。家電機器２５０が通信部２５１を介してその対話データを受信すると、発話制御部２５８は、音声出力部２６２を介して、当該対話データに基づく音声を出力する。このとき、状態表示部２５９は、出力される音声に対するユーザ評価の入力を促す画面を表示し得る。あるいは、音声取得制御部２５７は、音声入力部２６１からの音声信号の入力を受け付け可能な状態となる。

ステップＳ７８０にて、サーバ２１０は、出力された音声に対するユーザ評価の入力を受け付ける。例えば、家電機器２５０のユーザが、状態表示部２５９に表示された画面において、出力された音声の内容に評価を与えるタッチ操作を行なうと、その評価を表わす信号は、通信部２５１からサーバ２１０に送られる。当該評価は、例えば、５段階評価、あるいは、ＳＮＳにおいて用いられているように評価を示すメッセージのアイコンが押下されたか否かに基づいて行われる。

別の局面において、対話システム２０は、対話内容の評価を音声で受け付けてもよい。評価のためのフレーズの一例および評価値は、例えば、以下のとおりである。
（フレーズ）（評価値）
すごい１０
いいね１０
わかった７
うん５
はいはい５
だめだよ０．１
未登録１
応答なし１
各フレーズに対応づけられる評価値は、対話システムの管理者によって変更され得る。

ステップＳ７９０にて、サーバ２１０は、グローバルエピソード記憶部２２４において、ステップＳ７８０にて入力されたユーザ評価を当該グローバルエピソードに関連付けることにより、当該グローバルエピソードの関連情報を更新する。

なお、ステップＳ７５０における検索結果の評価は、ステップＳ７６０以降に行なわれてもよい。

図８を参照して、対話システム２０による出力について説明する。図８は、対話の解析結果とグローバルエピソード記憶部２２４に保存されているデータの一部を表わす図である。対話システム２０は、事象抽出部２２６による抽出の結果に基づいて、テーブル８００とテーブル８２０とをメモリのワーク領域に生成する。以下の例では、対話システム２０のユーザ（一徹、６０歳）が「今日テレビに歌手の山田Ａ子が出ていた」と発話した場合における対話システム２０の検索結果について説明する。

テーブル８００は、項目８１０，８１１を含む。項目８１０は、抽出された事象を表わす。項目８１１は、当該事象のスコアを表わす。本実施の形態において、スコアは、その対象物（抽出された事象）がどの程度の特長を持つかを示す指標である。ここではスコアの数字が高いほど、当該対象物が特長を示す単語であることを意味する。特長を計算する手法はいろいろあるが、代表的にはＴＦ‐ＴＤＦという方式が用いられる。この方式では、予め単語ごとに数値を割り振ることが可能である。サーバ２１０は、単語辞書とスコアとをペアにして記憶しておくことが望ましい。さらに、時期の事象は、例えば、その日は４、その週は３、その月は２、その季節は１というように、予め設定された値が当該事象に割り振られる。事象のスコアは、設定に応じて変更可能である。

図８に示される例では、ある局面において、対話システム２０は、ユーザからの発話に応答して４つの事象（事象（１）〜事象（４））を抽出している。

テーブル８２０は、項目８３０〜８３４を含む。項目８３０は、グローバルエピソードの識別番号を表わす。項目８３１は、当該グローバルエピソードに含まれる事象を表わす。項目８３２は、当該事象に関連付けられる日時情報を表わす。当該日時情報は、例えば、当該事象が最初に生じた日、当該事象が意味を有する日、当該事象が関係する期間等を含み得る。項目８３３は、当該事象に関連付けられる１つ以上の具体的なエピソードを表わす。項目８３４は、当該グローバルエピソードのデータレコードが最後に更新された日時を表わす。

図９を参照して、グローバルエピソードの評価について説明する。図９は、各グローバルエピソードの各スコアを表わす図である。各グローバルエピソードの各々について、事象スコア、年代スコアおよび直近時期ペナルティに基づいて、出力判定スコアが算出される。直近時期ペナルティは、当該エピソードの優先度を下げるために使用される。

事象スコアは、図８の項目８１１で示される値に対応する。年代スコアは、例えば、以下のような基準で導出される。
Ｙ＝ユーザ年齢−（現在の年−対象中心年代）
［対象年代ありの場合］
Ｙ＜０のときＳ＝０、Ｙ＝０のときＳ＝１、５＜ＹのときＳ＝２、１２＜Ｙ＜２３のときＳ＝３（重複適用の場合には、右側にある式が優先される）
［対象年代なし］
Ｓ＝１（例えば、時の記念日（６月１０日））。

また、直近時期ペナルティ（Ｐ）は、そのユーザにその事象を前回話してからの期間（Ｔ（日））との関係に基づき、例えば、以下のように規定される。
最初に事象が発話される場合（初期値）、Ｐ＝０、Ｔ≦９０の場合、Ｐ＝−２、Ｔ≦３０の場合、Ｐ＝−４、Ｔ≦１４の場合、Ｐ＝−６、Ｔ≦７の場合、Ｐ＝−８。

この関係は、ユーザが直近に聞いた発話を再度聞いても懐かしさの程度は、他の発話よりも小さくなり得る点を考慮して規定される。

なお、本実施の形態において、一般辞書は、対話用の知識ベースを含む。一般辞書の構成は当業者が容易に理解できるので、詳細な説明は繰り返さない。一般辞書のスコアは、ある局面において、常に０と設定してもよい。一般辞書の検索結果についても、１つ以上の検索結果が選定されて、直近時期ペナルティが設定されてもよい。なお、グローバルエピソード記憶部２２４の検索の結果、対応する検索結果がない場合には、一般辞書から生成した対話文が使われる。

［評価］
次に、対話システム２０の発話の評価について説明する。ユーザの発話に応答して対話システム２０が発話した後に、ユーザがさらに発話する場合がある。この発話に基づいて、サーバ２１０は、対話システム２０とユーザとの発話を評価する。

例えば、対話システム２０が「山田Ａ子は、１９７４年に映画「東京のダンサー」に出演したんだよね。なつかしいね。」と発話する。この発話に応答して、ユーザが「なつかしいね」と応答する。

対話システム２０のサーバ２１０は、ユーザの応答（なつかしいね）を認識すると、予め定められた評価基準に基づいて、その応答を評価する。たとえば、サーバ２１０は、ユーザの応答（なつかしいね）に対してポジティブ評価を与える。

なお、ユーザの発話（音声）やテキスト（文字）を評価する方法は各種存在する。たとえば、サーバ２１０は、単語単位に、プラス（ポジティブ）、マイナス（ネガティブ）を予め辞書として保有し、文章全体を単語の評価値の合計として評価し得る。あるいは、サーバ２１０は、発話やテキスト全体にポジティブまたはネガティブの評価値を付与し、学習で評価関数を学習してもよい。

サーバ２１０は、評価の結果に基づいて、エピソード評価・学習部２２７として、グローバルエピソード記憶部２２４の内容を更新する。

具体的には、グローバルエピソード記憶部２２４の「評価指標」に加点（ポジティブ）、減点（ネガティブ）することを想定する。上記の出力判定スコアでは、この評価指標の数値は考慮されていないが、エピソード評価・学習部２２７は、評価指標を「掛ける」あるいは「足す」などで最終的な出力判定スコアを算出することにより、ユーザのフィードバックを受けて、ユーザの好みの対話出力が選択されやすくすることが可能となる。

なお、ローカルエピソード記憶部２２３における学習も同様である。エピソード評価・学習部２２７は、ユーザから入力された発話に基づき、あるいは外部情報取得部２２２によって取得された情報に基づき、新たなエピソードをローカルエピソード記憶部２２３またはグローバルエピソード記憶部２２４に保存してもよい。

例えば、ユーザが「小学校はＡＢＣ小学校だったんだよ」と発話すると、対話システム２０は、「ＡＢＣ小学校に通っていたんだね」と応答する。ユーザが応答内容を認める回答（例えば、「そうだよ」とか「うん」等）を対話システム２０に返すと、サーバ２１０は、エピソード評価・学習部２２７として、ローカルエピソード「ＡＢＣ小学校に通っていた」をローカルエピソード記憶部２２３に記憶する。

次に、図１０を参照して、別の局面について説明する。別の局面に従う対話システムは、グローバルエピソードに加えてローカルエピソードも検索の対象とする点で、対話システム２０と異なる。

図１０は、別の局面に従う対話システムが実行する処理の一部を表わすフローチャートである。別の局面に従う対話システムは、ステップＳ７４０の代わりに、ステップＳ１０４０を実行する点で、対話システム２０の制御構造と異なる。なお、当該別の局面に従う対話システムは、たとえば、図２に示される対話システム２０の構成と同様の構成を有する。そこで、適宜、対話システム２０の構成を援用して、別の局面に従う対話システムを説明する。

ステップＳ１０４０にて、別の局面に従う対話システムを構成するサーバ２１０は、取得された個人情報と、抽出された事象とに基づいて、エピソードを検索する。例えば、エピソード評価・学習部２２７は、対話制御部２１７によって取得された個人情報と、事象抽出部２２６によって抽出された事象とを用いて、グローバルエピソード記憶部２２４およびローカルエピソード記憶部２２３から、当該個人情報および事象に関連するグローバルエピソードおよびローカルエピソードをそれぞれ検索する。なお、グローバルエピソードおよびローカルエピソードのいずれの検索結果も得られない場合には、事象抽出部２２６は、一般対話辞書７３３からエピソードを検索し得る。

ステップＳ１０５０にて、サーバ２１０は、検索結果を評価する。例えば、エピソード評価・学習部２２７は、検索によって得られた１つ以上のグローバルエピソードおよびローカルエピソードの各々について、予め定められた評価基準に従って、当該グローバルエピソードおよびローカルエピソードの評価値をそれぞれ算出する。

図１１および図１２を参照して、当該局面に従う対話システムの出力について説明する。図１１は、他の局面に従う対話システムによって生成されるデータ構造を概念的に表す図である。当該対話システムは、テーブル１１００を生成する。テーブル１１００は、項目１１１０〜１１８０を含む。項目１１１０は、ローカルエピソードを識別するＩＤを示す。項目１１２０は、ユーザを表す。項目１１３０は、エピソードが入力された日時を示す。項目１１４０は、当該エピソードが該当する時期を表す。項目１１５０は、エピソードの内容を表す。項目１１６０は、当該エピソードが出力（対話に使用）された回数を表す。項目１１７０は、評価指標を表す。項目１１８０は、最後に出力された日時を表す。

図１２は、他の局面に従う対話システムによって生成される各エピソードごとのスコアを表す図である。当該対話システムは、テーブル１２００を生成する。テーブル１２００は、グローバルエピソードおよびローカルエピソードの各々についてのレコード１２１０〜１２５０を含む。例えば、レコード１２１０〜１２３０は、グローバルエピソードについての各スコアを含む。レコード１２４０，１２５０は、ローカルエピソードについての各スコアを含む。なお、グローバルエピソードおよびローカルエピソードの各々のスコアのデータ構造は、図１２に示される態様に限られない。

図１３を参照して、事象の抽出例について説明する。図１３は、システム発話およびユーザ発話から事象が抽出される態様を概念的に表す図である。

システム発話ベース１３１０の場合、まず、対話システムが「今日テレビに歌手の山田Ａ子出るよ」と発話する。その発話に応答して、ユーザは「それは楽しみだね」と発話する。対話システムは、ユーザによる発話が肯定的であると判断し、対話システム自らが発話した内容から事象を抽出する。抽出される事象１３３０は、今日（２０１５年６月１０日）、テレビ、歌手、および山田Ａ子を含む。

一方、ユーザ発話ベース１３２０の場合、ユーザが対話システムに対して「今日テレビに歌手の山田Ａ子出てた」と発話する。対話システムは、ユーザによる発話を認識すると、その発話から、事象として、今日（２０１５年６月１０日）、テレビ、歌手、および山田Ａ子をそれぞれ抽出する。抽出される事象は、システム発話ベース１３１０の場合に抽出される事象と同じである。

図１４を参照して、対話システムを構成する端末とサーバとの同期について説明する。図１４は、端末とサーバとが実行する処理の流れを表すシーケンスチャートである。端末は、一例として、音声認識機能と通信機能とを備えるエアコン１４００である。エアコンとサーバ２１０とは通信可能に接続されている。

ある局面において、ステップＳ１４１０にて、ユーザ（一徹）がエアコン１４００に対して、電源スイッチをＯＮにする。ステップＳ１４２０にて、エアコン１４００は、サーバ２１０に対して、エアコンの機器ＩＤを送信する。Ｓ１４２２にて、エアコン１４００とサーバ２１０とは、認証処理を実行する。サーバ２１０は、対話システムを構成する端末としてエアコン１４００が登録されていると判断すると、エアコン１４００に対して認証が成功した旨を通知する。エアコン１４００は、その通知を受信すると、初期情報をサーバ２１０に送信する。初期情報は、例えば、室外温度（摂氏３５度）、および室内温度（摂氏３２度）を含む。さらに、サーバ２１０とエアコン１４００とは、音声対話のセッションを始動する。

Ｓ１４３０にて、ユーザは、エアコン１４００に対して、例えば「今日は暑いね。」と発話する。

ステップＳ１４３２にて、エアコン１４００は、その発話を認識すると、同様に「今日は暑いね」との内容を含む信号を、サーバ２１０に送信する。信号は、音声信号、テキスト情報のいずれであってもよい。

Ｓ１４４０にて、サーバ２１０は、発話を含む信号をエアコン１４００から受信したことに応答して、個人同定を行ない、エピソードを検索し、評価を行ない、対話を生成し、ユーザの発話に対応する動作の提案を生成する。例えば、家電機器２５０がエアコンの場合は、動作の提案は、スイッチのオンまたはオフ、設定温度を上げることまたは下げること、風量の設定等を含む。家電機器２５０がお掃除ロボットの場合は、「掃除する？」等の問いかけを含む。

Ｓ１４５０にて、サーバ２１０は、ユーザの発話に対して応答するための信号を、エアコン１４００に送信する。当該信号は、例えば、「そうだね、２年前の６月も暑かったよね。部屋の中が３２度だからエアコンつけるね。」と発話するための音声信号またはテキスト情報を含む。

Ｓ１４５２にて、エアコン１４００は、その信号をサーバ２１０から受信すると、スピーカ（図示しない）から、「そうだね、２年前の６月も暑かったよね。部屋の中が３２度だからエアコンつけるね。」と発話する。

Ｓ１４６０にて、ユーザが「有り難う」と発話する。ステップＳ１４６２にて、エアコン１４００は、その発話を認識すると、その発話を含む信号をサーバ２１０に送信する。サーバ２１０は、その信号を受信すると、音声認識処理と意味解析処理を実行し、エアコン１４００の動作の制御に関し、ユーザの発話が肯定的であると判断する。

Ｓ１４７０にて、サーバ２１０は、その判断の結果に基づいて、冷房をＯＮにし、設定温度を予め定められた温度（例えば、摂氏２６度）にする旨の制御信号をエアコン１４００に送信する。

図１５を参照して、対話システムにおけるイベントの学習について説明する。図１５は、対話システムがローカルエピソードに関してイベントを学習するために実行する処理の一部を表すフローチャートである。

ステップＳ１５１０にて、対話システムは、対話の入力を受け付ける。例えば、ユーザ（理恵）が「明日の運動会楽しみ。」と発話すると、その発話を受け付けた家電機器２５０は、その発話を含む信号をサーバ２１０に送信する。サーバ２１０は、その発話について音声認識処理する。

ステップＳ１５２０にて、サーバ２１０は、対話解析処理を実行する。例えば、サーバ２１０は、単語として、「明日」、「運動会」および「楽しみ」を抽出する。

ステップＳ１５３０にて、サーバ２１０は、対話解析処理の結果に基づいて、イベントを抽出できたか否かを判断する。例えば、サーバ２１０は、抽出された各単語が予め準備された出来事に関するものであるか否かに基づいて、イベントを抽出できたか否かを判断する。サーバ２１０はイベントを抽出できたと判断すると（ステップＳ１５３０にてＹＥＳ）、制御をステップＳ１５４０に切り換える。そうでない場合には（ステップＳ１５４０にてＮＯ）、サーバ２１０は、処理を終了する。

ステップＳ１５４０にて、サーバ２１０は、抽出されたイベントの内容を解析する。具体的には、サーバ２１０は、当該イベントの名称、時期、場所等を取得する。

ステップＳ１５５０にて、サーバ２１０は、イベントの内容が適切であるか否かを判断する。

ステップＳ１５６０にて、サーバ２１０は、重複があるか否かを判断する。
ステップＳ１５７０にて、サーバ２１０は、イベントがＯＫであるか否かを確認する。

ステップＳ１５８０にて、サーバ２１０は、イベントを登録する。
（まとめ）
本開示に係る技術思想は、ある局面において、対話システムとして、周知の構成を有する汎用コンピュータにより実現される。このコンピュータは、メモリと、プロセッサと、出力インターフェイスとを備える。メモリは、エピソード記憶モジュールとしてエピソードを格納している。メモリは、さらに、個人情報記憶モジュールとして、ユーザの情報を記憶している。プロセッサは、上記対話システムと対話しているユーザを同定する。プロセッサは、当該ユーザとの対話から、当該対話に関連する一つ以上の事象を抽出し、上記抽出された一つ以上の事象に関連するエピソードを上記エピソード記憶部から抽出する。プロセッサは、生成モジュールとして、上記抽出されたエピソードと、上記同定されたユーザの個人情報とに基づいて、上記同定されたユーザに応じた対話内容を生成する。出力インターフェイスは、上記生成された対話内容を出力する。

別の局面において、メモリは、グローバルな事象と、ローカルな事象とを記憶している。プロセッサは、上記抽出された一つ以上の事象に関連するグローバルなエピソードとローカルなエピソードとを抽出する。プロセッサは、エピソード評価モジュールとして、上記抽出されたグローバルなエピソードおよびローカルなエピソードの評価を行なう。プロセッサは、上記評価の結果に基づいて、上記グローバルなエピソードおよびローカルなエピソードの少なくともいずれかのエピソードと、上記同定されたユーザの個人情報とに基づいて、上記ユーザに応じた対話内容を生成する。

別の局面において、プロセッサは、評価取得モジュールとして、出力される対話内容に対するユーザの評価の入力を受け付ける。メモリは、上記評価に基づいて、上記エピソードの学習として、当該エピソードを保存するように構成されている。

好ましくは、上記エピソードは、音声、音楽、映像およびテキストの少なくともいずれかを含む。

別の局面において、対話システムは、通信機能を備える端末を含む。プロセッサは、上記端末の種類にさらに基づいて、上記ユーザに応じた対話内容を生成するように構成されている。端末の種類とは、例えば、家電機器の種類に相当する。家電機器は、例えば、お掃除ロボット、エアコン、照明、調理器、テレビ、冷蔵庫その他の機器を含み得る。

別の局面において、上記端末は、命令に応じた動作を行なう機器を含む。当該機器は、例えば、上述の家電機器を含む。プロセッサは、上記機器の動作を制御する命令を有する対話内容を生成する。当該命令は、動作命令、停止命令、設定温度アップ、設定温度ダウン、照明のオンまたはオフ、照明を明るくすること又は暗くすること、調理器のオンまたはオフ、テレビのオンまたはオフを含む。

別の局面において、上記のいずれかの対話システムに接続可能な端末が実現される。当該端末は、上記端末を識別する端末情報を格納するためのメモリと、上記端末情報を上記対話システムに送信するための送信回路と、上記対話システムから出力される対話内容に応じて動作を制御するためのプロセッサとを備える。当該端末は、例えば、お掃除ロボット、エアコン、照明、調理器、テレビ、冷蔵庫その他の家電機器を含む。

別の局面において、コンピュータが対話を制御する方法が提供される。この方法は、コンピュータのプロセッサによって実現される。より具体的には、この方法は、不揮発記憶装置からエピソードを読み出して準備するステップと、不揮発記憶装置からユーザの情報を読み出してワーク領域にロードするステップと、上記対話システムと対話しているユーザを同定するステップと、当該ユーザとの対話から、当該対話に関連する一つ以上の事象を抽出し、上記抽出された一つ以上の事象に関連するエピソードを抽出するステップと、上記抽出されたエピソードと、上記同定されたユーザの個人情報とに基づいて、上記同定されたユーザに応じた対話内容を生成するステップと、上記生成された対話内容を出力するステップとを備える。

さらに別の局面において、コンピュータに対話を制御させるためのプログラムが提供される。このプログラムは、上記コンピュータに、エピソードを準備するステップと、ユーザの情報を準備するステップと、上記対話システムと対話しているユーザを同定するステップと、当該ユーザとの対話から、当該対話に関連する一つ以上の事象を抽出し、上記抽出された一つ以上の事象に関連するエピソードを抽出するステップと、上記抽出されたエピソードと、上記同定されたユーザの個人情報とに基づいて、上記同定されたユーザに応じた対話内容を生成するステップと、上記生成された対話内容を出力するステップとを実行させる。

以上のようにして、本実施の形態によれば、ユーザに合わせた対話が実現でき、疲労回復、うつ症状の改善または親しみの向上等の効果が実現できる。

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

２０対話システム、３０インターネット、１１０，１２０家、１１１，１２１掃除ロボット、１１２，１２２ルータ、１１３，１２３冷蔵庫、１１４，１２４照明、１１５，１２５テレビ、１１６，１２６，１４００エアコン、１３０医療機関サーバ、１４０自治体サーバ、１５０事業者サーバ、１６０，１７０スマートフォン、１８０自動車、２１０サーバ、２１１，２５１通信部、２１２機器制御信号送信部、２１３，２５６機器制御部、２１４，２５３制御指示受信部、２１５，２５２全体制御部、２１６音声認識部、２１７対話制御部、２１８音声合成部、２１９個人同定部、２２０機器状態発話生成部、２２１情報発話生成部、２２２外部情報取得部、２２３ローカルエピソード記憶部、２２４グローバルエピソード記憶部、２２５個人情報記憶部、２２６事象抽出部、２２７学習部、２５０家電機器、２５４状態取得部、２５５個人情報取得部、２５７音声取得制御部、２５８発話制御部、２５９状態表示部、２６０機器情報記憶部、２６１音声入力部、２６２音声出力部、７３３一般対話辞書、８００，８２０，１１００，１２００テーブル、１２１０，１２３０，１２４０，１２５０レコード、１３１０システム発話ベース、１３２０ユーザ発話ベース。

Claims

対話システムであって、
ユーザに関連するローカルエピソードを含むエピソードを記憶するためのエピソード記憶部と、
ユーザの情報を記憶するための個人情報記憶部と、
前記対話システムと対話しているユーザを同定するための個人同定部と、
当該ユーザとの対話から、当該対話に関連する一つ以上の事象を抽出し、前記同定されたユーザに関連するローカルエピソードの中から、前記抽出された一つ以上の事象に関連するエピソードを抽出するための抽出部と、
前記抽出されたエピソードと、前記同定されたユーザの個人情報とに基づいて、前記同定されたユーザに応じた対話内容を生成するための生成部と、
前記生成された対話内容を出力するための出力部とを備える、対話システム。
前記エピソード記憶部は、グローバルエピソードをさらに記憶するように構成され、
前記抽出部は、前記抽出された一つ以上の事象に関連する前記グローバルエピソードをさらに抽出する、請求項１に記載の対話システム。
前記対話システムは、前記抽出されたグローバルエピソードおよびローカルエピソードの評価を行なうためのエピソード評価部をさらに備え、
前記生成部は、前記評価の結果に基づいて、前記グローバルエピソードおよびローカルエピソードの少なくともいずれかのエピソードと、前記同定されたユーザの個人情報とに基づいて、前記ユーザに応じた対話内容を生成する、請求項２に記載の対話システム。
前記出力部により出力される対話内容に対するユーザの評価の入力を受け付けるための評価取得部をさらに備え、
前記エピソード記憶部は、前記評価に基づいて、前記エピソードの学習を行なうように構成されている、請求項１〜３のいずれかに記載の対話システム。
前記エピソードは、音声、音楽、映像およびテキストの少なくともいずれかを含む、請
求項１〜４のいずれかに記載の対話システム。
前記出力部は、通信機能を備える端末を含み、
前記生成部は、前記端末の種類にさらに基づいて、前記ユーザに応じた対話内容を生成するように構成されている、請求項１〜５のいずれかに記載の対話システム。
前記端末は、命令に応じた動作を行なう機器を含み、
前記生成部は、前記機器の動作を制御する命令を有する対話内容を生成する、請求項６に記載の対話システム。
コンピュータが対話を制御する方法であって、
ユーザに関連するローカルエピソードを含むエピソードを準備するステップと、
ユーザの情報を準備するステップと、
対話システムと対話しているユーザを同定するステップと、
当該ユーザとの対話から、当該対話に関連する一つ以上の事象を抽出し、前記同定されたユーザに関連するローカルエピソードの中から、前記抽出された一つ以上の事象に関連するエピソードを抽出するステップと、
前記抽出されたエピソードと、前記同定されたユーザの個人情報とに基づいて、前記同定されたユーザに応じた対話内容を生成するステップと、
前記生成された対話内容を出力するステップとを備える、方法。
コンピュータに対話を制御させるためのプログラムであって、
前記プログラムは、前記コンピュータに、
ユーザに関連するローカルエピソードを含むエピソードを準備するステップと、
ユーザの情報を準備するステップと、
対話システムと対話しているユーザを同定するステップと、
当該ユーザとの対話から、当該対話に関連する一つ以上の事象を抽出し、前記同定されたユーザに関連するローカルエピソードの中から、前記抽出された一つ以上の事象に関連するエピソードを抽出するステップと、
前記抽出されたエピソードと、前記同定されたユーザの個人情報とに基づいて、前記同定されたユーザに応じた対話内容を生成するステップと、
前記生成された対話内容を出力するステップとを実行させる、プログラム。