JP2020154378A

JP2020154378A - 自己との対話装置、チャットボット、およびロボット

Info

Publication number: JP2020154378A
Application number: JP2019049563A
Authority: JP
Inventors: 繁明仁科; Shigeaki Nishina; 史興浅野; Fumioki Asano; 智幸佐畑; Tomoyuki Satake
Original assignee: Honda Motor Co Ltd
Current assignee: Honda Motor Co Ltd
Priority date: 2019-03-18
Filing date: 2019-03-18
Publication date: 2020-09-24

Abstract

【課題】利用者の自分の固有の感情や心的状態や思考の整理や見直し、利用者独自の新しい発想の効率的発見と創造を、利用者が一人で行うことを可能にする自己との対話装置、チャットボット、およびロボットを提供することを目的とする。【解決手段】自己との対話装置は、概念を定義するための階層的な辞書である概念辞書を格納する概念辞書データベースと、象徴関係や自由連想関係の一覧表である連想対応表を格納する連想対応表データベースと、利用者の対話履歴を取得する対話取得部と、対話履歴を格納する対話履歴データベースと、対話取得部が取得した対話履歴の発言情報に基づいて、利用者との対話を行う対話手段と、を備える。【選択図】図１

Description

本発明は、自己との対話装置、チャットボット、およびロボットに関する。

近年、音声による動作指示を受け付けて動作する装置が開発されている。また、音声によって、コンピュータ（スマートフォン、スマートスピーカ等）との対話を行う装置の開発が進められている。このような装置では、利用者の発話が自然言語であることが望まれている。

例えば、特許文献１に記載の技術は、対話の状況を判断して入力モードを切り替え、入力文を形態素分析し、形態素分析の結果を構文分析し、構文上の格を示すラベルを付与した単語のリストを生成する。そして、特許文献１に記載の技術は、システムが出力した質問文に対する回答文が入力されると判断される場合、形態素分析の結果から品詞が名詞である単語を切り出して回答として抽出する。そして、特許文献１に記載の技術は、入力文を判定して、構文表現データを知識としてデータベースに格納する登録処理、すでにデータベースに格納された知識を検索する検索処理、構文的に不完全な入力文の不足格を利用者に入力を促す聞き返し処理、予め設定された機能を起動させる機能実行処理から選ばれる少なくとも１つの入力文処理を選択する。そして、特許文献１に記載の技術は、入力文判定に従って入力文の処理を行い、入力文処理手段の結果に応じて、出力文を生成し出力する。

特開２００１−２２７６３号公報

しかしながら、従来技術では、利用者が質問した場合に提示される回答は、標準的または模範的な回答であった。このため、従来技術における装置と利用者との対話では、利用者の自分の固有の感情や心的状態や思考の整理や見直し、利用者独自の新しい発想の効率的発見と創造を、利用者が一人で行うことができなかった。

本発明は、上記の問題点に鑑みてなされたものであって、利用者の自分の固有の感情や心的状態や思考の整理や見直し、利用者独自の新しい発想の効率的発見と創造を、利用者が一人で行うことを可能にする自己との対話装置、チャットボット、およびロボットを提供することを目的とする。

（１）上記目的を達成するため、本発明の一態様に係る自己との対話装置（１）は、利用者と対話をする自己との対話装置において、概念を定義するための階層的な辞書である概念辞書を格納する概念辞書データベース（概念辞書ＤＢ２３）と、象徴関係や自由連想関係の一覧表である連想対応表を格納する連想対応表データベース（連想対応表ＤＢ２４）と、前記利用者の対話履歴を取得する対話取得部（１６）と、前記対話履歴を格納する対話履歴データベース（対話履歴ＤＢ２２）と、前記対話取得部が取得した前記対話履歴の発言情報に基づいて、前記利用者との対話を行う対話手段（対話制御部２０１、対話文生成部２０２、スピーカ３０２、自分自身の３Ｄ生成部４３）と、を備える。

（２）また、本発明の一態様に係る自己との対話装置において、前記対話取得部は、前記対話装置との過去の対話に基づいて発言履歴を記憶するようにしてもよい。

（３）また、本発明の一態様に係る自己との対話装置において、前記対話取得部は、前記利用者による過去の発言または著述の電子データに基づいて、過去の前記利用者の発言履歴を取得するようにしてもよい。

（４）また、本発明の一態様に係る自己との対話装置において、前記対話手段は、前記利用者の発言履歴から判断して矛盾していることを発話した場合に、その旨を知らせるようにしてもよい。

（５）また、本発明の一態様に係る自己との対話装置において、前記対話手段は、思考を発展させる可能性のある発言を前記対話履歴から検索し、または結論を導く可能性のある発言を前記対話履歴から検索して応答するようにしてもよい。

（６）また、本発明の一態様に係る自己との対話装置において、前記対話手段は、コンプレックスに触れる内容を前記連想対応表から検索して応答するようにしてもよい。

（７）また、本発明の一態様に係る自己との対話装置において、前記対話取得部は、前記利用者の発言履歴に基づいて前記概念辞書データベースを更新するようにしてもよい。

（８）また、本発明の一態様に係る自己との対話装置において、前記対話手段は、対話が停滞した際に、前記概念辞書を用いて抽象化された概念を対話文化して応答するようにしてもよい。

（９）また、本発明の一態様に係る自己との対話装置において、前記対話手段は、対話が停滞した際に、前記概念辞書を用いて具体化された概念を対話文化して応答するようにしてもよい。

（１０）上記目的を達成するため、本発明の一態様に係るチャットボット（１００４）は、上記（１）〜（９）のいずれか１つの自己との対話装置を備える。

（１１）上記目的を達成するため、本発明の一態様に係るロボット（１００５）は、上記（１）〜（９）のいずれか１つの自己との対話装置を備える。

上述した（１）または（１０）あるいは（１１）によれば、利用者の自分の思考の整理や見直し、新しい発想の効率的発見と創造を、利用者が一人で行うことを可能にする。

また、上述した（２）によれば、過去の対話装置と利用者の対話に基づいて、対話を行うことができる。
また、上述した（３）によれば、利用者が利用した電子メール、ＳＮＳ、ブログ等の利用者の過去の発言または著述に基づいて、対話を行うことができる。

また、上述した（４）によれば、過去の発話内容と矛盾する場合にそれを指摘することで、利用者が対話の糸口をみつけたり、利用者に考えるきっかけを提供することができる。
また、上述した（５）によれば、利用者の思考を手助けすることができる。

また、上述した（６）によれば、利用者に心的状態を改善させる糸口を探るきっかけを提供することができる。
また、上述した（７）によれば、過去に結論に至った結果を次回の対話に活用することができる。

また、上述した（８）または（９）によれば、利用者の思考を手助けすることができ、対話を継続することができる。

実施形態に係る自己との対話装置の構成例を示すブロック図である。実施形態に係る対話履歴ＤＢ２２が格納する対話履歴の例を示す図である。ＳＮＳでの対話履歴の例を示す図である。ブログでの対話履歴の例を示す図である。電子メールでの対話履歴の例を示す図である。実施形態に係る概念辞書ＤＢ２３が格納する概念辞書の例を示す図である。実施形態に係る連想対応表ＤＢ２４が格納する連想対応表における象徴関係対応表の例を示す図である。実施形態に係る利用者が自己の客観視等を行う場合に、自己との対話装置が利用者との対話を行う際の処理例を示す図である。実施形態に係るブレーンストーミングを目的とする対話例を示す図である。実施形態に係る心的状態変化を目的とする対話例を示す図である。

まず、本実施形態の自己との対話装置の概要を説明する。
自己との対話装置は、利用者の発話やＳＮＳ、ブログ、電子メール等の発言履歴等を学習して、擬似的に利用者のコピーを生成する。自己との対話装置は、この自分のコピーと対話することで、自分の思考の整理や見直し、新しい発想の効率的発見と創造を、利用者が一人で行うことができる装置を提供する。また、自己との対話装置は、利用者が一人でブレーンストーミングを行うため、利用者が自分本意に他の考えを取捨することができ、より効率的な発想支援を行うことができる装置を提供する。また、自己との対話装置は、カウンセリング頻度とカウンセリング時間の制約を解消することができる装置を提供する。また、自己との対話装置は、自分自身のいわば複製と対話することにより、カウンセラーとユーザーの相性による効果のバラツキという問題を解消することができる装置を提供する。
このように、本実施形態の自己との対話装置は、スマートスピーカ等のように一般的なシナリオに基づいた対話ではなく、利用者は自己との対話を行える装置を提供する。

以下、本発明の実施の形態について図面を参照しながら説明する。
図１は、本実施形態に係る自己との対話装置１の構成例を示すブロック図である。図１に示すように、自己との対話装置１は、マイクロフォン１０１、ＡＤ変換部１０２、ＦＦＴ１０３、特徴量抽出部１０４、音声認識部１０５、撮影部１１、表情認識部１２、感情推定部１３、言語モデルＤＢ１４、音響モデルＤＢ１５、対話取得部１６、操作部１７、テキスト取得部１８、画像認識部１９、対話制御部２０１（対話手段）、対話文生成部２０２（対話手段）、標準対話コーパスＤＢ２１、対話履歴ＤＢ２２、概念辞書ＤＢ２３、連想対応表ＤＢ２４、音声合成部３０１、スピーカ３０２（対話手段）、振る舞い選択部４１、自分自身の画像・動画ＤＢ４２、自分自身の３Ｄ生成部４３（対話手段）、および表示部４４（対話手段）を備える。

なお、自己との対話装置１は、例えばパーソナルコンピュータ（１００１）、タブレット端末（１００２）、スマートフォン（１００３）、チャットボット（Ｃｈａｔｂｏｔ）（１００４）、ロボット（１００５）、スマートスピーカ（１００６）等のいずれかであってもよい。なお、本実施形態におけるパーソナルコンピュータ、タブレット端末、スマートフォン、チャットボット、ロボット、スマートスピーカ等は、自己との対話装置１の機能部を備える。そして、本実施形態におけるパーソナルコンピュータ、タブレット端末、スマートフォン、チャットボット、ロボット、スマートスピーカ等は、一般的なシナリオに沿った回答を行うのではなく、利用者が自己との対話を行う環境を提供する装置である。

マイクロフォン１０１は、音源が発した音響信号を収音し、収音した音響信号をＡＤ変換部１０２に出力する。なお、マイクロフォン１０１は、マイクロフォンアレイであってもよい。この場合、マイクロフォン１０１は、Ｍ（Ｍは２以上の整数）個のマイクロフォンから構成され、音源が発した音響信号を収音し、収音したＭチャネルの音響信号をＡＤ変換部１０２に出力する。

ＡＤ変換部１０２は、マイクロフォン１０１が出力する音響信号をアナログ信号からデジタル信号に変換する。ＡＤ変換部１０２は、デジタル信号に変換した音響信号をＦＦＴ１０３に出力する。

ＦＦＴ１０３は、ＡＤ変換部１０２が出力する音響信号に対して高速フーリエ変換（ＦａｓｔＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍ）を行って周波数領域の信号に変換する。ＦＦＴ１０３は、周波数領域に変換した信号を特徴量抽出部１０４に出力する。なお、Ｍチャネルの音響信号の場合、ＦＦＴ１０３は、同じサンプリング周波数の信号を用いてＭチャネルの音響信号に対してサンプリングを行う。

特徴量抽出部１０４は、ＦＦＴ１０３が出力する音響信号から音響特徴量を計算して抽出する。特徴量抽出部１０４は、例えば、静的メル尺度対数スペクトル（ＭＳＬＳ：Ｍｅｌ−ＳｃａｌｅＬｏｇＳｐｅｃｔｒｕｍ）、デルタＭＳＬＳ及び１個のデルタパワーを、所定時間（例えば、１０ｍｓ）毎に算出することで音響特徴量を算出する。なお、ＭＳＬＳは、音響認識の特徴量としてスペクトル特徴量を用い、ＭＦＣＣ（メル周波数ケプストラム係数；ＭｅｌＦｒｅｑｕｅｎｃｙＣｅｐｓｔｒｕｍＣｏｅｆｆｉｃｉｅｎｔ）を逆離散コサイン変換することによって得られる。特徴量抽出部１０４は、求めた音響特徴量を音声認識部１０５に出力する。

言語モデルＤＢ（データベース）１４は、言語モデルを格納する。言語モデルは、任意の文字列について，それが日本語文等である確率を付与する確率モデルである。また、言語モデルは、例えば、Ｎグラムモデル、隠れマルコフモデル、最大エントロピーモデル等のいずれかである。

音響モデルＤＢ１５は、音源モデルを格納する。音源モデルは、収音された音響信号を音源同定部１０８が同定するために用いるモデルである。

音声認識部１０５は、言語モデルＤＢ１４が格納する言語モデルと、音響モデルＤＢ１５が格納する音源モデルを参照して、特徴量抽出部１０４が出力する音響特徴量に対して音声認識処理を行う。音声認識部１０５は、認識した音声認識結果（テキスト情報）を、感情推定部１３と対話取得部１６と対話制御部２０１に出力する。

なお、マイクロフォン１０１、ＡＤ変換部１０２、ＦＦＴ１０３、特徴量抽出部１０４、および音声認識部１０５は、利用者の音声を認識してテキスト化する処理部１０である。

操作部１７は、キーボード、マウス、表示部４４上に設けられたタッチパネルセンサ等である。操作部１７は、利用者が操作した結果を検出し、検出した結果をテキスト取得部１８に出力する。操作部１７は、テキスト入力の際に使用される。

テキスト取得部１８は、操作部１７が出力する検出された結果に基づいて入力されたテキスト情報を取得し、取得したテキスト情報を表示部４４と対話取得部１６と対話制御部２０１に出力する。

撮影部１１は、利用者の顔を含む画像を撮影し、撮影した画像を表情認識部１２に出力する。撮影部１１は、例えばＣＣＤ（ＣｈａｒｇｅＣｏｕｐｌｅｄＤｅｖｉｃｅ；電荷結合素子）画像センサ、ＣＭＯＳ（ＣｏｍｐｌｅｍｅｎｔａｒｙＭｅｔａｌ-Ｏｘｉｄｅ-Ｓｅｍｉｃｏｎｄｕｃｔｏｒ；相補型電界効果）画像センサ等である。なお、撮影部１１は、利用者と自己との対話装置１が手話で対話を行う場合、利用者の顔と手を含む画像を撮影し、撮影した画像を表情認識部１２と画像認識部１９に出力する。

画像認識部１９は、撮影部１１が出力する画像に対して、周知の手法によって手話を認識する。画像認識部１９は、認識した手話をテキスト情報に変換し、変換したテキスト情報を対話制御部２０１と対話取得部１６に出力する。

表情認識部１２は、撮影部１１が撮影した画像に対して周知の手法（二値化処理、輪郭抽出処理、画像強調処理、特徴量抽出処理、パターンマッチング処理等）で画像認識処理を行って、利用者の顔の表情を認識する。表情認識部１２は、認識した表情認識結果を感情推定部１３に出力する。

感情推定部１３は、音声認識部１０５が出力する音声認識結果と、表情認識部１２が出力する表情認識結果を取得する。感情推定部１３は、取得した音声認識結果と表情認識結果のうち少なくとも１つを用いて利用者の感情を推定する。感情推定部１３は、例えば、音声のトーンや、音声のピッチの変化、発話文がネガティブであるかポジティブであるかの分析（以下、ネガポジ分析ともいう）に基づいて利用者の感情を推定する。または、感情推定部１３は、例えば、表情に基づいて利用者の感情を推定する。感情推定部１３は、推定に用いるための利用者の音声の変化の情報、および利用者の表情の情報を記憶する。感情推定部１３は、推定した感情推定結果を対話制御部２０１に出力する。

対話取得部１６は、音声認識部１０５が出力する音声認識結果と、対話文生成部２０２が出力する対話文情報を取得し、取得した音声認識結果と対話文情報に基づいて利用者と自己との対話装置１との対話を対話履歴ＤＢ２２に格納させる。なお、対話取得部１６は、対話時、利用者が操作部１７を操作してテキスト情報を入力した場合、テキスト取得部１８が出力するテキスト情報を取得する。なお、対話取得部１６は、対話時、利用者が手話で対話を行う場合、画像認識部１９が出力するテキスト情報を取得する。
また、対話取得部１６は、利用者が使用しているＳＮＳ（ＳｏｃｉａｌＮｅｔｗｏｒｋｉｎｇＳｅｒｖｉｃｅ；ソーシャル・ネットワーキング・サービス）や電子メールやブログから対話履歴を取得し、取得した対話履歴を対話履歴ＤＢ２２に格納させる。また、対話取得部１６は、利用者の発言（発話、テキスト情報）履歴に基づいて概念辞書ＤＢ２３や連想対応表ＤＢ２４を更新する。なお、対話取得部１６は、ＳＮＳ、電子メール、ブログの他、過去の利用者の発言や投稿をまとめた電子書籍や、スマートフォンなどに記憶されたメモなど、過去の利用者の発言また著述の電子データを取得して対話履歴ＤＢ２２に格納する。

標準対話コーパスＤＢ２１は、標準対話コーパスを格納する。標準対話コーパスとは、自己との対話装置１と利用者が、通常時に対話を行う際に使用するコーパスであり、例えば対話内容に応じたシナリオである。なお、標準対話コーパスＤＢ２１が格納する情報は、利用開始後からの時間が短く、利用者の対話履歴の蓄積が不十分である場合に使用されるが、対話履歴が蓄積するに応じて参照割合が低下させる。

対話履歴ＤＢ２２は、利用者と自己との対話装置１との対話履歴を格納する。なお、対話履歴ＤＢ２２が格納する対話履歴の例は後述する。なお、対話履歴ＤＢ２２は、利用者の発話や対話に応じて追加、更新される。すなわち、対話履歴ＤＢ２２が格納する内容は、自己との対話を学習することで対話制御部２０１が更新していく。

概念辞書ＤＢ２３は、オントロジー（概念）辞書を格納する。なお、概念辞書ＤＢ２３が格納する概念辞書の例は後述する。また、概念辞書ＤＢ２３が格納する内容は、自己との対話を学習することで対話制御部２０１が更新していく。

連想対応表ＤＢ２４は、連想対応表を格納する。なお、連想対応表ＤＢ２４が格納する連想対応表の例は後述する。また、連想対応表ＤＢ２４が格納する内容は、自己との対話を学習することで対話制御部２０１が更新していく。

対話制御部２０１は、標準対話コーパスＤＢ２１、対話履歴ＤＢ２２、概念辞書ＤＢ２３、および連想対応表ＤＢ２４を参照して、利用者の発言（発話、テキスト情報、手話）と、感情推定部１３が出力する感情推定結果を用いて対話を制御する。なお、対話制御部２０１は、対話時、利用者が発話した場合、音声認識部１０５が出力するテキスト情報を取得する。なお、対話制御部２０１は、対話時、利用者が操作部１７を操作してテキスト情報を入力した場合、テキスト取得部１８が出力するテキスト情報を取得する。なお、対話制御部２０１は、対話時、利用者が手話で対話を行う場合、画像認識部１９が出力するテキスト情報を取得する。
対話制御部２０１は、利用者の発言（発話、テキスト情報、手話）と感情推定結果に基づいて、後述するように利用者の発言に対する応答を、標準対話コーパスＤＢ２１、対話履歴ＤＢ２２、概念辞書ＤＢ２３、および連想対応表ＤＢ２４を探索して選択する。対話制御部２０１は、選択した応答の対話文を生成する指示である対話文生成指示を対話文生成部２０２に出力する。
また、対話制御部２０１は、自己との対話装置１と利用者とが対話を行った際、利用者がブログやＳＮＳ等に投稿した際、利用者が電子メールを送信した際に、対話履歴ＤＢ２２、概念辞書ＤＢ２３および連想対応表ＤＢ２４を更新する。

対話文生成部２０２は、対話制御部２０１が出力する対話文生成指示に基づいて、対話文を生成し、生成した対話文情報を、対話取得部１６と音声合成部３０１と振る舞い選択部４１に出力する。なお、対話文生成部２０２は、利用者が難聴者等の場合、対話文情報を表示部４４にも出力する。なお、対話文生成部２０２が生成する対話文は、自己との対話装置１と利用者との対話等による対話履歴に基づくものであり、利用者へ自己との対話を提供するものである。

なお、対話制御部２０１と対話文生成部２０２は、対話の制御と生成を行う処理部２０である。

音声合成部３０１は、対話文生成部２０２が出力する対話文情報に基づいて音声信号を合成し、合成した音声信号をスピーカ３０２に出力する。なお、合成に用いる音声は、利用者の音声に基づくようにしてもよい。これにより、利用者は、自分との対話を大なうことができる。

スピーカ３０２は、音声合成部３０１が出力する音声信号を再生する。
なお、音声合成部３０１とスピーカ３０２は、発話のプロセス３０である。

振る舞い選択部４１は、対話文生成部２０２が出力する対話文情報に基づいて、発話に対する振る舞いを選択し、選択した振る舞いを示す情報を自分自身の３Ｄ生成部４３に出力する。

自分自身の画像・動画ＤＢ４２は、利用者の画像や動画を格納する。

自分自身の３Ｄ生成部４３は、自分自身の画像・動画ＤＢ４２が格納する画像や動画を用いて、利用者の３Ｄ（三次元）画像を生成する。また、自分自身の３Ｄ生成部４３は、振る舞い選択部４１が出力する振る舞いを示す情報に基づいて、対応する振る舞いの利用者の３Ｄ画像を生成し、生成した３Ｄ画像を表示部４４に出力する。

表示部４４は、例えば液晶表示装置、有機ＥＬ（ＥｌｅｃｔｒｏＬｕｍｉｎｅｓｃｅｎｃｅ）表示装置、ＶＲ（ＶｉｒｔｕａｌＲｅａｌｉｔｙ）表示装置等である。表示部４４は、自分自身の３Ｄ生成部４３が出力する３Ｄ画像を表示する。

なお、自己との対話装置１は、振る舞い選択部４１、自分自身の画像・動画ＤＢ４２、自分自身の３Ｄ生成部４３、および表示部４４を備えていなくてもよい。この場合、自己との対話装置１は、音声によって利用者との対話を行うようにしてもよい。

また、自己との対話装置１は、標準対話コーパスＤＢ２１、対話履歴ＤＢ２２、概念辞書ＤＢ２３、および連想対応表ＤＢ２４以外の情報を格納するデータベース等を備えていてもよい。また、自己との対話装置１は、必要に応じて、例えば利用者の家族の対話履歴ＤＢ２２も参照して処理を行うようにしてもよい。

なお、言語モデルＤＢ１４、音響モデルＤＢ１５、対話制御部２０１、対話文生成部２０２、標準対話コーパスＤＢ２１、対話履歴ＤＢ２２、概念辞書ＤＢ２３、および連想対応表ＤＢ２４は、自己との対話装置１が備えていなくてもよく、クラウド上の情報であってもよい。

なお、特徴量抽出部１０４は、音源定位を行う音源定位部、音源を分離する音源分離部、および発話区間を検出する発話区間検出部等を備えていてもよい。この場合、特徴量抽出部１０４は、ＦＦＴ１０３が出力するＭチャネルの音響信号に基づいて各音源の方向を予め定めた長さのフレーム（例えば、２０ｍｓ）毎に定めるようにしてもよい（音源定位）。そして、特徴量抽出部１０４は、Ｍチャネルの音響信号を音源方向情報が示す音源方向に基づいて、音源毎の成分を示す音響信号である音源別音響信号に分離するようにしてもよい。そして、特徴量抽出部１０４は、分離された音響信号のスペクトルと、音源方向情報に基づいて、音源毎の発話区間を検出するようにしてもよい。そして、特徴量抽出部１０４は、分離されたスペクトルから音声認識用の音響特徴量を音源毎に計算するようにしてもよい。

次に、対話履歴ＤＢ２２、概念辞書ＤＢ２３、および連想対応表ＤＢ２４が格納する情報例を説明する。

図２は、本実施形態に係る対話履歴ＤＢ２２が格納する対話履歴の例を示す図である。
図２に示す例では、自己との対話装置１と利用者との対話が行われた際の対話履歴を示している。図２において、符号Ｒ１１〜Ｒ１６は自己との対話装置１の発話を示し、符号Ｈ１１〜Ｈ１２は利用者の発話を示している。対話履歴ＤＢ２２は、発話内容に、発話順番と、発話を行った人または装置を示す情報を関連付けて格納する。なお、対話履歴ＤＢ２２は、発話が行われた日時を示す情報も関連付けて格納する。なお、図２に示した対話履歴は、自己との対話装置１が発話を開始する例を示したが、対話は利用者の質問等によって開始されてもよい。

なお、対話履歴ＤＢ２２は、自己との対話装置１との対話履歴だけではなく、例えば、利用者が使用した電子メールやＳＮＳにおける他者との対話履歴、ブログやＳＮＳにおける利用者の発言（投稿）履歴等の利用者の過去の発言または著述も格納する。

図３は、ＳＮＳでの対話履歴の例を示す図である。図３において、符号Ａ１１〜Ａ１４は利用者の発話（書き込み）を示し、符号Ｊ１１〜Ｊ１４は相手の発話（書き込み）を示す。図３において、利用者は例えば父親であり、相手は例えば利用者の息子である。なお、対話履歴ＤＢ２２は、ＳＮＳ等において、自己の発話と、発話相手および発話相手の発話内容と、発話順番と、対話が行われた日時とを関連付けての対話履歴として記憶する。

図４は、ブログでの対話履歴の例を示す図である。図４において、符号ｇ１１はブラウザに表示された画像を示し、符号ｇ１２はブログでの発話内容を示している。対話履歴ＤＢ２２は、ブログのタイトル、発話（発信）した日時、発話（文章）を関連付けて格納する。

図５は、電子メールでの対話履歴の例を示す図である。図５において、符号ｇ２１は電子メールのアプリメーションの画面に表示された画像を示し、符号ｇ２２は電子メールでの発話内容を示している。対話履歴ＤＢ２２は、電子メールのタイトル、発話（送信）した日時、発話（文章）を関連付けて格納する。なお、対話履歴ＤＢ２２は、送信先（送信相手）も関連付けて格納するようにしてもよい。

図６は、本実施形態に係る概念辞書ＤＢ２３が格納する概念辞書の例を示す図である。
図６に示すように概念辞書は、概念を定義するための階層的な辞書である。また、概念辞書は、対象世界にかかわる諸概念を整理して体系づけ、コンピュータにも理解可能な形式で明示的に記述したものである。なお、図６に示した概念辞書は、辞書データの一部であり、これに限らない。

図７は、本実施形態に係る連想対応表ＤＢ２４が格納する連想対応表における象徴関係対応表の例を示す図である。
連想対応表は、象徴関係や自由連想関係の一覧表である。ここで、象徴関係とは、例えば潜在内容のある要素と夢の顕在内容のなかのある要素の関係である。また、自由連想とは、ある言葉（刺激語）を与えられた時に心に浮かぶ考えの連想である。なお、図７に示した連想対応表は一例であり、これに限らない。また、連想対応表は、フロイトなどの夢分析、精神分析で用いるものや、過去の連想履歴などに基づくものであってもよい。

ここで、利用者が自己の客観視等を行う際の自己との対話装置１との対話中に、対話制御部２０１が参照する情報例を、さらに説明する。
まず、対話制御部２０１が対話履歴ＤＢ２２を参照する例を説明する。
対話制御部２０１は、利用者の発話に対して、過去の発話履歴から以下の条件を満たす（回答として成立する、感情や心理をポジティブに誘導できる）応答文を検索する。
・対話が破綻せずに、有意に継続できたときの過去の応答文を検索する。
・ブレーンストーミングを目的とする場合は、抽象度の高さを認識し、効果的な（抽象化または具体化された）応答文を検索する。なお、対話制御部２０１抽象度を周知技術を用いて算出する。
・心的状態改善を目的とする場合は、快不快やネガティブやポジティブで優先度を決定し、有意度の高い応答文を検索する。過去の対話履歴は、表情やネガポジ分析を通しての感情価がタグとして付与されているため、心的状態を改善する傾向の高い応答文の検索ができる。なお、対話制御部２０１は、優先度を予め表形式で記憶していてもよい。

次に、利用者が自己の客観視等を行う際の自己との対話装置１との対話中に、対話制御部２０１が概念辞書ＤＢ２３を参照する例を説明する。
対話制御部２０１は、利用者との対話において、以下のような場合に概念辞書ＤＢ２３を参照する。
・特にブレ―ストーミングを目的とする対話の場合に用いる。
・対話文について、その中に含まれている名詞や動詞の概念分類や抽象度のレベルを判断する場合に用いる。
・対話目的に応じ、より高い抽象度、または逆に高い具体性を持っている過去の応答文を検索する。

次に、利用者が自己の客観視等を行う際の自己との対話装置１との対話中に、対話制御部２０１が連想対応表ＤＢ２４を参照する例を説明する。
対話制御部２０１は、利用者との対話において、以下のような場合に連想対応表ＤＢ２４を参照する。
・心的状態の変化を目的とする対話の場合に用いる。
・自己との対話装置１が利用者と夢の話を開始し、その夢の中に現れる印象深い要素について尋ねて、その回答を得たときに、連想対応表を検索し、その意味を応答文として返す。
・自由連想や、夢の話の中に現れた要素が何を象徴するのかについて自己との対話装置１が利用者に質問をし、その回答を概念辞書ＤＢ２３に格納して更新する。

次に、利用者が自己の客観視等を行う場合に、自己との対話装置１が利用者との自己対話を行う際の処理例を説明する。
図８は、本実施形態に係る利用者が自己の客観視等を行う場合に、自己との対話装置１が利用者との対話を行う際の処理例を示す図である。なお、図８において、符号５１０は対話管理処理であり、音声認識部１０５、感情推定部１３、対話制御部２０１、対話文生成部２０２、音声合成部３０１、振る舞い選択部４１、および自分自身の３Ｄ生成部４３が処理を行う。また、符号５１１は、入力内容の分類処理である。符号ｇ５１２は内部状態の更新処理である。また、符号５２０は内部状態処理である。また、符号５３０は外部データベースであり、標準対話コーパスＤＢ２１、対話履歴ＤＢ２２、概念辞書ＤＢ２３、および連想対応表ＤＢ２４である。

（ステップＳ１０１）利用者が自己の客観視等を行う場合に、利用者は、自己との対話装置１に対して発話を行う。利用者が行う発話は、例えば、ブレーンストーミングを目的とする対話、心的状態変化を目的とする対話、両者が関わる対話があるとする。

（ステップＳ１０２）マイクロフォン１０１は、利用者の発話を收音する。続けて、撮影部１１は、発話時の利用者の顔を含む画像を撮影する。

（ステップＳ１１０）会話開始時において、対話制御部２０１は、音声認識結果に基づいて利用者の相談内容を、ブレーンストーミングを目的とする対話であるか、心的状態変化を目的とする対話であるか、両者が関わる対話であるかのいずれか１つに分類する。

（ステップＳ１１１）利用者との対話中、対話制御部２０１は、音声認識結果に基づいて利用者の相談内容を、ブレーンストーミングを目的とする対話であるか、心的状態変化を目的とする対話であるか、両者が関わる対話であるかのいずれか１つに分類する。

（ステップＳ１１２）感情推定部１３は、対話内容が心的状態変化を目的とする対話の場合、音声認識結果と表情認識結果に基づいて、利用者の感情を分類する。なお、利用者の感情は、例えば、快、不快、覚醒度、発話内容のネガティブさ、発話内容のポジティブさなどである。

（ステップＳ１２０）会話開始時において、対話制御部２０１は、ステップＳ１１０の処理に基づいて対話目的を更新する。

（ステップＳ１２１）利用者との対話中、ステップＳ１１１の処理でブレーンストーミングを目的とする対話であると分類した場合、対話制御部２０１は、利用者の発話内容の概念を更新する。なお、対話制御部２０１は、例えば、概念辞書ＤＢ２３を検索して発話内容に概念をタグ付けする。また、対話制御部２０１は、過去の発話データも概念辞書ＤＢ２３で概念をタグ付けしておき概念をキーにして過去発話を検索できるようにしておく。この処理は、例えば、「思考を発展させる（結論を導く）可能性のある発言履歴を検索し発話する」や、「対話が停滞した際に概念辞書を用いて抽象化された概念を対話文化して発話する」ための準備として行う。なお、タグとは、データベースの各要素に付与する属性である。

（ステップＳ１２２）利用者との対話中、ステップＳ１１１の処理でブレーンストーミングを目的とする対話であると分類した場合、対話制御部２０１は、利用者の過去の発話内容（自己との対話装置１との対話、ブログへの投稿、ＳＮＳへの投稿、電子メール等）との矛盾や共通点を更新する。対話制御部２０１は、例えば、利用者の過去の発話内容と矛盾する場合にそれを指摘するように制御し、過去の発話内容と概念が共通する場合にそれを指摘するように制御する。

（ステップＳ１２３）利用者との対話中、ステップＳ１１１の処理で心的状態変化を目的とする対話であると分類した場合、対話制御部２０１は、利用者の発話内容から推定する深層心理状態を更新する。対話制御部２０１は、例えば発話内容と感情から連想対応表を検索してタグ付けする。また、対話制御部２０１は、例えば過去の発話データにも連想対応表から深層心理をタグ付け、または心的状態変化を目的とする対話を通して得られた新たな連想関係を格納しておき過去発話の検索ができるようにしておく。この処理は、例えば「コンプレックスに触れる内容を（フロイト等の精神分析で用いる）連想対応表から検索し、発話する」ための準備として行う。

（ステップＳ１２４）対話制御部２０１は、ステップＳ１１２の処理結果と、ステップＳ１２３の処理結果に基づいて、利用者の心理状態の分類を更新する。対話制御部２０１は、例えば、悲しみと喜び、嫌悪と信頼、苛立ちと平穏、不安と安心などの軸で利用者の心理状態を分類して特定し、ネガティブな状態である場合はポジティブな状態へ移行させることを対話目的に設定するように制御する。

（ステップＳ１３０）対話制御部２０１は、ステップＳ１２０の処理に基づいて、対話目的を特定する。対話目的は、例えば、概念の深化、概念の具体化、深層心理の可視化、感情の刺激、感情の安定化、ネガティブな心理状態からポジティブな心理状態への誘導などである。

（ステップＳ１３１）心的状態変化を目的とする対話の場合、対話制御部２０１は、ステップＳ１２４の処理結果に基づいて、利用者の心理状態のターゲットを特定する。対話制御部２０１は、例えば、悲しみと喜び、嫌悪と信頼、苛立ちと平穏、不安と安心などの軸で利用者の心理状態を分類して特定し、ネガティブな状態である場合はポジティブな状態へ移行させることを対話目的に設定するように制御する。

（ステップＳ１３２）対話制御部２０１は、ステップＳ１３１の処理結果に基づいて、対話目的を更新する。

（ステップＳ１４０）振る舞い選択部４１は、内部状態の更新処理５１２の処理結果と、ステップＳ１３０の処理結果に基づいて、３Ｄ画像の振る舞いを選択する。続けて、対話制御部２０１と対話文生成部２０２は、内部状態の更新処理５１２の処理結果と、ステップＳ１３０の処理結果に基づいて、発話を選択する。また、振る舞い選択部４１は、行動は対話の概念や対話目的にしたがい適切なものを選択する。

（ステップＳ１５０）対話文生成部２０２と音声合成部３０１は、生成された発話をスピーカ３０２から再生する。また、自分自身の３Ｄ生成部４３は、例えば振る舞い（行動）をＶＲキャラクターのアクション（身振りや手振り）によって表現し、生成した３Ｄ画像を表示部４４に表示させる。

上述した処理によって、符号５１０の対話管理処理、および符号５２０の内部状態処理は、自己との対話装置１と利用者と対話に応じて、自分の複製を構築（学習・記憶）して、運用（自分と対話）しつつ更新（成長）する。この結果、利用者が自己との対話装置１と対話することで、自己との対話装置１は、「あたかも自分（利用者）と対話するかのような状態を創り出す」ことができ、「自分（利用者）を客観視することを支援する」ことができる環境を提供することができる。また、本実施形態によれば、例えばブレーンストーミングの場合、利用者独自の新しい発想の効率的発見と創造を利用者が一人で行うことを可能にする。

なお、対話制御部２０１は、例えば対話開始から所定時間における利用者との対話の内容を、標準対話コーパスＤＢ２１を用いて制御する。そして、対話制御部２０１は、例えば対話開始から所定時間または所定の対話回数における利用者との対話の内容に対して、ブレーンストーミングを目的とする対話であるか、心的状態変化を目的とする対話であるかを、標準対話コーパスＤＢ２１、対話履歴ＤＢ２２、概念辞書ＤＢ２３、および連想対応表ＤＢ２４を参照して分類する。

なお、図８に示した処理手順、処理内容等は一例であり、これに限らない。例えば、処理手順は行っていてもよく、他の処理を行ってもよい。

次に、ブレーンストーミングを目的とする利用者と自己との対話装置１との対話による自己との対話例を説明する。この場合の自己との対話装置１の返答も一般的なシナリオに基づくものではなく、利用者との対話履歴に基づくものであり、利用者はあたかも自分のコピーと対話することで、例えば自己を内観することができる。
図９は、本実施形態に係るブレーンストーミングを目的とする対話例を示す図である。図９において、符号Ｒ１０１〜Ｒ１１０は利用者の発話であり、符号Ｔ１０１〜Ｔ１０９は自己との対話装置１の発話である。なお、図９における対話では、利用者と自己との対話装置１は、音声によって対話を行い、３Ｄ画像を用いていない例である。また、図９において、自己との対話装置１を「対話装置」と略して示している。

符号Ｒ１０１の発話に基づいて、対話制御部２０１は、例えば標準対話コーパスＤＢ２１を参照して、対話目的をブレーンストーミングに分類して設定して、符号Ｔ１０１の発話を提示する。

符号Ｒ１０２の発話に基づいて、対話制御部２０１は、対話履歴ＤＢ２２を参照して、過去の対話履歴やＳＮＳ履歴から関連する発言を検索して、符号Ｔ１０２の発話を提示する。

符号Ｒ１０３の発話に基づいて、対話制御部２０１は、対話履歴ＤＢ２２や概念辞書ＤＢ２３を参照して、複数（対立）の概念を含む過去の対話履歴を検索して、符号Ｔ１０３の発話を提示する。

符号Ｒ１０４の発話に基づいて、対話制御部２０１は、対話履歴ＤＢ２２や概念辞書ＤＢ２３を参照して、高次の概念を含む過去の対話履歴を検索して、符号Ｔ１０５の発話を提示する。

符号Ｒ１０５の発話に基づいて、対話制御部２０１は、概念辞書ＤＢ２３を参照して、高次の概念そのものを検索して、符号Ｔ１０５の発話を提示する。

符号Ｒ１０６、Ｔ１０７の発話に基づいて、対話制御部２０１は、対話履歴ＤＢ２２や概念辞書ＤＢ２３を参照して、低次の概念（具体）を含む過去の対話履歴を検索して、符号Ｔ１０８の発話を提示する。なお、対話制御部２０１は、符号Ｒ１０６に対して、ポジティブな方向に制御するように符号Ｔ１０６の発話を提示する。

符号Ｒ１０８の発話に基づいて、対話制御部２０１は、対話履歴ＤＢ２２を参照して、過去の対話履歴やＳＮＳ履歴から結論となる発言を検索して、符号Ｔ１０８の発話を提示する。

符号Ｒ１０９の発話に基づいて、対話制御部２０１は、例えば標準対話コーパスＤＢ２１を参照して、符号Ｔ１０９の発話を提示する。そして、対話制御部２０１は、これらの対話と結論を、対話履歴ＤＢ２２に対話を行った日時も関連付けて格納する。

次に、心的状態変化を目的とする利用者と自己との対話装置１との対話による自己との対話例を説明する。この場合の自己との対話装置１の返答も一般的なシナリオに基づくものではなく、利用者との対話履歴に基づくものであり、利用者はあたかも自分のコピーと対話することで、例えば解決策を見いだす補助を行うことができる。
図１０は、本実施形態に係る心的状態変化を目的とする対話例を示す図である。図１０において、符号Ｒ２０１〜Ｒ２０９は利用者の発話であり、符号Ｔ２０１〜Ｔ２０９は自己との対話装置１の発話である。なお、図１０における対話では、利用者と自己との対話装置１は、音声によって対話を行い、３Ｄ画像を用いていない例である。また、図１０において、自己との対話装置１を「対話装置」と略して示している。

対話制御部２０１は、符号Ｔ２０１以前の対話、利用者の感情推定結果に基づいて、対話目的を夢分析による心的状態の改善に分類して設定して、符号Ｔ２０１の発話を提示する。

符号Ｒ２０１の発話に基づいて、対話制御部２０１は、例えば標準対話コーパスＤＢ２１や連想対応表ＤＢ２４を参照して、夢分析のオーソドックスな質問として符号Ｔ２０２の発話を提示する。
符号Ｒ２０２の発話に基づいて、対話制御部２０１は、例えば標準対話コーパスＤＢ２１や連想対応表ＤＢ２４を参照して、夢分析のオーソドックスな質問として符号Ｔ２０３の発話を提示する。
符号Ｒ２０３の発話に基づいて、対話制御部２０１は、例えば標準対話コーパスＤＢ２１や連想対応表ＤＢ２４を参照して、夢分析のオーソドックスな質問として符号Ｔ２０４の発話を提示する。

符号Ｒ２０４の発話に基づいて、対話制御部２０１は、例えば対話履歴ＤＢ２２や連想対応表ＤＢ２４を参照して、フロイト等の連想対応表や過去の連想履歴を検索して、符号Ｔ２０５の発話を提示する。

符号Ｒ２０５の発話に基づいて、対話制御部２０１は、例えば対話履歴ＤＢ２２や連想対応表ＤＢ２４を参照して、心的状態を改善させる糸口を探る質問として符号Ｔ２０６の発話を提示する。
符号Ｒ２０６の発話に基づいて、対話制御部２０１は、例えば対話履歴ＤＢ２２や連想対応表ＤＢ２４を参照して、心的状態を改善させる糸口を探る質問として符号Ｔ２０７の発話を提示する。

符号Ｒ２０７の発話に基づいて、対話制御部２０１は、例えば対話履歴ＤＢ２２や連想対応表ＤＢ２４を参照して、ネガティブな心理状態からポジティブな心理状態への誘導するように符号Ｔ２０８の発話を提示する。
符号Ｒ２０８の発話に基づいて、対話制御部２０１は、例えば対話履歴ＤＢ２２や連想対応表ＤＢ２４を参照して、ネガティブな心理状態からポジティブな心理状態への誘導するように符号Ｔ２０９の発話を提示する。そして、対話制御部２０１は、これらの対話と結論を、対話履歴ＤＢ２２に対話を行った日時も関連付けて格納する。

なお、図９、図１０に示した利用者と自己との対話装置１との対話は一例であり、これに限らない。
例えば、利用者と自己との対話装置１との対話中に、対話目的が、例えばブレーンストーミングから心的状態変化に変化した場合、対話制御部２０１は、図８のステップＳ１３２の処理に応じて対話目的を更新し、処理を切り替える。

また、図９、図１０に示した利用者と自己との対話装置１との対話例では、利用者と自己との対話装置１との音声による対話例を示したが、これに限らない。自己との対話装置１は、自分自身の３Ｄ生成部４３が生成した３Ｄ画像も対話中に提示するようにしてもよい。
なお、利用者が難聴者等の場合、自分自身の３Ｄ生成部４３は身振りに加えて手話の動作の３Ｄ画像も生成するようにしてもよい。または、利用者が難聴者等の場合、利用者が操作部１７を操作して入力したテキスト情報と、対話文生成部２０２が生成した応答文を表示部４４に表示することで、利用者との対話を行うようにしてもよい。また、利用者が難聴者でなくても、自己との対話装置１は利用者との対話を、テキスト情報を用いてチャットのように行ってもよい。このようにすることで、発話が苦手な利用者であってもテキスト入力可能な場合、自己との対話装置１は、利用者が自己との対話を実行することができる。

このように、自己との対話装置１は、利用者が直接的に求める情報を推定して与えるのではなく、思考の整理、新しい発想の発見、新しいアイデアの創出を助けるための対話（発話、テキスト情報、３Ｄ画像）を生成して提示する。

上述したように、本実施形態では、利用者が自己との対話装置１と行った対話履歴、ＳＮＳ等で発言した対話履歴、電子メール等で他者と行った対話履歴を取得して格納するようにした。また、本実施形態では、自己との対話装置１が利用者との対話を自然言語によって行う。そして対話の際、自己との対話装置１は、利用者の発話（含む操作部１７から入力されたテキスト情報）から高次の意図を推定して、推定した高次の意図に基づき且つ利用者の対話履歴等から応答（発話、テキスト情報、３Ｄ画像）を生成して提示するようにした。なお、提示する応答は、利用者の発話内容に応じて、利用者の考えを追認する応答、利用者の考えに対して疑問を呈する応答、利用者の考えと関係する新しい情報の提供を行う応答、利用者の考えと無関係な雑談的情報の提供を行う応答、ネガティブな心理状態からポジティブな心理状態への誘導を行う応答等を行うようにした。

これにより、本実施形態によれば、利用者の自分の思考の整理や見直し、新しい発想の効率的発見と創造を、利用者が一人で行うことができる。
ここで複数人の議論では、考えを拡げたり深めたりするポジティブな効果も得られるが、逆にそれぞれの考えを尊重することによって、結果として全体の考えが収束してしまうというネガティブな場合もある。これに対して、本実施形態によれば、利用者一人でブレーンストーミングを行うため、利用者が自分本意に他の考えを取捨することができ、より効率的な発想支援を行うことができる。これにより、本実施形態によれば、自分自身の発話履歴に基づいて自分と対話をすることができるので、自分の思考特性等を把握しやすくなる。

また、本実施形態によれば、利用者の発言履歴から判断して矛盾していることを発話した場合に、その旨を知らせることで、利用者が対話の糸口をみつけたり、利用者に考えるきっかけを提供することができる。
また、本実施形態によれば、思考を発展させる可能性のある発言を対話履歴から検索し、または結論を導く可能性のある発言を対話履歴から検索して応答するので、利用者の思考を手助けすることができる。

また、本実施形態によれば、コンプレックスに触れる内容を連想対応表ＤＢ２４から検索して応答するので、利用者に心的状態を改善させる糸口を探るきっかけを提供することができる。
また、本実施形態によれば、利用者の発言履歴に基づいて前記概念辞書ＤＢ２３を更新するので、過去に結論に至った結果を次回の対話に活用することができる。
また、本実施形態によれば、対話が停滞した際に、前記概念辞書を用いて抽象化（または具体化）された概念を対話文化して応答するので、利用者の思考を手助けすることができ、対話を継続することができる。

さらに、心理カウンセラーによる心理カウンセリングは、カウンセリング頻度やカウンセリング時間の制約があり、またカウンセラーの能力、カウンセラーと利用者との相性によって効果のバラツキが発生する。これに対して、本実施形態によれば、カウンセリング頻度とカウンセリング時間の制約は解消される。さらに本実施形態によれば、自分自身のいわば複製と対話することにより、カウンセラーの能力やカウンセラーと利用者の相性による効果のバラツキという問題も解消される。

なお、本発明における自己との対話装置１の機能の全てまたは一部を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより自己との対話装置１が行う処理の全てまたは一部を行ってもよい。なお、ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境（あるいは表示環境）を備えたＷＷＷシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ−ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ（ＲＡＭ）のように、一定時間プログラムを保持しているものも含むものとする。

また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク（通信網）や電話回線等の通信回線（通信線）のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル（差分プログラム）であってもよい。

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形および置換を加えることができる。

１…自己との対話装置、１０１…マイクロフォン、１０２…ＡＤ変換部、１０３…ＦＦＴ、１０４…特徴量抽出部、１０５…音声認識部、１０…処理部、１１…撮影部、１２…表情認識部、１３…感情推定部、１４…言語モデルＤＢ、１５…音響モデルＤＢ、１６…対話取得部、１７…操作部、１８…テキスト取得部、１９…画像認識部、２０…処理部、２０１…対話制御部、２０２…対話文生成部、２１…標準対話コーパスＤＢ、２２…対話履歴ＤＢ、２３…概念辞書ＤＢ、２４…連想対応表ＤＢ、３０１…音声合成部、３０２…スピーカ、４１…振る舞い選択部、４２…自分自身の画像・動画ＤＢ、４３…自分自身の３Ｄ生成部、４４…表示部、１００４…チャットボット、１００５…ロボット

Claims

利用者と対話をする対話装置において、
概念を定義するための階層的な辞書である概念辞書を格納する概念辞書データベースと、
象徴関係や自由連想関係の一覧表である連想対応表を格納する連想対応表データベースと、
前記利用者の対話履歴を取得する対話取得部と、
前記対話履歴を格納する対話履歴データベースと、
前記対話取得部が取得した前記対話履歴の発言情報に基づいて、前記利用者との対話を行う対話手段と、
を備える自己との対話装置。
前記対話取得部は、前記対話装置との過去の対話に基づいて発言履歴を記憶する、請求項１に記載の自己との対話装置。
前記対話取得部は、前記利用者による過去の発言または著述の電子データに基づいて、過去の前記利用者の発言履歴を取得する、請求項１に記載の自己との対話装置。
前記対話手段は、前記利用者の発言履歴から判断して矛盾していることを発話した場合に、その旨を知らせる、請求項１から請求項３のいずれか１項に記載の自己との対話装置。
前記対話手段は、思考を発展させる可能性のある発言を前記対話履歴から検索し、または結論を導く可能性のある発言を前記対話履歴から検索して応答する、請求項１から請求項３のいずれか１項に記載の自己との対話装置。
前記対話手段は、コンプレックスに触れる内容を前記連想対応表から検索して応答する、請求項１から請求項３のいずれか１項に記載の自己との対話装置。
前記対話取得部は、前記利用者の発言履歴に基づいて前記概念辞書データベースを更新する、請求項１から請求項６のいずれか１項に記載の自己との対話装置。
前記対話手段は、対話が停滞した際に、前記概念辞書を用いて抽象化された概念を対話文化して応答する、請求項１から請求項７のいずれか１項に記載の自己との対話装置。
前記対話手段は、対話が停滞した際に、前記概念辞書を用いて具体化された概念を対話文化して応答する、請求項１から請求項７のいずれか１項に記載の自己との対話装置。
請求項１〜請求項９のいずれか１つに記載の自己との対話装置を備えるチャットボット。
請求項１〜請求項９のいずれか１つに記載の自己との対話装置を備えるロボット。