WO2020213245A1

WO2020213245A1 - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: WO2020213245A1
Application number: PCT/JP2020/005680
Authority: WO
Inventors: 文彦飯田; 龍一鈴木; 邦在鳥居; 笑佳金子
Original assignee: ソニー株式会社
Priority date: 2019-04-16
Filing date: 2020-02-14
Publication date: 2020-10-22
Also published as: JP7439826B2; JPWO2020213245A1; CN113661036A; US20220288791A1

Abstract

インタラクション装置からユーザへの出力を制御する出力制御部と、前記インタラクション装置の出力に対応して行われた前記ユーザの行動を判断する行動評価部と、前記ユーザの行動に対応する前記ユーザの感情を推定する感情推定部と、前記インタラクション装置の出力、前記ユーザの行動、及び前記ユーザの感情を互いに関連付けて、インタラクション情報として蓄積する情報蓄積部と、を備え、前記出力制御部は、蓄積された前記インタラクション情報に基づいて、前記インタラクション装置から前記ユーザへの出力を制御する、情報処理装置。

Description

情報処理装置、情報処理方法、及びプログラム

　本開示は、情報処理装置、情報処理方法、及びプログラムに関する。

　近年、ユーザとコミュニケーションを行うロボット装置が普及しつつある。そのため、このようなロボット装置において、ユーザとより円滑にコミュニケーションを行うための技術が求められている。

　例えば、下記の特許文献１には、ロボット装置に人間的・生物的な行動をエミュレートさせることで、ロボット装置に対するユーザからの共感を高める行動制御技術が開示されている。具体的には、特許文献１には、ユーザからロボット装置への接触回数等などに基づいてユーザとロボット装置との親密度を評価することで、親密度の低いユーザから遠ざかり、親密度の高いユーザに近づくようにロボット装置を制御する技術が開示されている。

国際公開第２０１７／１７５５５９号

　しかし、上記の特許文献１に開示された技術は、ユーザに対するロボット装置の距離を制御するものであるため、ユーザとロボット装置とのコミュニケーションの質を向上させるものではなかった。また、ロボット装置に限らずユーザとコミュニケーションを行うエージェント、又はスマートスピーカ等についても、これら装置とユーザとのコミュニケーションの質を向上させることが求められていた。

　そのため、ユーザとインタラクション装置とのインタラクションをより強めることで、ユーザに対してより品質の高いコミュニケーションを提供することを可能とする技術が求められていた。

　本開示によれば、インタラクション装置からユーザへの出力を制御する出力制御部と、前記インタラクション装置の出力に対応して行われた前記ユーザの行動を判断する行動評価部と、前記ユーザの行動に対応する前記ユーザの感情を推定する感情推定部と、前記インタラクション装置の出力、前記ユーザの行動、及び前記ユーザの感情を互いに関連付けて、インタラクション情報として蓄積する情報蓄積部と、を備え、前記出力制御部は、蓄積された前記インタラクション情報に基づいて、前記インタラクション装置から前記ユーザへの出力を制御する、情報処理装置が提供される。

　また、本開示によれば、演算処理装置によって、インタラクション装置からユーザへの出力を制御することと、前記インタラクション装置の出力に対応して行われた前記ユーザの行動を判断することと、前記ユーザの行動に対応する前記ユーザの感情を推定することと、前記インタラクション装置の出力、前記ユーザの行動、及び前記ユーザの感情を互いに関連付けて、インタラクション情報として蓄積することと、蓄積された前記インタラクション情報に基づいて、前記インタラクション装置から前記ユーザへの出力を制御することと、を含む、情報処理方法が提供される。

　さらに、本開示によれば、コンピュータを、インタラクション装置からユーザへの出力を制御する出力制御部と、前記インタラクション装置の出力に対応して行われた前記ユーザの行動を判断する行動評価部と、前記ユーザの行動に対応する前記ユーザの感情を推定する感情推定部と、前記インタラクション装置の出力、前記ユーザの行動、及び前記ユーザの感情を互いに関連付けて、インタラクション情報として蓄積する情報蓄積部と、として機能させ、蓄積された前記インタラクション情報に基づいて、前記インタラクション装置から前記ユーザへの出力を制御させるように前記出力制御部を機能させる、プログラムが提供される。

本開示に係る技術が適用されるシステムの概要を説明する説明図である。本開示の第１の実施形態に係るシステムの機能構成を説明するブロック図である。一般的な室内空間を撮像した画像の一例を示す模式図である。あらかじめ設定されたユーザに関する情報の一例を示す表図である。ロボット装置の出力と、ユーザの行動とを同一時系列に並べた例を示す表図である。情報蓄積部が生成するインタラクション情報の例を示す表図である。同実施形態に係るシステムにより実行される動作の一例を示すフローチャート図である。同実施形態に係るシステムの変形例について説明する説明図である。本開示の第２の実施形態に係るシステムの機能構成を説明するブロック図である。同実施形態に係るシステムにより実行される動作の一例を示すフローチャート図である。同実施形態に係るシステムにより実行される動作の他の例を示すフローチャート図である。同実施形態に係るシステムにより実行される動作の他の例を示すフローチャート図である。生成したインラクション情報、及び選択したインタラクション情報の一例を示す表図である。図１２に示す一例に基づいて、それぞれ記憶されるインタラクション情報の一例を示す表図である。同実施形態に係るシステムの第３の使用例を説明する説明図である。本開示の各実施形態に係るシステムを構成する情報処理装置におけるハードウェア構成の一例を示すブロック図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　なお、説明は以下の順序で行うものとする。
　１．本開示に係る技術の概要
　２．第１の実施形態
　　２．１．情報処理装置の構成
　　２．２．情報処理装置の動作
　　２．３．変形例
　３．第２の実施形態
　　３．１．情報処理装置の構成
　　３．２．情報処理装置の動作
　　３．３．使用例
　４．ハードウェア構成

　＜１．本開示に係る技術の概要＞
　まず、図１を参照して、本開示に係る技術が適用されるシステムの概要について説明する。図１は、本開示に係る技術が適用されるシステムの概要を説明する説明図である。

　図１に示すように、本開示に係る技術が適用されるシステムは、情報処理装置１０と、ネットワーク３０によって情報処理装置１０と接続されたロボット装置２０と、を含む。なお、図１では、ロボット装置２０のユーザとして、２人のユーザ４０を示すが、ロボット装置２０のユーザは、１人、又は３人以上のいずれであってもよいことは言うまでもない。

　ロボット装置２０は、ユーザ４０とインタラクションを行うことが可能な自律行動型のロボット装置である。ロボット装置２０は、ユーザ４０の近くで動作するロボット装置であり、例えば、ペット型のロボット、人型のコミュニケーションロボット、搬送ロボット、又はアーム等を備えるロボット等であってもよい。

　ロボット装置２０は、撮像装置、マイクロフォン、又は各種センサによる外部環境の観測結果に基づいて行動を制御されることで、ユーザ４０とインタラクションを行うことが可能である。ロボット装置２０は、例えば、音声出力、画像表示、移動、又は動作などの出力によってユーザ４０とインタラクションしてもよい。

　ただし、本開示に係る技術が適用されるシステムでは、ユーザ４０とインタラクションを行う装置は、ロボット装置２０以外の装置であってもよいことは言うまでもない。例えば、本開示に係る技術が適用されるシステムは、ロボット装置２０に替えて、キャラクタ又は人格を模したエージェントを視覚的に出力する表示装置、又はエージェントの発話を聴覚的に出力する音声出力装置を含んでもよい。本明細書では、ロボット装置２０を含む、このようなユーザ４０とインタラクションを行う装置群をインタラクション装置とも称する。

　ネットワーク３０は、情報の有線又は無線の伝送路である。例えば、ネットワーク３０は、インターネット、電話回線網若しくは衛星通信網などの公衆回線網、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、又はＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）などであってもよい。また、ネットワーク３０は、ＩＰ－ＶＰＮ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ－Ｖｉｒｔｕａｌ　Ｐｒｉｖａｔｅ　Ｎｅｔｗｏｒｋ）などの専用回線網であってもよい。

　なお、情報処理装置１０、及びロボット装置２０は、ネットワーク３０を介さずに直接接続されていてもよい。例えば、情報処理装置１０、及びロボット装置２０は、有線で互いに接続されていてもよく、Ｗｉ－Ｆｉ（登録商標）、又はＢｌｕｅｔｏｏｔｈ（登録商標）の無線通信によって互いに接続されていてもよい。

　情報処理装置１０は、ロボット装置２０と、ユーザ４０とのインタラクションの内容を制御する。具体的には、情報処理装置１０は、ユーザ４０が存在する空間のセンシング結果に基づいて、ロボット装置２０からユーザ４０への出力を制御する。詳細には、情報処理装置１０は、センシングしたユーザ４０の発話又は行動の内容に基づいて、ユーザ４０がロボット装置２０に期待又は要求する出力を推定し、推定した出力を発するようにロボット装置２０を制御してもよい。

　例えば、情報処理装置１０は、ユーザ４０が発した質問に対する回答を生成し、生成した回答をロボット装置２０から音声又は画像にて出力させてもよい。または、情報処理装置１０は、ユーザ４０の興味又は注目を惹くような行動を発するようにロボット装置２０の行動を制御してもよい。

　本開示に係る技術が適用されるシステムによれば、ユーザ４０が存在する空間の情報を情報処理装置１０にて解析し、解析した結果に基づいてロボット装置２０からの出力の内容を制御することで、ロボット装置２０と、ユーザ４０との間で双方向のコミュニケーションを行うことができる。例えば、本開示に係る技術が適用されるシステムは、ロボット装置２０及びユーザ４０との間で会話又は応答を行わせたり、ロボット装置２０にペットをエミュレートするような動作を行わせたり、ロボット装置２０及びユーザ４０で共同して作業を行わせたりすることが可能である。

　本開示に係る技術は、このようなシステムにおいて、ロボット装置２０のユーザ４０への出力と、該出力に対応して行われたユーザ４０の行動及び感情と、を関連付けて蓄積するものである。

　本開示に係る技術によれば、情報処理装置１０は、上記で蓄積された情報を用いることによって、ロボット装置２０の出力に対するユーザ４０の反応を推定することができるため、ロボット装置２０からユーザ４０へのコミュニケーションの品質をより高めることができる。

　また、本開示に係る技術によれば、情報処理装置１０は、上記で蓄積された情報を用いることによって、ユーザ４０に所定の行動又は感情を誘起したい場合に、誘起したい行動又は感情に対応するロボット装置２０の出力を判断することができる。したがって、情報処理装置１０は、ロボット装置２０を介して、ユーザ４０に所定の行動又は感情を誘起させることが可能である。

　＜２．第１の実施形態＞
　（２．１．情報処理装置の構成）
　以下では、図２を参照して、上述した本開示に係る技術を実現する第１の実施形態について説明する。図２は、第１の実施形態に係るシステムの機能構成を説明するブロック図である。

　図２に示すように、本実施形態に係るシステムは、ネットワーク３０で互いに接続された情報処理装置１０、及びロボット装置２０を含んで構成される。

　ロボット装置２０は、ユーザ４０が存在する空間のセンシング結果に基づいて情報処理装置１０が判断した内容の出力をユーザ４０に対して発する。ここで、ロボット装置２０の出力とは、ロボット装置２０からユーザ４０への視覚、聴覚、又は触覚の少なくともいずれか１つ以上の感覚に対するあらゆる働きかけを表す。例えば、ロボット装置２０の出力とは、ロボット装置２０からユーザ４０への画像表示、音声出力、動作提示、接近若しくは離反等の移動、対象物の受け渡し、又は接触等を表してもよい。

　（情報処理装置１０）
　情報処理装置１０は、センサ部１０１と、認識部１０３と、行動評価部１０５と、感情推定部１０７と、情報蓄積部１０９と、記憶部１１１と、通信部１１３と、を含んで構成される。

　情報処理装置１０は、例えば、監視カメラシステムの制御装置のように、ユーザ４０からの直接的な働きかけを受け付けない情報処理装置であってもよく、スマートスピーカ等のようにユーザ４０から直接的な働きかけを受け付ける情報処理装置であってもよい。さらに、情報処理装置１０は、センサ部１０１を備えず、情報処理のみを行うコンピュータ等であってもよい。

　センサ部１０１は、ユーザ４０が存在する空間に関する情報を取得するセンサを含む。

　例えば、センサ部１０１は、ＲＧＢカメラ、グレースケールカメラ、デプスカメラ、赤外線カメラ、又はＴｏＦ（Ｔｉｍｅ　ｏｆ　Ｆｌｉｇｈｔ）カメラ等の各種カメラを含み、ユーザ４０が存在する空間の撮像画像を取得してもよい。センサ部１０１は、これらの各種カメラを複数含むことにより、ユーザ４０等の対象物との距離に関する情報をさらに取得してもよい。また、センサ部１０１は、ＬＩＤＡＲ（Ｌａｓｅｒ　Ｉｍａｇｉｎｇ　Ｄｅｔｅｃｔｉｏｎ　ａｎｄ　Ｒａｎｇｉｎｇ）センサ、又はＲＡＤＡＲ（Ｒａｄｉｏ　Ｄｅｔｅｃｔｉｎｇ　ａｎｄ　Ｒａｎｇｉｎｇ）センサなどの各種測距センサを含み、ユーザ４０が存在する空間の物体の配置に関する情報を取得してもよい。さらに、センサ部１０１は、マイクロフォンを含み、ユーザ４０が存在する空間の音声を取得することで、ユーザ４０の位置及び状況に関する情報を取得してもよい。センサ部１０１は、マイクロフォンを複数含むことにより、音源位置を特定する情報をさらに取得してもよい。加えて、センサ部１０１は、照度計、温度計、又は湿度計などのセンサを含み、ユーザ４０が存在する空間の環境に関する情報を取得してもよい。

　ただし、センサ部１０１は、ユーザ４０が存在する空間に関する情報を取得することができれば、上述したセンサ以外の公知のセンサを含んでもよいことは言うまでもない。

　認識部１０３は、センサ部１０１が取得した情報に基づいて、ユーザ４０が存在する空間の状況を認識する。具体的には、認識部１０３は、センサ部１０１の各種カメラにて取得された、ユーザ４０が存在する空間の撮像画像に対して、所定のルール又は機械学習アルゴリズムに基づく画像認識を作用させることで、該空間の状況を認識してもよい。

　例えば、センサ部１０１に含まれる各種カメラにて図３に示す撮像画像が取得された場合、認識部１０３は、物体認識アルゴリズムに基づいて、撮像画像に写った空間の物体の種別、個数、又は位置などを認識してもよい。

　図３は、一般的な室内空間を撮像した画像の一例を示す模式図である。図３に示すように、例えば、室内空間５０には、テーブル５１、椅子５２、５３、及び室内灯５４が存在しているとする。

　認識部１０３は、室内空間５０に居住するユーザ４０によってテーブル５１、椅子５２、５３、又は室内灯５４としてそれぞれ設定された物体を形状又は色等の特徴に基づいて認識することで、撮像画像に写った室内空間５０における物体の位置等を認識してもよい。または、認識部１０３は、教師あり機械学習によって構築されたアルゴリズムを用いて、室内空間５０に存在する物体の中からテーブル５１、椅子５２、５３、及び室内灯５４をそれぞれ認識してもよい。

　また、認識部１０３は、空間におけるユーザ４０の個人及び位置をさらに認識してもよい。具体的には、認識部１０３は、撮像画像に対して、あらかじめ設定された特徴量又は機械学習に基づくアルゴリズムを作用させることで、ユーザ４０の顔認識を行い、ユーザ４０の個人及び位置を認識してもよい。または、認識部１０３は、音声又は身体的特徴からユーザ４０の性別及び年齢を認識し、認識したユーザ４０の性別及び年齢と、あらかじめ設定されたユーザ４０に関する情報とを照らし合わせることで、ユーザ４０の個人及び位置を認識してもよい。

　なお、あらかじめ設定されたユーザ４０に関する情報としては、例えば、図４に示すような情報を例示することができる。図４は、情報処理装置１０にあらかじめ設定されたユーザ４０に関する情報の一例を示す表図である。

　図４に示すように、情報処理装置１０は、ユーザ４０に関する情報として、ユーザ４０の氏名、年齢、性別、及び他ユーザとの関係をユーザごとに記憶してもよい。また、情報処理装置１０は、認識部１０３による認識に基づいて、センサ部１０１がセンシングした時点での空間内のユーザ４０の在又は不在を記憶してもよい。さらに、情報処理装置１０は、センサ部１０１でのセンシング結果に基づいて、ユーザ４０が空間内に存在する可能性が高い時間帯を頻出時間として記憶してもよい。加えて、情報処理装置１０は、ユーザ４０とロボット装置２０との交流時間を記憶してもよい。

　さらに、認識部１０３は、空間におけるロボット装置２０の位置及び個体をさらに認識してもよい。具体的には、認識部１０３は、撮像画像に写ったロボット装置２０の形状、又はロボット装置２０に貼り付けられた識別用二次元コード若しくは識別番号を認識することで、ロボット装置２０の位置及び個体を認識してもよい。

　行動評価部１０５は、センサ部１０１にて取得した情報に基づいて、空間内におけるユーザ４０の行動を把握する。具体的には、行動評価部１０５は、センサ部１０１にて取得したユーザ４０の撮像画像に基づいて、ユーザ４０の行動を把握してもよい。また、行動評価部１０５は、センサ部１０１にて取得してユーザ４０の音声情報に基づいて、ユーザ４０の発話内容を把握してもよい。

　例えば、行動評価部１０５は、ユーザ４０にロボット装置２０からの出力が発せられた時点におけるユーザ４０の行動又は状態を時刻と共に把握してもよい。また、行動評価部１０５は、ユーザ４０の行動又は状態が変化した場合に、変化後のユーザの行動又は状態を時刻と共に把握してもよい。行動評価部１０５は、このようなタイミングでユーザ４０の行動又は状態を把握することで、常時、ユーザ４０の行動又は状態を把握せずとも、ロボット装置２０の出力に対応して行われたユーザ４０の行動を判断することが可能になる。

　さらに、行動評価部１０５は、ロボット装置２０の出力に対応して行われたユーザ４０の行動を判断する。具体的には、行動評価部１０５は、ロボット装置２０からユーザ４０への出力、及びユーザ４０の行動を同一時系列に並べることで、ロボット装置２０の出力に対応して行われたユーザ４０の行動を判断することができる。

　例えば、行動評価部１０５は、ロボット装置２０からユーザ４０への出力に連続してユーザ４０の行動が所定の時間内に行われた場合、ロボット装置２０の該出力と、ユーザ４０の該行動とが対応していると判断してもよい。また、行動評価部１０５は、ロボット装置２０からユーザ４０への出力の後に、ユーザ４０の行動が変更された場合、ロボット装置２０の該出力と、変更後のユーザ４０の行動とが対応していると判断してもよい。これは、ロボット装置２０からユーザ４０への出力に対応するために、ユーザ４０が行動を変化させたと考えられるためである。また、行動評価部１０５は、ロボット装置２０からユーザ４０への出力と、ユーザ４０の行動との同一の組み合わせが複数回確認される場合に、ロボット装置２０の該出力と、ユーザ４０の該行動とが対応していると判断してもよい。

　さらに、行動評価部１０５は、ユーザ４０からロボット装置２０への直接的な行動が発生した場合、ロボット装置２０の出力に時間が掛かった場合、又はユーザ４０の行動に時間が掛かった場合には、ロボット装置２０の出力、及びユーザ４０の行動の間の時間経過を考慮して、ロボット装置２０の出力と、ユーザ４０の行動との対応関係を判断してもよい。

　なお、行動評価部１０５は、ユーザ４０の行動に基づいて把握することができる情報であれば、上述した以外の情報も把握してもよい。例えば、ユーザ４０の発話の頻度若しくは内容、ユーザ４０の位置関係、又はユーザ４０の行動の対象若しくは内容に基づいて複数のユーザ４０の間の関係性が把握可能である場合、行動評価部１０５は、ユーザ４０の発話又は行動に基づいて、複数のユーザ４０の間の関係性を把握してもよい。行動評価部１０５にて把握されたこれらの情報は、図４で例示したユーザ４０に関する情報に追加されることで、情報処理装置１０に記憶されてもよい。

　感情推定部１０７は、ユーザ４０の行動に対応するユーザ４０の感情を推定する。具体的には、感情推定部１０７には、まず、感情の評価軸、及び評価軸の感情に関連するユーザ４０の行動があらかじめ設定される。これにより、感情推定部１０７は、行動評価部１０５にて把握されたユーザ４０の行動と、評価軸の感情ごとに設定された行動とを比較することで、ユーザ４０の感情を推定することができる。なお、感情の評価軸としては、例えば、驚き、恐怖、悲しみ、及び喜びなどを例示することができる。

　また、感情推定部１０７は、センサ部１０１に含まれる各種カメラ、又はユーザ４０が装着したウェアラブル端末等からユーザ４０の心拍数、血圧、又は体温等の生体情報を取得することができる場合には、これらのユーザ４０の生体情報に基づいて、ユーザ４０の感情を推定してもよい。このような場合、感情推定部１０７は、生体情報が示すユーザ４０の状態と、あらかじめ評価軸の感情ごとに設定された状態とを比較することで、ユーザ４０の感情を推定してもよい。

　ここで、図５を参照して、行動評価部１０５、及び感情推定部１０７の動作の具体例について説明する。図５は、ロボット装置２０の出力と、ユーザ４０の行動とを同一時系列に並べた例を示す表図である。

　図５に示すように、ロボット装置２０の出力、及びユーザ４０の行動には、同一時計によるタイムスタンプが押されており、これにより、ロボット装置２０の出力、及びユーザ４０の行動を同一時系列に列挙することが可能になっている。

　例えば、図５に示す表図では、状況Ｎｏ．１として、「１８：１５：０１」にロボット装置２０が「テレビを見ている」状態のユーザ「Ａ」に「近づく」という出力を行ったことが示されている。続いて、状況Ｎｏ．２として、「１８：１５：１０」にユーザ「Ａ」が「ロボット装置に触れる」という行動を行ったことが示されている。次に、状況Ｎｏ．３として、「１８：１６：３０」にロボット装置２０がユーザ「Ｂ」を「見つめる」という出力を行ったことが示されている。また、状況Ｎｏ．４として、「１８：１６：４５」にユーザ「Ｂ」が「ロボット装置に話しかける」という行動を行ったことが示されている。さらに、状況Ｎｏ．５として、「１８：２０：１１」にロボット装置２０が「勉強をしている」状態のユーザ「Ｃ」に「近づく」という出力を行ったことが示されている。続いて、状況Ｎｏ．６として、「１８：２３：２０」にユーザ「Ｃ」が「ロボット装置を追い払う」という行動を行ったことが示されている。

　このような場合、行動評価部１０５は、対象となるユーザ４０が同じであり、かつ発生した時刻が近い状況Ｎｏ．３のロボット装置２０の出力と、状況Ｎｏ．４のユーザ４０の行動とが互いに対応していると判断してもよい。また、行動評価部１０５は、対象となるユーザ４０が同じであり、かつロボット装置２０の出力後にユーザ４０の状態又は行動が変化している状況Ｎｏ．１のロボット装置２０の出力と、状況Ｎｏ．２のユーザ４０の行動とが互いに対応していると判断してもよい。また、行動評価部１０５は、発生した時刻は離れているものの、対象となるユーザ４０が同じであり、かつロボット装置２０の出力後にユーザ４０の状態又は行動が変化している状況Ｎｏ．５のロボット装置２０の出力と、状況Ｎｏ．６のユーザ４０の行動とが互いに対応していると判断してもよい。

　さらに、図５に示す表図では、ロボット装置２０の出力に対応していると判断された状況Ｎｏ．２、４、６のユーザ４０の行動から、感情推定部１０７にて推定されるユーザ４０の感情がそれぞれ示されている。例えば、状況Ｎｏ．２におけるユーザ「Ａ」の「ロボット装置に触れる」という行動からは、「喜び」という感情が推定されている。また、状況Ｎｏ．４におけるユーザ「Ｂ」の「ロボット装置に話しかける」という行動からは、「喜び」という感情が推定されている。さらに、状況Ｎｏ．６におけるユーザ「Ｃ」の「ロボット装置を追い払う」という行動からは、「驚き」という感情が推定されている。

　情報蓄積部１０９は、ロボット装置２０の出力、ロボット装置２０の出力に対応するユーザ４０の行動、及びユーザ４０の行動から推定されるユーザ４０の感情を関連付けて、インタラクション情報として蓄積する。具体的には、情報蓄積部１０９は、行動評価部１０５にて互いに対応すると判断されたロボット装置２０の出力、及びユーザ４０の行動と、感情推定部１０７にてユーザ４０の行動から推定されたユーザ４０の感情とを組み合わせることで、ユーザ４０ごとにインタラクション情報を生成する。

　生成されたインタラクション情報は、例えば、記憶部１１１に蓄積されることで、データベースを構築してもよい。記憶部１１１は、例えば、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）等の磁気記憶装置、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等の半導体記憶装置、光記憶装置、又は光磁気記憶装置等により実現されてもよい。

　例えば、情報蓄積部１０９は、図５に示した具体例からは、図６で示すインタラクション情報を生成することができる。図６は、情報蓄積部１０９が生成するインタラクション情報の例を示す表図である。

　図６に示すように、例えば、情報蓄積部１０９は、図５の状況Ｎｏ．１及び２の情報に基づいて、「ユーザＡ」について、「近づく」というロボット装置２０の出力と、「ロボット装置に触れる」というユーザ４０の行動と、「喜び」というユーザ４０の感情とを関連付けたインタラクション情報を生成することができる。また、情報蓄積部１０９は、図５の状況Ｎｏ．３及び４の情報に基づいて、「ユーザＢ」について、「見つめる」というロボット装置２０の出力と、「ロボット装置に話しかける」というユーザ４０の行動と、「喜び」というユーザ４０の感情とを関連付けたインタラクション情報を生成することができる。さらに、情報蓄積部１０９は、図５の状況Ｎｏ．５及び６の情報に基づいて、「ユーザＣ」について、「近づく」というロボット装置２０の出力と、「ロボット装置を追い払う」というユーザ４０の行動と、「驚き」というユーザ４０の感情とを関連付けたインタラクション情報を生成することができる。

　情報蓄積部１０９は、行動評価部１０５にて、ロボット装置２０からユーザ４０への出力、及びロボット装置２０からの出力に対応するユーザ４０の行動の組み合わせが把握されるごとにインタラクション情報を生成する。これによれば、情報蓄積部１０９は、ロボット装置２０からの出力に対するユーザ４０の反応をインタラクション情報としてデータベース化することができる。したがって、情報処理装置１０は、ロボット装置２０からユーザ４０に出力を発する場合に、蓄積されたインタラクション情報から同様の出力を発した際のユーザ４０の反応を検索することで、ユーザ４０の反応を予測することができるようになる。

　また、情報蓄積部１０９は、インタラクション情報に対して、ロボット装置２０の出力、及びユーザ４０の行動の組み合わせが発生した際の環境等に関する前提条件を追加してもよい。これは、ロボット装置２０からユーザ４０に同じ出力を発した場合でも、ユーザ４０の反応が異なる場合があるからである。

　例えば、ロボット装置２０がユーザ４０に近づいた場合、ユーザ４０は、通常、ロボット装置２０をなでるという反応を返しているとする。しかし、ユーザ４０がロボット装置２０に気が付かなかったり、他の作業を行ったりしている場合、ロボット装置２０がユーザ４０に近づいたとしても、ユーザ４０は、ロボット装置２０をなでるという反応を返さないことがあり得る。情報蓄積部１０９は、このような状況によるロボット装置２０の出力に対するユーザ４０の行動の違いを前提条件として場合分けすることで、インタラクション情報の精度を向上させることができる。

　例えば、図６に示すインタラクション情報の具体例では、「近づく」というロボット装置２０の出力に「ロボット装置に触れる」というユーザ４０の行動を対応させたインタラクション情報に対して「ユーザが能動的な作業を行っていない場合」という前提条件が付加されている。また、「見つめる」というロボット装置２０の出力に「ロボット装置に話しかける」というユーザ４０の行動を対応させたインタラクション情報に対して「ユーザの視野内にロボット装置が存在する場合」という前提条件が付加されている。さらに、「近づく」というロボット装置２０の出力に「ロボット装置を追い払う」というユーザ４０の行動を対応させたインタラクション情報に対して「ユーザＢと一緒にいる場合」という前提条件が付加されている。

　これらの前提条件は、ロボット装置２０からユーザ４０に同じ出力を発した際に、ユーザ４０からの反応が異なったことに基づいて、情報蓄積部１０９によって設定される。例えば、ロボット装置２０からユーザ４０への「近づく」という出力と、「なでる」というユーザ４０の行動とを関連付けたインタラクション情報が蓄積された後に、ロボット装置２０からユーザ４０への「近づく」という出力に対応して、「追い払う」というというユーザ４０の行動が誘起されたとする。このとき、情報蓄積部１０９は、それぞれの場合において、ユーザ４０の行動が発生した際の時間帯、ユーザ４０の状態、又はユーザ４０の周囲の環境の状態を参照することで、それぞれの場合の差分を抽出する。その後、情報蓄積部１０９は、抽出した差分を前提条件として、それぞれの場合に対応するインタラクション情報に追加することができる。

　通信部１１３は、情報処理装置１０と、ロボット装置２０との間で情報の送受信を行うための通信インタフェースである。

　例えば、通信部１１３は、ネットワーク３０を介して、情報処理装置１０と、ロボット装置２０との間で情報の送受信を行ってもよい。ネットワーク３０は、インターネット、衛星通信網、若しくは電話回線網などの公衆通信網、又はＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）若しくはＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）などの限られた領域内に設けられた通信網のいずれであってもよい。

　また、通信部１１３は、情報処理装置１０と、ロボット装置２０との間で直接、情報の送受信を行ってもよい。例えば、通信部１１３は、無線ＬＡＮ、Ｗｉ－Ｆｉ（登録商標）、若しくはＢｌｕｅｔｏｏｔｈ（登録商標）等の無線通信、又は同軸ケーブル等の有線通信を用いて、情報処理装置１０と、ロボット装置２０との間で情報の送受信を行ってもよい。

　（ロボット装置２０）
　ロボット装置２０は、センサ部２０１と、認識部２０３と、出力制御部２０５と、出力部２０７と、通信部２０９と、を含んで構成される。

　ロボット装置２０は、例えば、自律行動が可能なロボット装置である。具体的には、ロボット装置２０は、ユーザ４０とのコミュニケーションを行うことが可能な動物型又は人型のロボットであってもよく、ユーザ４０との共同作業を行うことが可能な搬送ロボット、又はアーム等を備えるロボット等であってもよい。

　センサ部２０１は、ロボット装置２０の外界の環境情報を取得するセンサと、ロボット装置２０の自機情報を取得するセンサと、を含む。例えば、センサ部２０１は、ロボット装置２０の外界の環境情報を取得するセンサとして、ＲＧＢカメラ、グレースケールカメラ、ステレオカメラ、デプスカメラ、赤外線カメラ、若しくはＴｏＦカメラ等の各種カメラ、ＬＩＤＡＲセンサ若しくはＲＡＤＡＲセンサなどの各種測距センサ、又はマイクロフォン、照度計、温度計、若しくは湿度計などのセンサを含んでもよい。一方、センサ部２０１は、ロボット装置２０の自機情報を取得するセンサとして、例えば、エンコーダ、電圧計、電流計、歪みゲージ、圧力計、又はＩＭＵ（Ｉｎｅｒｔｉａｌ　Ｍｅａｓｕｒｅｍｅｎｔ　Ｕｎｉｔ）等を含んでもよい。センサ部２０１が含む各種センサにて取得された情報は、ロボット装置２０の出力を制御するために用いられる。

　ただし、センサ部２０１は、ロボット装置２０の周囲の環境情報、又はロボット装置２０の自機情報を取得することができれば、上述したセンサ以外の公知のセンサを含んでもよいことは言うまでもない。

　認識部２０３は、センサ部２０１が取得した情報に基づいて、ロボット装置２０の外界の環境状態、又はロボット装置２０の自機状態を認識する。具体的には、認識部２０３は、センサ部２０１が取得した環境情報に基づいて、物体認識、動作認識、文字認識、又は音声認識を行うことで、ロボット装置２０の外界の環境状態を認識してもよい。また、認識部２０３は、センサ部２０１が取得した自機情報に基づいて、位置認識、運動状態（例えば、速度、加速度、ジャーク、角速度又は角加速度等）認識、又は機体状態（例えば、電源残量、温度又は関節角等）認識を行うことで、ロボット装置２０の自機状態を認識してもよい。

　認識部２０３による上記の認識は、いずれも公知の認識技術を用いることで行うことができる。認識部２０３による認識は、例えば、所定のルールに基づいて行われてもよく、機械学習アルゴリズムに基づいて行われてもよい。

　出力制御部２０５は、ロボット装置２０からユーザ４０に発する出力を制御する。具体的には、出力制御部２０５は、蓄積されたインタラクション情報に基づいてユーザ４０に発する出力を生成し、さらに該出力を実現する制御命令を生成する。

　例えば、出力制御部２０５は、蓄積されたインタラクション情報に基づいて、ユーザ４０に誘起したい行動又は感情に対応するロボット装置２０の出力を生成し、さらに該出力を実現する制御命令を生成してもよい。ロボット装置２０からユーザ４０に所定の感情を誘起させる出力を発しようとする場合、出力制御部２０５は、蓄積されたインタラクション情報を参照することで、所定の感情をユーザ４０に誘起することができる出力を抽出し、ロボット装置２０からユーザ４０に発する出力を実現するための制御命令を生成することができる。

　なお、出力制御部２０５の機能の一部又は全部は、ロボット装置２０ではなく情報処理装置１０に備えられていてもよい。

　出力部２０７は、出力制御部２０５からの制御命令に基づいて、ロボット装置２０からユーザ４０への出力を発生させる。具体的には、出力部２０７は、実空間への出力を行うモジュールであればどのようなものであってもよい。例えば、出力部２０７は、磁気モータ又は流体ポンプ等のアクチュエータ、エンジン等の動力装置、音声を出力するスピーカ、画像を出力するプロジェクタ、ディスプレイ、又は発光器（例えば、電球、ＬＥＤ又はレーザ等）などであってもよい。

　通信部２０９は、情報処理装置１０と、ロボット装置２０との間で情報の送受信を行うための通信インタフェースである。具体的には、通信部２０９は、情報処理装置１０の通信部１１３と対応する通信インタフェースであってもよい。

　例えば、通信部２０９は、ネットワーク３０を介して、情報処理装置１０と、ロボット装置２０との間で情報の送受信を行ってもよい。ネットワーク３０は、インターネット、衛星通信網、若しくは電話回線網などの公衆通信網、又はＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）若しくはＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）などの限られた領域内に設けられた通信網のいずれであってもよい。

　また、通信部２０９は、情報処理装置１０と、ロボット装置２０との間で直接、情報の送受信を行ってもよい。例えば、通信部２０９は、無線ＬＡＮ、Ｗｉ－Ｆｉ（登録商標）、若しくはＢｌｕｅｔｏｏｔｈ（登録商標）等の無線通信、又は同軸ケーブル等の有線通信を用いて、情報処理装置１０と、ロボット装置２０との間で情報の送受信を行ってもよい。

　以上により、本実施形態に係るシステムを構成する機能群について具体的に説明した。これらの機能群は、上述した例に限定されず、情報処理装置１０及びロボット装置２０のいずれに含まれていてもよい。また、これらの機能群は、ロボット装置２０に集約されていてもよい。

　（２．２．情報処理装置の動作）
　次に、図７を参照して、本実施形態に係るシステムの動作について説明する。図７は、本実施形態に係るシステムにより実行される動作の一例を示すフローチャート図である。

　図７で示すフローチャート図による動作例は、ユーザ４０からロボット装置２０への親密さを向上させることを目的とする動作例である。本実施形態に係るシステムは、ユーザ４０の発話を把握し、ユーザ４０の発話内容に基づいて、ロボット装置２０からの出力を発することで、ユーザ４０とロボット装置２０との間でより高品質のインタラクションを行うことができる。例えば、本実施形態に係るシステムは、発話内容からユーザ４０がロボット装置２０に期待していると推定される出力をロボット装置２０に行わせることで、ユーザ４０にロボット装置２０と相互理解しているような体験を提供することができる。

　図７に示すように、まず、情報処理装置１０は、センサ部１０１からの環境内のセンシング結果に基づいて、環境内にユーザ４０が複数存在するか否かを判断する（Ｓ１０１）。本実施形態に係るシステムは、ユーザごとに、ロボット装置２０の出力と、ユーザ４０の行動及び感情とを関連付けるものであるため、環境内にユーザ４０が複数存在する場合には、情報処理装置１０は、まず、ロボット装置２０が出力を発するユーザ４０を決定する。

　環境内にユーザ４０が複数存在する場合（Ｓ１０１／Ｙｅｓ）、情報処理装置１０は、ユーザ４０ごとに設定された優先度に基づいて、ロボット装置２０が出力を発する対象となるユーザ４０を決定する（Ｓ１０２）。

　優先度は、ユーザ４０とロボット装置２０とのインタラクション（交流ともいう）の程度に基づいて設定されてもよい。例えば、優先度は、ユーザ４０とロボット装置２０とのインタラクションの頻度、時間、深度、又は密度等のパラメータに基づいて、これらのパラメータが高いユーザ４０ほど優先度が高くなるように設定されてもよい。

　ここで、ユーザ４０がロボット装置２０と交流した経験がなく優先度が設定されていないユーザである場合、情報処理装置１０は、ユーザ４０の属性情報に基づいて優先度を設定してもよい。例えば、情報処理装置１０は、撮像画像等から推定されるユーザ４０の年齢及び性別に基づいて、ユーザ４０の行動モデルを生成することで、ロボット装置２０からユーザ４０に出力を発する優先度を設定してもよい。

　なお、環境内にユーザ４０が１人のみの場合（Ｓ１０１／Ｎｏ）、情報処理装置１０は、ステップＳ１０２の動作を行わずにステップＳ１０３の動作を行う。

　続いて、情報処理装置１０は、ロボット装置２０が出力を発する対象となるユーザ４０の発話にロボット装置２０に関する発話が存在するか否かを判断する（Ｓ１０３）。ロボット装置２０に関する発話が存在しない場合（Ｓ１０３／Ｎｏ）、情報処理装置１０は、環境内のユーザ４０の人数が変化したか否かを判断した（Ｓ１０４）上で、ユーザ４０がロボット装置２０に関する発話を行うまで待機する。ただし、環境内のユーザ４０の人数が変化した場合（Ｓ１０４／Ｙｅｓ）、より高い優先度のユーザ４０が現れることで、出力の対象となるユーザ４０が変更される可能性があるため、情報処理装置１０は、ステップＳ１０２に戻って動作をやり直す。

　次に、情報処理装置１０は、ユーザ４０の発話の内容から、ロボット装置２０からユーザ４０に発する出力を決定する。このとき、情報処理装置１０は、蓄積されたインタラクション情報に基づいて、ロボット装置２０からユーザ４０に発する出力をより適した出力となるようにしてもよい（Ｓ１０５）。

　例えば、ユーザ４０の発話の内容が「ロボットに来てほしい」等のロボット装置２０の出力を具体的に指定する内容である場合、情報処理装置１０は、ロボット装置２０からユーザ４０に発する出力を直接的に決定することができる。

　一方で、ユーザ４０の発話の内容が「かわいいロボットだね」等のロボット装置２０の出力を指定しない、感覚的な内容である場合、情報処理装置１０は、蓄積されたインタラクション情報に基づいて、ユーザ４０の発話内容に含まれる感情を誘起させる出力をユーザ４０に発する出力として決定してもよい。例えば、ユーザ４０の発話の内容が「かわいいロボットだね」である場合、情報処理装置１０は、かわいいしぐさとして設定された複数パターンの出力をロボット装置２０が発する出力として決定してもよい。また、決定された複数パターンの出力には、それぞれ実現可能性が設定されていてもよい。これによれば、情報処理装置１０は、夜などの音声の出力が制約される状況では音声を用いた出力の実現可能性を低下させる等の制御を行うことで、ロボット装置２０の出力を外部環境に考慮して制御することが可能になる。

　ただし、本実施形態に係る技術は、上記例示に限定されない。情報処理装置１０は、ユーザ４０の動作から、ユーザ４０がロボット装置２０に期待する出力を推定し、ロボット装置２０からユーザ４０に発する出力を決定することも可能である。

　続いて、情報処理装置１０は、決定された出力をロボット装置２０が実行可能か否かを判断する（Ｓ１０６）。例えば、ロボット装置２０が犬などの動物を模したペット型ロボットである場合、ロボット装置２０は、歩行機構を有するため、「ロボットに来てほしい」という発話内容を実現する出力を発することが可能である。一方で、このようなロボット装置２０は、飛行機構を有していないため、「ロボットに飛んでほしい」という発話内容を実現する出力を発することはできない。このように、情報処理装置１０は、ロボット装置２０が有する機能を考慮することで、決定された出力をロボット装置２０が実行可能か否かを判断する。

　決定された出力をロボット装置２０が実行できない場合（Ｓ１０６／Ｎｏ）、情報処理装置１０は、ステップＳ１０３に戻って、ロボット装置２０に関する発話をユーザ４０が発するまで待機する。

　一方、決定された出力をロボット装置２０が実行可能である場合（Ｓ１０６／Ｙｅｓ）、情報処理装置１０は、ロボット装置２０が出力を発するまでの待ち時間を設定する（Ｓ１０７）。これは、ユーザ４０からの発話に対してロボット装置２０が即時に対応することは、ロボット装置２０が反射的かつ機械的な対応をしているような印象をユーザ４０に与え、ユーザ４０の感情形成に効果的ではないためである。ロボット装置２０が出力を発するまでの待ち時間の長さは、ロボット装置２０が発する出力の内容に基づいて設定されてもよい。例えば、ロボット装置２０が発する出力が直接的な移動等であれば、待ち時間の長さは短くともよい。また、ロボット装置２０が出力を発するまでの待ち時間の長さは、ユーザ４０に飽きを感じさせないためにランダムに設定されてもよい。

　ここで、ロボット装置２０が出力を発するまでの待ち時間の間に、ロボット装置２０に関する新たな発話が発生した場合（Ｓ１０８／Ｙｅｓ）、情報処理装置１０は、ステップＳ１０５に戻って、ロボット装置２０が発する出力を再度決め直してもよい。また、図示しないが、ロボット装置２０が出力を発するまでの待ち時間の間に、出力を発する対象となり得るより高い優先度のユーザが現れた場合、情報処理装置１０は、ステップＳ１０３に戻って、ロボット装置２０が発する出力を再度決め直してもよい。

　ロボット装置２０が発する出力の決め直しにつながるような事象が発生せず（Ｓ１０８／Ｎｏ）、待ち時間が経過した場合、情報処理装置１０は、決定された出力を発するようにロボット装置２０を制御する（Ｓ１０９）。このように、情報処理装置１０は、ユーザ４０の発話又は行動から、ユーザ４０がロボット装置２０に期待すると推定される出力をロボット装置２０が発するような制御を行うことで、ロボット装置２０とユーザ４０とのインタラクションを支援することが可能である。

　その後、情報処理装置１０は、ロボット装置２０の出力に対応するユーザ４０の行動及び感情を評価する（Ｓ１１１）。具体的には、情報処理装置１０は、ロボット装置２０が発した出力に対応して行われたユーザ４０の行動を判断し、ユーザ４０の該行動からユーザ４０の感情を推定する。

　さらに、情報処理装置１０は、ロボット装置２０の出力と、該出力に対応して行われたユーザ４０の行動と、該行動から推定されるユーザ４０の感情とを関連付けたインタラクション情報を生成し、生成したインタラクション情報を蓄積する（Ｓ１１３）。

　このとき、情報処理装置１０は、ロボット装置２０の出力が同じであるインタラクション情報が既に蓄積されている場合には、生成したインタラクション情報と、既に蓄積されているインタラクション情報とを比較することで、インタラクション情報に前提条件をさらに追加してもよい。

　例えば、ロボット装置２０からユーザ４０に対して「近づく」という出力に対応して、ユーザ４０の「笑う」という行動、及び「喜び」という感情が誘起されることを示すインタラクション情報が蓄積されていたとする。しかし、平日の朝などのユーザ４０が忙しい状況でロボット装置２０が同じ出力を発した場合、ユーザ４０の行動及び感情は、蓄積されたインタラクション情報よりもネガティブなものとなったとする。このような場合、情報処理装置１０は、平日の朝という時間帯の前提条件では、ロボット装置２０の「近づく」という出力に対応して、ユーザ４０のネガティブな行動及び感情が誘起されることを把握することができる。したがって、情報処理装置１０は、把握した内容に基づいて、蓄積されたインタラクション情報を更新することで、平日の朝の時間帯ではロボット装置２０が発する出力を「近づく」から「見つめる」等の他の出力に変更することができる。

　（２．３．変形例）
　続いて、図８を参照して、本実施形態に係るシステムの変形例について説明する。図８は、本実施形態に係るシステムの変形例について説明する説明図である。

　図７を参照して説明した例では、ロボット装置２０の出力は、ユーザ４０のロボット装置２０に関する発話をトリガとして発せられる。しかしながら、本実施形態に係るシステムは、上記例示に限定されない。例えば、ロボット装置２０の出力は、自発的に発せられてもよい。

　具体的には、図８に示す例では、２人のユーザ４０が購入したクッション５５について会話しているとする。このような場合、２人のユーザ４０はロボット装置２０に関する発話を行っていないため、情報処理装置１０は、発話内容から２人のユーザ４０がロボット装置２０に期待する出力を判断することが困難となる。そこで、情報処理装置１０は、ロボット装置２０から２人のユーザ４０に自発的に出力を発することで、２人のユーザ４０の行動及び感情を引き出してもよい。

　例えば、情報処理装置１０は、２人のユーザ４０が会話の話題としているクッション５５に近づくという出力を発するようにロボット装置２０を制御してもよい。すなわち、情報処理装置１０は、２人のユーザ４０の発話に含まれる対象物に対してロボット装置２０の出力を作用させることで、ユーザ４０からロボット装置２０に対する行動又は感情を引き出してもよい。これによれば、情報処理装置１０は、ユーザ４０のいずれかから「新しいクッションを買ってよかった」等の「喜び」の感情を推定することが可能な発話を引き出すことができる可能性がある。このような場合、情報処理装置１０は、ロボット装置２０の「新しい対象物に近づく」という出力と、ユーザ４０の「新しい対象物に関する発話」という行動と、ユーザ４０の「喜び」という感情とを関連付けたインタラクション情報を蓄積することが可能となる。

　＜３．第２の実施形態＞
　（３．１．情報処理装置の構成）
　次に、図９を参照して、本開示に係る技術を実現する第２の実施形態について説明する。図９は、第２の実施形態に係るシステムの機能構成を説明するブロック図である。

　図９に示すように、本実施形態に係るシステムは、ネットワーク３０で互いに接続された情報処理装置１１、及びロボット装置２０を含んで構成される。

　本実施形態に係るシステムは、第１の実施形態に係るシステムにて説明したインタラクション情報に基づいて、ロボット装置２０の出力を制御することで、ユーザ４０に対して所望の行動又は感情を誘起させるものである。例えば、本実施形態に係るシステムは、ユーザ４０に対象物に対するポジティブな感情を誘起させたい場合、インタラクション情報にてユーザ４０のポジティブな感情と関連付いたロボット装置２０の出力を対象物と関連するように発する。これによれば、ユーザ４０は、ロボット装置２０の出力に対応して誘起されたポジティブな感情を対象物に対しても抱くようになると考えられる。

　（情報処理装置１１）
　情報処理装置１１は、行動誘起部１２５と、情報蓄積部１２１と、記憶部１１１と、判断部１２３と、通信部１１３と、を含んで構成される。

　行動誘起部１２５は、ユーザ４０に誘起させる行動又は感情を決定する。具体的には、行動誘起部１２５は、対象物へのコマーシャルのためにポジティブな感情をユーザ４０に誘起させること、又は対象物からユーザ４０を遠ざけるためにネガティブな感情をユーザ４０に誘起させることを決定してもよい。または、行動誘起部１２５は、ユーザ４０の安全のために身体保護に必要な行動をユーザ４０に誘起させることを決定してもよい。さらには、行動誘起部１２５は、ユーザ４０の行動を誘導するためにロボット装置２０に追従する行動をユーザ４０に誘起させることを決定してもよい。行動誘起部１２５がユーザ４０に誘起させる行動又は感情は、目的に応じて適宜選択されてもよい。ユーザ４０に誘起させる行動又は感情は、情報処理装置１１にて自律的に決定されてもよく、外部からの指示に基づいて決定されてもよい。

　情報蓄積部１２１は、第１の実施形態に係るシステムにて説明したインタラクション情報を蓄積する。すなわち、情報蓄積部１２１は、ロボット装置２０の出力と、ロボット装置２０の出力に対応して発せられたユーザ４０の行動と、ユーザ４０の該行動から推定されるユーザ４０の感情とを関連付けたインタラクション情報を蓄積する。蓄積されたインタラクション情報を用いることによって、情報処理装置１１は、所望のユーザ４０の行動又は感情を誘起するロボット装置２０の出力を判断することができる。情報蓄積部１２１に蓄積されるインタラクション情報は、第１の実施形態に係るシステムにて生成及び蓄積されたものであってもよく、外部から導入されたものであってもよい。

　インタラクション情報は、例えば、データベースを構築して記憶部１１１に蓄積される。記憶部１１１は、例えば、ＨＤＤ等の磁気記憶装置、ＳＳＤ等の半導体記憶装置、光記憶装置、又は光磁気記憶装置等により実現されてもよい。

　判断部１２３は、蓄積されたインタラクション情報に基づいて、ユーザ４０に誘起させる行動又は感情に対応するロボット装置２０の出力を判断する。具体的には、判断部１２３は、蓄積されたインタラクション情報の中から、ユーザ４０に誘起させる行動又は感情に関連付けられたロボット装置２０の出力を抽出し、抽出したロボット装置２０の出力からロボット装置２０が実行可能な出力を選択する。

　ロボット装置２０の出力は、ユーザ４０の視覚、聴覚、又は触覚の少なくともいずれか１つ以上の感覚に働き掛けるものである。視覚に働き掛けるロボット装置２０の出力とは、例えば、ユーザ４０に対するロボット装置２０の行動の提示、又はロボット装置２０からの映像又は画像の提示などであってもよい。聴覚に働き掛けるロボット装置２０の出力とは、例えば、ロボット装置２０からの鳴き声等の音声出力などであってもよい。触覚に働き掛けるロボット装置２０の出力とは、例えば、ロボット装置２０とユーザ４０との接触による振動又は温感の提示、又は空気砲等を用いた非接触での触覚の提示などであってもよい。

　判断部１２３は、ユーザ４０に誘起させる行動又は感情の内容及び重要度に応じて、ロボット装置２０の出力の内容を判断してもよい。例えば、蓄積されたインタラクション情報には、ユーザ４０に誘起する行動又は感情に対応するロボット装置２０の出力が複数存在する場合がある。このような場合、判断部１２３は、ユーザ４０に誘起する行動又は感情の内容に基づいて、対応するロボット装置２０の複数の出力の中から適切な出力を選択してもよい。例えば、判断部１２３は、ユーザ４０に誘起させる行動又は感情の重要度が高いほど、ロボット装置２０がより多くの出力を発することを判断してもよい。

　例えば、ユーザ４０に即時的に行動又は感情を誘起する場合、ロボット装置２０が移動した後に情報を提示したのでは、情報提示の即時性が失われてしまう。したがって、このような場合、判断部１２３は、ロボット装置２０に鳴き声等の音声出力を行わせることでユーザ４０にロボット装置２０を注目させた後で、ロボット装置２０の移動、及び情報提示を行うことを判断してもよい。このような制御によれば、判断部１２３は、情報提示の即時性を担保することが可能となる。

　また、判断部１２３は、ユーザ４０とロボット装置２０とのインタラクションの程度（すなわち、交流の頻度、時間、密度、又は深度等のパラメータ）に基づいて、ロボット装置２０の出力の内容を判断してもよい。例えば、ユーザ４０とロボット装置２０とのインタラクションの頻度が低い場合には、判断部１２３は、ロボット装置２０にて音声又は映像等のより理解しやすい具体的な出力を発することを判断してもよい。

　例えば、対象物へのコマーシャルのためにポジティブな感情をユーザ４０に誘起させる場合、判断部１２３は、ユーザ４０にポジティブな感情を誘起させる出力を対象物と関連付けるようにロボット装置２０に出力させることを判断してもよい。また、対象物からユーザ４０を遠ざけるためにネガティブな感情をユーザ４０に誘起させる場合、判断部１２３は、ユーザ４０にネガティブな感情を誘起させる出力を対象物と関連付けるようにロボット装置２０に出力させることを判断してもよい。

　例えば、ユーザ４０の安全のために身体保護に必要な行動をユーザ４０に誘起させる場合、判断部１２３は、環境によるユーザ４０の身体への影響を想起させるような出力をロボット装置２０に出力させることを判断してもよい。これによれば、ユーザ４０には、ロボット装置２０の出力によって、環境による身体への影響を回避するような行動が誘起されることになる。また、ユーザ４０の安全のために身体保護に必要な行動をユーザ４０に誘起させる場合、判断部１２３は、環境によってロボット装置２０に問題が生じているような出力をロボット装置２０に出力させることを判断してもよい。これによれば、ユーザ４０には、ロボット装置２０を心配又は気に掛ける感情を介して、ロボット装置２０に生じている問題を解決しようとする行動が誘起されることになる。

　例えば、ユーザ４０の行動を誘導するためにロボット装置２０に追従する行動をユーザ４０に誘起させる場合、判断部１２３は、ユーザ４０に所望の行動を率先して行うような出力をロボット装置２０に出力させることを判断してもよい。これによれば、ユーザ４０にロボット装置２０への対抗意識を持たせ、ロボット装置２０の出力を追従させることで、ユーザ４０に所望の行動を誘起させることが可能となる。

　通信部１１３は、第１の実施形態と同様に、情報処理装置１１と、ロボット装置２０との間で情報の送受信を行うための通信インタフェースである。通信部１１３は、第１の実施形態にて説明した通信部１１３と実質的に同様であるので、ここでの説明は省略する。

　（ロボット装置２０）
　ロボット装置２０は、センサ部２０１と、認識部２０３と、出力制御部２０５と、出力部２０７と、通信部２０９と、を含んで構成される。ロボット装置２０の各構成の機能は、第１の実施形態にて説明した機能と実質的に同様であるので、ここでの説明は省略する。

　以上により、本実施形態に係るシステムを構成する機能群について具体的に説明した。これらの機能群は、第１の実施形態と同様に、情報処理装置１１及びロボット装置２０のいずれに含まれていてもよい。また、これらの機能群は、ロボット装置２０に集約されていてもよい。

　（３．２．情報処理装置の動作）
　続いて、図１０～図１１Ｂを参照して、本実施形態に係るシステムの動作について説明する。

　図１０は、本実施形態に係るシステムにより実行される動作の一例を示すフローチャート図である。図１０で示すフローチャート図による動作例は、ユーザ４０に所望の行動又は感情を誘起させることを目的とする動作例である。

　図１０に示すように、まず、情報処理装置１１は、センサ部１０１からの環境内のセンシング結果に基づいて、環境内に存在するユーザ４０を把握する（Ｓ２０１）。

　続いて、情報処理装置１１は、ユーザ４０とロボット装置２０との過去のインタラクションの履歴に基づいて、ユーザ４０の優先度を推定する（Ｓ２０２）。情報処理装置１１は、例えば、ユーザ４０とロボット装置２０とのインタラクションの頻度、時間、密度、又は深度等のパラメータに基づいて、ユーザ４０の優先度を推定してもよい。または、情報処理装置１１は、ユーザ４０からロボット装置２０への働き掛けの回数、又はユーザ４０がロボット装置２０の電源をオフにした回数などのユーザ４０のロボット装置２０の操作履歴に基づいて、ユーザ４０の優先度を推定してもよい。

　次に、情報処理装置１１は、優先度に基づいて、行動又は感情を誘起するユーザ４０を決定する（Ｓ２０３）。インタラクション情報は、ユーザごとに、ロボット装置２０の出力と、ユーザ４０の行動及び感情とを関連付けている。そのため、情報処理装置１１は、ステップＳ２０１～ステップＳ２０３までの動作によって、インタラクション情報を参照するユーザを決定する。

　なお、ステップＳ２０１～ステップＳ２０３までのユーザ４０を決定する動作は、図７を参照して説明した第１の実施形態に係るシステムの動作（ステップＳ１０１～ステップＳ１０２）と同様であってもよい。

　その後、情報処理装置１１は、決定したユーザ４０に誘起する行動又は感情を決定する（Ｓ２０４）。具体的には、情報処理装置１１は、外部からの指示、又は内部の情報処理に基づいて、ユーザ４０に誘起する行動又は感情を決定する。例えば、情報処理装置１１は、ユーザ４０に対象物を訴求するコマーシャル、水分を摂取するなどの健康面からのユーザ４０への注意喚起、又は危険な場所を示すなどの事故防止等の注意喚起などの目的に基づいて、ユーザ４０に誘起する行動又は感情を決定してもよい。

　次に、情報処理装置１１は、ユーザ４０に対する行動又は感情の誘起の実行可能性を判断する（Ｓ２０５）。例えば、ユーザ４０に対象物を訴求するコマーシャルのために、対象物に対するユーザ４０のポジティブな感情を誘起する場合、対象物の実物、又は広告等が環境内に存在しなければ、情報処理装置１１は、ユーザ４０に対象物に対する感情を誘起することが困難となる。情報処理装置１１は、ユーザ４０に対する行動又は感情の誘起の実行可能性を判断することで、ロボット装置２０が適切なタイミングでユーザ４０の行動又は感情を誘起することを可能とする。

　ユーザ４０に対する行動又は感情の誘起が実行可能である場合（Ｓ２０５／Ｙｅｓ）、情報処理装置１１は、蓄積されたインタラクション情報に基づいて、誘起する行動又は感情に対応するロボット装置２０の出力を判断する（Ｓ２０６）。具体的には、情報処理装置１１は、蓄積されたインタラクション情報から、誘起させる行動又は感情をユーザ４０から引き出すことができた出力を抽出し、抽出した出力をロボット装置２０に適宜出力させる。

　一方、ユーザ４０に対する行動又は感情の誘起が実行不可である場合（Ｓ２０５／Ｎｏ）、情報処理装置１１は、ステップＳ２０４に戻って、ユーザ４０に誘起する行動又は感情を改めて決定し直す。

　ロボット装置２０からユーザ４０に出力が発せられた後、情報処理装置１１は、ロボット装置２０の出力に対するユーザ４０の行動又は感情を評価することで、行動又は感情の誘起の効果を測定する（Ｓ２０７）。さらに、情報処理装置１１は、ロボット装置２０の出力に対するユーザ４０の行動又は感情の評価結果に基づいて、ユーザ４０の行動又は感情がより誘起されるように、インタラクション情報におけるロボット装置２０の出力を更新してもよい（Ｓ２０８）。または、情報処理装置１１は、ロボット装置２０の出力に対するユーザ４０への行動又は感情の誘起の程度に関する情報をインタラクション情報に追加してもよい。これによれば、情報処理装置１１は、ユーザ４０とロボット装置２０とインタラクションを通じて、所望の行動又は感情を誘起することができるようにロボット装置２０の出力をユーザ４０に最適化することができる。

　図１１Ａ及び図１１Ｂは、本実施形態に係るシステムにより実行される動作の他の例を示すフローチャート図である。図１１Ａ及び図１１Ｂで示すフローチャート図による動作例は、図１０を参照して説明した動作例において、情報処理装置１１によるインタラクション情報の更新に関する動作に着目した動作例である。

　図１１Ａに示すように、まず、情報処理装置１１は、ユーザ４０に誘起させる行動又は感情を決定する（Ｓ３０１）。続いて、情報処理装置１１は、ユーザ４０が新規ユーザであるか否かを判断する（Ｓ３０２）。

　ユーザ４０が新規ユーザである場合（Ｓ３０２／Ｙｅｓ）、情報処理装置１１にはユーザ４０のインタラクション情報が蓄積されていない。そのため、情報処理装置１１は、ユーザ４０のセンシング情報に基づいてユーザ４０の年齢層及び性別等の属性を解析し（Ｓ３０５）、解析した属性に基づいてユーザ４０に近いユーザモデルを選択する（Ｓ３０６）。ユーザモデルには、年齢層及び性別等の属性に応じて、ロボット装置２０の出力と、該出力と対応する一般的なユーザ４０の行動及び感情とを関連付けたインタラクション情報があらかじめ設定されている。情報処理装置１１は、ユーザモデルに設定されたインタラクション情報を仮のインタラクション情報として用いることで、インタラクション情報が蓄積されていない新規ユーザであっても、行動又は感情を誘起することを可能とする。その後、情報処理装置１１は、選択したユーザモデルのインタラクション情報の中から、誘起させる行動又は感情に対応する情報を選択する（Ｓ３０７）。

　一方、ユーザ４０が新規ユーザではない場合（Ｓ３０２／Ｎｏ）、情報処理装置１１にはユーザ４０のインタラクション情報が蓄積されている。そのため、情報処理装置１１は、ユーザ４０のインタラクション情報の中に誘起させる行動又は感情に対応するインタラクション情報があるか否かを判断する（Ｓ３０３）。誘起させる行動又は感情に対応するインタラクション情報が存在する場合（Ｓ３０３／Ｙｅｓ）、情報処理装置１１は、インタラクション情報の中から対応する情報を選択する（Ｓ３０８）。誘起させる行動又は感情に対応するインタラクション情報が存在しない場合（Ｓ３０３／Ｎｏ）、情報処理装置１１は、誘起させる行動又は感情に近しい行動又は感情に対応する情報を選択する（Ｓ３０４）。

　続いて、情報処理装置１１は、ステップＳ３０４、Ｓ３０７、及びＳ３０８にて選択された情報に基づいて、ロボット装置２０の出力を制御する（Ｓ３０９）。これにより、ロボット装置２０からユーザ４０に対して、所望の行動又は感情を誘起させる出力が発せられる。

　その後、図１１Ｂに示すように、情報処理装置１１は、ロボット装置２０の出力に対応するユーザ４０の行動をセンシングし（Ｓ３１０）、センシングした行動からユーザ４０の感情を推定する。次に、情報処理装置１１は、評価したユーザ４０の行動及び感情に基づいて、ロボット装置２０の出力と、対応するユーザ４０の行動及び感情とを関連付けたインタラクション情報を生成する（Ｓ３１１）。

　ここで、情報処理装置１１は、ロボット装置２０の出力を判断する際に選択したインタラクション情報と、生成したインタラクション情報とがすべて一致しているか否かを判断する（Ｓ３１２）。選択したインタラクション情報と、生成したインタラクション情報とがすべて一致している場合（Ｓ３１２／Ｙｅｓ）、情報処理装置１１は、選択したインタラクション情報をユーザ４０のインラクション情報として改めて記憶する（Ｓ３１３）。

　一方、選択したインタラクション情報と、生成したインタラクション情報とがすべて一致していない場合（Ｓ３１２／Ｎｏ）、情報処理装置１１は、選択したインタラクション情報と、生成したインタラクション情報とがロボット装置２０の出力について一致しているか否かを判断する（Ｓ３１４）。ロボット装置２０の出力が一致していない場合（Ｓ３１４／Ｎｏ）、情報処理装置１１は、生成したインラクション情報を新規のインタラクション情報として新たに記憶する（Ｓ３１７）。

　ロボット装置２０の出力が一致している場合（Ｓ３１４／Ｙｅｓ）、情報処理装置１１は、選択したインタラクション情報と、生成したインラクション情報とでは、前提条件が異なるためにユーザ４０の行動又は感情が変化したと判断する。そこで、情報処理装置１１は、選択したインタラクション情報と、生成したインラクション情報との間の差異を評価する（Ｓ３１５）。その後、情報処理装置１１は、評価した差異を前提条件として追加して、選択したインタラクション情報、及び生成したインラクション情報をそれぞれ記憶する（Ｓ３１６）。

　図１２及び図１３を参照して、情報処理装置１１のステップＳ３１５及びＳ３１６の動作について、より具体的に説明する。図１２は、生成したインラクション情報、及び選択したインタラクション情報の一例を示す表図である。図１３は、図１２に示す一例に基づいて、それぞれ記憶されるインタラクション情報の一例を示す表図である。

　図１２に示すように、例えば、ロボット装置２０の出力を判断するために選択されたインタラクション情報では、「近づく」というロボット装置２０の出力に「ロボット装置に触れる」というユーザ４０の行動と、「喜び」というユーザ４０の感情とが関連付けられているとする。一方、ロボット装置２０の出力を受けたユーザ４０の行動及び感情を評価することで生成されたインタラクション情報では、「近づく」というロボット装置２０の出力に「ロボット装置を追い払う」というユーザ４０の行動と、「怒り」というユーザ４０の感情とが関連付けられているとする。

　このような場合、情報処理装置１１は、それぞれのインタラクション情報が生成された状況を参照することで、それぞれのインタラクション情報の差異を評価する。例えば、選択されたインタラクション情報は「朝」の時間帯かつ「ユーザＡが近くにいる」という周辺環境の状況下で生成されており、生成されたインタラクション情報は「朝」の時間帯かつ「ユーザＢが近くにいる」という周辺環境の状況下で生成されているとする。このとき、情報処理装置１１は、２つのインタラクション情報が生成された状況の差異として、「ユーザＡが近くにいる」又は「ユーザＢが近くにいる」という周辺環境の違いを見出すことができる。

　したがって、情報処理装置１１は、２つのインタラクション情報の差異として見出した周辺環境の情報を前提条件として２つのインタラクション情報にそれぞれ追加することができる。これによれば、図１３に示すように、情報処理装置１１は、選択されたインタラクション情報からは、「ユーザＡが近くにいる」という前提条件を追加した第１のインタラクション情報を生成し、該情報を記憶することができる。また、情報処理装置１１は、生成されたインタラクション情報からは、「ユーザＢが近くにいる」という前提条件を追加した第２のインタラクション情報を生成し、該情報を記憶することができる。

　（３．３．使用例）
　次に、本実施形態に係るシステムによる具体的な使用例について説明する。

　（第１の使用例）
　本実施形態に係るシステムは、例えば、ユーザ４０に対する商品のコマーシャルに用いることが可能である。

　例えば、ユーザ４０に商品への興味を誘起したい場合、情報処理装置１１は、「商品のコマーシャル映像がテレビに表示された場合に、テレビに向かって吠える」、又は「環境内にある商品をユーザ４０の下に持っていく」等の出力を発するようにロボット装置２０の出力を制御することができる。これによれば、本実施形態に係るシステムは、商品をユーザ４０により着目させることが可能になる。

　（第２の使用例）
　本実施形態に係るシステムは、例えば、ユーザ４０の身体保護のための注意喚起に用いることが可能である。

　例えば、環境内に障害物があり、ユーザ４０が足をぶつける可能性がある場合、又は気温が高く、ユーザ４０が熱中症を発症する可能性がある場合、情報処理装置１１は、ユーザ４０に起き得る状態を想起させる行動の出力を発するようにロボット装置２０の出力を制御することができる。

　具体的には、情報処理装置１１は、障害物によって動けなくなる挙動、又は障害物によって故障したような挙動をロボット装置２０に出力させることで、障害物を取り除くという行動をユーザ４０に誘起させることができる。また、情報処理装置１１は、熱中症で動けなくなるような挙動、水分を呑むような挙動、飲料を購入することを促す挙動、冷房装置を作動させるような挙動、又は涼しい場所へ誘導するよう挙動をロボット装置２０に出力させることで、熱中症を回避するための行動をユーザ４０に誘起させることができる。

　（第３の使用例）
　本実施形態に係るシステムは、例えば、ロボット装置２０の行動をユーザ４０に追従させるために用いることが可能である。図１４を参照して、第３の使用例について説明する。図１４は、本実施形態に係るシステムの第３の使用例を説明する説明図である。

　図１４に示すように、本実施形態に係るシステムのユーザとして、親４１、及び子供４２がいる場合を想定する。本実施形態に係るシステムは、子供４２のロボット装置２０への対抗意識を用いて、親４１が子供４２に望む行動をロボット装置２０に実行させることで、子供４２にロボット装置２０の出力に追従する行動を誘起させることができる。すなわち、本実施形態に係るシステムは、所定の関係性を有する複数のユーザ４０において、ユーザ４０の間の関係性を考慮することで、インタラクション情報を蓄積したユーザ４０以外のユーザに行動又は感情を誘起することも可能である。

　例えば、情報処理装置１１は、親４１の発話内容から親４１から子供４２への指示を把握し、親４１から子供４２への指示に沿った出力を発するようにロボット装置２０を制御してもよい。

　具体的には、情報処理装置１１は、「おもちゃ５７を片付けなさい」という親４１の発話内容を認識した場合、子供４２よりも率先しておもちゃ５７を片付ける出力を発するようにロボット装置２０を制御することができる。これによれば、ロボット装置２０は、子供４２の対抗意識を刺激することで、おもちゃ５７を片付ける行動を行うように子供４２を誘導することができる。また、情報処理装置１１は、「こちらに来なさい」という親４１の発話内容を認識した場合、子供４２よりも率先して親４１に近づく出力を発するようにロボット装置２０を制御することができる。これによれば、ロボット装置２０は、親４１の発話に沿った行動を行うように子供４２を誘導することができる。

　なお、情報処理装置１１は、親４１の発話以外のトリガに基づいて、ロボット装置２０の出力を制御してもよい。例えば、ロボット装置２０がおもちゃ５７を片付けるという出力を行うことで、親４１の喜ぶという感情が誘起されたというインタラクション情報が存在する場合、情報処理装置１１は、おもちゃ５７が片付いていない状態を検出したことをトリガとして、おもちゃ５７を片付けるという出力を発するようにロボット装置２０を制御してもよい。これによれば、ロボット装置２０は、ロボット装置２０に追従しておもちゃ５７を片付ける行動を行うように子供４２に誘導することができる。

　＜４．ハードウェア構成＞
　さらに、図１５を参照しながら、本開示の第１の実施形態に係るシステムを構成する情報処理装置１０のハードウェア構成の一例について説明する。図１５は、第１の実施形態に係るシステムを構成する情報処理装置１０におけるハードウェア構成の一例を示すブロック図である。なお、第２の実施形態に係る情報処理装置１１のハードウェア構成は、第１の実施形態に係る情報処理装置１０のハードウェア構成と実質的に同様であるから、ここでの説明は省略する。

　図１５に示すように、情報処理装置１０は、ＣＰＵ９０１と、ＲＯＭ９０２と、ＲＡＭ９０３と、ホストバス９０５と、ブリッジ９０７と、外部バス９０６と、インタフェース９０８と、入力装置９１１と、出力装置９１２と、ストレージ装置９１３と、ドライブ９１４と、接続ポート９１５と、通信装置９１６とを備える。情報処理装置１０は、ＣＰＵ９０１に替えて、又はＣＰＵ９０１と共に、電気回路、ＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）、又はＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）等の処理回路を備えてもよい。

　ＣＰＵ９０１は、演算処理装置、又は制御装置として機能し、各種プログラムに従って情報処理装置１０内の動作全般を制御する。また、ＣＰＵ９０１は、マイクロプロセッサであってもよい。ＲＯＭ９０２は、ＣＰＵ９０１が使用するプログラム及び演算パラメータ等を記憶する。ＲＡＭ９０３は、ＣＰＵ９０１の実行において使用するプログラム、及びその実行において適宜変化するパラメータ等を一時記憶する。ＣＰＵ９０１は、例えば、認識部１０３、行動評価部１０５、感情推定部１０７、情報蓄積部１０９、１２１、判断部１２３、行動誘起部１２５、及び出力制御部２０５の機能を実行してもよい。

　ＣＰＵ９０１、ＲＯＭ９０２、及びＲＡＭ９０３は、ＣＰＵバスなどを含むホストバス９０５により相互に接続されている。ホストバス９０５は、ブリッジ９０７を介して、ＰＣＩ（Ｐｅｒｉｐｈｅｒａｌ　Ｃｏｍｐｏｎｅｎｔ　Ｉｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バスなどの外部バス９０６に接続されている。なお、ホストバス９０５、ブリッジ９０７、及び外部バス９０６は、必ずしも分離されていなくともよく、１つのバスにこれらの機能が実装されてもよい。

　入力装置９１１は、例えば、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチ又はレバー等のユーザによって情報が入力される装置である。さらに、入力装置９１１は、例えば、上記の入力手段を用いてユーザにより入力された情報に基づいて入力信号を生成する入力制御回路などを含んでもよい。

　出力装置９１２は、情報をユーザに対して視覚的又は聴覚的に通知することが可能な装置である。出力装置９１２は、例えば、ＣＲＴ（Ｃａｔｈｏｄｅ　Ｒａｙ　Ｔｕｂｅ）ディスプレイ装置、液晶ディスプレイ装置、プラズマディスプレイ装置、ＥＬ（ＥｌｅｃｔｒｏＬｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイ装置、レーザープロジェクタ、ＬＥＤ（Ｌｉｇｈｔ　Ｅｍｉｔｔｉｎｇ　Ｄｉｏｄｅ）プロジェクタ、又はランプ等の表示装置であってもよく、スピーカ、又はヘッドフォン等の音声出力装置等であってもよい。

　出力装置９１２は、例えば、情報処理装置１０による各種処理にて得られた結果を出力してもよい。具体的には、出力装置９１２は、情報処理装置１０による各種処理にて得られた結果を、テキスト、イメージ、表、又はグラフ等の様々な形式で視覚的に表示してもよい。または、出力装置９１２は、音声データ又は音響データ等のオーディオ信号をアナログ信号に変換して聴覚的に出力してもよい。

　ストレージ装置９１３は、情報処理装置１０の記憶部の一例として形成されたデータ格納用の装置である。ストレージ装置９１３は、例えば、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス又は光磁気記憶デバイス等により実現されてもよい。例えば、ストレージ装置９１３は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出装置、及び記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。ストレージ装置９１３は、ＣＰＵ９０１が実行するプログラム、各種データ及び外部から取得した各種のデータ等を格納してもよい。ストレージ装置９１３は、例えば、記憶部１１１の機能を実行してもよい。

　ドライブ９１４は、記憶媒体用リーダライタであり、情報処理装置１０に内蔵又は外付けされる。ドライブ９１４は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記憶媒体に記録されている情報を読み出して、ＲＡＭ９０３に出力する。また、ドライブ９１４は、リムーバブル記憶媒体に情報を書き込むことも可能である。

　接続ポート９１５は、外部機器と接続されるインタフェースである。接続ポート９１５は、外部機器とのデータ伝送可能な接続口であり、例えばＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）であってもよい。

　通信装置９１６は、例えば、ネットワーク３０に接続するための通信デバイス等で形成されたインタフェースである。通信装置９１６は、例えば、有線若しくは無線ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＬＴＥ（Ｌｏｎｇ　Ｔｅｒｍ　Ｅｖｏｌｕｔｉｏｎ）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又はＷＵＳＢ（Ｗｉｒｅｌｅｓｓ　ＵＳＢ）用の通信カード等であってもよい。また、通信装置９１６は、光通信用のルータ、ＡＤＳＬ（Ａｓｙｍｍｅｔｒｉｃ　Ｄｉｇｉｔａｌ　Ｓｕｂｓｃｒｉｂｅｒ　Ｌｉｎｅ）用のルータ、又は各種通信用のモデム等であってもよい。通信装置９１６は、例えば、インターネット、又は他の通信機器との間で、例えばＴＣＰ／ＩＰ等の所定のプロトコルに則して信号等を送受信することができる。

　接続ポート９１５、又は通信装置９１６は、通信部１１３の機能を実行してもよい。

　なお、情報処理装置１０に内蔵されるＣＰＵ、ＲＯＭ、及びＲＡＭなどのハードウェアに対して、上述した本実施形態に係るシステムを構成する情報処理装置１０の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供することが可能である。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　インタラクション装置からユーザへの出力を制御する出力制御部と、
　前記インタラクション装置の出力に対応して行われた前記ユーザの行動を判断する行動評価部と、
　前記ユーザの行動に対応する前記ユーザの感情を推定する感情推定部と、
　前記インタラクション装置の出力、前記ユーザの行動、及び前記ユーザの感情を互いに関連付けて、インタラクション情報として蓄積する情報蓄積部と、
を備え、
　前記出力制御部は、蓄積された前記インタラクション情報に基づいて、前記インタラクション装置から前記ユーザへの出力を制御する、情報処理装置。
（２）
　前記行動評価部は、前記インタラクション装置の出力、及び前記ユーザの行動を同一の時系列に並べることで、前記インタラクション装置からの出力に対応して行われた前記ユーザの行動を判断する、前記（１）に記載の情報処理装置。
（３）
　前記行動評価部は、前記インタラクション装置の出力と、前記ユーザの行動とが所定時間内に連続して行われた場合、前記インタラクション装置の出力と、前記ユーザの行動とが対応していると判断する、前記（２）に記載の情報処理装置。
（４）
　前記行動評価部は、前記インタラクション装置の出力の後に前記ユーザの行動が変更された場合、前記インタラクション装置の出力と、前記ユーザの変更後の行動とが対応していると判断する、前記（２）又は（３）に記載の情報処理装置。
（５）
　前記感情推定部は、それぞれの感情に関連すると設定された言動と、前記ユーザの行動とを比較することで、前記ユーザの行動に対応する前記ユーザの感情を推定する、前記（１）～（４）のいずれか一項に記載の情報処理装置。
（６）
　前記インタラクション情報は、前記インタラクション装置の出力、前記ユーザの行動、及び前記ユーザの感情を互いに関連付ける前提条件に関する情報をさらに含む、前記（１）～（５）のいずれか一項に記載の情報処理装置。
（７）
　複数の前記インタラクション情報において、前記インタラクション装置の同じ出力に対応する前記ユーザの行動又は感情が異なる場合、複数の前記インタラクション情報には、前記前提条件として前記インタラクション装置又は前記ユーザの周辺環境の差異がそれぞれ追加される、前記（６）に記載の情報処理装置。
（８）
　前記ユーザが複数である場合、前記出力制御部は、前記ユーザの各々に設定された優先度に基づいて、前記インタラクション装置が出力を発するユーザを決定する、前記（１）～（７）のいずれか一項に記載の情報処理装置。
（９）
　前記優先度は、前記ユーザの各々に対する前記インタラクション装置のインタラクションの頻度、時間、又は深度の少なくともいずれか１つ以上に基づいて設定される、前記（８）に記載の情報処理装置。
（１０）
　前記出力制御部は、前記ユーザの発話の内容から前記ユーザが前記インタラクション装置に期待する出力を推定し、推定した出力を発するように前記インタラクション装置を制御する、前記（１）～（９）のいずれか一項に記載の情報処理装置。
（１１）
　前記出力制御部は、前記ユーザが前記インタラクション装置に期待する複数パターンの出力のうち、前記インタラクション装置に実行可能な出力を発するように前記インタラクション装置を制御する、前記（１０）に記載の情報処理装置。
（１２）
　前記出力制御部は、前記ユーザの発話から前記インタラクション装置が前記ユーザに出力を発するまでの間に、所定の長さの待ち時間を設ける、前記（１１）に記載の情報処理装置。
（１３）
　前記出力制御部は、前記インタラクション装置の出力ごとに、前記待ち時間の長さをランダムに制御する、前記（１２）に記載の情報処理装置。
（１４）
　前記インタラクション装置は、ロボット装置である、前記（１）～（１３）のいずれか一項に記載の情報処理装置。
（１５）
　前記インタラクション装置は、前記ユーザの視覚、聴覚、又は触覚の少なくともいずれか１つ以上の感覚に対して働き掛ける出力を発する、前記（１）～（１４）のいずれか一項に記載の情報処理装置。
（１６）
　演算処理装置によって、
　インタラクション装置からユーザへの出力を制御することと、
　前記インタラクション装置の出力に対応して行われた前記ユーザの行動を判断することと、
　前記ユーザの行動に対応する前記ユーザの感情を推定することと、
　前記インタラクション装置の出力、前記ユーザの行動、及び前記ユーザの感情を互いに関連付けて、インタラクション情報として蓄積することと、
　蓄積された前記インタラクション情報に基づいて、前記インタラクション装置から前記ユーザへの出力を制御することと、
を含む、情報処理方法。
（１７）
　コンピュータを、
　インタラクション装置からユーザへの出力を制御する出力制御部と、
　前記インタラクション装置の出力に対応して行われた前記ユーザの行動を判断する行動評価部と、
　前記ユーザの行動に対応する前記ユーザの感情を推定する感情推定部と、
　前記インタラクション装置の出力、前記ユーザの行動、及び前記ユーザの感情を互いに関連付けて、インタラクション情報として蓄積する情報蓄積部と、
として機能させ、
　蓄積された前記インタラクション情報に基づいて、前記インタラクション装置から前記ユーザへの出力を制御させるように前記出力制御部を機能させる、プログラム。

　１０、１１　　情報処理装置
　２０　　　ロボット装置
　３０　　　ネットワーク
　４０　　　ユーザ
　１０１　　センサ部
　１０３　　認識部
　１０５　　行動評価部
　１０７　　感情推定部
　１０９　　情報蓄積部
　１１１　　記憶部
　１１３　　通信部
　１２１　　情報蓄積部
　１２３　　判断部
　１２５　　行動誘起部
　２０１　　センサ部
　２０３　　認識部
　２０５　　出力制御部
　２０７　　出力部
　２０９　　通信部

Claims

　インタラクション装置からユーザへの出力を制御する出力制御部と、
　前記インタラクション装置の出力に対応して行われた前記ユーザの行動を判断する行動評価部と、
　前記ユーザの行動に対応する前記ユーザの感情を推定する感情推定部と、
　前記インタラクション装置の出力、前記ユーザの行動、及び前記ユーザの感情を互いに関連付けて、インタラクション情報として蓄積する情報蓄積部と、
を備え、
　前記出力制御部は、蓄積された前記インタラクション情報に基づいて、前記インタラクション装置から前記ユーザへの出力を制御する、情報処理装置。
　前記行動評価部は、前記インタラクション装置の出力、及び前記ユーザの行動を同一の時系列に並べることで、前記インタラクション装置からの出力に対応して行われた前記ユーザの行動を判断する、請求項１に記載の情報処理装置。
　前記行動評価部は、前記インタラクション装置の出力と、前記ユーザの行動とが所定時間内に連続して行われた場合、前記インタラクション装置の出力と、前記ユーザの行動とが対応していると判断する、請求項２に記載の情報処理装置。
　前記行動評価部は、前記インタラクション装置の出力の後に前記ユーザの行動が変更された場合、前記インタラクション装置の出力と、前記ユーザの変更後の行動とが対応していると判断する、請求項２に記載の情報処理装置。
　前記感情推定部は、それぞれの感情に関連すると設定された言動と、前記ユーザの行動とを比較することで、前記ユーザの行動に対応する前記ユーザの感情を推定する、請求項１に記載の情報処理装置。
　前記インタラクション情報は、前記インタラクション装置の出力、前記ユーザの行動、及び前記ユーザの感情を互いに関連付ける前提条件に関する情報をさらに含む、請求項１に記載の情報処理装置。
　複数の前記インタラクション情報において、前記インタラクション装置の同じ出力に対応する前記ユーザの行動又は感情が異なる場合、複数の前記インタラクション情報には、前記前提条件として前記インタラクション装置又は前記ユーザの周辺環境の差異がそれぞれ追加される、請求項６に記載の情報処理装置。
　前記ユーザが複数である場合、前記出力制御部は、前記ユーザの各々に設定された優先度に基づいて、前記インタラクション装置が出力を発するユーザを決定する、請求項１に記載の情報処理装置。
　前記優先度は、前記ユーザの各々に対する前記インタラクション装置のインタラクションの頻度、時間、又は深度の少なくともいずれか１つ以上に基づいて設定される、請求項８に記載の情報処理装置。
　前記出力制御部は、前記ユーザの発話の内容から前記ユーザが前記インタラクション装置に期待する出力を推定し、推定した出力を発するように前記インタラクション装置を制御する、請求項１に記載の情報処理装置。
　前記出力制御部は、前記ユーザが前記インタラクション装置に期待する複数パターンの出力のうち、前記インタラクション装置に実行可能な出力を発するように前記インタラクション装置を制御する、請求項１０に記載の情報処理装置。
　前記出力制御部は、前記ユーザの発話から前記インタラクション装置が前記ユーザに出力を発するまでの間に、所定の長さの待ち時間を設ける、請求項１１に記載の情報処理装置。
　前記出力制御部は、前記インタラクション装置の出力ごとに、前記待ち時間の長さをランダムに制御する、請求項１２に記載の情報処理装置。
　前記インタラクション装置は、ロボット装置である、請求項１に記載の情報処理装置。
　前記インタラクション装置は、前記ユーザの視覚、聴覚、又は触覚の少なくともいずれか１つ以上の感覚に対して働き掛ける出力を発する、請求項１に記載の情報処理装置。
　演算処理装置によって、
　インタラクション装置からユーザへの出力を制御することと、
　前記インタラクション装置の出力に対応して行われた前記ユーザの行動を判断することと、
　前記ユーザの行動に対応する前記ユーザの感情を推定することと、
　前記インタラクション装置の出力、前記ユーザの行動、及び前記ユーザの感情を互いに関連付けて、インタラクション情報として蓄積することと、
　蓄積された前記インタラクション情報に基づいて、前記インタラクション装置から前記ユーザへの出力を制御することと、
を含む、情報処理方法。
　コンピュータを、
　インタラクション装置からユーザへの出力を制御する出力制御部と、
　前記インタラクション装置の出力に対応して行われた前記ユーザの行動を判断する行動評価部と、
　前記ユーザの行動に対応する前記ユーザの感情を推定する感情推定部と、
　前記インタラクション装置の出力、前記ユーザの行動、及び前記ユーザの感情を互いに関連付けて、インタラクション情報として蓄積する情報蓄積部と、
として機能させ、
　蓄積された前記インタラクション情報に基づいて、前記インタラクション装置から前記ユーザへの出力を制御させるように前記出力制御部を機能させる、プログラム。