JP6322927B2

JP6322927B2 - インタラクション装置、インタラクションプログラムおよびインタラクション方法

Info

Publication number: JP6322927B2
Application number: JP2013168554A
Authority: JP
Inventors: 金岡　利知; 利知金岡
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2013-08-14
Filing date: 2013-08-14
Publication date: 2018-05-16
Anticipated expiration: 2033-08-14
Also published as: JP2015036915A

Description

本発明は、人との間で言語および非言語によるコミュニケーションを行うインタラクション装置、インタラクションプログラムおよびインタラクション方法に関する。

従来、人物と、ロボットやディスプレイに表示される人物や動物等との間で、発話や身振り等の働きかけ（インタラクションとも称する）を実行してコミュニケーションを行う技術が提案されている。

例えば、ロボット等のインタラクション装置は、人物の視線や発話、人物との距離等の情報を取得し、取得した情報に基づいて、人物に対する働きかけの内容や人物に働きかけるタイミング等を決定する技術が提案されている（特許文献１、非特許文献１参照）。

特開２０１１−６８１号公報

米澤朋子、山添大丈、内海章、安部伸治、「ユーザの視線・発話に対するクロスモダルアウェアネス〜ユーザ状況把握を表すロボット〜」、ＨＡＩシンポジウム2009、2C-3、2009年

例えば、インタラクション装置への働きかけの意思がない人物が、インタラクション装置を見ながらインタラクション装置の前を通り過ぎる場合がある。このような場合に、インタラクション装置が、通り過ぎる人物に発話や身振り等の働きかけを行うと、インタラクション装置から発話等の働きかけを受けた人物は、働きかけを不自然に感じ、あるいは働きかけを不快に思う場合がある。

１つの側面では、本発明は、人物が違和感を持ちにくいタイミングで、インタラクション装置に人物への働きかけを行わせることを目的とする。

一つの観点によるインタラクション装置は、出力装置からの働きかけを受ける対象者による出力装置への働きかけを検出し、検出した各対象者を識別し、識別した各対象者と各対象者による働きかけの検出結果とを対応付ける検出部と、検出部により検出された対象者による働きかけに基づいて、各対象者の働きかけの特徴を示す特徴量をそれぞれ求める演算部と、演算部により求められた各対象者の特徴量のそれぞれに基づいて、出力装置の対象者への働きかけを変化させる制御部と、を含む。

別の観点によるインタラクションプログラムは、出力装置からの働きかけを受ける対象者による出力装置への働きかけを検出し、検出した各対象者を識別し、識別した各対象者と各対象者による働きかけの検出結果とを対応付け、検出された対象者による働きかけに基づいて、各対象者の働きかけの特徴を示す特徴量をそれぞれ求め、求められた各対象者の特徴量のそれぞれに基づいて、出力装置の対象者への働きかけを変化させる、処理をコンピュータに実行させる。

別の観点によるインタラクション方法は、出力装置からの働きかけを受ける対象者による出力装置への働きかけを検出し、検出した各対象者を識別し、識別した各対象者と各対象者による働きかけの検出結果とを対応付け、検出された対象者による働きかけに基づいて、各対象者の働きかけの特徴を示す特徴量をそれぞれ求め、求められた各対象者の特徴量のそれぞれに基づいて、出力装置の対象者への働きかけを変化させる。

人物が違和感を持ちにくいタイミングで、インタラクション装置に人物への働きかけを行わせることができる。

インタラクション装置の一実施形態を示す図である。図１に示した検出部により検出される対象者の働きかけの一例を示す図である。図１に示したインタラクション装置におけるインタラクション処理の例を示す図である。インタラクション装置の別実施形態を示す図である。対象者の働きかけを示すテーブルの一例を示す図である。図５に示す対象者の働きかけを示すテーブルの一例の続きを示す図である。図６に示す対象者の働きかけを示すテーブルの一例の続きを示す図である。対象者の出力装置に対する働きかけの意思の強さの定義の例を示す図である。図４に示す推定部が指標値の推定に用いる遷移条件のテーブルの一例を示す図である。対象者Ｕのインタラクション意思値、指標値および主要状態の時間変化の一例を示す図である。図４に示したインタラクション装置におけるインタラクション処理の例を示す図である。インタラクション装置の別実施形態を示す図である。図１２に示したインタラクション装置におけるインタラクション処理の例を示す図である。インタラクション装置の別実施形態を示す図である。識別子ごとの対象者の働きかけを示すテーブルの一例を示す図である。図１４に示したインタラクション装置におけるインタラクション処理の例を示す図である。図１４に示すインタラクション装置のハードウェア構成の一例を示す図である。

以下、図面を用いて実施形態について説明する。

図１は、インタラクション装置の一実施形態を示す。

図１に示すインタラクション装置１００は、検出部１０、演算部２０、推定部３０および制御部４０を有する。また、インタラクション装置１００は、カメラ１および出力装置２と接続される。なお、カメラ１および出力装置２は、インタラクション装置１００に含まれてもよい。以下の説明では、出力装置２からの働きかけを受ける人物を対象者Ｕと称する。

カメラ１は、例えば、出力装置２に対向する領域を撮影することで画像を生成し、生成した画像をインタラクション装置１００の検出部１０に出力する。例えば、出力装置２は、出力装置２への働きかけを行う対象者Ｕを含む領域に対向して設置される。カメラ１は、毎秒数コマから数十コマのフレームレートで撮影可能な性能を有する。なお、カメラ１と出力装置２とは、一体に配置されてもよい。

出力装置２は、インタラクション装置１００からの制御に応じて、対象者Ｕに対して働きかけを行う。出力装置２は、例えば、サーボモータにより動く顔および腕等の部材やスピーカ等を有し、対象者Ｕに対して、身振り等の働きかけや発話を行うロボットである。あるいは、出力装置２は、液晶モニタ等のディスプレイであり、インタラクション装置１００からの制御に応じて、対象者Ｕに対して、発話や身振り等の働きかけを行う人物や動物等のキャラクターを表示してもよい。

検出部１０は、カメラ１により撮影された画像を取得し、取得した画像に基づいて、対象者Ｕの出力装置２を介してインタラクション装置１００への働きかけを検出する。例えば、検出部１０は、取得した画像から輝度の不連続な変化を示すエッジ等の特徴点を抽出し、抽出した特徴点の分布に基づいて対象者Ｕの顔、腕、胴体等の輪郭を特定する。そして、検出部１０は、特定した輪郭に基づいて対象者Ｕを検出する。また、検出部１０は、例えば、特定した対象者Ｕの顔、目、鼻、耳、あるいは口等の輪郭の形状や互いの位置の関係に基づいて、対象者Ｕの顔の向きや視線の方向、あるいは対象者Ｕの表情等を、対象者Ｕによる働きかけとして検出する。なお、検出部１０は、対象者Ｕの顔や手等の輪郭の位置の時間変化から、対象者Ｕの動きを検出し、対象者Ｕが手を振る動作やうなずく動作等を、対象者Ｕの働きかけとして検出してもよい。検出部１０が検出する対象者Ｕの働きかけの例については、図２で説明する。

例えば、検出部１０は、検出した対象者の働きかけを演算部２０に出力する。そして、検出部１０は、カメラ１から受ける次の画像を用いて対象者Ｕの検出動作を繰り返す。

なお、検出部１０は、人物の顔や胴体等の画像のテンプレートと、撮影した画像との相関を示す相関係数を求め、求めた相関係数が所定の値以上となる画像領域を対象者Ｕとして検出してもよい。例えば、人物の顔や胴体等の画像のテンプレートは、インタラクション装置１００が内蔵するＥＥＰＲＯＭ（Electrically Erasable Programmable Read-Only Memory）等の記憶部に予め記憶される。

演算部２０は、検出部１０により順次に検出される対象者Ｕによる働きかけに基づいて、対象者Ｕの働きかけの特徴を示す特徴量を求める。例えば、演算部２０は、検出部１０により検出された過去の対象者Ｕによる働きかけに基づいて、検出された対象者Ｕの顔の向きや視線の方向、表情、あるいは動作等の対象者Ｕの働きかけのばらつきの度合いを特徴量として求める。これは、例えば、対象者Ｕは、出力装置２とコミュニケーションを取りたいという関心が高いほど、出力装置２に対して様々なバリエーションの身振り等の働きかけを行い、出力装置２の興味を対象者Ｕの方に向けようとするためである。なお、例えば、演算部２０は、検出部１０により検出された対象者Ｕによる働きかけを、インタラクション装置１００が内蔵するＥＥＰＲＯＭ等の記憶部に順次に記憶する。また、演算部２０は、求めた対象者Ｕの働きかけの特徴を示す特徴量を推定部３０に出力する。演算部２０による特徴量を求める例は、図４から図７でも説明する。

推定部３０は、演算部２０により求められた対象者Ｕの働きかけの特徴を示す特徴量に基づいて、対象者Ｕの出力装置２への働きかけの意思の強さを推定する。例えば、推定部３０は、演算部２０から受けた対象者Ｕの働きかけのばらつきの度合いと所定の閾値とを比較する。推定部３０は、例えば、対象者Ｕの働きかけのばらつきの度合いが所定の閾値より大きい場合、対象者Ｕには、出力装置２に対する働きかけの意思を、他の場合より強く有すると推定する。一方、推定部３０は、対象者Ｕの働きかけのばらつきの度合いが所定の閾値以下の場合、対象者Ｕには、出力装置２に対する働きかけの意思がない、あるいは働きかけ意思が他の場合より弱いと推定する。推定部３０は、推定結果を対象者Ｕの出力装置２への働きかけの意思の強さとして制御部４０に出力する。推定部３０による働きかけの意思の強さを推定する例は、図８から図１０でも説明する。

制御部４０は、推定部３０により推定される対象者Ｕから出力装置２への働きかけの意思の強さに応じて、出力装置２の対象者Ｕへの働きかけを変化させる。例えば、制御部４０は、対象者Ｕの出力装置２に対する働きかけの意思の強さに応じて、検出部１０で検出される対象者Ｕの働きかけに対応して、ＥＥＰＲＯＭ等の記憶部に予め登録された働きかけを出力装置２に実行させる。例えば、制御部４０は、対象者Ｕが出力装置２に対する働きかけの意思を有すると推定された場合で、対象者Ｕが手を振っていることが検出された場合に、対象者Ｕに対して手を振る等の動作を出力装置２に実行させる。一方、制御部４０は、例えば、対象者Ｕの出力装置２に対する働きかけの意思がないと推定され、対象者Ｕが出力装置２をじっと見ていることが検出された場合に、対象者Ｕが手を振る等の動作をするまで対象者Ｕの様子を見守る動作を、出力装置２に実行させる。あるいは、制御部４０は、出力装置２に対する働きかけの意思がない対象者Ｕに対して、発話や身振り等の働きかけを出力装置２に実行させることで、対象者Ｕに出力装置２への働きかけの意思を持たせるようにしてもよい。

図２は、図１に示した検出部１０により検出される対象者Ｕの働きかけの一例を示す。図２（ａ）から図２（ｄ）は、検出部１０から受けたカメラ１により撮影された対象者Ｕの画像１ａをそれぞれ示す。図２（ａ）に示す画像１ａは、対象者Ｕが出力装置２から見て左側の方に視線を向けている場合を示す。図２（ｂ）は、対象者Ｕが出力装置２の方を向いているが、対象者Ｕの顔の中心が画像１ａの対角線（破線で示す）の交点である画像１ａの中心（またはカメラ１の光軸方向）から外れ、対象者Ｕの視線と出力装置２の向きとが互いにずれている場合を示す。図２（ｃ）に示す画像１ａは、対象者Ｕが出力装置２から見て右側の方に視線を向けている場合を示す。図２（ｄ）に示す画像１ａは、対象者Ｕが出力装置２の方に視線を向け、対象者Ｕの顔の中心が画像１ａの中心と一致する場合で、対象者Ｕの視線と出力装置２の向きとが一致する場合を示す。検出部１０は、例えば、検出された対象者Ｕの顔、目、鼻、耳、あるいは口等の輪郭の位置、および画像の中心位置に基づいて、対象者Ｕの顔の向きや視線の方向を検出する。検出部１０は、検出した対象者Ｕの顔の向きや視線の方向等を、対象者Ｕの働きかけを示す情報の一部として図１に示す演算部２０に出力する。

図３は、図１に示したインタラクション装置１００におけるインタラクション処理の例を示す。ここで、インタラクション処理とは、インタラクション装置１００が対象者Ｕに対する働きかけの動作を、例えば、出力装置２に行わせる処理である。ステップＳ１０，Ｓ２０，Ｓ３０およびＳ４０は、インタラクション装置１００に搭載されるプロセッサがインタラクションプログラムを実行することにより実行される。すなわち、図３は、インタラクションプログラムおよびインタラクション方法の一実施形態を示す。この場合、図１に示した検出部１０、演算部２０、推定部３０および制御部４０は、インタラクションプログラムの実行により実現される。なお、図３に示す処理は、インタラクション装置１００に搭載されるハードウェアにより実行されてもよい。この場合、図１に示した検出部１０、演算部２０、推定部３０および制御部４０は、インタラクション装置１００内に配置される回路により実現される。

ステップＳ１０において、検出部１０は、カメラ１により撮影された対象者Ｕを含む画像に基づいて、図１で説明したように、対象者Ｕによる働きかけを検出する。

次に、ステップＳ２０において、演算部２０は、検出部１０により順次に検出される対象者Ｕによる働きかけに基づいて、図１で説明したように、対象者Ｕの働きかけの特徴を示す特徴量を求め、求めた特徴量を推定部３０に出力する。

次に、ステップＳ３０において、推定部３０は、演算部２０から受けた対象者Ｕの働きかけの特徴を示す特徴量に基づいて、図１で説明したように、対象者Ｕの出力装置２への働きかけの意思の強さを推定する。推定部３０は、推定した対象者Ｕの意思の強さを制御部４０に出力する。

次に、ステップＳ４０において、制御部４０は、推定部３０により推定された対象者Ｕの意思の強さに応じて、図１で説明したように、出力装置２の対象者Ｕへの働きかけを変化させる。

そして、インタラクション装置１００によるインタラクション処理は終了する。なお、図３に示したフローは、繰り返し実行されてもよく、所定の頻度で実行されてもよい。

以上、この実施形態では、演算部２０は、検出部１０により検出された対象者Ｕによる働きかけに基づいて、対象者Ｕの働きかけの特徴を示す特徴量を算出する。推定部３０は、求められた特徴量に基づいて、対象者Ｕの出力装置２への働きかけの意思の強さを推定し、制御部４０は、推定された対象者Ｕの意思の強さに応じて、出力装置２の対象者Ｕへの働きかけを変化させる。これにより、インタラクション装置１００は、例えば、対象者Ｕの出力装置２への働きかけの意思が強いことが推定された場合に、出力装置２による対象者Ｕへの働きかけを行わせることができる。すなわち、インタラクション装置１００は、出力装置２を介して、対象者Ｕが違和感を持ちにくいタイミングで、対象者Ｕへの働きかけを行わせることができる。

図４は、インタラクション装置の別実施形態を示す。なお、図４に示すインタラクション装置１００ａの各要素のうち、図１に示すインタラクション装置１００の要素と同一または同様の機能を有するものについては、同一の符号を付し説明を省略する。

マイクロホン３は、例えば、出力装置２の周辺の音声を電気信号に変換し、変換した電気信号を音声データとして検出部１０ａに出力する。なお、マイクロホン３は、出力装置２とともに一体に配置されてもよい。

タッチセンサ４は、例えば、対象者Ｕにより出力装置２が触られた場合、対象者Ｕにより触られたことを示す電気信号を接触データとして検出部１０ａに出力する。なお、タッチセンサ４は、出力装置２とともに一体に配置されてもよい。

検出部１０ａは、カメラ１から撮影された画像を、マイクロホン３から音声データを、およびタッチセンサ４から接触データをそれぞれ取得する。検出部１０ａは、例えば、取得した画像、音声データおよび接触データに基づいて、対象者Ｕによる出力装置２への働きかけを検出する。例えば、検出部１０ａは、特定した対象者Ｕの顔、目、鼻、耳、あるいは口等の輪郭の形状や互いの位置の関係に基づいて、対象者Ｕの顔の向きや視線の方向、あるいは対象者Ｕの表情や動作等を、対象者Ｕによる働きかけとして検出する。

また、検出部１０ａは、例えば、画像における対象者Ｕの大きさに基づいて、出力装置２から対象者Ｕまでの距離を、対象者Ｕによる働きかけの１つとして検出する。なお、例えば、測距センサが出力装置２に配置される場合に、検出部１０ａは、配置された測距センサから出力される距離の情報に基づいて、出力装置２から対象者Ｕまでの距離を検出してもよい。

また、検出部１０ａは、例えば、取得した音声データに基づいて、出力装置２の周囲で発せられた音声を検出する。検出部１０ａは、例えば、音声が検出され、撮影された画像から対象者Ｕが検出された場合、検出された対象者Ｕの口の動きと、検出された音声が発せられたタイミングとの比較から、検出された音声が対象者Ｕにより発せられた音声か否かを判定する。検出部１０ａは、対象者Ｕの口の動きと、検出された音声のタイミングとが一致する場合、対象者Ｕが音声を発したと判定し、対象者Ｕによる働きかけとして検出する。一方、検出部１０ａは、対象者Ｕの口の動きと、検出された音声のタイミングとが異なる場合、対象者Ｕと異なる人物が音声を発したと判定し、対象者Ｕによる働きかけとしない。なお、検出部１０ａは、画像から対象者Ｕを検出せず、音声を検出した場合、画像に写っていない人物を、検出した音声を発した対象者Ｕとし、検出した音声を対象者Ｕによる働きかけとして検出することが好ましい。

また、検出部１０ａは、例えば、取得した接触データに基づいて、タッチセンサ４を触った対象者Ｕを検出する。検出部１０ａは、例えば、タッチセンサ４が触られ、撮影された画像から対象者Ｕを検出した場合、対象者Ｕがタッチセンサ４を触ったと判定し、対象者Ｕによる働きかけとして検出する。一方、検出部１０ａは、画像から対象者Ｕを検出せず、タッチセンサ４が触られた場合、画像に写っていない人物を対象者Ｕとし、タッチセンサ４が触られたことを対象者Ｕによる働きかけとして検出することが好ましい。

検出部１０ａは、例えば、時刻を計時するクロック回路を含み、クロック回路から出力される時刻を示す情報を対象者Ｕによる働きかけの検出結果に付加し、１秒等の所定の時間間隔で、演算部２０ａおよび制御部４０ａにそれぞれ出力する。

演算部２０ａは、検出部１０ａにより順次に検出される対象者Ｕによる働きかけに基づいて、対象者Ｕの働きかけの特徴を示す特徴量を求める。演算部２０ａは、例えば、検出部１０ａにより検出された過去の対象者Ｕによる働きかけに基づいて、対象者Ｕの働きかけの特徴を示す特徴量を求め、求めた特徴量を推定部３０ａに出力する。また、演算部２０ａは、例えば、求めた特徴量を、検出部１０ａにより検出された対象者Ｕによる働きかけの検出結果とともに、記憶部５０に割り当てられた対象者Ｕの働きかけを示すテーブル５１の格納領域に順次に記憶する。なお、記憶部５０は、ＥＥＰＲＯＭやＲＡＭ（Random Access Memory）等である。演算部２０ａの動作については、図５から図７において説明する。

推定部３０ａは、演算部２０ａより求められた対象者Ｕの働きかけの特徴を示す特徴量に基づいて、対象者Ｕの出力装置２への働きかけの意思の強さを推定する。推定部３０ａの動作については、図８から図１０において説明する。

制御部４０ａは、検出部１０ａにより検出される対象者Ｕによる働きかけおよび推定部３０ａにより推定される対象者Ｕから出力装置２への働きかけの意思の強さに応じて、出力装置２の対象者Ｕへの働きかけを変化させる。例えば、制御部４０ａは、図１に示した制御部４０と同様に、対象者Ｕの出力装置２に対する働きかけの意思の強さに応じて、検出部１０ａで検出される対象者Ｕの働きかけに対応して、記憶部５０に予め登録された働きかけを出力装置２に実行させる。

図５から図７は、対象者Ｕの働きかけを示すテーブルの一例を示す。図５から図７に示すテーブル５１は、対象者Ｕによる働きかけが検出部１０ａにより検出された時刻、対象者Ｕによる働きかけ、主要状態、関数Ｈ’（ｔ）、距離、関数Ｉ（ｔ）および指標値の各格納領域を含む。主要状態は、対象者Ｕの働きかけの種類の中で、最も高い頻度で検出された働きかけを示し、後述する式（６）を用いて演算部２０ａにより求められテーブル５１に格納される。関数Ｈ’（ｔ）は、後述する式（４）を用いて演算部２０ａにより求められテーブル５１に格納される。関数Ｉ（ｔ）は、後述する式（５）を用いて演算部２０ａにより求められテーブル５１に格納される。距離は、出力装置２から対象者Ｕまでの距離を示し、検出部１０ａにより検出され、演算部２０ａによりテーブル５１に格納される。指標値は、対象者Ｕの出力装置２に対する働きかけの意思の強さを示し、推定部３０ａによりテーブル５１に格納される。指標値の格納領域については、推定部３０ａの動作とともに、図８から図１０において説明する。

時刻の格納領域には、演算部２０ａが、例えば、１秒等の所定の時間間隔で、検出部１０ａから受ける検出結果に付加された時刻を格納する。図５から図７に示すテーブル５１の時刻の格納領域には、例えば、１０時０分０秒から１０時０分４９秒の各時刻が格納される。

対象者Ｕの働きかけの格納領域は、例えば、“ＦＬ（Face Left）”、“ＦＲ（Face Right）”、“ＦＦ（Face Front）”、“ＥＣ（Eye Contact）”、“ＦＥ（Face Expression）”の格納領域を含む。さらに、対象者Ｕの働きかけの格納領域は、“ＧＳ（Gesture）”、“ＮＤ（Nod）”、“ＲＯ（Roll）”、“ＳＰ（Speech）”、“ＴＣ（Touch）”および“ＮＦ（No Face）”の領域を含む。なお、対象者Ｕの働きかけの種類は、これに限定されず、他の働きかけの種類を含んでもよい。

領域ＦＬは、図２（ａ）に示すように、対象者Ｕが出力装置２から見て左側の方に視線を向けていること、すなわち、働きかけ“ＦＬ”が検出された時に“１”にセットされる。領域ＦＲは、図２（ｃ）に示すように、対象者Ｕが出力装置２から見て右側の方に視線を向けていること、すなわち、働きかけ“ＦＲ”が検出された時に“１”にセットされる。領域ＦＦは、図２（ｂ）に示すように、対象者Ｕが出力装置２の方を向いているが、対象者Ｕの視線と出力装置２の向きとが一致しないこと、すなわち、働きかけ“ＦＦ”が検出された時に“１”にセットされる。領域ＥＣは、図２（ｄ）に示すように、対象者Ｕが出力装置２の方に視線を向け、対象者Ｕの視線と出力装置２の向きとが一致すること、すなわち、働きかけ“ＥＣ”が検出された時に“１”にセットされる。

また、領域ＦＥは、対象者Ｕが笑顔、怒り顔、あるいは悲しんでいる等の表情をしていること、すなわち、働きかけ“ＦＥ”が検出された時に“１”にセットされる。領域ＧＳは、対象者Ｕが手振りや身振り等の動作をしていること、すなわち、働きかけ“ＧＳ”が検出された時に“１”にセットされる。領域ＳＰは、対象者Ｕが出力装置２に発話していること、すなわち、働きかけ“ＳＰ”が検出された時に“１”にセットされる。領域ＮＤは、対象者Ｕが頭を上下に振ってうなずく動作をしていること、すなわち、働きかけ“ＮＤ”が検出された時に“１”にセットされる。領域ＲＯは、対象者Ｕが頭を左右に振る動作をしていること、すなわち、働きかけ“ＲＯ”が検出された時に“１”にセットされる。領域ＴＣは、対象者Ｕがタッチセンサ４に触れたこと、すなわち、働きかけ“ＴＣ”が検出された時に“１”にセットされる。なお、領域ＦＬ、ＦＲ、ＦＦ、ＥＣ、ＦＥ、ＧＳ、ＮＤ、ＲＯ、ＳＰおよびＴＣは、対応する働きかけが検出部１０ａにより検出されない場合、“０”にリセットされる。
領域ＮＦは、領域ＦＬ、ＦＲ、ＦＦ、ＥＣ、ＦＥ、ＧＳ、ＮＤ、ＲＯ、ＳＰおよびＴＣが全て“０”にリセットされている場合に、“１”にセットされる。すなわち、領域ＮＦは、検出部１０ａにより対象者Ｕによる働きかけが検出されなかった場合に“１”にセットされる。一方、領域ＮＦは、領域ＦＬ、ＦＲ、ＦＦ、ＥＣ、ＦＥ、ＧＳ、ＮＤ、ＲＯ、ＳＰおよびＴＣのいずれかが「１」にセットされている場合、“０”にリセットされる。

なお、図５から図７では、テーブル５１を見やすくするために、“１”にセットされた領域ＦＬ、ＦＲ、ＦＦ、ＥＣ、ＦＥ、ＧＳ、ＮＤ、ＲＯ、ＳＰ、ＴＣおよびＮＦは、網掛けで示される。

例えば、図５から図７において、領域ＮＦが“１”にセットされた１０時０分０秒から４秒、１９秒、２０秒、２２秒および３９秒から４９秒の各時刻は、対象者Ｕによる働きかけが検出部１０ａにより検出されなかったことを示す。

図５から図７において、領域ＦＦが“１”にセットされた１０時０分１５秒、１８秒、２４秒および３８秒の各時刻は、出力装置２に向いた対象者Ｕの視線が出力装置２の向きと一致しないことが、対象者Ｕによる働きかけとして検出されたことを示す。領域ＥＣが“１”にセットされた１０時０分５秒から１４秒、１６秒、１７秒、２１秒、２３秒および２５秒から３７秒の各時刻は、出力装置２に向いた対象者Ｕの視線が出力装置２の向きと一致したことが、対象者Ｕによる働きかけとして検出されたことを示す。領域ＦＥが“１”にセットされた１０時０分７秒、１３秒、１６秒および３４秒の各時刻は、対象者Ｕが笑顔、怒り顔、あるいは悲しんでいる等の表情を浮かべたことが、対象者Ｕによる働きかけとして検出されたことを示す。領域ＮＤが“１”にセットされた１０時０分１３秒の時刻は、対象者Ｕがうなずく動作をしたことが、対象者Ｕによる働きかけとして検出されたことを示す。領域ＴＣが“１”にセットされた１０時０分１７秒および１８秒の各時刻は、対象者Ｕがタッチセンサ４を触ったことが、対象者Ｕによる働きかけとして検出されたことを示す。

次に、関数Ｈ’（ｔ）の格納領域について説明する。演算部２０ａは、例えば、式（１）を用いて、現在の時刻ｔから所定の時間前までの期間における「１」の値が格納された働きかけの種類の総数Ｎ（ｔ）を求める。すなわち、働きかけの種類の総数Ｎ（ｔ）は、現在の時刻ｔから所定の時間前までの期間に一度でも図１に示した検出部１０によって検出された働きかけの種類の総数であり、対象者Ｕから出力装置２への働きかけの多彩さを示す。

ここで、“Ｔ”は、現在の時刻ｔから所定の時間前までの期間を示し、例えば、１０秒等と設定される。“ｄevent（ｔ−ｉ）”は、現在の時刻ｔからｉ秒前の時刻における領域ＦＬ、ＦＲ、ＦＦ、ＥＣ、ＦＥ、ＧＳ、ＮＤ、ＲＯ、ＳＰ、ＴＣおよびＮＦに格納された“０”または“１”の値を示す。式（１）の展開された各項に示されるように、“event”は、領域ＦＬ、ＦＲ、ＦＦ、ＥＣ、ＦＥ、ＧＳ、ＮＤ、ＲＯ、ＳＰ、ＴＣおよびＮＦのそれぞれに対応する対象者Ｕによる働きかけの種類を示す。

また、演算部２０ａは、式（２）に基づいて、領域ＦＬ、ＦＲ、ＦＦ、ＥＣ、ＦＥ、ＧＳ、ＮＤ、ＲＯ、ＳＰ、ＴＣおよびＮＦそれぞれに対応する種類の働きかけが検出された発生確率ｐevent（ｔ）を求める。“event”は、式（１）と同様に、領域ＦＬ、ＦＲ、ＦＦ、ＥＣ、ＦＥ、ＧＳ、ＮＤ、ＲＯ、ＳＰ、ＴＣおよびＮＦのそれぞれに対応する対象者Ｕによる働きかけの種類を示す。

演算部２０ａは、求めた各種類の働きかけの発生確率ｐevent（ｔ）を式（３）に代入して、例えば、対象者Ｕによる働きかけのばらつきを示す平均情報量である関数Ｈ（ｔ）を求める。

そして、演算部２０ａは、式（４）に基づいて、求めた平均情報量Ｈ（ｔ）から関数Ｈ’（ｔ）に変換する。つまり、演算部２０ａは、平均情報量Ｈ（ｔ）が増加する場合、現在の時刻ｔの平均情報量Ｈ（ｔ）の値を現在の時刻ｔの関数Ｈ’（ｔ）の値とする。一方、演算部２０ａは、平均情報量Ｈ（ｔ）が減少する場合、現在の時刻ｔの平均情報量Ｈ（ｔ）と１秒前の関数Ｈ（ｔ−１）との値を平均した値を関数Ｈ’（ｔ）の値とする。以下の説明では、関数Ｈ’（ｔ）の値は、平滑化された平均情報量と称される。

平均情報量をＨ（ｔ）からＨ’（ｔ）に変換することで、新奇な刺激に対しては急激に興味を持つ対象者Ｕの反応を示し、興味の低下時には過去の記憶を保持することで、対象者Ｕの出力装置２への働きかけの意思の度合いが断続的になることを抑制できる。この結果、推定部３０ａは、対象者Ｕの出力装置２への働きかけの意思の強さを精度良く推定することができる。演算部２０ａは、求めた平滑化された平均情報量Ｈ’（ｔ）の値を平滑化された平均情報量Ｈ’（ｔ）の格納領域に格納する。

例えば、演算部２０ａは、式（５）を用いて、平滑化された平均情報量Ｈ’（ｔ）に対して出力装置２から対象者Ｕまでの距離を重み付けした関数Ｉ（ｔ）を、対象者Ｕによる働きかけのばらつきの大きさを示す分散情報として求める。以下の説明では、関数Ｉ（ｔ）の値は、インタラクション意思値と称する。

ここで、式（５）に含まれる定数Ｘは、対象者Ｕが出力装置２に対して親しみを持っていることを示す対人距離を示す。例えば、定数Ｘは、０．５メートル等の距離に設定される。また、式（５）に含まれる変数Ｄｉｓ（ｔ）は、検出部１０ａにより検出された出力装置２から対象者Ｕまでの距離を示し、図５から図７に示すテーブル５１の距離の格納領域に格納された値である。演算部２０ａは、求めたインタラクション意思値Ｉ（ｔ）の値を、テーブル５１の関数Ｉ（ｔ）の格納領域に格納する。なお、演算部２０ａは、インタラクション意思値Ｉ（ｔ）を、対象者Ｕによる働きかけのばらつきの大きさを示す分散情報として求めたが、これに限定されない。例えば、演算部２０ａは、平均情報量Ｈ（ｔ）や平滑化された平均情報量Ｈ’（ｔ）を、対象者Ｕによる働きかけのばらつきの大きさを示す分散情報として求めてもよい。

また、演算部２０ａは、例えば、求めた各種類の働きかけが検出された発生確率ｐeventのうち、式（６）に基づいて、最も高い発生確率で検出された働きかけを、対象者Ｕの主要状態と判定する。

演算部２０ａは、主要状態と判定した働きかけを、図５から図７に示すテーブル５１の主要状態の格納領域に格納する。主要状態は、図４に示した検出部１０ａにより検出された対象者Ｕによる働きかけの種類の中で、他の種類より高い頻度で検出された働きかけを示す指向情報の一例である。

図８は、対象者Ｕの出力装置２に対する働きかけの意思の強さの定義の例を示す。図８に示すように、対象者Ｕの出力装置２に対する働きかけの意思の強さは、例えば、４段階の指標値Ｓ（ｔ）によって定義される。なお、対象者Ｕの出力装置２に対する働きかけの意思の強さは、４段階に限定されず、２以上の複数の指標値Ｓ（ｔ）で定義されることが好ましい。

例えば、推定部３０ａが指標値Ｓ（ｔ）を“０”にセットした場合には、画像、音声データおよび接触データから、対象者Ｕの働きかけが検出部１０ａにより検出されないことを示す。推定部３０ａが指標値Ｓ（ｔ）を“１”にセットした場合には、例えば、画像、音声データおよび接触データのいずれかから対象者Ｕの働きかけが検出部１０ａにより検出されたことを示す。また、推定部３０ａが指標値Ｓ（ｔ）を“１”にセットした場合には、対象者Ｕが出力装置２に対して働きかけの意思がない場合にも適用される。推定部３０ａが指標値Ｓ（ｔ）を“２”にセットした場合には、対象者Ｕが出力装置２に対して働きかけの意思があることを示す。推定部３０ａが指標値Ｓ（ｔ）を“３”にセットした場合には、出力装置２に対する対象者Ｕの働きかけの意思が、指標値Ｓ（ｔ）が“２”にセットされた場合より強いことを示す。

図９は、図４に示す推定部３０ａが指標値Ｓ（ｔ）の推定に用いる遷移条件のテーブルの一例を示す。図９に示すテーブル５２は、例えば、記憶部５０に割り当てられた格納領域に予め記憶される。テーブル５２は、遷移条件、現在の時刻ｔより１秒前の過去の指標値Ｓ（ｔ−１）および現在の時刻ｔにおける現在の指標値Ｓ（ｔ）の格納領域を含む。

遷移条件の格納領域の１行目は、例えば、検出部１０ａが、画像、音声データおよび接触データから、現在の時刻ｔから１秒前において対象者Ｕの働きかけを検出しなかった場合で、現在の時刻ｔにおいて対象者Ｕの働きかけを検出した場合の遷移条件を示す。例えば、推定部３０ａは、図５から図７に示すテーブル５１から、現在の時刻ｔより１秒前の時刻における指標値の格納領域に格納された値を、過去の指標値Ｓ（ｔ−１）として読み込む。推定部３０ａは、読み込んだ過去の指標値Ｓ（ｔ−１）が“０”で、現在の時刻ｔに検出部１０ａより対象者Ｕによる働きかけを検出したという結果を受けた場合、「対象者を検出（DETECT＿HUMAN）」と判定する。推定部３０ａは、過去の指標値Ｓ（ｔ−１）の“０”から現在の指標値Ｓ（ｔ）を“１”に遷移させる。そして、推定部３０ａは、現在の指標値Ｓ（ｔ）の値を、テーブル５１の現在の時刻ｔにおける指標値の格納領域に格納する。

図９に示す遷移条件の格納領域の２行目は、例えば、検出部１０ａが、画像、音声データおよび接触データから、一定の期間以上に亘って対象者Ｕの働きかけを検出しなかった場合の遷移条件を示す。例えば、図５から図７に示すテーブル５１において、現在の時刻ｔから一定の期間前までに亘って、領域ＮＦが連続して“１”にセットされた場合、推定部３０ａは、「対象者を不検出（LOST＿HUMAN）」と判定する。推定部３０ａは、指標値Ｓ（ｔ−１）の“Ｙ”から指標値Ｓ（ｔ）を“０”に遷移させる。また、推定部３０ａは、現在の指標値Ｓ（ｔ）を、テーブル５１の現在の時刻ｔにおける指標値の格納領域に格納する。ここで、過去の指標値Ｓ（ｔ−１）の“Ｙ”は、“１”、“２”および“３”のいずれかを示す。

また、一定の期間は、例えば、２０秒以上等に設定される。すなわち、現在の時刻ｔにおいて、検出部１０ａにより対象者Ｕによる働きかけが検出されず、演算部２０ａにより領域ＮＦが“１”にセットされたとしても、推定部３０ａは、「対象者を不検出（LOST＿HUMAN）」と直ちに判定しない。例えば、出力装置２が、インタラクション装置１００ａからの制御に応じて、対象者Ｕの働きかけを追跡する場合に、対象者Ｕがカメラ１の撮影範囲から一瞬外れる場合がある。対象者Ｕがカメラ１の撮影範囲から外れる度に、推定部３０ａが「対象者を不検出（LOST＿HUMAN）」と判定した場合、インタラクション装置１００ａによる出力装置２の動作は不自然となる。そこで、出力装置２の動作が不自然とならないように、推定部３０ａは、現在の時刻ｔから一定の期間前までの領域ＮＦに“１”が連続してセットされた場合に、「対象者を不検出（LOST＿HUMAN）」と判定する。

図９に示す遷移条件の格納領域の３行目から５行目は、推定部３０ａが、指標値Ｓ（ｔ）を“１”から“２”、“２”から“３”、あるいは“３”から“２”に遷移させる遷移条件を示す。例えば、推定部３０ａは、図５から図７に示すテーブル５１において、現在の時刻ｔより１秒前の時刻における指標値の格納領域に格納された値を、過去の指標値Ｓ（ｔ−１）として読み込む。演算部２０ａにより求められた現在の時刻ｔの主要状態が働きかけ“ＦＦ”または“ＥＣ”で、インタラクション意思値Ｉ（ｔ）が閾値Ｔｈ１２より大きい場合、推定部３０ａは、指標値Ｓ（ｔ−１）の“１”から指標値Ｓ（ｔ）を“２”に遷移させる。また、演算部２０ａにより求められた現在の時刻ｔの主要状態が働きかけ“ＦＦ”または“ＥＣ”で、インタラクション意思値Ｉ（ｔ）が閾値Ｔｈ２３より大きい場合、推定部３０ａは、指標値Ｓ（ｔ−１）の“２”から指標値Ｓ（ｔ）を“３”に遷移させる。また、演算部２０ａにより算出された現在の時刻ｔの主要状態が働きかけ“ＦＦ”または“ＥＣ”で、インタラクション意思値Ｉ（ｔ）が閾値Ｔｈ３２より小さい場合、推定部３０ａは、指標値Ｓ（ｔ−１）の“３”から指標値Ｓ（ｔ）を“２”に遷移させる。そして、推定部３０ａは、現在の指標値Ｓ（ｔ）を、テーブル５１の現在の時刻ｔにおける指標値の格納領域に格納する。

図９に示す遷移条件の格納領域の６行目および７行目は、推定部３０ａが、指標値Ｓ（ｔ）を“２”から“１”または“３”から“１”に遷移させる遷移条件を示す。例えば、推定部３０ａは、図５から図７に示すテーブル５１において、現在の時刻ｔから１秒前の時刻における指標値の格納領域に格納された値を、過去の指標値Ｓ（ｔ−１）として読み込む。読み込んだ過去の指標値Ｓ（ｔ−１）が“２”または“３”の場合で、演算部２０ａにより求められた現在の時刻ｔのインタラクション意思値Ｉ（ｔ）が閾値Ｔｈ２１より小さい場合、推定部３０ａは、現在の指標値Ｓ（ｔ）を“１”に遷移させる。そして、推定部３０ａは、現在の指標値Ｓ（ｔ）を、テーブル５１の現在の時刻ｔにおける指標値の格納領域に格納する。

なお、推定部３０ａは、図９に示す遷移条件のいずれも満たさない場合、過去の指標値Ｓ（ｔ−１）の値を現在の時刻ｔの指標値Ｓ（ｔ）として維持し、テーブル５１の現在の時刻ｔにおける指標値の格納領域に格納する。

図１０は、対象者Ｕのインタラクション意思値Ｉ（ｔ）、指標値Ｓ（ｔ）および主要状態の時間変化の一例を示す。図１０に示すように、横軸は、例えば、図５から図７に示すテーブル５１の時刻を含む１０時０分０秒から５０秒の範囲の時刻を示す。縦軸は、対象者Ｕのインタラクション意思値Ｉ（ｔ）を示す。そして、図１０は、図５から図７に示すテーブル５１に格納されたインタラクション意思値Ｉ（ｔ）の値を破線の折れ線で示す。また、図１０に示すグラフの上段には、推定部３０ａにより推定された対象者Ｕの出力装置２に対する働きかけの意思の強さを示す指標値Ｓ（ｔ）と、演算部２０ａにより求められた対象者Ｕの主要状態とを示す。また、図１０に示すように、図９に示すテーブル５２における遷移条件の閾値Ｔｈ１２，Ｔｈ２３，Ｔｈ３２，Ｔｈ２１は、例えば、“１．０”，“２．０”，“１．５”，“０．５”にそれぞれ設定される。なお、閾値Ｔｈ１２，Ｔｈ２３，Ｔｈ３２，Ｔｈ２１は、“１．０”，“２．０”，“１．５”，“０．５”にそれぞれ設定されたが、これに限定されない。推定部３０ａは、閾値Ｔｈ１２，Ｔｈ２３，Ｔｈ３２，Ｔｈ２１として、例えば、対象者Ｕの性別や年齢に応じて予め設定した値を用いてもよい。また、閾値Ｔｈ１２と閾値Ｔｈ２１とは同じ値に設定され、閾値Ｔｈ２３と閾値Ｔｈ３２とは同じ値に設定されてもよい。また、推定部３０ａは、例えば、対象者Ｕからの出力装置２への働きかけをもとに学習し、閾値Ｔｈ１２，Ｔｈ２３，Ｔｈ３２，Ｔｈ２１の値を適宜変更してもよい。

図１０に示すように、１０時０分０秒から４秒の各時刻において、インタラクション意思値Ｉ（ｔ）は“０”の値を示す。これは、図５に示すように、１０時０分０秒から４秒の各時刻において、領域ＮＦが“１”にセットされ、対象者Ｕの働きかけが検出部１０ａにより検出されなかったことによる。なお、１０時０分０秒から一定の期間前までの領域ＮＦに“１”が連続してセットされているものとする。これにより、１０時０分０秒から４秒の各時刻において、演算部２０ａは、式（１）から式（５）に基づいて、インタラクション意思値Ｉ（ｔ）として“０”の値を算出する。また、１０時０分０秒から４秒の各時刻から一定の期間前までの領域ＮＦに“１”が連続してセットされることから、推定部３０ａは、テーブル５２の遷移条件に基づいて、「対象者を不検出（LOST＿HUMAN）」と判定する。推定部３０ａは、１０時０分０秒から４秒の各時刻の指標値Ｓ（ｔ）を“０”にセットする。

なお、１０時０分０秒からの５秒間の期間において、推定部３０ａが「対象者を不検出（LOST＿HUMAN）」と判定したが、図５に示すように、距離の格納領域には、例えば、検出部１０ａにより最後に検出された対象者Ｕの距離が格納される。ただし、推定部３０ａが「対象者を不検出（LOST＿HUMAN）」と判定した場合には、例えば、距離の格納領域に“０”の値が格納されてもよいし、測距センサ等を用いて検出部１０ａにより検出された壁や柱等の距離が格納されてもよい。

図５に示すように、１０時０分５秒の時刻において、検出部１０ａにより、対象者Ｕによる働きかけ“ＥＣ”の検出を示す領域ＥＣが“１”にセットされる。対象者Ｕによる新たな働きかけ（この例では“ＥＣ”）の検出により、検出された働きかけの種類が増えたことから、演算部２０ａは、例えば、“０”より大きなインタラクション意思値Ｉ（ｔ）を算出する。また、１０時０分５秒の時刻に対象者Ｕによる働きかけが検出部１０ａより検出されたことから、推定部３０ａは、「対象者を不検出（LOST＿HUMAN）」の状態から、「対象者を検出（DETECT＿HUMAN）」と判定する。そして、推定部３０ａは、１秒前の時刻である１０時０分４秒の指標値Ｓ（ｔ−１）が“０”から指標値Ｓ（ｔ）を“１”に遷移させる条件が満たされたと判定し、１０時０分５秒の指標値Ｓ（ｔ）を“１”にセットする。なお、１０時０分５の時刻までのＴ秒間では、領域ＮＦに対応する働きかけの発生確率が、領域ＥＣに対応する働きかけの発生確率より大きいことから、演算部２０ａは、１０時０分５秒の時刻の主要状態を領域ＮＦに対応する働きかけとする。

図５に示すように、時刻１０時０分６秒からの８秒間に亘って、働きかけ“ＥＣ”が、検出され、時刻１０時０分７秒に働きかけ“ＦＥ”が検出され、時刻１０時０分１３秒に働きかけ“ＦＥ”と働きかけ“ＮＤ”とが検出される。また、図５に示すように、時刻１０時０分６秒からの８秒間の期間に、検出された距離が小さくなることから、検出された対象者Ｕが出力装置２に近づいて来ることを示す。すなわち、時刻１０時０分６秒からの８秒間の期間に、検出された働きかけの種類を示す総数Ｎ（ｔ）が増加し、出力装置２と対象者Ｕとの距離が短くなることで、図１０に示すように、演算部２０ａにより求められるインタラクション意思値Ｉ（ｔ）が増加する。また、時刻１０時０分９秒において、働きかけ“ＥＣ”が検出された発生確率が、働きかけ“ＮＦ”が検出された発生確率より大きくなることから、演算部２０ａは、対象者Ｕの主要状態を働きかけ“ＥＣ”とする。ただし、図１０に示すように、時刻１０時０分９秒からの６秒間において、主要状態は働きかけ“ＥＣ”となるが、演算部２０ａにより求められたインタラクション意思値Ｉ（ｔ）は閾値Ｔｈ１２以下である。したがって、推定部３０ａは、図９に示すテーブル５２の遷移条件に基づき、現在の指標値Ｓ（ｔ）を“１”に遷移させる。

図５に示すように、時刻１０時０分１５秒からの６秒間の期間において、検出された対象者Ｕが出力装置２にさらに近づくとともに、検出された働きかけの種類を示す総数Ｎ（ｔ）が増加する。これにより、図１０に示すように、演算部２０ａにより求められたインタラクション意思値Ｉ（ｔ）はさらに増加する。図１０に示すように、時刻１０時０分１５秒において、演算部２０ａは、閾値Ｔｈ１２より大きいインタラクション意思値Ｉ（ｔ）を算出し、主要状態として働きかけ“ＥＣ”を求める。推定部３０ａは、図９に示すテーブル５２の遷移条件に基づき、指標値Ｓ（ｔ−１）の“１”から指標値Ｓ（ｔ）の“２”に遷移させる。また、時刻１０時０分１７秒において、演算部２０ａは、閾値Ｔｈ２３より大きいインタラクション意思値Ｉ（ｔ）を算出し、主要状態として働きかけ“ＥＣ”を求めることから、推定部３０ａは、指標値Ｓ（ｔ−１）の“２”から指標値Ｓ（ｔ）の“３”に遷移させる。

なお、図６に示すように、時刻１０時０分１９秒および２０秒において、領域ＮＦが“１”にセットされることから、検出部１０ａが、対象者Ｕの働きかけを見失ったことを示す。しかしながら、図５および図６に示すように、１０時０分１９秒および２０秒から一定の期間前において、領域ＮＦに“１”が連続してセットされていないことから、推定部３０ａは、「対象者を不検出（LOST＿HUMAN）」と判定しない。そして、推定部３０ａは、指標値Ｓ（ｔ）を“３”に維持する。

図５および図６に示すように、時刻１０時０分２１秒からの１７秒間の期間において、検出された対象者Ｕが出力装置２から遠ざかるとともに、検出された働きかけの種類を示す総数Ｎ（ｔ）が減少する。これにより、図１０に示すように、演算部２０ａにより求められたインタラクション意思値Ｉ（ｔ）は減少に転じる。時刻１０時０分２４秒において、演算部２０ａは、閾値Ｔｈ３２より小さいインタラクション意思値Ｉ（ｔ）を算出し、主要状態として働きかけ“ＥＣ”を求める。推定部３０ａは、図９に示すテーブル５２の遷移条件に基づき、指標値Ｓ（ｔ−１）の“３”から指標値Ｓ（ｔ）の“２”に遷移させる。また、時刻１０時０分３２秒において、演算部２０ａは、閾値Ｔｈ２１より小さいインタラクション意思値Ｉ（ｔ）を算出し、推定部３０ａは、テーブル５２の遷移条件に基づき、指標値Ｓ（ｔ−１）の“２”から指標値Ｓ（ｔ）の“１”に遷移させる。

なお、図１０に示すように、時刻１０時０分３８秒から１２秒間の期間において、インタラクション意思値Ｉ（ｔ）が一時的に増加する。これは、図７に示すように、検出部１０ａは、時刻１０時０分３８秒からの１２秒間の期間において、働きかけ“ＦＦ”および働きかけ“ＮＦ”のいずれかを検出する。また、検出部１０ａは、時刻１０時０分３８秒から１０秒前の時刻１０時０分２９秒までの期間において働きかけ“ＥＣ”を、時刻１０時０分３４秒に働きかけ“ＦＥ”をそれぞれ検出する。つまり、時刻１０時０分３８秒から１２秒間の期間において、検出された働きかけの種類を示す総数Ｎ（ｔ）が一時的に増加したために、インタラクション意思値Ｉ（ｔ）が一時的に増加した。ただし、時刻１０時０分３８秒からの１２秒間の期間において、演算部２０ａにより求められたインタラクション意思値Ｉ（ｔ）は、閾値Ｔｈ１２以下であることから、推定部３０ａは、テーブル５２の遷移条件に基づき、指標値Ｓ（ｔ）を“１”に維持する。そして、時刻１０時０分４９秒以降において、一定の期間に亘って、領域ＮＦに“１”が連続してセットされた場合、推定部３０ａは、「対象者を不検出（LOST＿HUMAN）」と判定し、指標値Ｓ（ｔ）を“０”に遷移させる。

図１１は、図４に示したインタラクション装置１００ａにおけるインタラクション処理の例を示す。ステップＳ１００，Ｓ１１０，Ｓ１２０，Ｓ１３０およびＳ１４０は、インタラクション装置１００ａに搭載されるプロセッサがインタラクションプログラムを実行することにより実行される。すなわち、図１１は、インタラクションプログラムおよびインタラクション方法の別実施形態を示す。この場合、図４に示した検出部１０ａ、演算部２０ａ、推定部３０ａおよび制御部４０ａは、インタラクションプログラムの実行により実現される。なお、図１１に示す処理は、インタラクション装置１００ａに搭載されるハードウェアにより実行されてもよい。この場合、図４に示した検出部１０ａ、演算部２０ａ、推定部３０ａおよび制御部４０ａは、インタラクション装置１００ａ内に配置される回路により実現される。

ステップＳ１００において、検出部１０ａは、カメラ１により撮影された画像、マイクロホン３により取得された音声データ、およびタッチセンサ４により取得された接触データに基づいて、図４で説明したように、対象者Ｕによる働きかけを検出する。

次に、ステップＳ１１０において、演算部２０ａは、検出部１０ａにより順次に検出される対象者Ｕによる働きかけに基づいて、図４から図７で説明したように、対象者Ｕの働きかけの特徴を示す特徴量を求める。演算部２０ａは、例えば、式（１）から式（６）を用いて求めた特徴量を推定部３０ａに出力する。また、演算部２０ａは、求めた特徴量を、検出部１０ａにより検出された対象者Ｕによる働きかけの検出結果とともに、図５から図７に示すテーブル５１に順次に格納する。

次に、ステップＳ１２０において、推定部３０ａは、演算部２０ａから受けた対象者Ｕの働きかけの特徴を示す特徴量と、図９に示すテーブル５２の遷移条件とに基づいて、対象者Ｕの出力装置２への働きかけの意思の強さとして指標値Ｓ（ｔ）の値を推定する。推定部３０ａは、推定した指標値Ｓ（ｔ）を制御部４０に出力する。

次に、ステップＳ１３０において、制御部４０ａは、検出部１０ａにより検出された対象者Ｕによる働きかけおよび推定部３０ａにより推定された対象者Ｕの意思の強さに応じて、出力装置２の対象者Ｕへの働きかけを変化させる。

次に、ステップＳ１４０において、インタラクション装置１００ａは、例えば、インタラクション装置１００ａに含まれるキーボードやタッチパネル等の入力装置を介して、終了指示を受けたか否かを判定する。インタラクション装置１００ａは、終了指示を受けた場合（ＹＥＳ）、一連の処理を終了する。一方、インタラクション装置１００ａは、終了指示を受けていない場合（ＮＯ）、処理をステップＳ１００に移行する。

以上、この実施形態では、演算部２０ａは、検出部１０ａに検出された対象者Ｕによる働きかけに基づいて、対象者Ｕの働きかけの特徴を示す特徴量として、式（１）から式（６）を用い対象者Ｕのインタラクション意思値Ｉ（ｔ）と主要意思とを求める。推定部３０ａは、演算部２０ａで求められた特徴量と図９に示すテーブル５２の遷移条件とに基づいて、対象者Ｕの出力装置２への働きかけの意思の強さを推定する。制御部４０は、検出された対象者Ｕによる働きかけおよび推定された対象者Ｕの意思の強さに応じて、出力装置２の対象者Ｕへの働きかけを変化させる。これにより、インタラクション装置１００ａは、例えば、対象者Ｕの出力装置２への働きかけの意思が強いことが推定された場合に、出力装置２による対象者Ｕへの働きかけを行わせることができる。すなわち、インタラクション装置１００ａは、出力装置２を介して、対象者Ｕが違和感を持ちにくいタイミングで、対象者Ｕへの働きかけを行わせることができる。

また、推定部３０ａが、演算部２０ａにより求められた特徴量とともに、図９に示すテーブル５２の遷移条件を用いることで、対象者Ｕの働きかけの意思の強さをロバストに推定することができ、対象者Ｕに配慮した出力装置２の働きかけが可能となる。

なお、検出部１０ａは、取得した音声データに基づいて、出力装置２の周囲で発せられた音声を検出したが、これに限定されない。例えば、検出部１０ａは、音声データに対して音声認識の処理を施し、対象者Ｕによる働きかけを検出してもよい。

なお、検出部１０ａにより検出される対象者Ｕは１人としたが、これに限定されない。例えば、検出部１０ａが、複数の対象者Ｕを検出した場合、検出した各対象者Ｕを識別する識別子を検出された各対象者Ｕによる働きかけの検出結果に付加するのがよい。演算部２０ａは、付加された識別子に基づいて、各対象者Ｕの働きかけの特徴を示す特徴量をそれぞれ求め、推定部３０ａは、検出結果と各対象者Ｕの特徴量とに基づいて、各対象者Ｕの出力装置２への働きかけの意思の強さをそれぞれ推定するのがよい。

なお、領域ＮＦは、領域ＦＬ、ＦＲ、ＦＦ、ＥＣ、ＦＥ、ＧＳ、ＮＤ、ＲＯ、ＳＰおよびＴＣが全て“０”にリセットされている場合に、“１”にセットされるとしたが、これに限定されない。例えば、検出部１０ａが、音声データや接触データから対象者Ｕの働きかけを検出し、検出された対象者Ｕが画像に撮影されていない場合、演算部２０ａは、領域ＳＰや領域ＴＣを“１”にセットするとともに、領域ＮＦを“１”にセットしてもよい。

なお、演算部２０ａは、インタラクション意思値Ｉ（ｔ）を求めるにあたり、式（４）に基づいて、平均情報量Ｈ（ｔ）を平滑化された平均情報量Ｈ’（ｔ）に変換したが、これに限定されない。例えば、演算部２０ａは、平均情報量Ｈ（ｔ）が減少する場合、現在の時刻ｔの平均情報量Ｈ（ｔ）の値より１秒前の平均情報量Ｈ（ｔ−１）の値を重み付けして、平滑化された平均情報量Ｈ’（ｔ）の値を算出してもよい。あるいは、演算部２０ａは、平均情報量Ｈ（ｔ）の値に対して、窓関数やローパスフィルタ等を用いた加重平均処理を施し、平滑化された平均情報量Ｈ’（ｔ）として求めてもよい。

なお、演算部２０ａは、式（３）に基づいて、平均情報量Ｈ（ｔ）を算出したがこれに限定されない。例えば、演算部２０ａは、式（７）に基づいて、平均情報量Ｈ（ｔ）を算出してもよい。

ここで、“ｐ１event”は、eventごとの働きかけが検出された発生確率を示し、“ｐ１event・ｌｏｇ２（ｐ１event）”の値は、eventごとに予め計算され記憶部５０に記憶される。演算部２０ａは、記憶部５０から記憶されたｐ１event・ｌｏｇ２（ｐ１event）の値を読み込み、式（７）に基づいて、平均情報量Ｈ（ｔ）を算出する。ｐ１event・ｌｏｇ２（ｐ１event）の値が予め計算されていることにより、演算部２０ａは、発生確率および発生確率の対数の計算を省略することができ、演算部２０ａの演算量を式(3)を用いる場合と比べて削減することができる。

図１２は、インタラクション装置の別実施形態を示す。なお、図１２に示すインタラクション装置１００ｂの各要素のうち、図４に示すインタラクション装置１００ａの要素と同一または同様の機能を有するものについては、同一の符号を付し説明を省略する。ただし、演算部２０ａは、検出部１０ａにより順次に検出される対象者Ｕによる働きかけに基づいて、算出した対象者Ｕの働きかけの特徴を示す特徴量を推定部３０ａとともに、判定部６０に出力する。

判定部６０は、例えば、演算部２０ａにより求められた対象者Ｕの働きかけの特徴を示す特徴量に基づいて、対象者Ｕが所定の働きかけに偏っているか否かを判定する。

ここで、例えば、働きかけ“ＥＣ”が連続して検出され、他の種類の働きが検出されない状態が続いている場合に、対象者Ｕは、出力装置２への働きかけの意思がなく、単に出力装置２を眺めている可能性が高い。このような場合に、演算部２０ａによって求められる平均情報量Ｈ（ｔ）およびインタラクション意思値Ｉ（ｔ）は“０”または“０”に近い値となる。なお、他の種類の働きかけである働きかけ“ＦＬ”、“ＦＲ”、“ＦＦ”、“ＦＥ”、“ＧＳ”、“ＮＤ”、“ＲＯ”、“ＳＰ”、“ＴＣ”および“ＮＦ”についても同様である。

そこで、判定部６０は、演算部２０ａにより求められた特徴量のうち、平均情報量Ｈ（ｔ）および主要状態に基づいて、例えば、平均情報量Ｈ（ｔ）が所定値以下である場合、対象者Ｕが、所定の働きかけである主要状態に偏っていると判定する。一方、受けた平均情報量Ｈ（ｔ）の値が所定値より大きい場合、判定部６０は、対象者Ｕが所定の働きかけである主要状態に偏っていないと判定する。判定部６０は、判定結果を制御部４０ｂに出力する。なお、判定部６０は、関数Ｈ（ｔ）と主要状態とに基づいて判定したが、これに限定されない。例えば、判定部６０は、主要状態とともに、インタラクション意思値Ｉ（ｔ）または平滑化された平均情報量Ｈ’（ｔ）に基づいて判定してもよい。また、所定値は、判定部６０の判定精度に応じて設定されるのが好ましい。

制御部４０ｂは、検出部１０ａにより検出された対象者Ｕによる働きかけ、推定部３０により推定される対象者Ｕから出力装置２への働きかけの意思の強さ、および判定部６０の判定結果に応じて、出力装置２の対象者Ｕへの働きかけを変化させる。例えば、制御部４０ｂは、図１に示した制御部４０と同様に、対象者Ｕの出力装置２に対する働きかけの意思の強さに応じて、検出部１０ａで検出される対象者Ｕの働きかけに対応して、記憶部５０に予め登録された働きかけを出力装置２に実行させる。

図１３は、図１２に示したインタラクション装置１００ｂにおけるインタラクション処理の例を示す。なお、図１３に示す処理のうち、図１１に示す処理と同一または同様の処理については、同一のステップの符号を付し説明を省略する。図１３に示す処理は、インタラクション装置１００ｂに搭載されるプロセッサがインタラクションプログラムを実行することにより実行される。すなわち、図１３は、インタラクションプログラムおよびインタラクション方法の別実施形態を示す。この場合、図１２に示した検出部１０ａ、演算部２０ａ、推定部３０ａ、制御部４０ｂおよび判定部６０は、インタラクションプログラムの実行により実現される。なお、図１３に示す処理は、インタラクション装置１００ｂに搭載されるハードウェアにより実行されてもよい。この場合、図１２に示した検出部１０ａ、演算部２０ａ、推定部３０ａ、制御部４０ｂおよび判定部６０は、インタラクション装置１００ｂ内に配置される回路により実現される。

ステップＳ１１０ａにおいて、演算部２０ａは、検出部１０ａにより順次に検出される対象者Ｕによる働きかけに基づいて、図４から図７で説明したように、対象者Ｕの働きかけの特徴を示す特徴量を求める。演算部２０ａは、算出した対象者Ｕの働きかけの特徴を示す特徴量を推定部３０ａおよび判定部６０にそれぞれ出力する。

ステップＳ１２５において、判定部６０は、演算部２０ａから受けた対象者Ｕの働きかけの特徴を示す特徴量に基づいて、図１２で説明したように、対象者Ｕが所定の働きかけに偏っているか否かを判定する。判定部６０は、判定結果を制御部４０ｂに出力する。

次に、ステップＳ１３０ａにおいて、制御部４０ｂは、検出部１０ａにより検出された対象者Ｕの働きかけ、推定部３０ａにより推定された対象者Ｕの意思の強さ、および判定部６０の判定結果に応じて、出力装置２の対象者Ｕへの働きかけを変化させる。

次に、ステップＳ１４０ａにおいて、インタラクション装置１００ｂは、例えば、インタラクション装置１００ｂに含まれるキーボードやタッチパネル等の入力装置を介して、終了指示を受けたか否かを判定する。インタラクション装置１００ｂは、終了指示を受けた場合（ＹＥＳ）、一連の処理を終了する。一方、インタラクション装置１００ｂは、終了指示を受けていない場合（ＮＯ）、処理をステップＳ１００に移行する。

以上、この実施形態では、演算部２０ａは、検出部１０ａに検出された対象者Ｕによる働きかけに基づいて、対象者Ｕの働きかけの特徴を示す特徴量として、式（１）から式（６）を用い対象者Ｕのインタラクション意思値Ｉ（ｔ）と主要意思とを求める。推定部３０ａは、演算部２０ａで求められた特徴量と図９に示すテーブル５２の遷移条件とに基づいて、対象者Ｕの出力装置２への働きかけの意思の強さを推定する。また、判定部６０は、演算部２０ａにより求められた特徴量に基づいて、対象者Ｕが所定の働きかけに偏っているか否かを判定する。制御部４０ａは、検出された対象者Ｕによる働きかけ、推定された対象者Ｕの意思の強さおよび判定部６０の判定結果に応じて、出力装置２の対象者Ｕへの働きかけを変化させる。例えば、対象者Ｕが出力装置２を漫然と眺めている場合等、対象者Ｕからの働きかけが偏っていると判定した場合に、制御部４０ａは、対象者Ｕの働きかけの意思がない場合と同様の働きかけを出力装置２に行わせる。これにより、インタラクション装置１００ｂは、出力装置２を介して、対象者Ｕが違和感を持ちにくいタイミングで、対象者Ｕへの働きかけを行わせることができる。

なお、検出部１０ａにより検出される対象者Ｕは１人としたが、これに限定されない。例えば、検出部１０ａが、複数の対象者Ｕを検出した場合、検出した各対象者Ｕを識別する識別子を検出された各対象者Ｕによる働きかけの検出結果に付加するのがよい。演算部２０ａは、付加された識別子に基づいて、各対象者Ｕの働きかけの特徴を示す特徴量をそれぞれ求め、推定部３０ａは、検出結果と各対象者Ｕの特徴量とに基づいて、各対象者Ｕの出力装置２への働きかけの意思の強さをそれぞれ推定するのがよい。また、判定部６０は、各対象者Ｕの特徴量に基づいて、対象者Ｕが所定の働きかけに偏っているか否かを判定するのがよい。

なお、検出部１０ｂは、図４から図１１で説明した実施形態と同様に、音声データや接触データから対象者Ｕの働きかけ“ＳＰ”や働きかけ“ＴＣ”を検出した場合でも、対象者Ｕが画像に撮影されていない場合に、働きかけ“ＮＦ”を検出してもよい。

なお、演算部２０ａは、図４から図１１で説明した実施形態と同様に、インタラクション意思値Ｉ（ｔ）を求めるために、平均情報量Ｈ（ｔ）の値より１秒前の平均情報量Ｈ（ｔ−１）の値を重み付けし、平滑化された平均情報量Ｈ’（ｔ）の値を算出してもよい。あるいは、演算部２０ａは、平均情報量Ｈ（ｔ）の値に対して、窓関数やローパスフィルタ等を用いた加重平均処理を施すことで、平滑化された平均情報量Ｈ’（ｔ）を求めてもよい。

なお、演算部２０ａは、図４から図１１で説明した実施形態と同様に、平均情報量Ｈ（ｔ）の算出に、式（７）を用いてもよい。

図１４は、インタラクション装置の別実施形態を示す。なお、図１４に示すインタラクション装置１００ｃの各要素のうち、図１２に示すインタラクション装置１００ｂの要素と同一または同様の機能を有するものについては、同一の符号を付し説明を省略する。

検出部１０ｂは、カメラ１から撮影された画像を、マイクロホン３から音声データを、およびタッチセンサ４から接触データをそれぞれ取得する。検出部１０ｂは、例えば、取得した画像、音声データおよび接触データに基づいて、図４に示した検出部１０ａと同様に、対象者Ｕによる出力装置２への働きかけを検出する。また、検出部１０ｂは、図４に示した検出部１０ａと同様に、例えば、画像における対象者Ｕの大きさに基づいて、出力装置２から対象者Ｕまでの距離を、対象者Ｕによる働きかけの１つとして検出する。

例えば、検出部１０ｂは、複数の対象者Ｕを検出した場合、検出した各対象者Ｕを識別する識別子Ｋ（１）−Ｋ（Ｍ）を検出された対象者Ｕによる働きかけの検出結果に付加する。検出部１０ｂは、識別子Ｋ（１）−Ｋ（Ｍ）が付加された検出結果を、制御部４０ｃおよび処理部７０（７０（１）−７０（Ｍ））に出力する（Ｍは正の整数）。

処理部７０（１）−７０（Ｍ）は、演算部２０ｂ、推定部３０ｂおよび判定部６０ａをそれぞれ含む。処理部７０（１）−７０（Ｍ）は、識別子Ｋ（１）−Ｋ（Ｍ）が付加された検出結果を検出部１０ｂより受けて、演算部２０ｂへ出力する。なお、図１４では、処理部７０（１）−７０（Ｍ）のうち、処理部７０（１）が、演算部２０ｂ、推定部３０ｂおよび判定部６０ａを含むことを示すが、他の処理部７０（２）−７０（Ｍ）についても同様に、演算部２０ｂ、推定部３０ｂおよび判定部６０ａを含む。以下において、処理部７０（１）の動作について説明し、処理部７０（２）−７０（Ｍ）についても同様の機能を有し、説明を省略する。

処理部７０（１）の演算部２０ｂは、例えば、検出部１０ｂより識別子Ｋ（１）−Ｋ（Ｍ）が付加された検出結果を受け、受けた結果のうち予め設定された識別子Ｋ（１）が付加された検出結果を抽出する。演算部２０ｂは、抽出した識別子Ｋ（１）の働きかけを示す検出結果に基づいて、識別子Ｋ（１）の対象者Ｕの働きかけの特徴を示す特徴量を求める。演算部２０ｂは、例えば、検出部１０ｂにより検出された過去の識別子Ｋ（１）の対象者Ｕによる働きかけに基づいて、識別子Ｋ（１）の対象者Ｕの働きかけの特徴を示す特徴量を求め、求めた特徴量を推定部３０ｂおよび判定部６０ａに出力する。また、演算部２０ｂは、例えば、求めた特徴量を、識別子Ｋ（１）の対象者Ｕによる働きかけの検出結果とともに、記憶部５０に割り当てられたテーブル５１（１）−５１（Ｍ）の格納領域のうち、識別子Ｋ（１）の対象者Ｕのテーブル５１（１）に順次に記憶する。テーブル５１（１）−５１（Ｍ）については、図１５で説明する。

処理部７０（１）の推定部３０ｂは、演算部２０ｂにより求められた識別子Ｋ（１）の対象者Ｕの働きかけの特徴を示す特徴量に基づいて、識別子Ｋ（１）の対象者Ｕの出力装置２への働きかけの意思の強さを推定する。推定部３０ｂは、推定した識別子Ｋ（１）の対象者Ｕの出力装置２への働きかけの意思の強さを選択部８０に出力する。

処理部７０（１）の判定部６０ａは、例えば、演算部２０ｂにより求められた識別子Ｋ（１）の対象者Ｕの働きかけの特徴を示す特徴量に基づいて、識別子Ｋ（１）の対象者Ｕが所定の働きかけに偏っているか否かを判定する。例えば、判定部６０ａは、求められた識別子Ｋ（１）の対象者Ｕの平均情報量Ｈ（ｔ）および主要状態に基づいて、平均情報量Ｈ（ｔ）が所定値以下である場合、識別子Ｋ（１）の対象者Ｕが、所定の働きかけである主要状態に偏っていると判定する。一方、判定部６０ａは、識別子Ｋ（１）の対象者Ｕの平均情報量Ｈ（ｔ）の値が所定値より大きい場合、識別子Ｋ（１）対象者Ｕが所定の働きかけである主要状態に偏っていないと判定する。判定部６０ａは、判定結果を選択部８０に出力する。なお、判定部６０ａは、平均情報量Ｈ（ｔ）と主要状態とに基づいて判定したが、これに限定されない。例えば、判定部６０ａは、主要状態とともに、インタラクション意思値Ｉ（ｔ）または平滑化された平均情報量Ｈ’（ｔ）に基づいて判定してもよい。また、所定値は、判定部６０ａの判定精度に応じて設定されるのが好ましい。

選択部８０は、例えば、処理部７０（１）−７０（Ｍ）の推定部３０ｂおよび判定部６０ａそれぞれから、識別子Ｋ（１）−Ｋ（Ｍ）の対象者Ｕの推定された意思の強さおよび判定結果をそれぞれ受ける。選択部８０は、受けた識別子Ｋ（１）−Ｋ（Ｍ）の対象者Ｕの推定された意思の強さおよび判定結果のうち、いずれかの対象者Ｕの推定された意思の強さおよび判定結果を選択する。例えば、選択部８０は、予め設定された識別子Ｋ（ｍ）の対象者Ｕの推定された意思の強さおよび判定結果を選択し、選択した識別子Ｋ（ｍ）の対象者Ｕの推定された意思の強さおよび判定結果を制御部４０ｃに出力する（ｍは１からＬの正の整数）。なお、選択部８０は、予め設定された識別子Ｋ（ｍ）の対象者Ｕの推定された意思の強さおよび判定結果を選択したが、これに限定されない。例えば、選択部８０は、出力装置２からの距離が最も近い、または最も遠い対象者Ｕの推定された意思の強さおよび判定結果を選択してもよい。あるいは、選択部８０は、指標値Ｓ（ｔ）が最も大きい、または最も小さい対象者Ｕの推定された意思の強さおよび判定結果を選択してもよい。さらに、選択部８０は、インタラクション装置１００ｃに含まれるキーボードやタッチパネル等を用いて、指定された対象者Ｕの推定された意思の強さおよび判定結果を選択してもよい。

制御部４０ｃは、検出部１０ｂにより検出された複数の対象者Ｕによる働きかけと、選択部８０により選択された対象者Ｕの推定部３０ｂにより推定された意思の強さおよび判定部６０ａの判定結果とに応じて、出力装置２の対象者Ｕへの働きかけを変化させる。例えば、制御部４０ｃは、図１２に示す制御部４０ｂと同様に、選択された対象者Ｕの働きかけの意思の強さに応じて、選択された対象者Ｕの検出部１０ｂで検出される働きかけに対応して、記憶部５０に予め登録された働きかけを出力装置２に実行させる。

図１５は、識別子Ｋ（ｊ）ごとの対象者Ｕの働きかけを示すテーブルの一例を示す。図１５に示すテーブル５１（１）−５１（Ｍ）は、識別子Ｋ（１）−Ｋ（Ｍ）の対象者Ｕにそれぞれ対応する。テーブル５１（１）−５１（Ｍ）は、検出部１０ｂにより働きかけが検出された時刻、対象者Ｕの働きかけ、主要状態、平滑化された平均情報量Ｈ’（ｔ）、距離、インタラクション意思値Ｉ（ｔ）および指標値の各格納領域を含む。なお、図１５では、テーブル５１（１）−５１（Ｍ）のうち、テーブル５１（１）の格納領域を示すが、他のテーブル５１（２）−５１（Ｍ）についても同様である。また、図１５に示すテーブル５１（１）の各格納領域に格納されたデータは、例えば、図５から図７に示すテーブル５１と同様であり説明を省略する。

図１６は、図１４に示したインタラクション装置１００ｃにおけるインタラクション処理の例を示す。ステップＳ２００，Ｓ２１０，Ｓ２２０，Ｓ２３０，Ｓ２４０，Ｓ２５０，Ｓ２６０およびＳ２７０の処理は、インタラクション装置１００ｃに搭載されるプロセッサがインタラクションプログラムを実行することにより実行される。すなわち、図１６は、インタラクションプログラムおよびインタラクション方法の別実施形態を示す。この場合、図１４に示した検出部１０ｂ、演算部２０ｂ、推定部３０ｂ、制御部４０ｃ、判定部６０ａ、処理部７０（１）−７０（Ｍ）および選択部８０は、インタラクションプログラムの実行により実現される。なお、図１６に示す処理は、インタラクション装置１００ｃに搭載されるハードウェアにより実行されてもよい。この場合、図１４に示した検出部１０ｂ、演算部２０ｂ、推定部３０ｂ、制御部４０ｃ、判定部６０ａ、処理部７０（１）−７０（Ｍ）および選択部８０は、インタラクション装置１００ｃ内に配置される回路により実現される。

ステップＳ２００において、検出部１０ｂは、カメラ１により撮影された画像、マイクロホン３により取得された音声データ、およびタッチセンサ４により取得された接触データに基づいて、図１４で説明したように、複数の対象者Ｕによる働きかけを検出する。検出部１０ｂは、検出した各対象者Ｕを識別する識別子Ｋ（１）−Ｋ（Ｌ）を検出された複数の対象者Ｕによる働きかけの検出結果に付加し、識別子Ｋ（１）−Ｋ（Ｍ）が付加された検出結果を、制御部４０ｃおよび処理部７０（１）−７０（Ｍ）に出力する。

次に、ステップＳ２１０において、各処理部７０の演算部２０ｂは、識別子Ｋ（１）−Ｋ（Ｍ）が付加された検出結果を検出部１０ｂからそれぞれ受け、演算部２０ｂごとに予め設定された識別子Ｋ（ｊ）が付加された検出結果をそれぞれ抽出する。ここで、ｊは１からＭの正の整数である。

次に、ステップＳ２２０において、各処理部７０の演算部２０ｂは、抽出した識別子Ｋ（ｊ）の対象者Ｕによる働きかけを示す検出結果に基づいて、図４から図１４で説明したように、識別子Ｋ（ｊ）の対象者Ｕの働きかけの特徴を示す特徴量を求める。演算部２０ｂは、例えば、式（１）から式（６）を用いて求めた特徴量を推定部３０ｂおよび判定部６０ａに出力する。また、演算部２０ｂは、求めた識別子Ｋ（ｊ）の対象者Ｕの特徴量を、識別子Ｋ（ｊ）の対象者Ｕによる働きかけを示す検出結果とともに、図１５に示すテーブル５１（ｊ）に順次に格納する。

次に、ステップＳ２３０において、各処理部７０の推定部３０ｂは、演算部２０ｂにより求められた識別子Ｋ（ｊ）の対象者Ｕの働きかけの特徴量に基づいて、識別子Ｋ（ｊ）の対象者Ｕの出力装置２への働きかけの意思の強さとして指標値Ｓ（ｔ）を推定する。各処理部７０の推定部３０ｂは、図９に示すテーブル５２の遷移条件に基づいて、推定した指標値Ｓ（ｔ）を、テーブル５１（ｊ）に格納するとともに、選択部８０に出力する。

次に、ステップＳ２４０において、各処理部７０の判定部６０ａは、演算部２０ｂから受けた識別子Ｋ（ｊ）の対象者Ｕの働きかけの特徴量に基づいて、図１４で説明したように、識別子Ｋ（ｊ）の対象者Ｕが所定の働きかけに偏っているか否かを判定する。各処理部７０の判定部６０ａは、判定結果を選択部８０に出力する。

次に、ステップＳ２５０において、選択部８０は、処理部７０（１）−７０（Ｍ）の推定部３０ｂおよび判定部６０ａから、識別子Ｋ（１）−Ｋ（Ｍ）の対象者Ｕの推定された意思の強さおよび判定結果をそれぞれ受ける。選択部８０は、いずれかの対象者Ｕの推定された意思の強さおよび判定結果を選択する。選択部８０は、選択した対象者Ｕの推定された意思の強さおよび判定結果を制御部４０ｃに出力する。

次に、ステップＳ２６０において、制御部４０ｃは、検出部１０ｂにより検出された複数の対象者Ｕによる働きかけと、選択部８０により選択された対象者Ｕの推定された意思の強さおよび判定結果とに応じて、出力装置２の対象者Ｕへの働きかけを変化させる。

次に、ステップＳ２７０において、インタラクション装置１００ｃは、例えば、インタラクション装置１００ｃに含まれるキーボードやタッチパネル等の入力装置を介して、終了指示を受けたか否かを判定する。インタラクション装置１００ｃは、終了指示を受けた場合（ＹＥＳ）、一連の処理を終了する。一方、インタラクション装置１００ｃは、終了指示を受けていない場合（ＮＯ）、処理をステップＳ２００に移行する。

以上、この実施形態では、各処理部７０の演算部２０ｂは、検出部１０ｂに検出された複数の対象者Ｕのうち、識別子Ｋ（ｊ）の対象者Ｕによる働きかけに基づいて、識別子Ｋ（ｊ）の対象者Ｕの働きかけの特徴を示す特徴量を算出する。各処理部７０の推定部３０ｂは、演算部２０ｂで求められた特徴量と図９に示すテーブル５２の遷移条件とに基づいて、識別子Ｋ（ｊ）の対象者Ｕの出力装置２への働きかけの意思の強さを推定する。また、各処理部７０の判定部６０ａは、演算部２０ａにより求められた特徴量に基づいて、識別子Ｋ（ｊ）の対象者Ｕが所定の働きかけに偏っているか否かを判定する。制御部４０ｃは、検出された複数の対象者Ｕによる働きかけと、選択部８０により選択された対象者Ｕの推定された意思および判定部６０ａの判定結果に応じて、出力装置２の選択された対象者Ｕへの働きかけを変化させる。例えば、出力装置２を漫然と眺めている等、選択部８０により選択された対象者Ｕの働きかけが偏っていると判定された場合に、制御部４０ｃは、対象者Ｕの働きかけの意思がない場合と同様の働きかけを出力装置２に行わせる。これにより、インタラクション装置１００ｃは、出力装置２を介して、対象者Ｕが違和感を持ちにくいタイミングで、対象者Ｕへの働きかけを行わせることができる。

また、推定部３０ｂは、演算部２０ｂで求められた特徴量とともに、図９に示すテーブル５２の遷移条件を用いることで、識別子Ｋ（ｊ）の対象者Ｕの働きかけの意思の強さをロバストに推定することができ、対象者Ｕに配慮した出力装置２の働きかけが可能となる。

なお、検出部１０ｂは、取得した音声データに基づいて、出力装置２の周囲で発せられた音声を検出したが、これに限定されない。例えば、検出部１０ｂは、音声データに対して音声認識の処理を施し、対象者Ｕによる働きかけを検出してもよい。

なお、検出部１０ｂは、図４から図１３で説明した実施形態と同様に、音声データや接触データから識別子Ｋ（ｊ）の対象者Ｕの働きかけ“ＳＰ”や働きかけ“ＴＣ”を検出した場合で、画像に撮影されていない場合に、働きかけ“ＮＦ”を検出してもよい。

なお、演算部２０ｂは、図４から図１３で説明した実施形態と同様に、インタラクション意思値Ｉ（ｔ）を求めるために、平均情報量Ｈ（ｔ）の値より１秒前の平均情報量Ｈ（ｔ−１）の値を重み付けし、平滑化された平均情報量Ｈ’（ｔ）の値を算出してもよい。あるいは、演算部２０ｂは、平均情報量Ｈ（ｔ）の値に対して、窓関数やローパスフィルタ等を用いた加重平均処理を施すことで、平滑化された平均情報量Ｈ’（ｔ）を求めてもよい。

なお、演算部２０ａは、図４から図１３で説明した実施形態と同様に、平均情報量Ｈ（ｔ）の算出に、式（７）を用いてもよい。

なお、処理部７０（１）−７０（Ｍ）の演算部２０ｂは、識別子Ｋ（１）−Ｋ（Ｍ）の対象者Ｕによる働きかけの検出結果と、求めた識別子Ｋ（１）−Ｋ（Ｍ）の対象者Ｕの特徴量とを、テーブル５１（１）−５１（Ｍ）にそれぞれ格納したが、これに限定されない。例えば、処理部７０（１）−７０（Ｍ）の演算部２０ｂは、識別子Ｋ（１）−Ｋ（Ｍ）の対象者Ｕによる働きかけの検出結果と、求めた識別子Ｋ（１）−Ｋ（Ｍ）の対象者Ｕの特徴量とを、１つのテーブルに格納してもよい。この場合、処理部７０（１）−７０（Ｍ）の演算部２０ｂは、識別子Ｋ（１）−Ｋ（Ｍ）の情報も１つのテーブルに格納することが好ましい。

なお、インタラクション装置１００ｃの処理部７０（１）−７０（Ｍ）は、判定部６０ａを有したが、これに限定されない。例えば、判定部６０ａが省略され、選択部８０は、処理部７０（１）−７０（Ｍ）の推定部３０ｂにより識別子Ｋ（１）−Ｋ（Ｍ）の対象者Ｕの推定された意思の強さをそれぞれ受け、例えば、最も強い意思が推定された対象者Ｕを選択してもよい。

なお、インタラクション装置１００ｃは選択部８０を有したが、これに限定されない。例えば、制御部４０ｃが、選択部８０の機能を有してもよい。その場合には、処理部７０（１）−７０（Ｍ）の推定部３０ｂおよび判定部６０ａは、識別子Ｋ（ｊ）の対象者Ｕの推定された意思の強さおよび判定結果を制御部４０ｃに直接出力する。

図１７は、図１４に示すインタラクション装置１００ｃのハードウェア構成の一例を示す。なお、図１７に示した要素のうち、図１４に示した要素と同等のものについては、同一の符号を付して示し、説明は省略する。

コンピュータ装置２００は、プロセッサ２１０、メモリ２２０、ハードディスク装置２３０、Ｉ／Ｏ（Input/Output）インタフェース２４０およびロボットインタフェース２５０を含む。また、コンピュータ装置２００は、表示装置２６０、光学ドライブ装置２７０、入力装置２８０およびネットワークインタフェース２９０をさらに含む。プロセッサ２１０、メモリ２２０、ハードディスク装置２３０、Ｉ／Ｏインタフェース２４０、ロボットインタフェース２５０、表示装置２６０、光学ドライブ装置２７０、入力装置２８０およびネットワークインタフェース２９０は、バスを介し互いに接続される。また、プロセッサ２１０、メモリ２２０、ハードディスク装置２３０、Ｉ／Ｏインタフェース２４０およびロボットインタフェース２５０は、インタラクション装置１００ｃに含まれる。

コンピュータ装置２００は、Ｉ／Ｏインタフェース２４０を介してカメラ１、マイクロホン３およびタッチセンサ４に接続される。そして、プロセッサ２１０は、Ｉ／Ｏインタフェース２４０を介して、カメラ１で撮影された画像、マイクロホンで取得された音声データおよびタッチセンサで取得された接触データをそれぞれ受ける。

また、ロボットインタフェース２５０には、例えば、出力装置２としてクマ型のロボットＣＲが接続され、プロセッサ２１０は、ロボットインタフェース２５０を介して、ロボットＣＲとの間で情報の授受を行う。なお、ロボットＣＲは、プロセッサ２１０からの指示に応じて首や腕、足等を動かすためのサーボモータ等を有する。また、カメラ１、マイクロホン３およびタッチセンサ４は、ロボットＣＲに一体に配置されてもよい。

また、表示装置２６０は、液晶モニタ等のディスプレイである。表示装置２６０は、ロボットＣＲの代わりに、インタラクション装置１００ｃからの制御に応じて、対象者Ｕに対して、発話や身振り等の働きかけを行う人物や動物等のキャラクターを表示してもよい。

光学ドライブ装置２７０は、光ディスク等のリムーバブルディスク２７５を装着可能であり、装着したリムーバブルディスク２７５に記録された情報の読み出しおよび記録を行う。

入力装置２８０は、例えば、キーボードやタッチパネル、マウス等である。インタラクション装置１００ｃの操作者は、入力装置２８０を操作し、例えば、ロボットＣＲが働きかける対象者Ｕの指定や、対象者Ｕの働きかけの意思の強さに応じてロボットＣＲを動作させるための各種閾値の設定等を入力する。なお、インタラクション装置１００ｃの操作者は、例えば、高齢者等の対象者Ｕに対して介護等を行う見守りサービス等を依頼した人物等である。インタラクション装置１００ｃの操作者は、インタラクション装置１００ｃが設置された場所から離れた場所に居住していてもよい。インタラクション装置１００ｃから離れた場所にいる操作者は、例えば、ネットワークＮＷおよびネットワークインタフェース２９０を介して、インタラクション装置１００ｃに対する指示を入力してもよい。

また、メモリ２２０は、コンピュータ装置２００のオペレーティングシステムとともに、プロセッサ２１０がインタラクション処理を実行するためのアプリケーションプログラムを格納する。また、メモリ２２０は、対象者Ｕによる働きかけを検出するために、人物の顔、腕、胴体、足等の各輪郭の情報やテーブル５２等を予め記憶してもよい。

なお、インタラクション処理を実行するためのアプリケーションプログラムは、例えば、リムーバブルディスク２７５に記録して頒布することができる。そして、リムーバブルディスク２７５を光学ドライブ装置２７０に装着して読み込み処理を行うことにより、インタラクション処理を実行するためのアプリケーションプログラムは、メモリ２２０やハードディスク装置２３０に格納されてもよい。また、コンピュータ装置２００は、ネットワークインタフェース２９０を介し、ネットワークＮＷからインタラクション処理を実行するためのアプリケーションプログラムをダウンロードし、メモリ２２０やハードディスク装置２３０に格納してもよい。

また、プロセッサ２１０は、インタラクション処理のアプリケーションプログラムを実行することで、検出部１０ｂ、演算部２０ｂ、推定部３０ｂ、制御部４０ｃ、判定部６０ａ、処理部７０（１）−７０（Ｍ）および選択部８０として機能する。また、プロセッサ２１０は、インタラクション処理のアプリケーションプログラムを実行することで、例えば、メモリ２２０に割り当てられた記憶領域にテーブル５１（１）−５１（Ｍ）をそれぞれ格納する。

つまり、インタラクション装置１００ｃは、プロセッサ２１０、メモリ２２０、ハードディスク装置２３０、Ｉ／Ｏインタフェース２４０およびロボットインタフェース２５０の協働によって実現する。

インタラクション処理のためのアプリケーションプログラムは、カメラ１、マイクロホン３およびタッチセンサ４等から取得したデータに基づいて、複数の対象者Ｕによる働きかけをそれぞれ検出する処理をプロセッサ２１０に実行させるプログラムを含む。また、インタラクション処理のためのアプリケーションプログラムは、検出した各対象者Ｕによる働きかけに基づいて、各対象者Ｕの働きかけの特徴を示す特徴量を求める処理をプロセッサ２１０に実行させるプログラムを含む。また、インタラクション処理のためのアプリケーションプログラムは、各対象者ＵのロボットＣＲへの働きかけの意思の強さを推定する処理をプロセッサ２１０に実行させるプログラムを含む。また、インタラクション処理のためのアプリケーションプログラムは、各対象者Ｕの検出結果、選択された対象者ＵのロボットＣＲへの働きかけの意思の強さおよび判定結果に基づいて、ロボットＣＲを制御する処理をプロセッサ２１０に実行させるプログラムを含む。

以上の詳細な説明により、実施形態の特徴点および利点は明らかになるであろう。これは、特許請求の範囲がその精神および権利範囲を逸脱しない範囲で前述のような実施形態の特徴点および利点にまで及ぶことを意図するものである。また、当該技術分野において通常の知識を有する者であれば、あらゆる改良および変更に容易に想到できるはずである。したがって、発明性を有する実施形態の範囲を前述したものに限定する意図はなく、実施形態に開示された範囲に含まれる適当な改良物および均等物に拠ることも可能である。

以上の実施形態に関し、さらに以下の付記を開示する。
（付記１）
出力装置からの働きかけを受ける対象者による出力装置への働きかけを検出する検出部と、
前記検出部により検出された前記対象者による働きかけに基づいて、前記対象者の働きかけの特徴を示す特徴量を求める演算部と、
求めた前記特徴量に基づいて、前記対象者の前記出力装置への働きかけの意思の強さを推定する推定部と、
前記推定部により推定された前記対象者の意思の強さに応じて、前記出力装置の前記対象者への働きかけを変化させる制御部と、
を備えることを特徴とするインタラクション装置。
（付記２）
付記１に記載のインタラクション装置において、
前記演算部は、前記検出部により検出された前記対象者による働きかけの種類および前記働きかけが検出された頻度の少なくとも一方のばらつきの大きさを示す分散情報を含む前記特徴量を求め、
前記推定部は、前記分散情報により、前記ばらつきが所定値より大きいことが示される場合に、前記対象者の前記出力装置への働きかけ意思が他の場合よりも強いと推定する
ことを特徴とするインタラクション装置。
（付記３）
付記２に記載のインタラクション装置において、
前記演算部は、前記検出部により検出された前記対象者による働きかけの種類の中で、他の種類より高い頻度で検出された働きかけを示す指向情報を前記特徴量の一部として求め、
前記推定部は、前記指向情報により第１の種類の働きかけが他の種類よりも高い頻度で検出されたことが示された場合に、前記分散情報で示される前記ばらつきと前記意思の強さを示す複数の段階のそれぞれについて設定した閾値との比較に基づいて、前記意思の強さを示す指標値を求める
ことを特徴とするインタラクション装置。
（付記４）
付記３に記載のインタラクション装置において、
前記分散情報および前記指向情報に基づいて、前記対象者による働きかけが第１の働きかけに偏っているか否かを判定する判定部を備え、
前記制御部は、前記検出部により検出された前記対象者による働きかけおよび前記推定部により推定された前記対象者の意思の強さとともに、前記判定部による判定結果に基づいて、前記出力装置の前記対象者への働きかけを変化させる
ことを特徴とするインタラクション装置。
（付記５）
付記１に記載のインタラクション装置において、
前記検出部は、複数の前記対象者を検出した場合、検出した前記各対象者を識別する識別子を前記検出部により検出された前記各対象者による働きかけの検出結果に付加し、
前記演算部は、前記検出結果に付加された前記識別子に基づいて、前記各対象者の前記特徴量をそれぞれ求め、
前記推定部は、前記検出部により検出された前記各対象者の前記特徴量に基づいて、前記各対象者の前記出力装置への働きかけの意思の強さをそれぞれ推定する
ことを特徴とするインタラクション装置。
（付記６）
付記５に記載のインタラクション装置において、
前記推定部により推定された複数の前記対象者の前記意思の強さのうち、前記対象者のいずれか１つの意思の強さを選択する選択部を備える
ことを特徴とするインタラクション装置。
（付記７）
出力装置からの働きかけを受ける対象者による出力装置への働きかけを検出し、
前記検出の処理により検出された前記対象者による働きかけに基づいて、前記対象者の働きかけの特徴を示す特徴量を求め、
求めた前記特徴量に基づいて、前記対象者の前記出力装置への働きかけの意思の強さを推定し、
前記推定の処理により推定された前記対象者の意思の強さに応じて、前記出力装置の前記対象者への働きかけを変化させる、
処理をコンピュータに実行させるインタラクションプログラム。
（付記８）
付記７に記載のインタラクションプログラムにおいて、
前記特徴量を求める処理は、前記検出の処理により検出された前記対象者による働きかけの種類および前記働きかけが検出された頻度の少なくとも一方のばらつきの大きさを示す分散情報を含む前記特徴量を求め、
前記推定の処理は、前記分散情報により、前記ばらつきが所定値より大きいことが示される場合に、前記対象者の前記出力装置への働きかけ意思が他の場合よりも強いと推定する
ことを特徴とするインタラクションプログラム。
（付記９）
付記８に記載のインタラクションプログラムにおいて、
前記特徴量を求める処理は、前記検出の処理により検出された前記対象者による働きかけの種類の中で、他の種類より高い頻度で検出された働きかけを示す指向情報を前記特徴量の一部として求め、
前記推定の処理は、前記指向情報により第１の種類の働きかけが他の種類よりも高い頻度で検出されたことが示された場合に、前記分散情報で示される前記ばらつきと前記意思の強さを示す複数の段階のそれぞれについて設定した閾値との比較に基づいて、前記意思の強さを示す指標値を求める
ことを特徴とするインタラクションプログラム。
（付記１０）
付記９に記載のインタラクションプログラムにおいて、
前記分散情報および前記指向情報に基づいて、前記対象者による働きかけが第１の働きかけに偏っているか否かを判定する処理を備え、
前記出力装置を制御する処理は、前記検出の処理により検出された前記対象者による働きかけおよび前記推定の処理により推定された前記対象者の意思の強さとともに、前記判定の処理による判定結果に基づいて、前記出力装置の前記対象者への働きかけを変化させる
ことを特徴とするインタラクションプログラム。
（付記１１）
付記７に記載のインタラクションプログラムにおいて、
前記検出の処理は、複数の前記対象者を検出した場合、検出した前記各対象者を識別する識別子を前記検出部により検出された前記各対象者による働きかけの検出結果に付加し、
前記特徴量を求める処理は、前記検出結果に付加された前記識別子に基づいて、前記各対象者の前記特徴量をそれぞれ求め、
前記意思を推定する処理は、前記検出部により検出された前記各対象者の前記特徴量に基づいて、前記各対象者の前記出力装置への働きかけの意思の強さをそれぞれ推定する、
ことを特徴とするインタラクションプログラム。
（付記１２）
付記９に記載のインタラクションプログラムにおいて、
前記推定の処理により推定された複数の前記対象者の前記意思の強さのうち、前記対象者のいずれか１つの意思の強さを選択する処理を備える
ことを特徴とするインタラクションプログラム。
（付記１３）
出力装置からの働きかけを受ける対象者による出力装置への働きかけを検出部により検出し、
前記検出部により検出された前記対象者による働きかけに基づいて、前記対象者の働きかけの特徴を示す特徴量を演算部により求め、
求めた前記特徴量に基づいて、前記対象者の前記出力装置への働きかけの意思の強さを推定部により推定し、
前記推定部により推定された前記対象者の意思の強さに応じて、前記出力装置の前記対象者への働きかけを制御部により変化させる、
ことを特徴とするインタラクション方法。
（付記１４）
付記１３に記載のインタラクション方法において、
前記演算部による処理は、前記検出部により検出された前記対象者による働きかけの種類および前記働きかけが検出された頻度の少なくとも一方のばらつきの大きさを示す分散情報を含む前記特徴量を求め、
前記推定部による処理は、前記分散情報により、前記ばらつきが所定値より大きいことが示される場合に、前記対象者の前記出力装置への働きかけ意思が他の場合よりも強いと推定する
ことを特徴とするインタラクション方法。
（付記１５）
付記１４に記載のインタラクション方法において、
前記演算部による処理は、前記検出部により検出された前記対象者による働きかけの種類の中で、他の種類より高い頻度で検出された働きかけを示す指向情報を前記特徴量の一部として求め、
前記推定部による処理は、前記指向情報により第１の種類の働きかけが他の種類よりも高い頻度で検出されたことが示された場合に、前記分散情報で示される前記ばらつきと前記意思の強さを示す複数の段階のそれぞれについて設定した閾値との比較に基づいて、前記意思の強さを示す指標値を求める
ことを特徴とするインタラクション方法。
（付記１６）
付記１５に記載のインタラクション方法において、
前記分散情報および前記指向情報に基づいて、前記対象者による働きかけが第１の働きかけに偏っているか否かを判定部により判定する処理を備え、
前記制御部による処理は、前記検出部により検出された前記対象者による働きかけおよび前記推定部により推定された前記対象者の意思の強さとともに、前記判定部による判定結果に基づいて、前記出力装置の前記対象者への働きかけを変化させる
ことを特徴とするインタラクション方法。
（付記１７）
付記１３に記載のインタラクション方法において、
前記検出部による処理は、複数の前記対象者を検出した場合、検出した前記各対象者を識別する識別子を前記検出部により検出された前記各対象者による働きかけの検出結果に付加し、
前記演算部による処理は、前記検出結果に付加された前記識別子に基づいて、前記各対象者の前記特徴量をそれぞれ求め、
前記推定部による処理は、前記検出部により検出された前記各対象者の前記特徴量に基づいて、前記各対象者の前記出力装置への働きかけの意思の強さをそれぞれ推定する、
ことを特徴とするインタラクションプログラム。
（付記１８）
付記１７に記載のインタラクション方法において、
前記推定部により推定された複数の前記対象者の前記意思の強さのうち、前記対象者のいずれか１つの意思の強さを選択部により選択する処理を備える
ことを特徴とするインタラクション方法。

１…カメラ；２…出力装置；３…マイクロホン；４…タッチセンサ；１０，１０ａ，１０ｂ…検出部；２０，２０ａ，２０ｂ…演算部；３０，３０ａ，３０ｂ…推定部；４０，４０ａ，４０ｂ，４０ｃ…制御部；５０…記憶部；５１，５１（１）−５１（Ｍ），５２…テーブル；６０，６１ａ…判定部；７０（１）−７０（Ｍ）…処理部；１００，１００ａ，１００ｂ，１００ｃ…インタラクション装置；２００…コンピュータ装置；２１０…プロセッサ；２２０…メモリ；２３０…ハードディスク装置；２４０…Ｉ／Ｏインタフェース；２５０…ロボットインタフェース；２６０…表示装置；２７０…光ドライブ装置；２７５…リムーバブルディスク；２８０…入力装置；２９０…ネットワークインタフェース；Ｕ…対象者；ＣＲ…ロボット；ＮＷ…ネットワーク

Claims

出力装置からの働きかけを受ける対象者による出力装置への働きかけを検出し、検出した各対象者を識別し、識別した前記各対象者と前記各対象者による働きかけの検出結果とを対応付ける検出部と、
前記検出部により検出された前記対象者による働きかけの種類と前記働きかけの種類毎の頻度とに基づいて、前記働きかけのばらつきの大きさを示す分散情報を含む特徴量をそれぞれ求める演算部と、
求めた前記特徴量に基づいて、前記対象者の前記出力装置への働きかけの強さを推定する推定部と、
前記推定部により推定された前記対象者の働きかけの強さに応じて、前記出力装置の前記対象者への働きかけを変化させる制御部と、
を備えることを特徴とするインタラクション装置。
請求項１に記載のインタラクション装置において、
前記検出部は、カメラにより撮影された画像を取得し、取得された画像に基づいて、前記働きかけを検出することを特徴とするインタラクション装置。
請求項１または請求項２に記載のインタラクション装置において、
前記出力装置は、サーボモータによる動く顔の部材を有するロボットであることを特徴とするインタラクション装置。
請求項１から請求項３のいずれか一項に記載のインタラクション装置において、
前記推定部により推定された前記対象者の働きかけの強さのうち、前記対象者のいずれか１つの働きかけの強さを選択する選択部とを備えることを特徴とするインタラクション装置。
出力装置からの働きかけを受ける対象者による出力装置への働きかけを検出し、検出した各対象者を識別し、識別した前記各対象者と前記各対象者による働きかけの検出結果とを対応付け、
検出された前記対象者による働きかけの種類と前記働きかけの種類毎の頻度とに基づいて、前記働きかけのばらつきの大きさを示す分散情報を含む特徴量をそれぞれ求め、
求めた前記特徴量に基づいて、前記対象者の前記出力装置への働きかけの強さを推定し、
推定された前記対象者の働きかけの強さに応じて、前記出力装置の前記対象者への働きかけを変化させる、
処理をコンピュータに実行させるインタラクションプログラム。
出力装置からの働きかけを受ける対象者による出力装置への働きかけを検出し、検出した各対象者を識別し、識別した前記各対象者と前記各対象者による働きかけの検出結果とを対応付け、
検出された前記対象者による働きかけの種類と前記働きかけの種類毎の頻度とに基づいて、前記働きかけのばらつきの大きさを示す分散情報を含む特徴量をそれぞれ求め、
求めた前記特徴量に基づいて、前記対象者の前記出力装置への働きかけの強さを推定し、
推定された前記対象者の働きかけの強さに応じて、前記出力装置の前記対象者への働きかけを変化させる、
ことを特徴とするインタラクション方法。