JP2020017206A

JP2020017206A - 情報処理装置、行動決定方法及びプログラム

Info

Publication number: JP2020017206A
Application number: JP2018141480A
Authority: JP
Inventors: 夏子尾崎; Natsuko Ozaki; 順横野; Jun Yokono; 嘉寧呉; Ka-Nyong Oh; 達人佐藤; Tatsuhito Sato; 明香渡辺; Asuka Watanabe
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2018-07-27
Filing date: 2018-07-27
Publication date: 2020-01-30
Also published as: WO2020022122A1; EP3832421A4; US20210316452A1; EP3832421A1

Abstract

【課題】より自然なコミュニケーションやインタラクションを可能にする自律ロボットを提供する。【解決手段】自律システムは、所定空間中の各位置に対して注目すべき程度を示す注目度が設定された注目度マップ４０に基づいて駆動機構に実行させる行動を決定する行動決定部１４２を備える。駆動機構は、自律移動体の位置及び姿勢を制御する。駆動機構の周囲の情報に基づいて、注目度マップを更新する更新部１３０をさらに備える。センサ１１０で取得されたセンサデータを認識処理する認識部１２０の処理の結果に基づいて注目度マップを更新する。画像データを出力するカメラ３２を、所定空間中を伝播する音を入力して音声データを出力するマイクロフォン３１を含み、認識部は、画像認識処理、音声データを音声認識処理の結果に基づいて注目度マップを更新する。【選択図】図４

Description

本開示は、情報処理装置、行動決定方法及びプログラムに関する。

近年、家庭におけるロボット掃除機やペットロボット、工場や物流倉庫における運搬ロボットなど、人工知能を備えた自律ロボットの開発が盛んに行なわれている。

なかでも、ペットロボットやヒューマノイドロボットや介護ロボットなど、人と密接に関わり合うことを目的とした自律ロボットでは、インタラクティブなコミュニケーションやユーザの行動や感情等に応じたインタラクションを可能にするための研究・開発が日々なされている。

特開２０１３−２４６５８８号公報

しかしながら、従来技術に係る自律ロボットのインタラクションは未だ十分に自然なものとはいえず、ユーザに対して違和感を与えてしまう場合が存在した。

そこで本開示では、より自然なコミュニケーションやインタラクションを可能にする情報処理装置、行動決定方法及びプログラムを提案する。

上記の課題を解決するために、本開示に係る一形態の情報処理装置は、所定空間中の各位置に対して注目すべき程度を示す注目度が設定された注目度マップに基づいて駆動機構に実行させる行動を決定する行動決定部を備える。

（作用）本開示に係る一形態の情報処理装置によれば、注目度マップに基づいて駆動機構の次の行動が決定されるため、注目すべき場所又は領域に応じてより的確な行動を実行することができる。それにより、より自然なコミュニケーションやインタラクションを実行することが可能となる。

本開示によれば、より自然なコミュニケーションやインタラクションを実行することが可能となる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載された何れかの効果であってもよい。

本開示の一実施形態に係る自律システムのシステム構成例を示すブロック図である。本開示の一実施形態に係る自律移動体のハードウェア構成例を示す図である。本開示の一実施形態に係る自律移動体の概略構成例を示すブロック図である。本開示の一実施形態に係る自律システムの機能ブロック構成の一例を示すブロック図である。本開示の一実施形態に係る注目度マップの一例を示す模式図である。図４に示す自律システムをより具体化した自律システムの概略構成例を示すブロック図である。本開示の一実施形態に係る自律システムの全体の概略動作の一例を示すフローチャートである。本開示の一実施形態に係る行動フェーズの流れの一例を示すフローチャートである。図８のステップＳ１０６の動作を説明するための図である。図８のステップＳ１０８の動作を説明するための図である。図８のステップＳ１１０の動作を説明するための図である。図８のステップＳ１０５のＹＥＳ〜Ｓ１１０の動作を説明するための図である。図８のステップＳ１０７のＹＥＳ〜Ｓ１１０の動作を説明するための図である。本開示の一実施形態に係る注目領域設定動作の一例を示すフローチャートである。図１４におけるステップＳ１２１を説明するための図である。図１４におけるステップＳ１２４を説明するための図である。図１４におけるステップＳ１２５及びＳ１２６を説明するための図である。本開示の一実施形態に係る認識フェーズの流れの一例を示すフローチャートである。図１８におけるステップＳ２０５を説明するための図である。図１８におけるステップＳ２０８を説明するための図である。図２０に示す３次元の個別の注目度マップを２次元の個別の注目度マップとした場合の例を示す図である。図１８におけるステップＳ２１２を説明するための図である。図１８におけるステップＳ２１４を説明するための図である。本開示の一実施形態に係る認識フェーズの他の流れの一例を示すフローチャートである。本開示の一実施形態において扱う情報の例を示す図である。

以下に、本開示の一実施形態について図面に基づいて詳細に説明する。なお、以下の実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

また、以下に示す項目順序に従って本開示を説明する。
１．一実施形態
１．１自律システムの構成例
１．２自律移動体の構成例
１．２．１自律移動体の外観構成例
１．２．１．１マイクロフォン
１．２．１．２カメラ
１．２．１．３ＴｏＦセンサ
１．２．１．４人感センサ
１．２．１．５ＰＳＤ
１．２．１．６タッチセンサ
１．２．１．７照度センサ
１．２．１．８足裏ボタン
１．２．１．９慣性計測装置（ＩＭＵ）
１．２．２自律移動体のブロック構成例
１．３自律システムのブロック構成例
１．３．１センサ群
１．３．２物体検出・認識部
１．３．３注目度マップ作成・更新部
１．３．４行動決定部
１．３．５インタラクション実行部
１．３．６個人識別ＤＢ
１．３．７注目度マップＤＢ
１．３．８行動ルールＤＢ
１．３．９特定行動ルールＤＢ
１．４注目度マップ
１．５自律システムの具体例
１．５．１物体検出・認識部の具体例
１．５．２行動決定部の具体例
１．５．３インタラクション実行部の具体例
１．６自律システムの動作例
１．６．１行動フェーズ
１．６．１．１自律移動体が注目領域に近すぎ且つ注目領域が画角の中心に無い場合
１．６．１．２自律移動体が注目領域から遠すぎ且つ注目領域が画角の中心に無い場合
１．６．１．３注目領域設定処理
１．６．１．４注目領域設定処理の具体例
１．６．２認識フェーズ（注目度マップ作成・更新）
１．６．２．１注目度の減衰処理から現フレームの個別の注目度マップを既存の注目度マップに加算するまで
１．６．３自律システムの動作の他の例
１．７注目度マップの作成に用いる情報の例
１．８作用・効果
１．９変形例

１．一実施形態
以下に、本開示の一実施形態に係る情報処理装置、情報処理システム、行動決定方法及びプログラムについて、図面を参照して詳細に説明する。

以下で例示する実施形態では、家庭内ペットロボットやヒューマノイドロボットやロボット掃除機や無人航空機や追従運搬ロボットや自動運転機能を搭載した自動車など、各種センサを搭載した自律移動体を含む自律システムが適用対象として想定されているが、本開示はこのような自律システムに限定されず、例えば駆動機構を備えたロボットアームやマニピュレータ等の可動部及び／又はインタラクティブなコミュニケーション機能を備えたスマートスピーカなど、自律又は遠隔操作による駆動（発音や発光等を含む）が可能な種々の装置又はそれを含むシステムを適用対象とすることが可能である。

１．１自律システムの構成例
図１は、本開示の一実施形態に係る自律システムのシステム構成例を示すブロック図である。図１に示すように、本実施形態に係る自律システム１００は、１以上の自律移動体１Ａ〜１Ｎがネットワーク４を介してサーバ２に接続された構成を備える。サーバ２は、例えばクラウドサーバなど、複数のサーバで構成されたサーバ群であってもよい。ネットワーク４は、例えば、インターネットやＬＡＮや移動体通信網等、種々のネットワークを適用することが可能である。以下の説明において、自律移動体１Ａ〜１Ｎのうちの任意の１つを自律移動体１として説明する。

サーバ２又は自律移動体１には、ユーザがスマートフォン等の通信端末３からネットワーク４を介してアクセス可能であってもよい。例えば、ユーザは、自律移動体１の所有者に関する情報やその他の所定の情報を、通信端末３を用いてサーバ２又は自律移動体１に登録可能であってもよい。

１．２自律移動体の構成例
次に、本開示の一実施形態に係る自律移動体１のハードウェア構成例について説明する。なお、以下では、自律移動体１がイヌ型の四足歩行ロボットである場合を例に説明する。

１．２．１自律移動体の外観構成例
図２は、本実施形態に係る自律移動体のハードウェア構成例を示す図である。図２に示すように、自律移動体１は、頭部（首部を含む）、胴部、４つの脚部、および尾部を有するイヌ型の四足歩行ロボットである。また、自律移動体１は、頭部に少なくとも２つのディスプレイ２１と、１つ以上のスピーカ２２とを備える。ディスプレイ２１は、例えば目に相当するものであり、目で表現される様々な感情や表情を表現する。スピーカ２２は、鳴き声や種々の情報を音声によってユーザに発信する。

また、自律移動体１は、種々のセンサを備える。自律移動体１は、例えば、マイクロフォン３１、カメラ３２、ＴｏＦ（Time of Flight）センサ３３、人感センサ３４、ＰＳＤ（Position Sensitive Detector）３５、タッチセンサ３６、照度センサ３７、足裏ボタン３８、慣性計測装置（Inertial Measurement Unit：ＩＭＵ）３９を備える。

１．２．１．１マイクロフォン
マイクロフォン３１は、周囲の音を収集する機能を有する。上記の音には、例えば、ユーザの発話や、周囲の環境音が含まれる。自律移動体１は、例えば、頭部に４つのマイクロフォンを備えてもよい。複数のマイクロフォン３１を備えることで、周囲で発生する音を感度高く収集すると共に、音源の定位を実現することが可能となる。

１．２．１．２カメラ
カメラ３２は、自律移動体１（又はその駆動機構）の周囲に存在するユーザや周囲環境を撮像する機能を有する。自律移動体１は、例えば、鼻先と腰部に２つの広角カメラを備えてもよい。この場合、鼻先に配置される広角カメラは、自律移動体１の前方視野（すなわち、イヌの視野）に対応した画像を撮像し、腰部の広角カメラは、上方を中心とする周囲領域の画像を撮像する。自律移動体１は、例えば、腰部に配置される広角カメラにより撮像された画像に基づいて、天井の特徴点などを抽出し、ＳＬＡＭ（Simultaneous Localization and Mapping）を実現することができる。

１．２．１．３ＴｏＦセンサ
ＴｏＦセンサ３３は、自律移動体１（又はその駆動機構）の頭部前方に存在する物体との距離を検出する機能を有する。ＴｏＦセンサ３３は、頭部の鼻先に備えられる。ＴｏＦセンサ３３によれば、種々の物体との距離を精度高く検出することができ、ユーザを含む対象物や障害物などとの相対位置に応じた動作を実現することが可能となる。なお、ＴｏＦセンサ３３に代えて、深度マップあるいは深度画像などを取得する深度センサ（深度カメラともいう）が用いられてもよい。

１．２．１．４人感センサ
人感センサ３４は、自律移動体１（又はその駆動機構）の周囲に存在するユーザやユーザが飼育するペットなどの所在を検知する機能を有する。人感センサ３４は、例えば、胸部に配置される。人感センサ３４によれば、前方に存在する動物体を検知することで、当該動物体に対する種々の動作、例えば、興味、恐怖、驚きなどの感情に応じた動作を実現することが可能となる。

１．２．１．５ＰＳＤ
ＰＳＤ３５は、自律移動体１（又はその駆動機構）の前方床面の状況を取得する機能を有する。ＰＳＤ３５は、例えば、胸部に配置される。ＰＳＤ３５によれば、自律移動体１の前方床面に存在する物体との距離を精度高く検出することができ、当該物体との相対位置に応じた動作を実現することができる。

１．２．１．６タッチセンサ
タッチセンサ３６は、ユーザによる接触を検知する機能を有する。タッチセンサ３６は、例えば、頭頂、あご下、背中など、ユーザが自律移動体１に対し触れる可能性が高い部位に配置される。タッチセンサ３６は、例えば、静電容量式や感圧式のタッチセンサであってよい。タッチセンサ３６によれば、ユーザによる触れる、撫でる、叩く、押すなどの接触行為を検知することができ、当該接触行為に応じた動作を行うことが可能となる。

１．２．１．７照度センサ
照度センサ３７は、自律移動体１（又はその駆動機構）が位置する空間の照度を検出する。照度センサ３７は、例えば、頭部背面において尾部の付け根などに配置されてもよい。照度センサ３７によれば、周囲の明るさを検出し、当該明るさに応じた動作を実行することが可能となる。

１．２．１．８足裏ボタン
足裏ボタン３８は、自律移動体１（又はその駆動機構）の脚部底面が床と接触しているか否かを検知する機能を有する。このために、足裏ボタン３８は、４つの脚部の肉球に該当する部位にそれぞれ配置される。足裏ボタン３８によれば、自律移動体１と床面との接触または非接触を検知することができ、例えば、自律移動体１がユーザにより抱き上げられたことなどを把握することが可能となる。

１．２．１．９慣性計測装置（ＩＭＵ）
ＩＭＵ３９は、頭部や胴部の速度や加速度、回転などの物理量を検出する６軸センサである。すなわち、ＩＭＵ３９は、Ｘ軸、Ｙ軸、Ｚ軸の加速度および角速度を検出する。ＩＭＵ３９は、頭部および胴部にそれぞれ配置される。ＩＭＵ３９によれば、自律移動体１の頭部および胴部の運動を精度高く検出し、状況に応じた動作制御を実現することが可能となる。

以上、本実施形態に係る自律移動体１（又はその駆動機構）が備えるセンサの一例について説明した。なお、図２を用いて説明した上記の構成はあくまで一例であり、自律移動体１が備え得るセンサの構成は係る例に限定されない。自律移動体１は、上記の構成のほか、例えば、深度センサ、超音波センサ、温度センサ、地磁気センサ、ＧＮＳＳ（Global Navigation Satellite System）信号受信機を含む各種の通信装置などをさらに備えてよい。自律移動体１が備えるセンサの構成は、仕様や運用に応じて柔軟に変形され得る。

１．２．２自律移動体のブロック構成例
図３は、本実施形態に係る自律移動体の概略構成例を示すブロック図である。図３に示すように、自律移動体１は、例えば、図２に例示した、ディスプレイ２１、スピーカ２２及び各種センサ３１〜３９に加え、コントロール部１０を備える。コントロール部１０は、ＣＰＵ（Central Processing Unit）１２、ＤＲＡＭ（Dynamic Random Access Memory）１３、フラッシュＲＯＭ（Read Only Memory）１４、ＰＣ（Personal Computer）カードインタフェース（Ｉ／Ｆ）１５、無線通信部１６及び信号処理回路１１が内部バス１７を介して相互に接続された構成を備える。さらに、自律移動体１は、動力源としてのバッテリ１８を備える。

また、自律移動体１は、位置及び姿勢を制御するための駆動機構として、頭部（首部）、胴部、脚部及び尾部の関節部分等の可動部２５と、この可動部２５を駆動するためのアクチュエータ２４とを備える。この駆動機構は、移動やインタラクションに必要な動作を実現するための機構でもある。したがって、駆動機構は、ディスプレイ２１、スピーカ２２及び各種センサ３１〜３９に加え、コントロール部１０を備えると言い換えることもできる。さらに、駆動機構は、自律移動体１の位置及び姿勢の制御の一つとして、例えば、カメラ３２のズームやピントを制御したり、マイクロフォン３１のズームを独立又はカメラ３２のズームに連動して制御したりしてもよい。

以上の構成において、マイクロフォン３１、カメラ３２、ＴｏＦセンサ３３、人感センサ３４、ＰＳＤ３５、タッチセンサ３６、照度センサ３７、足裏ボタン３８、ＩＭＵ３９、エンコーダ２３及びバッテリ１８は、それぞれコントロール部１０の信号処理回路１１と接続されている。

信号処理回路１１は、上述の各種センサから供給されるセンサデータや画像データ及び音声データを順次取り込み、これらをそれぞれ内部バス１７を介してＤＲＡＭ１３内の所定位置に順次格納する。また、信号処理回路１１は、これと共にバッテリ１８から供給されるバッテリ残量を表すバッテリ残量データを順次取り込み、これをＤＲＡＭ１３内の所定位置に格納する。

このようにしてＤＲＡＭ１３に格納された各センサデータ、画像データ、音声データ及びバッテリ残量データは、ＣＰＵ１２が自律移動体１の動作制御を行う際に利用されるとともに、必要に応じて、無線通信部１６を介して外部のサーバ２へ送信される。なお、無線通信部１６は、Ｂｌｕｅｔｏｏｔｈ（登録商標）やＷｉ−Ｆｉ（登録商標）などの他、無線ＬＡＮ（Local Area Network）や移動体通信網等の所定のネットワークを介して外部のサーバ２と通信を行なうための通信部であってよい。

ＣＰＵ１２は、例えば、自律移動体１の電源が投入された初期時、不図示のＰＣカードスロットに装填されたメモリカード１９又はフラッシュＲＯＭ１４に格納された制御プログラムをＰＣカードインタフェース１５を介して又は直接読み出し、これをＤＲＡＭ１３に格納する。

また、ＣＰＵ１２は、上述のように信号処理回路１１よりＤＲＡＭ１３に順次格納される各センサデータ、画像データ、音声データ及びバッテリ残量データに基づいて自機及び周囲の状況や、ユーザからの指示及び働きかけの有無などを判断する。

さらに、ＣＰＵ１２は、ＤＲＡＭ１３等に格納されている地図データ又は無線通信部１６を介して外部のサーバ２から取得した地図データと各種情報とを利用して、自己位置推定や種々の動作を実行する。例えば、ＣＰＵ１２は、無線通信部１６を介して外部のサーバ２から取得した行動計画情報（自機）１０５ａに基づいて、アクチュエータ２４へ与える制御指令１０６ａを生成し、これを信号処理回路１１を介してアクチュエータ２４へ出力する。

そして、ＣＰＵ１２は、上述の判断結果や推定された自己位置やＤＲＡＭ１３に格納されている制御プログラムや作成又は受信した行動計画情報等に基づいて、その後の行動を決定すると共に、当該決定結果に基づいて必要なアクチュエータ２４を駆動させることにより、移動やインタラクションなどの各種行動を実行する。

その際、ＣＰＵ１２は、必要に応じて音声データを生成し、これを信号処理回路１１を介して音声信号としてスピーカ２２に与えることにより当該音声信号に基づく音声を外部に出力させてもよい。さらに、ＣＰＵ１２は、必要に応じて画像データを生成し、これを信号処理回路１１を介して画像信号としてディスプレイ２１に与えることによりディスプレイ２１に各種情報を表示させてもよい。

このようにして、自律移動体１は、自機及び周囲の状況や、ユーザからの指示及び働きかけに応じて自律的に行動し得るように構成されている。

なお、以上で説明した自律移動体１は、単なる一例に過ぎず、上述したように、家庭内ペットロボットやヒューマノイドロボットやロボット掃除機や無人航空機や追従運搬ロボットや自動運転機能を搭載した自動車など、各種センサを搭載した自律移動体だけでなく、例えば駆動機構を備えたロボットアームやマニピュレータ等の可動部及び／又はインタラクティブなコミュニケーション機能を備えたスマートスピーカなど、自律又は遠隔操作による駆動（発音や発光等を含む）によって音を発する可能性のある種々の自律移動体を用いることが可能である。

１．３自律システムのブロック構成例
図４は、本実施形態に係る自律システムの機能ブロック構成の一例を示すブロック図である。図４に示すように、自律システム１００は、センサ群１１０と、物体検出・認識部（認識部）１２０と、注目度マップ作成・更新部（更新部）１３０と、行動決定部１４０と、インタラクション実行部（実行部）１５０と、注目度マップデータベース（ＤＢ）１０３と、行動ルールデータベース（ＤＢ）１０４と、特定行動ルールデータベース（ＤＢ）１０５とを備える。また、図４には示されていないが、自律システム１００には、個人識別データベース（ＤＢ）１０２（図６参照）が含まれてもよい。

このような構成において、センサ群１１０、行動決定部１４０及びインタラクション実行部１５０は、例えば、図１における自律移動体１に実装される。一方、物体検出・認識部１２０、注目度マップ作成・更新部１３０、個人識別ＤＢ１０２、注目度マップＤＢ１０３、行動ルールＤＢ１０４、及び、特定行動ルールＤＢ１０５は、例えば、サーバ２に実装される。ただし、このような構成に限定されず、センサ群１１０、物体検出・認識部１２０、注目度マップ作成・更新部１３０、行動決定部１４０及びインタラクション実行部１５０を自律移動体１に実装した構成や、これらに加え、個人識別ＤＢ１０２、注目度マップＤＢ１０３、行動ルールＤＢ１０４及び特定行動ルールＤＢ１０５を含む全ての構成を自律移動体１に実装した構成など、種々変形することが可能である。

また、センサ群１１０、物体検出・認識部１２０及び注目度マップ作成・更新部１３０は、注目度マップを作成する段階（これを認識フェーズという）で使用される構成であり、行動決定部１４０及びインタラクション実行部１５０は、自律移動体１に実際に行動を実行させる段階（これを行動フェーズという）で使用される構成である。

１．３．１センサ群
センサ群１１０は、例えば、上述したマイクロフォン３１、カメラ３２、ＴｏＦセンサ３３、人感センサ３４、ＰＳＤ３５、タッチセンサ３６、照度センサ３７、足裏ボタン３８、ＩＭＵ３９などで構成される。なお、説明の都合上、図４及び以下の説明では、人感センサ３４、ＰＳＤ３５、タッチセンサ３６、照度センサ３７、足裏ボタン３８、ＩＭＵ３９等をその他のセンサ３０とする。

１．３．２物体検出・認識部
物体検出・認識部１２０は、マイクロフォン３１、カメラ３２、ＴｏＦセンサ３３及びその他のセンサ３０それぞれで取得されたセンサデータに対し、センサの種類やセンサデータの属性等に応じた認識処理１２１〜１２４を実行し、その結果を注目度マップ作成・更新部１３０へ出力する。物体検出・認識部１２０が実行する認識処理１２１〜１２４には、例えば、マイクロフォン３１で取得された音声データに対する音声認識処理（１２１）や、カメラ３２で取得された画像データ（動画像データを含む）に対する画像認識処理（１２２）や、ＴｏＦセンサ３３で取得された距離画像に対する画像認識処理（１２３）や、その他のセンサ３０で取得されたセンサデータに対する認識処理１２４等が含まれる。

なお、図４には、マイクロフォン３１、カメラ３２、ＴｏＦセンサ３３及びその他のセンサ３０それぞれで取得されたセンサデータに対して個別に認識処理１２１〜１２４を実行する場合が例示されているが、このような構成に限定されず、２又はそれ以上のセンサで得られたセンサデータを統合し、統合されたセンサデータに対して認識処理を実行するなど、種々変形されてよい。

１．３．３注目度マップ作成・更新部
注目度マップ作成・更新部１３０は、物体検出・認識部１２０から入力された認識処理１２１〜１２４の結果それぞれに基づいて、所定空間内における注目すべき場所又は領域（以下、注目領域という）の位置を予測（又は推定）する注目領域予測１３１〜１３４を実行する。そして、注目度マップ作成・更新部１３０は、注目領域予測１３１〜１３４それぞれの結果に基づいて、それぞれが対応するセンサ３１〜３４及び３０で得られたセンサデータに基づく個別の注目度マップを生成する注目度マップ生成１３５〜１３８を実行する。なお、所定空間とは、例えば家屋やマンション等であればその各部屋（リビングやダイニングやキッチンや寝室やバスルーム等）であってもよいし、家屋全体やフロア全体やマンション全体など、種々の空間を適用することができる。

注目度マップ生成１３５〜１３８で生成された個別の注目度マップは、それぞれ注目度マップＤＢ１０３に既に格納されている注目度マップ４０に加算される。これにより、注目度マップＤＢ１０３内の注目度マップ４０が、逐次、最新の注目度マップ４０に更新される。

また、注目度マップ作成・更新部１３０には、注目度減衰部（減衰部）１３９が設けられている。注目度減衰部１３９は、所定の条件が満たされる度に、注目度マップＤＢ１０３内の注目度マップ４０における注目度を所定のルールに従って減衰する。例えば、注目度減衰部１３９は、後述する行動フェーズで確認した領域（注目領域）の注目度を所定のルールに従って減衰する。また、注目度減衰部１３９は、ある一定の周期で、注目度マップ４０における各領域の注目度を所定のルールに従って減衰する。

１．３．４行動決定部
行動決定部１４０は、例えば、自律移動体１におけるコントロール部１０、ディスプレイ２１、スピーカ２２、エンコーダ２３、アクチュエータ２４、可動部２５等（図３参照）で構成され、注目度マップ４０を用いて注目領域を決定する注目領域決定１４１と、決定された注目領域の情報（位置や範囲やピークの注目度の値等）に応じて自律移動体１の行動を決定する行動決定１４２と、決定された行動を実行する行動１４３とを実行する。なお、行動決定１４２では、行動決定部１４０は、注目領域の情報やその他の条件や状況等に応じて行動を決定する際のルール（以下、行動ルールという）が予め登録された行動ルールＤＢ１０４に登録されている行動ルールに基づいて、自律移動体１の行動１４３を決定する。

１．３．５インタラクション実行部
インタラクション実行部１５０は、自律移動体１にインタラクティブなコミュニケーションやユーザの行動や感情等に応じたインタラクションを実行させるための構成であり、例えば、自律移動体１におけるコントロール部１０、ディスプレイ２１、スピーカ２２、エンコーダ２３、アクチュエータ２４、可動部２５等で構成される。このインタラクション実行部１５０は、特定のイベントの発生を検知（イベント発生検知１５１）すると、発生したイベントの種類に応じて、特定行動ルールＤＢ１０５に予め登録されている特定の行動（インタラクション）１５２を実行する。なお、特定の行動１５２とは、ユーザとのインタラクティブなコミュニケーションや、ユーザの行動や感情等に応じたインタラクション等であってよい。

１．３．６個人識別ＤＢ
個人識別ＤＢ１０２は、例えば、マイクロフォン３１で取得された音声データに対して認識処理１２１を実行することで特定された声紋や、カメラ３２で取得された画像データに対して認識処理１２２を実行することで認識された顔等から、自律移動体１の所有者などの個人を特定するための情報を格納する。

１．３．７注目度マップＤＢ
注目度マップＤＢ１０３は、注目度マップ４０を格納する。例えば、注目度マップＤＢ１０３は、最新のセンサデータに基づいて更新された注目度マップ４０を格納する。また、注目度マップＤＢ１０３は、更新前の注目度マップを履歴として時系列に沿って蓄積しておいてもよい。

１．３．８行動ルールＤＢ
行動ルールＤＢ１０４は、上述したように、目領域の情報（位置や範囲やピークの注目度の値等）やその他の条件や状況等に応じて自律移動体１が実行する行動を決定する際の行動ルールを予め格納する。ここで、行動ルールの例としては、「自律移動体１から注目領域までの距離と注目領域のサイズとに基づいて、注目領域の全体をカメラ３２の画角内に収めきれないと判断される場合には、（自律移動体１が）注目領域から遠ざかる方向へ移動する」というルールや、「自律移動体１から注目領域までの距離と注目領域のサイズとに基づいて、注目領域のサイズがカメラ３２の画角に対して小さすぎると判断される場合には、（自律移動体１が）注目領域に近づく方向へ移動する」というルールや、「注目領域がカメラ３２の視野（画角）から外れている場合は、注目領域がカメラ３２の視野（画角）の中心となるようにカメラ３２のロール角（Ｒ）、ピッチ角（Ｐ）、ヨー角（Ｙ）等を制御する」というルールなどを挙げることができる。ただし、これらの行動ルールに限定されず、種々変形及び追加が可能であることは言うまでもない。

１．３．９特定行動ルールＤＢ
特定行動ルールＤＢ１０５は、発生したイベントの種類に応じて、自律移動体１に実行させる特定の行動を予め登録する。なお、特定の行動１５２とは、ユーザとのインタラクティブなコミュニケーションや、ユーザの行動や感情等に応じたインタラクション等であってよい。

１．４注目度マップ
図５は、本実施形態に係る注目度マップの一例を示す模式図である。注目度マップ４０は、例えば、３次元空間である所定空間ＳＰに対して注目度の分布が設定された構成を有している。より具体的には、例えば、注目度マップ４０の所定空間ＳＰは、例えばボックスセルが立体的に組み合わされてなる３次元のグリッドマップであり、各ボックスセルに注目度の値が設定されている。注目度マップ４０における注目度の局所的なピーク付近の分布５１〜５３の形状は、それぞれ例えば３次元ガウス分布に近似していてもよい。ただし、３次元の注目度マップ４０に限定されず、２次元の注目度マップなどとすることも可能である。

１．５自律システムの具体例
つぎに、本実施形態に係る自律システム１００について、より具体的に説明する。図６は、図４に示す自律システムをより具体化した自律システムの概略構成例を示すブロック図である。

１．５．１物体検出・認識部の具体例
図６と図４とを比較すると分かるように、図６に示す構成では、物体検出・認識部１２０が実行する処理の具体例として、顔検出２２１、顔識別２２２、個人識別２２３、視線検出２２４、動体検出２２５、人体検出（一部分を含む）２２６、音源方向検出２２７、音声識別２２８、トラッキング２２９等が挙げられている。

顔検出２２１は、例えば、カメラ３２で取得された画像データに含まれる人物の顔の領域を検出する処理であってよい。

顔識別２２２は、例えば、顔検出２２１で検出された顔の領域から顔の形状等の特徴を認識する処理であってよい。

個人識別２２３は、例えば、顔識別２２２で特定された顔の特徴に基づいて個人識別ＤＢ１０２を参照することで、当該顔を持つ個人を特定する処理であってよい。

視線検出２２４は、例えば、顔識別２２２で特定された顔の特徴に基づいてその人物の視線の向き、例えばその人物が注目している方向を検出する処理であってよい。

動体検出２２５は、例えば、カメラ３２で取得された画像データに含まれるボール等の動体を検出する処理であってよい。

人体検出（一部分を含む）２２６は、例えば、カメラ３２で取得された画像データに含まれる人体やその一部（腕や脚など）を検出する処理であってよい。

音源方向検出２２７は、例えば、マイクロフォン３１で取得された音声データから音源の位置や方向等を検出する処理であってよい。

音声識別２２８は、例えば、マイクロフォン３１で取得された音声データから音源（人、動物、無機物、有機物等）等を識別する処理であってよい。例えば、音源が人であれば、音声データが人の声であること、及び、その声紋等を検出する処理であってよい。

トラッキング２２９は、例えば、カメラ３２で取得された画像データに含まれる人や物体の移動を追跡する処理や、マイクロフォン３１で取得された音声データから特定される音源の移動を追跡する処理等であってよい。

１．５．２行動決定部の具体例
行動決定部１４０が実行する行動の具体例としては、見上げる・首を振る（任意の方向にカメラを向ける）２４１、近づく・下がる（任意の方向へ移動）２４２、カメラのズーム・ピント制御２４３、マイクロフォンのズームホーミング２４４等が挙げられている。ここで、見上げる・首を振る（任意の方向にカメラを向ける）２４１は、上述した、「注目領域がカメラ３２の視野（画角）から外れている場合は、注目領域がカメラ３２の視野（画角）の中心となるようにカメラ３２のロール角（Ｒ）、ピッチ角（Ｐ）、ヨー角（Ｙ）等を制御する」という行動ルールに対応している。また、近づく・下がる（任意の方向へ移動）２４２は、上述した、「自律移動体１から注目領域までの距離と注目領域のサイズとに基づいて、注目領域の全体をカメラ３２の画角内に収めきれないと判断される場合には、（自律移動体１が）注目領域から遠ざかる方向へ移動する」という行動ルール、及び、「自律移動体１から注目領域までの距離と注目領域のサイズとに基づいて、注目領域のサイズがカメラ３２の画角に対して小さすぎると判断される場合には、（自律移動体１が）注目領域に近づく方向へ移動する」という行動ルールに対応している。なお、カメラのズーム・ピント制御２４３は、例えば、「自律移動体１から注目領域までの距離が変化した場合には、カメラ３２のズーム及びピントを制御する」という行動ルールに対応していてもよい。また、マイクロフォンのズームホーミング２４４は、例えば、「カメラ３２のズームが変更された場合には、カメラ３２のズームに連動してマイクロフォン３１のズームを制御する」という行動ルールに対応していてもよい。ただし、これらの行動ルールに限定されるものではなく、種々変形されてよい。

行動決定部１４０が実行する行動、例えば、見上げる・首を振る（任意の方向にカメラを向ける）２４１と近づく・下がる（任意の方向へ移動）２４２とカメラのズーム・ピント制御２４３とマイクロフォンのズームホーミング２４４とは、別々に実行されてもよいし、同時に実行されてもよい。例えば、行動決定部１４０は、自律移動体１を注目領域に近づけつつ（２４２）、見上げる（２４１）ように動作させてもよい。

１．５．３インタラクション実行部の具体例
インタラクション実行部１５０が実行する特定の行動（インタラクション）１５２の具体例としては、動物や生き物（以下、動物等という）の動作に近い動作２５１、人等のユーザとのコミュニケーション２５２、人まね（関節マッピングを含む）や歌まね（声まねを含む）やボール遊びなどの遊び２５３、笑ったり嬉しがったり怒ったり泣いたりなどの感情表現２５４などの行動を挙げることができる。これにより、例えば、自律移動体１の所有者を識別した場合には喜びを表現するアクションを実行したり、ボールを認識した場合にはボールで遊ぶアクションを実行したりなどを、インタラクション実行部１５０は自律移動体１に実行させることが可能となる。

動物等の動作に近い動作２５１には、例えば、「足があったら見上げる」、「音がしたら振り返る」、「気になるものを順番に確認する」、「よく見えなかったら近づいて確認する」、「相手の動きに反応する」、「人の目線と同じ方向を見る」、「夢中になっていると周囲からの呼びかけに対して反応しない場合がある」などが含まれ得る。これらの動作２５１を特定の行動（インタラクション）１５２としてインタラクション実行部１５０に実行させることで、自律移動体１に好奇心などを表現するように行動させることが可能となる。

コミュニケーション２５２には、例えば、「所有者（飼い主）から呼ばれたら鳴いて近づく」、「手を叩かれたら近づく」、「話しかけられたら目を合わせる」、「撫でられたらおなかを見せる」などが含まれ得る。これらのコミュニケーション２５２を特定の行動（インタラクション）１５２としてインタラクション実行部１５０に実行させることで、ユーザが自律移動体１を呼び寄せたり、自律移動体１と会話をしたりなど、自律移動体１にユーザとのコミュニケーションを実行させることが可能となる。また、これらのコミュニケーション２５２を特定の行動（インタラクション）１５２としてインタラクション実行部１５０に実行させることで、自律移動体１が顔や人や物体を見つける回数が増えるため、自律移動体１がインタラクションを実行する機会を増加させることも可能となる。

遊び２５３には、例えば、「ボールが投げられたら追いかける」、「ボールを相手に蹴る」、「走ったらついて行く」などが含まれ得る。これらの遊び２５３を特定の行動（インタラクション）１５２としてインタラクション実行部１５０に実行させることで、ユーザがボールなどの遊び道具を用いて自律移動体１と遊ぶことが可能になる。

感情表現２５４には、例えば、「所有者（飼い主）を見つけたら尻尾を振る」、「叩かれそうになったら伏せる」、「怒られたら尻尾を下げる」などが含まれ得る。これらの感情表現２５４を特定の行動（インタラクション）１５２としてインタラクション実行部１５０に実行させることで、自律移動体１に自我を持ったような行動を実行させることが可能となる。

１．６自律システムの動作例
つづいて、本実施形態に係る自律システム１００の動作例を、図面を参照して詳細に説明する。なお、以下では、説明の簡略化のため、使用するセンサをカメラ３２とし、カメラ３２で取得された画像データに対して自律システム１００が実行する動作を例示する。

図７は、本実施形態に係る自律システムの全体の概略動作の一例を示すフローチャートである。図７に示すように、本動作では、所定の終了条件が満たされるまで（ステップＳ３００のＹＥＳ）、行動フェーズ（ステップＳ１００）と認識フェーズ（注目度マップ作成・更新）（ステップＳ２００）とが繰り返し実行される（ステップＳ３００のＮＯ）。なお、行動フェーズ（ステップＳ１００）と認識フェーズ（注目度マップ作成・更新）（ステップＳ２００）との順番は逆であってもよい。

ステップＳ１００の行動フェーズでは、行動決定部１４０によって各ステップが実行される。ステップＳ２００の認識フェーズ（注目度マップ作成・更新）では、センサ群１１０、物体検出・認識部１２０、注目度マップ作成・更新部１３０又はインタラクション実行部１５０によって各ステップが実行される。

１．６．１行動フェーズ
まず、図７のステップＳ１００に示す行動フェーズについて、図面を参照して詳細に説明する。図８は、本実施形態に係る行動フェーズの流れの一例を示すフローチャートである。図８に示すように、行動フェーズでは、行動決定部１４０は、まず、注目度マップＤＢ１０３から最新の注目度マップ４０を取得する（ステップＳ１０１）。つづいて、行動決定部１４０は、注目度マップ４０に対して注目領域Ａを設定する注目領域設定処理を実行する（ステップＳ１０２）。なお、注目領域設定処理の詳細については、後述において触れる。

つぎに、行動決定部１４０は、自律移動体１から注目領域Ａまでの距離と注目領域Ａのサイズとに基づいて、カメラ３２の画角に対して注目領域Ａのサイズが大きすぎるか否かを判断し（ステップＳ１０５）、大きすぎない場合（ステップＳ１０５のＮＯ）、ステップＳ１０７へ進む。一方、注目領域Ａのサイズが大きすぎる場合（ステップＳ１０５のＹＥＳ）、行動決定部１４０は、行動ルールＤＢ１０４を参照することで、「注目領域Ａのサイズがカメラ３２の画角と合うように、注目領域Ａから遠ざかる方向へ移動する」という行動を決定し、この決定した行動を実行する。これにより、図９の矢印Ｙ１に示されているように、注目領域Ａがカメラ３２の画角ＡＦ内に丁度よく収まるように、自律移動体１が注目領域Ａから遠ざかる（下がる）（図８のステップＳ１０６）。その後、行動決定部１４０は、ステップＳ１０９へ進む。

ステップＳ１０７では、行動決定部１４０は、自律移動体１から注目領域Ａまでの距離と注目領域Ａのサイズとに基づいて、カメラ３２の画角に対して注目領域Ａのサイズが小さすぎるか否かを判断し、小さすぎない場合（ステップＳ１０７のＮＯ）、ステップＳ１０９へ進む。一方、注目領域Ａのサイズが小さすぎる場合（ステップＳ１０７のＹＥＳ）、行動決定部１４０は、行動ルールＤＢ１０４を参照することで、「注目領域Ａのサイズがカメラ３２の画角と合うように、注目領域Ａに近づく方向へ移動する」という行動を決定し、この決定した行動を実行する。これにより、図１０の矢印Ｙ２に示されているように、注目領域Ａがカメラ３２の画角ＡＦ内に丁度よく収まるように、自律移動体１が注目領域Ａに近づく（図８のステップＳ１０８）。その後、行動決定部１４０は、ステップＳ１０９へ進む。

なお、カメラ３２の画角ＡＦに対して注目領域Ａのサイズが大きすぎるか否か、又は、小さすぎる否かについては、自律移動体１から注目領域Ａまでの距離と注目領域Ａのサイズとに基づいて、カメラ３２から見た注目領域Ａの角度範囲（縦方向及び横方向）を求め、この角度範囲がカメラ３２の画角に対してどの程度の割合であるかに基づいて判断されてもよい。

具体例を用いて説明すると、例えば、カメラ３２から見た注目領域Ａの縦方向及び横方向のうちの少なくとも一方向の角度範囲がカメラ３２の画角又は画角に対する第１の割合（例えば画角の８０％など）よりも大きい場合、行動決定部１４０がカメラ３２の画角に対する注目領域Ａのサイズが大きすぎると判断（ステップＳ１０５のＹＥＳ）し、それ以外の場合は大きすぎないと判断（ステップＳ１０５のＮＯ）してもよい。

同様に、例えば、カメラ３２から見た注目領域Ａの縦方向及び横方向のうちの少なくとも一方向の角度範囲がカメラ３２の画角又は画角に対する第２の割合（例えば画角の１０％など）未満である場合、行動決定部１４０がカメラ３２の画角に対する注目領域Ａのサイズは小さすぎると判断（ステップＳ１０７のＹＥＳ）、それ以外の場合小さすぎないと判断（ステップＳ１０７のＮＯ）してもよい。

なお、第１の割合は、自律移動体１の位置・姿勢の誤差や注目領域Ａを画角内に収める際の効率等を考慮して、画角に対してある程度のマージンを設定できる値であってよい。また、第２の割合は、カメラ３２で取得した画像データから注目領域Ａ中の物体（例えば顔等）を認識できるか否か等に基づいて設定されてよい。その場合、例えば解像度の高いカメラ３２であれば第２の割合は比較的小さな値に設定され、解像度の低いカメラ３２であれば第２の割合は比較的大きな値に設定される。

ステップＳ１０９では、行動決定部１４０は、注目領域Ａがカメラ３２の画角の中心又は略中心に位置しているか否かを判断する。例えば、行動決定部１４０は、注目領域Ａの中心、又は、注目領域Ａにおける最も注目度の高い位置がカメラ３２の画角の中心又は略中心に位置しているか否かを判断する。注目領域Ａがカメラ３２の画角の中心又は略中心に位置している場合（ステップＳ１０９のＹＥＳ）、本動作が図７に示す動作へリターンする。一方、注目領域Ａがカメラ３２の画角の中心又は略中心に位置していない場合（ステップＳ１０９のＮＯ）、行動決定部１４０は、行動ルールＤＢ１０４を参照することで、「注目領域Ａの中心、又は、注目領域Ａにおける最も注目度の高い位置がカメラ３２の画角の中心又は略中心に位置するように、カメラ３２のロール角（Ｒ）、ピッチ角（Ｐ）、ヨー角（Ｙ）等を制御する」という行動を決定し、この決定した行動を実行する。これにより、図１１の矢印Ｙ３に示されているように、注目領域Ａの中心、又は、注目領域Ａにおける最も注目度の高い位置がカメラ３２の画角ＡＦの中心又は略中心に位置するように、カメラ３２のロール角（Ｒ）、ピッチ角（Ｐ）、ヨー角（Ｙ）等が制御されてカメラ３２の画角ＡＦが移動される（図８のステップＳ１１０）。その後、本動作が図７に示す動作へリターンする。

１．６．１．１自律移動体が注目領域に近すぎ且つ注目領域が画角の中心に無い場合
ここで、自律移動体１が注目領域Ａに近すぎ且つ注目領域が画角の中心に無い場合の動作、すなわち、図８のステップＳ１０５のＹＥＳ〜Ｓ１１０の動作を、図１２を用いて説明する。図１２に示すように、自律移動体１が注目領域Ａに近すぎる場合、カメラ３２の画角に対して注目領域Ａのサイズが大きすぎると判断される（ステップＳ１０５のＹＥＳ）。その場合、行動決定部１４０によって決定された行動を実行することで、注目領域Ａがカメラ３２の画角ＡＦ内に丁度よく収まるように、自律移動体１が注目領域Ａから遠ざかる（下がる）（ステップＳ１０６）。

そして、注目領域Ａがカメラ３２の画角の中心又は略中心に位置していないと判断される（ステップＳ１０９のＮＯ）。この判断に対し、行動決定部１４０よって決定された行動を実行することで、注目領域Ａの中心、又は、注目領域Ａにおける最も注目度の高い位置がカメラ３２の画角ＡＦの中心又は略中心に位置するように、カメラ３２のロール角（Ｒ）、ピッチ角（Ｐ）、ヨー角（Ｙ）等が制御される（ステップＳ１１０）。

１．６．１．２自律移動体が注目領域から遠すぎ且つ注目領域が画角の中心に無い場合
つづいて、自律移動体１が注目領域Ａから遠すぎ且つ注目領域が画角の中心に無い場合の動作、すなわち、図８のステップＳ１０７のＹＥＳ〜Ｓ１１０の動作を、図１３を用いて説明する。図１３に示すように、自律移動体１が注目領域Ａから遠すぎる場合、カメラ３２の画角に対して注目領域Ａのサイズが小さすぎると判断される（ステップＳ１０７のＹＥＳ）。その場合、行動決定部１４０によって決定された行動を実行することで、注目領域Ａがカメラ３２の画角ＡＦ内に丁度よく収まるように、自律移動体１が注目領域Ａに近づく（ステップＳ１０８）。

１．６．１．３注目領域設定処理
つぎに、図８のステップＳ１０３に示す、注目度が高い領域を注目領域Ａに設定する際の動作（注目領域設定動作）について、図面を参照して詳細に説明する。図１４は、本実施形態に係る注目領域設定動作の一例を示すフローチャートである。図１４に示すように、本動作では、行動決定部１４０は、まず、図８のステップＳ１０１で取得した注目度マップ４０における注目度の最大値を探索する（ステップＳ１２１）。

つぎに、行動決定部１４０は、探索された注目度の最大値が予め設定しておいた第１閾値よりも大きいか否かを判断し（ステップＳ１２２）、大きい場合（ステップＳ１２２のＹＥＳ）、ステップＳ１２４へ進む。一方、注目度の最大値が第１閾値以下である場合（ステップＳ１２２のＮＯ）、行動決定部１４０は、注目度マップ４０の所定空間ＳＰからランダムで選択した領域を注目領域Ａに設定し（ステップＳ１２３）、図８に示す動作へリターンする。

ステップＳ１２４では、行動決定部１４０は、注目度の最大値の近傍領域で注目度が第２閾値以上である領域を探索する。なお、第２閾値は、第１閾値よりも低い値であってよい。つづいて、行動決定部１４０は、ステップＳ１２４で特定した領域の外接直方体を作成し（ステップＳ１２５）、作成した外接直方体を注目領域Ａに設定する（ステップＳ１２６）。その後、行動決定部１４０は、図８に示す動作へリターンする。

なお、行動決定部１４０は、ステップＳ１２３においてランダムで選択した領域を注目領域Ａに設定する代わりに、ステップＳ１２４をスキップして図８に示す動作へリターンしてもよい。その場合、例えば、前回の行動フェーズにおける注目領域設定処理で設定された注目領域Ａが継続して使用されてもよい。

１．６．１．４注目領域設定処理の具体例
ここで、図１４に示す注目領域設定処理について、具体例を用いて詳細に説明する。なお、以下では、説明の簡略化のため、注目度マップ４０として２次元の注目度マップ４１を例示する。注目度マップ４１は、例えば、グリッドマップ４３における各セル（マスともいう）に注目度が設定された構成を有している。

図１５は、図１４におけるステップＳ１２１を説明するための図である。図１５に示すように、図１４のステップＳ１２１では、行動決定部１４０は、注目度マップ４１の各セルを探索することで、最大値の注目度が設定されている第１のセルＭ１を特定する。

図１６は、図１４におけるステップＳ１２４を説明するための図である。図１６に示すように、図１４のステップＳ１２４では、行動決定部１４０は、ステップＳ１２１で特定した第１のセルＭ１の周囲のセルを探索することで、注目度が第２閾値以上（図１６に示す例では、５以上）の第２のセルＭ２を特定する。なお、探索する領域は、例えば、第１のセルＭ１から予め設定しておいた所定数のセル（図１６に示す例では、３セル）までの領域であってよい。

図１７は、図１４におけるステップＳ１２５及びＳ１２６を説明するための図である。図１６に示すように、図１４のステップＳ１２４では、行動決定部１４０は、以上のようにして特定した第１のセルＭ１及び第２のセルＭ２の領域の外縁に接し且つ当該領域を包含する矩形の領域（ただし、３次元の注目度マップ４０の場合は、直方体の領域）を作成する。そして、行動決定部１４０は、図１４のステップＳ１２５において、この矩形の領域を注目領域Ａに設定する。

１．６．２認識フェーズ（注目度マップ作成・更新）
つぎに、図７のステップＳ２００に示す認識フェーズ（注目度マップ作成・更新）について、図面を参照して詳細に説明する。図１８は、本実施形態に係る認識フェーズの流れの一例を示すフローチャートである。なお、図１８において、ステップＳ２０１は、センサ群１１０が実行するステップであり、ステップＳ２０２〜Ｓ２０４、Ｓ２０６及びＳ２０９は、物体検出・認識部１２０が実行するステップであり、ステップＳ２０５、Ｓ２０７、Ｓ２０８、及び、Ｓ２１２〜Ｓ２１４は、注目度マップ作成・更新部１３０が実行するステップであり、ステップＳ２１０及びＳ２１１は、インタラクション実行部１５０が実行するステップである。

図１８に示すように、認識フェーズでは、まず、センサ群１１０のカメラ３２が、取得した画像データを物体検出・認識部１２０に入力する（ステップＳ２０１）。つぎに、物体検出・認識部１２０が、入力された画像データに対して画像認識処理（図４の認識処理１２２、図６の顔検出２２１、顔識別２２２、個人識別２２３、人体検出（一部分を含む）２２６等に相当）を実行する（ステップＳ２０２）。

つぎに、物体検出・認識部１２０は、ステップＳ２０２の画像認識処理（人体検出（一部分を含む）２２６に相当）の結果、人が検出されたか否かを判断する（ステップＳ２０３）。人が検出されなかった場合（ステップＳ２０３のＮＯ）、本動作が図７に示す動作へリターンする。

一方、人が検出された場合（ステップＳ２０３のＹＥＳ）、物体検出・認識部１２０は、ステップＳ２０２の画像認識処理（顔検出２２１に相当）の結果、人の顔が検出されたか否かを判定する（ステップＳ２０４）。人の顔が検出されていない場合（ステップＳ２０４のＮＯ）、注目度マップ作成・更新部１３０が、ステップＳ２０２の画像認識処理（人体検出（一部分を含む）２２６に相当）で検出された人の部位等から、注目度マップ４０内における当該人の顔があるであろう位置（方向を含んでもよい）を予測し（ステップＳ２０５）、ステップＳ２０８へ進む。例えば、図１９に示すように、ステップＳ２０２の画像認識処理（人体検出（一部分を含む）２２６に相当）で人Ｈ１の脚Ｈ２の部位が検出された場合では、当該人Ｈ１の頭は、通常では、脚Ｈ２の上方に存在している。そこで、ステップＳ２０５では、検出された脚Ｈ２の上方に頭があるとして、所定空間ＳＰ内における当該人の顔があるであろう位置（又は領域）Ｒ１を予測する。

一方、人の顔が検出されていた場合（ステップＳ２０４のＹＥＳ）、物体検出・認識部１２０は、ステップＳ２０２の画像認識処理（顔識別２２２に相当）の結果、人の顔を識別できたか否かを判定する（ステップＳ２０６）。人の顔を識別できなかった場合（ステップＳ２０６のＮＯ）、注目度マップ作成・更新部１３０が、ステップＳ２０２の画像認識処理（人体検出（一部分を含む）２２６又は顔検出２２１に相当）で検出された人の部位又は顔の位置及び向き等から、注目度マップ４０内における当該人の顔を識別できるであろう位置（方向を含んでもよい）を予測し（ステップＳ２０７）、ステップＳ２０８へ進む。

一方、人の顔を識別できていた場合（ステップＳ２０６のＹＥＳ）、物体検出・認識部１２０は、個人識別ＤＢ１０２を参照することで、識別された顔を持つ個人が個人識別ＤＢ１０２に登録されているか否かを判定する（ステップＳ２０９）。個人識別ＤＢ１０２に登録されている顔である場合（ステップＳ２０９のＹＥＳ）、インタラクション実行部１５０が、特定行動ルールＤＢ１０５を参照することで、個人識別ＤＢ１０２から特定した個人に対して現在の状況等に応じた特定の行動１５２（図４参照）を実行し（ステップＳ２１０）、その後、本動作がステップＳ２１２へ進む。一方、個人識別ＤＢ１０２に登録されていない顔である場合（ステップＳ２０９のＮＯ）、インタラクション実行部１５０が、特定行動ルールＤＢ１０５を参照することで、未知の個人に対して現在の状況等に応じた特定の行動１５２（図４参照）を実行し（ステップＳ２１１）、その後、本動作がステップＳ２１２へ進む。

ステップＳ２０８では、注目度マップ作成・更新部１３０が、ステップＳ２０５又はＳ２０７で予測した位置の周囲に高い注目度を設定した現フレームについての個別の注目度マップ４２を作成する。そして、本動作がステップＳ２１２へ進む。例えば、図１９で例示したように、ステップＳ２０５において、検出された脚Ｈ２の上方に頭があるとして、注目度マップ４０内における当該人の顔があるであろう位置（又は領域）Ｒ１が予測された場合には、図２０に示すように、現フレームについての個別の注目度マップ４２として、予測された位置Ｒ１（又は領域の中心）に注目度の局所的なピークを持つ３次元ガウス分布形状の分布５４を含む現フレームについての個別の注目度マップ４２が作成される。なお、現フレームとは、例えばカメラ３２で取得された画像データであれば、直前に取得された最新の画像データに相当する。また、例えばマイクロフォン３１で取得された音声データであれば、直前の所定期間に取得された最新の音声データに相当する。

ステップＳ２１２では、注目度マップ作成・更新部１３０の注目度減衰部１３９（図４参照）が、注目度マップＤＢ１０３に格納されている注目度マップ４０に対して、所定のルールに従った注目度の減衰処理を実行する。つぎに、注目度マップ作成・更新部１３０が、ステップＳ２０８において現フレームにつての個別の注目度マップが作成されたか否かを判断し（ステップＳ２１３）、作成していない場合（ステップＳ２１３のＮＯ）、本動作が図７に示す動作へリターンする。

一方、現フレームについての個別の注目度マップ４２が作成されていた場合（ステップＳ２１３のＹＥＳ）、注目度マップ作成・更新部１３０が、現フレームについての個別の注目度マップ４２を、注目度マップＤＢ内の注目度マップ４０に加算し（ステップＳ２１４）、その後、本動作が図７に示す動作へリターンする。なお、注目度マップＤＢ内の注目度マップ４０に対する現フレームについての個別の注目度マップ４２の加算では、例えば、注目度マップ４０と現フレームについての個別の注目度マップ４２とで対応するセル（３次元の注目度マップの場合はボックスセル）の注目度が加算されてもよい。

１．６．２．１注目度の減衰処理から現フレームの個別の注目度マップを既存の注目度マップに加算するまで
ここで、図１８におけるステップＳ２１２〜Ｓ２１４までの動作、すなわち、注目度の減衰処理（Ｓ２１２）から現フレームの個別の注目度マップを既存の注目度マップに加算する処理（Ｓ２１４）までの動作について、具体例を用いて説明する。なお、本説明では、注目度マップＤＢ１０３に図５に示す注目度マップ４０が格納されており、そして、図１８のステップＳ２０８において、図２０に示す個別の注目度マップ４２が作成されたものとする。また、以下では、簡略化のため、３次元の注目度マップを２次元の注目度マップに置き換えて説明する。その場合、図５に示す３次元の注目度マップ４０が図２２の上段に示す２次元の注目度マップ４０に置き換えられ、図２０に示す３次元の個別の注目度マップ４２が図２１に示す２次元の個別の注目度マップ４２ａに置き換えられる。

本動作では、図８に示す行動フェーズにより、図５における分布５１に相当する領域が注目領域Ａに設定されて処理される。そこで、図１８のステップＳ２１２では、図２２に示すように、例えば、行動フェーズにおいて処理された分布５１に相当する領域の注目度が、所定のルールに従って減衰される。その結果、図２２の下段に示す注目度マップ４０ａに示すように、分布５１がこれよりも注目度の低い分布５１ａに減衰する。なお、所定のルールとは、例えば、該当する領域の注目度を所定の割合（例えば半分等）に減衰するなどのルールであってよい。

そして、図１８のステップＳ２１４では、図２３に示すように、減衰済みの注目度マップ４０ａと、現フレームについての個別の注目度マップ４２とが加算される。その結果、図２３の最下段に示すように、減衰済みの注目度マップ４０ａと現フレームについての個別の注目度マップ４２とが合成された新たな注目度マップ４０Ａが作成されて、注目度マップＤＢ１０３に格納される。

なお、注目度マップＤＢ１０３内の注目度マップ４０を減衰するルールとしては、上述のような、確認済みの領域の注目度を減衰するルールの他、例えば、所定時間が経過する度に注目度マップ４０全体の注目度を減衰するルールや、行動フェーズにおいて確認したが注目すべきものが存在しなかった領域の注目度を大幅に減衰するルールなど、種々のルールを適用することが可能である。

１．６．３自律システムの動作の他の例
上述では、センサ群１１０において使用するセンサをカメラ３２とし、カメラ３２で取得された画像データに対して自律システム１００が実行する動作の例を説明したが、以下では、センサ群１１０において使用するセンサをマイクロフォン３１とし、マイクロフォン３１で取得された音声データに対して自律システム１００が実行する動作の例を説明する。

上述において、図７〜図１７を用いて説明した行動フェーズの動作は、基本的には、使用するセンサをマイクロフォン３１とした場合にも適用可能であるため、ここでは重複する説明を省略する。

図２４は、使用するセンサをマイクロフォンとした場合の認識フェーズ（注目度マップ作成・更新）の流れの一例を示すフローチャートである。なお、図２４に示す動作において、図１８に示すステップと同様のステップについては、それを引用することで、詳細な説明を省略する。

図２４に示すように、認識フェーズでは、まず、センサ群１１０のマイクロフォン３１が、取得した音声データを物体検出・認識部１２０に入力する（ステップＳ２４１）。つぎに、物体検出・認識部１２０が、入力された音声データの音量が予め設定しておいた閾値より大きいか否かを判定し（ステップＳ２４２）、閾値以下である場合（ステップＳ２４２のＮＯ）、本動作が図７に示す動作へリターンする。一方、閾値より大きい場合（ステップＳ２４２のＹＥＳ）、物体検出・認識部１２０が、入力された音声データに対して音声認識処理（図４の認識処理１２１、図６の音源方向検出２２７、音声識別２２８、個人識別２２３等に相当）を実行する（ステップＳ２４３）。

つぎに、物体検出・認識部１２０は、ステップＳ２４３の音声認識処理（音源方向検出２２７に相当）の結果、音源の方向を推定できたか否かを判定する（ステップＳ２４４）。音源の方向を推定できなかった場合（ステップＳ２４４のＮＯ）、注目度マップ作成・更新部１３０が、注目度マップ４０の空間全体を音源が存在する可能性のある位置として予測範囲に設定する（ステップＳ２４５）。つづいて、注目度マップ作成・更新部１３０が、例えば、空間全体に対して一様な注目度を設定した現フレームについての個別の注目度マップ４２を作成し（ステップＳ２４６）、ステップＳ２１２へ進む。

一方、音源の方向を推定できた場合（ステップＳ２４４のＹＥＳ）、物体検出・認識部１２０は、ステップＳ２４３の音声認識処理（音声識別２２８に相当）の結果、音源が人であるか否かを判定する（ステップＳ２４７）。人でない場合（ステップＳ２４７のＮＯ）、注目度マップ作成・更新部１３０が、ステップＳ２４３の音声認識処理（音源方向検出２２７に相当）の結果から、音源の種類を特定できるであろう位置（方向を含んでもよい）を予測する（ステップＳ２４８）。つづいて、注目度マップ作成・更新部１３０が、予測した位置の周囲に高い注目度を設定した現フレームについての個別の注目度マップ４２を作成し（ステップＳ２４９）、ステップＳ２１２へ進む。

一方、音源が人であった場合（ステップＳ２４７のＹＥＳ）、物体検出・認識部１２０は、個人識別ＤＢ１０２を参照することで、検出された声紋と一致する声紋を持つ個人が個人識別ＤＢ１０２に登録されているか否かを判定する（ステップＳ２５０）。個人識別ＤＢ１０２に登録されている声紋である場合（ステップＳ２５０のＹＥＳ）、インタラクション実行部１５０が、図１８に示す動作と同様に、特定行動ルールＤＢ１０５を参照することで、個人識別ＤＢ１０２から特定した個人に対して現在の状況等に応じた特定の行動１５２（図４参照）を実行し（ステップＳ２１０）、その後、本動作がステップＳ２１２へ進む。一方、個人識別ＤＢ１０２に登録されていない顔である場合（ステップＳ２５０のＮＯ）、インタラクション実行部１５０が、図１８に示す動作と同様に、特定行動ルールＤＢ１０５を参照することで、未知の個人に対して現在の状況等に応じた特定の行動１５２（図４参照）を実行し（ステップＳ２１１）、その後、本動作がステップＳ２１２へ進む。

ステップＳ２１２では、図１８に示す動作と同様に、注目度マップ作成・更新部１３０の注目度減衰部１３９が注目度マップＤＢ１０３内の注目度マップ４０の注目度を所定のルールに従った減衰する。以降、図１８に示す動作と同様に、注目度マップ作成・更新部１３０が、ステップＳ２４６又はＳ２４９において現フレームにつての個別の注目度マップが作成されたか否かを判断し（ステップＳ２１３）、作成していない場合（ステップＳ２１３のＮＯ）、本動作が図７に示す動作へリターンする。一方、現フレームについての個別の注目度マップ４２が作成されていた場合（ステップＳ２１３のＹＥＳ）、注目度マップ作成・更新部１３０が、現フレームについての個別の注目度マップ４２を、注目度マップＤＢ内の注目度マップ４０に加算し（ステップＳ２１４）、その後、本動作が図７に示す動作へリターンする。

１．７注目度マップの作成に用いる情報の例
上述の説明において注目度マップ４０を作成する際に使用した情報（顔検出２２１、顔識別２２２、音源方向検出２２７、音声識別２２８等）は、単なる例であって、これらに限定されるものではない。そこで、図２５に、注目度マップの作成に使用する情報５１０の例と、その情報に基づいて注目度を高くする場所５２０の例と、注目度を高くする理由５３０の例とを示す。

図２５に示すように、注目度マップ４０の作成に使用する情報５１０としては、顔検出結果、人体検出結果（一部分を含む）、視線検出結果、物体認識結果、動体検出結果、トラッキング結果、音源方向検出結果、振動方向検出結果、匂い検出結果、時間と習慣との組合せ等を例示することができる。

顔検出結果は、顔検出２２１の結果であってよい。人体検出結果（一部分を含む）は、人体検出（一部分を含む）２２６の結果であってよい。視線検出結果は、視線検出２２４の結果であってよい。動体検出結果は、動体検出２２５の結果であってよい。トラッキング結果は、トラッキング２２９の結果であってよい。音源方向検出結果は、音源方向検出２２７の結果であってよい。

また、物体認識結果は、例えば、物体検出・認識部１２０がカメラ３２等で取得された画像データ等に対して実行した物体認識の結果であってよい。振動方向検出結果は、例えば、センサ群１１０に振動センサが含まれている場合であって、物体検出・認識部１２０が振動センサによって取得されたセンサデータから振動源の方向を特定したその結果であってよい。匂い検出結果は、例えば、センサ群１１０に匂いセンサが含まれている場合であって、物体検出・認識部１２０が匂いセンサによって取得されたセンサデータから特定の匂いを検出した際のその結果であってよい。時間と習慣との組合せは、例えば、センサ群１１０の各センサで取得されたセンサデータに基づいて特定される人の行動を時間情報と共に蓄積しておき、この蓄積されているセンサデータから直接、又は、統計処理することで得られる人の習慣に関する情報であってよい。

顔検出結果又は人体検出結果（一部分を含む）に基づいて注目度を高くする場所５２０は、顔が位置する場所、人体全体が位置する場所等であってよい。顔が位置する場所の注目度を高くする理由５３０は、例えば、センサ群１１０において顔を含む画像データを取得し、物体検出・認識部１２０において画像データに対する顔識別や表情識別を実行するためである。人体全体が位置する場所の注目度を高くする理由５３０は、例えば、センサ群１１０において人体全体を含む画像データを取得し、物体検出・認識部１２０において画像データに対する人識別や人の行動を認識するアクション認識を実行するためである。

視線検出結果に基づいて注目度を高くする場所５２０は、人が注目している物体が位置する場所等であってよい。人が注目している物体が位置する場所の注目度を高くする理由５３０は、例えば、センサ群１１０において人が注目している物体を含む画像データを取得し、物体検出・認識部１２０において画像データに対する物体認識を実行するためである。

物体認識結果に基づいて注目度を高くする場所５２０は、テーブルの上などの物体が位置する場所等であってよい。テーブルの上などの物体が位置する場所の注目度を高くする理由５３０は、例えば、センサ群１１０においてテーブルの上などの物体が位置する場所を含む画像データを取得し、物体検出・認識部１２０において画像データに対する物体認識を実行するためである。

動体検出結果に基づいて注目度を高くする場所５２０は、動体が位置する場所等であってよい。動体が位置する場所の注目度を高くする理由５３０は、例えば、センサ群１１０において動体を含む画像データを取得し、物体検出・認識部１２０において画像データに基づいて動体を特定したり人を特定したりするためである。

トラッキング結果に基づいて注目度を高くする場所５２０は、人の移動先となる場所等であってよい。人の移動先となる場所の注目度を高くする理由５３０は、例えば、センサ群１１０において人の移動先を含む画像データを取得し、物体検出・認識部１２０において画像データに基づいて人を特定したり人の行動を特定したりするためである。

音源方向検出結果に基づいて注目度を高くする場所５２０は、音源の位置する場所等であってよい。音源の位置する場所の注目度を高くする理由５３０は、例えば、センサ群１１０において音源を含む画像データを取得し、物体検出・認識部１２０において画像データに基づいて人を特定したり人の行動を特定したりするためである。

振動方向検出結果に基づいて注目度を高くする場所５２０は、振動源の位置する場所等であってよい。振動源の位置する場所の注目度を高くする理由５３０は、例えば、センサ群１１０において振動源を含む画像データを取得し、物体検出・認識部１２０において画像データに基づいて動体を特定したり人を特定したり人の行動を特定したりするためである。

匂い検出結果に基づいて注目度を高くする場所５２０は、匂い源の位置する場所等であってよい。匂い源の位置する場所の注目度を高くする理由５３０は、例えば、センサ群１１０において音源を含む画像データを取得し、物体検出・認識部１２０において画像データに基づいて人を特定したり人の行動を特定したりするためである。

時間と習慣との組合せに基づいて注目度を高くする場所５２０は、人のいそうな場所等であってよい。人のいそうな場所の注目度を高くする理由５３０は、例えば、センサ群１１０において人を含む画像データを取得し、物体検出・認識部１２０において画像データに基づいて人を特定したり人の行動を特定したりするためである。

１．８作用・効果
以上のように、本実施形態によれば、センサ群１１０で取得されたセンサデータに基づいて注目度マップ４０が逐次更新され、注目度マップ４０に基づいて自律移動体１の次の行動が決定されるため、自律移動体１が注目すべき場所又は領域を状況やコミュニケーションの相手に応じてより的確に注目領域Ａに設定することが可能となる。それにより、より自然なコミュニケーションやインタラクションを実行することが可能となる。

また、本実施形態では、確認済みの領域や時間経過などに基づいて注目度マップ４０の注目度を減衰させるため、自律移動体１が注目すべき場所又は領域を現在の状況に応じてより的確に注目領域Ａに設定することが可能となる。それにより、より自然なコミュニケーションやインタラクションを実行することが可能となる。

また、本実施形態では、１つ又は複数のセンサで取得されたセンサデータを用いて現フレームについての個別の注目度マップ４２を作成し、この個別の注目度マップ４２を注目度マップ４０に加算するため、複数の事象を統合した注目度マップ４０を容易に作成することが可能となる。

１．９変形例
上述の実施形態では、行動フェーズと認識フェーズとを交互に実行する場合を例示したが、このような動作に限定されるものではない。例えば、行動フェーズと認識フェーズとを交互に実行し、ある時点で、行動フェーズを所定回数連続して繰り返し実行してもよい。ただし、その場合でも、各行動フェーズのあとに注目度マップ４０における確認済みの領域の注目度を所定のルールで減衰させる処理を実行させるとよい。

また、上述の実施形態では、注目度マップ４０において、自律移動体１が注目すべき場所又は領域に高い注目度が設定される場合を例示したが、これに限らず、例えば、自律移動体１が位置すべき場所に高い注目度が設定されるように構成することも可能である。その場合、注目度マップ４０は、自律移動体１の一連の動作が登録された動作マップとして機能し得る。自律移動体１は、注目度マップ４０において注目度の高い位置を順に辿るように動作することとなる。

また、上述の実施形態では、行動フェーズと認識フェーズとが一連の動作（同一スレッド）として実行される場合を例示したが、これに限らず、例えば、行動フェーズと認識フェーズとがそれぞれマルチタスクのスレッド又はプロセスとして独立して実行されてもよい。その場合、行動フェーズにおいて、突発的に発生した注目度の高いイベント等によって割り込みが発生してもよい。

なお、行動フェーズと認識フェーズとをそれぞれマルチタスクのスレッド又はプロセスとして独立して実行する場合、図１８又は図２４のステップＳ２１０又はＳ２１１で実行される特定の行動１５２は、例えば、一定の期間、継続して実行されてもよい。その場合、特定の行動１５２の継続中は、認識フェーズを実行しないこととしてもよいし、認識フェーズの実行サイクルを下げてもよいし、注目領域Ａを決定する際の第１閾値（図１４のステップＳ１２２参照）を一時的に上げることで注目領域Ａが設定されることを回避してもよい。

また、上述の実施形態において例示した注目度マップ４０又は注目度マップＤＢ１０３は、複数の自律移動体１Ａ〜１Ｎで共有されてもよい。

さらに、注目度マップ４０の各ボックスセルに設定されている注目度は、スカラー値であってもよいし、ベクトル値であってよい。例えば、人の顔の位置に相当するボックスセルには、人の顔の方向を向くベクトル値が注目度として設定されていてもよい。

また、各ボックスセルに設定されている注目度には、属性情報が付加されていてもよい。この属性情報には、例えば、ソース属性、結果属性、時間係数などを含めることができる。

ソース属性とは、その注目度の算出において使用したセンサデータを取得したセンサに関する情報であり、例えば、その注目度が、カメラ３２で取得された画像データを認識処理１２２することで得られたものであるか、マイクロフォン３１で取得された音声データを認識処理１２１することで得られた情報であるか等の情報である。このようなソース属性を付加することで、例えば、行動決定部１４０が行動を決定する際（図４の行動決定１４２）に、ソース属性に応じて決定する行動を変えるように構成することが可能である。例えば、ソース属性がカメラ３２で取得された画像データを認識処理１２２することで得られたものであることを示している場合、行動決定部１４０は、行動決定１４２において、カメラ３２での撮像に好適な位置へ自律移動体１を移動させる行動を決定することができる。また、ソース属性がマイクロフォン３１で取得された音声データを認識処理１２１することで得られたものであることを示している場合、行動決定部１４０は、行動決定１４２において、マイクロフォン３１での集音に好適な位置、又は、マイクロフォン３１での集音とカメラ３２での撮影との両方が可能である位置へ、自律移動体１を移動させる行動を決定することができる。

結果属性とは、その注目度の由来に関する情報であり、例えば、その注目度が、楽しそうな事象に対する注目度であるか、恐ろしい事象に対する注目度であるか、危険な事象に対する注目度であるか等の情報である。このような結果属性を付加することで、例えば、行動決定部１４０が行動を決定する際（図４の行動決定１４２）に、結果属性に応じて決定する行動を変えるように構成することが可能である。例えば、結果属性が楽しそうな事象に対する注目度であることを示している場合、行動決定部１４０は、行動決定１４２において、楽しさを表現する行動（例えば、尻尾を振るなど）を決定することができる。また、結果属性が恐ろしい事象に対する注目度であることを示している場合、行動決定部１４０は、行動決定１４２において、恐れを表現する行動（例えば、遠くから確認するや尻尾を下げるなど）を決定することができる。

時間係数とは、その注目度が設定された領域に対してどの程度の時間継続して注目すべきであるかに関する情報である。このような時間係数を付加することで、例えば、注目度マップ作成・更新部１３０の注目度減衰部１３９が注目度マップ４０内の注目度を減衰する際の減衰の程度や頻度をボックスセルごとに決定することが可能となる。例えば、大きな音に由来する注目度であれば、行動決定部１４０が発生から直ぐに確認の行動を取らなかった場合には、比較的短時間で減衰するように構成することが可能となる。

また、上述の実施形態では、注目すべき領域の注目度を高くするための、現フレームについての個別の注目度マップ４２を作成する場合を例示したが、これに限られず、例えば、注目すべきでない、若しくは、注目する必要のない領域の注目度を低くするための、現フレームについての個別の注目度マップ４２が作成されてもよい。例えば、行動決定部１４０が注目領域Ａを確認したが注目すべき対象が何も存在しなかった場合には、当該注目領域Ａの注目度を下げるための現フレームについての個別の注目度マップ４２が作成されてもよい。このような注目度マップは、例えば、注目度を下げるべき領域に対応するボックスセルの注目度にマイナスの注目度を設定することで作成することができる。

また、上述の実施形態において、現フレームについての個別の注目度マップ４２は、例えば、注目する対象や領域に応じて注目度のピーク値及び注目度の分布が制御されてもよい。例えば、自律移動体１に対して「ピンクのボールが好き」という好みが設定されている場合、現フレームについての個別の注目度マップ４２におけるピンクのボールが位置する領域の注目度の分布を、通常よりも高いピーク値を持つ注目度の分布としてもよい。これにより、自律移動体１がピンクのボールに対して優先的に興味を示させることが可能となる。逆に、自律移動体１に対して「虫が嫌い」という好みが設定されている場合、現フレームについての個別の注目度マップ４２における虫が位置する領域の注目度の分布を、通常よりも低いピーク値又はマイナスのピーク値を持つ注目度の分布としてもよい。これにより、自律移動体１に虫に対して興味を示さないように行動させることが可能となる。

「ピンクのボールが好き」などの好みの設定は、例えば、ユーザが自律移動体１に対して直接、又は、ネットワーク４を介して接続された通信端末３を用いることで、自律移動体１に設定できてもよい。これにより、自律移動体１をユーザの好みに応じて行動するように設定することが可能となる。

また、センサ群１１０によって頻繁に検出される物体については、自律移動体１が好きなものとして、又は、自律移動体１の興味が薄れたもの（飽きたもの）として、自動又は手動で自律移動体１にその好みが設定されてもよい。

また、上述の実施形態において、注目度マップ４０の更新は、以下のような式（１）に基づいて実行されてもよい。なお、以下の式（１）は、対応するボックスセル同士が加算されることを前提としている。
最新の注目度マップ＝（１−α）（現在の注目度マップ）＋α（現フレームについての個別の注目度マップ） …（１）

式（１）において、αは更新率を示しており、例えば、０より大きく１未満の値である。従って、更新率αの値を調整することで、更新の程度を調整することが可能である。例えば、更新率αを大きな値とした場合、更新の程度が大きくなり、注目度マップ４０が短時間で変化することとなる。一方、更新率αを小さな値とした場合、更新の程度が小さくなり、注目度マップ４０が余り変化しなくなる。

また、更新率αは、インタラクション実行部１５０が実行している特定の行動１５２に応じて変更されてもよい。例えば、インタラクション実行部１５０が何かしらの特定の行動１５２を夢中になっている状態を実行している場合や、インタラクション実行部１５０が休んでいる状態（寝ている状態を含む）を実行している場合には、更新率αが低い値に変更されてもよい。それにより、自律移動体１が小さな物音などに反応しないようにすることが可能となる。

さらに、更新率αは、画像認識処理（認識処理１２２に相当）や音声認識処理（認識処理１２１に相当）の結果に応じて制御されてもよい。例えば、画像認識処理（個人識別２２３）の結果、所有者（飼い主）が識別できた場合には、この所有者（飼い主）に対応する領域に対する更新率αを小さくして注目度を低くなり難くし、それ以外の人物である場合には、この人物に対応する領域に対する更新率αを大きくして注目度を低くなり易くしてもよい。その際、初めて見る人物である場合には、この人物に対応する警戒を表現するために、この人物に対応する領域に対する更新率αを小さくして注目度を低くなり難くしてもよい。

以上、本開示の実施形態について説明したが、本開示の技術的範囲は、上述の各実施形態そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。

また、本明細書に記載された各実施形態における効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

なお、本技術は以下のような構成も取ることができる。
（１）
所定空間中の各位置に対して注目すべき程度を示す注目度が設定された注目度マップに基づいて駆動機構に実行させる行動を決定する行動決定部を備える情報処理装置。
（２）
前記駆動機構は、自律移動体の位置及び姿勢のうちの少なくとも一つを制御する移動機構であり、
前記行動決定部は、前記行動を前記駆動機構に実行させることで、前記自律移動体の位置及び姿勢のうちの少なくとも一つを制御する
前記（１）に記載の情報処理装置。
（３）
前記駆動機構の周囲の情報に基づいて、前記注目度マップを更新する更新部をさらに備える前記（１）又は（２）に記載の情報処理装置。
（４）
前記駆動機構の周囲の情報を取得するセンサと、
前記センサで取得されたセンサデータを認識処理する認識部と、
をさらに備え、
前記更新部は、前記認識処理の結果に基づいて前記注目度マップを更新する
前記（３）に記載の情報処理装置。
（５）
前記更新部は、前記認識処理の結果に基づいて、前記注目度マップにおける注目度を高く又は低くすべき領域を推定し、推定した前記領域の注目度が高く又は低くなるように、前記注目度マップを更新する前記（４）に記載の情報処理装置。
（６）
前記更新部は、前記推定した領域に注目度が設定された個別の注目度マップを作成し、前記個別の注目度マップを前記注目度マップに加算することで、前記注目度マップを更新する前記（５）に記載の情報処理装置。
（７）
前記センサは、前記駆動機構の周囲を撮像して画像データを出力するカメラを含み、
前記認識部は、前記画像データを画像認識処理し、
前記更新部は、前記画像認識処理の結果に基づいて前記注目度マップを更新する
前記（４）〜（６）の何れか１項に記載の情報処理装置。
（８）
前記画像認識処理は、前記画像データに含まれる人体の全体又は一部を検出する人体検出と、前記画像データに含まれる人の顔を検出する顔検出と、前記画像データに含まれる人の顔を識別する顔識別とのうち少なくとも一つを含む前記（７）に記載の情報処理装置。
（９）
前記センサは、所定空間中を伝播する音を入力して音声データを出力するマイクロフォンを含み、
前記認識部は、前記音声データを音声認識処理し、
前記更新部は、前記音声認識処理の結果に基づいて前記注目度マップを更新する
前記（４）〜（８）の何れか１項に記載の情報処理装置。
（１０）
前記音声認識処理は、前記駆動機構に対する前記音の音源の方向を検出する音源方向検出と、前記音の音源を識別する音源識別とのうち少なくとも１つを含む前記（９）に記載の情報処理装置。
（１１）
前記センサは、カメラ、マイクロフォン、ＴｏＦ（Time of Flight）センサ、人感センサ、ＰＳＤ（Position Sensitive Detector）、タッチセンサ、照度センサ、慣性計測装置のうち少なくとも１つを含む前記（４）に記載の情報処理装置。
（１２）
前記行動決定部は、前記注目度マップにおいて注目度が最大の位置を特定し、前記注目度が最大の位置を囲む領域を注目領域と設定し、前記注目領域に基づいて、前記駆動機構に実行させる前記行動を決定する前記（１）〜（１１）の何れか１項に記載の情報処理装置。
（１３）
前記駆動機構に設けられて前記駆動機構の周囲を撮像して画像データを出力するカメラをさらに備え、
前記行動決定部は、前記注目度マップにおいて注目度が最大の位置を特定し、前記注目度が最大の位置を囲む領域を注目領域と設定し、前記注目領域に対応する前記所定空間内の領域が前記カメラの画角内に収まるように、前記駆動機構に実行させる前記行動を決定する前記（１）〜（１１）の何れか１項に記載の情報処理装置。
（１４）
前記駆動機構に設けられて前記駆動機構の周囲を撮像して画像データを出力するカメラをさらに備え、
前記行動決定部は、前記注目度マップにおいて注目度が最大の位置を特定し、前記注目度が最大の位置を囲む領域を注目領域と設定し、前記注目領域に対応する前記所定空間内の領域が前記カメラの画角の略中心に位置するように、前記駆動機構に実行させる前記行動を決定する前記（１）〜（１１）の何れか１項に記載の情報処理装置。
（１５）
前記行動決定部は、前記注目度マップにおいて注目度が最大の位置を特定し、前記注目度が最大の位置を囲む領域を注目領域と設定し、前記注目領域に対応する前記所定空間内の領域に前記駆動機構が移動するように、前記駆動機構に実行させる前記行動を決定する前記（１）〜（１１）の何れか１項に記載の情報処理装置。
（１６）
前記駆動機構は、揺動可能な頭部を含み、
前記行動は、下がる、近づく、見上げる、首を振るのうち少なくとも１つを含む
前記（２）に記載の情報処理装置。
（１７）
前記行動決定部は、前記注目度マップにおいて注目度が最大の位置を特定し、前記注目度が最大の位置を囲む領域を注目領域と設定し、前記注目領域に基づいて、前記駆動機構に実行させる前記行動を決定し、
前記行動は、前記自律移動体が前記注目領域に対応する前記所定空間内の領域から遠ざかる、前記自律移動体が前記注目領域に対応する前記所定空間内の領域に近づく、前記自律移動体が前記注目領域に対応する前記所定空間内の領域を見上げる、前記自律移動体が前記注目領域に対応する前記所定空間内の領域を向くのうち少なくとも１つを含む前記（２）に記載の情報処理装置。
（１８）
前記更新部は、所定の条件に基づいて前記注目度マップにおける注目度を減衰させる減衰部を含む前記（３）〜（１１）の何れか１項に記載の情報処理装置。
（１９）
前記行動決定部は、前記注目度マップにおいて注目度が最大の位置を特定し、前記注目度が最大の位置を囲む領域を注目領域と設定し、前記注目領域に基づいて、前記駆動機構に実行させる前記行動を決定し、
前記減衰部は、前記駆動機構が前記行動を実行後、前記注目領域の注目度を減衰させる前記（１８）に記載の情報処理装置。
（２０）
前記減衰部は、所定時間が経過する度に前記注目度マップの注目度を減衰させる前記（１８）又は（１９）に記載の情報処理装置。
（２１）
特定のイベントの発生に応じて特定の行動を実行する実行部をさらに備える前記（１）〜（２０）の何れか１項に記載の情報処理装置。
（２２）
前記特定の行動は、動物や生き物の行動に近い動作、ユーザとのコミュニケーション、遊び、及び、感情表現のうち少なくとも１つを含む前記（２１）に記載の情報処理装置。
（２３）
所定空間中の各位置に対して注目すべき程度を示す注目度が設定された注目度マップに基づいて駆動機構に実行させる行動を決定する行動決定部を備える情報処理システム。
（２４）
所定空間中の各位置に対して注目すべき程度を示す注目度が設定された注目度マップに基づいて駆動機構に実行させる行動を決定することを含む行動決定方法。
（２５）
所定空間中の各位置に対して注目すべき程度を示す注目度が設定された注目度マップに基づいて駆動機構に実行させる行動を決定することをコンピュータに実行させるためのプログラム。

１、１Ａ〜１Ｎ自律移動体
２サーバ
３通信端末
１０コントロール部
１１信号処理回路
１２ＣＰＵ
１３ＤＲＡＭ
１４フラッシュＲＯＭ
１５ＰＣカードＩ／Ｆ
１６無線通信部
１７内部バス
１８バッテリ
１９メモリカード
２１ディスプレイ
２２スピーカ
２３エンコーダ（ポテンショメータ）
２４アクチュエータ
２５可動部
３０その他のセンサ
３１マイクロフォン
３２カメラ
３３ＴｏＦセンサ
３４人感センサ
３５ＰＳＤ
３６タッチセンサ
３７照度センサ
３８足裏ボタン
３９ＩＭＵ
４０、４０Ａ、４１注目度マップ
４２現フレームについての個別の注目度マップ
１００自律システム
１０２個人識別ＤＢ
１０３注目度マップＤＢ
１０４行動ルールＤＢ
１０５特定行動ルールＤＢ
１１０センサ群
１２０物体検出・認識部
１２１〜１２４認識処理
１３０注目度マップ作成・更新部
１３１〜１３４注目領域予測
１３５〜１３８注目度マップ作成
１３９注目度減衰部
１４０行動決定部
１４１注目領域決定
１４２行動決定
１４３行動
１５０インタラクション実行部
１５１イベント発生検知
１５２特定の行動
２２１顔検出
２２２顔識別
２２３個人識別
２２４視線検出
２２５動体検出
２２６人体検出（一部分を含む）
２２７音源方向検出
２２８音声識別
２２９トラッキング
２４１見上げる・首を振る（任意の方向にカメラを向ける）
２４２近づく・下がる（任意の方向へ移動）
２４３カメラのズーム・ピント制御
２４４マイクロフォンのズームホーミング
２５１動物等の動作に近い動作
２５２コミュニケーション
２５３遊び
２５４感情表現
Ａ注目領域
ＡＦ画角
ＳＰ所定空間

Claims

所定空間中の各位置に対して注目すべき程度を示す注目度が設定された注目度マップに基づいて駆動機構に実行させる行動を決定する行動決定部を備える情報処理装置。
前記駆動機構は、自律移動体の位置及び姿勢のうちの少なくとも一つを制御する移動機構であり、
前記行動決定部は、前記行動を前記駆動機構に実行させることで、前記自律移動体の位置及び姿勢のうちの少なくとも一つを制御する
請求項１に記載の情報処理装置。
前記駆動機構の周囲の情報に基づいて、前記注目度マップを更新する更新部をさらに備える請求項１に記載の情報処理装置。
前記駆動機構の周囲の情報を取得するセンサと、
前記センサで取得されたセンサデータを認識処理する認識部と、
をさらに備え、
前記更新部は、前記認識処理の結果に基づいて前記注目度マップを更新する
請求項３に記載の情報処理装置。
前記更新部は、前記認識処理の結果に基づいて、前記注目度マップにおける注目度を高く又は低くすべき領域を推定し、推定した前記領域の注目度が高く又は低くなるように、前記注目度マップを更新する請求項４に記載の情報処理装置。
前記更新部は、前記推定した領域に注目度が設定された個別の注目度マップを作成し、前記個別の注目度マップを前記注目度マップに加算することで、前記注目度マップを更新する請求項５に記載の情報処理装置。
前記センサは、前記駆動機構の周囲を撮像して画像データを出力するカメラを含み、
前記認識部は、前記画像データを画像認識処理し、
前記更新部は、前記画像認識処理の結果に基づいて前記注目度マップを更新する
請求項４に記載の情報処理装置。
前記センサは、所定空間中を伝播する音を入力して音声データを出力するマイクロフォンを含み、
前記認識部は、前記音声データを音声認識処理し、
前記更新部は、前記音声認識処理の結果に基づいて前記注目度マップを更新する
請求項４に記載の情報処理装置。
前記センサは、カメラ、マイクロフォン、ＴｏＦ（Time of Flight）センサ、人感センサ、ＰＳＤ（Position Sensitive Detector）、タッチセンサ、照度センサ、慣性計測装置のうち少なくとも１つを含む請求項４に記載の情報処理装置。
前記行動決定部は、前記注目度マップにおいて注目度が最大の位置を特定し、前記注目度が最大の位置を囲む領域を注目領域と設定し、前記注目領域に基づいて、前記駆動機構に実行させる前記行動を決定する請求項１に記載の情報処理装置。
前記駆動機構に設けられて前記駆動機構の周囲を撮像して画像データを出力するカメラをさらに備え、
前記行動決定部は、前記注目度マップにおいて注目度が最大の位置を特定し、前記注目度が最大の位置を囲む領域を注目領域と設定し、前記注目領域に対応する前記所定空間内の領域が前記カメラの画角内に収まるように、前記駆動機構に実行させる前記行動を決定する請求項１に記載の情報処理装置。
前記駆動機構に設けられて前記駆動機構の周囲を撮像して画像データを出力するカメラをさらに備え、
前記行動決定部は、前記注目度マップにおいて注目度が最大の位置を特定し、前記注目度が最大の位置を囲む領域を注目領域と設定し、前記注目領域に対応する前記所定空間内の領域が前記カメラの画角の略中心に位置するように、前記駆動機構に実行させる前記行動を決定する請求項１に記載の情報処理装置。
前記行動決定部は、前記注目度マップにおいて注目度が最大の位置を特定し、前記注目度が最大の位置を囲む領域を注目領域と設定し、前記注目領域に対応する前記所定空間内の領域に前記駆動機構が移動するように、前記駆動機構に実行させる前記行動を決定する請求項１に記載の情報処理装置。
前記駆動機構は、揺動可能な頭部を含み、
前記行動は、下がる、近づく、見上げる、首を振るのうち少なくとも１つを含む
請求項２に記載の情報処理装置。
前記更新部は、所定の条件に基づいて前記注目度マップにおける注目度を減衰させる減衰部を含む請求項３に記載の情報処理装置。
前記行動決定部は、前記注目度マップにおいて注目度が最大の位置を特定し、前記注目度が最大の位置を囲む領域を注目領域と設定し、前記注目領域に基づいて、前記駆動機構に実行させる前記行動を決定し、
前記減衰部は、前記駆動機構が前記行動を実行後、前記注目領域の注目度を減衰させる請求項１５に記載の情報処理装置。
前記減衰部は、所定時間が経過する度に前記注目度マップの注目度を減衰させる請求項１５に記載の情報処理装置。
特定のイベントの発生に応じて特定の行動を実行する実行部をさらに備える請求項１に記載の情報処理装置。
所定空間中の各位置に対して注目すべき程度を示す注目度が設定された注目度マップに基づいて駆動機構に実行させる行動を決定することを含む行動決定方法。
所定空間中の各位置に対して注目すべき程度を示す注目度が設定された注目度マップに基づいて駆動機構に実行させる行動を決定することをコンピュータに実行させるためのプログラム。