JP5764795B2

JP5764795B2 - 移動ロボット、移動ロボット用の学習システムおよび移動ロボットの行動学習方法

Info

Publication number: JP5764795B2
Application number: JP2011000489A
Authority: JP
Inventors: 神田　崇行; 崇行神田; 昌裕塩見
Original assignee: ATR Advanced Telecommunications Research Institute International
Current assignee: ATR Advanced Telecommunications Research Institute International
Priority date: 2011-01-05
Filing date: 2011-01-05
Publication date: 2015-08-19
Anticipated expiration: 2031-01-05
Also published as: JP2012139798A

Description

この発明は、移動ロボット、移動ロボット用の学習システムおよび移動ロボットの行動学習方法に関し、特にたとえば、人と共存する環境に配置されてサービスを提供する、移動ロボット、移動ロボット用の学習システムおよび移動ロボットの行動学習方法に関する。

近年、人と共存する環境に配置されて、案内や客引き、荷物搬送などの多様なサービスを提供する移動ロボットが開発されつつある。たとえば、非特許文献１には、広域で安定したセンシングが可能な環境設置のユビキタスセンサと、直感的な情報提供が可能な人間型の移動ロボットとを組み合わせた、ネットワークロボットに関する技術が開示されている。非特許文献１の技術では、蓄積した人々の移動軌跡情報から、空間の利用状況や人々の行動パターンを分析する。そして、その分析結果を用いて人々の行動を予測することによって、移動ロボットが適切な相手を自動的に選んで近づき、サービスを提供するようにしている。

一方、特許文献１には、学習機能を備える移動ロボットが開示されている。特許文献１の移動ロボットは、走行路の環境情報が格納された環境マップと、予め走行ルールが学習された自己組織化マップ（Self‐Organizing Map）を有する学習手段とを備える。環境マップには、センサ類によって検出された走行路の状況から認識された自己位置および障害物の情報が入力され、学習手段は、環境情報を入力値とする自己組織化マップの走行ルールに応じて、操舵情報を出力する。
神田崇行,Dylan F. Glas,塩見昌裕,荻田紀博,「移動する人にサービス提供するロボットのための環境情報構造化」，（日本ロボット学会誌 27(4), 449-459, 2009-05-15）特開２００７−３１６７９９号公報 [Ｇ０５Ｄ１／０２]

人と共存する環境において移動ロボットが移動すると、周囲の人は少なからず影響を受ける。たとえば、客引きサービスを行う移動ロボットが、客引き対象として選択した相手に近づくときには、選択した相手以外の人が移動ロボットの周囲に集まってくる場合がある。移動ロボットの周囲に人が集まるこのような現象は、客引きサービスを行う移動ロボットにとっては有利に作用するが、たとえば荷物搬送サービスを行う移動ロボットにとっては不利に作用する。また、周囲の人がどの程度の反応を示すかは、移動ロボットの移動の仕方（移動態様）や移動ロボットが配置された環境などによって変わると考えられる。したがって、より効果的にサービスを提供するためには、移動ロボットが周囲の人の反応状況を考慮して移動できればよいと考えられる。

しかしながら、非特許文献１の技術では、移動ロボットが存在しない状態で人々の移動軌跡情報を蓄積しており、移動ロボットの移動態様を決定するに際し、移動ロボットの移動に対する周囲の人の反応状況までは考慮していない。

また、特許文献１の技術は、移動途中に存在する障害物との衝突を避けて、安全かつ確実に目的地まで到達するための技術であり、障害物の回避行動を学習するにとどまる技術である。

それゆえに、この発明の主たる目的は、新規な、移動ロボット、移動ロボット用の学習システムおよび移動ロボットの行動学習方法を提供することである。

この発明の他の目的は、人と共存する環境においてサービスを効果的に提供できる、移動ロボット、移動ロボット用の学習システムおよび移動ロボットの行動学習方法を提供することである。

この発明は、上記の課題を解決するために、以下の構成を採用した。なお、括弧内の参照符号および補足説明などは、本発明の理解を助けるために後述する実施の形態との対応関係を示したものであって、この発明を何ら限定するものではない。

第１の発明は、人と共存する環境に配置されて移動を伴うサービスを提供する移動ロボットであって、配置環境において複数種類の移動の仕方によって移動を試みる第１実行手段、第１実行手段によって移動を試みたときの、目的地に到達したときに移動ロボット周囲の所定範囲内に滞在している人数を示す人の集まり具合に関する情報を含む周囲反応情報を検出する検出手段、検出手段によって検出された周囲反応情報を移動の仕方のそれぞれと対応付けて記憶する記憶手段、記憶手段に記憶された周囲反応情報を評価関数として、提供するサービスに応じた移動の仕方を選択する選択手段、および選択手段によって選択された移動の仕方によって当該サービスを実行する第２実行手段を備える、移動ロボットである。
第２の発明は、人と共存する環境に配置されて移動を伴うサービスを提供する移動ロボットであって、配置環境において複数種類の移動の仕方によって移動を試みる第１実行手段、第１実行手段によって移動を試みたときの、移動ロボットが移動した移動エリア内への流入人数から流出人数を引いた値、移動ロボットから所定距離の範囲内での平均移動速度がその範囲外の平均移動速度と比較して所定値以上遅くなった人数、または、移動ロボットが配置されていない状態と移動ロボットが移動しているときの状態との移動エリア内の人々の平均移動速度または平均通過時間の差を示す人の流れ具合に関する情報を含む周囲反応情報を検出する検出手段、検出手段によって検出された周囲反応情報を移動の仕方のそれぞれと対応付けて記憶する記憶手段、記憶手段に記憶された周囲反応情報を評価関数として、提供するサービスに応じた移動の仕方を選択する選択手段、および選択手段によって選択された移動の仕方によって当該サービスを実行する第２実行手段を備える、移動ロボットである。

第１の発明では、移動ロボット（１０）は、イベント会場や街中などの人と共存する様々な環境に配置され、案内および荷物運搬などの様々なサービスを提供する。そして、サービスを提供する際には、自身の行動に対する周囲の人の反応状況から適切な行動を学習し、その後のサービスの提供に生かす。具体的には、第１実行手段（２６，６２，６６，６８，Ｓ３）は、たとえば移動ロボットが最初にその環境に配置されたときに、「中央をまっすぐ進む」および「端をまっすぐ進む」等の複数種類の移動の仕方による移動を試みる。検出手段（３０，３４，６０，６２，６６，７０，８４，８６，Ｓ５）は、移動ロボット自身が搭載したセンサや環境に設置されたセンサ等を利用して、第１実行手段によって移動を試みたときの周囲反応情報を検出する。ここで、周囲反応情報は、移動ロボットが移動（サービス）を行う際の周囲の人の反応状況を示す情報であり、人の集まり具合に関する情報を含む。また、人の集まり具合に関する情報は、目的地に到達したときに移動ロボットの所定範囲内に滞在している人数を示す。記憶手段（６２，６６，８８，Ｓ５）は、検出手段によって検出された周囲反応情報を移動の仕方のそれぞれと対応付けて記憶する。選択手段（６２，６６，Ｓ１５）は、記憶手段に記憶された周囲反応情報を評価関数とし、提供するサービスに応じて当該評価関数が最小または最大となる移動の仕方を選択する。たとえば、移動ロボットの周囲に人を集めたいサービス（客引きサービス等）を提供するときには、人の集まり具合が最大となる移動の仕方を選択する。そして、第２実行手段（２６，６２，６６，６８，Ｓ１７）は、選択手段によって選択された移動の仕方によってサービスを実行する。
第２の発明では、周囲反応情報として、人の流れ具合に関する情報を含む。人の流れ具合に関する情報は、移動エリア内への流入人数から流出人数をひいた値（流入人数−流出人数）、移動ロボットから所定距離の範囲内での平均移動速度がその範囲外の平均移動速度と比較して所定値以上遅くなった人数、または、移動ロボットが配置されていない状態と移動ロボットが移動しているときの状態との移動エリア内の人々の平均移動速度または平均通過時間の差を示す。

第１および第２の発明によれば、自身の行動に対する周囲の人の反応状況から、配置される環境および提供するサービスに合った適切な行動を学習できるので、人と共存する環境において効果的にサービスを提供できる。

第３の発明は、第１または第２の発明に従属し、移動の仕方を分類するファクタは、移動経路を含む。

第３の発明では、移動の仕方を分類するファクタとして、移動経路を含む。つまり、「中央をまっすぐ進む」および「できるだけ人を避けて進む」等の移動経路の違いによって移動の仕方を分類する。

第３の発明によれば、配置される環境および提供するサービスに合った適切な移動経路を学習でき、人と共存する環境において効果的にサービスを提供できる。

第４の発明は、第１ないし第３のいずれかの発明に従属し、音声を出力する発話手段をさらに備え、移動の仕方を分類するファクタは、発話手段による発話を含む。

第４の発明では、音声を出力する発話手段（６２，６６，５４，７２）をさらに備える。そして、移動の仕方を分類するファクタとして、発話を含む。発話を加えた移動の仕方としては、たとえば、「大きな声で話しかけながら、前からゆっくり近づく」および「後ろからこっそり近づく」等の話しかけ方がある。

第４の発明によれば、配置される環境および提供するサービスに合った適切な発話を伴う移動の仕方を学習でき、人と共存する環境において効果的にサービスを提供できる。

第５の発明は、人と共存する環境に配置されて移動を伴うサービスを提供する移動ロボット用の学習システムであって、移動ロボットに対して、配置環境において複数種類の移動の仕方によって移動を試みさせる制御手段、移動ロボットが制御手段による移動を試みたときの、目的地に到達したときに移動ロボット周囲の所定範囲内に滞在している人数を示す人の集まり具合、および移動ロボットが移動した移動エリア内への流入人数から流出人数を引いた値、移動ロボットから所定距離の範囲内での平均移動速度がその範囲外の平均移動速度と比較して所定値以上遅くなった人数、または、移動ロボットが配置されていない状態と移動ロボットが移動しているときの状態との移動エリア内の人々の平均移動速度または平均通過時間の差を示す人の流れ具合の少なくとも一方に関する情報を含む周囲反応情報を検出する検出手段、および検出手段によって検出された周囲反応情報を移動の仕方のそれぞれと対応付けて記憶してデータベースを構築するデータベース構築手段を備える、移動ロボット用の学習システムである。

第５の発明では、移動ロボット用の学習システム（１００）は、たとえば移動ロボット（１０）および位置検出システム（１２）を含み、移動ロボットがサービスを提供する際には、移動ロボットの行動に対する周囲の人の反応状況から適切な行動を学習し、その後のサービスの提供に生かす。具体的には、制御手段（６２，６６，Ｓ３）は、「中央をまっすぐ進む」および「端をまっすぐ進む」等の複数種類の移動の仕方による移動を移動ロボットに試みさせる。検出手段（１２，３０，３４，６０，６２，６６，７０，８４，８６，Ｓ５）は、制御手段によって移動ロボットが移動を試みたときの周囲の人の反応状況を示す周囲反応情報を検出する。そして、データベース構築手段（６２，６６，８８，Ｓ５）は、検出手段によって検出された周囲反応情報を移動の仕方のそれぞれと対応付けて記憶してデータベースを構築する。構築したデータベースは、配置される環境および提供するサービスに合った適切な行動を移動ロボットに実行させるために用いられる。

第５の発明によれば、移動ロボットの行動に対する周囲の人の反応状況に関する情報を蓄積するので、データベースの構築後は、配置される環境および提供するサービスに合った適切な行動を移動ロボットに実行させることができる。したがって、人と共存する環境において効果的にサービスを提供する移動ロボットを実現できる。

第６の発明は、人と共存する環境に配置されて移動を伴うサービスを提供する移動ロボットの行動学習方法であって、（ａ）配置環境において複数種類の移動の仕方によって移動を試み、（ｂ）ステップ（ａ）で移動を試みたときの、目的地に到達したときに移動ロボット周囲の所定範囲内に滞在している人数を示す人の集まり具合、および移動ロボットが移動した移動エリア内への流入人数から流出人数を引いた値、移動ロボットから所定距離の範囲内での平均移動速度がその範囲外の平均移動速度と比較して所定値以上遅くなった人数、または、移動ロボットが配置されていない状態と移動ロボットが移動しているときの状態との移動エリア内の人々の平均移動速度または平均通過時間の差を示す人の流れ具合の少なくとも一方に関する情報を含む周囲反応情報を検出し、そして（ｃ）ステップ（ｂ）で検出した周囲反応情報を移動の仕方のそれぞれと対応付けて記憶してデータベースを構築する、移動ロボットの行動学習方法である。

第６の発明では、移動ロボット（１０）は、自身の行動に対する周囲の人の反応状況から適切な行動を学習し、その後のサービスの提供に生かす。先ず、ステップ（ａ）では、配置された環境において、「中央をまっすぐ進む」および「端をまっすぐ進む」等の複数種類の移動の仕方によって移動（サービス）を試みる（Ｓ３）。ステップ（ｂ）では、移動ロボット自身が搭載したセンサや環境に設置されたセンサ等を利用して、ステップ（ａ）で移動を試みたときの周囲反応情報、すなわち周囲の人の集まり具合および流れ具合の少なくとも一方に関する情報を検出する（Ｓ５）。そして、ステップ（ｃ）では、ステップ（ｂ）で検出した周囲反応情報を移動の仕方のそれぞれと対応付けて記憶してデータベース（８８）を構築する（Ｓ５）。構築したデータベースは、配置される環境および提供するサービスに合った適切な行動を移動ロボットに実行させるために用いられる。

第６の発明によれば、移動ロボットの行動に対する周囲の人の反応状況に関する情報を蓄積するので、第５の発明と同様の作用効果を奏し、人と共存する環境において効果的にサービスを提供する移動ロボットを実現できる。

この発明によれば、自身の行動に対する周囲の人の反応状況から、配置される環境および提供するサービスに合った適切な行動を学習するので、人と共存する環境において効果的にサービスを提供できる。

この発明の上述の目的、その他の目的、特徴および利点は、図面を参照して行う後述の実施例の詳細な説明から一層明らかとなろう。

この発明の一実施例の移動ロボットシステムの構成を示すブロック図である。図１の移動ロボットが人と共存する環境を移動する様子を示す図解図である。図１の移動ロボットの外観を正面から見た様子を示す図解図である。図１の移動ロボットの電気的構成を示すブロック図である。周囲反応情報データベースに記憶されるテーブルの一例を示す図解図である。図１の移動ロボットが備えるＣＰＵが実行する学習時の処理の一例を示すフロー図である。図１の移動ロボット１０が備えるＣＰＵが実行する学習後の処理の一例を示すフロー図である。周囲反応情報データベースに記憶されるテーブルの他の一例を示す図解図である。

図１および２を参照して、この発明の一実施例である移動ロボットシステム（移動ロボット用の学習システム）１００は、通信可能に接続される移動ロボット１０と位置検出システム１２とを含む。移動ロボットシステム１００において、移動ロボット１０は、イベント会場や街中などの人と共存する様々な環境（場所）に配置され、その環境内を自律的に移動して、案内、荷物運搬、客引き、エンタテインメント、掃除および巡回監視などの様々なサービスを提供する（タスクを実行する）。そして、サービスを提供する際には、位置検出システム１２や自身が搭載したセンサ等によって計測した、自身の行動に対する周囲の人の反応状況（周囲反応情報）から適切な行動を学習し、つまりどのように移動すると効果的かを学習し、その後のサービスの提供に生かす。

図３は、移動ロボット１０の外観を示す正面図である。この図３を参照して、移動ロボット１０のハードウェアの構成について説明する。なお、この実施例では、身体動作や発話を用いて人との間でコミュニケーション行動を実行する相互作用指向のロボットを移動ロボット１０の一例として挙げて説明するが、この発明でいうロボットとは、目的の動作や作業などをコンピュータの制御で自動的に行う機械や装置をいい、人の姿に似るものに限定されない。また、移動ロボットとは、移動機構を備えるロボットをいう。

移動ロボット１０は、台車２０を含み、この台車２０の下面には、移動ロボット１０を自律移動させる２つの車輪２２および１つの従輪２４が設けられる。２つの車輪２２は車輪モータ２６（図４参照）によってそれぞれ独立に駆動され、移動ロボット１０を前後左右任意の方向に動かすことができる。また、従輪２４は車輪２２を補助する補助輪である。このように、移動ロボット１０は、配置された環境内を自由に移動可能なものである。ただし、移動ロボット１０の移動機構は、車輪タイプに限定されず、公知の移動機構を適宜採用でき、たとえば２足歩行タイプの移動機構を採用することもできる。

台車２０の上には、円柱形のセンサ取付パネル２８が設けられ、このセンサ取付パネル２８には、赤外線距離センサ３０が取り付けられる。この赤外線距離センサ３０は、移動ロボット１０と周囲の物体（人や障害物など）との距離を計測するものである。

また、センサ取付パネル２８の上には、胴体３２が直立するように設けられる。胴体３２の前方中央上部（胸に相当する位置）には、上述した赤外線距離センサ３０がさらに設けられる。これは、移動ロボット１０の前方の主として人との距離を計測する。また、胴体３２には、１つの全方位カメラ３４が設けられる。全方位カメラ３４は、たとえば背面側上端部のほぼ中央から延びる支柱３６上に設けられる。全方位カメラ３４は、移動ロボット１０の周囲を撮影するものであり、後述する眼カメラ６０とは区別される。この全方位カメラ３４としては、たとえばＣＣＤやＣＭＯＳのような固体撮像素子を用いるカメラを採用することができる。なお、これら赤外線距離センサ３０および全方位カメラ３４の設置位置は当該部位に限られず適宜変更され得る。

胴体３２の両側面上端部（肩に相当する位置）のそれぞれには、肩関節３８Ｒおよび３８Ｌによって、上腕４０Ｒおよび４０Ｌが設けられる。図示は省略するが、肩関節３８Ｒおよび３８Ｌのそれぞれは、直交する３軸の自由度を有する。すなわち、肩関節３８Ｒは、直交する３軸のそれぞれの軸廻りにおいて上腕４０Ｒの角度を制御できる。肩関節３８Ｒの或る軸（ヨー軸）は、上腕４０Ｒの長手方向に平行な軸であり、他の２軸（ピッチ軸、ロール軸）は、それにそれぞれ異なる方向から直交する軸である。同様に、肩関節３８Ｌは、直交する３軸のそれぞれの軸廻りにおいて上腕４０Ｌの角度を制御できる。肩関節３８Ｌの或る軸（ヨー軸）は、上腕４０Ｌの長手方向に平行な軸であり、他の２軸（ピッチ軸、ロール軸）は、それにそれぞれ異なる方向から直交する軸である。

また、上腕４０Ｒおよび４０Ｌのそれぞれの先端には、肘関節４２Ｒおよび４２Ｌを介して、前腕４４Ｒおよび４４Ｌが設けられる。図示は省略するが、肘関節４２Ｒおよび４２Ｌは、それぞれ１軸の自由度を有し、この軸（ピッチ軸）の軸廻りにおいて前腕４４Ｒおよび４４Ｌの角度を制御できる。

前腕４４Ｒおよび４４Ｌのそれぞれの先端には、手に相当する球体４６Ｒおよび４６Ｌがそれぞれ固定的に設けられる。ただし、指や掌の機能が必要な場合には、人の手の形をした「手」を用いることも可能である。

また、図示は省略するが、台車２０の前面、肩関節３８Ｒ，３８Ｌを含む肩に相当する部位、上腕４０Ｒ，４０Ｌ、前腕４４Ｒ，４４Ｌおよび球体４６Ｒ，４６Ｌには、それぞれ、接触センサ（図４で接触センサ４８として包括的に示す。）が設けられている。台車２０の前面の接触センサ４８は、台車２０への人や他の障害物の接触を検知する。したがって、移動ロボット１０の移動中に障害物との接触があると、それを検知し、直ちに車輪２２の駆動を停止して移動ロボット１０の移動を急停止させることができる。また、その他の接触センサ４８は、主に、人が移動ロボット１０の当該各部位に触れたかどうかを検知する。なお、接触センサ４８の設置位置はこれらに限定されず、適宜な位置（胸、腹、脇、背中、腰など）に設けられてよい。

胴体３２の中央上部（首に相当する位置）には首関節５０が設けられ、さらにその上には頭部５２が設けられる。図示は省略するが、首関節５０は、３軸の自由度を有し、３軸の各軸廻りに角度制御可能である。或る軸（ヨー軸）は移動ロボット１０の真上（鉛直上向き）に向かう軸であり、他の２軸（ピッチ軸、ロール軸）は、それぞれ、それと異なる方向で直交する軸である。

頭部５２には、口に相当する位置に、スピーカ５４が設けられる。スピーカ５４は、移動ロボット１０が、それの周辺の人に対して音声ないし音によってコミュニケーションを取るために用いられる。また、耳に相当する位置には、マイク５６Ｒおよび５６Ｌが設けられる。以下、右耳に相当するマイク５６Ｒと左耳に相当するマイク５６Ｌとをまとめて「マイク５６」ということがある。マイク５６は、周囲の音、とりわけコミュニケーションを実行する対象である人の声を取り込む。さらに、目に相当する位置には、眼球部５８Ｒおよび５８Ｌが設けられる。眼球部５８Ｒおよび５８Ｌは、それぞれ眼カメラ６０Ｒおよび６０Ｌを含む。以下、右の眼球部５８Ｒと左の眼球部５８Ｌとをまとめて「眼球部５８」ということがあり、また、右の眼カメラ６０Ｒと左の眼カメラ６０Ｌとをまとめて「眼カメラ６０」ということがある。

眼カメラ６０は、移動ロボット１０に接近した人の顔や他の部分ないし物体などを撮影して、それに対応する映像信号を取り込む。眼カメラ６０としては、上述した全方位カメラ３４と同様のカメラを用いることができる。たとえば、眼カメラ６０は眼球部５８内に固定され、眼球部５８は眼球支持部（図示せず）を介して頭部５２内の所定位置に取り付けられる。図示は省略するが、眼球支持部は、２軸の自由度を有し、それらの各軸廻りに角度制御可能である。たとえば、この２軸の一方は、頭部５２の上へ向かう方向の軸（ヨー軸）であり、他方は、一方の軸に直交しかつ頭部５２の正面側（顔）が向く方向に直交する方向の軸（ピッチ軸）である。眼球支持部がこの２軸の各軸廻りに回転されることによって、眼球部５８ないし眼カメラ６０の先端（正面）側が変位され、カメラ軸すなわち視線方向が移動される。なお、上述のスピーカ５４、マイク５６および眼カメラ６０の設置位置は、これらに限定されず、適宜な位置に設けてられてよい。

図４は、移動ロボット１０の電気的な構成を示すブロック図である。図４に示すように、移動ロボット１０は、全体を制御するＣＰＵ６２を含む。ＣＰＵ６２は、マイクロコンピュータ或いはプロセサとも呼ばれ、バス６４を介して、メモリ６６、モータ制御ボード６８、センサ入力／出力ボード７０および音声入力／出力ボード７２等に接続される。

メモリ６６は、図示は省略するが、ＲＯＭやＨＤＤおよびＲＡＭを含む。ＲＯＭやＨＤＤには、移動ロボット１０の制御プログラムが予め記憶される。たとえば、人との間でコミュニケーション行動を実行するための行動制御プログラム、設定された移動の仕方で周囲に人が共存する環境内を移動するための移動制御プログラム、および外部コンピュータとの間で必要な情報を送受信するための通信プログラム等である。また、ＲＯＭやＨＤＤには、コミュニケーション行動を実行する際にスピーカ５４から発生すべき音声または声の音声データ（音声合成データ）、環境の地図データ、および試みる移動の仕方の種類に関するデータなどが適宜記憶される。また、ＲＡＭは、ワークメモリやバッファメモリとして用いられる。

モータ制御ボード６８は、たとえばＤＳＰで構成され、各腕や首関節５０および眼球部５８などの各軸モータの駆動を制御する。すなわち、モータ制御ボード６８は、ＣＰＵ６２からの制御データを受け、右眼球部５８Ｒの２軸のそれぞれの角度を制御する２つのモータ（図４では、まとめて「右眼球モータ」と示す。）７４の回転角度を制御する。同様に、モータ制御ボード６８は、ＣＰＵ６２からの制御データを受け、左眼球部５８Ｌの２軸のそれぞれの角度を制御する２つのモータ（図４では、まとめて「左眼球モータ」と示す。）７６の回転角度を制御する。

また、モータ制御ボード６８は、ＣＰＵ６２からの制御データを受け、右肩関節３８Ｒの直交する３軸のそれぞれの角度を制御する３つのモータと右肘関節４２Ｒの角度を制御する１つのモータとの計４つのモータ（図４では、まとめて「右腕モータ」と示す。）７８の回転角度を調節する。同様に、モータ制御ボード６８は、ＣＰＵ６２からの制御データを受け、左肩関節３８Ｌの直交する３軸のそれぞれの角度を制御する３つのモータと左肘関節４２Ｌの角度を制御する１つのモータとの計４つのモータ（図４では、まとめて「左腕モータ」と示す。）８０の回転角度を調節する。

さらに、モータ制御ボード６８は、ＣＰＵ６２からの制御データを受け、首関節５０の直交する３軸のそれぞれの角度を制御する３つのモータ（図４では、まとめて「頭部モータ」と示す。）８２の回転角度を制御する。さらにまた、モータ制御ボード６８は、ＣＰＵ６２からの制御データを受け、車輪２２を駆動する２つのモータ（図４では、まとめて「車輪モータ」と示す。）２６の回転角度を制御する。

なお、この実施例では、車輪モータ２６を除くモータは、制御を簡素化するために、ステッピングモータ或いはパルスモータを用いるようにしてある。ただし、車輪モータ２６と同様に、直流モータを用いるようにしてもよい。

センサ入力／出力ボード７０もまた、同様に、ＤＳＰで構成され、各センサからの信号を取り込んでＣＰＵ６２に与える。すなわち、赤外線距離センサ３０のそれぞれからの反射時間に関するデータが、センサ入力／出力ボード７０を通してＣＰＵ６２に入力される。また、全方位カメラ３４からの映像信号が、必要に応じてセンサ入力／出力ボード７０で所定の処理を施された後、ＣＰＵ６２に入力される。眼カメラ６０からの映像信号も、同様にして、ＣＰＵ６２に入力される。また、上述した複数の接触センサ４８からの信号がセンサ入力／出力ボード７０を介してＣＰＵ６２に与えられる。

音声入力／出力ボード７２もまた、同様に、ＤＳＰで構成され、ＣＰＵ６２から与えられる音声合成データに従った音声または声がスピーカ５４から出力される。また、マイク５６からの音声入力が、音声入力／出力ボード５６を介してＣＰＵ６２に取り込まれる。

また、ＣＰＵ６２は、バス６４を介して通信ＬＡＮボード８４に接続される。通信ＬＡＮボード８４は、ＤＳＰで構成され、ＣＰＵ６２から送られる送信データを無線通信装置８６に与え、無線通信装置８６から送信データを、たとえば、無線ＬＡＮのようなネットワークを介して外部コンピュータに送信する。また、通信ＬＡＮボード８４は、無線通信装置８６を介してデータを受信し、受信したデータをＣＰＵ６２に与える。つまり、この通信ＬＡＮボード８４および無線通信装置８６によって、移動ロボット１０は外部コンピュータ（位置検出システム１２）などと無線通信を行うことができる。

さらに、ＣＰＵ６２は、バス６４を介して周囲反応情報データベース（ＤＢ）８８に接続される。周囲反応情報ＤＢ８８は、詳細は後述するように、位置検出システム１２等によって計測される、移動ロボット１０の行動に対する周囲の人の反応状況に関する情報を蓄積したデータベースであり、提供するサービスおよび配置される環境などに適した行動（移動の仕方）を選択するためのテーブルを記憶する。

図１および２に戻って、位置検出システム１２は、汎用のコンピュータ１４と、計測区域が重なるように環境に設置される複数のＬＲＦ１６とを含み、ＬＲＦ１６を利用して人をセンシングすることで、環境内に存在する人の位置を検出する。以下、位置検出システム１２について説明するが、ＬＲＦを用いた移動物体の位置検出については、この発明者らが先に出願した特開２００９−１６８５７８号公報に詳細が開示されているので、参照されたい。

ＬＲＦ１６は、レーザを照射し、物体に反射して戻ってくるまでの時間から当該物体までの距離を計測するセンサであり、たとえば、トランスミッタから照射したレーザを回転ミラーで反射させて、前方を扇状に一定角度ずつスキャンする。ＬＲＦ１６としては、ＳＩＣＫ社製のＬＲＦ(型式 LMS 200)や、ＨＯＫＵＹＯ社製のＬＲＦ(型式 UTM‐30LX)等を用いることができる。

位置検出システム１２では、コンピュータ１４がＬＲＦ１６からの出力（距離データ）に基づいて、パーティクルフィルタを用いて、人の現在位置の変化を推定する。たとえば、ＬＲＦ１６によってスキャンされると、人が存在しない可視区域、人が存在する陰区域および人のエッジが検出される。また、実空間に対応する仮想空間に対してパーティクルを均等にばら撒き、ＬＲＦ１６毎に尤度を求める。さらに、ＬＲＦ１６毎の尤度を統合することで、各パーティクルが更新される。そして、更新された各パーティクルによって人の現在位置の変化が推定される。なお、尤度は、可視区域では一定値とし、陰区域では一定値とエッジの尤度との和となる。このようにして推定された現在位置の変化に基づいて人の位置を求め、その位置の平面座標を示す数値（位置データ）を、時刻データと対応付けて、位置履歴データ（移動軌跡データ）として人ごとに分けて蓄積していく。また、たとえば、各人の移動軌跡における一定時間ごとの変化量を時間で微分することによって、各人の移動速度を算出する。

なお、上述の位置検出システム１２では、ＬＲＦ１６を用いて人の位置を検出するようにしたが、超音波距離センサ、ミリ波レーダ、無線ＩＤタグリーダ、床センサおよび天井カメラ等を適宜用いて人の位置を検出することもできる。

このような構成の移動ロボットシステム１００では、移動ロボット１０は、上述のように、人と共存する環境に配置され、環境内を自律的に移動して様々なサービスを提供する。そして、サービスを提供する際には、自身の行動に対する周囲の人の反応状況から適切な行動を学習する。なお、移動ロボット１０は、移動する際には、メモリ６６に記憶された地図データ、および内蔵或いは環境に設置されたセンサの情報を参照して、自身の現在地（現在座標）を把握しながら移動する。

具体的には、移動ロボットシステム１００では、たとえば移動ロボット１０が最初にその環境に配置されたとき、つまり移動ロボット１０によるサービスの提供開始後の初期段階において、移動ロボット１０の行動に対する周囲の人の反応状況に関する情報を収集する学習動作を実行する。

この学習時には、移動ロボット１０は、複数種類の移動の仕方（移動態様）によってサービス（移動）を試みる。たとえば、ショッピングセンタ等の通路エリアにおいて、一方の端から他端側にある店舗まで移動する場合（これは、店舗まで客を誘導する客引きサービスや店舗に商品を配達する荷物搬送サービスを提供する場合、或いはエンタテインメントサービスを提供するためにコミュニケーション相手を探してブラブラと店舗まで移動する場合などに想定される状況である。）には、「中央をまっすぐ進む」、「端をまっすぐ進む」、「できるだけ人を避けて進む」、「人の後ろをついていく」等の移動の仕方のそれぞれによってサービスを試みる。なお、試みる移動の仕方の種類は、提供するサービスに応じて予め設定されており、各サービスと対応付けてメモリ６６等に適宜記憶される。また、試みる移動の仕方の種類数は、２種類以上の任意の数である。

そして、移動ロボット１０が複数種類の移動の仕方によってサービスを試みた際には、位置検出システム１２および移動ロボット１０が搭載する各種センサ３０，３４，６０等を利用して、移動ロボット１０の周囲に存在する人の反応状況、すなわち周囲反応情報を計測する。この周囲反応情報には、移動ロボット１０周囲の人の集まり具合を示す情報、および移動ロボット１０周囲の人の流れ具合を示す情報などが含まれる。

人の集まり具合を示す情報としては、たとえば、移動ロボット１０が目的地に到達したときに、移動ロボット１０を中心とした所定距離（たとえば半径２ｍ）の範囲内に何人の人が滞在しているかを計測した値を用いることができる。

人の流れ具合を示す情報としては、たとえば、移動ロボット１０が移動を開始してから目的地に到達するまでの時間の間に、通路エリア（移動エリア）に入った人の総数から出た人の総数をひいた値（流入人数−流出人数；つまり滞留した人数）を用いることができる。また、たとえば、移動ロボット１０が移動しているときに、移動ロボット１０を中心とした所定距離（たとえば半径３ｍ）の範囲内での平均移動速度が、その範囲外（たとえば半径３ｍから５ｍの間の範囲内）での平均移動速度と比較して、所定値（たとえば０．２ｍ/ｓ）以上遅くなった人の総数を人の流れ具合を示す情報として用いることもできる。さらに、たとえば、移動エリア内の人々の平均移動速度（全体の平均値）または人々が移動エリアを通過するのにかかった時間の平均値（平均通過時間）を、移動ロボット１０を配置しない状態で予め測定しておき、移動ロボット１０が移動しているときに測定したこれらの値との差を人の流れ具合を示す情報として用いることもできる。

このような複数種類の移動の仕方によるサービスの試みは、移動の仕方ごとに数回（２−３回程度）実行される。そして、移動ロボット１０がサービスを試みる度に計測した周囲反応情報は、移動の仕方のそれぞれと対応付けて記憶され、上述の周囲反応情報ＤＢ８８が構築される。

図５には、周囲反応情報ＤＢ８８に記憶されるテーブルの一例を示す。図５に示す例では、移動の仕方と対応付けて、実行回数、累積集まりおよび累積滞留の情報を記憶している。ここで、実行回数は、その移動の仕方によってサービスを実行した回数を示す。また、累積集まりは、人の集まり具合を示す情報の一例であり、その移動の仕方によって目的地に到達したときに移動ロボット１０の所定範囲内に滞在した人数の実行回数分の総和を示す。さらに、累積滞留は、人の流れ具合を示す情報の一例であり、その移動の仕方によって移動している間に移動エリア内に入った人の総数から出た人の総数をひいた値（つまり滞留した人数）の実行回数分の総和を示す。

図５を参照すると、たとえば、「中央をまっすぐ進む」という移動の仕方によるサービスの提供は３回実行され、３回実行分の累積集まりは１００人であり、累積滞留は８０人であるという情報が収集されていることが分かる。つまり、「中央をまっすぐ進む」という移動の仕方によってサービスの提供を行うと、１回当り約３３人の人が移動ロボット１０の周囲に集まり、１回当り約２７人の人が移動ロボット１０の周囲で滞留したことが分かる。また、たとえば、「端をまっすぐ進む」という移動の仕方によるサービスの提供は２回実行され、２回実行分の累積集まりは２０人であり、累積滞留は０人であるという情報が収集されていることが分かる。つまり、「端をまっすぐ進む」という移動の仕方によってサービスの提供を行うと、１回当り約１０人の人が移動ロボット１０の周囲に集まり、移動ロボット１０の周囲では人の滞留がほぼ発生しないことが分かる。その他、「できるだけ人を避けて進む」および「人の後ろをついていく」についても同様である。

なお、移動ロボット１０がその環境で他のサービスを行うときには、改めて、複数種類の移動の仕方によってそのサービスを試み、移動ロボット１０の周囲に存在する人の反応状況を計測して、移動の仕方のそれぞれと対応付けて記憶するとよい。たとえば、客引きサービス、荷物搬送サービス、およびエンタテインメントサービス等に場合分けして周囲反応情報を収集し、図５に示すようなテーブルを各サービスについて作成するとよい。また、複数の移動行程を含んでいたり、移動距離が長かったりするサービスの場合には、一連の１つのサービスを複数の行程（状況）に分割し、行程ごとに場合分けして周囲反応情報を収集して、図５に示すようなテーブルを各工程について作成することもできる。

周囲反応情報ＤＢ８８を構築した後、すなわち周囲反応情報を収集（学習）した後は、移動ロボット１０は、人の集まり具合や流れ具合に関する情報を評価関数とし、その評価関数が最小または最大となる移動の仕方を選択することによって、効果的なサービスの提供を行う。なお、どの情報を評価関数として用いるかについては、提供するサービス毎に予め設定されており、各サービスと対応付けてメモリ６６等に適宜記憶される。

たとえば、移動ロボット１０の周囲に人を集めたいサービス（客引きサービス等）を提供するときには、「累積集まり／実行回数」の値が最大となる移動の仕方が選択される。つまり、図５に示す例では、学習後に客引きサービス等を行うときには、「中央をまっすぐに進む」という移動の仕方が選択されるようになる。

また、たとえば、周囲の人の流れを邪魔せずに移動したいサービス（荷物搬送サービス等）や周囲の人の流れを促したいサービスを提供するときには、「累積滞留／実行回数」の値が最小（マイナスの値となる場合もある）となる移動の仕方が選択される。つまり、図５に示す例では、学習後に荷物搬送サービス等を行うときには、「端をまっすぐに進む」という移動の仕方が選択されるようになる。なお、人の流れ具合を示す情報として、移動ロボット１０の近くで平均移動速度が落ちた人の数を計測している場合には、実行回数１回当たりのその数が最小となる移動の仕方が選択される。また、人の流れ具合を示す情報として、移動エリアにおける平均移動速度または平均通過時間の移動ロボット１０の有無による差を計測している場合には、実行回数１回当たりのその差が最小となる移動の仕方が選択される。さらに、周囲の人の流れを邪魔せずに移動したいサービスを提供するときには、「累積集まり／実行回数」の値が最小となる移動の仕方が選択されるようにしてもよい。移動ロボット１０周囲の人の集まりが少なければ、周囲の人の流れを阻害する恐れが小さくなるからである。

続いて、フロー図を用いて移動ロボットシステム１００（移動ロボット１０）の動作を説明する。図６は、移動ロボット１０のＣＰＵ６２が実行する学習時の処理の一例を示し、図７は、移動ロボット１０のＣＰＵ６２が実行する学習後の処理の一例を示す。

図６を参照して、ＣＰＵ６２は、たとえば移動ロボット１０が或る環境に配置されてサービス（タスク）を提供する初期段階において、この学習時の処理を実行する。先ず、ステップＳ１では、提供するサービスを設定する。たとえば、提供するサービスを或る店舗まで客を誘導する客引きサービスに設定する。この際には、メモリ６６に記憶された地図データ、および内蔵センサや位置検出システム１２から送信される情報を参照して、自身の現在地および移動先（目的地）の座標を取得する。

次のステップＳ３では、移動の仕方を選択してサービスを開始する。すなわち、提供するサービスに応じて予め設定されている複数種類の移動の仕方の中から、ランダム或いは順番に、１つの移動の仕方を選択する。そして、車輪モータ２６の回転角度を制御する制御データをモータ制御ボード６８に対して送信し、選択した移動の仕方となるように移動ロボット１０の動作を制御してサービスの提供を試みる。

たとえば、「中央をまっすぐ進む」という移動の仕方が選択された場合には、移動エリアの中央を通って目的地まで移動するように車輪モータ２６を制御し、「端をまっすぐ進む」という移動の仕方が選択された場合には、移動エリアの端を通って目的地まで移動するように車輪モータ２６を制御する。また、「できるだけ人を避けて進む」という移動の仕方が選択された場合には、無線通信装置８６および通信ＬＡＮボード８４を介して、位置検出システム１２によって検出される周囲の人の位置情報を逐次受信し、移動ロボット１０と人との距離が最も大きくなるような経路を通って目的地まで移動するように車輪モータ２６を制御する。また、「人の後ろをついていく」という移動の仕方が選択された場合には、たとえば位置検出システム１２によって検出される人の移動履歴に基づいて移動ロボット１０近傍に存在する人の進行方向を推測し、目的地方向に移動すると推測された人の後ろをついていくように車輪モータ２６を制御する。ただし、「人の後ろをついていく」という移動の仕方では、目的地に到着できない恐れがあるので、目的地が決まっているサービスに関しては、「人の後ろをついていく」という移動の仕方は省略してもよい。「人の後ろをついていく」という移動の仕方は、主に、目的地がなくブラブラしている状態を含むサービス（たとえばエンタテインメントサービスの実行時には、コミュニケーション相手を探してブラブラと移動する状況がある）に設定され、この場合には、近傍に存在する人をランダムに選択して、その人の後ろをついていくように制御される。

次のステップＳ５では、ステップＳ３においてサービスを実行したときの周囲の人の集まり具合および流れ具合に関する情報を記録する。たとえば、周囲の人の集まり具合に関する情報として、移動ロボット１０が目的地に到着したときに、移動ロボット１０周囲の所定範囲内に何人の人が滞在しているかを計測し、その計測値を移動の仕方と対応付けて周囲反応情報ＤＢ８８に記憶する。また、たとえば、周囲の人の流れ具合に関する情報として、移動ロボット１０が移動を開始してから目的地に到達するまでの時間の間に、移動エリア内に入った人の総数から出た人の総数をひいた値（流入人数−流出人数）を計測し、その計測値を移動の仕方と対応付けて周囲反応情報ＤＢ８８に記憶する。なお、このような周囲反応情報は、位置検出システム１２によって検出されて、無線通信装置８６および通信ＬＡＮボード８４等を介してＣＰＵ６２に与えられたり、移動ロボット１０自身が搭載した各センサ３０，３４，６０によって検出されて、センサ入力／出力ボード７０等を介してＣＰＵ６２に与えられたりする。

そして、ステップＳ７では、データ量は十分か否かを判断する。すなわち、提供するサービスに応じて予め設定されている複数種類の移動の仕方によるサービスの試みが、移動の仕方のそれぞれについて所定回数だけ実行されたかどうかを判断する。ステップＳ７で“ＮＯ”の場合、すなわち収集したデータ量が不十分の場合には、ステップＳ３に戻り、所定回数実行されていない移動の仕方の中から１つの移動の仕方を選択し、同様の処理を繰り返す。一方、ステップＳ７で“ＹＥＳ”の場合、すなわち収集したデータ量が十分である場合には、そのサービスに関する学習処理を終了する。なお、移動ロボット１０がその環境で他のサービスを行うときには、他のサービスについても図６に示す学習処理を実行し、収集した情報を各サービスと対応付けて周囲反応情報ＤＢ８８に記憶するとよい。

図７を参照して、学習後、つまり周囲反応情報ＤＢ８８を構築した後の処理について説明する。ステップＳ１１では、この全体処理を終了するか否かを判断する。たとえば、オペレータによる停止命令を検出したか否かを判断する。ステップＳ１１で“ＹＥＳ”の場合、すなわちオペレータによる停止命令を検出した場合などには、全体処理を終了する。一方、ステップＳ１１で“ＮＯ”の場合には、処理はステップＳ１３に進む。

ステップＳ１３では、提供するサービスを設定する。すなわち、周囲反応情報を収集済みのサービスの中から１つのサービスを設定する。この際には、メモリ６６に記憶された地図データ、および内蔵センサや位置検出システム１２から送信される情報を参照して、自身の現在地および移動先（目的地）の座標を取得する。

次のステップＳ１５では、周囲反応情報ＤＢ８８を参照して、ステップＳ１３で設定したサービスに応じた移動の仕方を選択する。たとえば、移動ロボット１０の周囲に人を集めたい客引きサービス等を提供するときには、「累積集まり／実行回数」の値が最大となる移動の仕方を選択する。また、たとえば、周囲の人の流れを邪魔せずに移動したい荷物搬送サービスや周囲の人の流れを促進したいサービス等を提供するときには、「累積滞留／実行回数」の値が最小となる移動の仕方を選択する。

そして、ステップＳ１７では、ステップＳ１５で選択した移動の仕方によってサービスを実行する。すなわち、車輪モータ２６の回転角度を制御する制御データをモータ制御ボード６８に対して送信し、選択した移動の仕方となるように移動ロボット１０の動作を制御してサービスを提供する。

この実施例によれば、移動ロボット１０の行動に対する周囲の人の反応状況から、配置される環境および提供するサービスに合った適切な行動を学習するので、人と共存する環境において効果的にサービスを提供できる。

なお、上述の実施例では、移動ロボット１０が実際にサービスを提供しているときに周囲反応情報を収集するようにしたが、これに限定されない。たとえば、移動ロボット１０が複数種類の移動の仕方によって模擬的な移動（つまりサービスの提供を行わない状態での移動）を試みるようにし、この移動を試みた際の周囲反応情報を計測して周囲反応情報ＤＢ８８を構築する。そして、サービスを実際に提供するときに、構築した周囲反応情報ＤＢ８８に記憶された周囲反応情報を参照して、各種サービスに適した移動の仕方を選択することもできる。ただし、提供するサービスの種類によって周囲の人の反応状況は異なる場合があるので、実際にサービスを提供しているときに周囲反応情報を収集し、サービス毎に場合分けして記憶しておくことが好ましい。

また、或る移動ロボット１０が学習した内容（つまり構築した周囲反応情報ＤＢ８８）を利用して、他の移動ロボットが適切な移動の仕方を選択するようにすることもできる。ただし、移動ロボット１０の種類が異なる場合、たとえば人とのコミュニケーションを目的として製作されたコミュニケーションロボットと荷物の搬送を目的として製作されたカート型ロボットとでは、移動時の周囲の人の反応は異なるので、その移動ロボット自身が学習して、その後のサービスの提供に生かすことが好ましい。

また、上述の実施例で示した「中央をまっすぐ進む」等の移動の仕方（移動態様）は単なる例示であり、移動ロボット１０は他の移動の仕方を試みることもできる。さらに、上述の実施例では、移動の仕方の分類は、主に移動経路の違いによるものであった、つまり移動の仕方を分類するファクタとして、主として移動経路を用いたが、これに限定されない。たとえば、移動の仕方を分類するファクタとしては、移動経路の代わりに或いは移動経路と共に、移動速度を用いることもできる。また、右手を上に挙げる等の身体動作をファクタとして加えることもできるし、「○○でセールをやっているよ」等の発話をファクタとして加えることもできる。

身体動作や発話などを加えた移動の仕方の典型例としては、移動ロボット１０が少し離れた場所にいる人に話しかける場合の話しかけ方がある。図８には、人に対する話しかけを含むサービス（たとえばエンタテインメントサービス）を移動ロボット１０が提供する場合に、周囲反応情報ＤＢ８８に記憶されるテーブルの一例を示す。図８に示すように、移動ロボット１０は、人に対する話しかけを含むサービスを提供する場合には、「“おーい、そこのあなた”等と大きな声で話しかけながら、前からゆっくり近づく」、「前からまっすぐ、すばやく近づく」、「周りの人を避けながら近づく」および「後ろからこっそり近づく」等の複数種類の話しかけ方（移動の仕方）によるサービスの提供を学習時に試みる。そして、そのときの周囲反応情報を位置検出システム１２等によって検出し、移動の仕方と対応付けて記憶する。図８に示す例では、話しかけ方と対応付けて、実行回数、累積成功、累積集まりおよび累積滞留の情報を記憶している。ここで、累積成功は、話しかけに成功した回数を示す。

図８に示すような周囲反応情報ＤＢ８８を構築した後は、移動ロボット１０は、話しかけの成功率、人の集まり具合および流れ具合に関する情報を評価関数とし、その評価関数が最小または最大となる話しかけ方を選択することによって、効果的なサービスの提供を行う。具体的には、移動ロボット１０の周囲に人を集めたいサービスを提供するときには、話しかけの成功率（累積成功／実行回数）が最大であって、かつ「累積集まり／実行回数」の値が最大となる話しかけ方が選択される。たとえば客引きサービスを行うときには、客引き対象として選択して声をかけた相手以外の人も誘導することができるので、より効果的にサービスを提供できる。また、たとえばエンタテインメントサービスを行うときには、周囲に人が集まっていれば、次の相手をすぐに見つけることができるので、より効果的にサービスを提供できる。一方、周囲の人の流れを邪魔せずに移動したいサービスを提供するときには、話しかけの成功率が最大であって、かつ「累積滞留／実行回数」の値が最小となる話しかけ方を選択するとよい。

なお、上で挙げた所定距離などの具体的数値は、いずれも単なる一例であり、必要に応じて適宜変更可能である。

１０ …移動ロボット
１２ …位置検出システム
１４ …コンピュータ
１６ …レーザレンジファインダ
２２ …車輪
２６ …車輪モータ
６２ …ＣＰＵ
６６ …メモリ
８８ …周囲反応情報データベース
１００ …移動ロボットシステム（移動ロボット用の学習システム）

Claims

人と共存する環境に配置されて移動を伴うサービスを提供する移動ロボットであって、
配置環境において複数種類の移動の仕方によって移動を試みる第１実行手段、
前記第１実行手段によって前記移動を試みたときの、目的地に到達したときに前記移動ロボット周囲の所定範囲内に滞在している人数を示す人の集まり具合に関する情報を含む周囲反応情報を検出する検出手段、
前記検出手段によって検出された前記周囲反応情報を前記移動の仕方のそれぞれと対応付けて記憶する記憶手段、
前記記憶手段に記憶された前記周囲反応情報を評価関数として、提供するサービスに応じた前記移動の仕方を選択する選択手段、および
前記選択手段によって選択された前記移動の仕方によって当該サービスを実行する第２実行手段を備える、移動ロボット。
人と共存する環境に配置されて移動を伴うサービスを提供する移動ロボットであって、
配置環境において複数種類の移動の仕方によって移動を試みる第１実行手段、
前記第１実行手段によって前記移動を試みたときの、前記移動ロボットが移動した移動エリア内への流入人数から流出人数を引いた値、前記移動ロボットから所定距離の範囲内での平均移動速度がその範囲外の平均移動速度と比較して所定値以上遅くなった人数、または、前記移動ロボットが配置されていない状態と前記移動ロボットが移動しているときの状態との前記移動エリア内の人々の平均移動速度または平均通過時間の差を示す人の流れ具合に関する情報を含む周囲反応情報を検出する検出手段、
前記検出手段によって検出された前記周囲反応情報を前記移動の仕方のそれぞれと対応付けて記憶する記憶手段、
前記記憶手段に記憶された前記周囲反応情報を評価関数として、提供するサービスに応じた前記移動の仕方を選択する選択手段、および
前記選択手段によって選択された前記移動の仕方によって当該サービスを実行する第２実行手段を備える、移動ロボット。
前記移動の仕方を分類するファクタは、移動経路を含む、請求項１または２記載の移動ロボット。
音声を出力する発話手段をさらに備え、
前記移動の仕方を分類するファクタは、前記発話手段による発話を含む、請求項１ないし３のいずれかに記載の移動ロボット。
人と共存する環境に配置されて移動を伴うサービスを提供する移動ロボット用の学習システムであって、
前記移動ロボットに対して、配置環境において複数種類の移動の仕方によって移動を試みさせる制御手段、
前記移動ロボットが前記制御手段による移動を試みたときの、目的地に到達したときに前記移動ロボット周囲の所定範囲内に滞在している人数を示す人の集まり具合、および前記移動ロボットが移動した移動エリア内への流入人数から流出人数を引いた値、前記移動ロボットから所定距離の範囲内での平均移動速度がその範囲外の平均移動速度と比較して所定値以上遅くなった人数、または、前記移動ロボットが配置されていない状態と前記移動ロボットが移動しているときの状態との前記移動エリア内の人々の平均移動速度または平均通過時間の差を示す人の流れ具合の少なくとも一方に関する情報を含む周囲反応情報を検出する検出手段、および
前記検出手段によって検出された前記周囲反応情報を前記移動の仕方のそれぞれと対応付けて記憶してデータベースを構築するデータベース構築手段を備える、移動ロボット用の学習システム。
人と共存する環境に配置されて移動を伴うサービスを提供する移動ロボットの行動学習方法であって、
（ａ）配置環境において複数種類の移動の仕方によって移動を試み、
（ｂ）前記ステップ（ａ）で移動を試みたときの、目的地に到達したときに前記移動ロボット周囲の所定範囲内に滞在している人数を示す人の集まり具合、および前記移動ロボットが移動した移動エリア内への流入人数から流出人数を引いた値、前記移動ロボットから所定距離の範囲内での平均移動速度がその範囲外の平均移動速度と比較して所定値以上遅くなった人数、または、前記移動ロボットが配置されていない状態と前記移動ロボットが移動しているときの状態との前記移動エリア内の人々の平均移動速度または平均通過時間の差を示す人の流れ具合の少なくとも一方に関する情報を含む周囲反応情報を検出し、そして
（ｃ）前記ステップ（ｂ）で検出した前記周囲反応情報を前記移動の仕方のそれぞれと対応付けて記憶してデータベースを構築する、移動ロボットの行動学習方法。