WO2004018159A1

WO2004018159A1 - 環境同定装置及び環境同定方法、並びにロボット装置

Info

Publication number: WO2004018159A1
Application number: PCT/JP2003/010651
Authority: WO
Inventors: Steffen Gutmann; Masaki Fukuchi
Original assignee: Sony Corporation
Priority date: 2002-08-26
Filing date: 2003-08-22
Publication date: 2004-03-04
Also published as: US20060064202A1; EP1541295A1

Abstract

　環境同定装置（４００）は、ランドマークが複数配置され、一意に特定可能な環境内を移動するロボット装置が複数の登録済の環境から現在の環境を同定するものであり、現在の環境内のランドマークを認識し、ロボット装置自身の移動状態量を算出し、このランドマーク及び移動状態量に基づいて現在の環境におけるランドマークの位置情報を有する現在の環境地図を構築する環境地図構築部（４０２）と、ランドマークの位置情報及び環境ＩＤからなる登録済環境地図のデータベースを有する環境地図記憶部（４０３）と、登録済環境地図と現在の環境地図との類似度から現在の環境を同定する環境同定装置（４０４）と、新しい環境を探索する環境探索部（４０５）とから構成される。

Description

明細書環境同定装置及び環境同定方法、並びにロボット装置技術分野本発明は、移動体が現在移動している環境を同定する環境同定装置、環境同定方法、プログラム及び記録媒体、並びに環境同定装置を搭載したロボット装置に関する。

本出願は、日本国において 2 0 0 2年 8月 2 6日に出願された日本特許出願番号 2 0 0 2— 2 4 5 6 1 4を基礎として優先権を主張するものであり、この出願は参照することにより、本出願に援用される。罔景技術電気的又は磁気的な作用を用いて人間（生物）の動作に似た運動を行う機械装置を「ロボヅト」という。我が国においてロボットが普及し始めたのは、 1 9 6 0年代末からであるが、その多くは、工場における生産作業の自動化 ·無人化等を目的としたマニピュレータ及び搬送ロボヅト等の産業用ロボヅト（Industrial Robot) であった。

最近では、人間のパートナーとして生活を支援する、即ち住環境その他の日常生活上の様々な場面における人的活動を支援する実用ロボットの開発が進められている。このような実用ロボットは、産業用ロボットとは異なり、人間の生活環境の様々な局面において、個々に個性の相違した人間、又は様々な環境への適応方法を自ら学習する能力を備えている。例えば、犬又は猫のように 4足歩行の動物の身体メカニズム及びその動作を模した「ペット型」ロボット、或いは、 2足直立歩行を行う人間等の身体メカニズム及びその動作をモデルにしてデザインされた「人間型」又は「人間形」ロボヅト（Humanoid Robot) 等のロボヅト装置は、既に実用化されつつある。これらのロボット装置は、産業用ロボットと比較して、例えばエンターティンメント性を重視した様々な動作等を行うことができるため、ェン夕一ティンメントロボットと呼称される場合もある。また、そのようなロボット装置には、外部からの情報及び内部の状態に応じて自律的に動作するものがある。

ところで、自律型ロボット装置において、自身の周りの環境を認識して経路計画を立て、それに応じて移動する能力は言うまでもなく重要である。従来、移動ロボット装置においては、自身が移動する環境を認識するため、その環境全体の地図を保持したり、また、ロボット装置の微少移動又は姿勢の変更に際して環境地図が更新されている。

従来、このような環境地図を保持する移動ロボット装置のナビゲ一シヨンシステムが米国特許第 5 3 6 3 3 0 5号明細書（Navigation system for a mobi le r obot) に開示されている（以下、従来例という。）。この技術によれば、ロボヅト装置は、ランドマークが配置された環境の地図を記憶し、環境が変わったとき等に、記憶した環境地図と、現在の環境の観測結果とを比較し、ランドマークが一致した数によりその信頼性を評価する。記憶された環境地図に存在しないランドマークを観測した場合は、その情報を追加して環境地図を更新する。

しかしながら、従来例に記載の技術は、ある 1つの環境を想定し、その一つの環境地図を如何に構築するかに関し、ある 1つの環境内のナビゲーシヨン、又は自己位置同定を行うものである。即ち、例えば工場の搬送ロボットや、美術館内の案内ロボットといった限られた環境内での移動を前提としているロボットに有用であるものの、エンターテインメント用のロボット装置としては以下に示す問題点がある。即ち、エンターテインメント用のロボット装置は、その活動の場が家庭環境等であるため、途中で電源が切られる、及び持ち上げられて違う部屋に持っていかれる等、自己位置同定にとって困難な状況が日常的に多々発生する。例えば、東京のあるユーザの家の 1階にある部屋 A、その 2階にある部屋 B、及び大阪にある親戚の家の部屋 Cがあるとする。ロボット装置は、普段の日中は部屋 Aで活動しているが、夜間は部屋 Bに運ばれ、更に、夏休みは大阪の部屋 C に運ばれ、その部屋で活動するものとする。ロボット装置自身が能動的にこれらの部屋 A〜 Cの間を移動することは不可能であるため、例えば電源を切られた状態で搬送される。このような状況で、ロボット装置がこれらの部屋 A〜 Cの間の物理的関係を獲得することは不可能である。

即ち、従来例の方法では、別の部屋に搬送される等して物理的に離れた環境に移動させられた場合、そのままでは自己位置同定を行うことができず、従って、何らかの方法で明示的に環境が変化したことを指定する必要がある。

また、もし仮に全ての部屋の間の物理的関係を獲得することが可能で、全てを —つの環境地図で表現できたとすると、常に極めて多くの情報を一度に扱わなくてはいけなくなり、リソースの限られたロボット装置等には不向きであり、計算量の観点から問題が発生してしまう。発明の鬨示本発明は、このような従来の実情に鑑みて提案されたものであり、ロボット装置等の移動体における限られた計算リソース及びメモリリソースを考慮し、素早く現在の環境を同定することができ、各々の環境での自己位置同定を行うことができる環境同定装置、環境同定方法、プログラム及び記録媒体、並びに環境同定装置を搭載したロボット装置を提供することを目的とする。

上述した目的を達成するために、本発明に係る環境同定装置は、 1以上のランドマークが配置された環境内を移動体が移動して該環境を同定するする環境同定装置であって、上記 1以上のランドマークの観測結果及び上記移動体の移動状態量に基づき、 1以上のランドマークの配置又は数により一意に特定可能な環境の環境地図を構築する環境地図構築手段と、上記環境地図が登録済環境地図として複数記憶された環境地図記憶手段と、上記環境地図記憶手段に記憶されている上記登録済環境地図と、上記環境地図構築手段により構築された現在の環境地図とを比較して、上記現在の環境が上記登録済環境地図が示す環境であるか否かを判定する環境同定手段とを有することを特徴とする。

また、本発明に係る環境同定方法は、 1以上のランドマークが配置された環境内を移動体が移動して該環境を同定するする環境同定方法であって、上記 1以上のランドマークの観測結果及び上記移動体の移動状態量に基づき、 1以上のランドマークの配置又は数により一意に特定可能な環境の環境地図を構築する環境地図構築工程と、記憶手段に登録済環境地図として複数記憶された上記環境地図と、上記環境地図構築工程にて構築された現在の環境地図とを比較して、上記現在の環境が上記登録済環境地図が示す環境であるか否かを判定する環境同定工程とを有することを特徴とする。

また、本発明に係るプログラムは、上述した環境同定処理をコンピュータに実行させるものであり、本発明に係る記録媒体は、そのようなプログラムが記録されたコンピュータ読み取り可能なものである。

本発明においては、現在の環境における環境地図を構築する場合、 1以上のランドマ一クの配置又は数により一意に特定可能な環境毎の環境地図を構築し、この構築した環境地図を、登録済環境地図と比較して同定する同定手段を有するため、ロボット装置が物理的に離れた複数の環境（例えば、物理的に距離が離れた場所にある部屋 Aと部屋 B ) を素早く識別することができ、環境全てを大きな環境地図によって保持する手法に比べて、計算負荷が少なく、更に異なる環境間の相対的な位置関係を関知する必要がない。また、全てのランドマークを認識しなくても、ある程度の情報から現在の環境を同定することができる。このように、各環境毎に一つの環境地図を構築し、記憶手段に登録された環境地図群との比較をダイナミックに行うことにより、素早く現在の環境を同定することができ、各々の環境での自己位置同定を行うことができる。

本発明に係るロボット装置は、 1以上のランドマークが配置された環境内を移動するロボット装置であって、上記 1以上のランドマークの観測結果及び上記口ボット装置の移動状態量に基づき、 1以上のランドマークの配置又は数により一意に特定可能な環境の環境地図を構築する環境地図構築手段と、上記環境地図が登録済環境地図として複数記憶された環境地図記憶手段と、上記環境地図記憶手段に記憶されている上記登録済環境地図と、上記環境地図構築手段により構築された現在の環境地図とを比較して、上記現在の環境が上記登録済環境地図が示す環境であるか否かを判定する環境同定手段とを有することを特徴とする。

本発明においては、ランドマークにより一意に特定可能である範囲を 1つの環境とし、この環境を示す環境地図を記憶し、現在の環境と比較して同定することにより、一つ一つのデータ量が小さくてよく、ロボット装置における限られた計算リソース及びメモリリソースを考慮しつつ、現在移動している環境を迅速且つ効率よく同定することができる。

本発明の更に他の目的、本発明によって得られる具体的な利点は、以下に説明される実施例の説明から一層明らかにされるであろう。図面の簡単な説明図 1は、本発明の実施の形態におけるロボット装置の外観構成を示す図であつて、ヒユーマノィド型の 2足歩行のロボヅト装置を示す斜視図である。

図 2は、本発明の実施の形態におけるロボット装置の外観構成を示す図であつて、 4足歩行の動物型ロボット装置を示す斜視図である。

図 3は、本発明の実施の形態に係るロボット装置の概略を示すプロック図である。

図 4は、本発明の実施の形態に係るロボヅト装置を動作するソフトウヱァの構成を示す模式図である。

図 5は、本発明の実施の形態に係る環境同定システムを示すプロック図である _c 図 6は、本発明の実施の形態に係る環境同定システムで管理される環境地図の一例を示す模式図である。

図 7 Aは、ロボット装置が環境内を探索している様子を示す模式図であり、図 7 Bは、本実施の形態におけるランドマークを示す模式図である。

図 8は、ランドマークの一例を示す模式図である。

図 9は、本発明の実施の形態に係る環境同定装置の環境同定方法を示すフローチヤ一トである。

図 1 0は、ランドマークが配置された環境を示す模式図である。

図 1 1は、ロボット装置が自身の動きを考慮せずに構築した環境地図を示す模式図である。

図 1 2は、ロボット装置が自身の動きを考慮して構築した環境地図を示す模式図である。図 1 3は、拡張カルマンフィルタモデルの模式図である。

図 1 4 A及び図 1 4 Bは、夫々ロボット装置が自身の動作を観測した場合及びランドマークを観測した場合の環境地図を構築する方法を示すフローチヤ一卜である。

図 1 5は、ロボット装置が環境内を歩き回ってランドマークの位置を観測して構築した環境地図の一例を示す図である。

図 1 6は、同じく、ロボット装置が環境内を歩き回ってランドマークの位置を観測して構築した環境地図の一例を示す図である。

図 1 7は、本発明の実施の形態における環境同定部の環境同定方法を示すフロ一チヤ一トである。

図 1 8は、本発明の実施の形態における環境記憶装置に記憶される環境 I Dを説明する図である。

図 1 9は、環境内のランドマークの探索を終了する方法を説明するための模式図である。

図 2 0は、本発明の実施の形態におけるロボット装置のソフトウエアの動作を示すフローチャートである。

図 2 1は、同ソフトウェアに入力されるデータの流れを示す模式図である。図 2 2は、本発明の実施の形態におけるロボット装置の自由度構成モデルを模式的に示す図である。

図 2 3は、同ロボット装置の回路構成を示すプロック図である。

図 2 4は、同ロボヅト装置のソフトウエア構成を示すプロヅク図である。図 2 5は、同ロボヅト装置のソフトウエア構成におけるミドル . ウェア · レイャの構成を示すプロヅク図である。

図 2 6は、同ロボヅト装置のソフトウエア構成におけるアプリケーション · レィャの構成を示すプロヅク図である。

図 2 7は、アプリケーション · レイヤの行動モデルライブラリの構成を示すブロヅク図である。

図 2 8は、同ロボット装置の行動決定のための情報となる有限確率オートマトンを説明する図である。図 2 9は、有限確率ォートマトンの各ノードに用意された状態遷移表を示す図である。発明を実施するための最良の形態

1 . ロボヅト装置の概要

' 以下、本発明を適用した具体的な実施の形態につ^て、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、ランドマークが複数配置され一意に特定可能な環境内を移動するロボット装置が複数の登録済の環境から現在の環境を同定する環境同定装置及びこれを搭載したロボット装置に適用したものである。

このような環境同定装置を搭載するロボット装置としては、エンターティンメント用等の例えばヒューマノイド型の 2足歩行のロボット装置、及び、 4足歩行の動物型ロボット装置等を使用することができる。例えば、 2足歩行のロボット装置としては、図 1に示すように、ロボヅト装置 1の体幹部ユニット 2の所定の位置に頭部ュニット 3が連結されると共に、左右 2つの腕部ュニット 4 R / Lと、左右 2つの脚部ュニット 5 R / Lが連結されて構成されるものがある（但し、 R 及び Lの各々は、右及び左の各々を示す接尾辞である。以下において同じ。）。 · また、 4足歩行の動物型ロボット装置としては、「犬」を模した形状のいわゆるぺットロボットとされる図 2に示すようなものがある。このロボット装置 1 1は、胴体部ユニット 1 2の前後左右にそれそれ脚部ユニット 1 3 A , 1 3 B , 1 3 C ₃ 1 3 Dが連結されると共に、胴体部ュニット 1 2の前端部及び後端部にそれそれ頭部ュニツト 1 4及び尻尾部ュニット 1 5が連結されて構成されている。

これらのロボット装置 1 , 1 1は、何れも頭部ユニットに C C D ( charge cou pled device) / C M O S ( complementary metal-oxiae semi conductor) ί最像素子を用いた小型カメラを視覚センサとして有しており、画像処理によりランドマ —クを検出し、ロボット装置に対する相対的なランドマークの位置を獲得することができる。本実施の形態では、これをランドマークセンサとして使用する。以下、本実施の形態においては、本発明を、ヒューマノイド型の 2足歩行のロボット装置 1に適用した例について説明する。

図 3は、本発明の実施の形態に係るロボット装置の概略を示すプロック図である。図 3に示すように、ロボット装置 1の頭部ュニヅト 3には、右目及び左目にそれそれ相当する 2台の C CDカメラ 20 0 R , 200 Lが設けられ、この C C Dカメラ 2 00 R, 2 0 0 Lの後段には、ステレオ画像処理部 2 1 0が設けられている。 2台の C CDカメラ 2 0 0 R， 2 00 Lにより撮像された右目画像 2 0 1 R、左目画像 20 1 Lは、ステレオ画像処理部 2 1 0に入力される。ステレオ画像処理部 2 1 0は、各画像 2 0 1 R , 2 0 1 Lの視差情報（disparity data)

(距離情報）を計算し、カラー画像（YUV ：輝度 Y、色差 UV) 2 02及び視差画像（YDR ：輝度 Υ、視差 D、信頼度 R) 2 03をフレーム毎に左右交互に算出する。ここで、視差とは、空間中のある点が左目及び右目に写像される点の違いを示し、そのカメラからの距離に応じて変化するものである。

このカラ一画像 2 02及び視差画像 20 3はロボット装置 1の体幹部ュニヅト 2に内蔵された CPU (制御部） 22 0に入力される。また、ロボット装置 1の各関節にはァクチユエ一夕 2 3 0が設けられており、 C P U 2 20からの指令となる制御信号 2 3 1が供給されて、その指令値に応じてモー夕を駆動する。各関節（ァクチユエ一夕）には、ポテンショメ一夕が取り付けられ、その時のモータの回転角が CPU 2 20に送られる。このァクチユエータ 230に取り付けられたポテンショメータ、足底に取り付けられた夕ツチセンサ及び体幹部に取り付けられたジャイロ ·センサ等の各センサ 240は、現在の関節角度、設置情報、及び姿勢情報等の現在のロボヅト装置 1の状態を計測し、センサデータ 241 として CPU 2 20へ供給される。 CPU 2 2 0は、ステレオ画像処理部 2 1 0からのカラ一画像 2 02及び視差画像 2 03と、ァクチユエ一夕 2 30の全ての関節角度等のセンサデータ 24 1とが入力され、これらのデータが後述するソフトゥエアにより処理され、様々な動作を自律的に行うことが可能となる。

図 4は、本実施の形態におけるロボヅト装置 1を動作させるソフトウエアの構成を示す模式図である。本実施の形態におけるソフトウェアは、オブジェクト単位で構成され、ロボット装置 1の位置、移動量、周囲の障害物、及び環境地図等を認識し、ロボット装置 1が最終的に取るべき行動についての行動列を出力する各種認識処理等を行うものである。なお、ロボット装置 1の位置を示す座標として、例えば、後述するランドマーク等の特定の物体等に基づく所定位置を座標の原点としたワールド座標系（以下、絶対座標ともいう。） .と、ロボヅト装置 1自身を中心（座標の原点）としたロボット中心座標系（以下、相対座標ともいう。 ) との 2つの座標を使用する。

オブジェクト同士は、非同期に通信し合うことで、システム全体が動作する。各オブジェクトはメッセージ通信と共有メモリを使用したォブジヱクト間通信方法によりデータの受け渡し及びプログラムの起動（ I n v o k e ) を行っている。図 4に示すように、本実施の形態におけるロボヅト装置 1のソフトウェア 3 0 0 は、ロボット装置 1の移動量を算出する移動量算出手段（キネマテイツクオドメトリ（Kinematics Odometry) ) K I N E 3 1 0、環境内の平面を抽出する平面抽出部（Pl ane Extractor) P L E X 3 2 0、環境内の障害物を認識する障害物グリヅド算出部（Occupancy Gr id) O G 3 3 0、人工的なランドマークを含む環境において、自身のセンサ情報及び移動量算出手段から供給される自身の動作情報によって、ロボット装置 1の自己位置（位置及び姿勢）を同定するランドマークセンサ部（Landmark Sensor) C L S 3 4 0、ロボット中心座標を絶対座標に変換する絶対座標算出部（Local i zation) L Z 3 5 0及びロボット装置の取るべき行動を決定する行動決定部（Si tuated behavior Layer) S B L 3 6 0から構成され、各オブジェクト単位にて処理がなされる。

ここで、ロボット装置 1が自律的に動作するためには、ロボット装置 1が現在おかれている環境を認識する必要がある。本実施の形態においては、先ず、ロボット装置 1が自律的に動作するための各処理のうち、ロボット装置 1が現在移動している環境を同定するための環境同定装置について説明する。ロボット装置 1 を自律的に動作させる上記ソフトウェアについての詳細な説明、並びにロボヅト装置 1の構成及び動作に関する詳細な説明は後述する。

2 . 環境同定装置

本実施の形態の環境同定装置は、環境内に設置されたランドマークを認識するランドマークセンサを装備したロボット装置 1 (移動体）において、ランドマークの観測に基づき環境地図を構築し、この環境地図を既知の複数の環境地図（登録済環境地図）と比較することによって、ロボット装置 1が現在置かれている環境を同定するものである。既知の環境地図は、ユーザ等により作成されたものであっても、ロボット装置 1によって学習されたものであってもよい。環境地図は個々のランドマークの位置（x， y ) を有しており、環境地図の比較は、現在観測している環境地図のランドマ一クの位置を既知の環境地図におけるランドマークの位置と比較し、両者の類似性を評価することにより行われる。

環境内には、形状 ·色等が異なる複数種の人工的なランドマークを配置し、口ボット装置 1はこの環境の中を動き回りながらランドマ一クを観測し、自分自身の移動量からランドマークの位置を推定する。観測したランドマークの位置情報と、ロボット装置 1自身の移動量から、環境内のランドマークの相対的な位置関係を推定していく。本実施の形態においては、このランドマークの位置関係を環境地図という。仮に、全く同じ配置のランドマークを有する環境が 2つ以上存在しないと仮定すると、このランドマークの位置関係によって、その環境を一意に特定することができる。一意に特定可能な環境として、具体的には、形状及び/ 又は色等により環境内では一意に特定可能な人工的なランドマークを複数配置することにより、一意に特定可能な環境を作成することができる。ロボット装置 1 は、獲得したランドマークの位置関係、即ち環境地図と、環境同定装置の環境地図記憶部に記憶されている過去の環境地図情報群とを比較することによって、口ボット装置 1が現在置かれている環境を同定することができる。以下、本実施の形態の環境同定装置について具体的に説明する。

図 5は、本発明の実施の形態に係る環境同定装置を示すブロック図である。図 5に示すように、本実施の形態の環境同定装置 4 0 0は、現在の環境内のランドマークの観測結果及びロボット装置 1自身の移動状態量が供給され、このランドマーク及び移動状態量に基づいて、ロボット装置 1が現在おかれている環境のランドマーク情報を有する環境地図を構築する環境地図構築部（環境地図構築手段）（Map Bui lding) 4 0 2と、環境内のランドマークの位置情報とその環境に一意に割り振られる環境 I Dを一つの組として、複数の環境地図（登録済環境地図）及びその環境 I Dからなるデータベースを有する環環境地図記憶部（環境地図記憶手段）（Database of Environment) 4 0 3と、環境地図構築部 4 0 2によつて構築される現在ロボット装置 1が置かれている環境の環境地図と、環境地図記憶部 40 3に記憶された既知の環境地図との類似度を比較することによって、ロボット装置 1が現在置かれている環境を特定する環境同定部（環境同定手段） (Environment Identification) 404と、新しい環境を認識するためにロボヅト装置 1を歩き回らせる環境探索部（環境探索手段）（Exploration/Robot Cont rol) 40 5とから構成される。

上述したように、図 3に示す C CDカメラ 2 ◦ 0 L， 20 O Rによって取り込まれた映像は、ステレオ画像処理部 2 1 0に入力され、左右画像 2 0 1 R, 2 0 1 Lの視差情報（距離情報）からカラー画像（YUV) 202及び視差画像（Y DR) 2 03が算出されて CPU 2 20に入力される。また、ロボヅト装置 1に複数個設けられた各センサからのセンサデータ 24 1が入力される。これらの視差情報及び視差画像からなる画像データ 3 0 1と、センサデータ 3 0 2とが移動量算出手段 K I NEに入力される。

移動量算出手段 K I NEは、画像データ 30 1及びセンサデ一夕 30 2からなる入力デ一夕に基づいてロボヅト中心座標系の移動量（ォドメトリ）を算出するまた、ロボット装置 1は、自身の姿勢方向を検出し、移動量と共に姿勢方向を示す情報が環境地図構築部 402に供給される。また、環境内に配置された C CD カメラ 2 0 0 L, 2 0 0 Rによって観測されたランドマークのカラー画像（YU V) 2 02及び視差画像（YD R) 2 03が入力されランドマークを認識するランドマーク認識手段（図示せず）から、ランドマークの観測結果（以下、ランドマーク情報という。） 4 1 1が供給される。環境地図構築部 402は、このランドマ一ク情報 4 1 1及びロボヅト装置 1の移動量及び姿勢方向を示す情報（以下、移動状態量という。） 4 1 2からなる入力情報からロボット装置 1が現在置かれている環境地図 4 1 3を構築し、環境同定部 404に供給する。

環境同定部 404は、ロボット装置 1が現在置かれている環境、即ち、環境地図構築部 402から供給された環境地図 4 1 3と、環境地図記憶部 40 3に記憶されている複数の既知の環境地図（登録済環境地図）とを比較することによって、ロボット装置 1が現在置かれている環境を特定する。この既知の環境地図は、上述したように、ユーザ等により作成されたものであっても、環境地図構築部 40 2により構築されたものであってもよい。ロボット装置 1が置かれている現在の環境が、環境地図記憶部 4 0 3に記憶されている登録済の環境地図に一致した場合は、この登録済の環境地図に対応して記憶されている環境 I D (環境識別情報） 4 1 4を出力する。環境地図記憶部 4 0 3に記憶されている複数の登録済環境地図と一致した場合は、現在の環境が同定できなかったものとして、不明確

(曖昧）であることを示す（ambiguous) 信号を出力する。また、環境地図記憶部 4 0 3に記憶されている登録済の環境地図と一致するものがなかった場合にも現在の環境が同定できなかったものとして、現在の環境が不明であることを示す

(unknown) 信号を出力する。

環境地図記憶部 4 0 3は、環境内のランドマークの位置情報、及び環境に一意に割り振られる環境 I Dが記憶された環境地図データベース（図示せず）を有する。また、環境探索部 4 0 5は、新しい環境を認識するために、例えば外部からのリモートコントロール等によりロボット装置 1に環境内を歩き回らせ、環境内のランドマークを認識させるものである。

環境地図記憶部 4 0 3の環境地図データベースには、環境内のランドマークを識別するランドマ一ク識別情報及び位置情報、並びにこの環境に対応して割り当てられた環境 I Dが予め入力されていてもよく、又は環境探索部 4 0 5により、ロボット装置 1自身が環境地図データベースを作成するようにしてもよい。

環境内には、上述したように、形状及び色の違いにより複数種のランドマークを配置し、ロボット装置 1は、自身に備えられた C C Dカメラ 2 0 0 R , 2 0 0 L等のランドマークセンサにより、ランドマークの色及び形を検出 ·認識することによって、環境地図の構築、及び環境同定を行うことができる。例えば、決められた個数のランドマークが配置された環境を 1つの環境として環境 I Dを割り付けて管理することで、環境データベースの管理が容易になる。

例えば図 6に示すように、 1つの家にリビング 4 1 5、寝室 4 1 6、台所 4 1 7及び遊び部屋 4 1 8の 4部屋があった場合、ロボット装置 1は、家全体を 1つの環境地図で管理するのではなく、各部屋 4 1 5〜4 1 8を 1つの環境として環境 I Dを割り付け、 4つの環境地図で管理する。なお、各部屋 4 1 5〜4 1 8には予め決められた個数のランドマークが配置されており、そのランドマークの配置又は数により、一意に特定可能であるものとする。

このように、周囲の環境を 1つの環境地図で管理するのではなく、一意に特定可能な範囲で分割された複数の環境地図として記憶することにより、 1つ 1つのデータが小さくなり、データの更新、追加等における計算量を低減することができる。本実施の形態における一意に特定可能な環境は、複数のランドマークを配置し、その配置の仕方等によって一意に特定することができるものである。このとき、ランドマークが 1つの環境内にて一意に特定可能であると、環境の同定が容易となる。

図 7 Aは、ロボヅト装置 1が 1つの環境内（例えば図 6のリビング 4 1 5内）を探索している様子を示す模式図、図 7 Bは、本実施の形態におけるランドマ一クを示す模式図である。図 7 Aに示すように、例えば、環境 4 2 0内の机、柱、又は壁等のランドマーク貼り付け（配置）可能な対象物 4 2 2 a~4 2 2 eに、人工的な複数種のランドマーク Lが複数配置され、ロボット装置 1は、この環境 4 2 0の中を歩き回り、 C CDカメラ 2 0 0 R， 2 0 0 L等により獲得したランドマーク Lの観測と、ロボット装置 1自身の位置（X , y， Θ ) とから、ロボヅト装置 1自身が現在置かれている環境のランドマ一ク: Lの位置関係を獲得していく。ここで、ロボット装置位置（x， y , Θ ) は、所定の位置を基準（原点）とした座標系におけるロボット装置 1の位置（x， y) と、所定の方角 Dを基準 ( 0 ° ) としてロボ、ソト装置 1の姿勢方向の角度（0) とで表現することができる。ロボヅト装置 1は、自身の C CDカメラ 2 0 0 R， 2 0 0 及ぴセンサ2 4 ◦等から上述した移動量算出手段により、自身の移動量（dx, d y) 及び移動角（CI S) を算出することにより、自身の位置（x， y , Θ) を把握することができる。

ランドマーク Lは、図 7 Βに示すように、例えば、四角形、円形及び Ξ角形の幾何学パターン 4 3 1 - 43 3が所定の配置位置となるよう組み合わされたもので、その配色により、互いに識別可能なものを使用することができる。環境 4 2 0内には、このような複数種の人工的なランドマークが複数配置され、これにより、環境 4 2 0がー意に特定可能なものとなっている。ロボット装置 1が環境 4 2 0を同定する際は、自身の移動状態量からロボット装置 1自身が現在置かれている環境のランドマークの位置関係を獲得し、このランドマーク Lの種類及びその位置関係を、環境地図記憶部 4 0 3に記憶されている過去（登録済）の環境地図におけるランドマーク Lの種類及びその位置と比較することにより、現在の環境が既に登録済の環境であるか否かを判断する。

また、現在の環境が登録されていない新しい環境である場合、又は環境地図デ一夕ベースを作成する場合等は、環境探索部 4 0 5により、自身の移動量から口ボット装置 1自身が現在置かれている環境の全てのランドマークの位置関係を獲得し、新たに探索した環境毎に識別可能な例えば E n v 1、 ∑ 11 2等の環境1 Dを付して、探索した新しい環境内の全てのランドマ一ク Lの種類及びその位置関係を、この新しい環境に対応する環境 I Dと共に環境地図記憶部 4 0 3に記憶する。

2 - 1 . ランドマーク

次に、環境内に配置されるランドマークについて説明する。図 8は、ランドマークの一例を示す模式図である。本実施の形態においては、三角、四角、丸の 3 つの形状の幾何学パターンに赤、青、黄、及び緑の 4つの色を使用し、これらの形状及び色を組み合わせることにより、一意に特定可能（uni que) な複数種のランドマークを得ることができる。図 8は、左に四角形、中央に円形、右に三角形の幾何学パターンを配置し、各パターンの位置関係を固定して配置して、各パタ一ンの色を 4色、組み合わせることによって、合計 2 4種類のランドマークを作成した例を示す。このように、複数の幾何学パターンの位置関係及び配色により、異なるランドマークを形成することができる。

また、図 8においては、例えば、ランドマーク L 1とランドマーク L 2とでは、四角形、円形、三角形の位置関係は同じであるものの、その配置される位置がわずかに異なる。ロボヅト装置 1は、これらの位置の違いも認識することが可能であり、実際には、無数の異なるランドマークを作成し、ロボット装置 1に認識させることが可能である。ロボット装置 1は、このような 3つの形状パターンを観測した場合にランドマークとして認識するよう設定されているか、又は、使用されるランドマークを予め登録しておくこと等により、ランドマークを観測して識別することができる。また、ロボット装置 1は、図 8に示すようなランドマークの場合は、ランドマークの方向も検出可能であり、ランドマークの位置だけではなくその方向も検出することにより、より少ないランドマークで更に正確に環境を識別して特定することができる。

次に、本実施の形態の環境同定装置 4◦ 0の処理の流れを説明する。図 9は、本実施の形態の環境同定方法を示すフローチャートである。図 9に示すように、環境地図構築部 4 0 2にて、先ず、ランドマークを観測、又は、ロボット装置 1 自身の動作を検出した場合（ステヅプ S 1 ) 、環境地図の内部モデルを更新する (ステヅプ S 2 ) 。ここで、環境地図は、ロボヅト装置 1及びランドマークの状態べクトル 1を使用して下記（ 1 ) のように示すものとする。この環境地図及び状態べクトルについての詳細は後述する。

∑ 環境地図 · · ■ (1)

ここで、

ί :状態べクトル中央値

状態べクトルの共分散行列

この環境地図が環境地図構築部 4 0 2から環境同定部 4 0 4に供給されると、環境同定部 4 0 4は、環境地図記憶部 4 0 3の環境データベースを検索し、この環境地図と最も適合する環境地図とその環境 I D (Environment I D )を探し出す (ステップ S 3 ) 。

適合する環境地図及び環境 I Dが環境データベースに登録されていた場合（ステヅプ S 4 ： N O ) 、この環境 I Dを現在ロボット装置 1が置かれている環境として出力する（ステップ S 5 ) 。一方、適合する環境地図及び環境 I Dがデータベ一ス 4 0 6に登録されていない場合（ステヅプ S 4 ： Y E S ) 、環境探索部 4 0 5にて環境探索行動中か否かが判断される（ステップ S 6 ) 。環境探索行動中の場合（ステツプ S 6 ： Y E S ) 、直前に出力した環境 I Dを現在、ロボヅト装置 1が置かれている環境として出力する（ステップ S 8 ) 。一方、環境探索行動中でない場合、即ち、環境探索を終了している場合（ステップ S 6 ： N O ) 、その環境地図を、新しい環境地図として環境地図記憶部 4 0 3の環境データベースに追加する（ステップ S 7 ) 。

ステツプ S 6における探索行動状態は、環境探索部 4 0 5によって制御され、ロボット装置 1が環境内の全てのランドマークを訪問したかどうかを検出し（ステヅプ S 9 ) 、未だ、その環境内のすべてのランドマークを観測していない場合には、環境探索行動中となる。

2 - 2 . 環境地図構築部

次に、図 3に示す各処理部について更に詳細に説明する。先ず、環境地図構築部 4 0 2における環境地図構築方法について説明する。環境地図構築部 4 0 2は、ランドマークの観測情報とロボット装置 1 自身の動作の観測情報（移動状態量）を利用して、 Dボヅト装置 1が現在置かれている環境の環境地図（Envi ronment Map) Nを構築する。

ここで、環境地図構築部 4 0 2が環境を認識する際に、ランドマークの観測情報及びロボット装置 1の自身の動作観測情報を利用して環境認識する理由について説明する。なお、図 1 0乃至図 1 2においては、ランドマーク Lとして図 8に示すものとは異なり、外円及び内円からなる円形で、外円と内円とが異なる色を有するパターンをランドマークとして使用した例を示すが、このようなランドマークも色の組み合わせにより、複数種のランドマークを得ることができ、これらを複数組み合わせて配置することによって一意に特定可能な環境を形成することができる。

例えば、図 1 0に示すように、 6つのランドマーク Lを有する環境の中心位置にロボット装置 4 2 1が置かれていた場合に、ロボット装置 4 2 1が向く方向 (姿勢方向）を変更すると、ランドマーク Lの観測結果のみを使用してランドマークの位置を把握しょうとすると、ロボヅト装置 4 2 1には、そのカメラで観測されたランドマークの位置情報が時系列で入力されるため、図 1 1に示すように、自身の移動に伴い、同一のランドマークにおいてもその位置がずれて観測されてしまい、ランドマークの位置を特定することができない。そこで、ロボヅト装置 4 2 1のランドマ一ク観測結果と共にロボット装置 4 2 1の移動量及び姿勢方向の移動状態量を考慮することで、図 1 2に示すように、ある程度観測を続けると、同一のランドマークの位置が収束して、環境を認識することができるようになる。ここで、ランドマークの観測情報は、ロボヅト装置 1 に備えられたカメラによる観測結果として得ることができ、ロボット装置 1の移動量及び姿勢方向である移動状態量は、ロボヅト装置 1 自身が検出することができるが、これらの情報には、このカメラの観測結果誤差、並びの移動量及び姿勢方向の検出誤差等が含まれる。

そこで、本実施の形態は、この環境地図を、ロボット装置 1の状態（状態量） 1 _rと n個のランドマークの状態（状態量） 1 _L= ( 1 1₂, · · · ， 1 _n) ^τの推定値によって構成される状態べクトル 1 = ( 1 r， 1 12， · · · ， 1 n) Tによって表現する。また、ロボヅト装置 1の状態 1 _rはロボット装置 1の位置 ' 姿勢を用いて l _r= (X , y , θ) 各ランドマークの状態 1 iはランドマークのヮールド座標系における位置を用いて 1 i二 (xi, y ι) と表す。

そして、これらの状態量を統計的に扱うため、ガウス分布を有する確率密度関数 p ( 1 ) によって表現し、環境地図を下記（ 2 ) に示す記号によって表すこととする。

1:状態べクトルの中央値

∑_{1 :}状態べクトルの共分散行列

(ί,Σ,):環境地図

1； = ：ランドマ一クの状態べクトル

l_r = (x,y,0)^T：ロボヅト装置の状態べクトル

ここで、環境地図を求めることは、この状態ベクトル 1 = ( 1 r , 11 , 12 , · • · ， I n) ^Tを同定することであるため、本実施の形態では、この問題を、ロボット装置 1の動きを入力とし、ランドマークの観測を観測量とする、拡張カルマンフィル夕（Extended Kalman Filter) モデルを用いた状態ベクトル 1の同定問題に帰着した。

2— 2— 1. 拡張カルマンフィル夕

以下、拡張カルマンフィルタについて説明する。拡張カルマンフィル夕モデルでは、ある状態 1において、ある入力 mを行った場合の理論的な状態遷移を与える関数（遷移関数）を F (1, m) 、ある状態 1においてある既知の観測情報 0

(ランドマークの位置等）の理論値を与える関数（観測関数）を H (1) 、状態 1及び観測情報 0へのノイズ成分（中央値 0のガウス分布を持つノィズ成分を仮定）を w， Vとしたときに、状態 1及び観測情報 0のモデルを下記式（3) ，

(4) で表す。 I - F(l,m) + w · . · (3) o H(l)+v · - · (4)

図 1 3は、拡張カルマンフィル夕（Extended Kalman Filter)モデルの模式図である。図 1 3に示すモデルにおいて、入力情報 m、観測情報 0によって状態量 1 を更新する更新則について説明する。

ある時点での状態 1が、下記（5 ) ， ( 6) で推定されているものとする。

ί:中央値 · · ·（5)

：共分散行列 · · ·（6)

先ず、状態 1において、ある入力 mを観測した場合、状態 1の中央値、共分散行列は下記式（7 ) ，（8 ) により更新する。

入力情報による更新 ^F 丁 ₇ (7)

∑,― VF_t VF,^T +VF_a∑_a VF_a ⁷ (8)

： dF/dlによって与えられるヤコビ行列

V ： dF/da よつて与えられるヤコビ行列

一方、状態 1において、ある観測情報 0を観測した場合、状態 1の中央値、共分散行列は下記式（9 ) , ( 1 0 ) により更新する。出力情報による更新： ' ' ' ⁽⁹)

ここで、

w： w = 2, ν/· Σ;:¹で与えられるカルマンフィル夕ゲイン

νν = ο-Η (/)?与えられる観測誤差の中央値

∑,, :∑,, =∑ + 7 ∑ 「で与えられる観測誤差の共分散

2 - 2 - 2. 環境地図更新方法

次に、環境地図を計算する処理の流れを説明する。図 14A及び図 14Bは、環境地図を更新しながら環境地図を構築する方法を示すフローチャートである。環境地図には、初期値が入力されているものとする。ロボット装置 1自身の動きが観測された場合（ステップ S 1 1 ) 、環境地図のロボット装置 1の状態 l rを更新する（ステヅプ S 12) 。また、ランドマークを観測した場合（ステップ S 1 3) 、観測したランドマークが、現在の環境地図のランドマークの状態 1 _Lに存在しない新しいランドマークであるかどうかを判断する（ステップ S 14 ) 。そして、観測されたランドマークが新しいランドマークである場合（ステップ S 14

： YE S) 、ランドマーク状態 1_Lに新しいランドマーク状態 ltmを追加する（ステヅプ S 1 5 ) 。一方、観測されたランドマークが、新しいランドマークでない場合（ステップ S 14 ： NO) 、再観測されたランドマークの状態 1 iを更新する

(ステップ S 1 6) 。この処理を繰り返すことによって、環境地図.を構築することができる。

上記のステップ S 1 2， 1 5 , 1 6において、即ち、ステヅブ S 1 2において、ロボット装置 1が自身の動作を観測したとき、ステヅプ S 15において、新規ランドマークを観測したとき、及びステヅブ S 1 6において、ランドマークを再観測したときに環境地図の再計算が行われる。次に、この環境地図の更新方法について詳細に説明する。

A . ロボッ _ト装置が自身の動作を観—測した場合 CRobot Motion Observation) ロボヅト装置 1が動作した場合は、拡張カルマンフィル夕の入力情報による更新則により、状態ベクトルの中央値、共分散行列を次のように更新する。観測されたロボヅト装置 1の移動量を m= (x_m, y_m， 0_m) とすると、上述のように、ロボット装置 1の移動量の観測量も統計的に扱うため、ガウス分布を持つ確率密度関数 p (m) によって下記式（ 1 1 ) のように表現することができる。

p( )〜N( = (i_m,5)_m,e_m)i，∑_∞) . . . (11)

ここで、

^状態量の中央値

∑„,:状態量の共分散行列

ロボット装置 1の状態 1 _rにおいて、移動量 mの動作を行った後の、ロボット装置 1の状態 1 は、幾何学的に下記式（ 1 2 ) で求めることができる。

上記式（ 1 2) の右辺を関数 f ( 1， m) とする。ロボヅト装置 1の動きによつて、ランドマークの状態 l _L= ( l _{l 3} 1₂， · · · , 1 n) ^τは影響を受けないので、環境地図の状態べクトル 1 = ( 1 _r, 1 1₂, · · · , 1 _n) ま、変更されない。従って、状態ベクトル 1の中央値は、下記式（ 13) となり、共分散行列は、下記式（ 14) となる。これらの計算にかかる計算コストは 0 (n) である。

fv/;.∑„.v/,^r ₊ v/_m∑_mv/_m ^r v/,.∑ v,.∑

11

2, ∑ (14)

In

ここで、

V/,. :iによって得られるヤコビアン

dr

V ：^ "によって得られるヤコビアン

dm

B . 新規ランドマ一クを観測した場合（New Landmark Observation) 新しいランドマークを観測した場合、拡張カルマンフィル夕の入力情報による更新則により、状態ベクトル 1の中央値、共分散行列を次のように再計算することで、環境地図を更新する。

新しく観測されたランドマークのロボット装置 1からの相対的な位置を 0 =

(x， y) とすると、前述のように、ランドマークの位置の観測量も統計的に扱うため、ガウス分布を持つ下記式（ 1 5 ) に示す確率密度関数 p ( 0 ) によって表現する。

p (ひ)〜 N^ = ( ，タ。ァ,∑。) (15) ここで、

^状態量の中央値

∑„:状態量の共分散行列ロボヅト装置 1の状態 1 r二（X , y , θ ) ^τにおいて、新しいランドマーク 0 = (X , y) を観測した場合、ランドマークのワールド座標系での位置 1 iは、幾何学的に下記式（ 1 6) で求めることができる。

(16)

上式の右辺を関数 g (1， 0 ) とする。新しいランドマークの観測によって、ロボット装置 1の状態 1 <■と既知のランドマークの状態 1L = (11 , 1_2j · · · ,

I n) ^Tは影響を受けない。ランドマークの状態に新たに I nUを追加する。従って. 状態ベクトル 1の中央値は、下記式（ 1 7) となり、共分散行列は下記式（ 1 8) となる。これらの計算にかかかる計算コストは 0 (n) である。

Vg,: によって得られるヤコビアン

dr

。： · ^によって得られるヤコビアン

do

C . ランドマークの再観測（Landmark Re-Observation)

既知のランドマークを再観測した場合、拡張カルマンフィルタの出力情報による更新則により、状態ベクトル 1の中央値、共分散行列を次のように再計算することで、環境地図を更新する。

まず、再観測されたランドマークのロボット装置 1からの相対的な位置を 0 = ( i , y i ) とすると、前述のように、ランドマークの位置の観測量も統計的に扱うため、ガウス分布を有する下記式（ 1 9) に示す確率密度関数 p ( 0 ) によつて表現することができる。

p(o)〜N(5,∑。) . . - (19)

ここで、

0:状態量の中央値

Σ_{Λ :}状態量の共分散行列

次に、拡張カルマンフィルタの出力情報による更新則により、以下のように過程すると、状態量及び共分散行列は夫々下記式（20) ， (2 1) で更新される ₍

V = 0 - ο

。

W = Σ,ν/^Σ:¹ w： w =

カルマンフィル夕ゲイン

' /J(} 与えられる観測誤差の中央値

∑,:∑„ =∑, + VH,∑,VHfで与えられる観測誤差の共分散行列

1 ^-1+ W_v · · · (20)

∑,-w∑w² (21)

こで、ある状態におけるランドマークの状態 1 iの観測値の理論値は、幾何学的に下記式（2 2 ) により求めることができる。この計算コストは〇（n ² ) である。

o = h\l )= Rl- Θ,. I — ) • · · (22) :ある状態 /におけるランドマーク /_;の観測値の理論値

2 - 2 - 3 .環境地図構築例

図 1 5及び図 1 6は、ロボット装置 1が環境内を歩き回ってランドマークの位置を観測して構築した環境地図を示す図である。図 1 5は、同一形状（外円及び内円からなる）ランドマークを使用した場合であり、図 1 6は、図 8に示す異なる形状の幾何学パターンを組み合わせて得られるランドマークを使用した場合を示す。

図 1 5に示す環境 4 4 0において、 L 1 1 i〜 L 1 1 ₆は、本来のランドマークの配置位置を示している。このようなランドマーク L 1 1 〜！^ 1 1 6が配置された環境 4 4 0内の各ランドマークを観測し、ロボット装置 1が上述の方法によりランドマーク位置を推定した結果、得られたランドマーク位置を L 1 2 〜 1 2 ₆に示す。この推定誤差は 1 0 c m程度であった。

また、図 1 6に示す環境 4 5 0においても、図 1 5の場合と同様に、ほぼ正確に環境内のランドマーク位置を推定することができる。また、図 1 6に示すように、図 8に示すような異なる形状の幾何学パターンを組み合わせたランドマークを使用すると、円形の場合と異なり、そのランドマークが向く方向も検出することができ、ロボット装置 1は、より精度が高い環境地図を構築することができる。

2 — 3 . 環境同定部（Environment Identif i cation)

次に、環境同定部 4 0 4の環境同定方法について説明する。環境同定部 4 0 4 では、環境地図構築部 4 0 2から得られる環境地図（map) を、環境地図記憶部 4 0 3の環境地図データベースの環境地図（登録済環境地図）と比較することによつて、ロボット装置 1が現在置かれている場所を同定する。図 1 7は、環境同定部 404の環境同定方法を示すフローチャートである。

まず、環境地図が入力されると、その環境地図内のランドマークの数が、例えば 2つ等、環境内のランドマークの最小設定数（mi n) より大きいか否かが判断される（ステヅプ S 2 1 ) 。入力された環境地図内のランドマーク数が最小設定数（mi n) より大きい場合（ステヅプ S 2 1 ： YE S) 、ランドマークの個数が前回と変化したか否かが判定され（ステヅプ S 22 ) 、前回とランドマ一クの個数が変化している場合（ステヅブ S 22 ： YE S) は、その環境地図を環境地図データベースに登録されている環境地図群と比較し、入力された環境地図に類似した環境地図を探す（ステップ S 23) 。そして、類似した環境地図が一つである場合（ステヅプ S 24 ： YE S) 、環境 I Dとしてステップ S 24で適合した環境地図の環境 I Dを代入する（ステヅプ S 25) 。

一方、ステップ S 24にて、類似した環境地図が 1つでない場合、類似した環境地図が複数あるか否かが判定され（ステップ S 27) 、ステップ S 27にて複数ある場合は、環境 I Dとして曖昧 mbiguous) を代入する（ステップ S 2 8 ) _t 一方、ステップ S 27にて、一致した環境地図が複数存在しない場合、即ち、類似した環境地図が一つもなかった場合には、環境 I Dとして不明（unknown) を代入する（ステップ S 29 ) 。

また、ステヅプ S 2 1において、入力された環境地図内のランドマーク数がランドマークの最小設定数（mi n ) よりも少ない場合（ステップ S 2 1 ： NO) にも、ステヅプ S 29に進み、環境 I Dとして不明（unknown) を代入する。

また、ステップ S 2 1において、入力された環境地図内のランドマーク数が最小設定数よりも大きい場合でも、ステヅプ S 22において、ランドマークの数が前回と変化していないと判定された場合（ステップ S 2 1 ： Y E S , ステヅブ S 22 ： NO) は、入力された環境地図が変化しているか否か、即ち、ランドマークの位置が変化しているか否かを判定し（ステップ S 2 6) 、変化している場合 (ステップ S 26 ： YE S) には、ステツプ S 23に進み環境地図のマッチングを行う。一方、環境地図が変化してない場合（ステップ S 26 ： NO) には、ステヅプ S 30へ進む。ステップ S 3 0では、探索行動中か否かと前回の環境 I Dが不明（unknown) であつたか否かを判断する。探索行動中が終了しており、且つ、前回の環境 I Dが不明（皿 known) であった場合（ステップ S 3 0 ： Y E S ) 、入力された環境地図に対する新しい環境 I Dと併せて環境地図データベースに登録し（ステップ S 3 1 ) 、環境 I Dには新しく登録した環境 I Dを代入する（ステヅプ S 3 2 ) 。一方、ステップ S 3 1において、探索行動中であったり、前回の環境 I Dが不明 (unknown) でなかったりした場合は、環境 I Dとして、前回の環境 I Dを代入する (ステップ S 3 3 ) 。

そして、最後に、ステヅプ S 2 5、ステップ S 2 8、ステヅプ S 2 9、ステヅプ S 3 2、又はステップ S 3 3にて代入された環境 I Dを出力する。ステヅブ S 2 1及びステップ S 2 2の条件分岐は、入力された環境地図が前回と変化していない場合に、ステップ S 2 4の環境地図のマッチング処理をする手間を省くためである。

また、ステップ S 3 0では、後述する環境探索部 4 0 5がロボット装置 1の探索行動状態の状態を管理し、環境探索部 4 0 5により、ランドマ一クの探索行動が終了した場合に立てられる探索終了フラグにより探索終了か否かを判定する。

2 - 3 - 1 . 類似性の評価方法

次に、ステヅプ S 2 4の処理において、データベースの環境地図と入力された環境地図の類似性を評価する方法について述べる。

本実施の形態においては、環境地図間の類似性を数値化するために、マハラノビス（Mahalanob i s ) 距離 Wを用いた。マハラノビス距離とは、 2つの正規分布 X： Y間の距離を下記式（2 3 ) で定義したものである。最小マハラノビス距離 Wをマヅチング誤差として使用し、この最小マハラノビス距離 Wが所定の閾値以下であるか否かにより、類似性を判定することができる。下記（2 3 ) において、 r がマハラノビス距離を示す。

r² = (X - Yj∑-'(∑ - Y) (23) ここで、二つの環境地図（MAP 1 ， MAP 2 ) を下記（ 2 4 ) , ( 2 5 ) のように表すときの 2つの環境地図間の距離（マッチング誤差） Wを上記式（ 2 3 ) により求める。

/,∑):MAP1 - · · (24) ',∑): MAP 2 . ■ · (25)

環境地図のワールド基準系の座標は、地図毎に異なるため、これらの二つの分布の間には、互いに回転、併進移動の自由度が存在する。従って、 MAP Iの座標系と、 MAP 2の座標系との回転移動（回転角）を ω、併進移動を Τとすると、 MAP 1における MAP 2は、下記式（ 2 6 ) , ( 2 7 ) と表すことができる。

∑. =∑,. +Λ(ω)∑.Λ(ω/ · · · (27)

これを、上記式（2 3 ) に代入すると、 MAP I , MAP 2間の距離（マヅチング誤差） Wは、下記式（2 8 ) となる。

- (R(o)'+r)) (28)

マツチング誤差 Wを求めるためには、最終的にはマツチング誤差 Wを最小にする回転角 ω、併進移動 Τを求める必要がある。これは、非常に困難な問題であるが、仮に、共分散値が一定である、即ち下記式（2 9 ) を仮定すると、上記式 (2 8) は下記式（ 30) で近似でき、容易に解くことができる。これにより、最小となるマハラノビス距離 Wを求め、上述のステップ S 2 3のマッチングにおけるマッチング誤差として使用し、マツチング誤差 Wが所定の閾値以下である場合に、致であると判定する。

• · - (29)

-1 S

ω = tan "

丄，

n

/— '=丄

n

( -'

- . · .（³⁰)

'

2 - 4. 環境地図記憶部（Database of Environment)

次に、環境地図記憶部 403について説明する。環境地図記憶部 40 3では、環境地図構築部 40 2が出力する環境地図に環境 I Dを割り当てて、これらをセヅトにして記憶する。環境 I Dには、図 1 8に示すように、各環境（例えば、 E nv l〜Env 3) に対して、重複しない正の整数（例えば 1〜3) を設定する, また、数字で表される環境 I Dに対して、「夕ロウの部屋」、「花子の部屋」、「トイレ」（W. C. ) 、「台所」といった環境名を付与することもできる。環境名は、ロボット装置とユーザとの対話等によって獲得する。以下にロボット装置とユーザとの対話例を示す。

対話例：

ロボット装置：「ここの名前を教えて」

ュ一ザ：「ここは、タロウの部屋、だよ」ロボット装置：「わかった。夕ロウの部屋、だね」

環境地図及び環境 I Dは、電源を切っても記憶しておく必要があるため、ロボット装置 1本体のフラッシュメモリにファイルとして保存しておき、再起動時には、このファイルを読み出すことによって、環境地図データを復元する。また、これらの環境地図は、すべてロボット装置 1が動的に獲得したものである必要はなく、ユーザが他の手段で編集、又は登録してもよい。

2 — 5 . 環境探索部（Explorat ion/Robot Contro l )

次に、環境探索部 4 0 5について説明する。環境探索部 4 0 5では、環境地図を構築するために充分なランドマークを観測するために、ロボット装置 1の行動を制御しランドマークを探すとともに、上述したように、探索行動状態を通知する。

本実施の形態における環境同定方法においては、環境内の全てのランドマ一クを観測し終わるまでは、正確な環境同定をすることが難しい場合がある。従って、何らかの方法で、環境内の全てのランドマークを観測し終わったことを知る必要がある。環境内の全てのランドマークを観測し終わったことを知る方法としては、環境内に予め配置されるランドマークの個数を設定しておき、ロボヅト装置 1が設定された個数のランドマークを観測した時点で探索を終了する方法、所定の時間内環境内をランダムに移動させて全てのランドマークを観測させ、探索を終了する方法、所定の位置で 3 6 0 ° 回転することによりランドマークを観測して探索を終了する方法、現在観測しているランドマーク位置まで移動し、その位置で 3 6 0 ° 回転し、更に、その位置から観測されるランドマーク位置まで移動し、その位置で再び 3 6 0 ° 回転するというような動作を繰り返し、全てのランドマークを回るまで観測を続け探索を終了する方法、若しくはオペレータによりロボヅト装置 1をリモートコントロールして、全てのランドマ一クを観測させ探索を終了する方法、又はこれらの方法を組み合わせる等の方法がある。

ここでは、ロボット装置 1とユーザとの対話により探索終了を知る方法、環境内のランドマークの個数を予め設定しておく方法、所定の時間内環境内をランダムに移動する方法、所定の位置で 3 6 0 ° 回転する方法、及び発見したランドマーク全てを訪問する方法の 5つの特徴的な例で実験を行った結果について説明する。

2— 5— 1 . ユーザによる指示対話

ロボヅト装置 1がユーザのリモートコントロールによる指示、又はロボヅト装置 1の意思によって環境内を動き回つている状況において、ユーザとの対話によつて、環境内のランドマークをすベて観測し終わったことを認識する。

ロボット装置 1 とユーザとの対話によるシーケンス例を以下に示す。

対話例：

ロボヅト装置：「ランドマ一クは 4つでいいの？」

ユーザ：「違うよ。ランドマークの数は、 6個だよ。」

ロボヅト装置：「じゃあと 2つだね。」

ユーザ：「そうだよ。」

ロボット装置：ランドマークを探しに行く。

ロボヅト装置：「ランドマ一クは 6つでいいの？」

ユーザ：「そうだよ。」

2 - 5 - 2 . 環境内のランドマークの数を固定した場合

ある一つの環境内に存在するランドマ一クの数 Nを固定し、ロボ'ット装置 1は N個のランドマークを発見するまでは、探索行動状態であるとする。ロボット装置 1の環境地図に含まれるランドマークの数が N個以上になった場合、探索行動状態から抜け、探索終了フラグを立てる。例えば図 1 9に示すような環境の場合、ランドマークの数が 4個に設定されているため、ロボヅト装置 1は、 4個のランドマークを発見するまでは探索行動状態であるとし、探索を続ける。

2 - 5 - 3 . 所定の時間内環境内をランダムに移動する場合

ロボット装置 1は環境内をランダムに移動し、所定の時間内で発見できるだけのランドマークを発見する。所定の時間が経過した場合、探索行動状態から抜け、探索終了フラグを立てる。例えば、図 1 9のような環境の場合、ロボット装置 1 は、所定の時間（例えば数分間）だけ探索行動を行う。なお、この所定の時間としては、環境の広さやランドマークの数等を考慮して設定することが好ましい。

2 - 5 - 4 . 所定の位置で 3 6 0 ° 回転する場合

ロボット装置 1は所定の位置（例えば環境の中央付近）で 3 6 0 ° 回転し、ランドマ一クを観測して探索を終了する。例えば図 1 9に示すような環境の場合/ ロボヅト装置 1は、所定の位置で 3 6 0 ° 回転し、観測可能なランドマーク L 2 0〜L 2 2を発見した時点で探索行動を終了する。なお、図 1 9の場合、ロボット装置 1は、ランドマーク L 2 3を発見することができない。

2— 5— 5 . ランドマーク探索行動

環境内のランドマークを可能な限り発見するために、発見した全てのランドマ —クを訪問して歩いていく。先ず、環境内のある地点からスタートし、ランダムに歩き回り、そこで周りを 3 6 0度見渡す。そこで発見,したランドマークを訪問待ち行列とする。次に、訪問待ち行列から一つを選んで、そのランドマークまで歩いていき、ランドマークに到達したら訪問待ち行列からそのランドマークを削除し、ランドマーク付近で周りを全て見渡し、新しいランドマークを発見する。新しく発見されたランドマークは、訪問待ち行列に追加する。これを繰り返して、訪問待ち行列が空になるまでランドマークを訪問して歩く。他のどのランドマークからも観測不可能なランドマークがない場合は、このような戦略で環境内の全てのランドマークを発見することができる。例えば図 1 9に示すような環境の場合、先ず、周りを 3 6 0 ° 見渡して発見できるランドマーク L 2 0〜L 2 2が訪問待ち行列となり、訪問待ち行列から一つを選んで、そのランドマークまで歩いていく。そして、ランドマーク L 2 2の付近で周りを見渡すことで新たなランドマーク L 2 3を発見し、訪問待ち行列に追加する。

本実施の形態においては、ロボット装置 1は、形状及び/又は色等により異なる複数の人工的なランドマークが存在する一意に特定可能な環境内のランドマークを認識するランドマークセンサ（ランドマーク認識手段）、及びこのランドマークセンサによって獲得したランドマーク情報を記憶する記憶手段、ロボット装置 1 自身の行動を記憶する行動記憶手段を有しており、ランドマークセンサと行動記憶装置とから幾何的な環境地図を構築することができる。

また、ロボット装置 1は、ランドマークの観測に基づき構築した現在の環境地図 Nと、環境地図記憶部 4 0 3に記憶された既知の環境地図群とを比較することによって、ロボヅト装置 1が現在置かれている環境を同定することができる。既知の環境地図は、ユーザが作成して環境地図記憶部 4 0 3に供給してもよいし、ロボット装置 1自身によって学習されたものであってもよい。即知の環境地図は個々のランドマークの位置（X , y ) を有しており、環境地図の比較は、現在観測している現在の環境地図におけるランドマークの位置と、既知の環境地図におけるランドマークの位置とを比較し、それらの類似性を評価することにより行うことができる。

更に、ロボット装置 1は、環境探索部 4 0 5により、環境を探索し、探索が終了したことを告げるロボット制御手法により環境地図を構築し、この環境地図と、記憶装置に保存されている環境地図との類似度を出力して、類似度がある閾値を超えた環境地図の環境 I Dを出力することにより環境を同定すると共に、探索が終了し、データベースに類似する環境地図がない場合には、新しい環境地図と環境 I Dを環境地図記憶部 4 0 3に追加することができる。

更にまた、このように、一意に特定可能な複数に分割した環境地図を有することによって、ロボット装置 1が物理的に離れた複数の環境（例えば、物理的に距離が離れた場所にある部屋 Aと部屋; B ) を素早く識別することができ、環境全てを大きな環境地図によって保持する手法に比べて、計算負荷が少なく、ランドマーク又はロボット装置の動きを観測した際の、環境地図の更新時の計算 gも少なくてよい。更に、物理的に離れた場所にある場所 Aと場所 Bを違う環境地図 M a A , M a p Bとして記憶するため、それらの場所の相対的な位置関係には関知しなくてよい。また、全てのランドマークを認識しなくても、ある程度の情報から現在の環境を同定することができる。このように、各環境毎に一つの環境地図を構築し、記憶手段に登録された環境地図群との比較をダイナミックに行うことにより、素早く、現在の環境を同定することができ、各々の環境での自己位置同定を行うことができる。

3 . ロボット装置の詳細

3 — 1 . ソフトウェア

.次に、上述した図 4に示したロボット装置 1が行動を決定するためのソフトゥヱァの構成及び動作について詳細に説明する。図 2 0は、図 4に示すソフトゥェァ 3 0 0の動作を示すフローチヤ一トである。

図 4に示すソフトウエア 3 0 0のキネマティヅクオドメトリ K I N E 3 1 0には、上述したように、画像データ 3 0 1及びセンサデータ 3 0 2が入力される。この画像データ 3 0 1は、カラ一画像及びステレオカメラによる視差画像である ₍ また、センサデ一夕は、ロボット装置 1の関節角等のデータである。キネマティヅクオドメトリ K I N E 3 1 0は、これらの入力データ 3 0 1 , 3 0 2を受け取り、メモリに格納されていたそれまでの画像及びセンサデ一夕を更新する（ステヅプ S 1 0 1 ) 。

次に、これら画像データ 3 0 1 とセンサデータ 3 0 2 との時間的な対応を取る (ステップ S 1 0 2— 1 ) 。即ち、画像デ一夕 3 0 1の画像が撮像された時間におけるセンサデータ 3 0 2の関節角を割り出す。次いで、この関節角のデータを使用してロボツト装置 1が中心に固定されたロボット中心座標系を頭部ュニットに設けられたカメラの座標系へ変換する（ステツプ S 1 ◦ 2— 2 ) 。この場合、本実施の形態においては、ロボット中心座標系からカメラ座標系の同時変換行列等を導出し、この同時変換行列 3 1 1 とこれに対応する画像データとを画像認識を行うオブジェクトへ送信する。即ち、同時変換行列 3 1 1及びこれに対応する視差画像 3 1 2を平面抽出部 P L E X 3 2 0へ出力し、同時変換行列 3 1 1及びカラ一画像 3 1 3をランドマークセンサ部 C L S 3 4 0へ出力する。

また、センサデータ 3 0 2から得られる歩行パラメ一夕と、足底センサを使用した歩数のカウント数とからロボット装置 1の移動量を算出し、ロボット装置 1 のロボット中心座標系における移動量を算出する。以下、ロボット中心座標系の移動量をォドメトリともいう。このォドメトリ 3 1 4を障害物グリッド算出部 0 G 3 3 0及び絶対座標算出部 L Z 3 5 0へ出力する。

平面抽出部 P L E X 3 2 0は、キネマティックオドメトリ K I N E 3 1 ◦にて算出された同時変換行列 3 1 1 と、これに対応するステレオカメラから得られる視差画像 3 1 2 とが入力されると、それまでメモリに格納されていたこれらのデ一夕を更新する (ステップ S 1 0 3 ) そして、ステレオカメラのキヤリブレーションパラメ一夕等を使用して視差画像 3 1 2から 3次元の位置データ（レンジデ一夕）を算出する（ステヅプ S 1 0 4 - 1 ) 。次いで、このレンジデータからハフ変換等を使用して、例えば壁及びテーブル等の平面を除く平面を平面として抽出する。また、座標変換行列 3 1 1からロボヅト装置 1の足底が接地している平面との対応を取り、床面を選択し、床面上にない点、例えば所定の閾値よりも高い位置にあるもの等を障害物として床面からの距離を算出し、この障害物情報 (obstacle) 32 1を障害物グリッド算出部 330に出力する（ステヅプ S 1 0 4一 2 ) 。

障害物グリッド算出部〇 G 330では、上述したように、キネマティックォドメトリ K I NE 3 1 0にて算出されたォドメトリ 3 14と、平面抽出部 P LEX 320にて算出された障害物の観測情報（障害物情報） 32 1とが入力されると、メモリに格納されていたそれまでのデ一夕を更新する（ステップ S 1 05) 。そして、床面上に障害物があるか否かの確率を保持する障害物グリツドを確率的手法により更新する（ステップ S 10 6 ) 。

この障害物グリッド算出部 OG 330は、ロボット装置 1を中心とした例えば周囲 4mの障害物情報（環境地図）と、口ポット装置 1の向く方角を示す姿勢情報とを保持しており、確率的手法により環境地図を更新し、この更新した認識結果（障害物情報 33 1 ) を出力することにより、上位レイヤ、即ち、本実施の形態においては、経路計画決定部 SB L 360にて障害物を回避する計画を作成することができる。

ランドマークセンサ部 CL S 340は、キネマティヅクオドメトリ K I NE 3 1 0から同時変換行列 3 1 1及びカラー画像 3 1 3が入力されると、予めメモリ内に格納されていたこれらのデ一夕を更新する（ステップ S 1 07) 。そして、カラー画像 3 1 3の画像処理を行って、予め認識しているカラーランドマ一クを検出する。このカラ一ランドマ一クのカラー画像 3 1 3上での位置及び大きさをカメラ座標系での位置に変換する。更に、同時変換行列 3 1 1を使用し、カラーランドマークのカメラ座標系での位置をロボット中心座標系における位置に変換し、ロボット中心座標系におけるカラ一ランドマーク位置の情報（カラーランドマーク相対位置情報） 34 1を絶対座標算出部 L Z 350に出力する（ステップ S 1 08 ) 。

絶対座標算出部 L Z 350は、キネマティヅクオドメトリ K I NE 3 1 0からのォドメトリ 3 14と、ランドマークセンサ部 C L S 340からのカラ一ランドマーク相対位置情報 34 1とが入力されると、予めメモリ内に格納されていたこれらのデータが更新される（ステップ S 1 0 9 ) 。そして、絶対座標算出部 L Z 3 5 0が予め認識しているカラーランドマークの絶対座標（ワールド座標系での位置）、カラーランドマーク相対位置情報 3 4 1、及びォドメトリ 3 1 4を使用し、確率的手法によりロボット装置 1の絶対座標（ワールド座標系での位置）を算出する。そして、この絶対座標位置 3 5 1を経路計画決定部 S B L 3 6 0に出力する。

経路計画決定部 S B L 3 6 0は、障害物グリッド算出部 O G 3 3 0から障害物グリッド情報 3 3 1が入力され、絶対座標算出部 L Z 3 5 ◦から絶対座標位置 3 5 1が入力されると、予めメモリに格納されていたこれらのデータが更新される (ステップ S 1 1 1 ) 。そして、経路計画決定部 S B L 3 6 0は、障害物グリヅド算出部 0 G 3 3 0からの障害物情報 3 3 1により、ロボヅト装置 1の周囲に存在する障害物に関する認識結果を取得し、絶対座標算出部 L Z 3 5 0から現在のロボット装置 1の絶対座標を取得することにより、絶対座標系又はロボット装置中心のロボット中心座標系で与えられた目標地点に対して障害物に衝突せずに歩行可能な経路を生成し、経路に応じて経路を遂行する動作コマンドを発行'する。即ち、入力データから状況に応じてロボヅト装置 1が取るべき行動を決定し、その行動列を出力する（ステップ S 1 1 2 ) 。

また、人間によるナビゲーシヨンの場合には、障害物グリッド算出部 O G 3 3 0からロボット装置の周囲に存在する障害物に関する認識結果及び絶対座標算出部 L Z 3 5 0からの現在のロボット装置 1の位置の絶対座標をユーザに提供し、このユーザからの入力に応じて動作コマンドを発行させる。

図 2 1は、上述のソフトウエアに入力されるデータの流れを模式的に示す図である。なお、図 2 1において、図 3及び図 4に示す構成と同一構成要素には同一符号を伏してその詳細な説明は省略する。

顔検出部 F D T ( F a c e D e t e c t o r ) 3 7 1は、画像フレーム中から顔領域を検出するォブジェクトであり、カメラ等の画像入力装置からカラ一画像 2 0 2を受け取り、それを例えば 9段階のスケール画像に縮小変換する。この全ての画像の中から顔に相当する矩形領域を探索する。重なりあった候補領域を削減して最終的に顔と判断された領域に関する位置、大きさ、及び特徴量等の情報 372を出力して、顔識別部 F I (F a c e l d e nt i f y) 377へ送る。顔識別部 F I 377は、検出された顔画像を識別するォブジヱクトであり、顔の領域を示す矩形領域画像からなる情報 372を顔検出部 FDT 37 1から受け取り、この顔画像がメモリに格納されている手持ちの人物辞書のうちでどの人物に相当するかを比較して人物の識別を行う。そして、顔検出部 EDT 37 1から受け取った顔画像の顔画像領域の位置、大きさ情報と共に人物の I D情報 378 を D I L 379に出力する。

色認識部 M CT (Mu l t i C o l o r Tr a cke r) 373は、色認識を行うオブジェクトであり、カメラ等の画像入力装置からカラー画像 2 02を受け取り、予め保有している複数のカラ一 ·モデル情報に基づいて色領域を抽出し、連続した領域に分割する。色認識部 MCT 373は、分割した各領域の位置、大きさ及び特徴量等の情報 374を距離情報付加部 D I L (D i s t anc e l n f o rmat i onL i nke r) 379に出力する。

動き検出部 MD T (Mo t i onD e t e c t o r) 375は、画像の中で動いている部分を検出するォブジェクトであり、検出した動き領域の情報 376を挙値情報付加部 D I L 379に出力する。

距離情報付加部 D I L 379は、入力された 2次元の情報に距離情報を付加して 3次元の情報を出力するオブジェクトであり、顔検出部 F I 377からの I D 情報 378、色認識部 MC T 373からの分割した各領域の位置、大きさ及び特徴量等の情報 374並びに動き検出部 MD T 375からの動き領域の情報 376 に距離情報を付加して 3次元情報 380を短期記憶部 STM (Sho r t T e r ιηΜ Θ m o r y) 38 1に出力する。

短期記憶部 S TM 38 1は、ロボット装置 1の外部環境に関する情報を比較的短い時間だけ保持するオブジェクトであり、 Ar t hurD e c o d e r (図示せず）から音声認識結果（単語、音源方向、確信度）を受け取り、色認識部 MC T 373から肌色の領域の位置、大きさと顔領域の位置、大きさを受け取り、顔識別部 F I 377から人物の I D情報等を受け取る。また、ロボヅト装置 1の機体上の各センサからロボット装置の首の方向（関節角）を受け取る。そして、これらの認識結果及びセンサ出力を統合的に使って、現在どこにどの人物がいて、しゃべった言葉がどの人物のものであり、その人物とはこれまでにどんな対話を行ったのかという情報を保存する。こうした物体、即ちターゲットに関する物理情報と時間方向でみたイベント（履歴）を出力として、経路計画決定部（状況依存行動階層）（S B L ) 3 6◦等の上位モジュールに渡す。

経路計画決定部 S B Lは、上述の短期記憶部 S T M 3 8 1からの情報を基に口ボット装置 1の行動（状況に依存した行動）を決定するオブジェクトである。複数の行動を同時に評価したり、実行したりすることができる。また、行動を切り替えて機体をスリーブ状態にしておき、別の行動を起動することができる。

3 - 2 . ロボット装置の構成

以下、本発明の実施の形態における上述した環境同定装置を搭載した図 1に示すような 2足歩行タイプのロボット装置について詳細に説明する。この人間型のロボット装置は、住環境その他の日常生活上の様々な場面における人的活動を支援する実用ロボットであり、内部状態（怒り、悲しみ、喜び、楽しみ等）に応じて行動できるほか、人間が行う基本的な動作を表出できるエンターティンメントロボヅトである。

上述したように、図 1に示すロボット装置 1は、体幹部ュニット 2の所定の位置に頭部ュニヅト 3が連結されると共に、左右 2つの腕部ュニット 4 R / Lと、左右 2つの脚部ュニット 5 R / Lが連結されて構成されている。

このロボット装置 1が具備する関節自由度構成を図 2 2に模式的に示す。頭部ユニット 3を支持する首関節は、首関節ョ一軸 1 0 1と、首関節ピッチ軸 1 0 2 と、首関節ロール軸 1 0 3という 3自由度を有している。

また、上肢を構成する各々の腕部ュニヅト 4 R / Lは、肩関節ピッチ軸 1 0 7 と、肩関節ロール軸 1 0 8と、上腕ョー軸 1 0 9と、肘関節ピヅチ軸 1 1 0と、前腕ョー軸 1 1 1と、手首関節ピヅチ軸 1 1 2と、手首関節ロール輪 1 1 3と、手部 1 1 4とで構成される。手部 1 1 4は、実際には、複数本の指を含む多関節 •多自由度構造体である。ただし、手部 1 1 4の動作は、ロボット装置 1の姿勢制御や歩行制御に対する寄与や影響が少ないので、本明細書ではゼロ自由度と仮定する。したがって、各腕部は 7自由度を有するとする。

また、体幹部ュニット 2は、体幹ピッチ軸 1 0 4と、体幹ロール軸 1 0 5と、体幹ョー軸 1 0 6という 3自由度を有する。

また、下肢を構成する各々の脚部ュニヅト 5 R / Lは、股関節ョー軸 1 1 5と、股関節ピヅチ軸 1 1 6と、股関節口一ル軸 1 1 7と、膝関節ピヅチ軸 1 1 8と、足首関節ピヅチ軸 1 1 9と、足首関節ロール軸 1 2 0と、足部 1 2 1とで構成される。本明細書中では、股関節ピヅチ軸 1 1 6と股関節ロール軸 1 1 7の交点は、ロボット装置 1の股関節位置を定義する。人体の足部 1 2 1は、実際には多関節，多自由度の足底を含んだ構造体であるが、ロボット装置 1の足底は、ゼロ自由度とする。したがって、各脚部は、 6自由度で構成される。

以上を総括すれば、ロボ、ト装置 1全体としては、合計で 3 + 7 x 2 + 3 + 6 X 2 = 3 2自由度を有することになる。ただし、エンターテインメント向けの口ボット装置 1が必ずしも 3 2自由度に限定されるわけではない。設計 ·制作上の制約条件や要求仕様等に応じて、自由度、即ち関節数を適宜増減することができることはいうまでもない。

上述したようなロボット装置 1がもつ各自由度は、実際にはァクチユエ一タを用いて実装される。外観上で余分な膨らみを排してヒ卜の自然体形状に近似させること、 2足歩行という不安定構造体に対して姿勢制御を行うことなどの要請から、ァクチユエ一夕は小型且つ軽量であることが好ましい。

図 2 3には、ロボット装置 1の制御システム構成を模式的に示している。同図に示すように、ロボット装置 1は、ヒトの四肢を表現した体幹部ユニット 2，頭部ュニヅト 3，腕部ュニヅト 4 R / L，脚部ュニヅト 5 R / Lと、各ュニヅト間の協調動作を実現するための適応制御を行う制御ュニット 1 0とで構成される。ロボヅト装置 1全体の動作は、制御ュニヅト 1 0によって統括的に制御される。制御ュニヅト 1 0は、 C P U (Central Processing Unit) や、 D R A M、フラヅシュ R O M等の主要回路コンポーネント（図示しない）で構成される主制御部 1 1と、電源回路やロボット装置 1の各構成要素とのデータゃコマンドの授受を行うイン夕一フェイス（何れも図示しない）などを含んだ周辺回路 1 2とで構成される。

本発明を実現するうえで、この制御ユニット 1 0の設置場所は、特に限定されない。図 2 3では体幹部ユニット 2に搭載されているが、頭部ユニット 3に搭載してもよい。あるいは、ロボヅト装置 1外に制御ユニット 1 0を配備して、ロボヅト装置 1の機体とは有線又は無線で信するようにしてもよい。

図 2 2に示したロボット装置 1内の各関節自由度は、それそれに対応するァクチユエ一夕によって実現される。即ち、頭部ュニヅト 3には、首関節ョー軸 1 0

I、首関節ピッチ軸 1 02、首関節ロール軸 1 0 3の各々を表現する首関節ョー軸ァクチユエ一夕 A₂、首関節ピッチ軸ァクチユエ一夕 A₃、首関節ロール軸ァクチユエ一夕 A ₄が配設されている。

また、頭部ュニヅト 3には、外部の状況を撮像するための C CD (Charge Cou pled Device) カメラが設けられているほか、前方に位置する物体までの距離を測定するための距離センサ、外部音を集音するためのマイク、音声を出力するためのスピーカ、ユーザからの「撫でる」や「叩く」といった物理的な働きかけにより受けた圧力を検出するためのタツチセンサ等が配設されている。

また、体幹部ュニヅト 2には、体幹ピヅチ軸 1 04、体幹ロール軸 1 0 5、体幹ョ一軸 1 06の各々を表現する体幹ピヅチ軸ァクチユエ一夕 A₅、体幹ロール軸ァクチユエ一夕 A₆、体幹ョー軸ァクチユエ一夕 A₇が配設されている。また、体幹部ュニヅト 2には、このロボヅト装置 1の起動電源となるバヅテリを備えている。このバヅテリは、充放電可能な電池によって構成されている。

また、腕部ュニヅト 4 R/Lは、上腕ュニヅト 4 !R/Lと、肘関節ュニット 4 ₂R/Lと、前腕ュニヅト 4₃R/Lに細分化されるが、肩関節ピッチ軸 1 07、肩関節口ール軸 1 0 8、上腕ョー軸 1 09、肘関節ピツチ軸 1 1 0、前腕ョー軸 1

I I、手首関節ピッチ軸 1 1 2、手首関節ロール軸 1 1 3の各々表現する肩関節ピヅチ軸ァクチユエ一夕 A₈、肩関節ロール軸ァクチユエ一夕 A₉、上腕ョー軸ァクチユエ一夕 Ai。、肘関節ピッチ軸ァクチユエ一夕 A _u、肘関節ロール軸ァクチユエ一、手首関節ピッチ軸ァクチユエ一夕 A₁₃、手首関節ロール軸ァクチユエ一夕 A ₁₄が配備されている。

また、脚部ュニヅト 5 R/Lは、大腿部ュニヅト 5 iR/Lと、膝ュニヅト 5₂R /Lと、脛部ユニット 5₃R/Lに細分化されるが、股関節ョー軸 1 1 5、股関節ピヅチ軸 1 1 6、股関節ロール軸 1 1 7、膝関節ピヅチ軸 1 1 8、足首関節ピッチ軸 1 1 9、足首関節ロール軸 1 2 0の各々を表現する股関節ョ一軸ァクチユエ一夕 A₁₆、股関節ピッチ軸ァクチユエ一夕 A ₁₇、股関節口一ル軸ァクチユエ一夕 A ₁₈、膝関節ピッチ軸ァクチユエ一夕 A₁₃、足首関節ピッチ軸ァクチユエ一夕 A₂₀、足首関節口ール軸ァクチユエ一夕 A ₂₁が配備されている。各関節に用いられるァクチユエ一夕 Α₂， Α₃···は、より好ましくは、ギア直結型で且つサーボ制御系をヮンチヅプ化してモー夕 ·ュニヅト内に搭載したタイプの小型 ACサーボ ·ァクチユエ一夕で構成することができる。 · 体幹部ユニット 2、頭部ユニット 3、各腕部ユニット 4R/L、各脚部ュニヅト 5 R/Lなどの各機構ュニット毎に、ァクチユエ一夕駆動制御部の副制御部 2 0 , 2 1 , 22 R/L , 23 R/Lが配備されている。さらに、各脚部ユニット 5 R/Lの足底が着床したか否かを検出する接地確認センサ 30 R/Lを装着するとともに、体幹部ュニヅト 2内には、姿勢を計測する姿勢センサ 3 1を装備している。

接地確認センサ 30 RZLは、例えば足底に設置された近接センサ又はマイク口 ·スイッチなどで構成される。また、姿勢センサ 3 1は、例えば、加速度センザとジャイロ ·センサの組み合わせによって構成される。

接地確認センサ 30 RZLの出力によって、歩行 ·走行などの動作期間中において、左右の各脚部が現在立脚又は遊脚何れの状態であるかを判別することができる。また、姿勢センサ 3 1の出力により、体幹部分の傾きや姿勢を検出することができる。

主制御部 1 1は、各センサ 30 R/L， 3 1の出力に応答して制御目標をダィナミヅクに補正することができる。より具体的には、副制御部 20， 2 1 , 22 R/L , 23 R/Lの各々に対して適応的な制御を行い、ロボヅト装置 1の上肢、体幹、及び下肢が協調して駆動する全身運動パターンを実現できる。

ロボヅト装置 1の機体上での全身運動は、足部運動、 ZMP (Zero Moment Po int) 軌道、体幹運動、上肢運動、腰部高さなどを設定するとともに、これらの設定内容にしたがった動作を指示するコマンドを各副制御部 20， 2 1， 22 R/ L， 23 R/Lに転送する。そして、各々の副制御部 20， 2 1 , · · '等では、主制御部 1 1からの受信コマンドを解釈して、各ァクチユエ一夕 A₂, A₃ · · '等に対して駆動制御信号を出力する。ここでいう「ZMP」とは、歩行中の床反力によるモーメントがゼロとなる床面上の点のことであり、また、「ZMP軌道」とは、例えばロボット装置 1の歩行動作期間中に ZMPが動く軌跡を意味する。なお、 ZMPの概念並びに ZMPを歩行ロボヅトの安定度判別規範に適用する点については、 Miomir Vukobratovic著 "LEGGED LOCOMOTION ROBOTS" (加藤一郎外著『歩行ロボットと人工の足』（日刊工業新聞社））に記載されている。

以上のように、ロボット装置 1は、各々の副制御部 20 , 2 1 , · · '等が、主制御部 1 1からの受信コマンドを解釈して、各ァクチユエ一夕 A ₂， A₃ - · ' に対して駆動制御信号を出力し、各ユニットの'駆動を制御している。これにより、ロボット装置 1は、目標の姿勢に安定して遷移し、安定した姿勢で歩行できる。また、ロボヅト装置 1における制御ュニヅト 1 0では、上述したような姿勢制御のほかに、加速度センサ、夕ツチセンサ、接地確認センサ等の各種センサ、及び C CDカメラからの画像情報、マイクからの音声情報等を統括して処理している。制御ユニット 1 0では、図示しないが加速度センサ、ジャイロ 'センサ、夕ツチセンサ、距離センサ、マイク、スピーカなどの各種センサ、各ァクチユエ一夕、 C CDカメラ及びバヅテリが各々対応するハブを介して主制御部 1 1と接続されている。

主制御部 1 1は、上述の各センサから供給されるセンサデ一夕や画像デ一夕及び音声データを順次取り込み、これらをそれぞれ内部ィンターフヱイスを介して D RAM内の所定位置に順次格納する。また、主制御部 1 1は、バッテリから供給されるバッテリ残量を表すバッテリ残量データを順次取り込み、これを D R A M内の所定位置に格納する。 D RAMに格納された各センサデータ、画像デ一夕、音声データ及びバッテリ残量データは、主制御部 1 1がこのロボット装置 1の動作制御を行う際に利用される。

主制御部 1 1は、ロボット装置 1の電源が投入された初期時、制御プログラムを読み出し、これを DRAMに格納する。また、主制御部 1 1は、上述のように主制御部 1 1より D RAMに順次格納される各センサデータ、画像データ、音声データ及びバッテリ残量デ一夕に基づいて自己及び周囲の状況や、ユーザからの指示及び働きかけの有無などを判断する。

さらに、主制御部 1 1は、この判断結果及び DRAMに格納した制御プログラムに基づいて自己の状況に応じて行動を決定するとともに、当該決定結果に基づいて必要なァクチユエ一夕を駆動させることによりロボット装置 1に、いわゆる「身振り」、「手振り」といった行動をとらせる。

このようにしてロボット装置 1は、制御プログラムに基づいて自己及び周囲の状況を判断し、ユーザからの指示及び働きかけに応じて自律的に行動できる。 • ところで、このロボット装置 1は、内部状態に応じて自律的に行動することができる。上述の図 4、図 2 0及び図 2 1に示したソフトウェアは、主にロボヅト装置 1 が自律的に経路を生成するためのものである。以下では、ロボット装置 1 における制御プログラム全体のソフトウエア構成例について、図 2 4乃至図 2 9 を用いて説明する。なお、この制御プログラムは、予め、ロボヅト装置 1内に設けられたフラッシュ R◦ Mに格納されており、ロボット装置 1の電源投入初期時において読み出される。

図 2 4において、デバイス ' ドライノ ' ' レイヤ 4 0は、制御プログラムの最下位層に位置し、複数のデバイス ' ドライバからなるデバイス ' ドライノ ' · セヅト 4 1から構成されている。この場合、各デバイス ' ドライノは、 C C Dカメラやタィマ等の通常のコンピュ一夕で用いられるハードウェアに直接アクセスすることを許されたオブジェクトであり、対応するハードウエアからの割り込みを受けて処理を行う。

また、ロボティヅク ' サーバ ' オブジェクト 4 2は、デバイス · ドライノ ' レィャ 4 0の最下位層に位置し、例えば上述の各種センサゃァクチユエ一夕 2 8 i〜

2 8 _n等のハ一ドウエアにアクセスするためのィンターフェイスを提供するソフトウェア群でなるバーチャル · ロボット 4 3 と、電源の切換えなどを管理するソフトウエア群でなるパワーマネージャ 4 4と、他の種々のデバイス ' ドライバを管理するソフトウェア群でなるデバイス ' ドライノ、 · マネージャ 4 5 と、ロボット装置 1の機構を管理するソフトウヱァ群でなるデザィンド ' ロボット 4 6とから構成されている。

マネージャ . オブジェクト 4 7は、ォブジェクト · マネージャ 4 8及びサ一ビス · マネージャ 4 9から構成されている。オブジェクト · マネージャ 4 8は、口ボティヅク . サーバ · オブジェクト 4 2、ミドル ' ウェア ' レイヤ 5 0、及びァプリケ一シヨン . レイヤ 5 1に含まれる各ソフトウエア群の起動や終了を管理するソフトウェア群であり、サービス . マネージャ 4 9は、メモリカードに格納されたコネクションフアイルに記述されている各ォブジェクト間の接続情報に基づいて各ォブジェクトの接続を管理するソフトウエア群である。

ミドル . ウェア · レイヤ 5 0は、ロボティヅク · サーバ 'オブジェクト 4 2の上位層に位置し、画像処理や音声処理などのこのロボット装置 1の基本的な機能を提供するソフトウェア群から構成されている。また、アプリケーション ' レイャ 5 1は、ミドル . ウェア · レイヤ 5 0の上位層に位置し、当該ミドル · ウェア • レイヤ 5 0を構成する各ソフトウエア群によって処理された処理結果に基づいてロボット装置 1の行動を決定するためのソフトウエア群から構成されている。なお、ミドル · ウェア · レイヤ 5 0及びアプリケ一シヨン ' レイヤ 5 1の具体的なソフトウェア構成をそれそれ図 2 5に示す。

ミドル - ゥヱァ · レイヤ 5 0は、図 2 5に示すように、騒音検出用、温度検出用、明るさ検出用、音階認識用、距離検出用、姿勢検出用、夕ツチセンサ用、動き検出用及び色認識用の各信号処理モジュール 6 0〜 6 8並びに入力セマンティクスコンバータモジュール 6 9などを有する認識系 Ί 0と、出力セマンティクスコンバータモジュール 7 8並びに姿勢管理用、トラヅキング用、モーション再生用、歩行用、転倒復帰用、 L E D点灯用及び音再生用の各信号処理モジュール 7 1〜 7 7などを有する出力系 7 9とから構成されている。

認識系 Ί 0の各信号処理モジュール 6 0〜 6 8は、ロボティ'ック 'サーバ ·ォブジェクト 4 2のバーチャル · ロボヅト 4 3により D R A Mから読み出される各センサデータや画像データ及び音声データのうちの対応するデータを取り込み、当該データに基づいて所定の処理を施して、処理結果を入力セマンティクスコンバ一夕モジュール 6 9に与える。ここで、例えば、バーチャル · ロボット 4 3は、所定の通信規約によって、信号の授受或いは変換をする部分として構成されている。

入力セマンティクスコンバータモジュール 6 9は、これら各信号処理モジユール 6 0 ~ 6 8から与えられる処理結果に基づいて、「うるさい」、「暑い」、「明るい」、「ボールを検出した」、「転倒を検出した」、「撫でられた」、「叩かれた」、「ドミソの音階が閬こえた」、「動く物体を検出した」又は「障害物を検出した」などの自己及び周囲の状況や、ユーザからの指令及び働きかけを認識し、認識結果をアプリケーション · レイヤ 41に出力する。

アプリケーシヨン · レイヤ 5 1は、図 2 6に示すように、行動モデルライブラリ 80、行動切換モジュール 8 1、学習モジュール 82、感情モデル 8 3及び本能モデル 84の 5つのモジュールから構成されている。

行動モデルライブラリ 8 0には、図 2 7に示すように、「バヅテリ残量が少なくなつた場合」、「転倒復帰する」、「障害物を回避する場合」、「感情を表現する場合」、「ボールを検出した場合」などの予め選択されたいくつかの条件項目にそれそれ対応させて、それぞれ独立した行動モデルが設けられている。

そして、これら行動モデルは、それぞれ入力セマンティクスコンバータモジュール 6 9から認識結果が与えられたときや、最後の認識結果が与えられてから一定時間が経過したときなどに、必要に応じて後述のように感情モデル 8 3に保持されている対応する情動のパラメ一夕値や、本能モデル 84に保持されている対応する欲求のパラメ一夕値を参照しながら続く行動をそれそれ決定し、決定結果を行動切換モジュール 8 1に出力する。

なお、この実施の形態の場合、各行動モデルは、次の行動を決定する手法として、図 2 8に示すような 1つのノード（状態） NODE。〜NODE_nから他のどのノード N 0 D E。〜 N 0 D E _nに遷移するかを各ノード N 0 D E。〜 N 0 D E _nに間を接続するアーク AR C i〜AR C_nlに対してそれそれ設定された遷移確率 P 〜卩。に基づいて確率的に決定する有限確率オートマトンと呼ばれるァルゴリズムを用いる。

具体的に、各行動モデルは、それそれ自己の行動モデルを形成するノード NO D E。〜N〇 D E _nにそれそれ対応させて、これらノード NOD E。〜 NODE _n毎に図 2 9に示すような状態遷移表 9 0を有している。

この状態遷移表 9 0では、そのノード NODE。~NODE_nにおいて遷移条件とする入力イベント（認識結果）が「入力イベント名」の列に優先順に列記され、その遷移条件についてのさらなる条件が「データ名」及び「データ範囲」の列における対応する行に記述されている。したがって、図 29の状態遷移表 9 0で表されるノード NODE 。。では、「ボールを検出（BA L L) 」という認識結果が与えられた場合に、当該認識結果とともに与えられるそのボールの「大きさ（SIZE) 」が「0から 1000」の範囲であることや、「障害物を検出（OBSTACLE) 」という認識結果が与えられた場合に、当該認識結果とともに与えられるその障害物までの「距離（DISTANCE) 」が「0から 100」の範囲であることが他のノードに遷移するための条件となっている。

また、このノード NOD E！。。では、認識結果の入力がない場合においても、行動モデルが周期的に参照する感情モデル 83及び本能モデル 84にそれぞれ保持された各情動及び各欲求のパラメータ値のうち、感情モデル 8 3に保持された「喜び（Joy) 」、「驚き（Surprise) 」又は「悲しみ（Sadness) 」の何れかのパラメータ値が「50から 100」の範囲であるときには他のノードに遷移することができるようになつている。

また、状態遷移表 9 0では、「他のノードへの遷移確率」の欄における「遷移 ' 先ノード」の行にそのノード N 0 D E。〜 N 0 D E _nから遷移できるノード名が列記されているとともに、「入力イベント名」、「データ名」及び「データの範囲」の列に記述された全ての条件が揃ったときに遷移できる他の各ノード NOD E。〜 NOD E_nへの遷移確率が「他のノードへの遷移確率」の欄内の対応する箇所にそれそれ記述され、そのノード N 0 D E。〜NO D E _nに遷移する際に出力すべき行動が「他のノードへの遷移確率」の欄における「出力行動」の行に記述されている。なお、「他のノードへの遷移確率」の欄における各行の確率の和は 1 0 0 [%] となっている。

したがって、図 29の状態遷移表 9 0で表されるノード NODE i。。では、例えば「ボールを検出（BAL L) 」し、そのボールの「S I Z E (大きさ）」が「0から 1000」の範囲であるという認識結果が与えられた場合には、「30 [%] 」の確率で「ノード NO D E ₁₂。（node 120) 」に遷移でき、そのとき「 ACT I O N l」の行動が出力されることとなる。

各行動モデルは、それそれこのような状態遷移表 90として記述されたノ一ド NODE。〜 NO DE_nが幾つも繋がるようにして構成されており、入力セマンティクスコンバ一夕モジュール 6 9から認識結果が与えられたときなどに、対応するノード N O D E。〜N O D E _nの状態遷移表を利用して確率的に次の行動を決定し. 決定結果を行動切換モジュール 8 1に出力するようになされている。

図 2 7に示す行動切換モジュール 8 1は、行動モデルライブラリ 8 0の各行動モデルからそれぞれ出力される行動のうち、予め定められた優先順位の高い行動モデルから出力された行動を選択し、当該行動を実行すべき旨のコマンド（以下、行動コマンドという。）をミドル ' ウェア ' レイヤ 5 0の出力セマンティクスコンバ一夕モジュール 7 8に送出する。なお、この実施の形態においては、図 2 7 において下側に表記された行動モデルほど優先順位が高く設定されている。

また、行動切換モジュール 8 1は、行動完了後に出力セマンティクスコンパ'一夕モジュ一ル 7 8から与えられる行動完了情報に基づいて、その行動が完了したことを学習モジュール 8 2、感情モデル 8 3及び本能モデル 8 4に通知する。

一方、学習モジュール 8 2は、入力セマンティクスコンバータモジュ一ル 6 9 から与えられる認識結果のうち、「叩かれた」や「撫でられた」など、ユーザからの働きかけとして受けた教示の認識結果を入力する。

そして、学習モジュール 8 2は、この認識結果及び行動切換えモジュール 7 1 からの通知に基づいて、「叩かれた（叱られた）」ときにはその行動の発現確率を低下させ、「撫でられた（誉められた） j ときにはその行動の発現確率を上昇させるように、行動モデルライブラリ 7 0における対応する行動モデルの対応する遷移確率を変更する。

他方、感情モデル 8 3は、「喜び（Joy) 」、「悲しみ（Sadness) 」、「怒り (Anger) 」、「驚き（Surpri se) 」、「嫌悪（Di sgust) 」及び「恐れ（Fea r) 」の合計 6つの情動について、各情動毎にその情動の強さを表すパラメータを保持している。そして、感情モデル 8 3は、これら各情動のパラメータ値を、それそれ入力セマンティクスコンバ一夕モジュール 6 9から与えられる「叩かれた」及び「撫でられた」などの特定の認識結果や、経過時間及び行動切換モジュール 8 1からの通知などに基づいて周期的に更新する。

具体的には、感情モデル 8 3は、入力セマンティクスコンパ一夕モジュール 6 9から与えられる認識結果と、そのときのロボット装置 1の行動と、前回更新してからの経過時間となどに基づいて所定の演算式により算出されるそのときのその情動の変動量を Δ Ε [ t ] 、現在のその情動のパラメ一夕値を E [ t ] 、その情動の感度を表す係数を k _eとして、下記式（3 1 ) によって次の周期におけるその情動のパラメ一夕値 E [ t + 1 ] を算出し、これを現在のその情動のパラメ一夕値 E [ t ] と置き換えるようにしてその情動のパラメータ値を更新する。また、感情モデル 8 3は、これと同様にして全ての情動のパラメ一夕値を更新する。

E = [t + l] = E = [t]+ ke x ΑΕ [ΐ] . . . (3 1)

なお、各認識結果や出力セマンティクスコンバ一タモジュール 7 8からの通知が各情動のパラメ一夕値の変動量 Δ Ε [七 ] にどの程度の影響を与えるかは予め決められており、例えば「叩かれた」といった認識結果は「怒り」の情動のパラメータ値の変動量厶 Ε [ t ] に大きな影響を与え、「撫でられた」といった認識結果は「喜び」の情動のパラメータ値の変動量 Δ Ε [ t ] に大きな影響を与えるようになつている。

ここで、出力セマンティクスコンパ一夕モジュール 7 8からの通知とは、いわゆる行動のフィードバック情報（行動完了情報）であり、行動の出現結果の情報であり、感情モデル 8 3は、このような情報によっても感情を変化させる。これは、例えば、「叫ぶ」といった行動により怒りの感情レベルが下がるといったようなことである。なお、出力セマンティクスコンパ'一夕モジュール 7 8からの通知は、上述した学習モジュール 8 2にも入力されており、学習モジュール 8 2は、その通知に基づいて行動モデルの対応する遷移確率を変更する。

なお、行動結果のフィードバヅクは、行動切換モジュール 8 1の出力（感情が付加された行動）によりなされるものであってもよい。

一方、本能モデル 8 4は、「運動欲（exerc ise) 」、「愛情欲（affecti on) 」、「食欲（appet ite) 」及び「好奇心（curi osi ty) 」の互いに独立した 4つの欲求について、これら欲求毎にその欲求の強さを表すパラメータを保持している。そして、本能モデル 8 4は、これらの欲求のパラメータ値を、それぞれ入力セマンティクスコンバータモジュール 6 9から与えられる認識結果や、経過時間及び行動切換モジュール 8 1からの通知などに基づいて周期的に更新する。

具体的には、本能モデル 84は、「運動欲」、「愛情欲」及び「好奇心」については、認識結果、経過時間及び出力セマンティクスコンバータモジュール 7 8 からの通知などに基づいて所定の演算式により算出されるそのときのその欲求の変動量を Δ Ι [k] 、現在のその欲求のパラメ一夕値を I [k] 、その欲求の感度を表す係数 kiとして、所定周期で下記式（32) を用いて次の周期におけるその欲求のパラメ一夕値 I [k+ 1 ] を算出し、この演算結果を現在のその欲求のパラメータ値 I [k] と置き換えるようにしてその欲求のパラメ一夕値を更新する。また、本能モデル 84は、これと同様にして「食欲」を除く各欲求のパラメ一夕値を更新する。

l[k+l]= l[k]+kixM[k\ . . . (32)

なお、認識結果及び出力セマンティクスコンバータモジュール 7 8からの通知などが各欲求のパラメータ値の変動量 ΔΙ [k] にどの程度の影響を与えるかは予め決められており、例えば出力セマンティクスコンパ一夕モジュール Ί 8からの通知は、「疲れ」のパラメータ値の変動量 ΔΙ [k] に大きな影響を与えるようになつている。

なお、本実施の形態においては、各情動及び各欲求（本能）のパラメータ値がそれそれ 0から 1 00までの範囲で変動するように規制されており、また係数 k _e、 kiの値も各情動及び各欲求毎に個別に設定されている。

一方、ミドル ' ウェア · レイヤ 5 0の出力セマンティクスコンバー夕モジユール 78は、図 2 6に示すように、上述のようにしてアプリケーション ' レイヤ 5 1の行動切換モジュール 8 1から与えられる「前進」、「喜ぶ」、「鳴く」又は「トラッキング（ボールを追いかける）」といった抽象的な行動コマンドを出力系 79の対応する信号処理モジュール 7 1〜7 7に与える。そしてこれら信号処理モジュール 7 1〜 7 7は、行動コマンドが与えられると当該行動コマンドに基づいて、その行動をするために対応するァクチユエ一夕に与えるべきサーボ指令値や、スピー力から出力する音の音声データ及び又は L E Dに与える駆動データを生成し、これらのデ一夕をロボティヅク ·サーバ ·ォブジェクト 4 2のバーチャル · ロボット 4 3及び信号処理回路を順次介して対応するァクチユエ一夕又はスピーカ又は L E Dに順次送出する。

このようにしてロボヅト装置 1は、上述した制御プログラムに基づいて、自己 (内部）及び周囲（外部）の状況や、ユーザからの指示及び働きかけに応じた自律的な行動ができる。

このような制御プログラムは、ロボット装置 1が読取可能な形式で記録された記録媒体を介して提供される。制御プログラムを記録する記録媒体としては、磁気読取方式の記録媒体（例えば、磁気テープ、フレキシブルディスク、磁気カード）、光学読取方式の記録媒体（例えば、 C D— R O M、 M O、 C D - R , D V D ) 等が考えられる。記録媒体には、半導体メモリ（いわゆるメモリカード（矩形型、正方形型など形状は問わない。）、 I Cカード）等の記憶媒体も含まれるまた、制御プログラムは、いわゆるインターネット等を介して提供されてもよいこれらの制御プログラムは、専用の読込ドライバ装置、又はパーソナルコンビユー夕等を介して再生され、有線又は無線接続によってロボット装置 1に伝送されて読み込まれる。また、ロボット装置 1は、半導体メモリ、又は I Cカード等の小型化された記憶媒体のドライブ装置を備える場合、これら記憶媒体から制御プログラムを直接読み込むこともできる。

なお、本発明は、図面を参照して説明した上述の実施例に限定されるものではなく、添付の請求の範囲及びその主旨を逸脱することなく、様々な変更、置換又はその同等のものを行うことができることは当業者にとって明らかである。産業上の利用可能性上述した本発明によれば、環境内の全てのランドマークを認識しなくても、ある程度の情報から現在の環境を同定することができ、更に、全ての環境を一つの環境地図モデルで表現する手法に比べて、環境を一意に特定可能である範囲とし、これらの環境地図を記憶することにより、一つ一つの環境地図のデータ量が小さくてよいと共に、物理的に離れた場所にある場所 Aと場所 Bとを異なる環境地図として記憶することにより、場所の相対的な位置関係を関知する必要がない。

Claims

請求の範囲

1 . 1以上のランドマークが配置された環境内を移動するロボット装置であって、上記 1以上のランドマークの観測結果及び上記ロボット装置の移動状態量に基づき、 1以上のランドマークの配置又は数により一意に特定可能な環境の環境地図を構築する環境地図構築手段と、

上記環境地図が登録済環境地図として複数記憶された環境地図記憶手段と、上記環境地図記憶手段に記憶されている上記登録済環境地図と、上記環境地図構築手段により構築された現在の環境地図とを比較して、上記現在の環境が上記登録済環境地図が示す環境であるか否かを判定する環境同定手段と

を有することを特徴とするロボット装置。

2 . 1以上のランドマークが配置された環境内を移動体が移動して該環境を同定する環境同定装置であって、

上記 1以上のランドマークの観測結果及び上記移動体の移動状態量に基づき、 1以上のランドマークの配置又は数により一意に特定可能な環境の環境地図を構築する環境地図構築手段と、

を有することを特徴とする環境同定装置。

3 . 請求の範囲第 2項記載の環境同定装置であって、

上記登録済環境地図は、上記環境地図構築手段により構築された環境地図である

ことを特徴とする環境同定装置。

4 . 請求の範囲第 2項記載の環境同定装置であって、

上記環境地図は、上記ランドマークの位置情報を有し、上記環境地図記憶手段は、上記環境地図と共に該環境を識別する環境識別情報を記憶する

ことを特徴とする環境同定装置。

5 . 請求の範囲第 4項記載の環境同定装置であって、

上記環境同定手段は、上記現在の環境地図と上記登録済環境地図との類似度を算出し、該類似度に基づき現在の環境を同定する

ことを特微とする環境同定装置。

6 . 請求の範囲第 5項記載の環境同定装置であって、

上記環境同定手段は、上記現在の環境地図と上記登録済環境地図との類似度が所定の閾値以上であるとき、上記現在の環境を当該登録済環境地図が示す環境であると同定して該登録済環境地図の上記環境識別情報を出力する

ことを特徴とする環境同定装置。

7 . 請求の範囲第 5項記載の環境同定装置であって、

上記環境同定手段は、上記現在の環境地図と上記登録済環境地図との類似度が所定の閾値未満であるとき、該現在の環境地図を上記環境地図記憶手段に追加する追加手段を有する

ことを特徴とする環境同定装置。

8 . 請求の範囲第 2項記載の環境同定装置であって、

上記一意に特定可能な環境内を探索する探索手段を有する

ことを特徴とする請求項 2記載の環境同定装置。

9 . 請求の範囲第 8項記載の環境同定装置であって、

上記探索手段の上記環境内の探索を終了するよう制御する探索終了制御手段を有する

ことを特徴とする環境同定装置。

1 0 . 請求の範囲第 9項記載の環境同定装置であって、

上記探索終了制御手段は、上記一意に特定可能な環境内にて所定数のランドマ —クが観測されたとき、探索開始から所定期間経過したとき、又は上記移動体をコントロールする使用者により上記環境内の探索を終了するよう指示されたときに上記探索手段の探索を終了する

ことを特徴とする環境同定装置。

1 1 . 請求の範囲第 2項記載の環境同定装置であって、

上記一意に特定可能な環境は、所定数のランドマ一クを有することを特徴とする環境同定装置。

1 2 . 請求の範囲第 2項記載の環境同定装置であって、

上記ランドマークは、上記一意に特定可能な環境内にて一意に特定可能なものである

ことを特徴とする環境同定装置。

1 3 . 請求の範囲第 2項記載の環境同定装置であって、

上記ランドマークは、異なる形状及び/又は異なる色の複数の幾何学パターンが組み合わされたものである

ことを特徴とする環境同定装置。

1 4 . 請求の範囲第 1 3項記載の環境同定装置であって、

上記環境地図は、上記ランドマークの位置情報と共に上記ランドマ一クの方向を示す情報を有する

ことを特徴とする環境同定装置。

1 5 . 請求の範囲第 2項記載の環境同定装置であって、

上記移動体の移動状態量は、該移動体の姿勢方向及び位置を示すものであることを特徴とする環境同定装置。

1 6 . 請求の範囲第 2項記載の環境同定装置であって、

上記移動体は、供給された入力情報に基づいて動作を行う自律型のロボット装置である

ことを特徴とする環境同定装置。

1 7 . 1以上のランドマークが配置された環境内を移動体が移動して該環境を同定する環境同定方法であって、

上記 1以上のランドマ一クの観測結果及び上記移動体の移動状態量に基づき、 1以上のランドマークの配置又は数により一意に特定可能な環境の環境地図を構築する環境地図構築工程と、

記憶手段に登録済環境地図として複数記憶された上記環境地図と、上記環境地図構築工程にて構築された現在の環境地図とを比較して、上記現在の環境が上記登録済環境地図が示す環境であるか否かを判定する環境同定工程と

を有することを特徴とする環境同定方法。

1 8 . 請求の範囲第 1 7項記載の環境同定方法であって、

上記環境地図記構築工程にて構築された環境地図を上記登録済環境地図として上記記憶手段に記憶する記憶工程を有する

ことを特徴とする環境同定方法。

1 9 . 請求の範囲第 1 7項記載の環境同定方法であって、

上記環境地図は、上記ランドマークの位置情報を有し、上記記憶手段には、上記環境地図と共に該環境を識別する環境識別情報が記憶されている

ことを特徴とする環境同定方法。

2 0 . 請求の範囲第 1 9項記載の環境同定方法であって、

上記環境同定工程では、上記現在の環境地図と上記登録済環境地図との類似度が算出され、該類似度に基づき現在の環境が同定される

ことを特徴とする環境同定方法。

2 1 . 請求の範囲第 2 0項記載の環境同定方法であって、

上記環境同定工程では、上記現在の環境地図と上記登録済環境地図との類似度が所定の閾値以上であるとき、上記現在の環境を当該登録済環境地図が示す環境であると同定して該登録済環境地図の上記環境識別情報が出力される

ことを特徴とする環境同定方法。

2 2 . 請求の範囲第 2 0項記載の環境同定方法であって、

上記環境同定工程では、上記現在の環境地図と上記登録済環境地図との類似度が所定の閾値未満であるとき、該現在の環境地図が上記記憶手段に追加されることを特徴とする環境同定方法。

2 3 . 請求の範囲第 1 7項記載の環境同定方法であって、

上記一意に特定可能な環境内を探索する探索工程を有する

ことを特徴とする環境同定方法。

2 4 . 請求の範囲第 2 3項記載の環境同定方法であって、

上記探索工程では、上記一意に特定可能な環境内にて所定数のランドマークが観測されたとき、探索開始から所定期間経過したとき、又は上記移動体をコントロールする使用者により上記環境内の探索を終了するよう指示されたときに探索が終了されることを特徴とする環境同定方法。

2 5 . 1以上のランドマ一クが配置された環境内を移動体が移動して該環境を同定する動作をコンピュー夕に実行させるためのプログラムであって、

上記 1以上のランドマークの観測結果及び上記移動体の移動状態量に基づき、 1以上のランドマークの配置又は数により一意に特定可能な環境の環境地図を構築する環境地図構築工程と、

を有することを特徴とするプログラム。

2 6 . 1以上のランドマークが配置された環境内を移動体が移動して該環境を同定する動作をコンピュータに実行させるためのプログラムを記録したコンビユー夕読み取り可能な記録媒体であって、

を有することを特徴とするプログラムを記録した記録媒体。