JP3548315B2 - 認知地図を持つ装置 - Google Patents
認知地図を持つ装置 Download PDFInfo
- Publication number
- JP3548315B2 JP3548315B2 JP03152196A JP3152196A JP3548315B2 JP 3548315 B2 JP3548315 B2 JP 3548315B2 JP 03152196 A JP03152196 A JP 03152196A JP 3152196 A JP3152196 A JP 3152196A JP 3548315 B2 JP3548315 B2 JP 3548315B2
- Authority
- JP
- Japan
- Prior art keywords
- cognitive map
- solution
- cost
- information
- route
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000001149 cognitive effect Effects 0.000 title claims description 64
- 230000002068 genetic effect Effects 0.000 claims description 19
- 238000000034 method Methods 0.000 claims description 14
- 238000011156 evaluation Methods 0.000 claims description 13
- 238000002922 simulated annealing Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 230000007613 environmental effect Effects 0.000 claims description 7
- 239000000470 constituent Substances 0.000 claims description 4
- 230000035772 mutation Effects 0.000 claims description 4
- 210000000349 chromosome Anatomy 0.000 description 23
- 239000010813 municipal solid waste Substances 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000005192 partition Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 230000002354 daily effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 101150084750 1 gene Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 231100000225 lethality Toxicity 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Instructional Devices (AREA)
- Feedback Control In General (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Description
【発明の属する技術分野】
本発明は,環境を表現する空間的知識である認知地図を持つ装置であって,特に認知地図を確率的に表現することによって,環境が変化する場合にもロボット等が柔軟に対応できるようにした認知地図を持つ装置に関する。
【0002】
人間は過去の経験を記憶して利用し,日常生活を営んでいる。これらの記憶は,会話に必要な言語の知識や社会生活を送るための常識など多岐にわたっているが,中でも環境を表現する空間的知識は認知地図と呼ばれ,日常行動のためだけでなく,事物の認識,理解にも極めて重要な役割を担っている。
【0003】
例えば掃除ロボットや警備ロボットなど,実世界を移動しながら与えられた仕事をこなす装置を考える。ロボットは自らが持つ地図により移動計画を立て,移動先で与えられた仕事を行う。このような環境の認知に用いる地図として,厳密でなくても妥当な結果が得られること,また環境の変化に対して柔軟に対応できることが必要である。
【0004】
【従来の技術】
従来,ロボットが持つ地図は,予め予想される行動空間をもとに設計者が作成し,絶対地図を内部に記憶していた。ここで,絶対地図とは,市販の地形図のように緯度・経度等が正確に記されているような地図であり,屋内の地図の場合には,壁やドアや机などの位置が正確に記されているものである。
【0005】
一般に,設計時にロボットに与えた地図は変更されることなく,常に同じ地図をもとに行動計画が作成される。
ロボットに与えられる仕事で最も基本とされているのは移動である。掃除ロボットであれ,警備ロボットであれ,移動計画は必ず必要とされる。さらに,移動計画において重要なことは,どのようにして最短コストで指定された移動を行うかということである。
【0006】
従来,移動計画を立てるには,絶対地図をもとに移動可能な経路を虱潰しにチェックし,設計時に与えたコストを計算することにより,最短コストを得る経路を求めていた。しかし,ごく限られた狭い空間内や工場のように,レイアウトや障害物の存在がほとんど変化しない場合はともかく,実世界における未知の環境で最短コストを計算するには,現実的な時間内では不可能である。
【0007】
【発明が解決しようとする課題】
実世界を行動するロボットは,環境を認識するセンサや移動量の誤差を考慮しなくてはならない。絶対地図は,本来,誤差を考慮に入れていないので,測定誤差が生じた場合にそれを補正し計画を立てるのに使用しにくいという欠点がある。また,過去に一度しか行ったことのないような場所に関する不確かな情報をもとにした地図の表現は不可能である。
【0008】
さらに,従来の絶対地図では,設計時に与えた地図を変更しなければレイアウトの変更や突発的な事故などへの対応ができない。また,ロボットが作業を行うのに計画立案にかかる時間は,十分現実的な時間でなくてはならない。
【0009】
本発明は上記問題点の解決を図り,不確かな空間的知識も表現可能で,ある程度誤差があっても環境の認知に利用することができ,かつ環境の変化に対しても柔軟に対応することができる認知地図を持つ装置を提供することを目的としている。
【0010】
【課題を解決するための手段】
図1は本発明の原理説明図である。図1において,1はCPUおよびメモリなどを備えた処理装置,10は認知地図を構成するための事前知識を入力する事前知識入力手段,20は認知地図を記憶する認知地図記憶手段,30は認知地図により環境を認知する環境認知手段,31はシミュレーティドアニーリングによる最短コスト経路の探索手段,32は遺伝的(ジェネティック)アルゴリズムによる最短コスト経路の探索手段,40は探索した移動経路に基づく移動制御等を行う実行制御手段,50は認知地図の情報を学習する認知地図学習手段を表す。
【0011】
本発明は,環境を表現する空間的知識である認知地図を持つ装置に関するものであり,以下の手段を有する。
事前知識入力手段10は,認知地図記憶手段20に格納する構成要素に関する定義情報および確率情報(確率密度関数)を事前知識として入力する。認知地図記憶手段20は,認知地図の構成要素ごとに,その構成要素の定義情報と,その構成要素に関する位置や存在やコストの確率または情報の確からしさを示す確率情報とを記憶する手段である。環境認知手段30は,認知地図記憶手段20に格納された各構成要素の定義情報と確率情報とを用いて確率的に環境を認知する手段である。
【0012】
例えばロボット等が移動経路の探索のために認知地図を利用する場合,シミュレーティドアニーリング(Simulated Anealing)または遺伝的アルゴリズム(Genetic Algorithms)により最短コスト経路を探索する。そのため,シミュレーティドアニーリングによる最短コスト経路の探索手段31もしくは遺伝的アルゴリズムによる最短コスト経路の探索手段32を持つ。これらが行う探索において経路を評価する場合,確率情報を用いることにより移動の目的に応じた最適経路を探索する。
【0013】
実行制御手段40は,例えば制御対象がロボットである場合に,環境認知手段30の探索手段によって探索した移動経路に基づいてロボットの移動を制御する手段である。
【0014】
認知地図学習手段50は,実行制御手段40によって実際に実行した経験から得られた情報により,認知地図記憶手段20に格納する構成要素に関する確率情報を学習する手段である。また,必要であれば構成要素自体の学習も行う。
【0015】
本発明では,認知地図を構成する空間情報(認知地図の構成要素)を例えば以下の5つの要素とし,各々の位置,存在(あるかないか),信頼度をそれぞれ確率的に表現する。また,パスに関しては移動するのに要するコスト(距離,時間)を確率的に表現する。
【0016】
▲1▼パス……2点間の道筋
パスは移動が可能な2点間の道筋をいう。例えば,オフィス内の廊下,道路,鉄道,橋などがこれに該当する。
【0017】
▲2▼ノード……そこに入ることのできる領域
パスにつながっている空間の中で入り込むことができる領域をいう。例えば,交差点,駅,空港などがこれに該当する。
【0018】
▲3▼ランドマーク……目印
ランドマークは,移動の目印となるような構造物をいう。一例では,曲がり角はノードであるが,移動方向を変えるための重要な目印となるので,ランドマークでもある。同様に,駅,空港などもランドマークになる。
【0019】
▲4▼エッジ……異なった領域の境界
エッジは,それを越えて移動することのできない構成物をいう。例えば,室内では,壁やパーティションを越えて移動することはできないし,屋外においては,川,崖などがエッジに相当する。
【0020】
▲5▼ディストリクト……ある特徴を持った領域
共通の特徴がその中に見られる比較的大きな領域をいう。例えば,商店街,デパート,九州,四国などがこれに当たる。
【0021】
位置,存在の確率および信頼度やパスのコストは,事前知識入力手段10によって事前知識により与える。オフィスの認知地図を表現する場合,パーティションによるレイアウトはほとんど変化することがないので,高信頼度で実測したデータを使うことができる。また,春には新入社員が加わるのでレイアウト変更があるなどの日常生活における常識などから確率を記述することが可能である。
【0022】
しかし,事前知識には全くないような状況が存在することもある。例えば不意の来客があり,荷物を廊下に置いて帰ったような場合,廊下というパスは事前知識とは全く異なった状態になる。このとき,事前知識のままで行動計画を作成しても,障害物に阻まれて計画を遂行することが不可能である。このときの失敗の経験を認知地図学習手段50によって学習し,廊下に関する知識を変更する。これにより,次回は障害物の情報を活かした計画を立てることが可能になる。
【0023】
本発明の認知地図を最短コスト経路の探索に用いた場合,確率的な探索を効率的に行うことができる。すなわち,確率的探索手法として,シミュレーティドアニーリングまたは遺伝的アルゴリズムを用いることにより,従来手法に比べて現実的な時間で最短コストに準じる経路を求めることが可能である。
【0024】
なお,認知地図の構成要素に関する位置や存在の確率は,例えば1日おきに存在したり存在しなかったりする場合に,0.5という値となる確率密度関数である。また,信頼度は,確率を含めた構成要素の定義情報に対する信憑性を示す情報であり,実際の測定によって得られた情報である場合には信頼度が高く(値が1に近い),伝聞などから得られた情報は相対的に信頼度が低くなる(値が0に近い)。ここでは,このような確率や信頼度の情報を総称して確率情報というが,本発明の実施にあたっては,いずれか一方の情報だけでも十分である。
【0025】
【発明の実施の形態】
以下,本発明の実施の一形態を説明する。
図1に示す事前知識入力手段10では,地図で表現したい環境に関して持っている常識や過去の経験などを利用して決定された確率密度関数を入力する。もちろん,すべての構成物に関する知識を予め有することは稀であるので,既知のものに関してのみ確率を与え,未知のものには認知地図学習手段50によって確率密度関数を学習する。
【0026】
認知地図の構成要素に関する詳細を以下に述べる。
▲1▼パス(2点間の道筋)
パスは,スタート位置の座標値(どこから),エンド位置の座標値(どこまで),パスを通過するのに要する時間,距離,コストで表す。各々の値は,確率密度関数で表現されており,例えば時間に関して,P(時間)=(10秒,0.8)のように表現されていれば,確率0.8で10秒かかるということを意味する。さらに,それぞれのパスの情報には,信頼度が設定されており,情報がどれくらい信頼できるかの指標とされる。
【0027】
▲2▼ノード(そこに入ることのできる領域)
ノードは,駅,空港などといった名称とその位置,記述に関する信頼度で表現される。ここでもパスと同様に,位置に関しては確率で表現されている。
【0028】
▲3▼ランドマーク(目印)
ノードと同様に,ランドマークも名称とその位置,記述に関する信頼度で表現される。
【0029】
▲4▼エッジ(異なった領域の境界)
ノード,ランドマークと同様に,エッジも名称とその位置,記述に関する信頼度で表現される。
【0030】
▲5▼ディストリクト(ある特徴を持った領域)
ノード,ランドマーク,エッジと同様に,ディストリクトも名称とその位置,記述に関する信頼度で表現される。
【0031】
図2は,シミュレーティドアニーリングによる最短コスト経路の探索を説明する図である。
シミュレーティドアニーリングは,物理学における焼なましにヒントを得た計算手法であり,一つの初期状態から状態遷移を繰り返して状態系列を発生させ,その中で解を探索する一種の逐次探索改善法である。
【0032】
最短コスト経路問題は,ある制約条件gi (x)≦0(i=0,1,…,m)のもとでコストf(x)の最小値を求めるというように定式化することができる。このような最短コスト経路問題が与えられると,ステップS1では,初期解xをランダムに発生させ,繰り返し回数であるjに0をセットする。その後,ステップS2〜S4を繰り返す。
【0033】
ステップS2では,現在の解xの近傍S(x)の中から候補解yをランダムに選びだす。このとき,jに1を加え,さらに温度パラメータcを減少させる。温度パラメータcは,物理的な焼なましにおける温度に対応した制御変数であり,有限回の繰り返しの場合,cj のjが増えるに従って,cj の値が減少するように定められている。
【0034】
ステップS3では,ステップS2で選んだ近傍解yが現在の解xよりもコストが低ければ,その解yを現在の解xとする。すなわち,f(y)≦f(x)ならば,x=yとする。逆に,選んだ近傍解yが現在の解xよりもコストが高くても,ある確率pのもとで現在の解xとする。すなわち,f(y)>f(x)ならば,p(x→y)=exp(−(f(x)−f(y))/c)の確率で,x=yとする。
【0035】
ステップS4では,所定の終了条件を満たすかどうかを判定し,終了条件を満たすならば,それまでに得られた解xを最終的な解として処理を終了する。終了条件を満たしていないならば,ステップS2へ戻って同様に処理を繰り返す。終了条件としては,与えられた条件を満たす解が得られたこと,jが所定値になったこと,コストの改善率が所定の範囲内に収束したこと,計算時間が所定の時間になったことなど,予め任意に定めておくことができる。
【0036】
上記ステップS2におけるコストの算出において,認知地図の構成要素に関する確率情報を,経路の探索目的に応じて種々の方法で利用することができる。
例えば,どんなに遅くとも,ある制限時間内に必ず目的地へ到達しなければならないような場合には,確率や信頼度の低い情報を用いないでコスト計算を行う。換言すれば,確率や信頼度の高い情報だけを重視する重み付けを行ってコスト計算を行う。一方,最悪の場合に失敗することがあっても,現実上の最短コストの経路を試行的に求めたい場合には,確率や信頼度の低い情報についても,確率や信頼度の高い情報と同様に用いてコスト計算を行う。さらにまた,平均して現実上の最短コストに近い経路を求めるような場合には,確率や信頼度に応じた評価関数の係数を定めてコスト計算を行うというようにすることもできる。
【0037】
図3は,遺伝的アルゴリズムによる最短コスト経路の探索を説明する図である。
遺伝的アルゴリズムは,よく知られているように,解候補を染色体の形で表した個体集団に対して,交叉・突然変異・淘汰という遺伝的オペレーションを繰り返し適用し,生存競争の果てに環境への適応度がより高い個体が生き残っていく生物進化の仕組みを利用した準最適解を求める計算手法である。
【0038】
始めに最短コスト経路問題が与えられると,最適化項や制約条件を遺伝的アルゴリズムで用いる染色体にコード化する。ここでの染色体は,例えば認知地図における出発点から目的の到着点までに通過するパスもしくはノードを表すコードの列x1 ,x2 ,…,xn として表現される。
【0039】
遺伝的アルゴリズムによる最適化では,以下の処理を行う。まず,ステップS21では,染色体(解候補)の集団を発生させる。ここでは,予め定められた数の染色体をランダムに生成する。
【0040】
ステップS22における交叉では,染色体の集団から確率的に選択した複数の染色体について,染色体の一部を他の染色体の一部と組み合わせるオペレーションを実行する。また,ステップS23における突然変異では,染色体の集団から確率的に選択した染色体の遺伝子の一部について,他の遺伝子に置き換えるオペレーションを行う。ステップS24における淘汰では,各染色体について適応度(コスト)を計算し,適応度に応じた染色体の確率的な取捨選択を行う。具体的には,例えばルーレット法などを用いて,適応度の高い(コストの小さい)染色体を複製し,適応度が低い(コストの大きい)染色体を消滅させる処理を実行する。以上の世代交代により,解候補の集団の改善がなされる。
【0041】
ステップS25では,所定の終了条件を満たすかどうかを判定し,終了条件を満たすならば,それまでに得られた解候補の集団の中で,最適なものを最終的な解として処理を終了する。終了条件を満たしていないならば,ステップS22へ戻り,同様に処理を繰り返す。終了条件としては,所定の世代数だけ遺伝的オペレーションを繰り返したこと,計算時間が所定の時間になったこと,染色体の集団の中に所定の条件を満たす解候補があることなど,任意に選択可能である。
【0042】
上記ステップS24における適応度の算出において,認知地図の構成要素に関する確率情報を,経路の探索目的に応じて種々の方法で利用することができることは,前述したシミュレーティドアニーリングの場合と同様である。
【0043】
例えば,シミュレーティドアニーリングによる経路探索で用いる評価関数は,以下のような式で一般化できる。
評価=α(時間の総和)+β(距離の総和)+γ(エネルギー消費量)
この式で,α,β,γは,それぞれの項に対する係数であり,例えばβ,γがともにゼロであれば,時間の総和だけを評価することになり,α=0.5,β=0.5,γ=0であれば,時間と距離を同等に重視して評価することになる。これらの係数の決定は,問題や環境に大きく依存するものであるので,それぞれのケースに応じて実験などにより決定することが望ましい。
【0044】
遺伝的アルゴリズムにおける適応度も同様に定義することが可能である。
【0045】
【実施例】
図4は本発明の実施例を説明するためのオフィスのレイアウトの例,図5は図4のオフィスのレイアウトを記述した認知地図の例を示す。
【0046】
認知地図の対象となる環境として,図4に示すようなオフィスのレイアウトを扱うものとする。ここでの位置を示す座標値(x,y)は,パーティションP1〜P4で区切られた領域を,(0,0)から(100,100)までの相対的な座標で表したものである。
【0047】
図4に示す廊下A1,A2は,認知地図ではパスとして扱われ,例えば図5の(a)に示すように表現される。例えば,廊下A1は,座標(45,15)から(85,15)までの経路として定義されている。この廊下A1が存在する確率は0.9である。この存在確率0.9は,もし廊下A1上に大きな荷物などが置かれると通行できなくなるので,廊下A1がパスとして利用できなくなる確率が1割であることを意味している。ロボットが廊下A1の通過にかかる時間は,0.8の確率で10秒である。また,廊下A1の長さは,0.9の確率で4mである。エネルギー消費量などのコストは,0.7の確率で20である。また,これらの情報の信頼度が0.8であることが,事前知識として与えられている。廊下A2の定義情報も意味は同様である。
【0048】
コーナーCoは,ノードであり,図5の(b)に示すように,位置が(90,90)でその確率が0.9,また信頼度が0.8と定義されている。
目印であるランドマークとして,ごみ箱Ga,机De,ドアDoが,図5の(c)に示すように定義されている。エッジとして,P1〜P6のパーティションが,図5の(d)に示すように定義されている。ディストリクトは,オフィスであり,図5の(e)に示すように定義されている。なお,位置の座標としては,例えば領域のように範囲がある場合には,重心位置などの特定点の座標値を用いる。他に,サイズ情報等を持つようにしてもよい。
【0049】
図5に示すような認知地図を用い,ごみ箱GaからドアDoへ行く移動問題を考える。
ごみ箱GaからドアDoまでの経路探索での評価関数f(x)は,簡単化のため,各パスの移動に要する時間を加えたものとする。なお,パスは廊下A1,A2のように明示的に定義されたものの他に,あるランドマーク等から他のランドマーク等までというように,事実上のパスが存在する。この移動問題における各パスの移動に要する時間は,説明の都合上,図6(a)に示すように与えるものとする。例えば,ドアDoから机Deまでの移動に要する時間は,80秒である。また,制約条件は,図6(b)に示すようにf(x)<150である。
【0050】
図7は,シミュレーティドアニーリングによる探索例を示している。
まず初期解xをランダムに与える。この例では,図7(a)に示すように,x={ごみ箱Ga→廊下A1→コーナーCo→廊下A1→ごみ箱Ga→机De→ドアDo}というような初期解が得られている。図6に示す時間から,f(x)=320>150であり,この初期解は制約条件を満たしていない。そこで,繰り返し回数のjを0にして,次の処理へ進む。
【0051】
図7(b)に示すように,xの近傍の候補解yをランダムに発生させる。この例では,y={ごみ箱Ga→廊下A1→コーナーCo→廊下A2→ドアDo}となっている。f(y)=200である。j=1にする。
【0052】
図7(c)に示すように,f(y)とf(x)とを比較する。比較した結果,f(y)<f(x)であり,解の改善が見られるので,x=yとして解を置き換える。しかし,この解は,制約条件のf(x)<150を満たしていないので,次のステップへ移る。
【0053】
次に,図7(d)に示すように,xの近傍の候補解yをランダムに発生させる。この例では,y={ごみ箱Ga→机De→ドアDo}となっている。f(y)=120である。j=2にする。
【0054】
図7(e)に示すように,f(y)とf(x)とを比較する。比較した結果,f(y)<f(x)であり,解の改善が見られるので,x=yとして解を置き換える。制約条件を調べると,f(x)=120でf(x)<150が満たされたので,x={ごみ箱Ga→机De→ドアDo}を求める経路として処理を終了する。
【0055】
図8は,遺伝的アルゴリズムによる探索例を示している。
まず,図8(a)に示すように,染色体(解候補)の集団を発生させる。実際には多数の染色体の集団を用いるが,ここでは簡単化のため3個体で行うものとする。これらの3個体にNo1〜No3の番号を付ける。発生した染色体の初期集団は,以下のとおりである。
【0056】
No1={ごみ箱Ga→廊下A1→コーナーCo→廊下A1→ごみ箱Ga→机De→ドアDo}
No2={ごみ箱Ga→机De→ごみ箱Ga→廊下A1→コーナーCo→廊下A2→ドアDo}
No3={ごみ箱Ga→廊下A1→コーナーCo→廊下A2→コーナーCo→廊下A2→ドアDo}
それぞれの評価値(適応度の逆数)は,f(No1)=320,f(No2)=280,f(No3)=220である。
【0057】
次に,遺伝子操作の一つである交叉オペレーションをランダムに実施する。この例では,図8(b)に示すように,No2とNo3の染色体間で交叉が行われている。交叉の結果は,以下のとおりである。
【0058】
No1={ごみ箱Ga→廊下A1→コーナーCo→廊下A1→ごみ箱Ga→机De→ドアDo}
No2={ごみ箱Ga→机De→ごみ箱Ga→廊下A1→コーナーCo→廊下A2→コーナーCo→廊下A2→ドアDo}
No3={ごみ箱Ga→廊下A1→コーナーCo→廊下A2→ドアDo}
それぞれの評価値は,f(No1)=320,f(No2)=300,f(No3)=200である。
【0059】
次に,遺伝子操作の一つである突然変異オペレーションをランダムに実施する。この例では,図8(c)に示すように,No1に突然変異を生じさせている。No1の遺伝子である机Deが廊下A2に突然変異し,染色体の集団は以下のようになっている。
【0060】
No1={ごみ箱Ga→廊下A1→コーナーCo→廊下A1→ごみ箱Ga→廊下A2→ドアDo}
No2={ごみ箱Ga→机De→ごみ箱Ga→廊下A1→コーナーCo→廊下A2→コーナーCo→廊下A2→ドアDo}
No3={ごみ箱Ga→廊下A1→コーナーCo→廊下A2→ドアDo}
それぞれの評価値は,f(No1)=410,f(No2)=300,f(No3)=200である。
【0061】
次の図8(d)に示す淘汰オペレーションでは,評価値の小さいものが生き残るように,ルーレット法等により評価値に応じて確率的に増殖と致死の操作を行う。図8(d)では,No3の染色体が増殖し,消滅したNo1の染色体と置き換わっている。
【0062】
以上の(b)〜(d)の操作を,所定の世代数分または制約条件を満たす解が得られるまで繰り返す。例えば,図8(e)に示すように,No1={ごみ箱Ga→机De→ドアDo}の解が得られたとする。この評価値はf(No1)=120であり,制約条件のf(No1)<150が満たされたので,これを求める解とする。
【0063】
図9は,本発明の実施例による学習例を示す。
図7または図8に示す探索によって,最短経路{ごみ箱Ga→机De→ドアDo}が求まったならば,実際にロボットを移動させる。実際にロボットが移動すると,評価関数を求めるために使ったロボットの知識と実際の経験とのずれが生じていることがわかる。そのずれをロボットの知識に反映させるのが学習である。
【0064】
例えば,ある時点でロボットが図5に示すような認知地図の知識を持っていたとする。ここで,実際に{ごみ箱Ga→机De→ドアDo}の経路に従って移動してみると,ごみ箱Ga,机De,ドアDoの正確な位置が測定でき,その信頼度も上がる。例えば,学習前に図9(a)に示すような知識が,学習によって図9(b)に示すように変わる。
【0065】
【発明の効果】
以上説明したように本発明によれば,従来技術に比べて,より人間の考え方に近い認知地図を表現することができ,環境の変化に対しても柔軟に対応することができるようになる。さらに,従来技術に比べて,より現実的な時間で最短コストに準じる経路を求めることが可能となる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】シミュレーティドアニーリングによる最短コスト経路の探索を説明する図である。
【図3】遺伝的アルゴリズムによる最短コスト経路の探索を説明する図である。
【図4】オフィスのレイアウトの例を示す図である。
【図5】オフィスのレイアウトを記述した認知地図の例を示す図である。
【図6】本発明の実施例を説明するための条件の例を示す図である。
【図7】シミュレーティドアニーリングによる探索例を示す図である。
【図8】遺伝的アルゴリズムによる探索例を示す図である。
【図9】本発明の実施例による学習例を示す図である。
【符号の説明】
1 処理装置
10 事前知識入力手段
20 認知地図記憶手段
30 環境認知手段
31 シミュレーティドアニーリングによる最短コスト経路の探索手段
32 遺伝的アルゴリズムによる最短コスト経路の探索手段
40 実行制御手段
50 認知地図学習手段
Claims (6)
- 計算機が環境を認知するために用いる空間的知識を表現する認知地図を持つ装置において,
認知地図の構成要素ごとに,その構成要素の認知地図における位置情報を含む定義情報とその構成要素に関する確からしさを示す確率情報とを記憶する認知地図記憶手段と,
前記認知地図の構成要素に関する確率情報を入力し,前記認知地図記憶手段に格納する入力手段と,
前記認知地図記憶手段に格納された各構成要素の定義情報と確率情報とを用いて確率的に環境を認知する手段であって,少なくとも前記認知地図上のある位置から他の位置までの移動経路の探索において移動に要するコストを,前記各構成要素の定義情報と確率情報とに基づいて算出し,確率的にコストが最小となる経路を探索する手段を有する環境認知手段とを備えた
ことを特徴とする認知地図を持つ装置。 - 請求項1記載の認知地図を持つ装置において,
前記認知地図記憶手段に格納する認知地図の構成要素として,2点間の道筋を示すパスと,パスにつながっている空間の中で入り込むことのできる領域を示すノードと,異なった領域の境界を示すエッジとを少なくとも有する
ことを特徴とする認知地図を持つ装置。 - 請求項1または請求項2記載の認知地図を持つ装置において,
前記環境認知手段により環境を認知した結果に基づいて経験した事項から得られた情報と前記環境認知手段が環境を認知するために用いた前記認知地図の各構成要素の定義情報とを比較することにより,前記認知地図記憶手段に格納する構成要素に関する確率情報を学習する認知地図学習手段を備えた
ことを特徴とする認知地図を持つ装置。 - 請求項1,請求項2または請求項3記載の認知地図を持つ装置において,
前記環境認知手段における経路を探索する手段は,
経路探索問題におけるランダムに与えられた初期解によるコストと,前記初期解の近傍の候補解によるコストとを比較し,前記近傍の候補解によるコストが前記初期解によるコストより小さい場合に,前記近傍の候補解を新たな現在の解として前記初期解と置き換え,さらに前記現在の解の近傍の候補解によるコストが前記現在の解によるコストより小さい場合に,前記現在の解の近傍の候補解を新たな現在の解とする処理を,所定の条件が満たされるまで繰り返し行うシミュレーティドアニーリングにより経路を探索する手段である
ことを特徴とする認知地図を持つ装置。 - 請求項1,請求項2または請求項3記載の認知地図を持つ装置において,
前記環境認知手段における経路を探索する手段は,
経路探索問題における複数の解候補を生成し,生成された前記複数の解候補の交叉オペーレション,突然変異オペレーション,淘汰オペレーションを所定の条件が満たされるまで繰り返し行う遺伝的アルゴリズムにより経路を探索する手段である
ことを特徴とする認知地図を持つ装置。 - 請求項1,請求項2,請求項3,請求項4または請求項5記載の認知地図を持つ装置において,
前記認知地図記憶手段に格納される確率情報は,前記認知地図の構成要素の,少なくとも存在,位置またはコストに関する確率と,その定義情報がどれくらい信頼できるかの指標となる信頼度の情報とを含み,
前記環境認知手段における経路を探索する手段は,指定された経路の探索目的に応じて前記確率と前記信頼度とに重み付けを行った評価関数により経路探索を行う
ことを特徴とする認知地図を持つ装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03152196A JP3548315B2 (ja) | 1996-02-20 | 1996-02-20 | 認知地図を持つ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03152196A JP3548315B2 (ja) | 1996-02-20 | 1996-02-20 | 認知地図を持つ装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09222852A JPH09222852A (ja) | 1997-08-26 |
JP3548315B2 true JP3548315B2 (ja) | 2004-07-28 |
Family
ID=12333505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03152196A Expired - Fee Related JP3548315B2 (ja) | 1996-02-20 | 1996-02-20 | 認知地図を持つ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3548315B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7209914B2 (en) | 2001-05-22 | 2007-04-24 | Icms Group N.V. | Method of storing, retrieving and viewing data |
JP5057239B2 (ja) * | 2008-05-28 | 2012-10-24 | 株式会社Ihi | 無人搬送装置とその搬送経路決定方法 |
JP4714258B2 (ja) * | 2008-11-25 | 2011-06-29 | 株式会社東芝 | 経路を選択する装置、方法およびプログラム |
US8493407B2 (en) | 2009-09-03 | 2013-07-23 | Nokia Corporation | Method and apparatus for customizing map presentations based on user interests |
US9122693B2 (en) | 2010-11-30 | 2015-09-01 | Nokia Technologies Oy | Method and apparatus for determining contextually relevant geographical locations |
KR101432385B1 (ko) * | 2012-12-11 | 2014-08-21 | 경북대학교 산학협력단 | 유전자 알고리즘을 이용한 경로 생성 장치 및 그 동작 방법 |
JP7417954B2 (ja) * | 2019-01-31 | 2024-01-19 | パナソニックIpマネジメント株式会社 | 清掃ルート決定システム及び清掃ルート決定方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06208405A (ja) * | 1993-01-08 | 1994-07-26 | Takanori Ikegami | 知能ロボットのための情報処理方法および情報処理装置 |
JP3218865B2 (ja) * | 1994-06-28 | 2001-10-15 | 富士通株式会社 | 時間軸を探索空間に取り入れた経路探索装置 |
-
1996
- 1996-02-20 JP JP03152196A patent/JP3548315B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH09222852A (ja) | 1997-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cruz et al. | Optimization in dynamic environments: a survey on problems, methods and measures | |
Davoodi et al. | Multi-objective path planning in discrete space | |
Gao et al. | Ant colony optimization with clustering for solving the dynamic location routing problem | |
Kala et al. | Robotic path planning in static environment using hierarchical multi-neuron heuristic search and probability based fitness | |
KR101105325B1 (ko) | 실제 로봇의 다중 경로계획 방법 | |
Arzamendia et al. | Comparison of eulerian and hamiltonian circuits for evolutionary-based path planning of an autonomous surface vehicle for monitoring ypacarai lake | |
Muñoz-Carpintero et al. | A methodology based on evolutionary algorithms to solve a dynamic pickup and delivery problem under a hybrid predictive control approach | |
JP3548315B2 (ja) | 認知地図を持つ装置 | |
Paul et al. | Exploring reward efficacy in traffic management using deep reinforcement learning in intelligent transportation system | |
Rodriguez-Roman et al. | Surrogate-based optimization for the design of area charging schemes under environmental constraints | |
CN111553509A (zh) | 针对地质环境风险的轨道交通选线评估及成本优化方法 | |
Masoumi et al. | Using an evolutionary algorithm in multiobjective geographic analysis for land use allocation and decision supporting | |
Cuayáhuitl et al. | Generating adaptive route instructions using hierarchical reinforcement learning | |
Liao et al. | Modeling passenger behavior in nonpayment areas at rail transit stations | |
Chu | A computer model for selecting facility evacuation design using cellular automata | |
Zhou et al. | Traffic conduction analysis model with time series rule mining | |
CN111832602B (zh) | 基于地图的特征嵌入方法、装置、存储介质和电子设备 | |
Hsieh et al. | Applying particle swarm optimization to schedule order picking routes in a distribution center | |
Qin et al. | Dynamic Detection of Topological Information from Grid‐Based Generalized Voronoi Diagrams | |
Langley et al. | Case-based acquisition of place knowledge | |
Pahlavani et al. | A GIS-based approach for urban multi-criteria quasi optimized route guidance by considering unspecified site satisfaction | |
Nallakaruppan et al. | Hybrid swarm intelligence for feature selection on IoT-based infrastructure | |
Ishibuchi et al. | Learning fuzzy rules from iterative execution of games | |
Mikula | Meta-heuristics for routing problems | |
Langley et al. | Lazy acquisition of place knowledge |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20031215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20031224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040223 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040413 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040416 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080423 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090423 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090423 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100423 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110423 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110423 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120423 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |