WO2023157510A1

WO2023157510A1 - 経路計画装置、その適用設備、並びに経路計画方法

Info

Publication number: WO2023157510A1
Application number: PCT/JP2023/000381
Authority: WO
Inventors: 新士石原; 理優成川; 政樹金井; 佑里永崎; 敏之大塚
Original assignee: 株式会社日立製作所; 国立大学法人京都大学
Priority date: 2022-02-18
Filing date: 2023-01-11
Publication date: 2023-08-24
Also published as: JP2023120649A

Abstract

地図情報管理部とエージェント情報管理部の情報に基づいて、各エージェントを業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、各エージェントについて、エージェント間の距離が、エージェント情報管理部にて各エージェントに応じて設定される所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、経路計画計算部は、各時刻において、主目的達成評価部、主目的達成補助部、およびエージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、さらに、経路計画計算部で算出した経路計画を、全エージェントに伝達する行動計画伝達部を備える、経路計画装置。

Description

経路計画装置、その適用設備、並びに経路計画方法

　本発明は、多種、複数のエージェントが存在するエリアにおける経路計画装置、その適用設備、並びに経路計画方法に関する。

　物流倉庫の物品搬送や工場の工程間搬送の人手不足を解消するために、移動ロボット（ＡＧＶ：Ａｕｔｏｍａｔｅｄ　Ｇｕｉｄｅｄ　Ｖｅｈｉｃｌｅ、ＡＭＲ：Ａｕｔｏｎｏｍｏｕｓ　Ｍｏｂｉｌｅ　Ｒｏｂｏｔなど）の導入が進んでいる。

　このような移動ロボットを導入するには、倉庫や工場内にロボットが移動可能な通路を設定（ノードとエッジからなるグラフなどの作成）が必要になる。この設定が細かいほど、ロボットが選択可能な通路の自由度は高くなるため、より効率的な搬送が可能になるが、その反面、設定作業に多くの工数が必要になる。さらに、前記の通路の設定作業は、倉庫や工場のレイアウトが変更するたびに必要になるため、詳細な通路を設定する作業は、倉庫や工場を管理する事業者に大きな負担（エンジニアリングコスト）を求めることになる。

　このような課題に対して、特許文献１には、詳細な通路を設計することなく、複数のロボット（特許文献中ではビークル）が移動する経路を算出する方法が提示されている。

　より具体的には、各ロボットが障害物（建物内の柱や壁、自身以外のロボットなど）に接触せず、各ロボットの現在位置と各ロボットの目標位置をできるだけ小さくするようにモデル予測制御の考えに従って、各ロボットに対する制御入力（速度、角速度）を算出する。そして算出された制御入力を積分することで移動経路（位置、姿勢）を算出する。

特開２０２１－７７０９０号公報

　特許文献１によれば、事前に倉庫や工場内に詳細な通路情報を設計せずに、ロボットが目標値にたどり着く経路を算出することができる。

　然しながら、特許文献１はモデル予測制御の考え方に従っているため、モデル予測制御自体が抱える課題をそのまま受け継いでしまう。モデル予測制御は特定の評価関数を最小化するように制御入力を算出する手法であるが、評価関数の最小化（もしくは最大化）には、例えば勾配法など数値最適化手法を利用するため、算出される最適解が大域的最適（グローバル最適）にならず、局所最適（ローカル最適）になる可能性が高い。

　このように、特許文献１の手法によれば、局所最適の状態に陥り、ロボットが動作できなくなる状態（スタック、デッドロック）が非常に多く存在する恐れがある。

　本発明は以上の課題を解決するためになされたものであり、事前に詳細な通路情報を設定することなく、かつ、デッドロックを生じない経路計画装置、その適用設備、並びに経路計画方法を提供することを目的とする。

　以上のことから本発明においては、「複数のエージェントの移動先を決定する業務管理部と、エージェントが存在するエリアの地図情報を管理する地図情報管理部と、エージェントの個体情報を管理するエージェント情報管理部と、地図情報管理部とエージェント情報管理部の情報に基づいて、各エージェントを業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、各エージェントについて、エージェント間の距離が、エージェント情報管理部にて各エージェントに応じて設定される所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、経路計画計算部は、各時刻において、主目的達成評価部、主目的達成補助部、およびエージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、さらに、経路計画計算部で算出した経路計画を、全エージェントに伝達する行動計画伝達部を備えることを特徴とする経路計画装置。」とする。

　また本発明においては、「複数のエージェントの移動先と、エージェントが存在するエリアの地図情報と、エージェントの個体情報に基づいて、各エージェントを移動先に移動させるための経路計画を生成し、各エージェントについて、位置が目標位置に近づくほど高い評価を行う第１の評価と、各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う第２の評価と、各エージェントについて、エージェント間の距離が、各エージェントに応じて設定される所定の値に近づくほど低い評価を行う第３の評価を求め、各時刻において、第１の評価、第２の評価、および第３の評価による総合結果が、以前の評価値よりも向上するように経路計画を生成し、全エージェントに伝達することを計算機により実現することを特徴とする経路計画方法。」とする。

　また本発明においては、「経路計画装置が適用され、ビーコン及び、あるいは監視カメラによりエージェントの情報が入手されて、行動計画が前記エージェントに伝達される物流現場。」とする。

　また本発明においては、「経路計画装置が適用され、監視カメラによりエージェントの情報が入手されて、行動計画がデジタルサイネージに伝達される駐車場。」とする。

　本発明によれば、事前に精緻な地図情報を用意せずに、各エージェントが安全性や動作制約を考慮したうえで、デッドロックを生じない移動経路を生成できる。

　よって本発明の実施例によれば、エージェントの経路計画のエンジニアリングコストを大幅に抑制できる。また、個々のエージェントに対して移動計画をそれぞれ実行するのではなく、全エージェントの移動経路を同時に生成するため、全体最適化を実現できる。

本発明の実施例１に係る経路計画システムの全体構成例を示す機能ブロック図。本発明の実施例１に係る経路計画装置１の機能例を示すブロック図。エージェントの座標を示す図。エージェントの座標を示す図。エージェント間距離に関する評価関数の一例を示す図。従来における評価関数の特性例を示す図。エリア平面の位置例を示す図。評価関数が大域最適以外の局所最適を持つ特性の場合を示す図。円周上が局所最適解になる事例を示す図。２台のロボットが相手ロボットの後側の目標地点ｑに移動する状況を示す図。互いの偏差が一定になる円弧上に固定される動作を示す図。（１２）式の評価関数の特性例を示す図。 γｉの与え方の一例を示す図。（１３）式の評価関数の特性例を示す図。２次元平面におけるエージェント位置、走行軌道と目標地点ｒを示す図。２次元平面におけるエージェント位置と目標地点の偏差の時間変化を示す図。本発明の実施例２に係る制御システムの全体的な処理手順を示す図。処理機能ＦＣ６に示した主目的達成補助評価部４２の詳細なフローを示す図。経路計画装置１の更新タイミングの一例を示す図。スタック状態を初期状態として示した図。速度低下時の状態を示す図。総合評価の形状を示す図。局所最適からの移動を示す図。大域最適解の探索を示す図。図６ｂのときの主目的達成評価部４３の評価を示す図。局所解を持たない形状の評価関数を示す図。スタック回避の状況を示す図。スタックが発生する偏差ｅｂ１にエージェントが接近した状態を示す図。ペナルティが増加したときの総合評価値の形状を示す図。スタック回避の状況を示す図。作業員と自動化機械が混在する倉庫の例を示す図。予測ステップｋ＝５までに生成されるエージェントの経路の例を示す図。自動化機械が衝突防止方向に経路変更されたことを示す図。自動化機械が衝突防止のために停止することを示す図。２台の自動化機械が互いの後方に目標位置を与えられた状況示す図。２台の自動化機械が停止してしまう状況を示す図。交差する通路を活用して接触を回避する経路が生成された状況示す図。非自動化車両と自動化車両が混在する駐車場を示す図。駐車場に従来技術を適用したときに発生し得る経路計画の例を示す図。本発明を適用した場合に生成される経路計画の例を示す図。

　以下、本発明の実施例について、図面を参照して説明する。

　なお以下においては、実施例１で経路計画システムの全体構成例を、実施例２で経路計画の処理フローを、実施例３でスタック状態から脱出できる仕組みを、実施例４で物流現場への適用事例を、実施例５で駐車場への適用事例を説明する。

　図１は、本発明の実施例１に係る経路計画システムの全体構成例を示す機能ブロック図である。図１において、経路計画システム１０は、経路計画装置１が、監視装置２及びエージェント３からの位置情報Ｓ１、Ｓ２を得て、エージェント３に行動計画情報Ｓ３を与えるものである。ここでは、説明を簡略化するために、エージェント３（ロボット、車両、人など移動するすべての対象を含む）が１台（１人）しかいない場合を示すが、エージェントの数が増えたとしても基本的な構成は変わらない。

　このうちエージェント３は、通信部３１、自己位置取得部３２、他者位置取得部３３、経路追従部３４を備える。なお、すべてのエージェントは、これらの機能を備えている。
ただしエージェント３が人である場合には、人の位置が何らかの手段（例えば監視装置２）により把握され、人に対して行動計画を伝達できることが満たされていればよい。

　つまり、エージェント３が移動ロボットであり、かつ、移動ロボットがＬｉＤＡＲ（Ｌｉｇｈｔ　Ｄｅｔｅｃｔｉｏｎ　Ａｎｄ　Ｒａｎｇｉｎｇ）などの環境情報を取得するセンサを備えており、さらに、これらのセンサ情報を利用したＳＬＡＭ（Ｓｉｍｕｌｔａｎｅｏｕｓ　Ｌｏｃａｌｉｚａｔｉｏｎ　Ａｎｄ　Ｍａｐｐｉｎｇ）によって自己位置を算出する場合、点群情報として他のエージェント３の位置情報を取得することもできる。このような場合は、自己位置取得部３２と他者位置取得部３３を同時に実行することができる。

　一方、エージェント３が作業員の場合、エージェント自身は特定の機能を備えることはできない。ただし、作業員がＷｉｆｉやＢｌｕｅｔｏｏｈなどの無線通信機能を有するタブレットを保有していれば、通信部３１、自己位置取得部３２の機能を代替できる。また、作業員がタブレットに示された移動指示に従えば、経路追従部３４の機能が代替されていると言える。ただし、タブレットには他のエージェント３の位置情報を取得する機能がないため、作業員は他者位置取得部３３を有さないエージェント３として扱われる。

　エージェント３が移動ロボットの場合、経路計画装置１内の行動計画伝達部１５から配信された行動計画（経路計画）についての指令値Ｓ３を通信部３１で受信し、受信した経路計画に従うように経路追従部３４で各アクチュエータ（モータなど）を制御する。また、ＬｉＤＡＲ－ＳＬＡＭによって取得した位置情報（自己位置や他者位置）Ｓ２を通信部３１から経路計画装置１内のエージェント情報管理部１３へと送信する。なお、ＬｉＤＡＲ－ＳＬＡＭを利用する場合、管理エリアの地図情報も取得できるため、倉庫のレイアウト変更など地図情報に変更があった場合、この情報を地図情報管理部１２へ送信してもよい。

　なお、エリア内のエージェント３の位置情報Ｓ１は、エリア内に備えられた監視装置２内のエージェント位置取得部２２（監視カメラやビーコンなど）で取得し、監視装置２に備えられた通信部２１を介して、経路計画装置１内のエージェント情報管理部１３に渡してもよい。

　図２は、本発明の実施例１に係る経路計画装置１の機能例を示すブロック図である。図２において、経路計画装置１は、管理対象エリア（例えば、倉庫や駐車場）内のすべてのエージェント３（ロボット、車両、人など移動するすべての対象を含む）の位置やＩＤなどを管理するエージェント情報管理部１３から得られるエージェント情報Ｓ６、管理対象エリアにおけるエージェントの業務内容（移動先）を管理する業務管理部１１から得られる業務情報Ｓ４、管理対象エリアの地図情報を管理する地図情報管理部１２から得られる地図情報Ｓ５を入力情報として、各エージェント３に対する移動経路を経路計画部１４で算出する。経路計画部１４で算出した経路計画Ｓ３は行動計画伝達部１５により、管理対象エリアにいるエージェント３に送信される。

　なおエージェント情報管理部１３、業務管理部１１、地図情報管理部１２から得られる情報Ｓ６、Ｓ４、Ｓ５によれば、各エージェント３が、現時点で管理対象エリア内のどの位置に存在していて、どこの場所に行って、何をするのかが過去及び将来における行動として、時系列的に把握されていることになる。

　経路計画部１４は、主目的達成評価部４３、エージェント間距離評価部４１、主目的達成補助部４２、経路計画計算部４４から構成されて、経路計画計算部４４の出力を行動計画情報Ｓ３とする。

　なお図２における経路計画部１４の構成に関して、主目的達成評価部４３、エージェント間距離評価部４１、経路計画計算部４４は、従来から備えられている機能であるが、本発明ではこれに対して主目的達成補助部４２の機能を追加したものということができる。
基本的には、従来構成である主目的達成評価部４３とエージェント間距離評価部４１と経路計画計算部４４の機能により経路計画が可能であるが、この経路計画によりロボットが動作できなくなる状態（固着状態：スタック、デッドロック）に陥った場合に、主目的達成補助部４２の機能により固着状態から脱出するものである。

　まず、従来部分の機能について説明する。主目的達成評価部４３は、管理対象エリアにおけるエージェントの業務内容（移動先）を管理する業務管理部１１から得られる業務情報Ｓ４と、管理対象エリアの地図情報を管理する地図情報管理部１２から得られる地図情報Ｓ５を入力情報としている。これらの情報により、主目的達成評価部４３では、各エージェント３が達成すべき業務、つまり、特定位置（目標地点）への移動を達成するために利用される評価値の算出を行う。

　主目的達成評価部４３の処理の考え方について図３ａと図３ｂを用いて説明する。これらの図は、Ｘ－Ｙ座標で示される管理対象エリア内におけるエージェント３の現在位置を表している。

　ｉ番目のエージェント３が移動ロボットであるときに、図３ａのように自身の位置（ｘ_ｉ，ｙ_ｉ）及び姿勢θ_ｉから構成される位置ベクトルをｐ_ｉで定義すると、目標位置ｒ_ｉ＝（ｒｘ_ｉ，ｒｙ_ｉ，ｒθ_ｉ）への移動は自身の位置ベクトルｐ_ｉと目標位置ｒ_ｉの偏差ｅ_ｉを、例えば（１）式を用いて０に近づけることが経路計画の目標になる。

　なお、図３ａの移動ロボットの運動方程式は（２）式で与えることができる。ここで、ｖｉはエージェントｉの移動速度、ωｉはエージェントｉの角速度であり、制御入力は（ｖ，ω）の２入力で与えることができる。

　一方、図３ｂのように、エージェント３がオムニホイールで駆動されるロボットや作業員（人間）の場合、Ｘ、Ｙ方向に自在に移動できるため、運動方程式は（３）式に従うことになる。この場合、制御入力が（ｖｘ，ｖｙ，ω）の３入力になる。

　なおエージェント３を早く動かす方が移動効率は良いが、一方でエネルギ消費量も増加してしまう。各時刻のエネルギ消費は、エージェントの速度や角速度の関数として（４）式で与えることができる。

　よって、エネルギ消費量を抑制しながら、エージェント３が目標値に到達するには、（５）式のように、自身の位置ｐと目標地点ｒの偏差ｅとエネルギ消費量Ｅから構成される評価値を利用することが望ましい。

　ここで、ｋは時刻を意味し、ｋ０は評価開始時刻、ｋＮは評価終了時刻である。αは偏差に関する重みであり、βは消費エネルギに関する重みである。αとβのバランスを調整することでエージェント３の行動を調整できる。例えば、αに比べてβを大きくすると消費エネルギを抑制する、省エネモードの動作を実現できる。一方、βを０にすると、消費エネルギを考慮しないで最も早く移動する経路を計算することになる。

　（５）式をＮ台の全エージェント３について、考慮した（６）式を評価することが主目的達成評価部４３の機能となる。

　次に、同じく従来部分の機能である図２のエージェント間距離評価部４１について説明する。エージェント間距離評価部４１は、管理対象エリア内のすべてのエージェント３の位置やＩＤなどを管理するエージェント情報管理部１３から得られるエージェント情報Ｓ６と、管理対象エリアの地図情報を管理する地図情報管理部１２から得られる地図情報Ｓ５を入力情報としている。これらの情報により、エージェント間距離評価部４１は、各エージェントが接触すること防止するために、エージェント情報管理部１３から受け取った各エージェント間の距離が所定以上になるように主目的達成評価部４３の評価値を補正する機能を有する。

　位置ベクトルＰｉのエージェントｉと位置ベクトルＰｊのエージェントｊの距離ｄｉｊは（７）式で算出することができる。この距離ｄｉｊがエージェントごとに与えられる余裕距離ｄａ以上になる、つまり、（８）式を満足するように経路計画を実行する。

　（８）式を実現するには、後述の経路計画計算部４４の最適化計算における拘束条件として組み込んでもよい。また、（９）式のような評価関数を導入してもよい。（９）式のεはゼロ割を回避するための微小係数である。

　なお、（９）式は（９ａ）式と（９ｂ）式を含んでいる。（９ａ）式は特定の時刻のみの評価であり、（９ｂ）式はモデル予測制御の考えに従って評価時刻の予測期間ｋ＝ｋ０からｋＮまでの全ての評価を示す。

　説明の簡略化のため、特定の一時刻の評価である（９ａ）式に注目する。図４は、（９ａ）式の評価関数を示す図であり、横軸にエージェント間の距離ｄｉｊ、縦軸に評価関数の大きさを示している。ここでは、（９ａ）式の評価関数は図４のような形状になるため、エージェント間の距離ｄｉｊが余裕距離ｄａに近づくほど、大きな値をとる。つまり、エージェント間の距離が近づくほどに大きな罰則（ペナルティ）を与えることによって、各エージェント３の接触を防止することができる。

　次にエージェント間距離評価部４１の特徴点について説明する。ここで、余裕距離ｄａはエージェント情報管理部１３が保有しているエージェント情報Ｓ６に従って変更することが望ましい。

　表１は接触安全性に注目して設計された余裕距離ｄａの一例である。エージェント種別（作業員、低速機械、高速機械）ごとの接触を想定している。作業員は移動速度も遅く、作業員同士であれば接触しても事故になる可能性が低いため、エージェントの余裕距離ｄａは３０ｃｍになる。一方、高速機械（フォークリフトなど）が人と接触すると重大な事故になりえるため、余裕距離ｄａは１００ｃｍとする。ほかの組み合わせも同様の指針で設計される。

　表２は表１に加えて、感染症予防の観点を追加した余裕距離ｄａの設計例である。ここでもエージェント種別（作業員、低速機械、高速機械）ごとの接触を想定している。人と機械であれば、飛沫感染の可能性は少ないため、余裕距離ｄａは表１と同様である。一方で、人同士がすれ違うと飛沫感染の可能性が高まるため、余裕距離ｄａを大きくとることでソーシャルディスタンスを確保することが望ましい。表１、表２ともに余裕距離ｄａはエージェントの特性のみで決まるのではなく、エリアの通路幅などにも依存することになる。

　なお、地図情報管理部１３から受け取った地図情報Ｓ５における障害物（壁や柱など）を仮想的なエージェントとして扱い、各エージェントと障害物の距離ｄｉを（９）式と同様の形式で評価すれば障害物との接触回避も実現できる。もしくは、障害物情報をコストマップＣに保存しておき、コストマップにおける各エージェントの位置ｐｉを評価するように（１０）式を利用してもよい。

　以上が、従来の経路計画装置における制御であり、主目的達成評価部４３とエージェント間距離評価部４１と経路計画計算部４４の機能により経路計画が可能であるが、この経路計画によりロボットが動作できなくなる状態（固着状態：スタック、デッドロック）に陥った場合に、固着状態から脱出することができないものであった。固着状態から脱出できないことについて、図５ａ，図５ｂ，図５ｃ，図５ｄ，図６ａ，図６ｂを用いて説明する。

　たとえば、特許文献１では、ｍ台目のロボットの現在位置をｐｍ、目標位置をｑｍとして、その偏差をｅｍ＝ｐｍ－ｑｍで与え、（１１）式のような評価関数を設計している。

　ここで、ロボットが１台しか存在せず（ｍ＝１の場合）、かつ、障害物が存在しない場合、評価関数は図５ａのような形状（横軸：偏差、縦軸：評価関数）になるため、評価関数を最小化するように制御入力を算出すれば、偏差ｅが０になる（ロボットが目標値に到達する）状態を達成できる。

　ただし、図５ｂのエリア平面に示すように、ロボットの現在位置ｐ１と目標地点ｑ１の間に障害物が存在する場合には、前述のような動作を実現することができなくなる。図５ｂの場合、（１１）式を小さくするには、Ｙ軸を正方向に移動する動作が選択されることになる。しかし、Ｙ軸正方向に移動すると障害物があり、それ以上、目標地点ｑ１に接近することができなくなってしまう。

　このような状態から抜け出すには、Ｙ軸負方向に移動する必要があるが、自身の位置ｐ１と目標地点ｑ１との偏差ｅ１が増加するため、評価関数の値が増加してしまう。よって、制御入力は特許文献１の手法では算出できない。このような状況は図５ｃに示すように、評価関数が大域最適以外の局所最適を持つ場合に発生する。

　同じような状況は障害物（通路）の反対側に目標地点ｑ１がある場合には必ず発生する。例えば、図５ｄのような状況でロボットがＸ軸正方向に移動していると、目標地点ｑ１との偏差ｅ１が特定の距離になる円周上が局所最適解になる。この地点よりもＸ軸正方向に移動するにはＹ軸負方向への移動を伴う円弧運動をとらない限り評価関数が増加する。
円弧運動を行ってＢ地点にたどり着いても障害物があるため、ロボットはそれ以上進むことができなくなってしまう。

　前述のとおり、特許文献１の手法では、ロボットが１台しかいない環境でもロボットが目標地点に到達できない可能性がある。ロボットが複数台になると、さらにロボットが目標地点に到達することが困難になる。

　例えば、図６ａのように２台のロボットがそれぞれ相手ロボットの後ろ側にある目標地点ｑに移動する状況を考える。仮に、丸いロボット（ｍ＝１）がＹ軸負方向に移動して、四角いロボット（ｍ＝２）が通過するのを待つ、もしくは迂回する動作（図中、迂回ルートを生成）を実現できれば、２台のロボットはそれぞれ目標地点ｑに到達できる。

　しかし、そのような動作は丸いロボットの偏差ｅ１を増加させない限り生成されない。
偏差ｅｍを減少するようにして実現される動作は図６ｂに示すように互いのロボットが前進し、衝突回避のために設定された距離ｄ離れた状態で、互いの偏差ｅｍが一定になる円弧上に固定される動作である。

　このように、従来においては（６）式でβ＝０とした評価関数（（１１）式）を最小化するように制御入力（ｖｉ，ωｉ）を算出し、その結果を利用すると経路を算出しようとすると、局所最適に陥り、エージェントが移動できなくなってしまう状況がある。

　ここで、局所最適に陥り、エージェントが移動できなくなってしまう状況について、さらに検討すると、いくつかのパターンに整理することができる。このことから本発明では、各パターンに対応した対応策を提案する。

　本発明の主目的達成補助部４２は、このような状況を解消し、各エージェントが目標地点ｒに到達することを補助するために導入される。まず、各エージェントがデッドロックになってしまうという状況は、エージェントの移動速度が０（ゼロ）になる、と言い換えることができる。本発明が想定する第１のパターンがこれである。

　主目的達成補助部４２では、この第１のパターンの状況を回避するために、（１２）式の評価関数を導入する。なお（１２）式は（１２ａ）式と（１２ｂ）式を含んでいる。（１２ａ）式は特定の時刻のみの評価であり、（１２ｂ）式はモデル予測制御の考えに従って評価時刻の予測期間ｋ＝ｋ０からｋＮまでの全ての評価を示す。以降の説明は、（１２ａ）式を使用して行うものとする。

　（１２ａ）式は図７ａのような形状（横軸：ｖ_ｉ ^２，縦軸：評価関数の大きさ）になるため、各エージェントの移動速度ｖｉが０（ゼロ）に近づくほど、大きな罰則を与えることになる。このような関数を評価関数に加えることによって、エージェントが停止状態を解消するような動作が生成される。

　より具体的には、自己位置ｐと目標地点ｒとの偏差ｅが増えても、移動速度ｖｉが０（ゼロ）になるよりは合計の評価関数が低くなる。結果、図５ｂ、図６ａ，図６ｂのような状況で、エージェントは迂回するような挙動を実現することができる。同様に、図５ｄのような状況も解消することができる。

　なお、速度ｖｉが０（ゼロ）になるときにペナルティを与えると、エージェントが目標地点ｒに到達しても停止することができなくなってしまう。これを回避するために図７ｂ（横軸：ｅ_ｉ，縦軸：　γｉ）に示すように、エージェント位置ｑと目標地点ｒの偏差ｅｉが所定値ｅｔｈ以下になったらγｉ＝０とするように変更する。γｉ＝０であれば、速度ｖｉが０（ゼロ）になってもペナルティは与えられないので、エージェントは目標地点に到達することができる。

　なお、図７ｂはγｉの与え方の一例であり、偏差ｅｉが０のときに、γｉ＝０を満足していれば、どのような方法で設計してもよい。

　さらに、各エージェントがデッドロックになってしまうという状況は、エージェントが特定の位置ｐａにとどまっている状態、と言い換えることができる。本発明が想定する第２のパターンがこれである。

　主目的達成補助部４２では、この第２のパターンの状況を回避するために、（１３）式の評価関数を導入する。なお（１３）式は（１３ａ）式と（１３ｂ）式を含んでいる。（１３ａ）式は特定の時刻のみの評価であり、（１３ｂ）式はモデル予測制御の考えに従って評価時刻の予測期間ｋ＝ｋ０からｋＮまでの全ての評価を示す。以降の説明は、（１３ａ）式を使用して行うものとする。

　（１３ａ）式は図８のような形状（横軸：（Ｐａ－Ｐｉ）^２，縦軸：評価関数の大きさ）になるため、各エージェントの位置ｐｉがｐａに近づくほど、大きな罰則を与えることになる。このような関数を評価関数に加えることによって、エージェントが停止状態を解消するような動作が生成される。

　なお特定の位置ｐａは、事前にデッドロックを生じることが予測できる地図形状であれば、地図情報管理部１２に記録しておくことが望ましい。

　また、エージェント情報管理部１３で取得した各エージェントの位置ｐｉが一定時間変化しない場合、そのエージェントの位置ｐｉを前述の特定位置ｐａとして設定してもよい。このような方法を採用すると、ｐａ＝ｐｉが設定されたタイミングで大きなペナルティが課されるため、ｉ番目のエージェントがすぐに動き出すことが期待される。エージェントが移動し始めたら、設定したｐａを解除することが望ましい。

　また、各エージェントが停止状態になっていないが、目標地点に到達できない状況も考えられる。例えば、図９ａに示すように、エージェント３が目標地点と一定距離以上離れたまま円周上動作を一定速度で走行する状況がこのような状況に相当する。本発明が想定する第３のパターンがこれである。

　図９ａは、２次元平面におけるｉ番目のエージェントの位置Ｐｉ、および走行軌道と目標地点ｒを示しており、図９ｂはｉ番目のエージェントの位置Ｐｉと目標地点の偏差の時間変化を示している。このとき、、エージェント３は、目標地点ｒｉと一定距離以上離れたまま，円周上（偏差の最小値ｍｉｎ　ｅｉ、偏差の最大値ｍａｘ　ｅｉ）で、動作を一定速度で走行している。

　図９ａの状況では、エージェントが一定速度で動作しているため、（１２）式でペナルティを与えることは難しい。また、エージェントが特定位置に留まっているわけではないので、（１３）式でペナルティを与えることも難しい。

　各エージェントが停止状態、もしくは、図９ａのような状況は、所定時間内に確認された偏差ｅｉの最小値ｍｉｎ　ｅｉが更新されない状況と言い換えることができる。このような状況を解消するために、（１４）式に示すように、各エージェントの偏差ｅｉの積分値を評価するペナルティを導入する。図７のように円軌道で走行していると、時間が経過するほど偏差の積分値が大きくなるため、円軌道を逸脱する動作が選択されやすくなる。

　（１４）式は、偏差ｅｉを評価するという点では、（６）式において、β＝０とした評価関数に類似するが、（６）式は「ｋＮ－ｋ０」分の時間の偏差の累積値しか評価しないことに違いがある。たとえば、図９ｂの時刻ｔａから時刻ｔｂが「ｋＮ－ｋ０」に相当すると（６）式の評価値は減少しているため、適切な動作が生成されていると判断される。
一方、（１４）式は偏差ｅｉが０でない限り増加するため、より長期的に評価が実現できる。

　なお、（１４）式を利用すると過去の偏差ｅｉがすべて影響するため、最小値ｍｉｎ　ｅｉが更新されるたびに積分をリセットすることと、重みηｉをゼロにする操作を加えることが望ましい。

　以上のように、主目的達成補助部４２は、上記に示したパターンに対応する複数の対策手法を備えることで、脱出機能を実現することができる。主目的達成補助部４２は以上のいずれの方法の少なくとも１つ備えていれば良い。当然、前述の３つの手法すべてを備えていても良い。

　図２に戻り、経路計画計算部４４は、主目的達成評価部４３、エージェント間距離評価部４１、主目的達成補助部４２の、それぞれで設定した評価関数を統合し、その評価関数の値を最小化するように制御入力ｕを算出する。

　具体的には、各要素で設定した評価関数ＪＩを、重み係数αＩを利用して統合した評価関数（（１５）式）を最小化するように制御入力ｕを算出する。なお、主目的達成補助部４２のうち、特定の手法を無効化する場合は、対応する重み係数αＩ（Ｉ＝４、５、６）を０（ゼロ）にすればよい。

　制御入力ｕの算出方法自体は、よく知られたモデル予測制御の考えに従っており、特段の工夫はないため、説明は省略する。

　各時刻で最適な制御入力ｕが求まれば、対応する運動方程式（（２）式、（３）式）を利用して位置（ｘ、ｙ）と方位（θ）の時系列データを容易に生成できる。この時系列データが各エージェントに対する経路計画になる。この経路計画自体は特許文献１と同様であり、広く知られた手法であるため、具体的な説明は省略する。

　また経路計画計算部４４は、パターンを判別して特定の対策手法を実行するものとしてもよく、或は複数の対策手法を順次実行していずれかにより解消するのを待つことにしてもよい。

　算出された経路計画は行動計画伝達部１５を介して、各エージェントに配信される。

　実施例１では、経路計画システムの全体構成例を説明した。実施例２では、経路計画システムにおける処理フローについて説明する。

　本発明の実施例２に係る制御システムの全体的な処理手順を図１０のフローチャートを用いて説明する。

　まず、処理機能ＦＣ１からＦＣ３で経路計画装置１の計算に必要な情報を取得する。処理機能ＦＣ１では、エリア内のエージェントの位置情報Ｓ６を取得する。この機能は、エージェント情報管理部１３に相当する。処理機能ＦＣ２では、エリア内の各エージェントに与える業務内容Ｓ４（移動すべき目標地点ｒｉ）を取得する。この機能は、業務管理部１１に相当する。処理機能ＦＣ３では、エリア内の地図情報Ｓ５を取得する。この機能は、地図情報管理部１２に相当する。なお地図情報Ｓ５は業務内容やエージェントの位置情報に比べて、更新頻度が遅いため、必ず毎ステップで更新する必要はない。なお、処理機能ＦＣ１から処理機能ＦＣ３の処理順番はどのような順番でも良く、処理機能ＦＣ４以降に遷移する前にすべての情報がそろっていることが重要である。

　処理機能ＦＣ４では、処理機能ＦＣ１と処理機能ＦＣ２で取得した各エージェントの位置Ｓ６、業務内容Ｓ４に従って、各エージェントが目標地点に移動するための評価を行う。この機能は、主目的達成評価部４３に相当する。

　処理機能ＦＣ５では、処理機能ＦＣ１と処理機能ＦＣ３で取得した各エージェントの位置Ｓ６、および、地図情報Ｓ５を利用して、各エージェントが障害物や他のエージェントにも接触しないように行動するための評価を行う。この機能は、エージェント間距離評価部４１に該当する。

　処理機能ＦＣ６では、処理機能ＦＣ１から処理機能ＦＣ３で取得した各情報Ｓ４，Ｓ５，Ｓ６を利用して、各エージェントが目標地点に移動する過程で停止してしまう状況を解消するための評価を行う。この機能は主目的達成補助部４２に該当する。

　処理機能ＦＣ４から処理機能ＦＣ６も処理順番はどのような順番でも良く、処理機能ＦＣ７以降に遷移する前にすべての情報がそろっていることが重要である。上述のとおり、モデル予測制御の考えを利用する場合、処理機能ＦＣ４から処理機能ＦＣ６は初期時刻ｋ０から予測ステップ分（ｋＮ－ｋ０）先までの値を評価することになる。

　処理機能ＦＣ７では、処理機能ＦＣ４から処理機能ＦＣ６で算出した評価関数を最小化するように各エージェントの制御入力を算出し、その入力を積分することで移動経路を算出する。この機能は、行動計画計算部４４に相当する。

　処理機能ＦＣ７で経路計画が生成されたら、処理機能ＦＣ８に遷移する。

　処理機能ＦＣ８では、処理機能ＦＣ７で生成された経路計画を各エージェントに配信する。この機能は行動計画伝達部１５に相当する。

　処理機能ＦＣ６に示した主目的達成補助評価部４２の実施例に関して、より詳細なフローチャートを、図１１を用いて説明する。

　図１１の主目的達成補助評価部４２の最初の処理機能ＦＣ６１では、主目的達成補助評価部４２におけるパターン１に対する第１の実現手段である目標地点以外の箇所での減速にペナルティを与える機能を有効にするかを判断する。本機能が有効である場合（ＹＥＳ）は処理機能ＦＣ６２に遷移し、無効である場合（ＮＯ）は処理機能ＦＣ６３に遷移する。

　第１の実現手段を有効にするか否かは、ユーザ（エリア管理者）の設定で切り替えても良い。さらに、ユーザが第１の実現手段を有効にすると判断した状態でも、エージェント３が目標地点の近くにいるのであれば、本機能は無効になる。

　処理機能ＦＣ６２に遷移したとき、ここでは（１２）式に従って、目的地点以外での停止（減速）に対するペナルティ値を算出する。

　処理機能ＦＣ６３に遷移したとき、ここでは主目的達成補助評価部４２におけるパターン２に対する第２の実現手段である目標地点以外の特定位置ｐａに留まることにペナルティを与える機能を有効にするかを判断する。本機能が有効である場合（ＹＥＳ）は処理機能ＦＣ６４に遷移し、無効である場合（ＮＯ）は処理機能ＦＣ６７に遷移する。

　第２の実現手段を有効にするか否かは、ユーザの設定で切り替えても良い。さらに、ユーザが第２の実現手段を有効にすると判断した状態でも、エージェントが停止していないのあれば、本機能を無効にしても良い。

　処理機能ＦＣ６４では、ｉ番目のエージェントが停止している位置ｐｉをペナルティ計算のための特定位置ｐａとして与える。なお、地図形状からエージェントが停止することが事前に予測できる場合は、その位置をｐａとして事前に設定する処理で代替しても良い。

　処理機能ＦＣ６５に遷移すると、（１３）式に従って、目的地点以外の特定位置ｐａでの停止に対するペナルティ値を算出する。

　処理機能ＦＣ６６では、主目的達成補助評価部４２におけるパターン３に対する第３の実現手段であるエージェント位置と目標地点の偏差の積分を利用してペナルティを与える機能を有効にするかを判断する。本機能が有効である場合（ＹＥＳ）は処理機能ＦＣ６７に遷移し、無効である場合（ＮＯ）は処理機能ＦＣ６０に遷移する。

　第３の実現手段を有効にするか否かは、ユーザの設定で切り替えても良いが、第１、２の実現手段をユーザが無効にした場合は、自動的に有効にすることが望ましい。なお、後述の具体的な実施形態に示す通り、エージェントが作業員の場合、デッドロック（立ち往生）するような状況は作業員自身で解消できるため、そのような場合に限り、第１から第３の実現手段をすべて無効にしても良い。

　処理機能ＦＣ６７に遷移すると、特定時間のエージェント位置と目標地点の偏差の変化量を分析する。処理機能ＦＣ６８では、処理機能ＦＣ６７で取得した偏差の最小値が変化していれば（ＹＥＳ）、処理機能ＦＣ６９ｂに遷移する。一方、処理機能ＦＣ６７で取得した偏差の最小値が変化していない場合（ＮＯ）は処理機能ＦＣ６９ａに遷移する。

　ＦＣ６９ａでは、（１４）式に従って、偏差ｅｉの積分値を利用したペナルティを算出する。処理機能ＦＣ６９ｂでは、偏差ｅｉの積分値をリセットする操作を行う。処理機能ＦＣ６９ａに遷移した時のみに、積分値を計算する処理を実施している場合は、処理機能ＦＣ６９ｂの処理は行わなくても良い。

　処理機能ＦＣ６０では、処理機能ＦＣ６２、ＦＣ６５、ＦＣ６９ａで計算したそれぞれのペナルティを加算することでペナルティを統合する。処理機能ＦＣ６２、ＦＣ６５、ＦＣ６９ａのうち計算が実施されなかった値は０（ゼロ）で代替する。

　次に、経路計画装置１の更新タイミングの一例を、図１２を用いて説明する。本例は、エージェント数がＮ＝３の時（３Ａ，３Ｂ，３Ｃ）を考えているが、エージェント数が増えた場合であっても同様の処理を行うことができる。

　まず、経路計画装置１が動き出す時刻ｔ０では、すべてのエージェントが停止していることを想定する。経路計画装置１は、各エージェント３の位置情報などを入力として受け付けると、経路計画の計算を行い、各エージェント３に対する経路計画を順次配信する。

　最初の経路が時刻ｔ１に配信されると、各エージェントが目標地点に移動を開始する。
エージェント３ごとに目標地点ｒまでの移動距離も移動速度も異なるため、移動時間は一致していないことが多い。

　このうちエージェント３Ａについてみると、時刻ｔ２で目標地点に到達し、到達を検知した経路計画装置１はエージェント１に対して、新しい目標地点を付与して再度経路計画を行う。再度の経路計画は、入力、計算、出力の順序で実行され、時刻ｔ３においてエージェント３Ａに対する再経路計画が送信可能となる。

　この経路計画の計算時点（ｔ２－ｔ３間）では、エージェント３Ｂ、エージェント３Ｃは既に経路を与えられているため、エージェント３Ａのみの経路計画としても良い。ただし、全エージェントの経路計画を行う方が、全体最適化になるため、エリア全体としてはより良い行動計画が実現できる。

　経路計画の計算が完了すると、時刻ｔ３で各エージェントに新しい経路計画が与えられる。以降、各エージェントが目標地点に到達するごとに同様の処理が実行される。

　ただし、例えば、倉庫内で荷崩れが起きて特定の通路が通行不可になったなど、経路計画の再実施が必要になった場合には、どのエージェントも目標地点に到達していない時刻ｔ４に割り込み処理を行っても良い。

　実施例３では、上記した実施例の手法によりスタック状態から脱出できる仕組みについて時系列をもって説明する。

　まず、エージェント３が１台でスタックが発生する図５ｂのケースを想定する。なお、説明を簡単にするため、エージェント間距離評価部４１、主目標達成補助部４２がなく、主目的達成評価部４３のみであるとする。このときは評価関数の形状が、図５ｃのようになる。このため、経路計画計算部４４は総合評価を向上する（評価関数の値を小さくする）ために、偏差ｅを小さくするようにエージェントをｙ軸正方向に移動させる。

　図１３ａは、図５ｂと図５ｃを併記して、スタック状態を初期状態として示した図である。この特性では、大域最適に移行すべきところ、局所最適に陥っている。この時、図１３ａに示すように、評価関数の値はｆ１からｆ２へと減少する（総合評価は向上する）。
その後、エージェントと目標位置の間には壁があるため、それ以上エージェントは移動できなくなる。この状態からエージェントが引き返す動作（ｙ軸負方向への移動）をとると偏差ｅが増加するため、評価関数の値はｆ２よりも増加、つまり、総合評価が低下することになる。経路計画計算部４４は総合評価を向上する経路を算出する機能であるため、このような総合評価が低下する行動は算出できない。よって、エージェントは停止し続けることになる。

　つぎに、主目標達成補助部４２を追加した場合の動作を説明する。ここでは、エージェントは移動速度に注目した主目標達成補助部４２（（１２）式、図７ａ）が採用された場合について説明する。主目標達成補助部４２を追加した場合、図１３ａのようにエージェントが壁に近づこうとして減速を開始すると、図７ａに示した関数によって急速にペナルティ（罰則）が増加する。つまり、速度が低下するにつれて図１３ｂに示すように、主目標達成補助部４２の出力が増加する。結果として、主目標達成評価部４３と主目標達成補助部４２の和である総合評価が図１３ｃに示すような形状になる。つまり、エージェントが偏差ｅを小さくするための移動、および、壁への接近による減速に伴って、総合評価値がｆ１からｆ３へと増加（評価が低下）する結果になる。

　主目的達成評価部４３のみの場合、偏差ｅがｅａ１のときの図１３ａのように局所最適解に陥っていたのに対して、主目標達成補助部４２を追加すると、偏差がｅａ１のときは図１３ｃに示す通り、局所最適解でなくなる。これによって、図１３ｄに示すように、経路計画計算部４４は偏差ｅを小さくしながら、総合評価値を改善する解を探索することができるようになる。エージェントの速度が一定以上になると、主目標達成補助部４２によるペナルティの影響はなくなるが、図１３ｄのように偏差ｅがｅａ２を下回る状況になれば、局所解に陥ることなく、図１３ｅに示すように、経路計画計算部４４は偏差ｅが０になる大域最適解を探索することができる。

　次に、エージェント３が２台でスタックが発生する図６ｂのケースを想定する。図６ｂに示す状況の各エージェントの主目的達成評価部４３の評価を図１４ａに示す。図６ｂの状態では、位置ｐ１のエージェント３が迂回して目的地点へ移動する状況なので、図１４ａのように局所解を有する形状の評価関数になる。

　一方、位置ｐ２のエージェント３は直進のみで目標地点へ移動する状況なので図１４ｂのように、エージェント単独では局所解を持たない形状の評価関数になる。ただし、経路計画計算部４４は個別のエージェントの挙動を最適化するものではなく、全エージェントの行動を最適化するものであるため、総合評価値は図１４ａと図１４ｂを足し合した図１４ｃのような形状の評価関数の最適化を実施することになる。図１４ｃの評価関数は、合計の偏差ｅがｅｂ１に局所解が存在する。この局所解に陥った状況が図６ｂに示すお互いのエージェントが所定距離ｄ離れた状況から移動できない状況に相当する。

　これに対し、図１５ａに示すように、スタックが発生する偏差ｅｂ１に各エージェントが接近すると、各エージェントの速度が低下するため、主目標達成補助部４２により、ペナルティが増加する。ペナルティが増加することにより、経路計画計算部４４で利用する総合評価値の形状は図１５ｂのように変化し、偏差ｅｂ１の値は局所解でなくなる。よって、図１５ｃに示すように、もともとの局所解（ｅｂ１）で全エージェントがスタックしてしまう状況を回避することができる。

　実施例４では、本発明を工場、物流現場に適用することについて説明する。図１６は、エージェント３である作業員３Ｂと自動化機械（フォークリフト）３Ａが混在する倉庫１００を簡易的に表記した図である。図はわかりやすさを優先して作業員３Ｂも自動化機械３Ａも１台しか表記していないが、作業員、自動化機械ともに複数台いる環境でもよいし、自動化させていない通常の機械が混在していても良い。

　作業員３Ｂは図示しないスマートデバイスを装着、もしくは、保持している。スマートデバイスは、タブレット端末でも良いし、ゴーグルのように装着可能なモノであっても良い。スマートデバイスは、タブレット端末のモニタもしくはゴーグル内に目標地点への経路を表示することで作業員３Ｂに移動先を通知、誘導することができる。

　スマートデバイスは倉庫エリア１００内に配置されたビーコン１０３と無線通信を行うことで、スマートデバイスを装着、もしくは保有している作業員３Ｂの位置を計測することができる。また、スマートデバイスは通信機能を有しており、管制サーバ１０４と通信することができる。また倉庫エリア１００内に配置された監視カメラ１０１により、エリア内の様子が把握されている。

　管制サーバ１０４が本発明の経路計画装置１に相当する。なお、経路計画装置１の機能が同一のサーバで実施されなくても良い。例えば、処理負荷の高い経路計画計画部４４のみを特定のサーバで実行する形態にしても良い。また、管制サーバ１０４は必ずしも倉庫１００内に設置されている必要はない。

　自動化機械３Ａには図示しないＬｉＤＡＲが搭載されている。ＬｉＤＡＲで収集した点群データを処理することで自動化機械は倉庫地図の作成と自己位置推定を同時に実行するＳＬＡＭの機能が実装されている。さらに、自動化機械３Ａには図示しないコントローラが搭載されており、自動運転に関する各種演算が実行される。

　自動化機械３Ａのコントローラは通信機能を備えており、ＳＬＡＭで取得した自己位置、および、地図情報を管制サーバ１０４に送信するとともに、管制サーバ１０４から経路計画を受信する。コントローラは移動計画に従うように自動化機械３Ａのアクチュエータ（ステアリングモータ、走行モータなど）を制御する。作業員３Ｂや自動化機械３Ａが本発明におけるエージェント３に相当する。

　また、倉庫内に配置された監視カメラ１０１が本発明における図１の監視装置２に相当する。

　以下、図１の業務管理部１１において作業員３Ｂに棚１０２Ｂの位置ｒ１に物品を回収するように、また、自動化機械３Ａに棚１０２Ａの位置ｒ２の物品を回収するように作業が設定された状況を想定する。

　経路計画装置１は、作業員３Ｂをエージェント１、自動化機械３Ａをエージェント２として、それぞれが従うべき経路を算出する。

　まず、管制サーバ１０４は、作業員３Ｂが備えたスマートデバイスと自動化機械３Ａのコントローラからそれぞれの現在位置ｐ１、ｐ２を受信する。この機能は本発明のエージェント情報管理部１３に相当する。また、業務管理部１１が定めた作業員３Ｂ、自動化機械３Ａの目標地点をｒ１、ｒ２とする。

　経路計画部１４は作業員３Ｂを現在位置ｐ１から目標地点ｒ１に、自動化機械３Ａを現在位置ｐ２から目標地点ｒ２に導くように経路計画を行う。まず、両エージェントの位置が十分に離れているときは主目的達成評価部４３の評価値が支配的であるため、それぞれが最短ルートになるように経路が徐々に生成される。

　予測ステップｋ＝５までに生成される各エージェントの経路の例を図１７ａに示す。図１７ａの経路の時点（ｋ－５）から自動化機械３ＡがＹ軸負方向に移動する経路を引くと、時刻ｋ＝６で自動化機械３Ａと作業員３Ｂが接触する可能性がある。

　このような状況になると、エージェント間距離評価部４１によるペナルティが支配的になる。よって、図１７ｂに示すように、自動化機械３Ａは最短経路（Ｙ軸負方向への移動）ではなく、衝突を防止するＸ軸負方向に移動する経路を生成するようになる。以降は接触の可能性がなくなるため、それぞれが最短ルートをたどるように経路を順次生成する。

　なお、主目的達成評価部４３において（６）式のエネルギ消費量に関する重みβが大きく設定されている場合は、図１７ｂのように自動化機械３Ａを迂回させるルートを生成せず、図１７ｃのように、時刻ｋ＝４でたどり着いた位置ｐ２（４）で自動化機械３Ａを待機させる動作も実現し得る。図１７ｃでは、予測ステップk＝４からｋ＝７の間は、位置Ｐ２（４）に停止して移動しないことを表している。

　本発明を利用すれば、詳細な地図（ノード、エッジ情報）を事前に準備せずとも、評価関数の設計次第でさまざまな経路計画が自動的に実現されるため、エンジニアリングコストを大幅に抑制することができる。

　なお、図１７ｃの動作は主目的達成補助部４２の第１の実現手段によるペナルティ（（１２）式）の影響によっては実現することができない。ゆえに、エネルギ消費量を抑えることを重視する場合は、主目的達成補助部４２の第１の実現手段を無効にして、第２、第３の実現手段によって、デッドロックの発生を防止することが望ましい。

　次に、従来技術（特許文献１）ではデッドロックが生じ得るような状況として２台の自動化機械３Ｄ（エージェント１）、３Ｃ（エージェント２）が互いの初期位置ｐ１、ｐ２の後方に目標位置ｒ１、ｒ２が与えられた図１８ａの状況を考える。

　従来技術では、前述の図６ｂと同様の図１８ｂに示したようにそれぞれの自動化機械３Ｃ，３Ｄがある程度前進した位置（衝突しない距離）で停止してしまう。これは主目的達成評価部４３とエージェント間距離評価部４１しか有効でない状況で発生する固有の問題である。

　本発明を利用した場合も、最初は図１８ｂのような状況になり、車両が接触しないように減速を始める。その後、主目的達成評価部４３における偏差ｅを最小化しようとする評価指標（ｒをｑと読み替えた（１１）式）に比べて、主目的達成補助部４２の第１の実現手段によるペナルティが増加すると、偏差ｅを増加させてでも移動する経路が生成される。つまり、図１８ｃのように、交差する通路を活用して接触を回避する経路が生成される。

　以上のように、本発明を利用すれば、従来技術でデッドロックを生じる可能性がある状況でも、デッドロックを生じない経路を自動的に生成できる。ゆえに、デッドロック発生時のサービス員による遠隔操作も不要になるため、運用コストの抑制も期待できる。

　なお、作業員３Ｂは、自動化機械３Ａと異なり、自身の意思で自由に動き回ることができるため、スマートデバイスに与えた経路指示に従わないことも予想される。

　作業員３Ｂが経路指示に従ない場合は、経路計画装置１は、その作業員３Ｂを制御可能なエージェントとして扱わず、接触してはいけない障害物として扱うことになる。

　経路指示に従わないことが確認され次第、経路計画装置１は割り込み処理（図１２の時刻ｔ４）によって、その作業員３Ｂを除外したエージェントの経路計画を実施する。

　なお、作業員３Ｂが再び経路指示に従う意思をスマートデバイスから送信した場合は、同様に、経路計画装置１は割り込み処理によって、その作業員３Ｂを含めた全エージェントの経路計画を実施する。

　実施例５では、本発明を駐車場における経路計画に適用した場合を説明する。

　図１９は非自動化車両３Ｅと自動化車両３Ｆが混在する駐車場２００を簡易的に表記した図である。図はわかりやすさを優先して非自動化車両３Ｅも自動化車両３Ｆも１台しか表記していないが、非自動化車両、自動化車両ともに複数台いる環境でもよいし、非自動化車両が存在しない状況でも良い。

　非自動化車両３Ｅはカーナビゲーションシステムを備えているため、ＧＮＳＳ（Ｇｌｏｂａｌ　Ｎａｖｉｇａｔｉｏｎ　Ｓａｔｅｌｌｉｔｅ　Ｓｙｓｔｅｍ）を利用した自己位置取得機能や、通信機能を備えていることがあるが、これらの情報が本発明の経路計画システムと連携できるとは限らない。このため、駐車場環境における、非自動化車両３Ｅはエージェント３が備えるべき機能を自身で有していない状況になる。ただし、後述の構成により、非自動化車両３Ｅが備えるべき機能を代替することは可能である。

　自動化車両３ＦはＧＮＳＳやＬｉＤＡＲを利用した自己位置取得が可能である。また、自動化車両３Ｆには図示しないコントローラが搭載されており、自動運転に関する各種演算が実行される。さらに、コントローラには通信機能が備わっており、駐車場の運用を管理する管制サーバ１０４と通信を行い、管制サーバ１０４が伝達した経路計画に従って駐車場内を走行することが可能である。

　駐車場２００には、監視カメラ１０１が各所に備えられており、駐車場内の車両の位置、および、空きスペースを監視している。監視カメラ１０１は本発明の監視装置２に相当する。よって、監視カメラ１０１が非自動化車両３Ｅの自己位置取得部２２の代替機能となる。

　駐車場２００には、デジタルサイネージ１０５が各所に備えられており、空きエリアへのルート案内を表示することができる。管制サーバ１０４が配信した経路計画をデジタルサイネージ１０５に表示することで、非自動化車両３Ｅを誘導することができる。なお前述の物流倉庫の例と同様に、管制サーバ１０４は必ずしも駐車場２００内に設置されている必要はない。

　駐車場２００では、各エージェントに割り付ける業務は空きスペースへの移動になる。
よって、業務管理部１１は監視カメラ１０１で取得した空きスペースのうち、各エージェントの現在地から最も近い空きスペース、もしくは、施設入り口に最も近い空きスペースのいずれかを目的地点ｒｉ（ｉ＝１、…、Ｎ）として割り当てる機能を備える。

　経路計画装置１は各エージェントの現在位置ｐ１、ｐ２に対して、業務管理部１１が算出した目的地点ｒ１、ｒ２へと移動させるための経路計画を算出する。

　図２０ａは駐車場に従来技術（特許文献１）を適用したときに発生し得る経路計画の例を示している。図５ｂ、図５ｄに示した状況と同様に、各エージェントは障害物（壁や駐車している他車両）を挟んだ目標地点ｒｉへの最短距離位置（ｐ１（６）とｐ２（２））でデッドロックしてしまう。

　図２０ｂは同じ状況で本発明を適用した場合に生成される経路計画の例を示している。
図２０ａでデッドロックが発生する状況になると主目的達成補助部４２が算出するペナルティの値が大きくなるため、最短距離位置（ｐ１（６）とｐ２（２））から離れる制御入力を算出する　このため、最短距離位置（ｐ１（６）とｐ２（２））を一度離れた後に、徐々に目標地点ｒ１、ｒ２へと接近する経路を生成することが可能になる。

　物流倉庫の例と同様に、非自動化車両３Ｅは、自動化車両３Ｆと異なり、ドライバーの意思で自由に動き回ることができるため、デジタルサイネージ１０５に与えた経路指示に従わないことも予想される。

　非自動化車両３Ｅが経路指示に従ない場合は、経路計画装置１は、その非自動化車両３Ｅを制御可能なエージェントとして扱わず、接触してはいけない障害物として扱うことになる。経路指示に従わないことが確認され次第、経路計画装置１は割り込み処理（図１２の時刻ｔ４）によって、その非自動化車両３Ｅを除外したエージェントの経路計画を実施する。

　以上、物流倉庫と駐車場を例に本発明の実施形態を詳細に述べたが、本発明の適用先がこれらの場合に限定されないことは言うまでもない。たとえば、港湾における搬送車両の移動経路生成、テーマパーク内を移動するロボットの経路生成などにも活用できる。

１：経路計画装置、２：監視装置、３：エージェント、１０：経路計画システム、１１：業務管理部、１２：地図情報管理部、１３：エージェント情報管理部、１４：経路計画部、１５：行動計画伝達部、２１：通信部、２２：エージェント位置取得部、３１：通信部、３２：自己位置取得部、３３：他者位置取得部、３４：経路追従部、４１：エージェント間距離評価部、４２：主目的達成補助部、４３：主目的達成評価部、４４：経路計画計算部

Claims

　複数のエージェントの移動先を決定する業務管理部と、
　前記エージェントが存在するエリアの地図情報を管理する地図情報管理部と、
　前記エージェントの個体情報を管理するエージェント情報管理部と、
　前記地図情報管理部と前記エージェント情報管理部の情報に基づいて、各エージェントを前記業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、
　前記各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、
　前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、
　前記各エージェントについて、エージェント間の距離が、前記エージェント情報管理部にて各エージェントに応じて設定される所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、
　前記経路計画計算部は、各時刻において、前記主目的達成評価部、前記主目的達成補助部、および前記エージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、
　さらに、前記経路計画計算部で算出した経路計画を、全エージェントに伝達する行動計画伝達部を備えることを特徴とする経路計画装置。
　請求項１に記載の経路計画装置であって、
　前記主目的達成補助部は、前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れているときに、移動速度が低くなるほど低い評価を行うことを特徴とする経路計画装置。
　請求項１に記載の経路計画装置であって、
　前記主目的達成補助部は、前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れているときに、移動速度が低くなるほど低い評価を行い、かつ、または、各エージェントが地図情報管理部で設定された所定の位置に近づくほど低い評価を行うことを特徴とする経路計画装置。
　請求項１に記載の経路計画装置であって、
　前記主目的達成補助部は、前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れているときに、移動速度が低くなるほど低い評価を行い、かつ、または、各エージェントが地図情報管理部で設定された所定の位置に近づくほど低い評価を行い、さらに、各エージェントの位置とそれぞれの目標値との偏差が所定時間の間に減少しない場合に低い評価を行うことを特徴とする経路計画装置。
　複数、かつ、形状の異なるエージェントの移動先を決定する業務管理部と、
　前記エージェントが存在するエリアの地図情報を管理する地図情報管理部と、
　前記エージェントの個体情報を管理するエージェント情報管理部と、
　前記地図情報管理部と前記エージェント情報管理部の情報に基づいて、各エージェントを前記業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、
　前記各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、
　前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、
　前記各エージェントについて、エージェント間の距離が、前記エージェント情報管理部にて各エージェントの形態に応じて設定された所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、
　前記経路計画計算部は、各時刻において、前記主目的達成評価部、主目的達成補助部、および前記エージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、
　さらに、前記経路計画計算部で算出した経路計画を、全エージェントに伝達する行動計画伝達部を備えることを特徴とする経路計画装置。
　人を含む異種、かつ、複数のエージェントの移動先を決定する業務管理部と、
　前記エージェントが存在するエリアの地図情報を管理する地図情報管理部と、
　前記エージェントの個体情報を管理するエージェント情報管理部と、
　前記地図情報管理部と前記エージェント情報管理部の情報に基づいて、各エージェントを前記業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、
　前記各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、
　前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、
　前記各エージェントについて、エージェント間の距離が、前記エージェント情報管理部にて各エージェントの形態に応じて設定された所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、
　前記経路計画計算部は、各時刻において、前記主目的達成評価部、主目的達成補助部、および前記エージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、
　さらに、前記経路計画計算部で算出した経路計画を、自律体には制御指令値として、人には推奨経路として伝達する行動計画伝達部を備えることを特徴とする経路計画装置。
　複数のエージェントの移動先と、前記エージェントが存在するエリアの地図情報と、前記エージェントの個体情報に基づいて、各エージェントを移動先に移動させるための経路計画を生成し、
　前記各エージェントについて、位置が目標位置に近づくほど高い評価を行う第１の評価と、前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う第２の評価と、前記各エージェントについて、エージェント間の距離が、各エージェントに応じて設定される所定の値に近づくほど低い評価を行う第３の評価を求め、
　各時刻において、前記第１の評価、前記第２の評価、および前記第３の評価による総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、全エージェントに伝達することを計算機により実現することを特徴とする経路計画方法。
　請求項１に記載の経路計画装置が適用され、ビーコン及び、あるいは監視カメラにより前記エージェントの情報が入手されて、行動計画が前記エージェントに伝達される物流現場。
　請求項１に記載の経路計画装置が適用され、監視カメラにより前記エージェントの情報が入手されて、行動計画がデジタルサイネージに伝達される駐車場。