JP6938791B2 - マルチエージェントシステムにおいてロボットを動作させるための方法、ロボット及びマルチエージェントシステム - Google Patents

マルチエージェントシステムにおいてロボットを動作させるための方法、ロボット及びマルチエージェントシステム Download PDF

Info

Publication number
JP6938791B2
JP6938791B2 JP2020534470A JP2020534470A JP6938791B2 JP 6938791 B2 JP6938791 B2 JP 6938791B2 JP 2020534470 A JP2020534470 A JP 2020534470A JP 2020534470 A JP2020534470 A JP 2020534470A JP 6938791 B2 JP6938791 B2 JP 6938791B2
Authority
JP
Japan
Prior art keywords
option
action
system state
robot
options
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020534470A
Other languages
English (en)
Other versions
JP2021506607A (ja
Inventor
ビュアガー マティアス
ビュアガー マティアス
クリスティアン シリンガー フィリップ
クリスティアン シリンガー フィリップ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of JP2021506607A publication Critical patent/JP2021506607A/ja
Application granted granted Critical
Publication of JP6938791B2 publication Critical patent/JP6938791B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/0084Programme-controlled manipulators comprising a plurality of manipulators
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1669Programme controls characterised by programming, planning systems for manipulators characterised by special application, e.g. multi-arm co-operation, assembly, grasping
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1679Programme controls characterised by the tasks executed
    • B25J9/1682Dual arm manipulator; Coordination of several manipulators
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/23Pc programming
    • G05B2219/23289State logic control, finite state, tasks, machine, fsm
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39146Swarm, multiagent, distributed multitask fusion, cooperation multi robots
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06312Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Robotics (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Automation & Control Theory (AREA)
  • Manipulator (AREA)
  • Feedback Control In General (AREA)

Description

技術分野
本発明は、マルチエージェントシステムに関し、特に、協調的なオークション方法を用いてタスクを分配することによってマルチエージェントシステムのロボットを制御するための方法に関する。
背景技術
1つのタスクを共同で克服するために、複数のロボットからなるチームを調整することは、特に、周囲状況が不確実である場合、及び、タスク仕様における時間依存性が存在する場合には、困難である。1つのタスク仕様を複数のサブタスクに分解するためには、タスク仕様を分解するための適当なメカニズムが必要であり、特に、現実の環境の不確実性に起因して、個々のロボットに対する行動指示を満足のいくように割り当てることは不可能である。
ロボットの個々の行動の間の時間依存性をマッピングするために、LTL仕様の形態でタスク仕様をマッピングする記述言語、いわゆる線形時相論理(LTL)が公知である。LTL仕様から、アクション計画、即ち、個々のロボットに対する行動指示の集合を、公知の手法により導き出すことができる。
ロボット用途のためにLTLを使用することにより、特にマルコフ決定過程(MDP:Markov Decision Processes)を用いて、時間的な制約を確率モデルに組み込むことが可能となる。マルコフ決定過程によれば、アクションの実行の未知の期間と、環境内での確率論的なイベントとを含む不確実性を、マッピングすることが可能となる。
LTLタスク仕様に関して不確実性の下で行動指示を計画するために、Lacerda, D. Parker及びN. Hawes著の『Optimal and dynamic planning for Markov decision processes with co-safe LTL specifications』(Int. Conf. on Intelligent Robots and Systems,第1511-1516頁,IEEE,2014年)は、タスク仕様のオートマトン表現をMDPと組み合わせる単一のロボットための計画を企図している。同様にして、C. D. Ding,S. L. Smith,C. Belta,及びD. Rus.著の『LTL control in uncertain environments with probabilistic satisfaction guarantees』(IFAC,44(1):3515-3520,2011年)は、LTLタスク記述の効果を最大化するために、個々のロボットのための行動指示を計画することを企図している。
特定のモデルに関係なく複数のロボットを調整するために、M. G. Lagoudakisら著の『Auction-Based Multi-Robot Routing. In Robotics: Science and Systems』(第343-350頁,Rome,Italy,2005年)は、効率性に焦点を当てた複数のオークション戦略を開示している。Koenig, C.ら著の『The power of sequential singleitem auctions for agent coordination』(National Conference on Artificial Intelligence,volume 21,第1625頁,Menlo Park,CA;Cambridge,MA,London;AAAI Press;MIT Press;1999,2006年)は、最適化結果を恣意的に悪化させることなく計画の労力を軽減するために、シーケンシャルなオークションを開示している。M. Guo及びD. V. Dimarogonas著の『Multiagent plan reconfiguration under local LTL specifications』(International Journal of Robotics Research,34(2):218-235,2015年)は、マルチロボットシステムの複数のロボットに、相互に独立してローカルのサブタスクを割り当て、目下の競合の発生を通信することを開示している。
『Optimal and dynamic planning for Markov decision processes with co-safe LTL specifications』、Lacerda, D. Parker及びN. Hawes著、Int. Conf. on Intelligent Robots and Systems,第1511-1516頁,IEEE,2014年 『LTL control in uncertain environments with probabilistic satisfaction guarantees』、C. D. Ding,S. L. Smith,C. Belta及びD. Rus.著、IFAC,44(1):3515-3520,2011年 『Auction-Based Multi-Robot Routing. In Robotics: Science and Systems』、M. G. Lagoudakisら著、第343-350頁,Rome,Italy,2005年 『The power of sequential singleitem auctions for agent coordination』、Koenig, C.ら著、National Conference on Artificial Intelligence,volume 21,第1625頁,Menlo Park,CA;Cambridge,MA,London;AAAI Press;MIT Press;1999,2006年 『Multiagent plan reconfiguration under local LTL specifications』、M. Guo及びD. V. Dimarogonas著、International Journal of Robotics Research,34(2):218-235,2015年
時間依存性の仕様を有するタスクを解決するための、非決定性の環境におけるマルチエージェントシステムのロボットを調整するための効率的な計画アルゴリズムは、現在のところ公知ではない。
発明の開示
本発明によれば、請求項1に記載の、マルチエージェントシステムにおいてロボットを動作させるための方法と、それぞれの独立請求項に記載の、ロボット及びマルチエージェントシステムとが企図されている。
さらなる実施形態は、従属請求項に記載されている。
第1の態様によれば、複数のロボットを有するマルチエージェントシステムを動作させるための方法であって、それぞれのロボットは、目標システム状態に到達するまで、以下の方法、即ち、
・現在のシステム状態を起点として、所定の決定性有限オートマトンにおけるシステム状態の経路に沿った進行が達成される複数の可能なオプションを決定し、ここで、オプションは、現在のシステム状態から後続のシステム状態への遷移を達成し得るようにするアクションを定義するものであり、
・複数の可能なオプションの各々に関して、当該オプションによって指定されたアクションを実行するためのコスト値を決定し、
・オークションを実行し、その際、それぞれのオプションに関して決定されたコスト値が、それぞれ残余のロボットによって考慮され、
・複数のオプションのうちの1つに対応するアクションを、該当する当該オプションに関して決定又は受信した全てのコスト値に依存して実行する、
ことを周期的に実行する方法が企図されている。
複数のロボット(エージェント)を有するマルチエージェントシステムを動作させるための上記の方法の着想は、マルチエージェントシステムによって解決されるべきタスク仕様を定義する決定性有限オートマトンを提供することである。決定性有限オートマトンは、複数のシステム状態を有し、これらのシステム状態は、タスク目標を達成するために通過しなければならない1つ又は複数の状態経路を定義する。この決定性有限オートマトンにおいては、複数の異なるロボットに、オークション方法において状態遷移が割り当てられ、タスク目標の方向へと進行レベルの変更が達成される状態遷移(関連する状態遷移)だけが、オプションとして考慮される。これらの状態遷移は、以下においてはオプションと称される。このために、決定性有限オートマトンのシステム状態には、経路に沿って目標状態に向かって常に増加する、対応する進行レベルが予め割り当てられる。
進行レベルが増加することを特徴とする状態遷移を、個々のロボットに割り当てるプロセスにおいては、状態変化をもたらすサブタスクを、オプションとして個々のロボットに割り当てることができる。このようなオークション方法により、適当なコスト関数を用いて、最小のコストを有する該当するサブタスクを実行し得るロボットに、そのサブタスクを割り当てることができる。コスト関数は、特に、該当するサブタスクを実行するための時間消費量と、システム状態のために定義された条件がサブタスクの実行によって満たされる確率とを考慮することができる。
サブタスクによって、より高い進行レベルを有するシステム状態のためのシステム状態条件が満たされると、ロボットの全ての実行中のサブタスクが中断され、新たなオークションが実施され、そこで、新しいオプションがロボットに分配される。新しいオプションは、現在到達されたシステム状態を起点としている関連する状態遷移に相当する。この方法は、目標状態に到達するまで実施される。このようにして、マルチエージェントシステムにおけるサブタスクの分配を効率的に実施することが可能となり、特に時間依存性を特に効率的に考慮することが可能となる。
決定性有限オートマトンを全てのロボットに対して指定することにより、それぞれのロボットは、各自のオプションを、上位のタスク目標に鑑みて分散的に決定することができ、この場合には、複雑性が格段に低減された確率論的計画問題を解決すれば足りる。分散型のオークション方式により、複数の異なるロボットにそれぞれ異なるオプションが割り当てられ、本提案によるオークションアルゴリズムによって、ロボットは、他のサブタスクに時間的に依存しているサブタスクを実行することが可能となる。サブタスクが満たされるたびに方法が改めて実行され、これにより、システム状態に関する知識を最新で考慮することができる。
上記の方法によれば、さらに、特にロボットに予めサブタスクを割り当てる必要がないので、線形の実装が可能となる。全体として、不確実性の影響を受けるシステム環境において複数のロボットを調整する分散型の方法によって、指定されたタスク仕様を、例えば線形時相論理(LTL)、特にCo−Safe LTLの形態において実施することが可能となる。
上記の方法によれば、特に環境条件が不確実である場合に、マルチエージェントシステムの補足を効率的に調整することが可能となる。このことは、特に、複数のロボットからなるチーム全体によって処理されるべき時相論理が含まれた仕様の場合に当てはまる。このためにロボットには、タスク仕様のサブタスクが自動的に割り当てられる。計画された行動指示を定期的に更新することにより、システム環境の状況を考慮することもでき、これによってロボットを、不確実性に合わせて柔軟に適合させることができる。
さらに、複数のオプションのうちの1つに対応するアクションを、当該対応するオプションに対して、当該対応するオプションに関して受信した全てのコスト値のうちの最小のコストを示す固有のコスト値が決定された場合に実行することができる。
複数のオプションのうちの1つに対応するアクションを、複数のオプションのいずれに対しても、当該対応するオプションに関して受信した全てのコスト値のうちの最小のコストを示す固有のコスト値が決定されなかった場合には、実行しないようにすることもできる。
さらに、複数のオプションのいずれに対しても、当該対応するオプションに関して受信した全てのコスト値のうちの最小のコストを示す固有のコスト値が決定されなかった場合には、決定性有限オートマトンにおける経路に沿った他のオプションのためのアクションを実行することができ、ここで、他のオプションは、当該他のオプションに対応するアクションの履行が、オークションにおいて分配されたオプションのアクションの実行を阻害しないように選択される。
オプションのためのコスト値を、当該オプションに割り当てられたアクションを実行するための期間に依存して決定することができ、及び/又は、当該オプションに割り当てられたアクションの実行時に、当該オプションが通じているシステム状態に到達するための状態条件が満たされる確率に依存して決定することができる。
特に、オプションに割り当てられたアクションの実行時に、システム状態に到達するための状態条件が達成される確率を、当該アクションの実行中に更新することができる。
1つの実施形態によれば、後続するシステム状態の条件を満たすことによって、先行するシステム状態のうちの1つに到達し得る可能性が存在しない場合に、決定性有限オートマトンのシステム状態の経路に沿った進行を達成することができ、特に、システム状態には、決定性有限オートマトンのシステム状態の経路に沿った進行を示す進行レベルが割り当てられる。
アクションが終了すると、システム状態に到達したことを残余のロボットに送信することができる。
後続するシステム状態に到達したという情報を受信すると、アクションの実行を中断又は終了することができる。
さらに、それぞれのオプションに関して決定されたコスト値を、それぞれ残余のロボットによるコストの明示的な通信によって提供することができる。
他の態様によれば、マルチエージェントシステムを動作させるためのロボットであって、当該ロボットは、目標システム状態に到達するまで、以下のステップ、即ち、
・現在のシステム状態を起点として、所定の決定性有限オートマトンにおけるシステム状態の経路に沿った進行が達成される複数の可能なオプションを決定するステップであって、オプションは、現在のシステム状態から後続のシステム状態への遷移を達成し得るようにするアクションを定義するものである、ステップと、
・複数の可能なオプションの各々に関して、当該オプションによって指定されたアクションを実行するためのコスト値を決定するステップと、
・それぞれ残余のロボットから、それぞれのオプションに関して決定されたコスト値を受信するステップと、
・それぞれのオプションに関して決定されたコスト値を考慮して、オークションを実行するステップと、
・複数のオプションのうちの1つに対応するアクションを、該当する当該オプションに関して決定又は受信した全てのコスト値に依存して実行するステップと、
を周期的に実行するように構成されているロボットが企図されている。
さらなる態様によれば、上記の複数のロボットを有する、マルチエージェントシステムが企図されている。
図面の簡単な説明
以下においては、添付の図面に基づいて実施形態をより詳細に説明する。
マルチエージェントシステムのロボットの概略図である。 進行レベル割り当てを有する決定性有限オートマトンを示す図である。 決定性有限オートマトンの個々のシステム状態への進行レベルの割り当てを説明するためのフローチャートである。 所与のタスクに関するタスク仕様を解決するためのマルチエージェントシステムを動作させるための方法を説明するためのフローチャートである。 システム環境内に配置された、2つの移動可能なロボットを有するマルチエージェントシステムの例を示す図である。 図5のマルチエージェントシステムのタスクを解決するための決定性有限オートマトンを示す図である。
実施形態の説明
エージェントが、環境と相互作用するロボットとして設けられているマルチエージェントシステムを動作させるための方法を、以下に説明する。ロボット1は、図1に概略的に示されているような構成を有する。このために、ロボット1は、それぞれ1つの制御ユニット2を含み、この制御ユニット2は、サブタスクを実行するように構成されている。さらに、それぞれのロボット1は、他のロボット1と通信するために、他のロボット1に情報を送信するための及び他のロボット1から情報を受信するための通信装置3を有する。
ロボット1は、アクチュエータ4を用いてシステム環境と相互作用することができる。アクチュエータ4は、例えば、移動アクチュエータ、把持アクチュエータなどを含むことができ、これらのアクチュエータは、ロボット1に割り当てられたサブタスクに従って公知の手法により動作させられる。これによってロボット1は、特に移動すること、物体を拾い上げること、物体を置くこと、などを行うことができる。
さらに、センサ5を用いて環境状態を検出することができる。例えば、センサ5は、カメラや、例えば超音波センサのような、物体を検出するために使用可能な他のセンサなどを含み得る。障害物である物体が迂回されるように、システム環境内での移動を可能にするために、相互作用し得る/相互作用すべき相手である物体の位置を、カメラを用いて検出及び識別することができる。
さらに、ロボット1には、例えばタッチディスプレイ又は音声入力/出力装置のような、通信によって環境の物体又は人間と相互作用するための対話装置6を設けることができる。このようにして人間は、ロボット1への入力を実施して、情報を受け取ることができる。
以下において説明する方法の起点は、線形時相論理(LTL)、特にco−safe線形時相論理(scLTL)の形態のタスク仕様である。線形時相論理(LTL)は、時間モダリティを有する、解決されるべきタスクのタスク仕様のための記述言語である。いずれのscLTLタスク仕様も、決定性有限オートマトン(DFA)に変換することができる。
図2には、そのような決定性有限オートマトン(DFA)が例示的に示されている。図2は、複数のシステム状態(q1−q10)を示し、これらのシステム状態(q1−q10)には、1つの開始状態11(q0)と、複数の中間状態12(q1−q9)と、1つ又は複数の目標状態13(q10)とが含まれる。決定性有限オートマトンを説明するための図においては、矢印は、1つ又は複数の経路に沿った、開始状態11(q1)から目標状態13(q10)への状態遷移を示す。ある1つのシステム状態は、その該当するシステム状態に割り当てられた状態条件が満たされると、到達される。開始状態11から目標状態13までのシステム状態は、経路に沿った進行によって到達される。ある1つのシステム状態から次に続くシステム状態へと戻り経路の可能性が存在しない場合に、複数の経路のうちの1つに沿った進行が達成される。経路に沿った進行は、進行レベル、特に昇順の進行レベルによって示される。
オークション方法の準備のために、これらの進行レベルが、図3のフローチャートに示される方法に基づいて、開始状態11を起点として目標状態13まで付与される。ステップS1においては、開始状態11に1(又は他の初期値)の進行レベルを割り当てることができる。
後続のステップS2においては、選択された現在のシステム状態(初期時には開始状態である)から到達し得る全てのシステム状態であって、かつ、現在のシステム状態又は他の以前のシステム状態へと戻ってくる経路を有さない全てのシステム状態(即ち、関連する状態遷移)に対して、1(又は他の量)だけ増加された進行レベルが割り当てられる。関連しない状態遷移(即ち、DFAにおいて戻ってくる経路を有する状態からの状態遷移)によって到達される残余のシステム状態には、該当する現在のシステム状態と同一の進行レベルが割り当てられる。これによって、以前の状態へと戻ってくる経路を有するそれぞれのシステム状態には、以前のシステム状態の進行レベルと同等の進行レベルが割り当てられる。
ステップS3においては、全てのシステム状態が考慮されたかどうかが問い合わせられる。これが当てはまる場合(選択肢:はい)には、方法が終了し、これが当てはまらない場合(選択肢:いいえ)には、ステップS2にジャンプして戻り、未だ処理されていない次のシステム状態が、現在のシステム状態として採用される。このようにして、決定性有限オートマトンからのそれぞれのシステム状態に、進行レベル([x]によって表現されており、ただし、xは、進行レベルの数である)を割り当てることができる。このようにして進行レベルが設けられた決定性有限オートマトンDFAに基づいて、対応するタスク仕様を複数のロボットによって処理するための方法を実施することができる。
マルチエージェントシステムを動作させるための方法に対する前提条件は、それぞれのロボット1がそれぞれ残余のロボット1と通信可能であることと、それぞれのロボット1に決定性有限オートマトンDFAが通知されていることとである。以下の方法は、複数のロボット1のうちの1つにおけるシーケンスを説明するものであり、この方法は、基本的に、それぞれのロボット1において並行して実施される。
先ず始めに、ステップS11において、決定性有限オートマトンにおける現在の状態を起点として、特に最初の実行時に、開始状態11と、進行レベルの増加を達成し得る全ての可能なオプションとが決定される。オプション(より高い進行レベルを有するシステム状態への状態遷移を意味する)は、目標状態13へ向かう途中の中間状態であるDFAの次の可能なシステム状態へと、到達するための選択肢を表している。本実施例においては、開始状態q1を起点として、システム状態q2及びq3が、上記の次の可能なシステム状態に相当する。これは、オプションq1→q2、及び、オプションq1→q3に相当する。
ここで、ステップS12において、それぞれのロボット1により、ステップS11で決定された全ての可能なオプションに対してアクションコストが決定される。アクションコストは、例えば、該当するロボット1がそれぞれのオプションを実行するための期間に相当し得る又はこれを含み得る。さらに、アクションコストは、不確実性の影響を受けやすいシステム環境においては、確率を考慮することができる。確率は、該当するロボット1によって該当するオプションが実行される際に、到達されるべきシステム状態に対する状態条件が満たされる確率をそれぞれ示す。K=t*p(ただし、tは、オプションを実行するための推定期間、pは、該当するオプションの状態条件が満たされる確率)が当てはまる。
ステップS13においては、該当するロボット1のそれぞれの可能なオプションに関してこのようにして決定されたコストが、全ての残余のロボット1に通信される。従って、全てのロボット1には、あらゆるオプションのコストに関する情報が存在することとなる。
さて、ステップS14においては、自分自身で求めたオプション又は他のロボット1から受信したオプションのうちの1つによって到達し得るそれぞれの可能なシステム状態に関して、それぞれの最小のコストが決定される。
次に、ステップS15においては、それぞれのロボット1において、オプションによって到達し得る中間状態に関して、固有のコストが最小のコストであるどうかがチェックされる。これが当てはまる場合(選択肢:はい)には、該当するロボット1によって(その最小のコストを有する)該当するオプションが引き受けられ、そのオプションによって指定されているシステム状態に到達するための行動指示へと変換される。次に、方法は、ステップS16に続く。
ステップS16においては、それに応じて行動指示の実行が即座に開始される。
ステップS17においては、それぞれのロボット1において、自身のアクションによって状態条件が満たされたか、又は、状態条件が満たされたことに関する相応の情報が、他のロボットによって受信されたかがチェックされる。これが当てはまらない場合(選択肢:いいえ)には、ステップS17にジャンプして戻り、これが当てはまる場合(選択肢:はい)には、ステップS19にジャンプする。
ステップS19においては、目標システム状態に到達したかどうかがチェックされる。これが当てはまる場合(選択肢:はい)には、方法が終了する。これが当てはまらない場合には、ステップS11にジャンプして戻る。
ステップS15において、それぞれのオプションに関して、いずれのオプションも、最小のコストでは実行することができないと判断された場合(選択肢:いいえ)には、方法は、ステップS18に続く。
複数の同等の最小のコストが存在する場合には、場合によっては複数のロボット1が、オプションのうちの1つを同時に選択し、対応する行動指示を同時に実行することができる。割り当てプロセスにより、それぞれのロボット1に対して、そのロボット1が行動指示を実行し得るオプションが割り当てられ、又は、何もしないままに留められる。
ステップS18においては、ロボット1は、自身が遂行可能な行動指示を計画して、タスクのうちの未来の部分に備えるために、オークション中に未来の状態を推定することができる。このことは、これらの行動指示の履行が、現在のオプションのサブタスクの実行を阻害しないことが保証されることによって実施されるべきである。従って、割り当てられていないロボット1にオプションを分配するために、現在実行されているオプションよりも高い進行レベルを有するシステム状態を有していて、かつ、実行されているオプションの結果を前提条件として含んでいない、さらなる他のオプションが考慮される。
環境の不確実性に起因して、サブタスクの実行がどのようにして進むかは、前もっては明確ではない。従って、ロボット1は、各自の行動指示を、実行中に2つの方式で更新することができる。
1.ある1つのロボット1のオプションが終了すると、それぞれ他のロボット1の現在の状態が更新される。これによって、それぞれのロボット1の状態が変更されるので、前もって実行された行動指示が中断される。
2.ロボット1によって実行中に収集された知識が考慮される。これにより、特定のイベントが観察される可能性があることを示すイベント確率を適合させることができる。この更新された確率は、それぞれのロボット1に通信され、個々のオプションのコストを決定する際に考慮される。
図5には、オフィスビル内に移動可能なロボットR1,R2が配置されているマルチエージェントシステムの例が示されている。設定目標は、これらのロボット1のうちの一方が、部屋rの中に移動して入ることであるが、ただし、このことは、2人の人間a,bが許可した後にのみ可能となる。この許可は、例えば、個々のロボット1の対話装置6のタッチスクリーンを介してアクセスコードを入力することによって与えることができる。この例においては、これらの人間を、場所a2及びb1において発見し得ると仮定するが、ただし、このことは、事前には分かっていない。さらに、ナビゲーション行動を実行するための期間は、進んだ距離に比例すると仮定する。アクセス制限を考慮しながら部屋rへのアクセスを取得するという設定目標を、次のscLTLの式によって表現することができる。
Figure 0006938791
なお、a,bは、該当する人間a,bによって同意が与えられたことを示す。
φによって構築されているDFAは、図6において、システム状態q1−q5によって概略的に示されている。scLTLミッションが、ロボット1に伝送される。初期時には、仮定された進行レベルの増加に応じて、ロボットR1には、システム状態q1からq2につながるオプションq1−q2が割り当てられ、ロボットR2には、システム状態q2からq4につながるオプションq2−q4が割り当てられる。従って、ロボットR1によって選択されたオプションは、ロボットR1をbへと導き、ロボットR2によって選択されたオプションは、ロボットR2をaへと導く。該当する人間が2つの部屋a,aのうちの一方の中にいる確率と、もう一方の中にいる確率とが同等である(それぞれ0.5の確率)と仮定すると、ロボットR2は、部屋aの方がより近いので、aではなくaに移動することを決定する。
計画の最初の立て直しは、ロボットR1が部屋bに到達した後に行われる。部屋bにおいてロボット1は、承認bを与える人間bがいることを発見し、これによって中間状態q2に到達する。その間にロボットR2は、既に部屋aの近くにきており、従って、ロボットR2には、オプションq2−q4が割り当てられ、対応するアクションが実行される。その間にロボットR1には、ミッションを終了するためにオプションq4−q5が割り当てられる。
さて、部屋aでアクセス許可aを取得することができないとロボットR2が判断すると、ロボットR2は、オプションq2−q4の行動指示を期待どおりには終了することができず、部屋aでアクセス承認aを取得することができないことを報告するために、部屋aに人間がいるというイベント確率を0へと更新する。これによって更新がもたらされ、この更新によってロボットR1は、aへの移動によってオプションq2−q4を実行するためのコストがより小さいロボット1であるとして選択される。なぜなら、ロボットR2にはオプションq4−q5が割り当てられているからである。ロボットR2は、ロボットR1がオプションq2−q4を終了することができるよりも迅速に中間地点に到達するので、ロボットR2がロボットR1を待っていることを観察することができる。ロボットR1がq2−q4を終了すると、ロボットR2は、割り当てられた、既にほぼ終了しているオプションq4−q5を維持し、部屋rに進入することによってミッションを終了する。
オークション割り当ての分散型のアプローチに基づいて、上記の方法を、任意の個数のロボット1を有するマルチエージェントシステムに適用することができ、さらなるロボット1を追加することによって、ミッションの実行時間を短縮することができる。

Claims (14)

  1. 複数のロボット(1)を有するマルチエージェントシステムを動作させるための方法であって、
    それぞれのロボット(1)は、目標システム状態に到達するまで、以下の方法、即ち、
    ・現在のシステム状態(q1−q10)を起点として、所定の決定性有限オートマトン(DFA)におけるシステム状態の経路に沿った進行が達成される複数の可能なオプションを決定し(S11)、ここで、前記オプションは、現在のシステム状態から後続のシステム状態(q1−q10)への遷移を達成し得るようにするアクションを定義するものであり、
    ・前記複数の可能なオプションの各々に関して、当該オプションによって指定されたアクションを実行するためのコスト値を決定し(S12)、
    ・オークションを実行し(S14,S15)、その際、それぞれのオプションに関して決定された前記コスト値が、それぞれ残余のロボット(1)によって考慮され、
    ・前記複数のオプションのうちの1つに対応するアクションを、該当する当該オプションに関して決定又は受信した全てのコスト値に依存して実行する(S16)、
    ことを周期的に実行する方法。
  2. 前記複数のオプションのうちの1つに対応するアクションを、当該対応するオプションに対して、当該対応するオプションに関して受信した全てのコスト値のうちの最小のコストを示す固有のコスト値が決定された場合に実行する、
    請求項1に記載の方法。
  3. 前記複数のオプションのうちの1つに対応するアクションを、前記複数のオプションのいずれに対しても、当該対応するオプションに関して受信した全てのコスト値のうちの最小のコストを示す固有のコスト値が決定されなかった場合には実行しない、
    請求項1又は2に記載の方法。
  4. 前記複数のオプションのいずれに対しても、当該対応するオプションに関して受信した全てのコスト値のうちの最小のコストを示す固有のコスト値が決定されなかった場合には、前記決定性有限オートマトン(DFA)における経路に沿った他のオプションのためのアクションを実行し、
    前記他のオプションは、当該他のオプションに対応するアクションの履行が、前記オークションにおいて分配されたオプションのアクションの実行を阻害しないように選択される、
    請求項1又は2に記載の方法。
  5. オプションのためのコスト値を、
    当該オプションに割り当てられたアクションを実行するための期間に依存して決定し、及び/又は、
    当該オプションに割り当てられたアクションの実行時に、当該オプションが通じているシステム状態(q1−q10)に到達するための状態条件が満たされる確率に依存して決定する、
    請求項1乃至4のいずれか一項に記載の方法。
  6. オプションに割り当てられたアクションの実行時に、前記システム状態(q1−q10)に到達するための状態条件が達成される確率を、当該アクションの実行中に更新する、
    請求項5に記載の方法。
  7. 後続するシステム状態(q1−q10)の条件を満たすことによって、先行するシステム状態(q1−q10)のうちの1つに到達し得る可能性が存在しない場合に、前記決定性有限オートマトン(DFA)のシステム状態の経路に沿った進行が達成され、
    特に、前記システム状態には、前記決定性有限オートマトン(DFA)のシステム状態(q1−q10)の経路に沿った進行を示す進行レベルが割り当てられる、
    請求項1乃至6のいずれか一項に記載の方法。
  8. アクションが終了すると、前記システム状態(q1−q10)に到達したことを残余のロボット(1)に送信する、
    請求項1乃至7のいずれか一項に記載の方法。
  9. 後続するシステム状態(q1−q10)に到達したという情報を受信すると、アクションの実行を中断又は終了する、
    請求項1乃至8のいずれか一項に記載の方法。
  10. それぞれのオプションに関して決定されたコスト値を、それぞれ残余のロボット(1)によるコストの明示的な通信によって提供する、
    請求項1乃至9のいずれか一項に記載の方法。
  11. マルチエージェントシステムを動作させるためのロボット(1)であって、
    当該ロボット(1)は、目標システム状態に到達するまで、以下のステップ、即ち、
    ・現在のシステム状態(q1−q10)を起点として、所定の決定性有限オートマトン(DFA)におけるシステム状態(q1−q10)の経路に沿った進行が達成される複数の可能なオプションを決定するステップであって、前記オプションは、現在のシステム状態から後続のシステム状態(q1−q10)への遷移を達成し得るようにするアクションを定義するものである、ステップと、
    ・前記複数の可能なオプションの各々に関して、当該オプションによって指定されたアクションを実行するためのコスト値を決定するステップと、
    ・それぞれ残余のロボットから、それぞれのオプションに関して決定されたコスト値を受信するステップと、
    ・前記それぞれのオプションに関して決定された前記コスト値を考慮して、オークションを実行するステップと、
    ・前記複数のオプションのうちの1つに対応するアクションを、該当する当該オプションに関して決定又は受信した全てのコスト値に依存して実行するステップと、
    を周期的に実行するように構成されているロボット(1)。
  12. 請求項11に記載の複数のロボット(1)を有するマルチエージェントシステム。
  13. 計算ユニット上で、特にロボット(1)上で実行されたときに、請求項1乃至10のいずれか一項に記載の方法を実行するために構成されたプログラムコード有するコンピュータプログラム。
  14. 請求項13に記載のコンピュータプログラムが記憶された機械可読記憶媒体。
JP2020534470A 2017-12-22 2018-12-13 マルチエージェントシステムにおいてロボットを動作させるための方法、ロボット及びマルチエージェントシステム Active JP6938791B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102017223717.1 2017-12-22
DE102017223717.1A DE102017223717B4 (de) 2017-12-22 2017-12-22 Verfahren zum Betreiben eines Roboters in einem Multiagentensystem, Roboter und Multiagentensystem
PCT/EP2018/084807 WO2019121338A1 (de) 2017-12-22 2018-12-13 Verfahren zum betreiben eines roboters in einem multiagentensystem, roboter und multiagentensystem

Publications (2)

Publication Number Publication Date
JP2021506607A JP2021506607A (ja) 2021-02-22
JP6938791B2 true JP6938791B2 (ja) 2021-09-22

Family

ID=64870450

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020534470A Active JP6938791B2 (ja) 2017-12-22 2018-12-13 マルチエージェントシステムにおいてロボットを動作させるための方法、ロボット及びマルチエージェントシステム

Country Status (6)

Country Link
US (1) US11179843B2 (ja)
JP (1) JP6938791B2 (ja)
KR (1) KR20200099572A (ja)
CN (1) CN111465475B (ja)
DE (1) DE102017223717B4 (ja)
WO (1) WO2019121338A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020087206A (ja) 2018-11-29 2020-06-04 株式会社日立製作所 自律体システム及びその制御方法
DE102019201045B4 (de) * 2019-01-28 2020-11-26 Robert Bosch Gmbh Verfahren, Vorrichtung und Computerprogramm zum Ermitteln einer Aktion oder Trajektorie eines Roboters
DE102019203214B4 (de) * 2019-03-08 2022-01-20 Robert Bosch Gmbh Verfahren zum Betreiben eines Roboters in einem Multiagentensystem, Roboter und Multiagentensystem
CN112859887B (zh) * 2019-11-28 2022-06-14 中国科学院沈阳自动化研究所 基于天基中心的多水下机器人自主任务分配方法
DE102020103854B4 (de) 2020-02-14 2022-06-15 Franka Emika Gmbh Maschinelles Lernen einer erfolgreich abgeschlossenen Roboteranwendung
JP7283624B2 (ja) * 2020-02-25 2023-05-30 日本電気株式会社 情報処理装置、情報処理方法、及びプログラム
DE102020204388A1 (de) 2020-04-03 2021-10-07 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zum Ansteuern eines Agenten
DE102020114738A1 (de) 2020-06-03 2021-12-09 Bayerische Motoren Werke Aktiengesellschaft Verfahren, System sowie Computerprogramm zum Betreiben eines oder mehrerer Roboter, eines Robotersystems und/oder eines Roboterschwarms
DE102020114737A1 (de) 2020-06-03 2021-12-09 Bayerische Motoren Werke Aktiengesellschaft Verfahren, System sowie Computerprogramm zum Betreiben eines oder mehrerer Roboter, eines Robotersystems und/oder eines Roboterschwarms
US20230356389A1 (en) * 2020-09-25 2023-11-09 Nec Corporation Control device, control method and storage medium
US11938518B2 (en) * 2021-01-20 2024-03-26 AMP Robotics Corporation Techniques for planning object sorting
WO2022162783A1 (ja) * 2021-01-27 2022-08-04 日本電気株式会社 制御装置、制御方法及び記憶媒体
US11812280B2 (en) * 2021-06-01 2023-11-07 Kabushiki Kaisha Toshiba Swarm control algorithm to maintain mesh connectivity while assessing and optimizing areal coverage in unknown complex environments

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8135413B2 (en) * 1998-11-24 2012-03-13 Tracbeam Llc Platform and applications for wireless location and other complex services
US6415274B1 (en) 1999-06-24 2002-07-02 Sandia Corporation Alpha-beta coordination method for collective search
US6859927B2 (en) 1999-12-21 2005-02-22 Lockheed Martin Corporation Apparatus and method for controlling allocation of resources and task execution
US6842899B2 (en) * 1999-12-21 2005-01-11 Lockheed Martin Corporation Apparatus and method for resource negotiations among autonomous agents
US7171441B2 (en) * 2000-09-07 2007-01-30 Fujitsu Limited Virtual communication channel and virtual private community, and agent collaboration system and agent collaboration method for controlling the same
SG120067A1 (en) * 2001-06-01 2006-03-28 Vientity Private Ltd Intelligent procurement agent
DE10220085A1 (de) 2002-04-25 2003-11-20 Peter Schmutter Computerprogramm zur automatischen Optimierung des Verhaltens und der Kommunikationseigenschaften von topologisch angeordneten (möglicherweise mobilen, aber nicht notwendigerweise physikalischen) Entitäten zur Erreichung eines höheren Zieles durch Kooperation
AU2003262893A1 (en) * 2002-08-21 2004-03-11 Neal Solomon Organizing groups of self-configurable mobile robotic agents
US7194337B2 (en) * 2003-10-31 2007-03-20 Hewlett-Packard Development Company, Lp Agent-based operation of a robotic device
US7590589B2 (en) * 2004-09-10 2009-09-15 Hoffberg Steven M Game theoretic prioritization scheme for mobile ad hoc networks permitting hierarchal deference
JP2009134652A (ja) 2007-11-30 2009-06-18 Osaka Univ マルチ・エージェントシステム、プログラム、コンピュータ読み取り可能な記録媒体
JP4839487B2 (ja) 2007-12-04 2011-12-21 本田技研工業株式会社 ロボット及びタスク実行システム
CN101859135B (zh) 2009-04-07 2012-07-18 西门子(中国)有限公司 对分布式自动化系统进行控制的方法和装置
KR102117984B1 (ko) * 2013-11-27 2020-06-02 한국전자통신연구원 군집 로봇의 협력 청소 방법 및 제어 장치
DE102014112639C5 (de) 2014-09-02 2020-07-02 Cavos Bagatelle Verwaltungs Gmbh & Co. Kg System zum Erstellen von Steuerungsdatensätzen für Roboter
US9733646B1 (en) * 2014-11-10 2017-08-15 X Development Llc Heterogeneous fleet of robots for collaborative object processing
US10022867B2 (en) * 2014-11-11 2018-07-17 X Development Llc Dynamically maintaining a map of a fleet of robotic devices in an environment to facilitate robotic action
CN105068550B (zh) * 2015-08-21 2017-10-20 燕山大学 一种基于拍卖模式的水下机器人多目标选择方法
DE102016002194A1 (de) 2016-02-20 2016-08-11 Daimler Ag Verfahren und Fertigungssystem zum Ausführen einer Fertigungsaufgabe
US9645577B1 (en) 2016-03-23 2017-05-09 nuTonomy Inc. Facilitating vehicle driving and self-driving
CN105843227B (zh) * 2016-04-15 2018-10-23 上海大学 一种基于任务密集度动态调整的多机器人协作围捕任务分配方法
CN106875090B (zh) * 2017-01-09 2020-05-08 中南大学 一种面向动态任务的多机器人分布式任务分配形成方法
US20180326581A1 (en) * 2017-05-11 2018-11-15 King Fahd University Of Petroleum And Minerals System and method for auction-based and adaptive multi-threshold multi-agent task allocation

Also Published As

Publication number Publication date
CN111465475A (zh) 2020-07-28
US20200276699A1 (en) 2020-09-03
DE102017223717B4 (de) 2019-07-18
CN111465475B (zh) 2023-04-04
JP2021506607A (ja) 2021-02-22
US11179843B2 (en) 2021-11-23
DE102017223717A1 (de) 2019-06-27
KR20200099572A (ko) 2020-08-24
WO2019121338A1 (de) 2019-06-27

Similar Documents

Publication Publication Date Title
JP6938791B2 (ja) マルチエージェントシステムにおいてロボットを動作させるための方法、ロボット及びマルチエージェントシステム
JP7391535B2 (ja) マルチエージェントシステムにおけるロボットの動作方法、ロボット及びマルチエージェントシステム
RU2589869C2 (ru) Способ и система для эффективного планирования для множества автоматизированных неголономных транспортных средств с использованием планировщика скоординированных маршрутов
Herrero-Perez et al. Modeling distributed transportation systems composed of flexible automated guided vehicles in flexible manufacturing systems
US11986966B2 (en) Method for operating a robot in a multi-agent system, robot, and multi-agent system
Yasuda Behavior-based autonomous cooperative control of intelligent mobile robot systems with embedded Petri nets
Schillinger et al. Auctioning over probabilistic options for temporal logic-based multi-robot cooperation under uncertainty
Li et al. Artificial intelligence empowered multi-AGVs in manufacturing systems
Ding et al. Task-motion planning for safe and efficient urban driving
Bøgh et al. Distributed fleet management in noisy environments via model-predictive control
Mahdavi et al. Optimal trajectory and schedule planning for autonomous guided vehicles in flexible manufacturing system
Frasheri et al. Analysis of perceived helpfulness in adaptive autonomous agent populations
Coltin et al. Towards replanning for mobile service robots with shared information
Zanlongo et al. Multi-robot planning for non-overlapping operator attention allocation
Domínguez et al. Human–computer cooperation platform for developing real-time robotic applications
Jungbluth et al. Reinforcement Learning-based Scheduling of a Job-Shop Process with Distributedly Controlled Robotic Manipulators for Transport Operations
El Jalaoui et al. Contextual Management of Tasks and Instrumentation within an AUV control software architecture.
Li et al. A framework for coordinated control of multi-agent systems
Peterson et al. Dynamic behavior sequencing for hybrid robot architectures
Philips et al. PROSA and Delegate MAS in Robotics
Subramanian et al. A Study on seamless information sharing between robots in identifying the optimal path: An agent based approach
Chuang et al. A novel approach with bayesian networks to multi-robot task allocation in dynamic environments
Graff Programming and managing swarms of mobile robots: a systemic approach
Hartmann et al. Towards computing low-makespan solutions for multi-arm multi-task planning problems
Carreno et al. Towards long-term autonomy based on temporal planning

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200619

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210901

R150 Certificate of patent or registration of utility model

Ref document number: 6938791

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150