JP2019200792A - マルチエージェントシステムにおけるロボットの動作方法、ロボット及びマルチエージェントシステム - Google Patents

マルチエージェントシステムにおけるロボットの動作方法、ロボット及びマルチエージェントシステム Download PDF

Info

Publication number
JP2019200792A
JP2019200792A JP2019091277A JP2019091277A JP2019200792A JP 2019200792 A JP2019200792 A JP 2019200792A JP 2019091277 A JP2019091277 A JP 2019091277A JP 2019091277 A JP2019091277 A JP 2019091277A JP 2019200792 A JP2019200792 A JP 2019200792A
Authority
JP
Japan
Prior art keywords
option
action
robot
cost
options
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019091277A
Other languages
English (en)
Other versions
JP7391535B2 (ja
Inventor
ビュアガー マティアス
Buerger Mathias
ビュアガー マティアス
シリンガー フィリップクリスティアン
Christian Schillinger Philipp
クリスティアン シリンガー フィリップ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of JP2019200792A publication Critical patent/JP2019200792A/ja
Application granted granted Critical
Publication of JP7391535B2 publication Critical patent/JP7391535B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0287Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling
    • G05D1/0291Fleet control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/0084Programme-controlled manipulators comprising a plurality of manipulators
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0217Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory in accordance with energy consumption, time reduction or distance reduction criteria
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0287Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39146Swarm, multiagent, distributed multitask fusion, cooperation multi robots
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/50Machine tool, machine tool null till machine tool work handling
    • G05B2219/50391Robot

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Manipulator (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • General Factory Administration (AREA)

Abstract

【課題】複数のロボットを備えるマルチエージェントシステムの動作方法を提供する。【解決手段】現在のシステム状態から後続のシステム状態への遷移が実現される複数の行動を規定複数のオプションを求めS11、オプションによって示された行動を実行するための行動コストを求めS12、行動コスト値が残余の各ロボットによって考慮された行動を実行しS14、S15、該当するオプションに対して求められた又は受信された全てのコスト値に関連して、複数のオプションのうちの1つに相当する行動を実行しS16、所定のオプションに対する行動コストは、それぞれ複数の経験パラメータのうちの1つを考慮し、この経験パラメータは、過去の、既に実行された、特定のオプションに対して割り当てられた、複数のロボットの複数の行動に対するコストに関連する。以上を各ロボットは周期的に実施する。【選択図】図4

Description

本発明は、マルチエージェントシステムに関し、特に、協調的なオークション方法を用いてタスクの分配によってマルチエージェントシステムのロボットを制御する方法に関する。
技術的な背景
タスクを共同で処理するためのロボットのチームの調整は、特に、環境の状態が不確実である場合、及び、タスク仕様が時間に関連する場合に、困難である。タスク仕様を複数の部分タスクに分解するのには、タスク仕様を分解する適切な機構が必要であり、ここでは特に、実際の環境の不確実性が原因で、個々のロボットに対して行動指示を満足に割り当てることができない。
ロボットの個々の行動の間の時間的な関連性を再現するために、記述言語、いわゆる線形時相論理(LTL)が既知であり、これは、LTL仕様の形態のタスク仕様を再現する。LTL仕様から、行動計画、即ち、個々のロボットに対する行動指示のセットをそれ自体公知の方法により導出することができる。
ロボットアプリケーションに対するLTLは、特に、マルコフ決定過程(MDP:Markov Decision Processes)によって、時間的な周辺条件を確率論的なモデルに統合することを可能にする。マルコフ決定過程は、行動の実行の未知の時間期間と環境における確率的なイベントを含めた不確実性を再現することを可能にする。
行動指示を、LTLタスク仕様に対する不確実性のもとで作成するために、個々のロボットに対する計画が設定可能であり、これは、タスク仕様の自動再現をマルコフ決定過程と組み合わせる。LTLタスク記述の利用を最大化するために、行動指示を個々のロボットに対して計画することもできる。
複数のロボットを、特定のモデルに関連せずに、調整するために、一般的に、オークション方法が既知である。P.Schillinger等著「Auctioning over Probabilistic Options for Temporal Logic−Based Multi−Robot Cooperation under Uncertainty(IEEE International Conference on Robotics and Automation,2018)」は、共通のタスクを満たす、ロボットのチームの調整方法を開示している。ここでは、時間的な関連性と環境の不確実性が考慮され得る。示されたこの方法は、タスク実行中の不確実性と観察を考慮することを可能にする。これは、オークション方法を用いてタスク分配を実行することによって行われる。
「Auctioning over Probabilistic Options for Temporal Logic−Based Multi−Robot Cooperation under Uncertainty(IEEE International Conference on Robotics and Automation,2018)」P.Schillinger等著
時間的に関連する仕様を伴うタスクを解決するための、非決定性環境における、マルチエージェントシステムのロボットの調整に対する効率的な計画アルゴリズムは、この時点では既知ではない。
発明の開示
本発明においては、請求項1に記載されたマルチエージェントシステムにおけるロボットの動作方法並びに他の独立請求項に記載されたロボット及びマルチエージェントシステムが提示されている。
さらなる構成は、従属請求項に記載されている。
第1の態様においては、複数のロボットを備えるマルチエージェントシステムの動作方法が提示されており、各ロボットは、以下の方法を周期的に実施し、即ち、
・現在のシステム状態に基づいて、可能な複数のオプションを求め、複数のオプションは、現在のシステム状態から後続のシステム状態への遷移が実現される複数の行動を規定し、
・可能な複数のオプションのそれぞれに対して、オプションによって示された行動を実行するための行動コストを求め、
・オークションを実行し、ここでは各オプションに対して求められた行動コスト値が残余の各ロボットによって考慮され、
・該当するオプションに対して求められた又は受信された全てのコスト値に関連して、複数のオプションのうちの1つに相当する行動を実行し、
所定のオプションに対する行動コストは、それぞれ経験パラメータのうちの1つを考慮し、この経験パラメータは、過去の、既に実行された、特定のオプションに対して割り当てられた、複数のロボットの複数の行動に対するコストに関連する。
複数のロボット(エージェント)を備えるマルチエージェントシステムの上述した動作方法の考案は、マルチエージェントシステムによって解決されるべきタスク仕様を規定する決定性有限オートマトンを提供することである。決定性有限オートマトンは、複数のシステム状態を有しており、これらのシステム状態は、タスク目標を達成するために通過しなければならない1つ又は複数の状態経路を規定する。このような決定性有限オートマトンにおいては、状態遷移が、種々のロボットに、オークション方法において割り当てられる。ロボットによって実行可能な状態遷移を以降においては、オプションと称する。
個々のロボットへの実行されるべき状態遷移の割り当てのプロセスにおいて、状態変化を生じさせる部分タスクがオプションとして各ロボットに割り当て可能である。このようなオークション方法は、適切なコスト関数を用いて、部分タスクを、該当する部分タスクを最小コストで実行することを可能にするロボットに割り当てることを可能にする。コスト関数は、特に、該当する部分タスクの実行のための時間コストと、この部分タスクの実行によって、システム状態を規定する条件が満たされる確率を考慮する。
部分タスクによって、システム状態に対するシステム状態条件が満たされる場合、実行中の全ての、ロボットの部分タスクが中断され、新たなオークションが実行され、ここで、新たなオプションがロボットに分配される。新たなオプションは、ここで得られたシステム状態に基づく相対的な状態遷移に対応する。このような方法は、目標状態が得られるまで実施される。このようにして、部分タスクをマルチエージェントシステムにおいて、効率良く分配することが可能である。ここでは特に、時間的な関連性を特に効率的な方法で考慮することができる。
全てのロボットにおける決定性有限オートマトンの設定によって、各ロボットは、有利には、自身のオプションを、上位のタスク目標に関して求めることができ、ここでは、極めて格段に複雑性の低い確率論的な計画問題が解決されればよい。分散したオークションスキームによって、種々のオプションを種々のロボットに割り当てることができる。ここで、提案されたオークションアルゴリズムは、ロボットが、時間的に、別の部分タスクに関連する部分タスクを実行することを可能にする。部分タスクがそれぞれ満たされると、この方法は再び、実施され、システム状態に関する知識が、現在の方式によって考慮され得る。
上述の方法は、さらに、直線的な実装を可能にする。なぜなら特にロボットに、事前に、部分タスクを割り当てる必要がないからである。全体的に、不確実性と結び付いているシステム環境において、複数のロボットを調整する、この分散した方法は、所定のタスク仕様を実行することを可能にする。これは例えば線形時相理論(Linear Temporal Logic(LTL))の形態、特にCo−Safe LTLの形態である。
上述した方法は、効率的に、マルチエージェントシステムの付加を調整することを可能にする。これは特に、環境条件が不確実な場合である。これは特に、全体的なロボットのチームによって処理されるべき時間的なロジックを含んでいる仕様に対して当てはまる。このためにロボットに、タスク仕様の部分タスクが自動的に割り当てられる。システム環境の状態も、計画された行動指示の規則的な更新によって考慮可能であり、従って、ロボットを柔軟に、不確実性に整合させることができる。
さらに、複数のオプションのうちの1つに相当する行動を、対応するオプションに対して受信された全てのコスト値のうちの最小コストを示す固有のコスト値が、対応するオプションに対して求められた場合に、実行することができる。
複数のオプションのうちの1つに相当する行動を、対応するオプションに対して受信された全てのコスト値のうちの最小コストを示す固有のコスト値が、オプションに対して求められない場合に、実行しないように設定することもできる。
さらに、経験パラメータは、オプションによって実行されるべき行動が開始されたときに、該当するロボットの物理的な開始状態の分布に関連していてよい。
ある実施形態においては、経験パラメータは、最短経路問題を解くことによって求められる。
該当するロボットによって行動を実行するためのコストが求められ、経験パラメータが、求められたコストに関連して、特に比較的高いkに対して低減する整合パラメータに特に関連して整合されることによって、経験パラメータが、オプションに属する行動の終了時に更新されるように設定することができる。
オプションに対するコスト値が、オプションに割り当てられた行動を実行するための持続時間に関連して求められる、及び/又は、オプションに割り当てられた行動の実行時に、オプションが導く、システム状態に達するための状態条件が得られる確率に関連して求められるように設定することができる。
特に、オプションに割り当てられた行動の実行時に、システム状態に達するための状態条件が得られる確率が、行動の実行中に更新されてよい。
ある実施形態においては、前進が、決定性有限オートマトンのシステム状態の経路に沿って行われてよい。これは、先行するシステム状態のうちの1つのシステム状態の後続のシステム状態の条件を満たすことができない場合である。ここでは特に、システム状態に、決定性有限オートマトンのシステム状態の経路に沿って前進を示す前進レベルが割り当てられる。
行動の終了時に、得られたシステム状態が、残余のロボットに伝達されるように設定することができる。
後続のシステム状態の到達に関する情報が受信されると、行動の実行が中断され又は終了されるように設定することができる。
さらに、各オプションに対して求められたコスト値を、残余の各ロボットによる、コストの明示的な伝達によって提供することができる。
別の態様においては、マルチエージェントシステムの動作のためのロボットが設けられており、ロボットは、以下のステップを周期的に実行するように構成されており、即ち、
・現在のシステム状態に基づいて、可能な複数のオプションを求め、複数のオプションは、現在のシステム状態から後続のシステム状態への遷移が実現される複数の行動を規定し、
・可能な複数のオプションのそれぞれに対して、オプションによって示された行動を実行するための行動コストを求め、
・オークションを実行し、ここでは各オプションに対して求められた行動コスト値が残余の各ロボットによって考慮され、
・該当するオプションに対して求められた又は受信された全てのコスト値に関連して、複数のオプションのうちの1つに相当する行動を実行し、
所定のオプションに対する行動コストは、それぞれ複数の経験パラメータのうちの1つを考慮し、この経験パラメータは、過去の、既に実行された、特定のオプションに対して割り当てられた、複数のロボットの複数の行動に対するコストに関連する。
別の態様においては、マルチエージェントシステムに、複数の上述したロボットが設けられている。
実施形態を以降において、添付の図面に基づいて詳細に説明する。
マルチエージェントシステムのロボットの概略図。 決定性有限オートマトンの図。 周期性有限オートマトンの図。 示されたタスクでのタスク仕様を解決するためのマルチエージェントシステムの動作方法を示すフローチャート。 2つの可動のロボットを備えた、システム環境に配置されたマルチエージェントシステムの例。
実施形態の説明
以降においては、エージェントが、環境と相互作用するロボットとして設けられているマルチエージェントシステムにおいて記載された方法を記載する。ロボット1は、図1に概略的に示されているような構造を有している。ロボット1は、このためにそれぞれ1つの制御ユニット2を含んでおり、これは、部分タスクを実行するように形成されている。別のロボット1との通信のために、各ロボット1は、さらに、通信装置3を有しており、これによって、情報を別のロボット1に伝達することができ、さらに情報を別のロボット1から受信することができる。
アクチュエータ4によって、ロボット1にシステム環境を組み込むことができる。アクチュエータ4は、例えば、前進運動アクチュエータ、把持アクチュエータ等を含むことができる。これは、ロボット1に割り当てられた部分タスクに対して対応して、それ自体公知の方法によって動作させられる。これによって、ロボット1は、特に、移動する、対象物を取り上げる、下に置く等をすることができる。
さらに、センサ装置5によって、環境状態を検出することができる。センサ装置5は、例えばカメラ、対象物検出のために用いられる別のセンサ装置、例えば超音波装置等を含むことができる。カメラによって、相互作用され得る/相互作用されるべきである対象物の位置が識別及び同定され、システム環境内の移動を実現することができる。ここでは、障害物等である対象物が回避される。
ロボット1にはさらに、相互作用装置6、例えばタッチディスプレイ又は言語入力/出力装置が設けられていてよく、これによって、環境の対象物又は人物と通信によって相互作用することができる。このようにして人物が、ロボット1に入力し、かつ、情報を得ることができる。
以降に記載する方法の起点は、線形時相論理(LTL)、特にco−safe Linear Temporal Logic(scLTL)の形態のタスク仕様である。これは、解決されるべきタスクのタスク仕様に対する記述言語であり、時間的なモダリティを有している。各scLTL−タスク仕様は決定性有限オートマトン(DEA)に変換される。
このような決定性有限オートマトン(DEA)が例示的に図2に示されている。これはシステム状態(q1−q10)を示しており、これは開始状態11(q1)、複数の中間状態12(q2−q9)と1つ又は複数の目標状態13(q10)を含んでいる。決定性有限オートマトンを示すこのダイヤグラムにおいては、矢印は、1つ又は複数の経路に沿った、開始状態11(q1)から目標状態13(q10)への状態遷移を示している。該当するシステム状態に割り当てられた状態条件が満たされている場合に、システム状態が得られる。開始状態11から目標状態13へのシステム状態は、矢印に沿った前進によって得られる。あるシステム状態から後続のシステム状態へ、戻る経路の可能性が無い場合には、経路の1つに沿って前進が行われる。経路に沿った前進は、前進レベル、特に上昇する前進レベルによって示される。
図3は、システム状態q0−q4を備えた周期性有限オートマトンの概略図を示している。これは、繰り返す周期的なタスクを記述するのに適している。この周期性有限オートマトンは、有限オートマトンの一部であってよく、又は、有限オートマトンを表してよい。周期性有限オートマトンは、特に、次のような特徴を有している。即ち、目標状態(q4)13が得られたときに、これが早期の状態、例えば開始状態(q0)11にリセットされるという特徴を有している。以降において、そうでないことが記載されていない限り、決定性有限オートマトンと周期性有限オートマトンの定義は、記載されている方法に対して、同等に理解可能である。図示された周期性有限オートマトンは、以下のLTLの式に対応する。
Figure 2019200792
以降においては、周期性有限オートマトンにおいて、個々のロボット1にオプションを割り当てる方法が記載されている。決定性有限オートマトンの非周期的な部分におけるオプションの割り当ては、同一の方法又は異なる方法に従って実行可能である。
マルチエージェントシステムの動作方法に対する前提条件は、各ロボット1が、残余の各ロボット1と通信可能であるということ、及び、各ロボット1に、周期性有限オートマトンDEAが知らされている、ということである。図4に関連して示された後続の方法は、ロボット1におけるフローを示しており、ここで、これらの方法は、基本的に、並行して、各ロボット1において実施される。
まずはステップS11において、決定性有限オートマトンにおいて、現在の状態に基づいて、特に最初の通過の際に、開始状態11に基づいて、全ての可能なオプションが求められる。これらのオプション(設定された(現在の)システム状態/ロボット状態から可能な後続のシステム状態/ロボット状態への状態遷移として表されている)は、決定性有限オートマトンの次の可能なシステム状態に達するための可能性を表している。
ステップS12において、ステップS11において求められた全ての可能なオプションに対して、行動コストAKが求められる。この行動コストAKは、例えば、該当するロボット1に対する各オプションを実行するための持続時間Dに関連していてよい。さらに行動コストAKは、不確実性を有するシステム環境の際に、確率を考慮する。この確率はそれぞれ、該当するロボット1によって該当するオプションを実行する際に、後続のシステム状態に対する状態条件が満たされる確率を示している。これは、直接的なコストK:K=D(s)p(s)に対して当てはまり、ここで、D(s)は、この実行が物理的な状態sで終了する条件下でオプションを実行するための見積もられた持続時間であり、pは、全ての状態sにわたって合計された、このような状態sにおける該当するオプションの状態条件が満たされる確率である。さらに、コストKは、システムの別のロボットに既に割り当てられているコストを考慮することができる。
さらに、オプションに対する行動コストAKの計算時には、AK=K+Vによって、経験パラメータVが考慮される。このような経験パラメータVは、早期のコストを、オプションの実行時に経験値として考慮することを可能にし、これによって、該当するオプションによって規定された行動の直接的なコストKが修正可能である。
周期性有限オートマトンの場合は、同等である現在のシステム状態と後続のシステム状態との間に、事前に実現された状態遷移(即ち、同等の状態遷移)の観察によって、特定のロボット1による、オプションを実行するためのコストがより良好に見積もられることを可能にする。特に、経験パラメータVが考慮される。これは、各システム状態に対して、特定のシステム状態への変換がどの程度有利であるのかを示す経験パラメータVの値が割り当てられることによって行われる。
経験パラメータVの特定を、以降において、より詳細に説明する。
ステップS13においては、このようにして求められたコストが、該当するロボット1の各可能なオプションに対して、残余の全てのロボット1に伝達される。従って、全てのロボット1において、各オプションに対するコストに関する情報が存在する。
ステップS14においては、自身によって求められたオプションの1つによって、又は、別のロボット1から得られたオプションによって到達される各可能なシステム状態に対して、最小行動コストが求められる。
次に、ステップS15において、各ロボット1において、オプションによって得られる中間状態に対して、自身のコストが、提供された全てのコストの中で最小コストであるか否かが検査される。そうである場合には(選択肢:はい)、該当するロボット1(これを確認したロボット)に、該当するオプション(最小コストを伴う)が割り当てられ、このオプションによって示されたシステム状態を得るための行動指示に変換される。次に、この方法はステップS16に続く。
ステップS16においては、対応して、行動指示の実行が迅速に開始される。
ステップS17においては、各ロボット1において、自身の行動によって、状態条件が満たされたか否か、又は、状態条件を満たしたことに関する対応する情報が、別のロボット1から受信されたか否かが検査される。そうでない場合には(選択肢:いいえ)、ステップS17に戻り、そうである場合には(選択肢:はい)、ステップS19に移動する。
ステップS19においては、例えば、中断条件を示す、所定の目標状態が得られたか否かが検査される。そうである場合には(選択肢:はい)、この方法は、終了する。そうでない場合には、ステップS11に戻る。
ステップS15において、各オプションに対して、いずれのオプションも最小コストによって実行され得ないことが確認されると(選択肢:いいえ)、この方法は、ステップS18に続く。
最小コストが同等である場合には特に、複数のロボット1が、オプションの1つを同時に選択し、対応する行動指示を同時に実行してよい。割り当てプロセスによって、各ロボット1に、それに対応して、各ロボットが行動指示を実行することができるオプションが割り当てられ、又は、各ロボットは何もしないままである。
ステップS18において、オークションの間、行動指示を計画するために、ロボット1は今後の状態を想定することができる。ロボットはこれを追求することができ、タスク提示の今後の部分に対して準備することができる。これは、次のことが保証されることによって行われるべきである。即ち、このような行動指示の追跡が現在のオプションの部分タスクの実行を妨害しない、又は、害を与えないことが保証されることによって行われるべきである。従って、割り当てられていないロボット1へのオプションの分配のために、実行されているオプションの結果を、前提条件として含まないさらなるオプションが考慮される。
環境の不確実性によって、事前に、部分タスクの実行がどのように続くのかが明らかではない。従って、ロボット1は、自身の行動指示を、実行の間、2つの方式により更新することができる。
1.ロボット1のオプションが終了すると、各別のロボット1の現在の状態が更新される。これによって、各ロボット1の状態が変更されるので、事前に実行された行動指示が中断される。
2.ロボット1によって、実行の間に集められた知識が考慮される。これによって、特定のイベントが観察されることを示すイベント確率が整合可能である。このような更新された確率は、各ロボット1に伝達され、個々のオプションのコストを求める際に考慮される。
タスク実行中に、各ロボット1は、この方法を周期的に実施する。ここで、周期性有限オートマトンの共通のシステム状態及び自身のロボット状態が留意される。このような状態を起点として、各ロボット1は、上述した方法を実施し、これによって次のオプションを特定する。はじめに割り当てられたオプションだけが実行されることが許容されており、現在の状態におけるLTAタスク提示に害を与える、予期されるべき前進を受理するオプションは実行されないので、いわゆる待機行動が案内される。ここで、従うべき行動指示に即して各可能な行動に対して、目標状態のうちの1つが現在のシステム状態の移行条件に害を与えるか否かが検査される。移行条件は、各システム状態において、有効な調整又は安全規則を規定する。そうである場合には、各行動は、待機行動によって置換される。この待機行動は、該当するロボット1が、各状態に留まり、移行条件に害を与えることができないことを保証する。
各ロボット1は次に、自身のオプションを実行する。これは、定められた行動指示に従うことによって行われる。第1のロボット1が目標状態に達すると、全ての他のロボット1に中断信号が送信され、これによって、自身の現在の行動が中断される。同時に、次の反復のシステム状態qk+1が、各オプションの目標状態q’にセットされ、ロボット1の間で同期される。特に、周期性有限オートマトンの使用時には、システム状態は、目標状態13に達すると常に、開始状態11に設定される。
経験パラメータVは、後続の計算に対応して更新される。ここで、持続時間dは、反復kの実行に必要な持続時間を測定することによって特定される。
このために、経験パラメータVとQ関数が、ロボット1の間で分配され、割り当てられているオプションの自身のオプションを実行すべき行動を終了した各ロボット1によって更新される。このために、対応する情報がロボット1の間で伝達される。
オプションの割り当ては、中断後に再度実施され、次のオプションが選択される。この調整によってロボット1は、確率動力学に留意し、自身のタスクの割り当てを、需要に従って整合させることができる。
以降においては、経験パラメータVがどのようにして求められるのかが記載される。
上述したオークションプロセスにおいて、各ロボット1は、全ての使用可能なオプションに対して、コストKを、特に実行持続時間dの形態で計算し、かつ、該当するオプションに割り当てられた行動の目標状態の経験パラメータVを計算する。実行持続時間dは、オプションの実行のために、該当するオプションの現在のロボット状態から最終状態に達するための予期されている持続時間に相当するが、これによって、複数のロボットを備えるシステムにおける物理的なシステム状態の確率性は、再現されない。これは、次のことによって生じる。即ち、種々のロボットによる、オプションによって示された行動の同時の実行時に、これが、複数のロボットのうちの1つのロボットによる目標状態の達成時に、行動の実行の最中に存在し得る、ことによって生じる。これは、この場合には迅速に終了又は中断される。このようにして生じた、これらの残余のロボット1の不特定の中間状態に基づいて、行動コストを、後続のオークションの自身の次の行動に対して、不正確にしか特定することができない。
従って、確率性が考慮されるべき場合には、最小コストを伴うオプションを、経験パラメータVの推測的な考慮によってしか求めることができない。経験パラメータVは、オプションによって実行されるべき行動の開始時に、該当するロボット1の物理的な開始状態の分配に関連する。
分配は、観察される開始状態によって、タスクの繰り返される実行中に再現され、経験パラメータVは、これによって、長期間のコストを、論理的な状態に関して再現することができる。これによって、オプションの各目標状態を、最短経路問題を解くことによって求めることができる。
従って、周期性有限オートマトンにおける遷移の実行のための持続時間は、経験値
Figure 2019200792
を有するオプションoの持続時間に相当する。
このような最短経路問題に対するベルマン方程式は、
Figure 2019200792
に相当し、ここで、境界条件V(q)=0であり、q’はオプションoの論理的な目標状態である。ここで、O(q)は、周期性有限オートマトンのシステム状態に基づく、可能なオプションのセットを示している。このようなアプローチにおいては、持続時間
Figure 2019200792
は未知であり、Vは、実際に実行される行動の実行持続時間
Figure 2019200792
の観察によってのみ、求められる。
近似的な経験コストを、オプションoによって示される行動の実行時に、システム状態qにおいて再現するQ関数によって、反復kに対する見積もられた経験パラメータV
Figure 2019200792
から、周期性有限オートマトンの全てのシステム状態に対して、システム状態において提供可能なオプションにおいて導出される。
これによって、常に、オプションに属する行動の終了時に、該当するロボットによって行動を実行するためのコスト又は持続時間が求められ、Q関数が
Figure 2019200792
に対応して更新される。αは、整合パラメータに相当し、これは比較的高いkの場合には低減され得る。
図5には、マルチエージェントシステムのシナリオに対する例が示されており、これに、上述の方法が有利に適用可能である。このマルチエージェントシステムにおいては、可動のロボットR1、R2、R3が、タスクを実行すべきである。目標設定は、目標位置のセットを、種々のラベル「red」、「blue」、「yellow」及び「green」によって示す、図5に示されたカード上で、以降の目標仕様
Figure 2019200792
が実行されるべきである、ということである。
このような目標設定は、目標位置「red」に搬送し、次に、目標位置「blue」へ搬送することによって、又は、最初に、目標位置「yellow」に搬送し、次に目標位置「green」へ搬送することによって、満たされる。搬送されるべき対象物は、位置p1及びp2から取り上げられ得る。さらに、ロボットは、これが搬出を実行するときに損傷を受けることがあり、これが損傷を受けると、さらなる対象物は取り上げられない。損傷を受けたロボット1は、位置「station」において修理されるものとしてもよい。
オークション割り当ての分散したアプローチに基づいて、上述の方法は、任意の数のロボット1を有するマルチエージェントシステムに適用可能である。ここで、このミッションの実行時間は、さらなるロボット1の追加によって低減可能である。

Claims (15)

  1. 複数のロボット(1)を備えるマルチエージェントシステムの動作方法であって、
    各ロボット(1)は、以下の方法を周期的に実施し、即ち、
    ・現在のシステム状態(q1−q10)に基づいて、可能な複数のオプションを求め(S11)、前記複数のオプションは、現在のシステム状態(q1−q10)から後続のシステム状態(q1−q10)への遷移が実現される複数の行動を規定し、
    ・前記可能な複数のオプションのそれぞれに対して、前記オプションによって示された行動を実行するための行動コストを求め(S12)、
    ・オークションを実行し(S14,S15)、ここでは各オプションに対して求められた行動コスト値が、残余の各ロボット(1)によって考慮され、
    ・該当するオプションに対して求められた又は受信された全てのコスト値に関連して、前記複数のオプションのうちの1つに相当する行動を実行し(S16)、
    所定のオプションに対する前記行動コストは、それぞれ経験パラメータ(V)のうちの1つを考慮し、前記経験パラメータ(V)は、過去の、既に実行された、前記特定のオプションに対して割り当てられた、前記複数のロボットの複数の行動に対するコストに関連する、
    マルチエージェントシステムの動作方法。
  2. 前記複数のオプションのうちの1つに相当する行動を、対応する前記オプションに対して受信された全てのコスト値のうちの最も低いコストを示す固有のコスト値が、対応する前記オプションに対して求められた場合に、実行する、請求項1に記載の方法。
  3. 前記複数のオプションのうちの1つに相当する行動を、対応する前記オプションに対して受信された全てのコスト値のうちの最も低いコストを示す固有のコスト値が、対応する前記オプションに対して求められない場合に、実行しない、請求項1又は2に記載の方法。
  4. 前記経験パラメータ(V)は、前記オプションによって実行されるべき行動が開始されたときに、該当する前記ロボット(1)の物理的な開始状態の分布に関連する、請求項1乃至3のいずれか一項に記載の方法。
  5. 前記経験パラメータ(V)は、最短経路問題を解くことによって求められる、請求項1乃至4のいずれか一項に記載の方法。
  6. 該当する前記ロボット(1)によって前記行動を実行するためのコストが求められ、前記経験パラメータ(V)が、求められた前記コストに関連して、特に比較的高いkに対して低減する整合パラメータに特に関連して、整合されることによって、前記経験パラメータ(V)が、オプションに属する前記行動の終了時に更新される、請求項1乃至5のいずれか一項に記載の方法。
  7. オプションに対する前記コスト値を、前記オプションに割り当てられた前記行動を実行するための持続時間に関連して求める、及び/又は、前記オプションに割り当てられた前記行動の実行時に、前記オプションが導く、前記システム状態(q1−q10)に達するための状態条件が得られる確率に関連して求める、請求項1乃至6のいずれか一項に記載の方法。
  8. オプションに割り当てられた前記行動の実行時に、前記システム状態(q1−q10)に達するための状態条件が得られる確率が、前記行動の実行中に更新される、請求項7に記載の方法。
  9. 行動の終了時に、得られた前記システム状態(q1−q10)が、残余の前記ロボット(1)に伝達される、請求項1乃至8のいずれか一項に記載の方法。
  10. 後続のシステム状態(q1−q10)の到達に関する情報が受信されると、行動の実行が中断され又は終了される、請求項1乃至9のいずれか一項に記載の方法。
  11. 各オプションに対して求められたコスト値が、残余の各ロボット(1)による、コストの明示的な伝達によって提供される、請求項1乃至10のいずれか一項に記載の方法。
  12. マルチエージェントシステムの動作のためのロボット(1)であって、前記ロボット(1)は、以下のステップを周期的に実行するように構成されており、即ち、
    ・現在のシステム状態(q1−q10)に基づいて、可能な複数のオプションを求め(S11)、前記複数のオプションは、現在のシステム状態(q1−q10)から後続のシステム状態(q1−q10)への遷移が実現される複数の行動を規定し、
    ・前記可能な複数のオプションのそれぞれに対して、前記オプションによって示された行動を実行するための行動コストを求め(S12)、
    ・オークションを実行し(S14,S15)、ここでは各オプションに対して求められた行動コスト値が、残余の各ロボット(1)によって考慮され、
    ・該当するオプションに対して求められた又は受信された全てのコスト値に関連して、前記複数のオプションのうちの1つに相当する行動を実行し(S16)、
    所定のオプションに対する前記行動コストは、それぞれ複数の経験パラメータのうちの1つを考慮し、前記経験パラメータは、過去の、既に実行された、前記特定のオプションに対して割り当てられた、前記複数のロボットの複数の行動に対するコストに関連する、
    マルチエージェントシステムの動作のためのロボット(1)。
  13. 請求項12に記載の、複数のロボット(1)を備えるマルチエージェントシステム。
  14. コンピュータプログラムが計算ユニット、特にロボット(1)上で実行されるときに、請求項1乃至11のいずれか一項に記載の方法を実施するために構成されているプログラムコード手段を備えたコンピュータプログラム。
  15. 請求項14に記載のコンピュータプログラムが格納されている、機械読み取り可能な記憶媒体。
JP2019091277A 2018-05-15 2019-05-14 マルチエージェントシステムにおけるロボットの動作方法、ロボット及びマルチエージェントシステム Active JP7391535B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102018207539.5A DE102018207539A1 (de) 2018-05-15 2018-05-15 Verfahren zum Betreiben eines Roboters in einem Multiagentensystem, Roboter und Multiagentensystem
DE102018207539.5 2018-05-15

Publications (2)

Publication Number Publication Date
JP2019200792A true JP2019200792A (ja) 2019-11-21
JP7391535B2 JP7391535B2 (ja) 2023-12-05

Family

ID=68419666

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019091277A Active JP7391535B2 (ja) 2018-05-15 2019-05-14 マルチエージェントシステムにおけるロボットの動作方法、ロボット及びマルチエージェントシステム

Country Status (4)

Country Link
US (1) US11198214B2 (ja)
JP (1) JP7391535B2 (ja)
CN (1) CN110488807B (ja)
DE (1) DE102018207539A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2021171357A1 (ja) * 2020-02-25 2021-09-02
WO2022049756A1 (ja) * 2020-09-07 2022-03-10 日本電気株式会社 判定装置、判定方法及び記憶媒体
WO2022074824A1 (ja) * 2020-10-09 2022-04-14 日本電気株式会社 時相論理式生成装置、時相論理式生成方法及び記憶媒体
WO2022107324A1 (ja) * 2020-11-20 2022-05-27 日本電気株式会社 支援制御装置、支援装置、ロボット制御システム、支援制御方法及び記憶媒体
WO2022107207A1 (ja) * 2020-11-17 2022-05-27 日本電気株式会社 情報収集装置、情報収集方法及び記憶媒体
WO2022162784A1 (ja) * 2021-01-27 2022-08-04 日本電気株式会社 制御装置、制御方法及び記憶媒体
CN115545587A (zh) * 2022-12-05 2022-12-30 成都大学 一种基于多智能体的课堂教学方案评价方法及系统

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180326581A1 (en) * 2017-05-11 2018-11-15 King Fahd University Of Petroleum And Minerals System and method for auction-based and adaptive multi-threshold multi-agent task allocation
US11110606B2 (en) * 2019-01-02 2021-09-07 The Boeing Company Coordinating work within a multi-robot cell
DE102019203214B4 (de) 2019-03-08 2022-01-20 Robert Bosch Gmbh Verfahren zum Betreiben eines Roboters in einem Multiagentensystem, Roboter und Multiagentensystem
US11635774B2 (en) * 2019-06-29 2023-04-25 Intel Corporation Dynamic anchor selection for swarm localization
CN111079990B (zh) * 2019-11-29 2022-11-25 炬星科技(深圳)有限公司 集群机器人调度方法、装置、系统、设备及计算机可读存储介质
DE102020204388A1 (de) 2020-04-03 2021-10-07 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zum Ansteuern eines Agenten
CN112894811B (zh) * 2021-01-20 2022-09-20 西北工业大学 基于群智能mas的分布式多机器人的智能控制方法及装置
CN117506940B (zh) * 2024-01-04 2024-04-09 中国科学院自动化研究所 机器人轨迹语言描述生成方法、装置和可读存储介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415274B1 (en) * 1999-06-24 2002-07-02 Sandia Corporation Alpha-beta coordination method for collective search
US6859927B2 (en) * 1999-12-21 2005-02-22 Lockheed Martin Corporation Apparatus and method for controlling allocation of resources and task execution
US6842899B2 (en) * 1999-12-21 2005-01-11 Lockheed Martin Corporation Apparatus and method for resource negotiations among autonomous agents
US7171441B2 (en) * 2000-09-07 2007-01-30 Fujitsu Limited Virtual communication channel and virtual private community, and agent collaboration system and agent collaboration method for controlling the same
US6904335B2 (en) * 2002-08-21 2005-06-07 Neal Solomon System, method and apparatus for organizing groups of self-configurable mobile robotic agents in a multi-robotic system
US7194337B2 (en) * 2003-10-31 2007-03-20 Hewlett-Packard Development Company, Lp Agent-based operation of a robotic device
US7590589B2 (en) * 2004-09-10 2009-09-15 Hoffberg Steven M Game theoretic prioritization scheme for mobile ad hoc networks permitting hierarchal deference
JP4839487B2 (ja) * 2007-12-04 2011-12-21 本田技研工業株式会社 ロボット及びタスク実行システム
CN101859135B (zh) * 2009-04-07 2012-07-18 西门子(中国)有限公司 对分布式自动化系统进行控制的方法和装置
KR102117984B1 (ko) * 2013-11-27 2020-06-02 한국전자통신연구원 군집 로봇의 협력 청소 방법 및 제어 장치
CN104155999B (zh) * 2014-07-31 2017-03-29 海南大学 战场环境下多无人机时敏任务动态分配方法
US9733646B1 (en) * 2014-11-10 2017-08-15 X Development Llc Heterogeneous fleet of robots for collaborative object processing
US10022867B2 (en) * 2014-11-11 2018-07-17 X Development Llc Dynamically maintaining a map of a fleet of robotic devices in an environment to facilitate robotic action
CN105068550B (zh) * 2015-08-21 2017-10-20 燕山大学 一种基于拍卖模式的水下机器人多目标选择方法
CN105843227B (zh) * 2016-04-15 2018-10-23 上海大学 一种基于任务密集度动态调整的多机器人协作围捕任务分配方法
CN106789740B (zh) * 2016-11-11 2019-12-10 中国人民解放军海军航空大学 按任务优先级序贯拍卖的多平台传感器协同管理方法
CN106502250B (zh) * 2016-11-23 2019-03-26 北京邮电大学 三维空间内多机器人编队的路径规划算法
CN106875090B (zh) * 2017-01-09 2020-05-08 中南大学 一种面向动态任务的多机器人分布式任务分配形成方法
US20180326581A1 (en) * 2017-05-11 2018-11-15 King Fahd University Of Petroleum And Minerals System and method for auction-based and adaptive multi-threshold multi-agent task allocation

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
" Optimal and dynamic planning for Markov decision processes with co-safe LTL specifications", [ONLINE], JPN7023001669, September 2014 (2014-09-01), pages 1511 - 1516, ISSN: 0005051256 *
"Real Time Auction Based Allocation of Tasks for Multi-Robot Exploration Problem in Dynamic Environme", [ONLINE], JPN7023001670, 8 August 2017 (2017-08-08), pages 全ページ, ISSN: 0005051257 *
"The Power of Sequential Single-Item Auctions for Agent Coordination", [ONLINE], JPN7023001668, 9 August 2017 (2017-08-09), pages 1625 - 1629, ISSN: 0005051255 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7416197B2 (ja) 2020-02-25 2024-01-17 日本電気株式会社 制御装置、制御方法及びプログラム
WO2021171357A1 (ja) * 2020-02-25 2021-09-02 日本電気株式会社 制御装置、制御方法及び記録媒体
JPWO2021171357A1 (ja) * 2020-02-25 2021-09-02
WO2022049756A1 (ja) * 2020-09-07 2022-03-10 日本電気株式会社 判定装置、判定方法及び記憶媒体
JP7485058B2 (ja) 2020-09-07 2024-05-16 日本電気株式会社 判定装置、判定方法及びプログラム
WO2022074824A1 (ja) * 2020-10-09 2022-04-14 日本電気株式会社 時相論理式生成装置、時相論理式生成方法及び記憶媒体
JP7435814B2 (ja) 2020-10-09 2024-02-21 日本電気株式会社 時相論理式生成装置、時相論理式生成方法及びプログラム
WO2022107207A1 (ja) * 2020-11-17 2022-05-27 日本電気株式会社 情報収集装置、情報収集方法及び記憶媒体
JPWO2022107207A1 (ja) * 2020-11-17 2022-05-27
WO2022107324A1 (ja) * 2020-11-20 2022-05-27 日本電気株式会社 支援制御装置、支援装置、ロボット制御システム、支援制御方法及び記憶媒体
JPWO2022107324A1 (ja) * 2020-11-20 2022-05-27
JP7491400B2 (ja) 2020-11-20 2024-05-28 日本電気株式会社 支援制御装置、支援装置、ロボット制御システム、支援制御方法及びプログラム
WO2022162784A1 (ja) * 2021-01-27 2022-08-04 日本電気株式会社 制御装置、制御方法及び記憶媒体
JP7494943B2 (ja) 2021-01-27 2024-06-04 日本電気株式会社 制御装置、制御方法及びプログラム
CN115545587B (zh) * 2022-12-05 2023-03-24 成都大学 一种基于多智能体的课堂教学方案评价方法及系统
CN115545587A (zh) * 2022-12-05 2022-12-30 成都大学 一种基于多智能体的课堂教学方案评价方法及系统

Also Published As

Publication number Publication date
DE102018207539A1 (de) 2019-11-21
JP7391535B2 (ja) 2023-12-05
US11198214B2 (en) 2021-12-14
CN110488807A (zh) 2019-11-22
US20190351542A1 (en) 2019-11-21
CN110488807B (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
JP2019200792A (ja) マルチエージェントシステムにおけるロボットの動作方法、ロボット及びマルチエージェントシステム
US11179843B2 (en) Method for operating a robot in a multi-agent system, robot, and multi-agent system
US11279033B2 (en) Method and apparatus for collision-free motion planning of a manipulator
Gebser et al. Routing driverless transport vehicles in car assembly with answer set programming
CN113490578B (zh) 运行多智能体系统中的机器人的方法、机器人和多智能体系统
CN113496347A (zh) 用于为多个机器调度作业集合的设备和方法
Neves et al. A study on a Q-Learning algorithm application to a manufacturing assembly problem
CN112344945B (zh) 室内配送机器人路径规划方法、系统及室内配送机器人
JP2021526982A (ja) ロボットの予測制御方法及び関係する制御システム
Palombarini et al. End-to-end on-line rescheduling from Gantt chart images using deep reinforcement learning
Abd et al. Simulation modelling and analysis of scheduling in robotic flexible assembly cells using Taguchi method
Carpanzano et al. Design and implementation of a distributed part-routing algorithm for reconfigurable transportation systems
Li et al. Artificial intelligence empowered multi-AGVs in manufacturing systems
JP7343033B2 (ja) 制御装置、制御方法及びプログラム
JP3169001B2 (ja) ロット搬送制御システム及びその搬送制御方法ならびに搬送制御プログラムを格納した記憶媒体
CN116703104A (zh) 一种基于决策大模型的料箱机器人订单拣选方法及装置
Rogalla et al. Automated process planning for cyber-physical production systems
EP4250198A1 (en) Task assignment in autonomous mobile devices
Edwards et al. Coverage planning for capacitated field operations under spatial variability
Bozzi et al. Dynamic MPC-based scheduling in a smart manufacturing system problem
CN114995393A (zh) 移动机器人的调度方法、装置和调度系统
CN114340855B (zh) 机器人行动计划系统、机器人系统、机器人作业验证系统及机器人行动计划方法
Cheng et al. A deep reinforcement learning hyper-heuristic to solve order batching problem with mobile robots
EP4432030A1 (en) Soft reset - error handling in shop floor executable schedule generation
Schneevogt et al. Optimizing Job Shop Scheduling in the Furniture Industry: A Reinforcement Learning Approach Considering Machine Setup, Batch Variability, and Intralogistics

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231122

R150 Certificate of patent or registration of utility model

Ref document number: 7391535

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150