CN111830916A - 一种面向多目标追踪的群机器人分布式竞争协同方法 - Google Patents

一种面向多目标追踪的群机器人分布式竞争协同方法 Download PDF

Info

Publication number
CN111830916A
CN111830916A CN202010632057.9A CN202010632057A CN111830916A CN 111830916 A CN111830916 A CN 111830916A CN 202010632057 A CN202010632057 A CN 202010632057A CN 111830916 A CN111830916 A CN 111830916A
Authority
CN
China
Prior art keywords
robot
swarm
robots
competition
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010632057.9A
Other languages
English (en)
Inventor
金龙
齐一萌
李帅
刘梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lanzhou University
Original Assignee
Lanzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lanzhou University filed Critical Lanzhou University
Priority to CN202010632057.9A priority Critical patent/CN111830916A/zh
Publication of CN111830916A publication Critical patent/CN111830916A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/4185Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by the network communication
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/31From computer integrated manufacturing till monitoring
    • G05B2219/31088Network communication between supervisor and cell, machine group
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Manufacturing & Machinery (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Manipulator (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提出一种面向多目标追踪的群机器人分布式竞争协同方法,包括如下步骤:1)分配机器人并实时探测目标群体的位置信息、环境信息、群机器人的覆盖域及消耗的通信功率等;2)各机器人实时获取在通信拓扑图中与其连通的机器人所掌握的信息;3)根据所述信息实时构建群机器人分布式竞争协同中用于最优机器人选择的决策方案,并根据二次规划方法确定分配机器人的驱动信息指令;4)根据所述驱动信息指令选择出最优机器人,并实时识别机器人与目标群体的运动坐标系,实现面向多目标任务执行的群机器人分布式竞争协同。本方法通过构建竞争协同机制拓宽了群机器人的应用场景,并利用分布式设计降低了通信负载与损耗并保证了群机器人系统的稳定性。

Description

一种面向多目标追踪的群机器人分布式竞争协同方法
技术领域
本发明涉及分布式竞争协同控制领域,具体涉及一种面向多目标追踪的群机器人分布式竞争协同方法。
背景技术
机器人技术的发展使得机器人应用领域和范围不断扩展,因而人们寄希望于机器人能完成更加复杂的作业。然而,以单个机器人为核心的复杂作业往往效率低下,难以满足任务的需求。受生物界个体社会行为的启发,以多智能体协同为主导的作业模式通常比单个智能体作业更具优势。伴随着智能化程度的加深及任务的多样化,对群机器人系统的研究也提出了更高的要求。
群机器人的协同控制问题已经成为医疗服务、军事和制造业等领域研究的热点,其在灾害搜索与营救、城市智能交通、无人机集群战场侦察与袭击等方面的应用引起了相关研究人员的极大关注。群机器人协同不仅能够增强机器人系统的灵活性,而且能够完成单个机器人无法完成的任务。群机器人系统的协同行为可分为基于合作的协同与基于竞争的协同,系统内的个体通过相互合作、竞争和自组织,在集体层面上呈现出有序的协同运动和行为。然而,现阶段针对群机器人协同的研究大多仅考虑基于合作行为的协同,其通常会带来资源浪费、系统冗余以及任务效率降低等问题,且无法更加全面准确地建模与反映出各种社会现象与原理。因此,亟需为群机器人系统构建竞争协同机制,从而进一步提高系统效率,合理配置资源,开拓其在诸如面向多目标群体的跟踪、围捕、救援等一系列任务中的应用前景。
由于群机器人系统中各机器人之间受到方位不定、间隔距离、通信功率的限制,通常不具有全局通信的能力。采用分布式通信拓扑结构的群机器人系统只需使各机器人与其在通信拓扑图中连通的机器人进行通信,极大地降低了系统的通信负载且提高了系统的稳定性,即使出现某些局部通信失败,群机器人系统也能正常工作。此外,考虑到机器人自身的故障干扰、系统布局的变动等情况,切换拓扑网络结构更适用于动态复杂环境中作业的实施。
发明内容
本发明提出一种面向多目标追踪的群机器人分布式竞争协同方法,旨在实现群机器人系统在通信受限、故障干扰存在下的分布式竞争协同,并使系统内所有机器人在执行任务时效率与精确度均达到最优化。
本发明实施例第一方面提供了一种面向多目标追踪的群机器人分布式竞争协同方法中对最优机器人的决策流程;
所述群机器人系统的分布式竞争协同中对最优机器人的决策流程包括:
获取所述目标群体和系统中各机器人的位置和速度等信息;
探测所述群机器人系统运行环境中外界障碍物的位置(速度)信息并监查各机器人自身潜在的摩擦和震动等干扰因素;
按照所述群机器人系统的分布式竞争协同规则对系统中的机器人进行最优化选择;
所述群机器人系统的分布式竞争协同中用于最优机器人选择的决策方案为
Figure BDA0002565969250000021
其中,
Figure BDA0002565969250000022
为输入向量
Figure BDA0002565969250000023
的第
Figure BDA0002565969250000024
个元素
Figure BDA0002565969250000025
其作为所述群机器人系统的分布式竞争协同中用于最优机器人选择的输入信息,表征系统中各机器人的竞争态势权重;该竞争态势权重由
Figure BDA0002565969250000026
Figure BDA0002565969250000027
决定,
Figure BDA0002565969250000028
表示最优机器人判定的影响因素,包括:系统各机器人与目标群体的相对速度、相对位置、系统各机器人的结构设计与执行能力等;
Figure BDA0002565969250000029
为由加权影响因素
Figure BDA00025659692500000225
到竞争态势权重
Figure BDA00025659692500000210
的映射函数,充分考虑任务执行环境中障碍物与各机器人的相对位置信息等并设置安全阈值d,使群机器人系统运行满足:机器人相对障碍物远离安全阈值d时,
Figure BDA00025659692500000211
机器人相对障碍物落入安全阈值d时,
Figure BDA00025659692500000212
即一个极大负值;
Figure BDA00025659692500000213
具体反映为利用所获取的障碍物与群机器人系统的各种信息,对处于障碍物安全阈值外的机器人依据其竞争态势权重完成所述决策,对处于障碍物安全阈值内的机器人自动退出群机器人竞争网络,由系统内其余机器人构成决策系统进行竞争;障碍物包含外界阻碍机器人运动的各种环境因素、系统内其它机器人、机器人自身结构间的摩擦与震动等;
Figure BDA00025659692500000214
为输出向量
Figure BDA00025659692500000215
的第
Figure BDA00025659692500000216
个元素,表征控制群机器人系统内各机器人是否被派遣执行追踪任务的驱动信息指令,且
Figure BDA00025659692500000217
为群机器人的分布式竞争协同系统的不等式约束条件;所述决策方案的判定条件为:条件1:若
Figure BDA00025659692500000218
属于输入向量
Figure BDA00025659692500000219
中的前
Figure BDA00025659692500000220
个最大的元素,即对应群机器人系统中竞争态势权重最大的
Figure BDA00025659692500000221
个机器人,此时驱动信息指令
Figure BDA00025659692500000222
Figure BDA00025659692500000223
个机器人用于执行任务,条件2:反之驱动信息指令
Figure BDA00025659692500000224
机器人保持静止并继续监测新的目标群体。
本发明实施例第二方面提供了一种面向多目标追踪的群机器人分布式竞争协同方法,其特征在于,所述群机器人的分布式竞争协同系统包括多个用于执行任务的机器人及不多于机器人数量的目标对象,所述群机器人的分布式竞争协同系统内的机器人在通信拓扑图中连通;
所述方法包括如下步骤:
分配机器人并实时探测和感知目标群体及环境信息;
实时获取所述目标群体的位置和速度等信息;
实时监测群机器人系统的覆盖域和系统消耗的通信功率;
实时规划切换通信拓扑结构以约束系统功率与能量损耗实现最优化;
系统中各机器人实时获取在切换通信拓扑图中与其连通的机器人的位置和速度等信息,所述切换通信拓扑图中相连通的机器人间采用全双工通信;
根据所述目标群体和机器人的位置和速度等信息,按照预设的规则实时构建所述群机器人的分布式竞争协同中用于最优机器人选择的决策方案;
在所述群机器人的分布式竞争协同系统的约束下,根据标准二次规划方法确定分配各机器人的驱动信息指令;
根据所述驱动信息指令实时选择出系统中竞争态势权重最大的
Figure BDA0002565969250000031
个机器人执行任务,其余机器人保持静止并等待下一目标群体的出现,并实时识别机器人与目标群体的运动坐标系,直至机器人与目标群体的运动坐标系重合,从而实现面向目标群体的跟踪、围捕、救援等一系列任务的群机器人分布式竞争协同。
与现有技术相比,本发明有如下优点:突破传统针对群机器人系统开展的研究大多为基于合作的协同这一局限,引入群机器人间的竞争机制并将其应用于面向多目标的跟踪、围捕、救援等一系列任务中,拓展群机器人系统的应用场景;采用分布式协同控制方法,鉴于系统中各机器人只需与较少数量的机器人进行通信,大大降低了群机器人分布式竞争协同系统的通信负载和计算负担,最终在通信受限的情况下实现群机器人的分布式竞争协同。
附图说明
图1为本发明实施例中一种面向多目标追踪的群机器人分布式竞争协同方法一个实施例的流程图;
图2为图1中步骤101的一个实施例的具体流程图;
图3为图1中步骤106的一个实施例的具体流程图;
图4为图1中步骤107的一个实施例的具体流程图。
具体实施方式
本发明提出一种面向多目标追踪的群机器人分布式竞争协同方法,旨在实现群机器人系统在通信受限、故障干扰存在下的分布式竞争协同,并使系统内所有机器人在执行任务时效率与精确度均达到最优化。在群机器人的分布式竞争协同控制过程中,我们均采用以下规则来实现执行任务的最优化。
所述群机器人系统的分布式竞争协同中对最优机器人的决策流程包括:
获取所述目标群体和系统中各机器人的位置信息;
探测所述群机器人系统运行环境中外界障碍物的位置信息;
按照所述群机器人系统的分布式竞争协同规则对系统中的机器人进行最优化选择;
所述群机器人系统的分布式竞争协同中用于最优机器人选择的规则具体为:
假定竞争态势权重为:
Figure BDA0002565969250000041
其中,
Figure BDA0002565969250000042
为系统内第
Figure BDA0002565969250000043
个机器人的关节角度;映射函数
Figure BDA0002565969250000044
将系统内第
Figure BDA0002565969250000045
个机器人的关节角度空间信息映射到笛卡尔空间,且满足关节的运动学方程
Figure BDA0002565969250000046
以及对应的时间导数信息
Figure BDA0002565969250000047
Figure BDA0002565969250000048
为机器人的雅可比矩阵;
Figure BDA0002565969250000049
为第
Figure BDA00025659692500000410
个机器人的末端执行器的实时位置坐标信息;rd(t)为机器人末端执行器的期望运动轨迹,即目标对象的运动路径;
Figure BDA00025659692500000411
为所述机器人末端执行器的实时位置与目标对象的实时位置之间距离向量的范数;
Figure BDA00025659692500000412
作为所述群机器人的分布式竞争协同中用于最优机器人选择的输入竞争态势权重,表征系统中各机器人的实时位置与目标对象的实时位置之间的距离。根据所有已得到的系统中各机器人与目标对象的位置距离构建上述竞争态势权重作为最优机器人决策方案的输入信息,群机器人系统内部通过已构建的通信拓扑结构实现信息的流通与传递,进而推动群机器人系统内部基于赢者通吃的竞争以确定输入竞争态势权重中
Figure BDA00025659692500000413
个最大值,即距离目标对象前
Figure BDA00025659692500000428
个最近的机器人。同时,在机器人任务执行过程中,考虑到所探测到的外界障碍物的位置信息,通过映射函数
Figure BDA00025659692500000414
来修正输入竞争态势权重。因障碍物存在对输入竞争态势权重进行调整的规则具体为:
设定障碍物与机器人各连杆之间的最短距离为
Figure BDA00025659692500000415
其中,
Figure BDA00025659692500000416
为障碍物的实时位置信息;
Figure BDA00025659692500000429
为机器人的各连杆上距离障碍物最近点的实时位置信息。设置机器人运行的安全阈值为d,若障碍物与各连杆间的最短距离中至少存在一个落入安全阈值d内的距离信息,则
Figure BDA00025659692500000417
该机器人自动退出群机器人竞争网络且被视为本次任务执行中的输家,而群机器人系统内其余机器人
Figure BDA00025659692500000418
继续进行基于赢者通吃机制的竞争以重新确定输入竞争态势权重中
Figure BDA00025659692500000419
个最大值。经过系统竞争所决策出的这
Figure BDA00025659692500000420
个机器人被用于执行任务,且在机器人运动过程中实时探测群机器人系统的布局以不断调整需要派出执行任务的最优机器人,对于执行任务的机器人,即
Figure BDA00025659692500000421
属于输入向量
Figure BDA00025659692500000422
中的前
Figure BDA00025659692500000423
个最大的元素,其对应的驱动信息指令
Figure BDA00025659692500000424
反之
Figure BDA00025659692500000425
对于任意一个目标对象实时分配
Figure BDA00025659692500000426
个机器人用于执行任务,余下的
Figure BDA00025659692500000427
个机器人保持静止,等待用于本次任务执行中群机器人系统布局变动引起的机器人分配的实时调整,另一方面等待下一目标群体的出现再次进行最优机器人选择;
根据上述对群机器人系统的分布式竞争协同中用于最优机器人选择的规则的描述,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行进一步描述:
图1展示了本发明一种面向多目标追踪的群机器人分布式竞争协同方法的一个实施例的流程图,所述群机器人的分布式竞争协同系统包括多个用于执行任务的机器人及不多于机器人数量的目标对象,所述群机器人的分布式竞争协同系统内的机器人在通信拓扑图中连通;
如图1所示,所述控制方法包括:
101、分配机器人并实时探测和感知目标群体及环境信息;
102、实时获取所述目标群体的位置信息;
103、实时监测群机器人系统的覆盖域和系统消耗的通信功率;
104、实时规划切换通信拓扑结构以约束系统功率与能量损耗实现最优化;
105、系统中各机器人实时获取在切换通信拓扑图中与其连通的机器人的位置信息,所述切换通信拓扑图中相连通的机器人间采用全双工通信;
系统中的各机器人需要确定目标群体的位置信息,同时获取与所述机器人在通信拓扑图中连通的机器人所确定的与目标群体间的相对位置信息。由于群机器人系统的动态性以及任务执行的时变性,通信拓扑结构会根据系统的覆盖域和系统消耗的通信功率不断切换,从而不断更新与所述机器人进行实时通信的机器人。然而各时刻的切换拓扑图为平衡无向图,且各拓扑图间联合连接,保证通信的平稳与流畅。
106、根据所述目标群体和机器人的位置信息,按照预设的规则实时构建所述群机器人的分布式竞争协同中用于最优机器人选择的决策方案;
在系统中各机器人执行任务时,目标群体和机器人的位置实时改变使得群机器人分布式竞争协同系统的位置分布改变,或是障碍物的存在性导致部分机器人退出竞争网络,因此对于最优机器人的选择需要进行实时的距离判定以及修正,即在执行同一个任务时会有不同的机器人被交替派出。整个过程保持用于执行任务的机器人数量
Figure BDA0002565969250000051
不变,其余
Figure BDA0002565969250000052
个机器人保持静止并等待下一目标群体的出现。
107、在所述群机器人的分布式竞争协同系统的约束下,根据标准二次规划方法确定分配各机器人的驱动信息指令;
各机器人实时获取目标群体的位置信息并借助于通信拓扑图的连通性获取与所述机器人连通的机器人所确定的目标群体的位置信息,以此按照预设的规则构建相应的二次规划方案。
108、根据所述驱动信息指令实时选择出系统中竞争态势权重最大的
Figure BDA0002565969250000053
个机器人执行任务,其余机器人保持静止并等待下一目标群体的出现,并实时识别机器人与目标群体的运动坐标系,直至机器人与目标群体的运动坐标系重合,从而实现面向目标群体的跟踪、围捕、救援等一系列任务的群机器人分布式竞争协同。
进一步地,如图2所示,步骤101具体可以包括:
1011、实时获取所述目标群体的位置信息;
1012、根据目标群体的类型分配不同类型的机器人,初步将机器人与目标群体间的相对位置信息以及任务执行环境中障碍物与各机器人的相对位置信息作为分配的考虑因素,综合所述分配的考虑因素构成用于最优机器人选择的竞争态势权重
Figure BDA0002565969250000061
1013、根据目标群体的规模分配不同数量的机器人,对于每个目标对象设置
Figure BDA0002565969250000062
个机器人用于任务执行;系统中竞争态势权重最大的
Figure BDA0002565969250000063
个机器人被用于执行任务,其余机器人静止并继续监测目标群体等待执行任务。
如图3所示,步骤106具体可以包括:
1061、实时获取所述目标群体的位置信息;
1062、实时监测群机器人系统的覆盖域和系统消耗的通信功率;
1063、实时规划切换通信拓扑结构以约束系统功率与能量损耗实现最优化;
1064、系统中各机器人实时获取在切换通信拓扑图中与其连通的机器人的位置信息,所述切换通信拓扑图中相连通的机器人间采用全双工通信;
1065、根据所述目标群体和机器人的位置信息,实时构建所述用于最优机器人选择的决策方案对应的竞争态势权重;
1066、机器人监测目标群体并实时识别目标群体的运动坐标系,对群机器人系统的布局、机器人与目标群体间的相对距离、机器人运动环境中障碍物的位置信息进行实时确定并对所述竞争态势权重不断修正以判定是否需要更改用于执行任务的机器人;
1067、根据所述竞争态势权重构建所述用于最优机器人选择的决策方案,即确定输入竞争态势权重
Figure BDA0002565969250000064
对应的输出驱动信息指令
Figure BDA0002565969250000065
结合所述群机器人系统的分布式竞争协同规则以及赢者通吃的设计理念,对用于执行任务的机器人的驱动信息指令记为1;对静止并继续监测目标群体等待执行任务的机器人的驱动信息指令记为0;因此,所述一种面向多目标追踪的群机器人分布式竞争协同方法的输出驱动信息指令满足:
Figure BDA0002565969250000066
进一步而言,如图4所示,步骤107具体可以包括:
1071、设置最优化性能指标为系统中机器人的竞争态势权重,根据所述用于最优机器人选择的决策方案以及所述群机器人分布式竞争协同系统的约束构建标准二次规划;
所述决策方案与群机器人的分布式竞争协同系统的约束可描述为如下标准二次规划:
最小化:
Figure BDA0002565969250000071
约束条件:
Figure BDA0002565969250000072
其中,
Figure BDA0002565969250000073
上标T表示向量的转置;A(t)=[En×n;-En×n];a(t)=[1n;0n],对于上述标准二次规划问题,引入一类非线性互补函数来辅助求解满足等式约束和不等式约束的最优化问题,因此求解上述标准二次规划问题等价于求解一个非线性方程:
S(t)d(t)=c(t),
其中,
Figure BDA0002565969250000074
Figure BDA0002565969250000075
Figure BDA0002565969250000076
Figure BDA0002565969250000077
γ>0;
Figure BDA0002565969250000078
Figure BDA0002565969250000079
分别代表上述标准二次规划问题中等式约束和不等式约束对应的拉格朗日乘子。
1072、对所述标准二次规划用二次规划求解器进行求解,得到求解结果;
下面给出一个可行的二次规划求解器的例子(本发明不限于该求解器例子)。通过定义一个误差函数
Figure BDA00025659692500000710
结合误差函数的演化公式
Figure BDA00025659692500000711
我们可以给出所述求解器的连续时间表达式为:
Figure BDA00025659692500000712
整理上述表达式得到连续时间求解器模型为:
Figure BDA00025659692500000713
上述连续时间求解器模型可以用于求解所述群机器人系统的分布式竞争协同对应的标准二次规划问题,所求解结果即为用于群机器人分布式竞争协同系统选择最优机器人执行任务的驱动信息指令。为了将求解器模型更好地应用于数值设备,我们拟给出欧拉前向差分公式(本发明不限于该差分公式)对上述求解器进行离散化:
Figure BDA00025659692500000714
其中,k表示更新指数且k=0,1,2,…;δ为采样间隔。因此,一种离散时间求解器模型为:
Figure BDA00025659692500000715
1073、根据所述求解结果分配用于任务执行的机器人。
在本发明实施例中,是以系统中各机器人与目标群体之间的位置距离作为选择最优机器人的性能指标来构建竞争态势权重,且将环境中的障碍物因素作为辅助参数。但是在实际操作以及任务执行过程中,对于最优机器人的选择并不仅限于此,还涉及速度信息、结构设计、执行能力、机器人自身的摩擦与震动带来的干扰等多方面的因素。在对群机器人进行最优选择时,为保证更加精确高效的判断,可增加对速度信息的判定。当获取位置信息并得到距离数值后,需要对各机器人的初始速度方向以及相对于目标对象的速度大小进行确定,若机器人的初始速度方向与目标对象的运动速度方向相反,此时的机器人需要根据所获取到的目标对象的运动方向以及速度信息进行自动调整,并由此提高任务执行的精度和效率。
据上所述,以上实施例仅用以说明本发明的技术方案,而并非对其限制。本领域的技术人员应当理解:对上述实施例中所记载的技术方案仍可进行改进和优化,也可对其中部分技术特征进行等同替换。而这些改进或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

Claims (6)

1.一种面向多目标追踪的群机器人分布式竞争协同方法,其特征在于,根据所述目标群体与机器人的位置和速度等信息构建群机器人系统的分布式竞争协同中用于最优机器人选择的决策方案;
所述群机器人系统的分布式竞争协同中对最优机器人的决策流程包括:
获取所述目标群体和系统中各机器人的位置和速度等信息;
探测所述群机器人系统运行环境中外界障碍物的位置(速度)信息并监查各机器人自身潜在的摩擦和震动等干扰因素;
按照所述群机器人系统的分布式竞争协同规则对系统中的机器人进行最优化选择;
所述群机器人系统的分布式竞争协同中用于最优机器人选择的决策方案为
Figure FDA0002565969240000011
其中,
Figure FDA0002565969240000012
为输入向量
Figure FDA0002565969240000013
的第
Figure FDA0002565969240000014
个元素
Figure FDA0002565969240000015
其作为所述群机器人系统的分布式竞争协同中用于最优机器人选择的输入信息,表征系统中各机器人的竞争态势权重;该竞争态势权重由
Figure FDA0002565969240000016
Figure FDA0002565969240000017
决定,
Figure FDA0002565969240000018
表示最优机器人判定的影响因素,包括:系统各机器人与目标群体的相对速度、相对位置、系统各机器人的结构设计与执行能力等;
Figure FDA0002565969240000019
为由加权影响因素
Figure FDA00025659692400000110
到竞争态势权重
Figure FDA00025659692400000111
的映射函数,充分考虑任务执行环境中障碍物与各机器人的相对位置信息等并设置安全阈值d,使群机器人系统运行满足:机器人相对障碍物远离安全阈值d时,
Figure FDA00025659692400000112
机器人相对障碍物落入安全阈值d时,
Figure FDA00025659692400000113
即一个极大负值;
Figure FDA00025659692400000114
具体反映为利用所获取的障碍物与群机器人系统的各种信息,对处于障碍物安全阈值外的机器人依据其竞争态势权重完成所述决策,对处于障碍物安全阈值内的机器人自动退出群机器人竞争网络,由系统内其余机器人构成决策系统进行竞争;障碍物包含外界阻碍机器人运动的各种环境因素、系统内其它机器人、机器人自身结构间的摩擦与震动等;
Figure FDA00025659692400000115
为输出向量
Figure FDA00025659692400000116
的第
Figure FDA00025659692400000117
个元素,表征控制群机器人系统内各机器人是否被派遣执行追踪任务的驱动信息指令,且
Figure FDA00025659692400000118
为群机器人的分布式竞争协同系统的不等式约束条件;所述决策方案的判定条件为:条件1:若
Figure FDA00025659692400000119
属于输入向量
Figure FDA00025659692400000120
中的前
Figure FDA00025659692400000121
个最大的元素,即对应群机器人系统中竞争态势权重最大的
Figure FDA00025659692400000122
个机器人,此时驱动信息指令
Figure FDA00025659692400000123
Figure FDA00025659692400000124
个机器人用于执行任务,条件2:反之驱动信息指令
Figure FDA00025659692400000125
机器人保持静止并继续监测新的目标群体。
2.根据权利要求1所述的一种面向多目标追踪的群机器人分布式竞争协同方法,其特征在于,所述群机器人的分布式竞争协同系统包括多个用于执行任务的机器人及不多于机器人数量的目标对象,所述群机器人的分布式竞争协同系统内的机器人在通信拓扑图中连通;
所述方法包括如下步骤:
分配机器人并实时探测和感知目标群体及环境信息;
实时获取所述目标群体的位置和速度等信息;
实时监测群机器人系统的覆盖域和系统消耗的通信功率;
实时规划切换通信拓扑结构以约束系统功率与能量损耗实现最优化;
系统中各机器人实时获取在切换通信拓扑图中与其连通的机器人的位置和速度等信息,所述切换通信拓扑图中相连通的机器人间采用全双工通信;
根据所述目标群体和机器人的位置和速度等信息,按照预设的规则实时构建所述群机器人的分布式竞争协同中用于最优机器人选择的决策方案;
在所述群机器人的分布式竞争协同系统的约束下,根据标准二次规划方法确定分配各机器人的驱动信息指令;
根据所述驱动信息指令实时选择出系统中竞争态势权重最大的
Figure FDA0002565969240000022
个机器人执行任务,其余机器人保持静止并等待下一目标群体的出现,并实时识别机器人与目标群体的运动坐标系,直至机器人与目标群体的运动坐标系重合,从而实现面向目标群体的跟踪、围捕、救援等一系列任务的群机器人分布式竞争协同。
3.根据权利要求2所述的一种面向多目标追踪的群机器人分布式竞争协同方法,其特征在于,分配机器人并实时探测和感知目标群体及环境信息具体为:
实时获取所述目标群体的位置和速度等信息;
根据目标群体的类型分配不同类型的机器人,将机器人与目标群体间的相对位置、速度信息、各机器人的结构设计与执行能力、任务执行环境中障碍物与各机器人的相对位置信息等作为分配的考虑因素,综合所述分配的考虑因素构成用于最优机器人选择的竞争态势权重
Figure FDA0002565969240000021
根据目标群体的规模分配不同数量的机器人,对于每个目标对象设置
Figure FDA0002565969240000024
个机器人用于任务执行;系统中竞争态势权重最大的
Figure FDA0002565969240000023
个机器人被用于执行任务,其余机器人静止并继续监测目标群体等待执行任务。
4.根据权利要求3所述的一种面向多目标追踪的群机器人分布式竞争协同方法,其特征在于,所述用于最优机器人选择的决策方案通过以下步骤确定:
实时获取所述目标群体的位置和速度等信息;
实时监测群机器人系统的覆盖域和系统消耗的通信功率;
实时规划切换通信拓扑结构以约束系统功率与能量损耗实现最优化;
系统中各机器人实时获取在切换通信拓扑图中与其连通的机器人的位置和速度等信息,所述切换通信拓扑图中相连通的机器人间采用全双工通信;
根据所述目标群体和机器人的位置和速度等信息,实时构建所述用于最优机器人选择的决策方案对应的竞争态势权重;
机器人监测目标群体并实时识别目标群体的运动坐标系,对群机器人系统的布局、机器人与目标群体间的相对距离、速度、机器人运动环境中障碍物的位置等信息进行实时确定并对所述竞争态势权重不断修正以判定是否需要更改用于执行任务的机器人;
根据所述竞争态势权重构建所述用于最优机器人选择的决策方案,即确定输入竞争态势权重
Figure FDA0002565969240000031
对应的输出驱动信息指令
Figure FDA0002565969240000032
结合所述群机器人系统的分布式竞争协同规则以及赢者通吃的设计理念,对用于执行任务的机器人的驱动信息指令记为1;对静止并继续监测目标群体等待执行任务的机器人的驱动信息指令记为0;因此,所述一种面向多目标追踪的群机器人分布式竞争协同方法的输出驱动信息指令满足:
Figure FDA0002565969240000033
5.根据权利要求1至4中任一项所述的一种面向多目标追踪的群机器人分布式竞争协同方法,其特征在于,根据所述群机器人系统对目标群体进行监测并执行相应任务的规则,利用标准二次规划方法确定分配机器人的驱动信息指令具体包括:
设置最优化性能指标为系统中机器人的竞争态势权重,根据所述用于最优机器人选择的决策方案以及所述群机器人分布式竞争协同系统的约束构建标准二次规划;
对所述标准二次规划用二次规划求解器进行求解,得到求解结果;
根据所述求解结果分配用于任务执行的机器人。
6.根据权利要求5所述的一种面向多目标追踪的群机器人分布式竞争协同方法,其特征在于,所述标准二次规划构建过程为:
假设第
Figure FDA0002565969240000034
个最大竞争态势权重
Figure FDA00025659692400000312
与第
Figure FDA0002565969240000035
个最大竞争态势权重间的差值最小为e(e为常数且e>0),那么权利要求1中所述群机器人系统执行任务中用于最优机器人选择的决策方案等价于一个标准二次规划问题为:
最小化:
Figure FDA0002565969240000036
约束条件:
Figure FDA0002565969240000037
其中,上述二次规划问题中各系数向量的定义为:
Figure FDA0002565969240000038
Figure FDA0002565969240000039
上标T表示向量的转置;
上述标准二次规划问题可被重新表述为:
最小化:
Figure FDA00025659692400000310
约束条件:
Figure FDA00025659692400000311
其中,A(t)=[En×n;-En×n];a(t)=[1n;0n],对于上述标准二次规划问题,引入一类非线性互补函数来辅助求解满足等式约束和不等式约束的最优化问题,因此求解上述标准二次规划问题等价于求解一个非线性方程:
S(t)d(t)=c(t),
其中,
Figure FDA0002565969240000041
Figure FDA0002565969240000042
Figure FDA0002565969240000043
Figure FDA0002565969240000044
Figure FDA0002565969240000045
分别代表上述标准二次规划问题中等式约束和不等式约束对应的拉格朗日乘子;
因此,在群机器人系统分布式竞争协同中针对所探测到的目标群体,系统中竞争态势权重的前
Figure FDA0002565969240000046
个最大值所对应的机器人可以实现对其有效地跟踪、围追、救援等任务;而在后续执行任务时,对于再次选择竞争态势权重最大的机器人需要对上述非线性等式进行重复操作,即进行迭代运算,且每次机器人的选择范围均为排除已派出执行任务的机器人后所有剩余的机器人。
CN202010632057.9A 2020-07-02 2020-07-02 一种面向多目标追踪的群机器人分布式竞争协同方法 Withdrawn CN111830916A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010632057.9A CN111830916A (zh) 2020-07-02 2020-07-02 一种面向多目标追踪的群机器人分布式竞争协同方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010632057.9A CN111830916A (zh) 2020-07-02 2020-07-02 一种面向多目标追踪的群机器人分布式竞争协同方法

Publications (1)

Publication Number Publication Date
CN111830916A true CN111830916A (zh) 2020-10-27

Family

ID=72899699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010632057.9A Withdrawn CN111830916A (zh) 2020-07-02 2020-07-02 一种面向多目标追踪的群机器人分布式竞争协同方法

Country Status (1)

Country Link
CN (1) CN111830916A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113580129A (zh) * 2021-07-19 2021-11-02 中山大学 一种基于机器人的多目标协同围捕方法、装置及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140195095A1 (en) * 2008-12-30 2014-07-10 Elbit Systems Ltd. Autonomous navigation system and method for a maneuverable platform
CN107065860A (zh) * 2017-02-24 2017-08-18 华南理工大学 一种面向渔业捕捞的无人船群协同自组织作业系统及方法
CN107193009A (zh) * 2017-05-23 2017-09-22 西北工业大学 一种模糊自适应多交互模型的多uuv协同系统水下目标跟踪算法
US20180326583A1 (en) * 2017-05-11 2018-11-15 King Fahd University Of Petroleum And Minerals Dynamic multi-objective task allocation
CN109116349A (zh) * 2018-07-26 2019-01-01 西南电子技术研究所(中国电子科技集团公司第十研究所) 多传感器协同跟踪联合优化决策方法
CN109839933A (zh) * 2019-02-20 2019-06-04 哈尔滨工程大学 一种基于vdsom算法的多机器人任务分配方法
CN110096061A (zh) * 2019-06-04 2019-08-06 兰州大学 一种无人艇集群的抗扰动分布式协同控制方法与装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140195095A1 (en) * 2008-12-30 2014-07-10 Elbit Systems Ltd. Autonomous navigation system and method for a maneuverable platform
CN107065860A (zh) * 2017-02-24 2017-08-18 华南理工大学 一种面向渔业捕捞的无人船群协同自组织作业系统及方法
US20180326583A1 (en) * 2017-05-11 2018-11-15 King Fahd University Of Petroleum And Minerals Dynamic multi-objective task allocation
CN107193009A (zh) * 2017-05-23 2017-09-22 西北工业大学 一种模糊自适应多交互模型的多uuv协同系统水下目标跟踪算法
CN109116349A (zh) * 2018-07-26 2019-01-01 西南电子技术研究所(中国电子科技集团公司第十研究所) 多传感器协同跟踪联合优化决策方法
CN109839933A (zh) * 2019-02-20 2019-06-04 哈尔滨工程大学 一种基于vdsom算法的多机器人任务分配方法
CN110096061A (zh) * 2019-06-04 2019-08-06 兰州大学 一种无人艇集群的抗扰动分布式协同控制方法与装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113580129A (zh) * 2021-07-19 2021-11-02 中山大学 一种基于机器人的多目标协同围捕方法、装置及介质
CN113580129B (zh) * 2021-07-19 2024-01-16 中山大学 一种基于机器人的多目标协同围捕方法、装置及介质

Similar Documents

Publication Publication Date Title
Tang et al. Swarm intelligence algorithms for multiple unmanned aerial vehicles collaboration: A comprehensive review
CN108801266B (zh) 一种多无人机对不确定环境搜索的航迹规划方法
CN111638717B (zh) 一种分布式自主机器人交通协调机制的设计方法
CN111552314B (zh) 多无人机自适应编队跟踪控制方法
Liang et al. Mobile robot path planning based on adaptive bacterial foraging algorithm
CN109270934B (zh) 基于领航者切换的多机器人编队续航方法
CN113342030B (zh) 基于强化学习的多无人机协同自组织控制方法及系统
CN114578772B (zh) 一种agv集群控制系统设计框架及方法
Yasin et al. Navigation of autonomous swarm of drones using translational coordinates
Huang et al. A novel hybrid discrete grey wolf optimizer algorithm for multi-UAV path planning
Geng et al. Learning to cooperate in decentralized multi-robot exploration of dynamic environments
CN113900449B (zh) 多无人机轨迹规划方法、装置、无人机及存储介质
CN111830916A (zh) 一种面向多目标追踪的群机器人分布式竞争协同方法
Wu et al. Deep-reinforcement-learning-based multitarget coverage With connectivity guaranteed
Wu et al. Collision-aware task assignment for multi-robot systems
Yi et al. Digital twin constructed spatial structure for flexible and efficient task allocation of drones in mobile networks
CN112034844A (zh) 多智能主体编队搬运方法、系统和计算机可读存储介质
CN116449864A (zh) 一种无人机集群的最优路径选择方法
Liu et al. Multiple UAV formations delivery task planning based on a distributed adaptive algorithm
CN113485339A (zh) 基于petri网的送餐机器人路径优化及任务分配方法
Shang et al. Interacting with multi-agent systems through intention field based shared control methods
Wang et al. Cooperative control of robotic swarm based on self-organized method and human swarm interaction
Yu et al. A novel automated guided vehicle (AGV) remote path planning based on RLACA algorithm in 5G environment
Saifutdinov et al. Scenario Modeling in a Centralized Airport Ground Traffic Control System
Lucas et al. A distributed control of movements and fuzzy logic-based task allocation for a swarm of autonomous agents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20201027

WW01 Invention patent application withdrawn after publication