CN104942807B - 基于扩展式合作博弈的多机器人围捕目标方法 - Google Patents

基于扩展式合作博弈的多机器人围捕目标方法 Download PDF

Info

Publication number
CN104942807B
CN104942807B CN201510178542.2A CN201510178542A CN104942807B CN 104942807 B CN104942807 B CN 104942807B CN 201510178542 A CN201510178542 A CN 201510178542A CN 104942807 B CN104942807 B CN 104942807B
Authority
CN
China
Prior art keywords
robot
target
enclosure
robots
trapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510178542.2A
Other languages
English (en)
Other versions
CN104942807A (zh
Inventor
李敏
曹金阁
李洋
窦连航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201510178542.2A priority Critical patent/CN104942807B/zh
Publication of CN104942807A publication Critical patent/CN104942807A/zh
Application granted granted Critical
Publication of CN104942807B publication Critical patent/CN104942807B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/1605Simulation of manipulator lay-out, design, modelling of manipulator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Manipulator (AREA)

Abstract

本发明提供一种基于扩展式合作博弈的多机器人围捕目标方法,包括如下步骤:步骤一:对多机器人围捕的扩展式合作博弈模型进行数学建模;步骤二:制定机器人的运行策略;步骤三:围捕任务执行过程的制定;本发明使得围捕机器人在执行任务过程中可以有更加灵活的位置,它们可以快速的追赶目标,追赶过程中可以躲避障碍物和同伴,最后围堵在目标机器人周围,使得目标机器人无法从包围圈中逃脱。

Description

基于扩展式合作博弈的多机器人围捕目标方法
技术领域
本发明涉及多机器人协作围捕领域,尤其涉及一种基于扩展式合作博弈的多机器人围捕目标方法。
背景技术
近年来,多机器人协作已经得到了研究者的关注,在社会生活和军事项目中都起到了非常重要的作用。单个机器人现在功能越来越强大,可以完成难度大的任务,但是在单个机器人身上为了完成某种任务而添加功能,这样的成本是巨大的,所以研究者开始探寻其他的方法来弥补单机器人的此项弱点。多机器人系统一般是用成本低并且功能简单的轮式机器人来组成,它不仅可以完成单个机器人所能完成的任务,而且还能显著的提高机器人的工作效率。
多机器人协作围捕是检验多机器人工作效率的有效方法之一。多机器人围捕过程就是利用三个或者三个以上的轮式机器人,首先协作寻找到环境中移动的一个目标机器人,然后通过运动过程中围在目标周围来达到围捕目标的目的,最后目标没有运行的出口后,任务结束。传统的多机器人围捕通常是采用对多机器人队伍进行编队的形式,这种方法必须要求群体形成一个固定的队伍形状。但是这种方法使得机器人的运动不够灵活,每个机器人必须出现在一个固定的位置上来围捕目标,从而增加了完成任务的复杂度。基于编队形式的不足,人们运用博弈论的相关知识,在多机器人协作围捕系统中把围捕者和围捕目标看作博弈的两方,建立博弈模型,分析影响围捕行为中各个机器人博弈策略的要素,然后对群体机器人围捕策略进行优化,以求达到围捕团队整体性能最优。在博弈模型中,基于合作博弈的目标围捕方法采用非编队形式的运动,使多机器人群体具有强制性,同时具有开放性,在群体约束之下个体之间可以进行自由竞争,增加了任务执行的灵活性。
发明内容
鉴于上述提到的问题,本发明的目的在于提出一种基于扩展式合作博弈的多机器人围捕目标方法。
一种基于扩展式合作博弈的多机器人围捕目标方法, 其特征在于,具体包括如下步骤:
步骤一:对多机器人围捕的扩展式合作博弈模型进行数学建模:
围捕机器人:多机器人群体协作系统中机器人集合为:
表示的是系统中的围捕机器人i;目标机器人只有一个为Target
行动集:轮到行动时,可以选择的所有行动的集合被称为行动集,记为;通过对本发明行动策略的分析和简化得到以下的行动集:
TT 策略表示围捕机器人朝目标机器人方向运动一步;
TL策略表示围捕机器人沿左侧最小避碰方向角运动一步;
TR策略表示围捕机器人沿右侧最小避碰方向角运动一步;
策略集Move中的策略分别指朝目标机器人左侧、右侧方向运动和朝目标机器人方向运动;
是具有较高碰撞危险度的机器人之间的最小避碰方向角,为最小避碰距离,代表机器人之间的距离;公式表示为:
围捕者运动方向与环境x轴的夹角为,此为围捕者的运动方向角;那么可以得到三种运动策略的运动公式如下:
TT:
TL:
TR:
阶段和行动顺序:在扩展式合作博弈中,围捕者是按照一定的规则按照顺序进行运动,每次运动称为一个阶段;本发明要求每个阶段仅有一个围捕者进行运动,因此阶段数是由参与博弈的围捕者的数量决定;
围捕机器人运行角度的计算方法:a、b、c分别为围捕者、目标前一位置和现在位置组成三角形的三个边,围捕者与目标的连线是围捕者此时的运动方向,计算公式为如下:
围捕者与目标之间的距离为为目标的坐标位置,()为围捕者坐标位置,的计算公式为:
综上所述,约定局中人博弈优先级顺序为如下三式:
式中分别为机器人的任务、与目标的相对距离和目标角对博弈优先级的影响函数,表示机器人到达目标的有效区域半径, 为每一项的权值系数,且
收益函数:在扩展式博弈中,博弈机器人的收益函数是所有个体共用的;在围捕机器人各自采取某种行为策略后,就形成一个局势,所以为了衡量局势的优劣,本发明采用局势评估函数作为收益函数,计算出的评估值作为围捕机器人的收益值;为了描述一个局势对围捕机器人完成目标的贡献大小,
步骤二:制定机器人的运行策略:
搜索目标机器人策略: 任务初始,如果围捕机器人无法发现目标机器人的位置,此时他们需要进行目标机器人的搜索;目标机器人的扫描范围也是有限的,在没有发现围捕者的情况下,所有的围捕机器人进行漫无目的的行走,围捕机器人之间不进行通信以减少负担,一旦有一个围捕机器人扫描到了目标机器人,不断的用最大的速度来追捕目标机器人,与此同时此围捕机器人会马上发出信号,发送目标机器人的位置信息给其扫描范围之内的围捕机器人,收到信息的围捕机器人也会用最大的速度去追捕目标机器人,并且也会发出目标机器人的位置信息给其他的围捕机器人,最后所有收到目标机器人位置信息的围捕机器人会执行围捕任务;
判定围捕任务成功完成:由收益函数得知,围捕机器人在不发生碰撞的情况下,与目标机器人的距离越近收益越大,同时与其他围捕机器人距离越远其收益越大,但是由于是围捕任务,靠近目标比围捕机器人之间的距离更重要,所以在收益函数中靠近目标的收益权值比围捕机器人之间距离权值大,所以围捕机器人优先靠近目标机器人的情况下,再与其他围捕机器人保持最大的安全距离;当围捕机器人群体对目标形成围捕之后,群体几乎是均匀的分配在目标机器人周围;这样就会产生一个问题:围捕机器人群体较少时,相邻机器人之间的距离较大,容许目标机器人安全通过,造成无法完成围捕任务的情况;
目标机器人逃脱策略:围捕机器人到达危险区域后,离目标机器人越近的围捕机器人对其影响越大,围捕机器人对目标影响力相加得到矢量,即为目标此时的运动方向;所以目标机器人的逃脱方向的计算公式为如下式:
是指运动方向的矢量;是指Target的距离;
步骤三:围捕任务执行过程的制定:
机器人分为围捕者与目标,围捕机器人有三个以上的机器人,目标只有一个机器人,所有的机器人都是同构机器人,以方便运行过程中的计算;围捕者快速的靠近目标,然后均匀的围住目标,将目标限制在围捕者组成的圈内,限制目标的运动;
整个围捕过程为: 在一个平面空间中随机的产生n个围捕机器人,开始搜寻空间中的目标机器人;机器人的位置信息都是公开化的,围捕机器人根据位置信息和其他围捕机器人的运动方向来确定围捕队伍中动态博弈的顺序;根据动态博弈的顺序,围捕机器人开始了与其他机器人个体的博弈,最终确定自身的运动策略;目标机器人根据围捕机器人的位置信息确定危险情况而选择自身的运动策略;如果目标机器人围捕成功,便将目标押送到相应位置,如果围捕不成功,再次从开始制定围捕运动策略。
与现有技术相比,本发明具有如下的有益效果:其一,本发明基于扩展式合作博弈的概念,使得每个机器人面对决策的选择都能够找到对群体利益最大的一项;其二,本发明不是采用多机器人编队的方式来进行围捕,而是采用群体自适应的方式来达到围捕的目的。本发明使得围捕过程更加灵活,每个机器人通过扩展式合作博弈的方法来考虑策略,而不需要考虑整个群体的队形。
附图说明
图1是围捕机器人运行方向示意图。
图2是机器人避障示意图。
图3是三个围捕机器人工作图。
图4是系统运行流程框图。
具体实施方式
本发明具体实施结合附图说明如下。
本发明中提供的方法区别于现有方法的显著特征在于:其一,本发明基于扩展式合作博弈的概念,使得每个机器人面对决策的选择都能够找到对群体利益最大的一项;其二,本发明不是采用多机器人编队的方式来进行围捕,而是采用群体自适应的方式来达到围捕的目的。本发明使得围捕过程更加灵活,每个机器人通过扩展式合作博弈的方法来考虑策略,而不需要考虑整个群体的队形。
本发明基于扩展式合作博弈的多机器人围捕目标方法包括如下步骤:
步骤一:对多机器人围捕的扩展式合作博弈模型进行数学建模:
(1)围捕机器人:
多机器人社会化群体协作系统中机器人集合为:
表示的是系统中的围捕机器人i;目标机器人只有一个为Target
(2)行动集:
轮到行动时,可以选择的所有行动的集合被称为行动集,记为。通过对本发明行动策略的分析和简化可以得到以下的行动集,如下式(1):
(1)
TT 策略表示围捕机器人朝目标机器人方向运动一步;
TL策略表示围捕机器人沿左侧最小避碰方向角运动一步;
TR策略表示围捕机器人沿右侧最小避碰方向角运动一步;
策略集Move中的策略分别指朝目标机器人左侧、右侧方向运动和朝目标机器人方向运动;
是具有较高碰撞危险度的机器人之间的最小避碰方向角,为最小避碰距离,代表机器人之间的距离。公式表示为如下式(2):
(2)
如图1所示,围捕者运动方向与环境x轴的夹角为,此为围捕者的运动方向角。那么可以得到三种运动策略的运动公式为如下式(3)、(4)、(5):
TT: (3)
TL: (4)
TR: (5)
(3)阶段和行动顺序:
在扩展式博弈中,围捕者是按照一定的规则按照顺序进行运动,每次运动称为一个阶段。本发明要求每个阶段仅有一个围捕者进行运动,因此阶段数是由参与博弈的围捕者的数量决定。
在此本发明主要考虑两个影响制定规则的因素:
a)任务的重要程度;
b)围捕机器人与目标点的接近程度,Lt越小且越小的围捕机器人于目标的接近程度越高;
定义1:围捕机器人运行角度的计算方法:如图2所示,a、b、c分别为围捕者、目标前一位置和现在位置组成三角形的三个边,围捕者与目标的连线是围捕者此时的运动方向,计算公式为如下式(6):
(6)
围捕者与目标之间的距离为为目标的坐标位置,()为围捕者坐标位置,的计算公式为如下式(7):
(7)
综上所述,约定局中人博弈优先级顺序为如下式(8)、(9)、(10):
(8)
(9)
(10)
式中分别为机器人的任务、与目标的相对距离和目标角对博弈优先级的影响函数,表示机器人到达目标的有效区域半径,为每一项的权值系数,且
(4)收益函数:
在扩展式合作博弈中,博弈机器人的收益函数是所有个体共用的。在围捕机器人各自采取某种行为策略后,就形成一个局势,所以为了衡量局势的优劣,本发明采用局势评估函数作为收益函数,计算出的评估值作为围捕机器人的收益值;为了描述一个局势对围捕机器人完成目标的贡献大小,本发明主要考虑以下两个因素:
(a)距离影响因素
距离影响因素是指某一局势在距离上对围捕机器人完成任务的贡献大小,我们考虑围捕机器人与目标机器人的相对距离以及围捕机器人与其他围捕机器人的相对距离两个方面的影响, 代表围捕机器人与目标机器人的安全距离和围捕机器人之间的安全距离,则收益函数分别被定义为:
从公式中得出越小,此局势对完成任务的贡献越大;越大,此局势对完成任务的贡献越大。要考虑所有围捕机器人对一个围捕机器人的收益,所以将与其他n-1个机器人的收益取平均数:
(b)角度影响因素
角度影响因素是指某一局势在运动方向上对围捕机器人完成任务的贡献大小,本发明考虑围捕机器人运动方向与目标的朝向角以及围捕机器人之间的碰撞角度的影响,收益函数被定义为:
综合考虑各影响因素得到围捕机器人的总的收益函数为:
其中,是机器人的候选行动j,分别是权值系数,且满足公式:
可以得出由本发明收益函数得到的收益值的范围在[0,1]之间,并且收益值越接近于1,局势对围捕机器人完成任务的贡献越大。
步骤二:制定机器人的运行策略:
搜索目标机器人策略:
任务初始,如果围捕机器人无法发现目标机器人的位置,此时他们需要进行目标机器人的搜索;目标机器人的扫描范围也是有限的,在没有发现围捕者的情况下,所有的围捕机器人进行漫无目的的行走,围捕机器人之间不进行通信以减少负担,一旦有一个围捕机器人扫描到了目标机器人,不断的用最大的速度来追捕目标机器人,与此同时此围捕机器人会马上发出信号,发送目标机器人的位置信息给其扫描范围之内的围捕机器人,收到信息的围捕机器人也会用最大的速度去追捕目标机器人,并且也会发出目标机器人的位置信息给其他的围捕机器人,最后所有收到目标机器人位置信息的围捕机器人会执行围捕任务;
判定围捕任务成功完成:
由收益函数得知,围捕机器人在不发生碰撞的情况下,与目标机器人的距离越近收益越大,同时与其他围捕机器人距离越远其收益越大,但是由于是围捕任务,靠近目标比围捕机器人之间的距离更重要,所以在收益函数中靠近目标的收益权值比围捕机器人之间距离权值大,所以围捕机器人优先靠近目标机器人的情况下,再与其他围捕机器人保持最大的安全距离。当围捕机器人群体对目标形成围捕之后,群体几乎是均匀的分配在目标机器人周围;这样就会产生一个问题:围捕机器人群体较少时,相邻机器人之间的距离较大,容许目标机器人安全通过,造成无法完成围捕任务的情况;
如图3所示,三个机器人去围捕目标机器人,目标机器人的最大安全距离是=0.5m(单位米),如果假定此时三个围捕机器人围住目标机器人之后,围捕机器人之间不存在安全距离问题,那么此时围捕机器人之间的距离大约为:,则,三个机器人便可以围捕成功。但是如果要考虑围捕机器人之间的安全距离如果达到了0.75m,则,此时目标机器人便可以从两个围捕机器人之间穿过,但是这种安全距离是不可能完成围捕任务的。所以在的情况下,机器人数量n满足,便可以完成围捕任务;
综上所述,围捕机器人对目标机器人进行围捕时,如果任意两个相邻围捕机器人之间的距离小于,此时目标机器人无法从两个围捕机器人中间穿过去,则系统就判定围捕任务成功完成;
目标机器人逃脱策略:
围捕机器人到达危险区域后,离目标机器人越近的围捕机器人对其影响越大,围捕机器人对目标影响力相加得到矢量,即为目标此时的运动方向。所以目标机器人的逃脱方向的计算公式为:
是指运动方向的矢量。是指与Target的距离;
步骤三:围捕任务执行过程的制定:
机器人分为围捕者与目标,围捕机器人有三个以上的机器人,目标只有一个机器人,所有的机器人都是同构机器人,以方便运行过程中的计算。围捕者快速的靠近目标,然后均匀的围住目标,将目标限制在围捕者组成的圈内,限制目标的运动;
整个围捕过程为: 在一个平面空间中随机的产生n个围捕机器人,开始搜寻空间中的目标机器人;机器人的位置信息都是公开化的,围捕机器人根据位置信息和其他围捕机器人的运动方向来确定围捕队伍中动态博弈的顺序;根据动态博弈的顺序,围捕机器人开始了与其他机器人个体的博弈,最终确定自身的运动策略;目标机器人根据围捕机器人的位置信息确定危险情况而选择自身的运动策略;如果目标机器人围捕成功,便将目标押送到相应位置,如果围捕不成功,再次从开始制定围捕运动策略;系统运动框图如图4所示。
本发明公开了一种基于扩展式合作博弈论的多机器人围捕方法,分别建立了围捕机器人运行的扩展式合作博弈模型、机器人的运行策略和整个围捕任务的执行过程,不同于以往的编队围捕方法,本发明使得围捕机器人在执行任务过程中可以有更加灵活的位置,它们可以快速的追赶目标,追赶过程中可以躲避障碍物和同伴,最后围堵在目标机器人周围,使得目标机器人无法从包围圈中逃脱。同时也为目标机器人设定了有效的逃脱策略,增大了多机器人群体围捕的难度,使得围捕算法更具有说服性。

Claims (1)

1.一种基于扩展式合作博弈的多机器人围捕目标方法, 其特征在于,具体包括如下步骤:
步骤一:对多机器人围捕的扩展式合作博弈模型进行数学建模:
围捕机器人:多机器人群体协作系统中机器人集合为:
表示的是系统中的围捕机器人i;目标机器人只有一个为Target
行动集:轮到行动时,可以选择的所有行动的集合被称为行动集,记为;通过对本发明行动策略的分析和简化得到以下的行动集:
TT 策略表示围捕机器人朝目标机器人方向运动一步;
TL策略表示围捕机器人沿左侧最小避碰方向角运动一步;
TR策略表示围捕机器人沿右侧最小避碰方向角运动一步;
策略集Move中的策略分别指朝目标机器人左侧、右侧方向运动和朝目标机器人方向运动;
是具有较高碰撞危险度的机器人之间的最小避碰方向角,为最小避碰距离,代表机器人之间的距离;公式表示为:
围捕者运动方向与环境x轴的夹角为,此为围捕者的运动方向角;那么可以得到三种运动策略的运动公式如下:
TT:
TL:
TR:
阶段和行动顺序:在扩展式合作博弈中,围捕者是按照一定的规则按照顺序进行运动,每次运动称为一个阶段;本发明要求每个阶段仅有一个围捕者进行运动,因此阶段数是由参与博弈的围捕者的数量决定;
围捕机器人运行角度的计算方法:a、b、c分别为围捕者、目标前一位置和现在位置组成三角形的三个边,围捕者与目标的连线是围捕者此时的运动方向,计算公式为如下:
围捕者与目标之间的距离为为目标的坐标位置,()为围捕者坐标位置,的计算公式为:
综上所述,约定局中人博弈优先级顺序为如下三式:
式中分别为机器人的任务、与目标的相对距离和目标角对博弈优先级的影响函数,表示机器人到达目标的有效区域半径, 为每一项的权值系数,且
收益函数:在扩展式博弈中,博弈机器人的收益函数是所有个体共用的;在围捕机器人各自采取某种行为策略后,就形成一个局势,所以为了衡量局势的优劣,本发明采用局势评估函数作为收益函数,计算出的评估值作为围捕机器人的收益值;为了描述一个局势对围捕机器人完成目标的贡献大小,
步骤二:制定机器人的运行策略:
搜索目标机器人策略: 任务初始,如果围捕机器人无法发现目标机器人的位置,此时他们需要进行目标机器人的搜索;目标机器人的扫描范围也是有限的,在没有发现围捕者的情况下,所有的围捕机器人进行漫无目的的行走,围捕机器人之间不进行通信以减少负担,一旦有一个围捕机器人扫描到了目标机器人,不断的用最大的速度来追捕目标机器人,与此同时此围捕机器人会马上发出信号,发送目标机器人的位置信息给其扫描范围之内的围捕机器人,收到信息的围捕机器人也会用最大的速度去追捕目标机器人,并且也会发出目标机器人的位置信息给其他的围捕机器人,最后所有收到目标机器人位置信息的围捕机器人会执行围捕任务;
判定围捕任务成功完成:由收益函数得知,围捕机器人在不发生碰撞的情况下,与目标机器人的距离越近收益越大,同时与其他围捕机器人距离越远其收益越大,但是由于是围捕任务,靠近目标比围捕机器人之间的距离更重要,所以在收益函数中靠近目标的收益权值比围捕机器人之间距离权值大,所以围捕机器人优先靠近目标机器人的情况下,再与其他围捕机器人保持最大的安全距离;当围捕机器人群体对目标形成围捕之后,群体几乎是均匀的分配在目标机器人周围;这样就会产生一个问题:围捕机器人群体较少时,相邻机器人之间的距离较大,容许目标机器人安全通过,造成无法完成围捕任务的情况;
目标机器人逃脱策略:围捕机器人到达危险区域后,离目标机器人越近的围捕机器人对其影响越大,围捕机器人对目标影响力相加得到矢量,即为目标此时的运动方向;所以目标机器人的逃脱方向的计算公式为如下式:
是指运动方向的矢量;是指Target的距离;
步骤三:围捕任务执行过程的制定:
机器人分为围捕者与目标,围捕机器人有三个以上的机器人,目标只有一个机器人,所有的机器人都是同构机器人,以方便运行过程中的计算;围捕者快速的靠近目标,然后均匀的围住目标,将目标限制在围捕者组成的圈内,限制目标的运动;
整个围捕过程为: 在一个平面空间中随机的产生n个围捕机器人,开始搜寻空间中的目标机器人;机器人的位置信息都是公开化的,围捕机器人根据位置信息和其他围捕机器人的运动方向来确定围捕队伍中动态博弈的顺序;根据动态博弈的顺序,围捕机器人开始了与其他机器人个体的博弈,最终确定自身的运动策略;目标机器人根据围捕机器人的位置信息确定危险情况而选择自身的运动策略;如果目标机器人围捕成功,便将目标押送到相应位置,如果围捕不成功,再次从开始制定围捕运动策略。
CN201510178542.2A 2015-04-16 2015-04-16 基于扩展式合作博弈的多机器人围捕目标方法 Expired - Fee Related CN104942807B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510178542.2A CN104942807B (zh) 2015-04-16 2015-04-16 基于扩展式合作博弈的多机器人围捕目标方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510178542.2A CN104942807B (zh) 2015-04-16 2015-04-16 基于扩展式合作博弈的多机器人围捕目标方法

Publications (2)

Publication Number Publication Date
CN104942807A CN104942807A (zh) 2015-09-30
CN104942807B true CN104942807B (zh) 2017-02-22

Family

ID=54158140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510178542.2A Expired - Fee Related CN104942807B (zh) 2015-04-16 2015-04-16 基于扩展式合作博弈的多机器人围捕目标方法

Country Status (1)

Country Link
CN (1) CN104942807B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111190420A (zh) * 2020-01-07 2020-05-22 大连理工大学 一种多移动机器人在安防领域中协作搜索与围捕方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105597325B (zh) * 2015-10-30 2018-07-06 广州银汉科技有限公司 协助瞄准的方法与系统
CN105487544B (zh) * 2016-01-18 2018-10-16 沈阳工业大学 基于模糊推理系统的多机器人角度控制围捕方法
CN105843227B (zh) * 2016-04-15 2018-10-23 上海大学 一种基于任务密集度动态调整的多机器人协作围捕任务分配方法
CN106647808B (zh) * 2017-01-05 2020-02-14 台州施特自动化有限公司 一种基于模糊控制算法的AUVs搜索和围捕任务分配控制方法
CN106843220B (zh) * 2017-02-27 2019-10-18 同济大学 一种多Agent围捕-觅食行为控制方法
CN107831780B (zh) * 2017-10-24 2020-09-22 佛山科学技术学院 一种基于模拟退火思想的多机器人合作围捕方法
CN108115685B (zh) * 2017-12-01 2020-03-13 中国科学院自动化研究所 多机器人围捕方法
CN109079779B (zh) * 2018-08-08 2020-11-10 北京理工大学 基于末端估计和操作度调整的多移动机械臂最优协同方法
CN109696084B (zh) * 2019-01-04 2020-09-15 北京邮电大学 一种多卫星博弈围捕策略
CN111240333A (zh) * 2020-01-18 2020-06-05 湖南科技大学 一种复杂非凸环境下群机器人协同作业的多目标围捕方法
CN111975767B (zh) * 2020-05-28 2022-01-25 上海理工大学 基于多级任务分配的多机器人视觉检测系统的协同运动规划方法
CN112596420A (zh) * 2020-11-24 2021-04-02 江苏科技大学 一种仿生爬行机器人及其自主控制方法
CN113095500B (zh) * 2021-03-31 2023-04-07 南开大学 一种基于多智能体强化学习的机器人追捕方法
CN113268078B (zh) * 2021-04-20 2022-11-18 四川大学 一种无人机群自适应环境的目标追踪围捕方法
CN113253738B (zh) * 2021-06-22 2021-10-01 中国科学院自动化研究所 多机器人协作围捕方法、装置、电子设备及存储介质
CN113485340A (zh) * 2021-07-12 2021-10-08 汕头大学 群体机器人分布式围捕控制方法及系统
CN113268893B (zh) * 2021-07-19 2021-10-01 中国科学院自动化研究所 基于连通保持约束的群体围捕方法及装置
CN114967707A (zh) * 2022-06-24 2022-08-30 东南大学 一种基于分布式优化的多机器人实时控制与协同围堵方法
CN115771145B (zh) * 2022-11-29 2023-09-15 哈尔滨理工大学 人机协作中基于博弈论的安全控制策略

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
A Cooperative hunting Behavior by Mobile Robot Troops;Hiroaki Yamaguchi;《International Conference on Robotics & Automation》;19980531;全文 *
A GA Based Combinatorial Auction Algorithm for Multi-robot Cooperative;Jianwei Gong etc.;《International Conference on Computational Intelligence and Security》;20071219;全文 *
A Socially Multi-Robot Target Tracking Method Based on Extended Cooperative Game Theory;Yang Li etc.;《International Conference on Robotics and Biomimetics》;20141210;全文 *
Game Theory Based Target Following by a Team of Robots;K. Skrzypczyk;《Fourth International Workshop on Robot Motion and Control》;20040630;全文 *
Multi-robot hunting based on Swarm Intelligence;Mininath K.Nighot;《Hybrid Intelligent Systems(HIS)》;20121207;全文 *
Multi-robot System Based on Model of Wolf Hunting Behavior to;John D. Madden etc.;《International Conference on Robotics and Biomimetics》;20101218;全文 *
一种多机器人围捕策略;付勇,汪浩杰;《华中科技大学学报(自然科学版)》;20080229;第36卷(第2期);全文 *
基于博弈理论群体机器人围捕行为研究及虚拟仿真;魏征;《中国优秀硕士学位论文全文数据库(电子期刊) 信息科技辑》;20140915;I140-324,全文 *
基于博弈论的群体机器人围捕策略研究;杨萍等;《机械制造》;20140531;第52卷(第597期);全文 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111190420A (zh) * 2020-01-07 2020-05-22 大连理工大学 一种多移动机器人在安防领域中协作搜索与围捕方法
CN111190420B (zh) * 2020-01-07 2021-11-12 大连理工大学 一种多移动机器人在安防领域中协作搜索与围捕方法

Also Published As

Publication number Publication date
CN104942807A (zh) 2015-09-30

Similar Documents

Publication Publication Date Title
CN104942807B (zh) 基于扩展式合作博弈的多机器人围捕目标方法
CN110147101B (zh) 一种基于深度强化学习的端到端分布式多机器人编队导航方法
Hernández et al. Selective Smooth Fictitious Play: An approach based on game theory for patrolling infrastructures with a multi-robot system
Gajurel et al. Neuroevolution for rts micro
Foderaro et al. A model-based cell decomposition approach to on-line pursuit-evasion path planning and the video game Ms. Pac-Man
CN111723931B (zh) 一种多智能体对抗动作预测方法及装置
CN112651486A (zh) 一种提高maddpg算法收敛速度的方法及其应用
CN115220458A (zh) 基于强化学习的多机器人围捕多目标的分布式决策方法
Li et al. Coordinated multi-robot target hunting based on extended cooperative game
CN114815891A (zh) 一种基于per-idqn的多无人机围捕战术方法
Sheikh et al. Learning distributed cooperative policies for security games via deep reinforcement learning
CN117400248A (zh) 一种基于多智能体深度强化学习的利用障碍物实施围捕方法
CN116562332B (zh) 一种人机共融环境下的机器人社交性运动规划方法
CN113189992B (zh) 一种基于局部定向的群体智能避障方法
CN117826867A (zh) 无人机集群路径规划方法、装置和存储介质
Tsay et al. Evolving intelligent mario controller by reinforcement learning
Panda et al. Autonomous mobile robot path planning using hybridization of particle swarm optimization and Tabu search
CN116382299A (zh) 路径规划方法、装置、电子设备及存储介质
Gaydashenko et al. A comparative evaluation of machine learning methods for robot navigation through human crowds
CN113283574B (zh) 群体对抗中智能体控制方法、装置、电子设备及存储介质
Ponsini et al. Analysis of soccer robot behaviors using time petri nets
CN114326826B (zh) 多无人机队形变换方法及系统
CN114611664A (zh) 一种多智能体学习方法、装置及设备
Bamal Collision-free path finding for dynamic gaming and real time robot navigation
CN117707219B (zh) 基于深度强化学习的无人机集群侦查对抗方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Li Min

Inventor after: Cao Jinge

Inventor after: Li Yang

Inventor after: Dou Lianhang

Inventor before: Li Min

Inventor before: Li Yang

Inventor before: Dou Lianhang

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170222

Termination date: 20210416

CF01 Termination of patent right due to non-payment of annual fee