CN105843227A - 一种基于任务密集度动态调整的多机器人协作围捕任务分配方法 - Google Patents

一种基于任务密集度动态调整的多机器人协作围捕任务分配方法 Download PDF

Info

Publication number
CN105843227A
CN105843227A CN201610234559.XA CN201610234559A CN105843227A CN 105843227 A CN105843227 A CN 105843227A CN 201610234559 A CN201610234559 A CN 201610234559A CN 105843227 A CN105843227 A CN 105843227A
Authority
CN
China
Prior art keywords
robot
seize
task
surrounding
auction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610234559.XA
Other languages
English (en)
Other versions
CN105843227B (zh
Inventor
李敏
王忠亚
李�杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201610234559.XA priority Critical patent/CN105843227B/zh
Publication of CN105843227A publication Critical patent/CN105843227A/zh
Application granted granted Critical
Publication of CN105843227B publication Critical patent/CN105843227B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Manipulator (AREA)

Abstract

本发明提出一种基于任务密集度动态调整的多机器人协作围捕任务分配方法,属于任务分配技术领域。本方法包括:群体搜索及围捕建模、任务分配策略。本发明将经过强化学习方法得到的围捕经验值的概念引入到任务分配算法中,对经过拍卖算法得到的初始任务分配方案进行动态调整,使其能够很好的适应动态变化的围捕环境,减少系统之间的通讯量与计算量;本发明在任务分配拍卖算法中对竞标机器人的代价函数求解进行了优化,提出了任务密集度的概念,便于提高多机器人协作系统任务分配的效率,减少花费成本。

Description

一种基于任务密集度动态调整的多机器人协作围捕任务分配方法
技术领域
本发明涉及任务分配领域,具体涉及一种基于任务密集度动态调整的多机器人协作围捕任务分配方法。
背景技术
自机器人诞生以来,人类社会的生活、生产方式发生了巨大变化。多机器人系统作为分布式人工智能的一个非常重要的分支,具有容错性、鲁棒性强、分布性协调性等特点。任务分配是有效利用多机器人系统资源以充分发挥系统效能优势的重要基础。最大化多机器人系统效能的前提条件是最优任务分配,然而实际情况下,最优分配算法的计算复杂度随问题规模呈指数级增长,当任务分配存在显著的动态不确定性时,多机器人系统实现最优分配愈加困难,所以在可接受的时间内实现最优分配的任务规模有限。市场机制拍卖算法是一种快速有效的资源分配方法具有较强的可操作性、可扩展性。基于拍卖的任务分配算法的最大优势在于适合动态不确定性环境下多机器人系统通过最大化个体效能实现最大化系统总效能的目的。基于拍卖的任务分配方法是拍卖机器人将任务信息公布出去等待竞标机器人竞标,竞标机器人根据任务信息计算竞标值,发送给拍卖机器人,然后拍卖机器人根据收到的所有竞标值选择合适的竞标机器人作为中标机器人。多机器人协作围捕问题本质上是多机器人分布式系统协作决策问题,通过研究多个围捕机器人的协作围捕策略,用来研究多机器人社会中智能体之间的竞争与合作、合作与协调策略以及最优决策分配机制以及团队最优决策算法等。
强化学习是学习如何把状态映射到动作,并且使得用数字表示的奖励信号最大的一种学习方法。将强化学习应用到多机器人围捕问题中,使围捕机器人能够在与环境交互的动态过程中获得围捕经验,不断地提高系统自身的性能,通过积累经验明确系统当前性能与目标性能之间的距离,实施改进操作,提高系统围捕效率。
发明内容
本发明的目的在于针对现有技术存在的缺陷提供一种基于任务密集度动态调整的多机器人协作围捕任务分配方法,对基于市场机制拍卖算法任务分配进行优化达到最优分配,为达到上述目的,本发明采用下述技术方案:
一种基于任务密集度动态调整的多机器人协作围捕任务分配方法,其特征在于:对传统拍卖算法代价函数进行优化,利用强化学习得到的围捕经验对任务分配动态调整;具体操作步骤如下:1)群体搜索及围捕建模,2)任务分配策略。
步骤1)群体搜索及围捕建模是:
(1)群体搜索方法:
采用的群体搜索策略是采用多机器人的漫游方法,即围捕机器人在多机器人协作系统环境中进行随机的行走;采用漫游方法的多机器人之间在发现目标机器人之前是不进行通信的以减少通讯负担;当一个围捕机器人发现了一个目标机器人后,该围捕机器人根据算法切换到拍卖机器人这个角色,评估对该目标机器人的围捕任务创建一个临时拍卖市场将围捕该目标机器人的任务发布出去并去追捕目标机器人;收到信息的围捕机器人成为竞标机器人并评估该项任务决定是否去竞拍这项围捕任务;
(2)围捕建模:
多机器人系统中,围捕机器人在巡逻过程中,发现了目标机器人,则该围捕机器人根据算法模型自动转化为拍卖机器人;该拍卖机器人对该目标机器人进行评估后,发布招标信息,等待其余围捕机器人竞标;同时拍卖机器人会对目标机器人发起围捕任务;所有围捕机器人在围捕的过程中,为了提高围捕机器人之间的围捕效率,实现多机器人之间的围捕任务同时避免多机器人之间的碰撞运动,通过考虑多机器人之间的避碰行为,对多机器人行动策略进行分析和简化得到如下的多机器人行动策略集:
Move={TT,TL,TR}
其中,TT表示围捕机器人向着目标机器人的方向前进一步,就是沿着围捕机器人跟目标机器人之间的中心连线向着目标机器人移动;TL表示围捕机器人向目标机器人左侧移动一步,使围捕机器人在移动后与目标机器人之间的中心间距保持安全距离;TR表示围捕机器人向目标机器人右侧移动一步,使围捕机器人在移动后与目标机器人之间的中心间距保持安全距离。
步骤2)任务分配策略是:
(1)拍卖机器人任务拍卖:
当围捕机器人RR在搜寻目标机器人的时候,发现了目标机器人RT,围捕机器人RR自动成为拍卖机器代理拍卖围捕机器人RT的任务;拍卖机器人RR对目标机器人RT以及周围环境进行评估,计算出对目标机器人展开围捕需要围捕机器人的个数n,并且向其他机器人发布拍卖围捕目标机器人RT的任务,等待其他围捕机器人对围捕机器人RT这项任务进行投标,接收其他围捕机器人发送回来的对围捕RT任务的标值;拍卖机器人RT接收到竞标机器人的投标后,预示着该投标机器人进入了由拍卖机器人RT组成的拍卖市场;由于对目标机器人RT的围捕是一种实时在变换的一个状态环境,所以需要对拍卖设定时间限制,超过一定时间后,该拍卖机器人就对收到的竞标信息进行评估并公布拍卖结果,该拍卖市场结束;当该拍卖机器人组成的拍卖市场即将到达规定的时限后,拍卖机器人根据竞标机器人发送的竞标值选择出价最高的n个机器人成为竞标成功机器人,竞拍成功机器人协助拍卖机器人完成对目标机器人RT的围捕任务,竞拍结束;
拍卖围捕机器人向外公布的招标信息除了围捕目标机器人的这项任务外,还包括对周围环境的评估;任务密集度是用来反应任务的密集度的影响因子,任务越密集,任务密集度的值就越大;如果被拍卖的任务的周围有很多项其他的任务,那么拍卖该项任务的时候的任务密集度的值就越大;如果一个拍卖机器人将一个任务密集度大的任务发布出去,那么竞标机器人在选择竞标某一项任务的时候,会优先竞标任务密集度大的任务;这种方式下,就会促使任务完成的时间花费的少;任务密集度的计算公式如下:
Int j = Σ i = 1 k Task j i / N T a s k
其中,Intj指任务j的任务密集度大小;随着k值大小的增加,任务密集度也会增加;NTask是指多机器人协作系统中所有的已经被发现的任务的数量大小;代表拍卖机器人在任务j周围发现的其余任务的数量;
(2)竞标围捕机器人竞标:
竞标围捕机器人接收到周围拍卖围捕机器人的招标信息后,从所有的围捕任务队列{RT1,RT2,RT3…}中选取参与的投标任务,每一个竞标机器人只参与一个拍卖机器人发布的拍卖围捕任务;而竞标围捕机器人参与哪一个拍卖围捕机器人发布的拍卖任务,需要竞标机器人去评估这项围捕任务;如若竞标机器人竞标成功一项围捕任务,则该竞标围捕机器人则协同其他竞标成功的围捕机器人与拍卖围捕机器人一同完成这项围捕目标机器人的任务;
当整个多机器人协作系统中存在了多个拍卖任务的时候,由于每一个围捕机器人都是自利的,每一个机器人的目标都是使自己的利益最大化,并不能够保证整个多机器人协作拍卖系统的效用最大化;在决策时间有限以及动态环境不确定因素下,为了使多机器人系统在经过较少次数的拍卖获得较理想的分配方案,降低多机器人系统之间的通信量,减少计算代价,将竞标价格定义为如下公式:
C RR i RT j = α ( Σ t )
Uj=f(DD,RRA)=γ1·DDj2·RRAj
P i ( RT j ) = γ ( U j - C RR i RT j )
其中,表示竞标机器人RRi完成任务RTj所消耗的代价花费,Uj表示机器人完成围捕任务RTj时系统获得的效益值,γ为比例系数;α代表花费的折扣率,为常数;t指的是围捕机器人RRi完成对RTj围捕所花费的时间,而完成对目标机器人的围捕所获得的效益值Uj,该目标机器人对系统的危害程度为DD,周围围捕机器人的数目为RRA1,γ2为权值系数;这里,越小,完成对RTj的围捕任务,机器人系统获得的效益值就越大,总体上使多机器人系统获得最大的效益值,是比较理想的分配方案;竞标机器人从任务队列中选取最能时多机器人系统获得最大效益值的围捕任务进行投标,最大提高系统的整体效用;
(3)拍卖任务的动态调整:
多机器人协作围捕系统是一个动态过程的围捕过程,根据拍卖产生的任务的分配结果在理想时间内可能会遇到意料之外的情况,即拍卖产生的任务分配结果不一定能够成功围捕目标机器人;考虑到这种情况,需要对拍卖产生的任务分配结果进行分配后的动态调整,随着多机器人参与围捕任务的进行,每一个机器人都会对围捕任务进行学习,参与围捕任务次数越多,机器人围捕的经验值就会越大,随着任务的进行,机器人学习能力逐渐增强,围捕任务的能力也越强;围捕机器人是异构机器人,不同的组合产生的能力是不同的,所以,针对每一个围捕机器人的不相同的能力,拍卖机器人根据异构机器人的组成、对围捕任务的判断、自己的经验值以及机器人的能量消耗,可实时判定,成功围捕的不确信度;
不确信度由两个因素来决定:机器人自身的能量变化W以及机器人在围捕任务过程中的经验值大小Q(s,a),在任务执行过程中,不确信度可以由以下公式进行定义:
N c l = β Q ( s , a ) + c 1 W + c 2
其中,Q(s,a)是指在当前环境s下,拍卖机器人对竞标成功的竞标机器人,选择这些竞标成功机器人的集合去围捕机器人这个选择a,能够成功围捕目标机器人的经验值大小或者说围捕成功的概率大小;c1与c2为常数,β为围捕奖励值的折扣系数;围捕机器人在每周期执行相应动作会减少相应的能量,
S=(s1,s2,…,sn)
A=(A1,A2,…,An)
其中,集合S与集合A存在映射关系:sn→an表示围捕成功的状态下的围捕机器人选择。随着围捕任务成功的次数增加,状态集合S与机器人选择集合A的维数相应增加;通过对两个集合的综合判定可以用作对多机器人协作围捕是否能够成功的一个考量;
Q ( s i , a i ) = R w i n n e r ∩ A i R w i n n e r = ( RR 1 , RR 2 , ... , RR n ) ∩ A i ( RR 1 , RR 2 , ... , RR n )
Q(si,ai)指的是在当前状态si下,选择的中标机器人中占据该拍卖围捕机器人有过合作并且围捕成功案例的Ai集合中的个数与中标机器人个数的比值,作为拍卖机器人的经验值大小用于动态调整的判别标准;
在多个竞标机器人与拍卖机器人组成的拍卖市场中形成一个围捕团队去围捕一个目标机器人的时候,由拍卖机器人在此时计算该团队完成这项围捕任务的不确信度,如果不确信度高于设定的阈值H时,该拍卖机器人就会重新评估这项围捕任务,从新发起一轮拍卖。
本发明与现有技术相比较,具有如下显而易见的突出实质性特点和显著技术进步:
第一:本发明提出的一种基于任务密集度动态调整的多机器人协作围捕任务分配方法,是在传统拍卖的任务分配算法基础上,提出任务密集度的概念进行优化后得到的一种任务分配方法,便于提高多机器人协作系统任务分配的效率,减少花费代价。
第二,本发明提出的一种基于任务密集度动态调整的多机器人协作围捕任务分配方法,将强化学习的方法引入到拍卖算法中,对拍卖后的任务分配方案进行动态调整,是一种适用于动态不确定环境下的任务分配方法,比传统任务分配方法在效率上优势明显。
附图说明
图1:本发明提出的一种基于任务密集度动态调整的多机器人协作围捕任务分配方法任务分配流程图。
图2:本发明多机器人协作围捕建模。
图3:本发明提出的一种基于任务密集度动态调整的多机器人协作围捕任务分配方法拍卖流程图。
图4:本发明提出的一种基于任务密集度动态调整的多机器人协作围捕任务分配方法竞标流程图。
具体实施方式
以下结合附图和优选实施例对本发明做进一步说明。
实施例一:参见图1,基于任务密集度动态调整的多机器人协作围捕任务分配方法,具体包含以下操作步骤:1)群体搜索及围捕建模,2)任务分配策略。
实施例二:本实例与实施例一基本相同,特别之处如下:
步骤1)群体搜索及围捕建模是:
(1)群体搜索方法:
采用的群体搜索策略是采用多机器人的漫游方法,即围捕机器人在多机器人协作系统环境中进行随机的行走;采用漫游方法的多机器人之间在发现目标机器人之前是不进行通信的以减少通讯负担;当一个围捕机器人发现了一个目标机器人后,该围捕机器人根据算法切换到拍卖机器人这个角色,评估对该目标机器人的围捕任务创建一个临时拍卖市场将围捕该目标机器人的任务发布出去并去追捕目标机器人;收到信息的围捕机器人成为竞标机器人并评估该项任务决定是否去竞拍这项围捕任务;
(2)围捕建模:
如图2所示,多机器人系统中,围捕机器人在巡逻过程中,发现了目标机器人,则该围捕机器人根据算法模型自动转化为拍卖机器人;该拍卖机器人对该目标机器人进行评估后,发布招标信息,等待其余围捕机器人竞标;同时拍卖机器人会对目标机器人发起围捕任务;所有围捕机器人在围捕的过程中,为了提高围捕机器人之间的围捕效率,实现多机器人之间的围捕任务同时避免多机器人之间的碰撞运动,通过考虑多机器人之间的避碰行为,对多机器人行动策略进行分析和简化得到如下的多机器人行动策略集:
Move={TT,TL,TR}
其中,TT表示围捕机器人向着目标机器人的方向前进一步,就是沿着围捕机器人跟目标机器人之间的中心连线向着目标机器人移动;TL表示围捕机器人向目标机器人左侧移动一步,使围捕机器人在移动后与目标机器人之间的中心间距保持安全距离;TR表示围捕机器人向目标机器人右侧移动一步,使围捕机器人在移动后与目标机器人之间的中心间距保持安全距离。
步骤2)任务分配策略是:
(1)拍卖机器人任务拍卖:
图3为拍卖机器人的拍卖流程图。当围捕机器人RR在搜寻目标机器人的时候,发现了目标机器人RT,围捕机器人RR自动成为拍卖机器代理拍卖围捕机器人RT的任务;拍卖机器人RR对目标机器人RT以及周围环境进行评估,计算出对目标机器人展开围捕需要围捕机器人的个数n,并且向其他机器人发布拍卖围捕目标机器人RT的任务,等待其他围捕机器人对围捕机器人RT这项任务进行投标,接收其他围捕机器人发送回来的对围捕RT任务的标值;拍卖机器人RT接收到竞标机器人的投标后,预示着该投标机器人进入了由拍卖机器人RT组成的拍卖市场;由于对目标机器人RT的围捕是一种实时在变换的一个状态环境,所以需要对拍卖设定时间限制,超过一定时间后,该拍卖机器人就对收到的竞标信息进行评估并公布拍卖结果,该拍卖市场结束;当该拍卖机器人组成的拍卖市场即将到达规定的时限后,拍卖机器人根据竞标机器人发送的竞标值选择出价最高的n个机器人成为竞标成功机器人,竞拍成功机器人协助拍卖机器人完成对目标机器人RT的围捕任务,竞拍结束;
拍卖围捕机器人向外公布的招标信息除了围捕目标机器人的这项任务外,还包括对周围环境的评估;任务密集度是用来反应任务的密集度的影响因子,任务越密集,任务密集度的值就越大;如果被拍卖的任务的周围有很多项其他的任务,那么拍卖该项任务的时候的任务密集度的值就越大;如果一个拍卖机器人将一个任务密集度大的任务发布出去,那么竞标机器人在选择竞标某一项任务的时候,会优先竞标任务密集度大的任务;这种方式下,就会促使任务完成的时间花费的少;任务密集度的计算公式如下:
Int j = Σ i = 1 k Task j i / N T a s k
其中,Intj指任务j的任务密集度大小;随着k值大小的增加,任务密集度也会增加;NTask是指多机器人协作系统中所有的已经被发现的任务的数量大小;代表拍卖机器人在任务j周围发现的其余任务的数量;
(2)竞标围捕机器人竞标:
图4为竞标机器人的竞标流程图。竞标围捕机器人接收到周围拍卖围捕机器人的招标信息后,从所有的围捕任务队列{RT1,RT2,RT3…}中选取参与的投标任务,每一个竞标机器人只参与一个拍卖机器人发布的拍卖围捕任务;而竞标围捕机器人参与哪一个拍卖围捕机器人发布的拍卖任务,需要竞标机器人去评估这项围捕任务;如若竞标机器人竞标成功一项围捕任务,则该竞标围捕机器人则协同其他竞标成功的围捕机器人与拍卖围捕机器人一同完成这项围捕目标机器人的任务;
当整个多机器人协作系统中存在了多个拍卖任务的时候,由于每一个围捕机器人都是自利的,每一个机器人的目标都是使自己的利益最大化,并不能够保证整个多机器人协作拍卖系统的效用最大化;在决策时间有限以及动态环境不确定因素下,为了使多机器人系统在经过较少次数的拍卖获得较理想的分配方案,降低多机器人系统之间的通信量,减少计算代价,将竞标价格定义为如下公式:
C RR i RT j = α ( Σ t )
Uj=f(DD,RRA)=γ1·DDj2·RRAj
P i ( RT j ) = γ ( U j - C RR i RT j )
其中,表示竞标机器人RRi完成任务RTj所消耗的代价花费,Uj表示机器人完成围捕任务RTj时系统获得的效益值,γ为比例系数;α代表花费的折扣率,为常数;t指的是围捕机器人RRi完成对RTj围捕所花费的时间,而完成对目标机器人的围捕所获得的效益值Uj,该目标机器人对系统的危害程度为DD,周围围捕机器人的数目为RRA1,γ2为权值系数;这里,越小,完成对RTj的围捕任务,机器人系统获得的效益值就越大,总体上使多机器人系统获得最大的效益值,是比较理想的分配方案;竞标机器人从任务队列中选取最能时多机器人系统获得最大效益值的围捕任务进行投标,最大提高系统的整体效用;
(3)拍卖任务的动态调整:
多机器人协作围捕系统是一个动态过程的围捕过程,根据拍卖产生的任务的分配结果在理想时间内可能会遇到意料之外的情况,即拍卖产生的任务分配结果不一定能够成功围捕目标机器人;考虑到这种情况,需要对拍卖产生的任务分配结果进行分配后的动态调整,随着多机器人参与围捕任务的进行,每一个机器人都会对围捕任务进行学习,参与围捕任务次数越多,机器人围捕的经验值就会越大,随着任务的进行,机器人学习能力逐渐增强,围捕任务的能力也越强;围捕机器人是异构机器人,不同的组合产生的能力是不同的,所以,针对每一个围捕机器人的不相同的能力,拍卖机器人根据异构机器人的组成、对围捕任务的判断、自己的经验值以及机器人的能量消耗,可实时判定,成功围捕的不确信度;
不确信度由两个因素来决定:机器人自身的能量变化W以及机器人在围捕任务过程中的经验值大小Q(s,a),在任务执行过程中,不确信度可以由以下公式进行定义:
N c l = β Q ( s , a ) + c 1 W + c 2
其中,Q(s,a)是指在当前环境s下,拍卖机器人对竞标成功的竞标机器人,选择这些竞标成功机器人的集合去围捕机器人这个选择a,能够成功围捕目标机器人的经验值大小或者说围捕成功的概率大小;c1与c2为常数,β为围捕奖励值的折扣系数;围捕机器人在每周期执行相应动作会减少相应的能量,
S=(s1,s2,…,sn)
A=(A1,A2,…,An)
其中,集合S与集合A存在映射关系:sn→an表示围捕成功的状态下的围捕机器人选择。随着围捕任务成功的次数增加,状态集合S与机器人选择集合A的维数相应增加;通过对两个集合的综合判定可以用作对多机器人协作围捕是否能够成功的一个考量;
Q ( s i , a i ) = R w i n n e r ∩ A i R w i n n e r = ( RR 1 , RR 2 , ... , RR n ) ∩ A i ( RR 1 , RR 2 , ... , RR n )
Q(si,ai)指的是在当前状态si下,选择的中标机器人中占据该拍卖围捕机器人有过合作并且围捕成功案例的Ai集合中的个数与中标机器人个数的比值,作为拍卖机器人的经验值大小用于动态调整的判别标准;
在多个竞标机器人与拍卖机器人组成的拍卖市场中形成一个围捕团队去围捕一个目标机器人的时候,由拍卖机器人在此时计算该团队完成这项围捕任务的不确信度,如果不确信度高于设定的阈值H时,该拍卖机器人就会重新评估这项围捕任务,从新发起一轮拍卖。

Claims (5)

1.一种基于任务密集度动态调整的多机器人协作围捕任务分配方法,其特征在于:对传统拍卖算法代价函数进行优化,利用强化学习得到的围捕经验对任务分配动态调整;具体操作步骤如下:1)群体搜索及围捕建模,2)任务分配策略。
2.根据权利要求1所述的基于任务密集度动态调整的多机器人协作围捕任务分配方法,其特征在于所述步骤1)群体搜索及围捕建模是:
(1)群体搜索方法:
采用的群体搜索策略是采用多机器人的漫游方法,即围捕机器人在多机器人协作系统环境中进行随机的行走;采用漫游方法的多机器人之间在发现目标机器人之前是不进行通信的以减少通讯负担;当一个围捕机器人发现了一个目标机器人后,该围捕机器人根据算法切换到拍卖机器人这个角色,评估对该目标机器人的围捕任务创建一个临时拍卖市场将围捕该目标机器人的任务发布出去并去追捕目标机器人;收到信息的围捕机器人成为竞标机器人并评估该项任务决定是否去竞拍这项围捕任务;
(2)围捕建模:
多机器人系统中,围捕机器人在巡逻过程中,发现了目标机器人,则该围捕机器人根据算法模型自动转化为拍卖机器人;该拍卖机器人对该目标机器人进行评估后,发布招标信息,等待其余围捕机器人竞标;同时拍卖机器人会对目标机器人发起围捕任务;所有围捕机器人在围捕的过程中,为了提高围捕机器人之间的围捕效率,实现多机器人之间的围捕任务同时避免多机器人之间的碰撞运动,通过考虑多机器人之间的避碰行为,对多机器人行动策略进行分析和简化得到如下的多机器人行动策略集:
Move={TT,TL,TR}
其中,TT表示围捕机器人向着目标机器人的方向前进一步,就是沿着围捕机器人跟目标机器人之间的中心连线向着目标机器人移动;TL表示围捕机器人向目标机器人左侧移动一步,使围捕机器人在移动后与目标机器人之间的中心间距保持安全距离;TR表示围捕机器人向目标机器人右侧移动一步,使围捕机器人在移动后与目标机器人之间的中心间距保持安全距离。
3.根据权利要求1所述的基于任务密集度动态调整的多机器人协作围捕任务分配方法,其特征在于所述步骤2)任务分配策略是:
(1)拍卖机器人任务拍卖:
当围捕机器人RR在搜寻目标机器人的时候,发现了目标机器人RT,围捕机器人RR自动成为拍卖机器代理拍卖围捕机器人RT的任务;拍卖机器人RR对目标机器人RT以及周围环境进行评估,计算出对目标机器人展开围捕需要围捕机器人的个数n,并且向其他机器人发布拍卖围捕目标机器人RT的任务,等待其他围捕机器人对围捕机器人RT这项任务进行投标,接收其他围捕机器人发送回来的对围捕RT任务的标值;拍卖机器人RT接收到竞标机器人的投标后,预示着该投标机器人进入了由拍卖机器人RT组成的拍卖市场;由于对目标机器人RT的围捕是一种实时在变换的一个状态环境,所以需要对拍卖设定时间限制,超过一定时间后,该拍卖机器人就对收到的竞标信息进行评估并公布拍卖结果,该拍卖市场结束;当该拍卖机器人组成的拍卖市场即将到达规定的时限后,拍卖机器人根据竞标机器人发送的竞标值选择出价最高的n个机器人成为竞标成功机器人,竞拍成功机器人协助拍卖机器人完成对目标机器人RT的围捕任务,竞拍结束;
拍卖围捕机器人向外公布的招标信息除了围捕目标机器人的这项任务外,还包括对周围环境的评估;任务密集度是用来反应任务的密集度的影响因子,任务越密集,任务密集度的值就越大;如果被拍卖的任务的周围有很多项其他的任务,那么拍卖该项任务的时候的任务密集度的值就越大;如果一个拍卖机器人将一个任务密集度大的任务发布出去,那么竞标机器人在选择竞标某一项任务的时候,会优先竞标任务密集度大的任务;这种方式下,就会促使任务完成的时间花费的少;任务密集度的计算公式如下:
Int j = Σ i = 1 k Task j i / N T a s k
其中,Intj指任务j的任务密集度大小;随着k值大小的增加,任务密集度也会增加;NTask是指多机器人协作系统中所有的已经被发现的任务的数量大小;代表拍卖机器人在任务j周围发现的其余任务的数量;
(2)竞标围捕机器人竞标:
竞标围捕机器人接收到周围拍卖围捕机器人的招标信息后,从所有的围捕任务队列{RT1,RT2,RT3…}中选取参与的投标任务,每一个竞标机器人只参与一个拍卖机器人发布的拍卖围捕任务;而竞标围捕机器人参与哪一个拍卖围捕机器人发布的拍卖任务,需要竞标机器人去评估这项围捕任务;如若竞标机器人竞标成功一项围捕任务,则该竞标围捕机器人则协同其他竞标成功的围捕机器人与拍卖围捕机器人一同完成这项围捕目标机器人的任务;
当整个多机器人协作系统中存在了多个拍卖任务的时候,由于每一个围捕机器人都是自利的,每一个机器人的目标都是使自己的利益最大化,并不能够保证整个多机器人协作拍卖系统的效用最大化;在决策时间有限以及动态环境不确定因素下,为了使多机器人系统在经过较少次数的拍卖获得较理想的分配方案,降低多机器人系统之间的通信量,减少计算代价,将竞标价格定义为如下公式:
C RR i RT j = α ( Σ t )
Uj=f(DD,RRA)=γ1·DDj2·RRAj
P i ( RT j ) = γ ( U j - C RR i RT j )
其中,表示竞标机器人RRi完成任务RTj所消耗的代价花费,Uj表示机器人完成围捕任务RTj时系统获得的效益值,γ为比例系数;α代表花费的折扣率,为常数;t指的是围捕机器人RRi完成对RTj围捕所花费的时间,而完成对目标机器人的围捕所获得的效益值Uj,该目标机器人对系统的危害程度为DD,周围围捕机器人的数目为RRA1,γ2为权值系数;这里,越小,完成对RTj的围捕任务,机器人系统获得的效益值就越大,总体上使多机器人系统获得最大的效益值,是比较理想的分配方案;竞标机器人从任务队列中选取最能时多机器人系统获得最大效益值的围捕任务进行投标,最大提高系统的整体效用;
(3)拍卖任务的动态调整:
多机器人协作围捕系统是一个动态过程的围捕过程,根据拍卖产生的任务的分配结果在理想时间内可能会遇到意料之外的情况,即拍卖产生的任务分配结果不一定能够成功围捕目标机器人;考虑到这种情况,需要对拍卖产生的任务分配结果进行分配后的动态调整,随着多机器人参与围捕任务的进行,每一个机器人都会对围捕任务进行学习,参与围捕任务次数越多,机器人围捕的经验值就会越大,随着任务的进行,机器人学习能力逐渐增强,围捕任务的能力也越强;围捕机器人是异构机器人,不同的组合产生的能力是不同的,所以,针对每一个围捕机器人的不相同的能力,拍卖机器人根据异构机器人的组成、对围捕任务的判断、自己的经验值以及机器人的能量消耗,实时判定,成功围捕的不确信度;
不确信度由两个因素来决定:机器人自身的能量变化W以及机器人在围捕任务过程中的经验值大小Q(s,a),在任务执行过程中,不确信度由以下公式进行定义:
N c l = β Q ( s , a ) + c 1 W + c 2
其中,Q(s,a)是指在当前环境s下,拍卖机器人对竞标成功的竞标机器人,选择这些竞标成功机器人的集合去围捕机器人这个选择a,能够成功围捕目标机器人的经验值大小或者说围捕成功的概率大小;c1与c2为常数,β为围捕奖励值的折扣系数;围捕机器人在每周期执行相应动作会减少相应的能量,
S=(s1,s2,…,sn)
A=(A1,A2,…,An)
其中,集合S与集合A存在映射关系:sn→an表示围捕成功的状态下的围捕机器人选择,随着围捕任务成功的次数增加,状态集合S与机器人选择集合A的维数相应增加;通过对两个集合的综合判定用作对多机器人协作围捕是否能够成功的一个考量;
Q ( s i , a i ) = R w i n n e r ∩ A i R w i n n e r = ( RR 1 , RR 2 , ... , RR n ) ∩ A i ( RR 1 , RR 2 , ... , RR n )
Q(si,ai)指的是在当前状态si下,选择的中标机器人中占据该拍卖围捕机器人有过合作并且围捕成功案例的Ai集合中的个数与中标机器人个数的比值,作为拍卖机器人的经验值大小用于动态调整的判别标准;
在多个竞标机器人与拍卖机器人组成的拍卖市场中形成一个围捕团队去围捕一个目标机器人的时候,由拍卖机器人在此时计算该团队完成这项围捕任务的不确信度,如果不确信度高于设定的阈值H时,该拍卖机器人就会重新评估这项围捕任务,从新发起一轮拍卖。
4.根据权利要求1中所述的基于任务密集度动态调整的多机器人协作围捕任务分配方法,其特征在于:所述的多机器人围捕成功的条件是围捕机器人之间的距离不大于目标机器人通过的安全距离,这里设置安全距离为0.5m。
5.根据权利要求1中所述的基于任务密集度动态调整的多机器人协作围捕任务分配方法,其特征在于:所述的拍卖市场结束的条件是所有的目标机器人都被发现并且被围捕成功。
CN201610234559.XA 2016-04-15 2016-04-15 一种基于任务密集度动态调整的多机器人协作围捕任务分配方法 Expired - Fee Related CN105843227B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610234559.XA CN105843227B (zh) 2016-04-15 2016-04-15 一种基于任务密集度动态调整的多机器人协作围捕任务分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610234559.XA CN105843227B (zh) 2016-04-15 2016-04-15 一种基于任务密集度动态调整的多机器人协作围捕任务分配方法

Publications (2)

Publication Number Publication Date
CN105843227A true CN105843227A (zh) 2016-08-10
CN105843227B CN105843227B (zh) 2018-10-23

Family

ID=56588533

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610234559.XA Expired - Fee Related CN105843227B (zh) 2016-04-15 2016-04-15 一种基于任务密集度动态调整的多机器人协作围捕任务分配方法

Country Status (1)

Country Link
CN (1) CN105843227B (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106647808A (zh) * 2017-01-05 2017-05-10 南宁市健佳网络科技有限公司 一种基于模糊控制算法的AUVs搜索和围捕任务分配控制方法
CN106843220A (zh) * 2017-02-27 2017-06-13 同济大学 一种多Agent围捕‑觅食行为控制方法
CN106875090A (zh) * 2017-01-09 2017-06-20 中南大学 一种面向动态任务的多机器人分布式任务分配形成方法
CN107562074A (zh) * 2017-07-24 2018-01-09 哈尔滨工程大学 一种面向mauvs围捕的任务分配方法
CN107657364A (zh) * 2017-09-06 2018-02-02 中南大学 一种面向烟草工厂物料运输的多载agv任务分配形成方法
CN107831780A (zh) * 2017-10-24 2018-03-23 佛山科学技术学院 一种基于模拟退火思想的多机器人合作围捕方法
CN107967513A (zh) * 2017-12-25 2018-04-27 徐雪松 多机器人强化学习协同搜索方法及系统
CN108985580A (zh) * 2018-06-16 2018-12-11 齐齐哈尔大学 基于改进bp神经网络的多机器人灾害搜救任务分配方法
CN109116854A (zh) * 2018-09-16 2019-01-01 南京大学 一种基于强化学习的多组机器人协作控制方法及控制系统
CN109919431A (zh) * 2019-01-28 2019-06-21 重庆邮电大学 基于拍卖算法的异构多机器人任务分配方法
US10456912B2 (en) 2017-05-11 2019-10-29 King Fahd University Of Petroleum And Minerals Dynamic multi-objective task allocation
CN110488849A (zh) * 2019-08-29 2019-11-22 哈尔滨工程大学 一种基于改进拍卖算法的围捕者决策方法
CN110488807A (zh) * 2018-05-15 2019-11-22 罗伯特·博世有限公司 用于运行机器人的方法、机器人和多智能体系统
CN110618689A (zh) * 2018-06-20 2019-12-27 陕西师范大学 一种约束条件下基于合同网的多uuv系统协商合作建模方法
CN110618690A (zh) * 2018-06-20 2019-12-27 陕西师范大学 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法
CN111190420A (zh) * 2020-01-07 2020-05-22 大连理工大学 一种多移动机器人在安防领域中协作搜索与围捕方法
CN111240332A (zh) * 2020-01-18 2020-06-05 湖南科技大学 一种复杂凸环境下群机器人协同作业的多目标围捕方法
CN111240288A (zh) * 2020-01-20 2020-06-05 广东博智林机器人有限公司 计算模型构建及配置计算的方法、装置、设备及存储介质
CN111352421A (zh) * 2020-03-04 2020-06-30 西北工业大学 一种多移动单元协同巡查的轨迹生成方法
CN111465475A (zh) * 2017-12-22 2020-07-28 罗伯特·博世有限公司 用于运行多代理系统中的机器人的方法、机器人以及多代理系统
CN111680836A (zh) * 2020-06-06 2020-09-18 杭州电子科技大学 一种面向在线st-sr问题的分布式多机器人系统任务分配方法
CN110162043B (zh) * 2019-05-17 2020-10-09 北京航空航天大学 一种多目标点同时到达约束下的集群任务分配和控制方法
CN111861671A (zh) * 2020-07-23 2020-10-30 浙江物产信息技术有限公司 一种控制机器人暗标出价的在线竞拍方法及装置
CN115113626A (zh) * 2022-07-20 2022-09-27 威康(深圳)智能有限公司 一种机器人分布式控制系统及其方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040162638A1 (en) * 2002-08-21 2004-08-19 Neal Solomon System, method and apparatus for organizing groups of self-configurable mobile robotic agents in a multi-robotic system
CN102901498A (zh) * 2012-09-21 2013-01-30 北京航空航天大学 一种不确定环境下的无人飞行器编队协同搜索和动态任务分配方法
CN104942807A (zh) * 2015-04-16 2015-09-30 上海大学 基于扩展式合作博弈的多机器人围捕目标方法
CN105068550A (zh) * 2015-08-21 2015-11-18 燕山大学 一种基于拍卖模式的水下机器人多目标选择策略
CN105182973A (zh) * 2015-09-08 2015-12-23 郑州大学 多机器人追捕者围捕单移动目标的自适应围捕装置与方法
CN105282246A (zh) * 2015-10-23 2016-01-27 上海交通大学 基于拍卖机制的感知任务分配的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040162638A1 (en) * 2002-08-21 2004-08-19 Neal Solomon System, method and apparatus for organizing groups of self-configurable mobile robotic agents in a multi-robotic system
CN102901498A (zh) * 2012-09-21 2013-01-30 北京航空航天大学 一种不确定环境下的无人飞行器编队协同搜索和动态任务分配方法
CN104942807A (zh) * 2015-04-16 2015-09-30 上海大学 基于扩展式合作博弈的多机器人围捕目标方法
CN105068550A (zh) * 2015-08-21 2015-11-18 燕山大学 一种基于拍卖模式的水下机器人多目标选择策略
CN105182973A (zh) * 2015-09-08 2015-12-23 郑州大学 多机器人追捕者围捕单移动目标的自适应围捕装置与方法
CN105282246A (zh) * 2015-10-23 2016-01-27 上海交通大学 基于拍卖机制的感知任务分配的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JINGE CAO ET AL.: "Multi-robot Target Hunting Based on Dynamic Adjustment Auction Algorithm", 《PROCEEDINGS OF 2016 IEEE INTERNATIONAL CONFERENCE ON MECHATRONICS AND AUTOMATION AUGUST 7 - 10, HARBIN, CHINA》 *
ZHONGYA WANG ET AL.: "A Task Allocation Algorithm Based on Market Mechanism for Multiple Robot Systems", 《PROCEEDINGS OF THE 2016 IEEE INTERNATIONAL CONFERENCE ON REAL-TIME COMPUTING AND ROBOTICS JUNE 6-9, 2016, ANGKOR WAT, CAMBODIA》 *
杨曙光: "移动机器人的避障及动态围捕研究", 《中国优秀硕士学位论文全文数据库》 *
王文星 等: "基于联合投标的多目标机器人围捕", 《现代电子技术》 *

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106647808B (zh) * 2017-01-05 2020-02-14 台州施特自动化有限公司 一种基于模糊控制算法的AUVs搜索和围捕任务分配控制方法
CN106647808A (zh) * 2017-01-05 2017-05-10 南宁市健佳网络科技有限公司 一种基于模糊控制算法的AUVs搜索和围捕任务分配控制方法
CN106875090A (zh) * 2017-01-09 2017-06-20 中南大学 一种面向动态任务的多机器人分布式任务分配形成方法
CN106843220A (zh) * 2017-02-27 2017-06-13 同济大学 一种多Agent围捕‑觅食行为控制方法
CN106843220B (zh) * 2017-02-27 2019-10-18 同济大学 一种多Agent围捕-觅食行为控制方法
US10456912B2 (en) 2017-05-11 2019-10-29 King Fahd University Of Petroleum And Minerals Dynamic multi-objective task allocation
US10543597B1 (en) 2017-05-11 2020-01-28 King Fahd University Of Petroleum And Minerals Task assignment method for wheeled robot network
US10525591B1 (en) 2017-05-11 2020-01-07 King Fahd University Of Petroleum And Minerals Robotic network system with dynamic multi-objective task allocation
CN107562074A (zh) * 2017-07-24 2018-01-09 哈尔滨工程大学 一种面向mauvs围捕的任务分配方法
CN107562074B (zh) * 2017-07-24 2020-05-22 哈尔滨工程大学 一种面向mauvs围捕的任务分配方法
CN107657364A (zh) * 2017-09-06 2018-02-02 中南大学 一种面向烟草工厂物料运输的多载agv任务分配形成方法
CN107831780A (zh) * 2017-10-24 2018-03-23 佛山科学技术学院 一种基于模拟退火思想的多机器人合作围捕方法
CN107831780B (zh) * 2017-10-24 2020-09-22 佛山科学技术学院 一种基于模拟退火思想的多机器人合作围捕方法
CN111465475A (zh) * 2017-12-22 2020-07-28 罗伯特·博世有限公司 用于运行多代理系统中的机器人的方法、机器人以及多代理系统
CN107967513A (zh) * 2017-12-25 2018-04-27 徐雪松 多机器人强化学习协同搜索方法及系统
CN110488807B (zh) * 2018-05-15 2024-05-14 罗伯特·博世有限公司 用于运行机器人的方法、机器人和多智能体系统
CN110488807A (zh) * 2018-05-15 2019-11-22 罗伯特·博世有限公司 用于运行机器人的方法、机器人和多智能体系统
CN108985580A (zh) * 2018-06-16 2018-12-11 齐齐哈尔大学 基于改进bp神经网络的多机器人灾害搜救任务分配方法
CN110618689A (zh) * 2018-06-20 2019-12-27 陕西师范大学 一种约束条件下基于合同网的多uuv系统协商合作建模方法
CN110618690A (zh) * 2018-06-20 2019-12-27 陕西师范大学 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法
CN110618690B (zh) * 2018-06-20 2022-06-07 陕西师范大学 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法
CN110618689B (zh) * 2018-06-20 2022-04-26 陕西师范大学 一种约束条件下基于合同网的多uuv系统协商合作建模方法
CN109116854A (zh) * 2018-09-16 2019-01-01 南京大学 一种基于强化学习的多组机器人协作控制方法及控制系统
CN109919431A (zh) * 2019-01-28 2019-06-21 重庆邮电大学 基于拍卖算法的异构多机器人任务分配方法
CN110162043B (zh) * 2019-05-17 2020-10-09 北京航空航天大学 一种多目标点同时到达约束下的集群任务分配和控制方法
CN110488849A (zh) * 2019-08-29 2019-11-22 哈尔滨工程大学 一种基于改进拍卖算法的围捕者决策方法
CN111190420B (zh) * 2020-01-07 2021-11-12 大连理工大学 一种多移动机器人在安防领域中协作搜索与围捕方法
CN111190420A (zh) * 2020-01-07 2020-05-22 大连理工大学 一种多移动机器人在安防领域中协作搜索与围捕方法
CN111240332A (zh) * 2020-01-18 2020-06-05 湖南科技大学 一种复杂凸环境下群机器人协同作业的多目标围捕方法
CN111240288A (zh) * 2020-01-20 2020-06-05 广东博智林机器人有限公司 计算模型构建及配置计算的方法、装置、设备及存储介质
CN111240288B (zh) * 2020-01-20 2021-03-16 广东博智林机器人有限公司 计算模型构建及配置计算的方法、装置、设备及存储介质
CN111352421A (zh) * 2020-03-04 2020-06-30 西北工业大学 一种多移动单元协同巡查的轨迹生成方法
CN111352421B (zh) * 2020-03-04 2022-08-12 西北工业大学 一种多移动单元协同巡查的轨迹生成方法
CN111680836B (zh) * 2020-06-06 2023-05-02 杭州电子科技大学 面向st-sr问题的分布式多机器人系统任务分配方法
CN111680836A (zh) * 2020-06-06 2020-09-18 杭州电子科技大学 一种面向在线st-sr问题的分布式多机器人系统任务分配方法
CN111861671A (zh) * 2020-07-23 2020-10-30 浙江物产信息技术有限公司 一种控制机器人暗标出价的在线竞拍方法及装置
CN115113626A (zh) * 2022-07-20 2022-09-27 威康(深圳)智能有限公司 一种机器人分布式控制系统及其方法
CN115113626B (zh) * 2022-07-20 2023-04-11 威康(深圳)智能有限公司 一种机器人分布式控制系统及其方法

Also Published As

Publication number Publication date
CN105843227B (zh) 2018-10-23

Similar Documents

Publication Publication Date Title
CN105843227A (zh) 一种基于任务密集度动态调整的多机器人协作围捕任务分配方法
CN109767128B (zh) 基于机器学习的成像卫星自主任务规划方法
CN104077634B (zh) 基于多目标优化的主动‑反应式动态项目调度方法
CN104572297A (zh) 一种基于遗传算法的Hadoop作业调度方法
Macchiaroli et al. A negotiation scheme for autonomous agents in job shop scheduling
CN101908172A (zh) 一种采用多种智能代理算法的电力市场混合仿真方法
CN111611062B (zh) 云边协同分层计算方法及云边协同分层计算系统
Guerrero et al. Multi-robot task allocation strategies using auction-like mechanisms
CN106970604A (zh) 一种基于蚁群算法的多目标工件调度算法
CN114154819A (zh) 一种基于任务相似度的多agv分布式调度方法与系统
CN110430547A (zh) UASNs中基于Q-learning的多AUV协作数据收集算法
CN115358831A (zh) 基于多智能体强化学习算法在联邦学习下的用户竞价方法及装置
CN108776845A (zh) 一种基于双目标作业车间调度的混合果蝇算法
CN104506576A (zh) 一种无线传感器网络及其节点任务迁移方法
CN107219824B (zh) 基于滚动窗口调度技术的软件机器人集成控制调度方法
CN109684088A (zh) 云平台资源约束的遥感大数据快速处理任务调度方法
CN102945510A (zh) 一种求解复杂资源受限项目调度问题的有效方法
CN111352713A (zh) 边缘环境面向时延优化的自动驾驶推理任务工作流调度方法
Dai et al. Research on multi-robot task allocation based on BP neural network optimized by genetic algorithm
CN106961124A (zh) 一种基于价格需求响应的经济调度模型
CN104540171A (zh) 一种无线传感器网络及其节点任务分配方法
Francisco et al. Experiments with firefly algorithm
CN106900007A (zh) 面向重叠分簇的无线传感器网络的复杂任务分配方法
CN102413482B (zh) 基于合同网的无线传感器任务分配方法
CN115186878B (zh) 一种多agv在线任务分配方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181023

Termination date: 20210415