CN110134146B - 一种不确定环境下的分布式多无人机任务分配方法 - Google Patents

一种不确定环境下的分布式多无人机任务分配方法 Download PDF

Info

Publication number
CN110134146B
CN110134146B CN201910513324.8A CN201910513324A CN110134146B CN 110134146 B CN110134146 B CN 110134146B CN 201910513324 A CN201910513324 A CN 201910513324A CN 110134146 B CN110134146 B CN 110134146B
Authority
CN
China
Prior art keywords
task
unmanned aerial
aerial vehicle
theta
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910513324.8A
Other languages
English (en)
Other versions
CN110134146A (zh
Inventor
符小卫
王辉
潘静
高晓光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201910513324.8A priority Critical patent/CN110134146B/zh
Publication of CN110134146A publication Critical patent/CN110134146A/zh
Application granted granted Critical
Publication of CN110134146B publication Critical patent/CN110134146B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种不确定环境下的分布式多无人机任务分配方法,首先建立协同任务分配模型,各无人机进行自己的任务束更新、构建,然后无人机编队进行一致性协商,实现不确定参数下最大化整体收益的目标。本发明利用一致性束算法CBBA,在分布式的架构下求解任务环境存在不确定参数时多无人机的时敏任务协同分配问题,利用高斯过程回归模型来捕捉不确定参数对任务分配收益的影响来参与分配过程从而保证任务分配结果的实际执行效果,利用主动学习和流形学习方法来提高算法的计算效率。

Description

一种不确定环境下的分布式多无人机任务分配方法
技术领域
本发明涉及一种多无人机任务分配方法。
背景技术
当前,随着无人机技术的提高,多无人机能通过协同、协作组成集群编队来完成单无人机无法完成或难以完成的工作。因此,多无人机系统的研究受到广泛关注。多无人机任务分配是多无人机协同任务规划的关键技术之一,其目标是根据任务区域和目标的先验情报信息,在考虑具体约束条件的前提下,以任务的总体效能最优或次优为目标,合理地将具体行动任务分配给无人机编队中的成员。随着无人机性能的不断提高和任务环境干扰因素的增加,任务分配过程中常常存在部分先验数据具有不确定性的现象,因此,不确定环境下的多无人机任务分配研究成为研究热点。
针对不确定环境下的多无人机任务分配问题,相关领域学者在主流的任务分配算法基础上考虑了分配参数的不确定性。陈侠将不确定性指标表示为区间不确定性信息,然后给出了基于随机概率的多属性方案排序(Stochastic Multi-criteria AcceptabilityAnalysis,SMAA)方法的求解思路。Ponda提出了鲁棒任务分配算法,具体操作是基于期望值法、最坏情形法、风险约束法将已知分布信息的不确定参数耦合进任务分配过程,并在一致性束算法CBBA(Consensus-Based Bundle Algorithm,CBBA)框架内进行了求解。但是现有的方法需要的计算量过大,如何在不降低鲁棒任务分配算法的执行效能的情况下提高算法的计算效率是本领域技术人员需要解决的技术问题。
发明内容
为了克服现有技术的不足,本发明提供一种不确定环境下的分布式多无人机任务分配方法,利用一致性束算法CBBA,在分布式的架构下求解任务环境存在不确定参数时多无人机的时敏任务协同分配问题,利用高斯过程回归模型(Gaussian ProcessRegression,GPR)来捕捉不确定参数对任务分配收益的影响来参与分配过程从而保证任务分配结果的实际执行效果,利用主动学习和流形学习方法来提高算法的计算效率。
本发明解决其技术问题所采用的技术方案包括以下步骤:
步骤1,对于由Na个无人机组成的无人机编队,所有无人机均是同一类型;任务执行区域内有Nt个目标,无人机编队要对每个目标执行时敏任务,每个时敏任务的执行时间为tj,j=1,2...,Nt,其时间窗约束为ETj≤tj≤LTj,其中,ETj为任务j的最早允许开始执行时间,LTj为任务j的最晚允许开始执行时间;
无人机i对目标j执行任务的收益
Figure BDA0002094190470000021
其中,Vj为目标j的价值,λ为指数折扣收益模型的递减因子,α为距离代价的惩罚因子,Lij为无人机i与目标j的欧式距离;
每个任务的执行时长tj-dur=gj(θ),其中,任务环境的不确定参数θ服从分布概率密度函数p(θ),函数关系gj在仿真时由历史数据或模型仿真获得;
协同分配模型目的是求解决策矩阵x,xij=1表示分配无人机i对目标j执行任务,x∈χ,
Figure BDA0002094190470000022
每个无人机最多能够执行Li个任务,每个无人机维护以下数据信息结构:
(1)任务束集(Bundle):
Figure BDA0002094190470000023
其中bin是竞拍到的目标,表示无人机i竞拍得到的第n个任务的序号;
(2)任务时序集(Path):
Figure BDA0002094190470000024
任务时序Pi为无人机i的任务束Bi的任务执行顺序,即无人机i执行任务的顺序为
Figure BDA0002094190470000025
(3)执行时间集(Time):
Figure BDA0002094190470000026
τin∈R+表示无人机i根据任务时序集Pi到达任务区执行任务pin的执行时间;
(4)赢家集(Winning Uavs):
Figure BDA0002094190470000027
其中元素zin表示无人机i与其所有邻接无人机通过信息交互所获得的关于任务j的赢家信息,即当前时刻无人机zin对任务j出价最高成为赢家;若当前尚未有无人机竞拍到任务j,则zi=φ;
(5)赢家出价集(Winning Bids):
Figure BDA0002094190470000028
其中元素yin∈R+,用来表示当前时刻各无人机对任务j竞拍时的最大出价值,若当前尚未有无人机竞拍到任务j则yin=0;
(6)时间戳集(Time Stamps):时间戳为
Figure BDA0002094190470000029
其中元素sin∈R+,用来表示无人机i与其邻接无人机之间的最近一次信息交互时间;
(7)分配时间标记:[Tip,tip],Tip为通信的时间标记,无人机之间采用同步通信机制,每次协商阶段无人机i同通信网络中的其他所有无人机进行完通信,Tip自增;tip为无人机i进行任务束构建阶段的时间标记,无人机i任务束构建完有新任务加入时,tip自增;
步骤2,已知无人机i和目标j的位置矢量、目标j任务Tj的价值和时间窗,构造信息结构Bi,Pii的步骤如下:
Step2.1,从j=1循环迭代到j=Nt,若
Figure BDA0002094190470000031
执行Step2.2到Step2.6,否则j自增;
Step2.2,对于任务时序集Pi的每一个位置k=1到k=LPi,检测加入新任务Tj的可能性,若满足可能性转入Step2.3,LPi为无人机i的任务时序集里已经出价的任务个数;
Step2.3,求Tj插在Pi的位置k竞拍出价的边际收益cij-Pik
Step2.3.1,根据已知不确定参数θ[θ12]的参数空间及分布概率密度函数p(θ),产生N个样本形成样本集,每个样本包含θ[θ12]和对应的f(θ)形成的有序对(θ,f(θ));其中,f(θ)为θ的具体取值下加入新任务Tj并插在Pi的位置k的优化任务束总收益;
样本集分为训练集S和未采样样本集U,训练集S样本的f(θ)已通过计算获得,未采样样本集U的f(θ)未知;
随机选取s个样本转入Step2.3.2计算f(θ),构造初始训练集;
Step2.3.2,求需要采样的样本θk对应的优化收益f(θk):
(1)对于任务时序集中的每个任务Tl∈Pi,任务Tl的执行时长已知;
(2)计算Pi对应的优化执行时间
Figure BDA0002094190470000032
(3)求
Figure BDA0002094190470000033
Step2.3.3,利用MPGR方法初步筛选U,产生稀疏子集Ls:
(1)利用K近邻法从U构造一个图G,每个θk是一个节点,每个节点选取离自己欧式距离最近的k个节点形成边;
(2)n=1,计算图G中每个节点的度
Figure BDA0002094190470000034
其中,Wpq为节点p与邻居节点q的连接边权值,
Figure BDA0002094190470000041
其中,xp,xq是节点p,q的位置矢量,t是一个可调参数,η是所有节点的最邻近距离的平均值;
(3)选出度指标最高的节点p*加入Ls,并从图G剔除
Figure BDA0002094190470000042
及p*的连接边;
(4)若n=NLs,NLs为期望生成的Ls的规模,转入Step2.3.4;否则n自增,转入Step2.3.3的(2);
Step2.3.4,通过训练集S训练高斯过程模型GPR为Jθ=J(θ),其中,J为输入不确定参数θ和输出收益Jθ之间的映射关系,高斯过程表示为J(θ)=GP(m(θ),k(θ,θ')),其中,均值m(θ)=Eθ[J(θ)],协方差k(θ,θ')=Eθ[(J(θ)-m(θ))(J(θ')-m(θ'))];
Step2.3.5,从Ls中同时选取Ns个样本加入训练集:
(1)对于每个样本θ*∈U,转入(2)进行GPR预测;
(2)求预测收益分
Figure BDA0002094190470000045
其中,均值μ(θ*)和方差∑(θ*)的计算如下:
μ(θ*)=k(θ*S)K-1J(θS)
Figure BDA0002094190470000046
K=k(θSS)
Figure BDA0002094190470000043
其中,α和Λ为高斯训练过程的超参数;
(3)选取最高评价值的Ns个样本加入训练集S,并从U中剔除
Figure BDA0002094190470000044
(4)若训练集规模已经达到要求,则转入Step2.3.6,否则转入Step2.3.2;
Step2.3.6,计算期望收益分:
(1)对于每个样本θk∈S∪U,利用式(2-10)预测θk相应的任务收益;
(2)概率归一化
Figure BDA0002094190470000051
(3)计算期望收益分
Figure BDA0002094190470000052
其中,JPold为无人机i增加该任务前任务束的总收益。
Step2.4,从cij-Pik中选出边际收益最大的插入位置PiG作为该任务插入到Pi中的最优时序,k=1~LPi;若cij-Pik大于赢家出价集yij,存储cij-PiG和PiG到无人机i的出价集
Figure BDA0002094190470000053
和插入时序集
Figure BDA0002094190470000054
代表出价过程,否则任务束构建过程结束;
Step2.5,从Ci中选择边际收益最大的任务
Figure BDA0002094190470000055
作为新加任务,更新无人机i的信息结构:
Figure BDA0002094190470000056
Figure BDA0002094190470000057
Step2.6,若无人机的任务束已经溢出,则任务束构建过程结束,更新分配时间标记tip
步骤3,无人机i进行收敛判断,若Tip-tip≥Nu,Nu为通信网络直径,则无人机i的分配信息已经保持Nu通信循环不变,若所有无人机的分配信息已经保持不变,则编队达到分配结果一致状态,算法结束;
步骤4,各无人机之间进行同步通信,共享zi,yi并更新分配时间标记Tip,若无人机i接收到邻接无人机l分配的信息后,对目标j的任务Tj,信息更新行动规则如下:
(1)更新:把ylj赋值给yij,把zlj赋值给zij
(2)重置:yij置为0,zij置为空;
(3)离开:yij、zij保持不变;
步骤5,各无人机经过一致性协商-竞标过程后,无人机i更新Bi,Pi,对于任务Tl∈Bi,若
Figure BDA0002094190470000059
则从任务束中剔除该任务Tl及Bi中位于该任务后加入的任务;
步骤6,优化目标函数
Figure BDA0002094190470000058
本发明的有益效果是:解决了时敏任务执行时长不确定的情况下,多无人机的任务分配问题。本发明基于分布式CBBA框架,并利用高斯过程回归模型、主动学习和流形学习方法来快速地求出期望收益得分的近似值,从而在规划阶段捕捉任务执行时长的不确定性对时序性任务的执行时间产生的影响,得到的任务分配结果在实际执行时具有很高的成功率并能获得较高的任务收益。
附图说明
图1是本发明所采用方法中每个无人机进行任务分配的流程示意图。
图2是本发明中采用CBBA方法进行不确定执行时长下任务分配的分配结果-任务路径图。
图3是采用基本CBBA方法进行实施例中相同环境的分配结果-任务路径图。
具体实施方式
下面结合附图和实施例对本发明进一步说明,本发明包括但不仅限于下述实施例。
如图1所示,本发明的步骤如下:
步骤1:不确定参数下多无人机时敏任务的协同分配模型
无人机编队由Na个无人机组成,所有无人机均是同一类型。任务执行区域内有Nt个目标,无人机编队要对每个目标执行时敏任务,每个时敏任务的执行时间为tj(j=1,2...,Nt),其时间窗约束如下:
ETj≤tj≤LTj (1-1)
其中,ETj为任务j的最早允许开始执行时间,LTj为任务j的最晚允许开始执行时间。时敏任务的执行必须要满足时间窗约束,即在时间窗内执行会取得收益,在时间窗之外执行则会被认为执行失败没有收益。
无人机i(i=1,2...,Na)对目标j(j=1,2...,Nt)执行任务的收益cij定义如下:
Figure BDA0002094190470000061
其中,Vj为目标j的价值,λ为指数折扣收益模型的递减因子(取值范围为[0,1]),α为距离代价的惩罚因子(取值范围为[0,1]),Lij为无人机i与目标j的欧式距离。
每个任务不会瞬间被执行,具有执行时长,执行时长会受环境影响。则执行时长与环境的数学关系可简单抽象为函数关系,每个任务的执行时长tj-dur由任务环境的不确定参数θ决定,函数关系如下:
tj-dur=gj(θ) (1-3)
其中,任务环境的不确定参数θ服从分布概率密度函数p(θ),函数关系gj在仿真时可由历史经验数据或模型仿真获得。
协同分配模型目的是求解决策矩阵x(0-1变量集合),xij=1表示分配无人机i对目标j执行任务,定义如下:
Figure BDA0002094190470000071
每个无人机由于性能和携带载荷的限制能够执行的任务个数有限,即每个无人机最多能够执行Li个任务,每个无人机维护以下数据信息结构:
(1)任务束集(Bundle):
Figure BDA0002094190470000072
其中bin是竞拍到的目标,表示无人机i竞拍得到的第n个任务的序号。
(2)任务时序集(Path):
Figure BDA0002094190470000073
任务时序Pi为无人机i的任务束Bi的任务执行顺序,即无人机i执行任务的顺序为
Figure BDA0002094190470000074
(3)执行时间集(Time):
Figure BDA0002094190470000075
τin∈R+表示无人机i根据任务时序集Pi到达任务区执行任务pin的执行时间。
(4)赢家集(Winning Uavs):
Figure BDA0002094190470000076
其中元素zin表示无人机i与其所有邻接无人机通过信息交互所获得的关于任务j的赢家信息,即当前时刻无人机zin对任务j出价最高成为赢家。若当前尚未有无人机竞拍到任务j,则zi=φ。
(5)赢家出价集(Winning Bids):
Figure BDA0002094190470000077
其中元素yin∈R+,用来表示当前时刻各无人机对任务j竞拍时的最大出价值,若当前尚未有无人机竞拍到任务j,则yin=0。
(6)时间戳集(Time Stamps):时间戳为
Figure BDA0002094190470000078
其中元素sin∈R+,用来表示无人机i与其邻接无人机之间的最近一次信息交互时间。
(7)分配时间标记:[Tip,tip],Tip为通信的时间标记,无人机之间采用同步通信机制,每次协商阶段无人机i同通信网络中的其他所有无人机进行完通信,Tip自增;tip为无人机i进行任务束构建阶段的时间标记,无人机i任务束构建完有新任务加入时,tip自增;
步骤2:任务束构建
已知无人机i(i=1,2...,Na)和目标j(j=1,2...,Nt)的位置矢量、目标j任务Tj的价值和时间窗,可按照Step2.1到Step2.4来构造信息结构Bi,Pii
Step2.1:从j=1循环迭代到j=Nt,若
Figure BDA0002094190470000081
执行Step2.2到Step2.6,否则j自增;
Step2.2:对于任务时序集Pi的每一个位置k=1到k=LPi(LPi为无人机i的任务时序集里已经出价的任务个数),检测加入新任务Tj的可能性,若满足可能性转入Step2.3;
Step2.3:求Tj插在Pi的位置k竞拍出价的边际收益cij-Pik
Step2.3.1:根据已知不确定参数θ[θ12]的参数空间及分布概率密度函数p(θ),产生N个样本形成样本集,每个样本包含θ[θ12]和对应的f(θ)形成的有序对(θ,f(θ))。
其中,f(θ)为θ的具体取值下加入新任务Tj并插在Pi的位置k的优化任务束总收益。
样本集分为训练集S和未采样样本集U(样本池),训练集S样本的f(θ)已通过计算获得,未采样样本集U的f(θ)未知。
随机选取s个样本转入Step2.3.2计算f(θ),构造初始训练集;
Step2.3.2:求需要采样的样本θk对应的优化收益f(θk):
(4)对于任务时序集中的每个任务Tl∈Pi,任务Tl的执行时长可由步骤1计算出;
(5)计算Pi对应的优化执行时间τi *
Figure BDA0002094190470000082
(6)求f(θk):
Figure BDA0002094190470000083
Step2.3.3:利用MPGR方法初步筛选U,产生稀疏子集Ls:
(1)利用K近邻法从U构造一个图G,每个θk是一个节点,每个节点选取离自己欧式距离最近的k个节点形成边;
(2)n=1,计算图G中每个节点的度d(p):
Figure BDA0002094190470000091
其中,Wpq为节点p与邻居节点q的连接边权值,计算如下:
Figure BDA0002094190470000092
其中,xp,xq是节点p,q的位置矢量,t是一个可调参数,η是所有节点的最邻近距离的平均值。
(3)选出度指标最高的节点p*加入Ls,并从图G剔除p*及p*的连接边:
Figure BDA0002094190470000093
(4)若n=NLs,NLs为期望生成的Ls的规模,转入Step2.3.4;否则n自增,转入Step2.3.3的(2);
Step2.3.4:通过训练集S训练高斯过程模型GPR:
Jθ=J(θ) (2-6)
其中,J为输入不确定参数θ和输出收益Jθ之间的映射关系,高斯过程可表示如下:
J(θ)=GP(m(θ),k(θ,θ')) (2-7)
其中,均值m(θ)和协方差k(θ,θ')的计算如下:
m(θ)=Eθ[J(θ)] (2-8)
k(θ,θ')=Eθ[(J(θ)-m(θ))(J(θ')-m(θ'))] (2-9)
Step2.3.5:从Ls中同时选取Ns个样本加入训练集:
(5)对于每个样本θ*∈U,转入(2)进行GPR预测;
(6)求预测收益分
Figure BDA0002094190470000094
Figure BDA0002094190470000095
其中,均值μ(θ*)和方差∑(θ*)的计算如下:
μ(θ*)=k(θ*S)K-1J(θS) (2-11)
Figure BDA0002094190470000101
K=k(θSS) (2-12)
Figure BDA0002094190470000102
其中,α和Λ为高斯训练过程的超参数。
(7)选取最高评价值的Ns个样本加入训练集S,并从U中剔除:
Figure BDA0002094190470000103
(8)若训练集规模已经达到要求,则转入Step2.3.6,否则转入2.3.2。
Step2.3.6:计算期望收益分:
(1)对于每个样本θk∈S∪U,利用式(2-10)预测θk相应的任务收益;
(2)概率归一化:
Figure BDA0002094190470000104
(7)计算期望收益分:
Figure BDA0002094190470000105
其中,
Figure BDA0002094190470000106
为无人机i增加该任务前任务束的总收益。
Step2.4:从cij-Pik(k=1to LPi)中选出边际收益最大的插入位置PiG作为该任务插入到Pi中的最优时序。若cij-Pik大于赢家出价集yij,存储cij-PiG和PiG到无人机i的出价集
Figure BDA0002094190470000107
和插入时序集
Figure BDA0002094190470000108
代表出价过程,否则任务束构建过程结束;
Step2.5:从Ci中选择边际收益最大的任务
Figure BDA0002094190470000109
作为新加任务,更新无人机i的信息结构:
Figure BDA00020941904700001010
Figure BDA00020941904700001011
Step2.6:若无人机的任务束已经溢出,则任务束构建过程结束,更新分配时间标记tip
步骤3:收敛判断
无人机i进行收敛判断,若Tip-tip≥Nu,Nu为通信网络直径,则无人机i的分配信息已经保持Nu通信循环不变,若所有无人机的分配信息已经保持不变,则编队达到分配结果一致状态,算法结束;
步骤4:一致性协商
各无人机之间进行同步通信,共享zi,yi并更新分配时间标记Tip,若无人机i接收到邻接无人机l分配的信息后,对目标j的任务Tj,信息更新行动规则如下:
(1)更新:把ylj赋值给yij,把zlj赋值给zij
(2)重置:yij置为0,zij置为空;
(3)离开:yij、zij保持不变;
无人机相互通信时,信息更新行动规则的选择遵照Ponda的博士论文"RobustDistributed Planning Strategies for Autonomous Multi-Agent Teams"。
步骤5:任务束更新
各无人机经过一致性协商-竞标过程后,无人机i需要更新Bi,Pi
对于任务Tl∈Bi,若
Figure BDA0002094190470000112
则需要从任务束中剔除该任务Tl及Bi中位于该任务后加入的任务;
步骤6:目标优化函数
协同任务分配的目标是一个数学优化的问题,优化的目标函数如下:
Figure BDA0002094190470000111
在分布式架构中进行任务分配算法的求解有着计算效率高、鲁棒性好的优点。通过步骤1建立协同任务分配模型,各无人机进行自己的任务束更新、构建,然后无人机编队进行一致性协商,即循环地进行步骤2、步骤3、步骤4和步骤5,从而能够实现不确定参数下最大化整体收益的目标。优化得到的决策矩阵x即任务分配结果,每个无人机维护的任务束集即其需要执行的任务,每个无人机维护的任务时序集即其需要执行任务的时序。
仿真环境为:Intel 2.8GHz,16GB内存的PC机,Windows10操作系统,Matlab2018a平台。
本发明考虑的是二维地图模型,高度已知,坐标系为平面坐标系。我方5架无人机需要对所处任务区的10个目标执行救援任务,无人机及目标的位置信息、每个任务的时间窗已知,任务区的大小为200m×200m,任务区的环境参数θ[θ12]为二维参数。已知环境参数θ的分布规律,θ的分布概率密度为二维高斯分布N(0,0,10,10,0.5),θ1和θ2的范围都为[-10,10]。无人机之间的通信网络为全联通,即任意两个无人机之间都能直接通信。无人机信息和任务的信息想定设置如表1、表2,任务的执行时长tj-dur的分布区间为[5s,35s]。
表1无人机信息设置
无人机编号 位置-x坐标(m) 位置-y坐标(m) 速度(m/s)
1 85.0525 77.9491 40
2 118.0923 120.9481 40
3 155.9565 160.6404 40
4 165.9341 130.5056 40
5 49.9302 176.8730 40
表2任务信息设置
任务编号 位置-x坐标(m) 位置-y坐标(m) 价值 时间窗
1 32.4941 128.3280 100 [52.5267,67.5267]
2 87.2405 60.3000 100 [49.4403,64.4403]
3 82.0714 174.4128 100 [26.4259,41.4259]
4 163.6574 189.7652 100 [71.4393,86.4393]
5 36.9334 139.6231 100 [68.4607,83.4607]
6 96.7491 132.4938 100 [19.0188,34.0188]
7 140.8701 142.9773 100 [54.3866,69.3866]
8 62.8865 72.7097 100 [90.9289,105.9289]
9 131.5797 159.6733 100 [48.5313,63.5313]
10 63.4772 120.4895 100 [71.5786,86.5786]
步骤1:不确定参数下多无人机时敏任务的协同分配模型
无人机编队由Na=5个无人机组成,所有无人机均是同一类型。任务执行区域内有Nt=10个目标,无人机编队要对每个目标执行时敏任务,每个时敏任务的执行时间为tj(j=1,2...,Nt),其时间窗约束如下:
ETj≤tj≤LTj (1-1)
其中,ETj为目标j任务的最早允许开始执行时间,LTj为目标j任务的最晚允许开始执行时间。本实例中,时间窗的设置如表2所示。时敏任务的执行必须要满足时间窗约束,即在时间窗内执行会取得收益,在时间窗之外执行则会被认为执行失败没有收益。
无人机i(i=1,2...,Na)对目标j(j=1,2...,Nt)执行任务的收益cij定义如下:
Figure BDA0002094190470000131
其中,Vj为目标j的价值,λ为指数折扣收益模型的递减因子(取值范围为[0,1]),α为距离代价的惩罚因子(取值范围为[0,1]),Lij为无人机i与目标j的欧式距离。本实例中取λ=0.1,α=1,欧式距离的计算则利用表1和表2提供的位置信息。
每个任务不会瞬间被执行,具有执行时长,执行时长会受环境影响。则执行时长与环境的数学关系可简单抽象为函数关系,每个任务的执行时长tj-dur由任务环境的不确定参数θ决定,函数关系如下:
tj-dur=gj(θ) (1-3)
本实例中,设定不确定参数θ对各任务执行时长的影响是相同的,函数关系简单抽象为:
Figure BDA0002094190470000132
协同分配模型目的是求解决策矩阵x(0-1变量集合),xij=1表示分配无人机i对目标j执行任务,定义如下:
Figure BDA0002094190470000133
每个无人机由于性能和携带载荷的限制能够执行的任务个数有限,即每个无人机最多能够执行Li个任务,每个无人机维护以下数据信息结构:
(1)任务束集(Bundle):
Figure BDA0002094190470000134
其中bin是竞拍到的目标,表示无人机i竞拍得到的第n个任务的序号。
(2)任务时序集(Path):
Figure BDA0002094190470000135
任务时序Pi为无人机i的任务束Bi的任务执行顺序,即无人机i执行任务的顺序为
Figure BDA0002094190470000136
(3)执行时间集(Time):
Figure BDA0002094190470000137
τin∈R+表示无人机i根据任务时序集Pi到达任务区执行任务pin的执行时间。
(4)赢家集(Winning Uavs):
Figure BDA0002094190470000141
其中元素zin表示无人机i与其所有邻接无人机通过信息交互所获得的关于任务j的赢家信息,即当前时刻无人机zin对任务j出价最高成为赢家。若当前尚未有无人机竞拍到任务j,则zi=φ。
(5)赢家出价集(Winning Bids):
Figure BDA0002094190470000142
其中元素yin∈R+,用来表示当前时刻各无人机对任务j竞拍时的最大出价值,若当前尚未有无人机竞拍到任务j,则yin=0。
(6)时间戳集(Time Stamps):时间戳为
Figure BDA0002094190470000143
其中元素sin∈R+,用来表示无人机i与其邻接无人机之间的最近一次信息交互时间。
(7)分配时间标记:[Tip,tip],Tip为通信的时间标记,无人机之间采用同步通信机制,每次协商阶段无人机i同通信网络中的其他所有无人机进行完通信,Tip自增;tip为无人机i进行任务束构建阶段的时间标记,无人机i任务束构建完有新任务加入时,tip自增;
步骤2:任务束构建
已知无人机i(i=1,2...,Na)和目标j(j=1,2...,Nt)的位置矢量、目标j任务Tj的价值和时间窗,可按照Step2.1到Step2.4来构造信息结构Bi,Pii
Step2.1:从j=1循环迭代到j=Nt,若
Figure BDA0002094190470000144
执行Step2.2到Step2.6,否则j自增;
Step2.2:对于任务时序集Pi的每一个位置k=1到k=LPi(LPi为无人机i的任务时序集里已经出价的任务个数),检测加入新任务Tj的可能性,若满足可能性转入Step2.3;
Step2.3:求Tj插在Pi的位置k竞拍出价的边际收益cij-Pik
Step2.3.1:根据已知不确定参数θ[θ12]的参数空间及分布概率密度函数p(θ),产生N个样本形成样本集,每个样本包含θ[θ12]和对应的f(θ)形成的有序对(θ,f(θ))。
其中,f(θ)为θ的具体取值下加入新任务Tj并插在Pi的位置k的优化任务束总收益。
样本集分为训练集S和未采样样本集U(样本池),训练集S样本的f(θ)已通过计算获得,未采样样本集U的f(θ)未知。
随机选取s个样本转入Step2.3.2计算f(θ),构造初始训练集;
Step2.3.2:求需要采样的样本θk对应的优化收益f(θk):
(8)对于任务时序集中的每个任务Tl∈Pi,任务Tl的执行时长可由式(1-2)计算出;
(9)计算Pi对应的优化执行时间τi *
Figure BDA0002094190470000151
(10)求f(θk):
Figure BDA0002094190470000152
Step2.3.3:利用MPGR方法初步筛选U,产生稀疏子集Ls:
(1)利用K近邻法从U构造一个图G,每个θk是一个节点,每个节点选取离自己欧式距离最近的k个节点形成边;
(2)n=1,计算图G中每个节点的度d(p):
Figure BDA0002094190470000153
其中,Wpq为节点p与邻居节点q的连接边权值,计算如下:
Figure BDA0002094190470000154
其中,xp,xq是节点p,q的位置矢量,t是一个可调参数,η是所有节点的最邻近距离的平均值。
(3)选出度指标最高的节点p*加入Ls,并从图G剔除p*及p*的连接边:
Figure BDA0002094190470000155
(4)若n=NLs,NLs为期望生成的Ls的规模,转入Step2.3.4;否则n自增,转入Step2.3.3的(2);
Step2.3.4:通过训练集S训练高斯过程模型GPR:
Jθ=J(θ) (2-6)
其中,J为输入不确定参数θ和输出收益Jθ之间的映射关系,高斯过程可表示如下:
J(θ)=GP(m(θ),k(θ,θ')) (2-7)
其中,均值m(θ)和协方差k(θ,θ')的计算如下:
m(θ)=Eθ[J(θ)] (2-8)
k(θ,θ')=Eθ[(J(θ)-m(θ))(J(θ')-m(θ'))] (2-9)
Step2.3.5:从Ls中同时选取Ns个样本加入训练集:
(9)对于每个样本θ*∈U,转入(2)进行GPR预测;
(10)求预测收益分
Figure BDA0002094190470000161
Figure BDA0002094190470000162
其中,均值μ(θ*)和方差∑(θ*)的计算如下:
μ(θ*)=k(θ*S)K-1J(θS) (2-11)
Figure BDA0002094190470000167
K=k(θSS) (2-12)
Figure BDA0002094190470000163
其中,α和Λ为高斯训练过程的超参数。
(11)选取最高评价值的Ns个样本加入训练集S,并从U中剔除:
Figure BDA0002094190470000164
(12)若训练集规模已经达到要求,则转入Step2.3.6,否则转入2.3.2。
Step2.3.6:计算期望收益分:
(1)对于每个样本θk∈S∪U,利用式(2-10)预测θk相应的任务收益;
(2)概率归一化:
Figure BDA0002094190470000165
(11)计算期望收益分:
Figure BDA0002094190470000166
其中,
Figure BDA0002094190470000171
为无人机i增加该任务前任务束的总收益。
Step2.4:从cij-Pik(k=1to LPi)中选出边际收益最大的插入位置PiG作为该任务插入到Pi中的最优时序。若cij-Pik大于赢家出价集yij,存储cij-PiG和PiG到无人机i的出价集
Figure BDA0002094190470000172
和插入时序集
Figure BDA0002094190470000173
代表出价过程,否则任务束构建过程结束;
Step2.5:从Ci中选择边际收益最大的任务
Figure BDA0002094190470000174
作为新加任务,更新无人机i的信息结构:
Figure BDA0002094190470000175
Figure BDA0002094190470000176
Step2.6:若无人机的任务束已经溢出,则任务束构建过程结束,更新分配时间标记tip
步骤3:收敛判断
无人机i进行收敛判断,若Tip-tip≥Nu,Nu为通信网络直径,则无人机i的分配信息已经保持Nu通信循环不变,若所有无人机的分配信息已经保持不变,则编队达到分配结果一致状态,算法结束;
步骤4:一致性协商
各无人机之间进行同步通信,共享zi,yi并更新分配时间标记Tip,若无人机i接收到邻接无人机l分配的信息后,对目标j的任务Tj,信息更新行动规则如下:
(1)更新:把ylj赋值给yij,把zlj赋值给zij
(2)重置:yij置为0,zij置为空;
(3)离开:yij、zij保持不变;
无人机相互通信时,信息更新行动规则的选择遵照Ponda的博士论文"RobustDistributed Planning Strategies for Autonomous Multi-Agent Teams"。
步骤5:任务束更新
各无人机经过一致性协商-竞标过程后,无人机i需要更新Bi,Pi
对于任务Tl∈Bi,若
Figure BDA0002094190470000177
则需要从任务束中剔除该任务Tl及Bi中位于该任务后加入的任务;
步骤6:目标优化函数
协同任务分配的目标是一个数学优化的问题,优化的目标函数如下:
Figure BDA0002094190470000181
在分布式架构中进行任务分配算法的求解有着计算效率高、鲁棒性好的优点。通过步骤1建立协同任务分配模型,各无人机进行自己的任务束更新、构建,然后无人机编队进行一致性协商,即循环地进行步骤2、步骤3、步骤4和步骤5,从而能够实现不确定参数下最大化整体收益的目标。优化得到的决策矩阵x即任务分配结果,每个无人机维护的任务束集即其需要执行的任务,每个无人机维护的任务时序集即其需要执行任务的时序。
图2是本发明实例的任务分配结果,5个无人机通过进行任务分配过程得到了一致的任务分配结果。A代表无人机,T代表任务。
A1→T2→T8;A2→T6→T10;A3→T7;A4→T9;A5→T3→T5
图3是采用基本CBBA方法的任务分配结果,其中的任务执行时长采用任务时长的均值计算。
对比图2和图3,可以看出2号无人机由于考虑了任务的不确定执行时长采用期望值的收益计算方法没有竞标到9号任务,由4号无人机去执行9号任务。这是因为,6号任务执行时长的延长可能会导致后继的9号任务的执行时间延迟,甚至延迟到9号任务的时间窗以外,造成执行失败。图3过程得到的任务总收益分为585.3,图2过程得到的任务总收益分为540.5。虽然分配得到的总任务收益分降低了,但实际执行过程中由于本实例耦合了不确定参数对任务收益分数的影响并将其加入到任务分配过程,得到的任务分配结果相比图3过程实际执行时具有更高的执行效率。
本实施实例中所采用的任务分配方法共调动步骤2.3来计算收益分959次,如果使用文献"Robust Distributed Planning Strategies for Autonomous Multi-AgentTeams"的蒙特卡洛抽样方法,每次需要进行10000次抽样来得到高精度的期望收益得分,而本发明每次仅需近似少量数目的抽样就能获得与蒙特卡洛方法同样精度的期望收益。虽然训练学习会带来时间代价的上升,但通过主动学习与流形学习的结合,在迭代的过程每次选择多个样本构造较优的训练集,可在保证近似精度不降低的前提下快速进行不确定参数整个空间的收益得分预测。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种不确定环境下的分布式多无人机任务分配方法,其特征在于包括下述步骤:
步骤1,对于由Na个无人机组成的无人机编队,所有无人机均是同一类型;任务执行区域内有Nt个目标,无人机编队要对每个目标执行时敏任务,每个时敏任务的执行时间为tj,j=1,2...,Nt,其时间窗约束为ETj≤tj≤LTj,其中,ETj为任务j的最早允许开始执行时间,LTj为任务j的最晚允许开始执行时间;
无人机i对目标j执行任务的收益
Figure FDA0003302064450000011
其中,Vj为目标j的价值,λ为指数折扣收益模型的递减因子,α为距离代价的惩罚因子,Lij为无人机i与目标j的欧式距离;
每个任务的执行时长tj-dur=gj(θ),其中,任务环境的不确定参数θ服从分布概率密度函数p(θ),函数关系gj在仿真时由历史数据或模型仿真获得;
协同分配模型目的是求解决策矩阵x,xij=1表示分配无人机i对目标j执行任务,
Figure FDA0003302064450000012
Na为组成无人机编队的无人机的数量;
每个无人机最多能够执行Li个任务,每个无人机维护以下数据信息结构:
(1)任务束集(Bundle):
Figure FDA0003302064450000013
其中bin是竞拍到的目标,表示无人机i竞拍得到的第n个任务的序号;
(2)任务时序集(Path):
Figure FDA0003302064450000014
任务时序Pi为无人机i的任务束Bi的任务执行顺序,即无人机i执行任务的顺序为
Figure FDA0003302064450000015
(3)执行时间集(Time):
Figure FDA0003302064450000016
τin∈R+表示无人机i根据任务时序集Pi到达任务区执行任务pin的执行时间;
(4)赢家集(Winning Uavs):
Figure FDA0003302064450000017
其中元素zin表示无人机i与其所有邻接无人机通过信息交互所获得的关于任务j的赢家信息,即当前时刻无人机zin对任务j出价最高成为赢家;若当前尚未有无人机竞拍到任务j,则zi=φ;
(5)赢家出价集(Winning Bids):
Figure FDA0003302064450000018
其中元素yin∈R+,用来表示当前时刻各无人机对任务j竞拍时的最大出价值,若当前尚未有无人机竞拍到任务j则yin=0;
(6)时间戳集(Time Stamps):时间戳为
Figure FDA0003302064450000021
其中元素sin∈R+,用来表示无人机i与其邻接无人机之间的最近一次信息交互时间;
(7)分配时间标记:[Tip,tip],Tip为通信的时间标记,无人机之间采用同步通信机制,每次协商阶段无人机i同通信网络中的其他所有无人机进行完通信,Tip自增;tip为无人机i进行任务束构建阶段的时间标记,无人机i任务束构建完有新任务加入时,tip自增;
步骤2,已知无人机i和目标j的位置矢量、目标j任务Tj的价值和时间窗,构造信息结构Bi,Pii的步骤如下:
Step2.1,从j=1循环迭代到j=Nt,若
Figure FDA0003302064450000022
执行Step2.2到Step2.6,否则j自增;
Step2.2,对于任务时序集Pi的每一个位置k=1到k=LPi,检测加入新任务Tj的可能性,若满足可能性转入Step2.3,LPi为无人机i的任务时序集里已经出价的任务个数;
Step2.3,求Tj插在Pi的位置k竞拍出价的边际收益cij-Pik
Step2.3.1,根据不确定参数θ的参数空间及分布概率密度函数p(θ),产生N个样本形成样本集,每个样本包含不确定参数θ和对应的f(θ)形成的有序对(θ,f(θ));其中,θ为二维参数[θ12],f(θ)为θ的具体取值下加入新任务Tj并插在Pi的位置k的优化任务束总收益;
样本集分为训练集S和未采样样本集U,训练集S样本的f(θ)已通过计算获得,未采样样本集U的f(θ)未知;
随机选取s个样本转入Step2.3.2计算f(θ),构造初始训练集;
Step2.3.2,求需要采样的样本θk对应的优化收益f(θk):
(1)对于任务时序集中的每个任务Tl∈Pi,任务Tl的执行时长已知;
(2)计算Pi对应的优化执行时间
Figure FDA0003302064450000023
(3)求
Figure FDA0003302064450000024
Step2.3.3,初步筛选U,产生稀疏子集Ls:
(1)利用K近邻法从U构造一个图G,每个θk是一个节点,每个节点选取离自己欧式距离最近的k个节点形成边;
(2)n=1,计算图G中每个节点的度
Figure FDA0003302064450000031
其中,Wpq为节点p与邻居节点q的连接边权值,
Figure FDA0003302064450000032
其中,xp,xq是节点p,q的位置矢量,t是一个可调参数,η是所有节点的最邻近距离的平均值;
(3)选出度指标最高的节点p*加入Ls,并从图G剔除
Figure FDA0003302064450000033
及p*的连接边;
(4)若n=NLs,NLs为期望生成的Ls的规模,转入Step2.3.4;否则n自增,转入Step2.3.3的(2);
Step2.3.4,通过训练集S训练高斯过程模型GPR为Jθ=J(θ),其中,J为输入不确定参数θ和输出收益Jθ之间的映射关系,高斯过程表示为J(θ)=GP(m(θ),k(θ,θ')),其中,均值m(θ)=Eθ[J(θ)],协方差k(θ,θ')=Eθ[(J(θ)-m(θ))(J(θ')-m(θ'))];
Step2.3.5,从Ls中同时选取Ns个样本加入训练集:
(1)对于每个样本θ*∈U,转入(2)进行GPR预测;
(2)求预测收益分
Figure FDA0003302064450000034
其中,均值μ(θ*)和方差∑(θ*)的计算如下:
μ(θ*)=k(θ*S)K-1J(θS)
Figure FDA0003302064450000035
K=k(θSS)
Figure FDA0003302064450000036
其中,α和Λ为高斯训练过程的超参数;
(3)选取最高评价值的Ns个样本加入训练集S,并从U中剔除
Figure FDA0003302064450000037
(4)若训练集规模已经达到要求,则转入Step2.3.6,否则转入Step2.3.2;
Step2.3.6,计算期望收益分:
(1)对于每个样本θk∈S∪U,利用Step2.3.5中第(2)步中的公式预测θk相应的任务收益;
(2)概率归一化
Figure FDA0003302064450000041
(3)计算期望收益分
Figure FDA0003302064450000042
其中,
Figure FDA0003302064450000043
为无人机i增加该任务前任务束的总收益;
Step2.4,从cij-Pik中选出边际收益最大的插入位置PiG作为该任务插入到Pi中的最优时序,k=1~LPi;若cij-Pik大于赢家出价集yij,存储cij-PiG和PiG到无人机i的出价集
Figure FDA0003302064450000044
和插入时序集
Figure FDA0003302064450000045
代表出价过程,否则任务束构建过程结束;
Step2.5,从Ci中选择边际收益最大的任务
Figure FDA0003302064450000046
作为新加任务,更新无人机i的信息结构:
Figure FDA0003302064450000047
Figure FDA0003302064450000048
Step2.6,若无人机的任务束已经溢出,则任务束构建过程结束,更新分配时间标记tip
步骤3,无人机i进行收敛判断,若Tip-tip≥Nu,Nu为通信网络直径,则无人机i的分配信息已经保持Nu通信循环不变,若所有无人机的分配信息已经保持不变,则编队达到分配结果一致状态,算法结束;
步骤4,各无人机之间进行同步通信,共享zi,yi并更新分配时间标记Tip,若无人机i接收到邻接无人机l分配的信息后,对目标j的任务Tj,信息更新行动规则如下:
(1)更新:把ylj赋值给yij,把zlj赋值给zij
(2)重置:yij置为0,zij置为空;
(3)离开:yij、zij保持不变;
步骤5,各无人机经过一致性协商-竞标过程后,无人机i更新Bi,Pi,对于任务Tl∈Bi,若
Figure FDA0003302064450000049
则从任务束中剔除该任务Tl及Bi中位于该任务后加入的任务;
步骤6,优化目标函数
Figure FDA0003302064450000051
CN201910513324.8A 2019-06-14 2019-06-14 一种不确定环境下的分布式多无人机任务分配方法 Expired - Fee Related CN110134146B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910513324.8A CN110134146B (zh) 2019-06-14 2019-06-14 一种不确定环境下的分布式多无人机任务分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910513324.8A CN110134146B (zh) 2019-06-14 2019-06-14 一种不确定环境下的分布式多无人机任务分配方法

Publications (2)

Publication Number Publication Date
CN110134146A CN110134146A (zh) 2019-08-16
CN110134146B true CN110134146B (zh) 2021-12-28

Family

ID=67577186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910513324.8A Expired - Fee Related CN110134146B (zh) 2019-06-14 2019-06-14 一种不确定环境下的分布式多无人机任务分配方法

Country Status (1)

Country Link
CN (1) CN110134146B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110717670B (zh) * 2019-10-08 2023-06-23 西北工业大学 基于ma与合同网的多uav协同对地物资投放规划方法
CN112859887B (zh) * 2019-11-28 2022-06-14 中国科学院沈阳自动化研究所 基于天基中心的多水下机器人自主任务分配方法
CN110865653B (zh) * 2019-12-02 2022-09-13 西北工业大学 一种分布式集群无人机队形变换方法
CN111665866B (zh) * 2020-06-24 2022-10-14 西北工业大学 一种基于性能影响算法的多无人机任务分配方法
CN111798122B (zh) * 2020-06-30 2024-06-14 广东电网有限责任公司清远供电局 一种机器人和无人机协同巡检的资源调度方法及装置
CN112351503B (zh) * 2020-11-05 2022-09-06 大连理工大学 基于任务预测的多无人机辅助边缘计算资源分配方法
CN112633654A (zh) * 2020-12-15 2021-04-09 哈尔滨工程大学 基于改进聚类扩展一致性束算法的多无人机任务分配方法
CN112528451A (zh) * 2021-01-15 2021-03-19 博智安全科技股份有限公司 网络传输方法、终端设备和计算机可读存储介质
CN112383926A (zh) * 2021-01-15 2021-02-19 博智安全科技股份有限公司 认知无线电网络信号的多智能体传输方法和终端设备
CN112926827B (zh) * 2021-01-22 2023-05-02 西北工业大学 一种基于性能影响算法的多无人机任务重分配方法
CN113190038A (zh) * 2021-04-19 2021-07-30 北京理工大学 一种无人机集群空中区域侦察任务的分配方法
CN113313411B (zh) * 2021-06-17 2024-03-01 中国人民解放军国防科技大学 基于拍卖机制的图节点任务分配方法、装置和设备
CN114200964B (zh) * 2022-02-17 2022-04-26 南京信息工程大学 一种无人机集群协同侦察覆盖分布式自主优化方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246289A (zh) * 2013-05-07 2013-08-14 西北工业大学 带通信约束的多无人机协同搜索中的目标分配方法
CN103425840A (zh) * 2013-08-14 2013-12-04 西北工业大学 一种基于改进多目标蛙跳算法的协同空战火力分配方法
CN104155999A (zh) * 2014-07-31 2014-11-19 海南大学 战场环境下多无人机时敏任务动态分配算法
CN104833949A (zh) * 2015-05-11 2015-08-12 西北工业大学 一种基于改进距离参数化的多无人机协同无源定位方法
CN107678446A (zh) * 2017-10-30 2018-02-09 西北工业大学 一种针对大规模目标群的无人机协同目标分配方法
CN108724187A (zh) * 2018-06-13 2018-11-02 中国科学技术大学 一种机器人抓取飞行物体的运动规划方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246289A (zh) * 2013-05-07 2013-08-14 西北工业大学 带通信约束的多无人机协同搜索中的目标分配方法
CN103425840A (zh) * 2013-08-14 2013-12-04 西北工业大学 一种基于改进多目标蛙跳算法的协同空战火力分配方法
CN104155999A (zh) * 2014-07-31 2014-11-19 海南大学 战场环境下多无人机时敏任务动态分配算法
CN104833949A (zh) * 2015-05-11 2015-08-12 西北工业大学 一种基于改进距离参数化的多无人机协同无源定位方法
CN107678446A (zh) * 2017-10-30 2018-02-09 西北工业大学 一种针对大规模目标群的无人机协同目标分配方法
CN108724187A (zh) * 2018-06-13 2018-11-02 中国科学技术大学 一种机器人抓取飞行物体的运动规划方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
"Multi-UAVs cooperative control in communication relay";Fu Xiaowei等;《2016 IEEE International Conference on Signal Processing, Communications and Computing (ICSPCC)》;20161231;全文 *
"Performance of the Asynchronous Consensus Based Bundle Algorithm in Lossy Network Environments";Matthew Rantanen等;《2018 IEEE 10th Sensor Array and Multichannel Signal Processing Workshop (SAM)》;20181231;全文 *
"Task Allocation Method for Multi-UAV Teams with Limited Communication Bandwidth";Xiaowei Fu等;《2018 15th International Conference on Control, Automation, Robotics and Vision (ICARCV)》;20181231;全文 *
"多无人机模糊态势的分布式协同空战决策";陈侠等;《上海交通大学学报》;20140731;第48卷(第7期);全文 *
《不确定环境下多无人机协同区域搜索算法》;符小卫等;《系统工程与电子技术》;20160430;第38卷(第4期);全文 *

Also Published As

Publication number Publication date
CN110134146A (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
CN110134146B (zh) 一种不确定环境下的分布式多无人机任务分配方法
US20200273346A1 (en) Multi-agent reinforcement learning for order-dispatching via order-vehicle distribution matching
CN113671987B (zh) 基于非死锁合同网算法的多机分布式时序任务分配方法
CN108664038A (zh) 一种多无人机分布式合同竞拍在线任务规划方法
CN112508369B (zh) 基于改进蚁群算法的多无人机任务分配方法
CN112633654A (zh) 基于改进聚类扩展一致性束算法的多无人机任务分配方法
CN110456633B (zh) 机载多平台分布式任务分配方法
CN108415760B (zh) 一种基于移动机会网络的群智计算在线任务分配方法
CN111798097B (zh) 一种基于市场机制的自主移动机器人任务分配处理方法
CN114415735A (zh) 面向动态环境的多无人机分布式智能任务分配方法
CN106611382A (zh) 一种基于布谷鸟搜索算法解决作业车间工艺瓶颈问题
Heap et al. Repeated sequential single-cluster auctions with dynamic tasks for multi-robot task allocation with pickup and delivery
CN117196169A (zh) 一种基于深度强化学习的机位调度方法
Qu et al. Dynamic scheduling in modern processing systems using expert-guided distributed reinforcement learning
Lin et al. Research on PSO based multiple UAVs real-time task assignment
Ahmed et al. MARL based resource allocation scheme leveraging vehicular cloudlet in automotive-industry 5.0
CN109636709A (zh) 一种适用于异构平台的图计算方法
Zu et al. Research on UAV path planning method based on improved HPO algorithm in multi-task environment
CN110780947B (zh) 用于社交图数据的PageRank并行计算加速方法
CN109886574B (zh) 一种基于改进阈值法的多机器人任务分配方法
Dong et al. Multi-target dynamic hunting strategy based on improved k-means and auction algorithm
Chen et al. NECTAR‐An Agent‐Based Dynamic Task Allocation Algorithm in the UAV Swarm
CN115689184A (zh) 一种基于共识的捆绑算法的分布式任务分配方法
CN116089083A (zh) 一种多目标数据中心资源调度方法
Khosravi et al. Cooperative control for multi-target interception with sensing and communication limitations: A game-theoretic approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20211228