CN115617071A - 一种量子雪豹机制的多无人机任务规划方法 - Google Patents

一种量子雪豹机制的多无人机任务规划方法 Download PDF

Info

Publication number
CN115617071A
CN115617071A CN202211224098.XA CN202211224098A CN115617071A CN 115617071 A CN115617071 A CN 115617071A CN 202211224098 A CN202211224098 A CN 202211224098A CN 115617071 A CN115617071 A CN 115617071A
Authority
CN
China
Prior art keywords
task
unmanned aerial
quantum
aerial vehicle
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211224098.XA
Other languages
English (en)
Inventor
高洪元
赵海军
孙志国
孙贺麟
王钦弘
李慧爽
刘凯龙
白浩川
狄妍岐
郭颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202211224098.XA priority Critical patent/CN115617071A/zh
Publication of CN115617071A publication Critical patent/CN115617071A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明设计了量子雪豹机制的多无人机对抗任务规划方法,每个目标都有三个任务:勘察,袭击和评估,三个任务严格按照时间顺序执行。为了实现三种任务的时间耦合,本发明设计了协同对抗和独立对抗并行使用的战斗方略,有效解决了时间约束问题。本发明设计的量子编码的雪豹量子位置演化机制,得到一种新的量子雪豹机制方法,量子雪豹中的移动追踪策略用于全局搜索,狩猎策略用于局部搜索,种群繁衍和灭绝策略用于淘汰劣等量子雪豹个体,三种策略协同优化适应度函数,克服了过去方法容易陷入局部收敛的弊端,也提升了演化机制的寻优速率。

Description

一种量子雪豹机制的多无人机任务规划方法
技术领域
本发明属于无人机任务规划领域,具体涉及一种量子雪豹机制的多无人机任务规划方法。
背景技术
1927年单翼无人机的出现在世界范围内引起了极大的轰动,标志着自人类第一次飞行以来航空技术发展的又一个里程碑。无人机是一种动力、可控、能够执行各种任务的无人机。一般来说,这些车辆要么由嵌入式计算机控制,要么由飞行员操作远程控制。目前,无人机不断发展成熟,已广泛应用于农业、搜救、环境监测领域等领域。无人机具有成本低、灵活性好、部署方便、续航时间长等优点。它是代替有人驾驶飞机执行勘察、巡航和其他任务的最佳选择。
多无人机协同任务分配是指在多个特定约束条件下,以实现目标函数最优为目的,对多架无人机分配对抗任务,从而确定最优任务分配方案。无人机集群任务分配有多种任务分配方式。按照无人机执行任务分配的控制方式,又可以分为集中式控制、分布式控制和分层分布式控制。本发明采用集中式控制方法执行多无人机的对抗任务分配。
根据已有文献发现,吴蔚楠等在《控制与决策》(2017,32(9):1574-1582)上发表的“基于SEAD任务特性约束的协同任务分配方法”中,使用多架异构无人机执行目标压制任务,每架无人机的参数都不同,并建立了多无人机协同对抗模型。为了优化该模型,作者采用了分布式遗传方法优化目标函数。然而,该方法中无人机的目标过少,并且没有考虑任务执行时间,这是不符合现实的,不足以证明该方法的优越性。采用的分布式遗传方法也存在易陷入局部收敛的弊端。
综上所述,上述文献在多无人机的博弈任务上做出一定的贡献,但是对目标压制任务中目标的数量过少,且考虑问题不全面。因此本发明设计了一种量子雪豹机制的多无人机任务规划方法,使用量子雪豹方法优化目标函数,克服了以往优化方法易陷入局部收敛的问题。在博弈任务数量上增加到55个,并考虑了任务执行时间等其他任务属性。然而在复杂的约束条件中优化目标函数是很难的,因此本发明设计了协同与独立博弈并行使用的策略方法,以及惩罚函数法。将复杂的有约束条件问题转换成无约束条件问题,使运算难度减少。在无人机种类上,分为监察无人机,对抗无人机以及投掷无人机,实现了多种无人机协同对抗和独立对抗并用的战斗方略。
发明内容
本发明的目的在于提供一种量子雪豹机制的多无人机任务规划方法。
本发明的目的通过如下技术方案来实现:
一种量子雪豹机制的多无人机任务规划方法,步骤如下:
步骤一,建立多无人机对抗博弈任务规划模型;
步骤二,初始量子雪豹的量子位置并设定参数;
步骤三,计算量子雪豹位置的适应度函数值;
步骤四,使用移动追踪策略更新量子雪豹的量子位置;
步骤五,使用狩猎策略更新量子雪豹的量子位置;
步骤六,使用种群繁衍和灭绝策略更新量子雪豹的量子位置;
步骤七,判断是否达到量子雪豹的最大迭代次数K2,是则终止迭代,将最优量子雪豹的位置映射为勘察任务分配矩阵并输出;否则令k=k+1,继续执行步骤四。
进一步地,步骤一具体如下:
假设有N架无人机执行目标压制任务,无人机的集合定义为U={U1,U2,…,UN},其中包括N1架监察无人机,N2架对抗无人机和N3架投掷无人机,因此满足N=N1+N2+N3;对抗博弈任务目标集合为T={T1,T2,…,TM},其中,目标Tm代表第m个地面目标的任务集合Tm={sm,am,em},其中,m=1,2,…,M,sm为目标Tm的勘察任务,am为目标Tm的袭击任务,em为目标Tm的评估任务;监察无人机可以执行目标的勘察任务和评估任务;对抗无人机可以执行勘察任务、袭击任务和评估任务;投掷无人机只能执行袭击任务;
由上可知,监察无人机和对抗无人机可以执行勘察任务,则勘察任务分配矩阵为
Figure BDA0003877088920000021
其中,前N1架无人机为监察无人机,后N2架无人机为对抗无人机,
Figure BDA0003877088920000022
表示无人机Un执行勘察任务sm
Figure BDA0003877088920000023
表示无人机Un不执行勘察任务sm;获得勘察任务分配矩阵后,所有无人机都接到了自己的勘察任务指令,无人机始终保持最近目标优先原则,即在基地飞向最近的目标,执行完该目标的勘察任务后,则飞向离该目标最近的目标,这时的勘察任务执行顺序就是无人机的任务规划矩阵,袭击和评估任务的任务规划矩阵计算原理与其一致;假设由Xs知无人机Un需要执行ζn个勘察任务,则无人机Un的勘察任务规划矩阵为
Figure BDA0003877088920000024
其中,
Figure BDA0003877088920000025
的值代表无人机Un第几个执行勘察任务sm
Figure BDA0003877088920000026
值越小,越先执行该任务;特别地,
Figure BDA0003877088920000027
时表示无人机Un不执行勘察任务sm
由于对抗无人机和投掷无人机可以执行袭击任务,则袭击任务分配矩阵为
Figure BDA0003877088920000031
其中,前N2架无人机为对抗无人机,后N3架无人机为投掷无人机,
Figure BDA0003877088920000032
表示无人机
Figure BDA0003877088920000033
执行袭击任务am
Figure BDA0003877088920000034
表示无人机
Figure BDA0003877088920000035
不执行袭击任务am;获得袭击任务分配矩阵后,所有无人机都接到了自己的袭击任务指令,假设由Xa知无人机
Figure BDA0003877088920000036
需要执行
Figure BDA0003877088920000037
个袭击任务,则无人机
Figure BDA0003877088920000038
的袭击任务规划矩阵为
Figure BDA0003877088920000039
其中,
Figure BDA00038770889200000310
的值代表无人机
Figure BDA00038770889200000311
第几个执行攻袭击任务am
Figure BDA00038770889200000312
值越小,越先执行该任务。特别地,
Figure BDA00038770889200000313
时表示无人机
Figure BDA00038770889200000314
不执行袭击任务am
由于监察无人机和对抗无人机可以执行评估任务,则评估任务分配矩阵为
Figure BDA00038770889200000315
其中,前N1架无人机为监察无人机,后N2架无人机为对抗无人机,
Figure BDA00038770889200000316
表示无人机
Figure BDA00038770889200000317
执行评估任务em
Figure BDA00038770889200000318
表示无人机
Figure BDA00038770889200000319
不执行评估任务em;获得评估任务分配矩阵后,所有无人机都接到了自己的评估任务指令;假设由Xe知无人机
Figure BDA00038770889200000320
需要执行
Figure BDA00038770889200000321
个评估任务,由无人机
Figure BDA00038770889200000322
的评估任务规划矩阵为
Figure BDA00038770889200000323
其中,
Figure BDA00038770889200000324
的值代表无人机
Figure BDA00038770889200000325
第几个执行评估任务em
Figure BDA00038770889200000326
值越小,越先执行该任务;特别地,
Figure BDA00038770889200000327
时表示无人机
Figure BDA00038770889200000328
不执行评估任务em
建立最小优化模型为:
Figure BDA00038770889200000329
其中,m=1,2,…,M,
Figure BDA00038770889200000330
表示评估任务em的结束时间;在对抗博弈任务中,要严格按照勘察-袭击-评估的顺序执行目标任务,袭击任务不能先于勘察任务执行,评估任务不能先于勘察和袭击任务执行;因此计算最大评估任务结束时间,也就是计算模型的结束时间;
建立的模型中需要满足以下约束条件:(1)勘察任务约束条件:
Figure BDA00038770889200000331
表示每个勘察任务都只能被一架无人机执行;(2)袭击任务约束条件:
Figure BDA00038770889200000332
Figure BDA00038770889200000333
(3)袭击任务约束条件:
Figure BDA00038770889200000334
(4)无人机的勘察约束条件:
Figure BDA0003877088920000041
表示限制无人机Un的勘察任务数量;(5)无人机的袭击约束条件:
Figure BDA0003877088920000042
表示限制无人机
Figure BDA0003877088920000043
的袭击任务数量;(6)无人机的评估约束条件:
Figure BDA0003877088920000044
表示限制无人机
Figure BDA0003877088920000045
的袭击任务数量,其中,
Figure BDA0003877088920000046
表示向上取整函数,θ为任务均衡因子;(7)任务时间关系:
Figure BDA0003877088920000047
其中,
Figure BDA0003877088920000048
Figure BDA0003877088920000049
表示侦勘察任务sm的结束时间和开始时间,
Figure BDA00038770889200000410
表示勘察任务sm的执行时间,
Figure BDA00038770889200000411
Figure BDA00038770889200000412
表示攻袭击任务sa的结束时间和开始时间,
Figure BDA00038770889200000413
表示袭击任务sa的执行时间,
Figure BDA00038770889200000414
Figure BDA00038770889200000415
表示评估任务se的结束时间和开始时间,
Figure BDA00038770889200000416
表示评估任务se的执行时间;(8)任务时间约束条件:
Figure BDA00038770889200000417
表示按照勘察-袭击-评估的顺序执行目标Tm的任务;
对抗无人机可以执行目标的勘察任务、袭击任务和评估任务,其可以独立完成目标任务,故采用独立策略,采用该策略的对抗无人机在按勘察-袭击-评估顺序执行目标的所有任务后,再飞向下一个目标继续执行任务;而监察无人机可以执行勘察任务和评估任务,投掷无人机可以执行袭击任务,二者均不能独立完成任务,故采用协同对抗的形式,俩架无人机通过合作完成单个目标的所有任务;这种策略可以使袭击任务分配矩阵和评估任务分配矩阵通过勘察任务分配矩阵表示,而不需要优化三个任务分配矩阵;这时,袭击任务分配矩阵中元素为
Figure BDA00038770889200000418
无人机Un袭击任务规划矩阵中元素为
Figure BDA00038770889200000419
评估任务分配矩阵中元素为
Figure BDA00038770889200000420
无人机Un评估任务规划矩阵中元素为
Figure BDA00038770889200000421
其中,m=1,2,…,M,n=1,2,…N1+N2,由上可知,监察无人机和投掷无人机的数目要相等,即N1=N3
假设对抗无人机Un按照顺序执行目标T1,T2,…,Tm中的任务,对抗无人机Un首先从基地飞向目标T1,在到达指定位置后,开始执行目标的勘察任务s1,这时勘察任务s1的开始时间为
Figure BDA00038770889200000422
其中,
Figure BDA00038770889200000423
为对抗无人机的飞行速度,d0,1为无人机基地和目标T1之间的距离,则勘察任务s1的结束时间为
Figure BDA0003877088920000051
在执行完分类任务后,采用独立对抗策略的对抗无人机Un直接执行目标T1的袭击任务a1,这时目标T1的袭击任务s1开始时间为
Figure BDA0003877088920000052
结束时间为
Figure BDA0003877088920000053
目标T1的评估任务e1开始时间为
Figure BDA0003877088920000054
结束时间为
Figure BDA0003877088920000055
对抗无人机Un执行完目标T1的所有任务后,会径直飞向目标T2执行勘察任务s2,这时勘察任务s2的开始时间为
Figure BDA0003877088920000056
其中,d1,2为目标T1和目标T2之间的距离,勘察任务s2的结束时间为
Figure BDA0003877088920000057
执行勘察任务s2后,无人机Un继续执行袭击任务a2,其开始时间为
Figure BDA0003877088920000058
结束时间为
Figure BDA0003877088920000059
评估任务e2的开始时间和结束时间分别为
Figure BDA00038770889200000510
Figure BDA00038770889200000511
假设监察无人机Un和投掷无人机Un需要按照顺序执行目标T1,T2,…,Tm中的任务,则监察无人机Un和投掷无人机
Figure BDA00038770889200000512
同时从基地飞向目标T1,首先由监察无人机Un执行目标的勘察任务s1,这时勘察任务s1的开始时间为
Figure BDA00038770889200000513
其中,
Figure BDA00038770889200000514
为勘察无人机
Figure BDA00038770889200000515
的速度;勘察任务s1的结束时间为
Figure BDA00038770889200000516
协同策略是一架监察无人机和一架投掷无人机合作完成目标的所有任务,目标T1的袭击任务a1开始时间,有俩种情况,第一种情况是监察无人机Un完成目标T1的勘察任务s1后,投掷无人机
Figure BDA00038770889200000517
还没有到达指定位置,这时目标T1的袭击任务a1开始时间为
Figure BDA00038770889200000518
其中,
Figure BDA00038770889200000519
为投掷无人机
Figure BDA00038770889200000520
的飞行速度;第二种情况是,投掷无人机
Figure BDA00038770889200000521
到达指定位置后,监察无人机Un还没有完成目标T1的勘察任务s1,这时目标T1的袭击任务a1开始时间为
Figure BDA00038770889200000522
目标T1的袭击任务a1结束时间为
Figure BDA00038770889200000523
投掷无人机
Figure BDA00038770889200000524
在完成目标T1的袭击任务a1后,会直接飞行目标T2,准备执行目标T2的袭击任务a2,而监察无人机继续执行目标T1的评估任务e1,目标T1的评估任务e1开始时间和结束时间分别为
Figure BDA00038770889200000525
当目标T1的所有任务执行完毕时,监察无人机也飞向目标T2执行勘察任务s2,勘察任务s2的开始时间为
Figure BDA00038770889200000526
结束时间为
Figure BDA00038770889200000527
同样,目标T2的袭击任务a1开始时间也存在两种情况,第一种情况是监察无人机Un完成目标T2的勘察任务s2后,投掷无人机
Figure BDA00038770889200000528
还没有到达指定位置,这时目标T2的袭击任务a2开始时间为
Figure BDA0003877088920000061
第二种情况是,投掷无人机
Figure BDA0003877088920000062
到达指定位置后,监察无人机Un还没有完成目标T2的勘察任务s2,这时目标T2的袭击任务a2开始时间为
Figure BDA0003877088920000063
目标T2的袭击任务a2结束时间为
Figure BDA0003877088920000064
评估任务e2的开始时间和结束时间分别为
Figure BDA0003877088920000065
Figure BDA0003877088920000066
由上可知,独立策略和协同策略并行使用的方法,同样满足了(7)和(8)约束条件,现在只剩下约束条件(1)和(4)没有简化,因此,引入了惩罚函数方法,将约束条件(1)和(4)转化为惩罚项引入到目标函数中;由惩罚函数方法原理,约束条件(1)可以转化为
Figure BDA0003877088920000067
约束条件(4)可以转化为
Figure BDA0003877088920000068
其中α1和α2为约束条件的权值因子,
Figure BDA0003877088920000069
表示向上取整函数;
建立的最小优化模型可简化为:
Figure BDA00038770889200000610
进一步地,步骤二具体如下:
设置种群规模为K1,最大迭代次数为K2;在初始种群中,随机初始量子雪豹的量子位置,第i只量子雪豹的第1代初始量子位置为
Figure BDA00038770889200000611
Figure BDA00038770889200000612
其中S是量子位置向量的最大维数,所有量子位置的任一维都是[0,1]之间的随机数,量子雪豹的位置可通过量子位置测量得到。第k次迭代中第i只量子雪豹的量子位置为
Figure BDA00038770889200000613
则根据测量规则可以得到第k次迭代中第i只量子雪豹的位置为
Figure BDA00038770889200000614
测量规则为
Figure BDA00038770889200000615
表示第i只量子雪豹位置的第h维变量,
Figure BDA00038770889200000616
为[0,1]之间的随机数,h=1,2,…,S。
进一步地,步骤三具体如下:
第k代第i只量子雪豹的位置
Figure BDA00038770889200000617
均对应一个多无人机对抗博弈任务规划的勘察任务分配矩阵,具体:将
Figure BDA00038770889200000618
Figure BDA00038770889200000619
对应勘察任务分配矩阵中第一行的
Figure BDA00038770889200000620
对应勘察任务分配矩阵中第二行的x2,1,x2,2,…,x2,M;以此类推,
Figure BDA0003877088920000071
对应勘察任务分配矩阵中最后一行的
Figure BDA0003877088920000072
构成的任务分配矩阵记作
Figure BDA0003877088920000073
因此,最大维数S要满足S=(N1+N2)·M;
将第k次迭代第i只量子雪豹的位置
Figure BDA0003877088920000074
映射为勘察任务分配矩阵
Figure BDA0003877088920000075
得到第k次迭代第i只量子雪豹的适应度函数值
Figure BDA0003877088920000076
通过适应度函数值找到第k次迭代量子雪豹群中的最优个体
Figure BDA0003877088920000077
进一步地,步骤四具体如下:
根据移动追踪策略来更新量子雪豹的量子位置,第
Figure BDA0003877088920000078
次迭代第i只量子雪豹的第h维量子旋转角为
Figure BDA0003877088920000079
其中,h=1,2,…,S,
Figure BDA00038770889200000710
Figure BDA00038770889200000711
跟踪的第ε个量子雪豹的第h维量子位置,
Figure BDA00038770889200000712
γ为[0,1]之间的随机数,γ1为[0,γ]之间的随机数,
Figure BDA00038770889200000713
Figure BDA00038770889200000714
的适应度函数值,
Figure BDA00038770889200000715
Figure BDA00038770889200000716
的适应度函数值,sign(·)为符号函数,当符号函数中的变量大于0时,函数值为1,变量小于0时,函数值为-1,变量等于0时,函数值为0;
利用量子旋转门更新第i只量子雪豹个体的第h维量子位置:
Figure BDA00038770889200000717
根据测量规则对量子位置
Figure BDA00038770889200000718
的每一维测量得到位置
Figure BDA00038770889200000719
然后计算
Figure BDA00038770889200000720
的适应度函数值
Figure BDA00038770889200000721
并对个体
Figure BDA00038770889200000722
进行赋值,赋值规则如下
Figure BDA00038770889200000723
进一步地,步骤五具体如下:
在狩猎策略中,量子雪豹会锁定猎物的位置,然后发动猛袭,假设第i只量子雪豹的猎物为
Figure BDA00038770889200000724
则第i只量子雪豹的第h维量子旋转角为
Figure BDA00038770889200000725
其中,
Figure BDA00038770889200000726
Figure BDA00038770889200000727
的第h维量子位置,P为狩猎参数,sign(·)为符号函数,函数取值规则与步骤四中的符号函数相同;
利用量子旋转门更新第i只量子雪豹个体的第h维量子位置:
Figure BDA0003877088920000081
然后计算
Figure BDA0003877088920000082
的适应度函数值
Figure BDA0003877088920000083
并对个体
Figure BDA0003877088920000084
进行赋值,赋值规则如下
Figure BDA0003877088920000085
进一步地,步骤六具体如下:
在量子雪豹种群中,量子雪豹可能会因为没有捕捉到猎物而饿死,或者成功捕猎后繁衍后代,这个更新策略模拟了北极的严酷条件。在量子雪豹种群中,适应度函数排名在最后K3个量子雪豹将被淘汰,取而代之的是前K3个量子雪豹繁衍出的新量子位置;这时,第i只劣等量子雪豹新量子位置的为第h维变量为
Figure BDA0003877088920000086
Figure BDA0003877088920000087
且ε在[1,K3]之间随机取值。
本发明的有益效果在于:
(1)现有技术中,没有说明的三种任务的执行时间以及引入约束条件较少等,考虑问题不全面。本发明建立的模型设计了8个约束条件,考虑的因素更加丰富,使研究的问题更有现实意义
(2)本发明设计了协同策略与独立策略并行使用的方法,将原本需要满足约束条件(1-8)的模型,简化成只需要满足约束条件(1)和(4)的模型。在协同策略与独立策略并行使用的方法基础上,本发明设计了惩罚函数法,使约束条件(1)和(4)转化成惩罚项代入到模型中,将原本复杂的多约束条件问题转化为无约束条件问题。使问题的复杂度降低,减少了运算量。
本发明设计了量子编码的雪豹量子位置演化机制,得到一种新的量子雪豹机制方法,量子雪豹中的移动追踪策略用于全局搜索,狩猎策略用于局部搜索,种群繁衍和灭绝策略用于淘汰劣等量子雪豹个体,三种策略协同优化适应度函数,克服了过去方法容易陷入局部收敛的弊端,也提升了演化机制的寻优速率。
附图说明
图1为本发明设计的基于量子雪豹机制的多无人机对抗博弈任务规划方法示意图;
图2为M=9的目标位置分布;
图3为M=18的目标位置分布;
图4为M=30的目标位置分布;
图5为N=4,M=9的目标函数收敛曲线;
图6为N=8,M=18的目标函数收敛曲线。
具体实施方式
下面结合附图对本发明做进一步描述。
将量子雪豹优化方法记为QSLO,将改进的两阶段狼群搜索方法记为MTWPS,为了验证基于量子雪豹机制的多无人机对抗博弈任务规划方法的性能,本发明进行了三组仿真测试以及两个收敛曲线仿真图。设置种群规模为K1=100,α1=20,α2=5,P=0.375,目标随机分布于5km×5km的区域中,假设所有无人机全程以一个速度飞行,监察无人机速度为70m/s,对抗无人机速度为80m/s,投掷无人机速度为60m/s,这些无人机同时同地出发,无人机基地位置为(2500,0),单位是m。勘察任务执行时间为Δts=5s,袭击任务执行时间为Δta=10s,评估任务执行时间为Δte=5s。表1给出了三组实验中无人机与目标的规模
表1无人机与目标的规模
Figure BDA0003877088920000091
在第一组实验中,N=4架无人机执行M=9个目标任务。无人机的种类信息为表2所示,目标位置如图2所示。设置种群规模为K1=100,迭代次数为K2=200。表2给出了QSLO方法和MTWPS方法最优解映射出的任务规划方案。在简单规模中,两种方法均可以达到最优,得到任务最佳规划方案。值得说明的是,无人机U4为投掷无人机,故任务规划矩阵与监察无人机U1相同。
表2 QSLO方法和MTWPS方法最优解映射出的任务规划方案
Figure BDA0003877088920000101
在第二组实验中,N=8架无人机执行M=18个目标任务。无人机的种类信息为表2所示,目标位置如图3所示。设置种群规模为K1=100,迭代次数为K2=200。表3给出了QSLO方法和MTWPS方法最优解映射出的任务规划方案。在该规模下,QSLO方法生成的最优解要优于MTWPS方法生成的最优解。值得说明的是,无人机U7和U8为投掷无人机,故任务规划矩阵分别与监察无人机U1和U2相同。
表3 QSLO方法和MTWPS方法最优解映射出的任务规划方案
Figure BDA0003877088920000102
在第三组实验中,N=8架无人机执行M=18个目标任务。无人机的种类信息为表2所示,目标位置如图4所示。设置种群规模为K1=100,迭代次数为K2=200。表4给出了QSLO方法和MTWPS方法最优解映射出的任务规划方案。在该规模下,QSLO方法生成的最优解要优于MTWPS方法生成的最优解。而且在规模逐渐增加下,QSLO方法生成的最优解与MTWPS方法生成的最优解差距越来越大。值得说明的是,无人机U10、U11和U12为投掷无人机,故任务规划矩阵分别与监察无人机U1、U2和U3相同。
表4 QSLO方法和MTWPS方法最优解映射出的任务规划方案
Figure BDA0003877088920000111
为了进一步验证QSLO方法的收敛性,选择MTWPS方法进行对比仿真,收敛性分析如图5和图6所示,图5是在N=4,M=9的规模上,设置迭代次数为K2=100,种群规模为K1=100,进行200次独立重复实验,仿真结果取平均值。图6是在N=8,M=18的规模上,设置迭代次数为K2=200,种群规模为K1=100,进行200次独立重复实验,仿真结果取平均值。可以看出,QSLO方法的收敛性能明显优于MTWPS方法。
下面结合附图与具体实施方式对本发明作进一步详细描述。
步骤一,建立多无人机对抗博弈任务规划模型。
假设有N架无人机执行目标压制任务,无人机的集合定义为U={U1,U2,…,UN},其中包括N1架监察无人机,N2架对抗无人机和N3架投掷无人机,因此满足N=N1+N2+N3。对抗博弈任务目标集合为T={T1,T2,…,TM},其中,目标Tm代表第m个地面目标的任务集合Tm={sm,am,em},其中,m=1,2,…,M,sm为目标Tm的勘察任务,am为目标Tm的袭击任务,em为目标Tm的评估任务。值得注意的是,监察无人机可以执行目标的勘察任务和评估任务;对抗无人机可以执行勘察任务、袭击任务和评估任务;投掷无人机只能执行袭击任务。
由上可知,监察无人机和对抗无人机可以执行勘察任务,则勘察任务分配矩阵为
Figure BDA0003877088920000121
其中,前N1架无人机为监察无人机,后N2架无人机为对抗无人机,
Figure BDA0003877088920000122
表示无人机Un执行勘察任务sm
Figure BDA0003877088920000123
表示无人机Un不执行勘察任务sm。获得勘察任务分配矩阵后,所有无人机都接到了自己的勘察任务指令,无人机始终保持最近目标优先原则,即在基地飞向最近的目标,执行完该目标的勘察任务后,则飞向离该目标最近的目标,这时的勘察任务执行顺序就是无人机的任务规划矩阵,袭击和评估任务的任务规划矩阵计算原理与其一致。假设由Xs知无人机Un需要执行ζn个勘察任务,则无人机Un的勘察任务规划矩阵为
Figure BDA0003877088920000124
其中,
Figure BDA0003877088920000125
的值代表无人机Un第几个执行勘察任务sm
Figure BDA0003877088920000126
值越小,越先执行该任务。特别地,
Figure BDA0003877088920000127
时表示无人机Un不执行勘察任务sm
由于对抗无人机和投掷无人机可以执行袭击任务,则袭击任务分配矩阵为
Figure BDA0003877088920000128
其中,前N2架无人机为对抗无人机,后N3架无人机为投掷无人机,
Figure BDA0003877088920000129
表示无人机Un执行袭击任务am
Figure BDA00038770889200001210
表示无人机
Figure BDA00038770889200001211
不执行袭击任务am。获得袭击任务分配矩阵后,所有无人机都接到了自己的袭击任务指令,假设由Xa知无人机
Figure BDA00038770889200001212
需要执行
Figure BDA00038770889200001213
个袭击任务,则无人机
Figure BDA00038770889200001214
的袭击任务规划矩阵为
Figure BDA00038770889200001215
其中,
Figure BDA00038770889200001216
的值代表无人机
Figure BDA00038770889200001217
第几个执行攻袭击任务am
Figure BDA00038770889200001218
值越小,越先执行该任务。特别地,
Figure BDA00038770889200001219
时表示无人机
Figure BDA00038770889200001220
不执行袭击任务am
由于监察无人机和对抗无人机可以执行评估任务,则评估任务分配矩阵为
Figure BDA00038770889200001221
其中,前N1架无人机为监察无人机,后N2架无人机为对抗无人机,
Figure BDA00038770889200001222
表示无人机
Figure BDA00038770889200001223
执行评估任务em
Figure BDA00038770889200001224
表示无人机
Figure BDA00038770889200001225
不执行评估任务em。获得评估任务分配矩阵后,所有无人机都接到了自己的评估任务指令。假设由Xe知无人机
Figure BDA00038770889200001226
需要执行
Figure BDA0003877088920000131
个评估任务,由无人机
Figure BDA0003877088920000132
的评估任务规划矩阵为
Figure BDA0003877088920000133
其中,
Figure BDA0003877088920000134
的值代表无人机
Figure BDA0003877088920000135
第几个执行评估任务em
Figure BDA0003877088920000136
值越小,越先执行该任务。特别地,
Figure BDA0003877088920000137
时表示无人机
Figure BDA0003877088920000138
不执行评估任务em
本发明建立的最小优化模型为:
Figure BDA0003877088920000139
其中,m=1,2,…,M,
Figure BDA00038770889200001310
表示评估任务em的结束时间。在对抗博弈任务中,要严格按照勘察-袭击-评估的顺序执行目标任务,袭击任务不能先于勘察任务执行,评估任务不能先于勘察和袭击任务执行。因此计算最大评估任务结束时间,也就是计算模型的结束时间。
建立的模型中需要满足几个约束条件。(1)勘察任务约束条件:
Figure BDA00038770889200001311
表示每个勘察任务都只能被一架无人机执行。(2)袭击任务约束条件:
Figure BDA00038770889200001312
Figure BDA00038770889200001313
(3)袭击任务约束条件:
Figure BDA00038770889200001314
(4)无人机的勘察约束条件:
Figure BDA00038770889200001315
表示限制无人机Un的勘察任务数量。(5)无人机的袭击约束条件:
Figure BDA00038770889200001316
表示限制无人机
Figure BDA00038770889200001317
的袭击任务数量。(6)无人机的评估约束条件:
Figure BDA00038770889200001318
表示限制无人机
Figure BDA00038770889200001319
的袭击任务数量。其中,
Figure BDA00038770889200001320
表示向上取整函数,θ为任务均衡因子。(7)任务时间关系:
Figure BDA00038770889200001321
其中,
Figure BDA00038770889200001322
Figure BDA00038770889200001323
表示侦勘察任务sm的结束时间和开始时间,
Figure BDA00038770889200001324
表示勘察任务sm的执行时间,
Figure BDA00038770889200001325
Figure BDA00038770889200001326
表示攻袭击任务sa的结束时间和开始时间,
Figure BDA00038770889200001327
表示袭击任务sa的执行时间,
Figure BDA00038770889200001328
Figure BDA00038770889200001329
表示评估任务se的结束时间和开始时间,
Figure BDA00038770889200001330
表示评估任务se的执行时间。(8)任务时间约束条件:
Figure BDA00038770889200001331
表示按照勘察-袭击-评估的顺序执行目标Tm的任务。
对抗无人机可以执行目标的勘察任务、袭击任务和评估任务,其可以独立完成目标任务,故采用独立策略,采用该策略的对抗无人机在按勘察-袭击-评估顺序执行目标的所有任务后,再飞向下一个目标继续执行任务。而监察无人机可以执行勘察任务和评估任务,投掷无人机可以执行袭击任务,二者均不能独立完成任务,故采用协同对抗的形式,俩架无人机通过合作完成单个目标的所有任务。这种策略可以使袭击任务分配矩阵和评估任务分配矩阵通过勘察任务分配矩阵表示,而不需要优化三个任务分配矩阵。这时,袭击任务分配矩阵中元素为
Figure BDA0003877088920000141
无人机Un袭击任务规划矩阵中元素为
Figure BDA0003877088920000142
评估任务分配矩阵中元素为
Figure BDA0003877088920000143
无人机Un评估任务规划矩阵中元素为
Figure BDA0003877088920000144
其中,m=1,2,…,M,n=1,2,…N1+N2,由上可知,监察无人机和投掷无人机的数目要相等,即N1=N3。得益于该方法,原需要满足的(1-6)约束条件,现在只需要满足(1)和(4)约束条件。下面继续讨论该方法对约束条件(8)的效益。
假设对抗无人机Un按照顺序执行目标T1,T2,…,Tm中的任务,对抗无人机Un首先从基地飞向目标T1,在到达指定位置后,开始执行目标的勘察任务s1,这时勘察任务s1的开始时间为
Figure BDA0003877088920000145
其中,
Figure BDA0003877088920000146
为对抗无人机的飞行速度,d0,1为无人机基地和目标T1之间的距离,则勘察任务s1的结束时间为
Figure BDA0003877088920000147
在执行完分类任务后,采用独立对抗策略的对抗无人机Un直接执行目标T1的袭击任务a1,这时目标T1的袭击任务s1开始时间为
Figure BDA0003877088920000148
结束时间为
Figure BDA0003877088920000149
目标T1的评估任务e1开始时间为
Figure BDA00038770889200001410
结束时间为
Figure BDA00038770889200001411
对抗无人机Un执行完目标T1的所有任务后,会径直飞向目标T2执行勘察任务s2,这时勘察任务s2的开始时间为
Figure BDA00038770889200001412
其中,d1,2为目标T1和目标T2之间的距离,勘察任务s2的结束时间为
Figure BDA00038770889200001413
执行勘察任务s2后,无人机Un继续执行袭击任务a2,其开始时间为
Figure BDA00038770889200001414
结束时间为
Figure BDA00038770889200001415
评估任务e2的开始时间和结束时间分别为
Figure BDA00038770889200001416
Figure BDA00038770889200001417
依此类推,其他目标的任务开始时间和结束时间的都可以得到。
假设监察无人机Un和投掷无人机
Figure BDA00038770889200001418
需要按照顺序执行目标T1,T2,…,Tm中的任务,则监察无人机Un和投掷无人机
Figure BDA0003877088920000151
同时从基地飞向目标T1,首先由监察无人机Un执行目标的勘察任务s1,这时勘察任务s1的开始时间为
Figure BDA0003877088920000152
其中,
Figure BDA0003877088920000153
为勘察无人机
Figure BDA0003877088920000154
的速度。勘察任务s1的结束时间为
Figure BDA0003877088920000155
与独立策略不同,协同策略是一架监察无人机和一架投掷无人机合作完成目标的所有任务,由于监察无人机没有携带弹药,且体型较投掷无人机小,速度明显快于投掷无人机,因此涉及到追及问题。故目标T1的袭击任务a1开始时间,有俩种情况,第一种情况是监察无人机Un完成目标T1的勘察任务s1后,投掷无人机
Figure BDA0003877088920000156
还没有到达指定位置,这时目标T1的袭击任务a1开始时间为
Figure BDA0003877088920000157
其中,
Figure BDA0003877088920000158
为投掷无人机
Figure BDA0003877088920000159
的飞行速度;第二种情况是,投掷无人机
Figure BDA00038770889200001510
到达指定位置后,监察无人机Un还没有完成目标T1的勘察任务s1,这时目标T1的袭击任务a1开始时间为
Figure BDA00038770889200001511
目标T1的袭击任务a1结束时间为
Figure BDA00038770889200001512
投掷无人机
Figure BDA00038770889200001513
在完成目标T1的袭击任务a1后,会直接飞行目标T2,准备执行目标T2的袭击任务a2,而监察无人机继续执行目标T1的评估任务e1,目标T1的评估任务e1开始时间和结束时间分别为
Figure BDA00038770889200001514
当目标T1的所有任务执行完毕时,监察无人机也飞向目标T2执行勘察任务s2,勘察任务s2的开始时间为
Figure BDA00038770889200001515
结束时间为
Figure BDA00038770889200001516
同样,目标T2的袭击任务a1开始时间也存在两种情况,第一种情况是监察无人机Un完成目标T2的勘察任务s2后,投掷无人机
Figure BDA00038770889200001517
还没有到达指定位置,这时目标T2的袭击任务a2开始时间为
Figure BDA00038770889200001518
第二种情况是,投掷无人机
Figure BDA00038770889200001519
到达指定位置后,监察无人机Un还没有完成目标T2的勘察任务s2,这时目标T2的袭击任务a2开始时间为
Figure BDA00038770889200001520
目标T2的袭击任务a2结束时间为
Figure BDA00038770889200001521
评估任务e2的开始时间和结束时间分别为
Figure BDA00038770889200001522
Figure BDA00038770889200001523
依此类推,其他目标的任务开始时间和结束时间的都可以得到。
由上可知,独立策略和协同策略并行使用的方法,同样满足了(7)和(8)约束条件,现在只剩下约束条件(1)和(4)没有简化,因此,本发明引入了惩罚函数方法,将约束条件(1)和(4)转化为惩罚项引入到目标函数中。由惩罚函数方法原理,约束条件(1)可以转化为
Figure BDA0003877088920000161
约束条件(4)可以转化为
Figure BDA0003877088920000162
其中α1和α2为约束条件的权值因子,
Figure BDA0003877088920000163
表示向上取整函数。
得益于本发明设计的两种方法,有8个复杂约束条件的有约束问题转化为无约束问题。将两个惩罚项代入到目标函数中,本发明建立的最小优化模型可简化为:
Figure BDA0003877088920000164
步骤二,初始量子雪豹的量子位置并设定参数。
设置种群规模为K1,最大迭代次数为K2。在初始种群中,随机初始量子雪豹的量子位置,第i只量子雪豹的第1代初始量子位置为
Figure BDA0003877088920000165
Figure BDA0003877088920000166
其中S是量子位置向量的最大维数,所有量子位置的任一维都是[0,1]之间的随机数,量子雪豹的位置可通过量子位置测量得到。第k次迭代中第i只量子雪豹的量子位置为
Figure BDA0003877088920000167
则根据测量规则可以得到第k次迭代中第i只量子雪豹的位置为
Figure BDA0003877088920000168
测量规则为
Figure BDA0003877088920000169
表示第i只量子雪豹位置的第h维变量,
Figure BDA00038770889200001610
为[0,1]之间的随机数,h=1,2,…,S。
步骤三,计算量子雪豹位置的适应度函数值。
第k代第i只量子雪豹的位置
Figure BDA00038770889200001611
均对应一个多无人机对抗博弈任务规划的勘察任务分配矩阵,具体:将
Figure BDA00038770889200001612
Figure BDA00038770889200001613
对应勘察任务分配矩阵中第一行的
Figure BDA00038770889200001614
对应勘察任务分配矩阵中第二行的x2,1,x2,2,…,x2,M;以此类推,
Figure BDA00038770889200001615
对应勘察任务分配矩阵中最后一行的
Figure BDA00038770889200001616
构成的任务分配矩阵记作
Figure BDA00038770889200001617
因此,最大维数S要满足S=(N1+N2)·M。
将第k次迭代第i只量子雪豹的位置
Figure BDA00038770889200001618
映射为勘察任务分配矩阵
Figure BDA00038770889200001619
得到第k次迭代第i只量子雪豹的适应度函数值
Figure BDA00038770889200001620
通过适应度函数值找到第k次迭代量子雪豹群中的最优个体
Figure BDA00038770889200001621
步骤四,使用移动追踪策略更新量子雪豹的量子位置。
根据移动追踪策略来更新量子雪豹的量子位置。第
Figure BDA0003877088920000171
次迭代第i只量子雪豹的第h维量子旋转角为
Figure BDA0003877088920000172
其中,h=1,2,…,S,
Figure BDA0003877088920000173
Figure BDA0003877088920000174
跟踪的第ε个量子雪豹的第h维量子位置,
Figure BDA0003877088920000175
γ为[0,1]之间的随机数,γ1为[0,γ]之间的随机数,
Figure BDA0003877088920000176
Figure BDA0003877088920000177
的适应度函数值,
Figure BDA0003877088920000178
Figure BDA0003877088920000179
的适应度函数值,sign(·)为符号函数,当符号函数中的变量大于0时,函数值为1,变量小于0时,函数值为-1,变量等于0时,函数值为0。
利用量子旋转门更新第i只量子雪豹个体的第h维量子位置:
Figure BDA00038770889200001710
根据测量规则对量子位置
Figure BDA00038770889200001711
的每一维测量得到位置
Figure BDA00038770889200001712
然后计算
Figure BDA00038770889200001713
的适应度函数值
Figure BDA00038770889200001714
并对个体
Figure BDA00038770889200001715
进行赋值,赋值规则如下
Figure BDA00038770889200001716
步骤五,使用狩猎策略更新量子雪豹的量子位置。
在狩猎策略中,量子雪豹会锁定猎物的位置,然后发动猛袭,假设第i只量子雪豹的猎物为
Figure BDA00038770889200001717
则第i只量子雪豹的第h维量子旋转角为
Figure BDA00038770889200001718
其中,
Figure BDA00038770889200001719
Figure BDA00038770889200001720
的第h维量子位置,P为狩猎参数,sign(·)为符号函数,函数取值规则与步骤四中的符号函数相同。
利用量子旋转门更新第i只量子雪豹个体的第h维量子位置:
Figure BDA00038770889200001721
然后计算
Figure BDA00038770889200001722
的适应度函数值
Figure BDA00038770889200001723
并对个体
Figure BDA00038770889200001724
进行赋值,赋值规则如下
Figure BDA00038770889200001725
步骤六,使用种群繁衍和灭绝策略更新量子雪豹的量子位置。
在量子雪豹种群中,量子雪豹可能会因为没有捕捉到猎物而饿死,或者成功捕猎后繁衍后代,这个更新策略模拟了北极的严酷条件。在量子雪豹种群中,适应度函数排名在最后K3个量子雪豹将被淘汰,取而代之的是前K3个量子雪豹繁衍出的新量子位置。这时,第i只劣等量子雪豹新量子位置的为第h维变量为
Figure BDA0003877088920000181
Figure BDA0003877088920000182
且ε在[1,K3]之间随机取值。
步骤七,判断是否达到量子雪豹的最大迭代次数K2,是则终止迭代,将最优量子雪豹的位置映射为勘察任务分配矩阵并输出;否则令k=k+1,继续执行步骤四。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种量子雪豹机制的多无人机任务规划方法,其特征在于:步骤如下:
步骤一,建立多无人机对抗博弈任务规划模型;
步骤二,初始量子雪豹的量子位置并设定参数;
步骤三,计算量子雪豹位置的适应度函数值;
步骤四,使用移动追踪策略更新量子雪豹的量子位置;
步骤五,使用狩猎策略更新量子雪豹的量子位置;
步骤六,使用种群繁衍和灭绝策略更新量子雪豹的量子位置;
步骤七,判断是否达到量子雪豹的最大迭代次数K2,是则终止迭代,将最优量子雪豹的位置映射为勘察任务分配矩阵并输出;否则令k=k+1,继续执行步骤四。
2.权利要求1所述的一种量子雪豹机制的多无人机任务规划方法,其特征在于:步骤一具体如下:
假设有N架无人机执行目标压制任务,无人机的集合定义为U={U1,U2,…,UN},其中包括N1架监察无人机,N2架对抗无人机和N3架投掷无人机,因此满足N=N1+N2+N3;对抗博弈任务目标集合为T={T1,T2,…,TM},其中,目标Tm代表第m个地面目标的任务集合Tm={sm,am,em},其中,m=1,2,…,M,sm为目标Tm的勘察任务,am为目标Tm的袭击任务,em为目标Tm的评估任务;监察无人机可以执行目标的勘察任务和评估任务;对抗无人机可以执行勘察任务、袭击任务和评估任务;投掷无人机只能执行袭击任务;
由上可知,监察无人机和对抗无人机可以执行勘察任务,则勘察任务分配矩阵为
Figure FDA0003877088910000011
其中,前N1架无人机为监察无人机,后N2架无人机为对抗无人机,
Figure FDA0003877088910000012
表示无人机Un执行勘察任务sm
Figure FDA0003877088910000013
表示无人机Un不执行勘察任务sm;获得勘察任务分配矩阵后,所有无人机都接到了自己的勘察任务指令,无人机始终保持最近目标优先原则,即在基地飞向最近的目标,执行完该目标的勘察任务后,则飞向离该目标最近的目标,这时的勘察任务执行顺序就是无人机的任务规划矩阵,袭击和评估任务的任务规划矩阵计算原理与其一致;假设由Xs知无人机Un需要执行ζn个勘察任务,则无人机Un的勘察任务规划矩阵为
Figure FDA0003877088910000014
其中,
Figure FDA0003877088910000015
的值代表无人机Un第几个执行勘察任务sm
Figure FDA0003877088910000016
值越小,越先执行该任务;特别地,
Figure FDA0003877088910000017
时表示无人机Un不执行勘察任务sm
由于对抗无人机和投掷无人机可以执行袭击任务,则袭击任务分配矩阵为
Figure FDA0003877088910000021
其中,前N2架无人机为对抗无人机,后N3架无人机为投掷无人机,
Figure FDA0003877088910000022
表示无人机
Figure FDA0003877088910000023
执行袭击任务am
Figure FDA0003877088910000024
表示无人机
Figure FDA0003877088910000025
不执行袭击任务am;获得袭击任务分配矩阵后,所有无人机都接到了自己的袭击任务指令,假设由Xa知无人机
Figure FDA0003877088910000026
需要执行
Figure FDA0003877088910000027
个袭击任务,则无人机
Figure FDA0003877088910000028
的袭击任务规划矩阵为
Figure FDA0003877088910000029
其中,
Figure FDA00038770889100000210
的值代表无人机
Figure FDA00038770889100000211
第几个执行攻袭击任务am
Figure FDA00038770889100000212
值越小,越先执行该任务。特别地,
Figure FDA00038770889100000213
时表示无人机
Figure FDA00038770889100000214
不执行袭击任务am
由于监察无人机和对抗无人机可以执行评估任务,则评估任务分配矩阵为
Figure FDA00038770889100000215
其中,前N1架无人机为监察无人机,后N2架无人机为对抗无人机,
Figure FDA00038770889100000216
表示无人机
Figure FDA00038770889100000217
执行评估任务em
Figure FDA00038770889100000218
表示无人机
Figure FDA00038770889100000219
不执行评估任务em;获得评估任务分配矩阵后,所有无人机都接到了自己的评估任务指令;假设由Xe知无人机
Figure FDA00038770889100000220
需要执行
Figure FDA00038770889100000221
个评估任务,由无人机
Figure FDA00038770889100000222
的评估任务规划矩阵为
Figure FDA00038770889100000223
其中,
Figure FDA00038770889100000224
的值代表无人机
Figure FDA00038770889100000225
第几个执行评估任务em
Figure FDA00038770889100000226
值越小,越先执行该任务;特别地,
Figure FDA00038770889100000227
时表示无人机
Figure FDA00038770889100000228
不执行评估任务em
建立最小优化模型为:
Figure FDA00038770889100000229
其中,m=1,2,…,M,
Figure FDA00038770889100000230
表示评估任务em的结束时间;在对抗博弈任务中,要严格按照勘察-袭击-评估的顺序执行目标任务,袭击任务不能先于勘察任务执行,评估任务不能先于勘察和袭击任务执行;因此计算最大评估任务结束时间,也就是计算模型的结束时间;
建立的模型中需要满足以下约束条件:(1)勘察任务约束条件:
Figure FDA00038770889100000231
表示每个勘察任务都只能被一架无人机执行;(2)袭击任务约束条件:
Figure FDA00038770889100000232
Figure FDA00038770889100000233
(3)袭击任务约束条件:
Figure FDA00038770889100000234
(4)无人机的勘察约束条件:
Figure FDA0003877088910000031
表示限制无人机Un的勘察任务数量;(5)无人机的袭击约束条件:
Figure FDA0003877088910000032
表示限制无人机
Figure FDA0003877088910000033
的袭击任务数量;(6)无人机的评估约束条件:
Figure FDA0003877088910000034
表示限制无人机
Figure FDA0003877088910000035
的袭击任务数量,其中,
Figure FDA0003877088910000036
表示向上取整函数,θ为任务均衡因子;(7)任务时间关系:
Figure FDA0003877088910000037
其中,
Figure FDA0003877088910000038
Figure FDA0003877088910000039
表示侦勘察任务sm的结束时间和开始时间,
Figure FDA00038770889100000310
表示勘察任务sm的执行时间,
Figure FDA00038770889100000311
Figure FDA00038770889100000312
表示攻袭击任务sa的结束时间和开始时间,
Figure FDA00038770889100000313
表示袭击任务sa的执行时间,
Figure FDA00038770889100000314
Figure FDA00038770889100000315
表示评估任务se的结束时间和开始时间,
Figure FDA00038770889100000316
表示评估任务se的执行时间;(8)任务时间约束条件:
Figure FDA00038770889100000317
表示按照勘察-袭击-评估的顺序执行目标Tm的任务;
对抗无人机可以执行目标的勘察任务、袭击任务和评估任务,其可以独立完成目标任务,故采用独立策略,采用该策略的对抗无人机在按勘察-袭击-评估顺序执行目标的所有任务后,再飞向下一个目标继续执行任务;而监察无人机可以执行勘察任务和评估任务,投掷无人机可以执行袭击任务,二者均不能独立完成任务,故采用协同对抗的形式,俩架无人机通过合作完成单个目标的所有任务;这种策略可以使袭击任务分配矩阵和评估任务分配矩阵通过勘察任务分配矩阵表示,而不需要优化三个任务分配矩阵;这时,袭击任务分配矩阵中元素为
Figure FDA00038770889100000318
无人机Un袭击任务规划矩阵中元素为
Figure FDA00038770889100000319
评估任务分配矩阵中元素为
Figure FDA00038770889100000320
无人机Un评估任务规划矩阵中元素为
Figure FDA00038770889100000321
其中,m=1,2,…,M,n=1,2,…N1+N2,由上可知,监察无人机和投掷无人机的数目要相等,即N1=N3
假设对抗无人机Un按照顺序执行目标T1,T2,…,Tm中的任务,对抗无人机Un首先从基地飞向目标T1,在到达指定位置后,开始执行目标的勘察任务s1,这时勘察任务s1的开始时间为
Figure FDA00038770889100000322
其中,
Figure FDA00038770889100000323
为对抗无人机的飞行速度,d0,1为无人机基地和目标T1之间的距离,则勘察任务s1的结束时间为
Figure FDA0003877088910000041
在执行完分类任务后,采用独立对抗策略的对抗无人机Un直接执行目标T1的袭击任务a1,这时目标T1的袭击任务s1开始时间为
Figure FDA0003877088910000042
结束时间为
Figure FDA0003877088910000043
目标T1的评估任务e1开始时间为
Figure FDA0003877088910000044
结束时间为
Figure FDA0003877088910000045
对抗无人机Un执行完目标T1的所有任务后,会径直飞向目标T2执行勘察任务s2,这时勘察任务s2的开始时间为
Figure FDA0003877088910000046
其中,d1,2为目标T1和目标T2之间的距离,勘察任务s2的结束时间为
Figure FDA0003877088910000047
执行勘察任务s2后,无人机Un继续执行袭击任务a2,其开始时间为
Figure FDA0003877088910000048
结束时间为
Figure FDA0003877088910000049
评估任务e2的开始时间和结束时间分别为
Figure FDA00038770889100000410
Figure FDA00038770889100000411
假设监察无人机Un和投掷无人机
Figure FDA00038770889100000412
需要按照顺序执行目标T1,T2,…,Tm中的任务,则监察无人机Un和投掷无人机
Figure FDA00038770889100000413
同时从基地飞向目标T1,首先由监察无人机Un执行目标的勘察任务s1,这时勘察任务s1的开始时间为
Figure FDA00038770889100000414
其中,
Figure FDA00038770889100000415
为勘察无人机
Figure FDA00038770889100000416
的速度;勘察任务s1的结束时间为
Figure FDA00038770889100000417
协同策略是一架监察无人机和一架投掷无人机合作完成目标的所有任务,目标T1的袭击任务a1开始时间,有俩种情况,第一种情况是监察无人机Un完成目标T1的勘察任务s1后,投掷无人机
Figure FDA00038770889100000418
还没有到达指定位置,这时目标T1的袭击任务a1开始时间为
Figure FDA00038770889100000419
其中,
Figure FDA00038770889100000420
为投掷无人机
Figure FDA00038770889100000421
的飞行速度;第二种情况是,投掷无人机
Figure FDA00038770889100000422
到达指定位置后,监察无人机Un还没有完成目标T1的勘察任务s1,这时目标T1的袭击任务a1开始时间为
Figure FDA00038770889100000423
目标T1的袭击任务a1结束时间为
Figure FDA00038770889100000424
投掷无人机
Figure FDA00038770889100000425
在完成目标T1的袭击任务a1后,会直接飞行目标T2,准备执行目标T2的袭击任务a2,而监察无人机继续执行目标T1的评估任务e1,目标T1的评估任务e1开始时间和结束时间分别为
Figure FDA00038770889100000426
当目标T1的所有任务执行完毕时,监察无人机也飞向目标T2执行勘察任务s2,勘察任务s2的开始时间为
Figure FDA00038770889100000427
结束时间为
Figure FDA00038770889100000428
同样,目标T2的袭击任务a1开始时间也存在两种情况,第一种情况是监察无人机Un完成目标T2的勘察任务s2后,投掷无人机
Figure FDA00038770889100000429
还没有到达指定位置,这时目标T2的袭击任务a2开始时间为
Figure FDA0003877088910000051
第二种情况是,投掷无人机
Figure FDA0003877088910000052
到达指定位置后,监察无人机Un还没有完成目标T2的勘察任务s2,这时目标T2的袭击任务a2开始时间为
Figure FDA0003877088910000053
目标T2的袭击任务a2结束时间为
Figure FDA0003877088910000054
评估任务e2的开始时间和结束时间分别为
Figure FDA0003877088910000055
Figure FDA0003877088910000056
由上可知,独立策略和协同策略并行使用的方法,同样满足了(7)和(8)约束条件,现在只剩下约束条件(1)和(4)没有简化,因此,引入了惩罚函数方法,将约束条件(1)和(4)转化为惩罚项引入到目标函数中;由惩罚函数方法原理,约束条件(1)可以转化为
Figure FDA0003877088910000057
约束条件(4)可以转化为
Figure FDA0003877088910000058
其中α1和α2为约束条件的权值因子,
Figure FDA0003877088910000059
表示向上取整函数;
建立的最小优化模型可简化为:
Figure FDA00038770889100000510
3.权利要求1所述的一种量子雪豹机制的多无人机任务规划方法,其特征在于:步骤二具体如下:
设置种群规模为K1,最大迭代次数为K2;在初始种群中,随机初始量子雪豹的量子位置,第i只量子雪豹的第1代初始量子位置为
Figure FDA00038770889100000511
Figure FDA00038770889100000512
其中S是量子位置向量的最大维数,所有量子位置的任一维都是[0,1]之间的随机数,量子雪豹的位置可通过量子位置测量得到。第k次迭代中第i只量子雪豹的量子位置为
Figure FDA00038770889100000513
则根据测量规则可以得到第k次迭代中第i只量子雪豹的位置为
Figure FDA00038770889100000514
测量规则为
Figure FDA00038770889100000515
表示第i只量子雪豹位置的第h维变量,
Figure FDA00038770889100000516
为[0,1]之间的随机数,h=1,2,…,S。
4.权利要求1所述的一种量子雪豹机制的多无人机任务规划方法,其特征在于:步骤三具体如下:
第k代第i只量子雪豹的位置
Figure FDA00038770889100000517
均对应一个多无人机对抗博弈任务规划的勘察任务分配矩阵,具体:将
Figure FDA00038770889100000518
Figure FDA00038770889100000519
对应勘察任务分配矩阵中第一行的x1,1,x1,2,…,x1,M
Figure FDA0003877088910000061
对应勘察任务分配矩阵中第二行的x2,1,x2,2,…,x2,M;以此类推,
Figure FDA0003877088910000062
对应勘察任务分配矩阵中最后一行的
Figure FDA0003877088910000063
构成的任务分配矩阵记作
Figure FDA0003877088910000064
因此,最大维数S要满足S=(N1+N2)·M;
将第k次迭代第i只量子雪豹的位置
Figure FDA0003877088910000065
映射为勘察任务分配矩阵
Figure FDA0003877088910000066
得到第k次迭代第i只量子雪豹的适应度函数值
Figure FDA0003877088910000067
通过适应度函数值找到第k次迭代量子雪豹群中的最优个体
Figure FDA0003877088910000068
5.权利要求1所述的一种量子雪豹机制的多无人机任务规划方法,其特征在于:步骤四具体如下:
根据移动追踪策略来更新量子雪豹的量子位置,第
Figure FDA0003877088910000069
次迭代第i只量子雪豹的第h维量子旋转角为
Figure FDA00038770889100000610
其中,h=1,2,…,S,
Figure FDA00038770889100000611
Figure FDA00038770889100000612
跟踪的第ε个量子雪豹的第h维量子位置,
Figure FDA00038770889100000613
γ为[0,1]之间的随机数,γ1为[0,γ]之间的随机数,
Figure FDA00038770889100000614
Figure FDA00038770889100000615
的适应度函数值,
Figure FDA00038770889100000616
Figure FDA00038770889100000617
的适应度函数值,sign(·)为符号函数,当符号函数中的变量大于0时,函数值为1,变量小于0时,函数值为-1,变量等于0时,函数值为0;
利用量子旋转门更新第i只量子雪豹个体的第h维量子位置:
Figure FDA00038770889100000618
根据测量规则对量子位置
Figure FDA00038770889100000619
的每一维测量得到位置
Figure FDA00038770889100000620
然后计算
Figure FDA00038770889100000621
的适应度函数值
Figure FDA00038770889100000622
并对个体
Figure FDA00038770889100000623
进行赋值,赋值规则如下
Figure FDA00038770889100000624
6.权利要求1所述的一种量子雪豹机制的多无人机任务规划方法,其特征在于:步骤五具体如下:
在狩猎策略中,量子雪豹会锁定猎物的位置,然后发动猛袭,假设第i只量子雪豹的猎物为
Figure FDA00038770889100000625
则第i只量子雪豹的第h维量子旋转角为
Figure FDA00038770889100000626
其中,
Figure FDA00038770889100000627
Figure FDA00038770889100000628
的第h维量子位置,P为狩猎参数,sign(·)为符号函数,函数取值规则与步骤四中的符号函数相同;
利用量子旋转门更新第i只量子雪豹个体的第h维量子位置:
Figure FDA0003877088910000071
然后计算
Figure FDA0003877088910000072
的适应度函数值
Figure FDA0003877088910000073
并对个体
Figure FDA0003877088910000074
进行赋值,赋值规则如下
Figure FDA0003877088910000075
7.权利要求1所述的一种量子雪豹机制的多无人机任务规划方法,其特征在于:步骤六具体如下:
在量子雪豹种群中,量子雪豹可能会因为没有捕捉到猎物而饿死,或者成功捕猎后繁衍后代,这个更新策略模拟了北极的严酷条件。在量子雪豹种群中,适应度函数排名在最后K3个量子雪豹将被淘汰,取而代之的是前K3个量子雪豹繁衍出的新量子位置;这时,第i只劣等量子雪豹新量子位置的为第h维变量为
Figure FDA0003877088910000076
Figure FDA0003877088910000077
且ε在[1,K3]之间随机取值。
CN202211224098.XA 2022-10-07 2022-10-07 一种量子雪豹机制的多无人机任务规划方法 Pending CN115617071A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211224098.XA CN115617071A (zh) 2022-10-07 2022-10-07 一种量子雪豹机制的多无人机任务规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211224098.XA CN115617071A (zh) 2022-10-07 2022-10-07 一种量子雪豹机制的多无人机任务规划方法

Publications (1)

Publication Number Publication Date
CN115617071A true CN115617071A (zh) 2023-01-17

Family

ID=84861342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211224098.XA Pending CN115617071A (zh) 2022-10-07 2022-10-07 一种量子雪豹机制的多无人机任务规划方法

Country Status (1)

Country Link
CN (1) CN115617071A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115993843A (zh) * 2023-03-23 2023-04-21 西北工业大学深圳研究院 一种应用于群体智能系统的最优编队控制方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115993843A (zh) * 2023-03-23 2023-04-21 西北工业大学深圳研究院 一种应用于群体智能系统的最优编队控制方法

Similar Documents

Publication Publication Date Title
CN111722643B (zh) 仿狼群合作狩猎机制的无人机集群动态任务分配方法
CN110608743B (zh) 基于多种群混沌灰狼算法的多无人机协同航路规划方法
CN111176334B (zh) 一种多无人机协同目标搜索方法
CN113791634B (zh) 一种基于多智能体强化学习的多机空战决策方法
CN109190978B (zh) 一种基于量子鸟群演化机制的无人机资源分配方法
CN113009934A (zh) 一种基于改进粒子群算法的多无人机任务动态分配方法
CN107589663B (zh) 基于多步粒子群算法的无人机协同侦察覆盖方法
CN114442662B (zh) 基于改进狼群优化算法的无人机集群协同对地打击方法
CN112784445B (zh) 一种飞行控制智能体的并行分布式计算系统及方法
CN108459616B (zh) 基于人工蜂群算法的无人机群协同覆盖航路规划方法
CN110941283B (zh) 一种基于任务需求的异构无人机集群协同最优配置方法
CN108549402A (zh) 基于量子乌鸦群搜索机制的无人机群任务分配方法
CN114172942B (zh) 多无人机辅助物联网的协同任务分配与轨迹优化方法
CN109541960B (zh) 一种用于飞行器数字化战场对抗的系统和方法
CN112783209A (zh) 一种基于鸽群智能竞争学习的无人机集群对抗控制方法
Duan et al. Multiple UCAVs cooperative air combat simulation platform based on PSO, ACO, and game theory
CN110059932A (zh) 基于svm的对地攻击型无人机作战效能评估方法
Qingwen et al. Cooperative jamming resource allocation of UAV swarm based on multi-objective DPSO
CN111121784A (zh) 一种无人侦察机航路规划方法
CN115617071A (zh) 一种量子雪豹机制的多无人机任务规划方法
CN112363532A (zh) 一种基于quatre算法的多无人机同时起飞集结方法
CN115494873A (zh) 时序约束下一种基于蒙特卡洛树搜索架构的异构多无人机协同任务分配方法
CN116088586B (zh) 一种无人机作战过程中的临机任务规划的方法
CN113608546B (zh) 量子海狮机制的无人机群任务分配方法
CN115220473A (zh) 一种多无人机蜂群协同任务动态分配方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination