CN115562342A - 多飞行器任务分配、航迹规划和编队控制一体化博弈方法 - Google Patents
多飞行器任务分配、航迹规划和编队控制一体化博弈方法 Download PDFInfo
- Publication number
- CN115562342A CN115562342A CN202211300744.6A CN202211300744A CN115562342A CN 115562342 A CN115562342 A CN 115562342A CN 202211300744 A CN202211300744 A CN 202211300744A CN 115562342 A CN115562342 A CN 115562342A
- Authority
- CN
- China
- Prior art keywords
- unmanned aerial
- aerial vehicle
- task
- formation control
- partition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 113
- 238000013439 planning Methods 0.000 title claims abstract description 105
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000005192 partition Methods 0.000 claims abstract description 66
- 238000011217 control strategy Methods 0.000 claims abstract description 58
- 230000003993 interaction Effects 0.000 claims abstract description 17
- 230000007246 mechanism Effects 0.000 claims abstract description 6
- 230000008878 coupling Effects 0.000 claims abstract description 5
- 238000010168 coupling process Methods 0.000 claims abstract description 5
- 238000005859 coupling reaction Methods 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000010586 diagram Methods 0.000 claims description 18
- 238000012512 characterization method Methods 0.000 claims description 11
- 238000000638 solvent extraction Methods 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 5
- 238000013316 zoning Methods 0.000 claims description 4
- 238000005304 joining Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 239000003795 chemical substances by application Substances 0.000 claims description 2
- 230000002457 bidirectional effect Effects 0.000 abstract description 5
- 230000000875 corresponding effect Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000013486 operation strategy Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/101—Simultaneous control of position or course in three dimensions specially adapted for aircraft
- G05D1/104—Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明公开了一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法,包括:(1)建立单架无人机的动态模型、无人机分区、无人机的个体偏好和整个无人机集群的信息交互拓扑图;(2)建立任务分配、航迹规划和编队控制的一体化博弈框架并在该框架下为任务分配、航迹规划和编队控制三个环节设计相互耦合性能指标;(3)设计反向策略机制,遵循反向运行顺序,利用反馈信息优化各环节的性能指标并设计每个环节的最优博弈控制策略模型,解算每个环节的最优控制策略;(4)基于三个环节的最优控制策略遵循正向顺序运行获得优化的无人机任务分配、航迹规划和编队控制。本发明能够实现飞行器每个环节策略的双向调整,达到一体化博弈的纳什均衡。
Description
技术领域
本发明涉及多飞行器控制的技术领域,具体是涉及一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法。
背景技术
集群飞行器作为一类以通信耦合的网络系统,在军事和民用方面都发挥着重要作用,例如森林防火、敌情监测等。博弈论在集群飞行器的任务分配、航迹规划和编队控制三个核心环节中有着相当广泛地应用,以寻求更优的系统性能。例如:在任务分配环节,现有技术中通过建立匿名享乐博弈,研究具有社会性抑制特性的无人机,在尽可能减少合作成员的情况下,实施联盟切换准则,形成与任务匹配的Nash稳定的无人机分区。在航迹规划环节,现有技术基于非零和博弈,实现避障条件约束下的无人机期望飞行轨迹的规划。在编队控制环节,基于非合作博弈,可以实现领导者-跟随者模式的集群编队控制。
在现有的一些博弈框架下,针对集群飞行器的任务分配、航迹规划和编队控制三个环节的策略通常是分开独立设计的,这种独立设计主要是顺着任务分配→路径规划→编队控制的方向正向调节每个环节的性能,可称之为开环设计。然而这种开环设计忽略了各个环节之间的双向互动,无法建立反馈机制,难以根据实际情况对策略进行及时地调整。因此,亟需建立针对三个环节一体化的博弈机制,使得每个环节的性能可以双向可调。
发明内容
发明目的:针对以上缺点,本发明提供一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法,通过建立一体化博弈框架并在该一体化博弈框架下关联耦合三个环节之间的指标,并结合各环节的反馈信息实现三个环节的闭环设计,实现了每个环节策略的双向调整,最终达到一体化博弈的纳什均衡。
技术方案:为解决上述问题,本发明公开一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法,具体包括以下步骤:
(1)针对多飞行器系统,建立单架无人机的动态模型、无人机分区、无人机的个体偏好和整个无人机集群的信息交互拓扑图;
(2)建立任务分配、航迹规划和编队控制的一体化博弈框架;基于步骤(1)中建立的每架无人机模型、无人机分区、无人机个体偏好在一体化博弈框架下为每架无人机任务分配、航迹规划和编队控制三个环节分别设计性能指标且任务分配的性能指标、航迹规划的性能指标和编队控制的性能指标相互耦合;
(3)设计反向策略机制,遵循编队控制、航迹规划、任务分配的运行顺序,利用反馈信息优化各环节的性能指标并设计每架无人机于每个环节的最优博弈控制策略模型,计算获取每架无人机于每个环节的最优控制策略;所述的反馈信息包括编队控制环节输出的状态误差量、编队控制环节的最优控制输入、航迹规划环节的最优控制输入;
(4)根据获取的每架无人机于三个环节的最优控制策略遵循无人机任务分配、航迹规划、编队控制的顺序运行获得优化的每架无人机任务分配、航迹规划和编队控制。
令:
式中,pi为无人机位置;vi为无人机速度;
(1.2)(1.2)根据实际期望位置所属的地理区域不同对任务进行分区,每个任务分区表示为:k为任务分区编号,为任务分区集合,为任务分区的数量;由于无人机与任务一一匹配,故根据任务的分区获得无人机分区表示为:且满足以下条件:
(1.3)设计任务分配环节的无人机i的性能指标为:
进一步的,步骤(2)具体包括:
(2.1)在航迹规划环节中为每一架无人机配备了一个负责产生期望的飞行轨迹的虚拟智能体,设计每一架无人机与对应的虚拟智能体具有相同的系统动态,表示为:
(2.2)建立任务分配、航迹规划和编队控制三个环节的一体化博弈框架,所述一体化博弈框架为:针对无人机与任务建立匿名享乐博弈实现任务分配,使得每一架无人机根据自我的偏好,选择不同任务,并形成对应的无人机联盟;在每个无人机联盟内部,建立斯坦伯格微分图博弈,实现航迹规划和编队控制;其中,虚拟智能体担任领导者产生期望的飞行轨迹,无人机担任跟随者实现编队飞行;
(2.3)基于一体化博弈框架为无人机任务分配、航迹规划和编队控制三个环节设计一组耦合的性能指标,具体包括:
针对愿意选择加入的联盟Dk的无人机i定义其航迹规划的性能指标为Γr、编队控制环节的性能指标为Jr;其中:
设计任务分配环节的性能指标Wi为航迹规划和编队控制两个环节的性能指标相加,具体为:
进一步的,步骤(3)具体包括:
(3.1)设计编队控制环节的博弈控制策略模型,具体包括:
约束条件为:
(3.1.3)计算获得无人机最优编队控制策略,公式为:
(3.2)设计航迹规划环节的博弈控制策略模型,具体包括:
(3.2.1)同一联盟中的虚拟智能体的动态表征为:
航迹规划的性能指标为Γr重新表示为:
(3.2.2)无人机航迹规划环节的博弈控制策略模型为:
约束条件为:
(3.2.3)计算获得无人机最优航迹规划策略,公式为:
(3.3)设计任务分配环节的博弈控制策略模型,具体包括:
(3.3.1)任务分配环节的博弈控制策略模型为:
约束条件:
δir∈{0,1},
式中,δir是任务与无人机的匹配因子;
(3.3.2)基于步骤(3.1)与步骤(3.2)获取的最优编队控制策略与最优航迹规划策略,根据切换准则搜索获取每个无人机对应的最优无人机分区Π*;所述切换准则为:对于一个无人机的分区无人机i选择离开其所在的联盟加入另一个联盟k≠m当且仅当存在一个任务dr,使得:
进一步的,步骤(4)具体包括:
(4.1)初始化无人机的集合、任务的集合、无人机的初始分区、初始权重;
(4.2)针对当前的无人机分区,判断当前无人机的分区是否符合该无人机个体偏好,即判断下式是否成立:
若成立,则无人机离开当前联盟加入新的联盟并更新分区,转至步骤(4.3);若不成立,则输出无人机分区,转至步骤(4.4);所述公式为:
(4.3)重复步骤(4.2)直至步骤(4.2)中公式成立,则输出无人机分区,该无人机分区为最优分区;
此外,本发明还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法的步骤。
有益效果:本发明所述一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法相对于现有技术,其显著优点是:通过建立一个一体化的博弈框架并在该框架下设计一组相互耦合的性能指标关联三个环节;再基于所设计的性能指标,设计反向策略设计的机制,即遵循编队控制→航迹规划→任务分配的顺序,根据该运行顺序下生成的反馈信息设计三个博弈策略模型,计算获取反向运行下的每个环节的最优策略;最后根据获得最优策略再调整正向运行策略。该方法克服了传统集群飞行器三个环节只能正向调整的局限性,有效实现了每个环节策略的双向调整和每个环节性能的双向调节。所设计的博弈策略不仅可以实现每个环节的稳定性和最优性能,而且可以实现一体化博弈的Gestalt Nash均衡。
附图说明
图1所示为本发明所述任务分配、航迹规划和编队控制三个环节一体化的博弈框架图;
图2所示为本发明所述一体化博弈框架中整体闭环设计框架图;
图3所示为本发明所述无人机执行不同任务的代价图;
图4所示为本发明所述参考飞行轨迹和真实飞行轨迹之间的轨迹误差曲线图;
图5所示为本发明实施例中无人机1-5的编队飞行轨迹图;
具体实施方式
下面结合附图对本发明的技术方案进一步说明。
如图1与图2所示,本发明提供一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法,具体包括以下步骤:
步骤一、建立单架无人机的动态模型、无人机分区、无人机的个体偏好和整个无人机集群的信息交互拓扑图;具体为:
通过构建:
无人机的动态模型进一步的改写为如下形式:
式中,Dk是执行任务d[k]的无人机联盟;
为每个任务分区d[k]设置nk+1个任务,即若将任务分配给无人机i,即无人机i重新被标记为r[k]。通过这种方式,无人机联盟Dk表示为:由于本发明所研究的无人机和任务之间是一一对应的关系,因此本发明将使用同时表征任务的索引集合以及联盟中无人机的索引集合。
(3)设计任务分配环节的无人机i的性能指标为:
式中, 表示期望的位置,表示期望的速度;表示任务--联盟对,即与nk架无人机一起执行任务考虑到无人机面对不同的任务--联盟对时,拥有个体的偏好选择,因此,建立如下无人机的偏好。对于任意一架无人机定义为一个完备的、自反的、可传递的二元关系的偏好选择。基于所建立的偏好选择,对于k≠m,表达式表示:相较于任务-联盟对无人机i更愿意选择任务-联盟对即无人机的个人偏好表达式为:
(4)采用图论描述每个联盟内的无人机的信息交互得到整个无人机集群的信息交互拓扑图。其中,以联盟为例,该联盟内信息交互拓扑图定义为:其中为图中节点的连边,表征两架无人机之间的信息交互。为了简化标记,在没有歧义的地方,采用移除上标"[·]"的方式来表征无人机和任务,即无人机r[k]将记作无人机r,任务将记作任务dr。基于简化的标记,无人机0表征联盟中选择任务d0的领导者无人机,无人机r(r≠0)表征联盟中选择任务dr的跟随者无人机r≠0。假设图是连通的。
步骤二、建立任务分配、航迹规划和编队控制的一体化博弈框架,并基于该一体化博弈框架下为每架无人机任务分配、航迹规划和编队控制三个环节设计一组耦合的性能指标。具体为:
(1)构建完备的博弈局势:在航迹规划环节中为每一架无人机配备了一个负责产生期望的飞行轨迹的虚拟智能体,设计无人机与对应的虚拟智能体具有相同的系统动态,表示为:
(2)建立任务分配、航迹规划和编队控制三个环节的一体化博弈框架,其中各个玩家总结如下:
a)匿名享乐博弈的玩家:无人机和任务;
b)斯坦伯格微分图博弈的玩家:虚拟智能体和无人机。
具体的,一体化博弈框架为:首先,针对无人机与任务建立匿名享乐博弈实现任务分配,使得每一架无人机根据自我的偏好,选择不同任务,并形成对应的无人机联盟。然后,在每个无人机联盟内部,建立斯坦伯格微分图博弈,实现航迹规划和编队控制。其中,虚拟智能体担任领导者产生期望的飞行轨迹,无人机担任跟随者实现编队飞行;
(3)基于一体化博弈框架为任务分配、航迹规划和编队控制三个环节设计一组耦合的性能指标,具体包括:
针对愿意选择加入的联盟Dk的无人机i定义其航迹规划的性能指标为Γr、编队控制环节的性能指标为Jr;设计任务分配环节的性能指标Wi为航迹规划和编队控制两个环节的性能指标相加,具体为:
如此设计的优点为:一方面,任务分配的性能可以通过航迹规划和编队控制环节的策略进行调整;另一方面,航迹规划和编队控制的性能可以通过任务分配环节的策略(dr,nk)进行调整。因此,每个环节的策略可以双向可调,这有利于后续三个环节的闭环设计。
下述给出航迹规划环节Γr、编队控制环节的性能指标Jr的具体形式:
基于虚拟智能体的系统动态和任务dr中所包含的期望目的地和期望速度的信息,设计虚拟智能体r的性能指标为
式中,zr表示智能体的状态;Gr、Fr均表示性能指标Γr中的权重矩阵,且Gr>0、Fr>0;该指标不仅考量了虚拟智能体自身的控制能耗,而且考量了无人机的控制能耗,使得编队控制对航迹规划的影响可以在斯坦伯格微分图博弈的框架下加以表征。
式中,Qr、Rr、Lr均表示性能指标Jr中的权重矩阵,Lr>0;
步骤三、提出反向策略设计的机制,遵循编队控制→航迹规划→任务分配的顺序的运行顺序,利用反馈信息优化各环节的性能指标并设计每个环节的最优博弈控制策略,最终计算获取每架无人机于每个环节无人机的最优控制策略。具体包括:
(1)设计编队控制环节的博弈控制策略模型,具体包括:
根据状态误差向量可得到编队控制环节的性能指标为Jr进一步表示为:
约束条件为:
(1.3)求解计算获得无人机最优编队控制策略。具体的,定义无人机r的哈密顿函数:
利用极小值原理,可得
可得无人机的最优控制策略为
其中λr满足:
其中Pr满足以下不对称黎卡提微分方程:
且gr满足伴随方程:
可得无人机r的最优控制策略的状态反馈形式可以表示为
其中,Rr为性能指标中控制输入的权重矩阵,Br为输入矩阵,Pr为不对称黎卡提微分方程的解。
(2)设计航迹规划环节的博弈控制策略模型。
将虚拟智能体作为斯坦伯格微分图博弈中的领导者玩家,实现其在编队控制约束下的最优航迹规划。
(2.1)同一联盟中的虚拟智能体r的动态表征为:
航迹规划的性能指标为Γr重新表示为:
(2.2)设计无人机航迹规划环节的博弈控制策略模型,具体的:在斯坦伯格微分图博弈的框架下,虚拟智能体r的最优航迹规划的问题描述为:对于给定的无人机分区,
约束条件为:
(2.3)计算获得无人机最优航迹规划策略。具体的:定义虚拟智能体r的哈密顿函数:
利用极小值原理,可以导出
因此,设计航迹规划的最优控制策略为
进而得到如下三个微分方程
基于以上各式,建立如下微分方程
设计矩阵Φ中的子矩阵为:
建立矩阵Ω和Ψ的仿射关系式:
其中,
(3)设计任务分配环节的博弈控制策略模型,具体包括:
(3.1)任务分配环节的博弈控制策略模型。具体为:在航迹规划和编队控制策略的影响下,建立匿名享乐博弈实现无人机的任务分配。任务分配的问题可以描述为:
约束条件:
δir∈{0,1},
其中,δir是任务与无人机的匹配因子。如果任务dr分配给无人机i,那么δir=1;否则δir=0。
(3.2)基于所建立的无人机的个体选择偏好,建立无人机是否加入或者离开某一个联盟的切换准则。
通过使用上述切换准则,无人机自发地演化成不同的分区形态,其中一个稳定的形态定义为Nash稳定的分区。定义为无人机i所属的分区,即如果对于每一架无人机都有不等式成立,那么,分区Π是一个Nash稳定的分区。
针对任何可能执行的任务dr,如果无人机i,与其对应的虚拟智能体i分别使用所设计的控制策略和那么在切换准则的作用下,任意初始的无人机分区Π0可以收敛至一个最终的无人机分区Π*。并且,这个最终的无人机分区Π*是一个Nash稳定的分区。
步骤四、根据获取的三个环节的最优控制策略遵循任务分配、航迹规划、编队控制的顺序正向运行获得多飞行器任务分配、航迹规划和编队控制。具体步骤包括:
(2)建立匿名享乐博弈,实现任务分配。针对当前的无人机分区Π(首次迭代之时,Π=Π0),判断下述公式是否成立;
若成立,执行一次切换操作:具体为:
重复步骤(2.1)-(2.3)直到分区Π收敛至最终的Nash稳定的分区Π。
(3)建立斯坦伯格微分图博弈:获取航迹规划和编队控制。
在Nash稳定的分区Π下,根据所分配的任务重新标记联盟中的无人机,并为无人机配备虚拟智能体,执行下述操作:
重复步骤(2)-(3)直到策略收敛至Gestalt Nash均衡点。
本发明实施例中以一个由5架无人机构成的集群来验证所提出的一体化博弈方法有效性。
首先,初始化无人机的位置和速度。将各个无人机的初始位置分别设置为:
p1(0)=[0.480.62]T,p2(0)=[1.520.65]T,
p3(0)=[2.560.60]T,p4(0)=[5.006.00]T,
p5(0)=[7.009.00]T.
各个无人机的初始速度分别设置为:
v1(0)=[0.550.81]T,v2(0)=[0.520.86]T,
v3(0)=[0.470.86]T,v4(0)=[0.270.11]T,
v5(0)=[0.220.26]T.
设置虚拟智能体和无人机具有相同的初始条件。任务中的每个无人机期望位置和期望速度分别设置为:
通过使用本发明所设计的控制策略,分别得到无人机执行每一个任务所需要的代价,如图3所示。进一步,通过最小化全局的性能指标,得到各无人机任务分配的结果为:
结合图3所示的内容,从个体无人机的角度和整体集群的角度来分析任务分配的结果。首先,从个体无人机的角度而言:每个无人机或更倾向于选择消耗代价较小的任务。因此,自图3可以看出,无人机1-无人机3倾向于选择加入联盟来一起完成任务d[1],而无人机4和无人机5倾向于加入联盟来执行任务d[2]。其中,无人机4执行任务和任务所需要的代价是相同的。但是,由于受到社会性抑制的影响,无人机4倾向于选择加入联盟而非联盟其次,从整体集群的角度:任务分配的总目标是最小化全局的性能指标。虽然同样分配无人机4和无人机5执行任务无人机5所需的代价会比无人机4所需的代价高,但是从最小化全局性能指标的角度来说,任务仍然会被分配给无人机5。同时,分配的结果符合无人机4和无人机5的个体偏好。
综合两个角度可以看出采用本发明所述方案在任务分配环节,最终的分配结果符合每个无人机个体的偏好、同时保证集群飞行器达到全局最优的性能。
基于上述任务分配的结果,建立无人机和虚拟智能体之间的斯坦伯格微分图博弈实现航迹规划和编队控制。图4展示了各无人机真实的飞行轨迹与参考的飞行轨迹之间的轨迹误差随时间变化的曲线。图中仿真结果表明,所设计的编队控制策略可以驱使无人机跟随参考的飞行轨迹,且飞行过程中,轨迹误差渐近收敛至0。图5展示了无人机1-5实时编队的情况,结果表明,所设计的编队控制策略可以使得无人机跟随参考的飞行轨迹到达目的地。图6展示了联盟中无人机1-3的实时编队情况,图7中展示了联盟中无人机4和5的实时编队情况。图8和图9展示了无人机1-6在编队过程中速度随时间变化的曲线。结果表明,当无人机到达最终的目的地时,无人机达到期望的速度。综上,利用本发明所获得的轨迹规划与编队控制符合期望要求。
综上,本发明所述的方法不但可以保证多飞行器在任务分配、航迹规划和编队控制中每个环节性能的双向调节,还可以同步实现集群飞行器的稳定性和最优性能。
Claims (7)
1.一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法,其特征在于,包括以下步骤:
(1)建立单架无人机的动态模型、无人机分区、无人机的个体偏好和整个无人机集群的信息交互拓扑图;
(2)建立任务分配、航迹规划和编队控制的一体化博弈框架;基于步骤(1)中建立的每架无人机模型、无人机分区、无人机个体偏好在一体化博弈框架下为每架无人机任务分配、航迹规划和编队控制三个环节分别设计性能指标且任务分配的性能指标、航迹规划的性能指标和编队控制的性能指标相互耦合;
(3)设计反向策略机制,遵循编队控制、航迹规划、任务分配的运行顺序,利用反馈信息优化各环节的性能指标并设计每架无人机于每个环节的最优博弈控制策略模型,计算获取每架无人机于每个环节的最优控制策略;所述的反馈信息包括编队控制环节输出的状态误差量、编队控制环节的最优控制输入、航迹规划环节的最优控制输入;
(4)根据获取的每架无人机于三个环节的最优控制策略遵循无人机任务分配、航迹规划、编队控制的顺序运行获得优化的每架无人机任务分配、航迹规划和编队控制。
2.根据权利要求1所述的多飞行器任务分配、航迹规划和编队控制一体化博弈方法,其特征在于,步骤(1)具体包括:
令:
式中,pi为无人机位置;vi为无人机速度;
(1.2)根据实际期望位置所属的地理区域不同对任务进行分区,每个任务分区表示为:k为任务分区编号,为任务分区集合,为任务分区的数量;由于无人机与任务一一匹配,故根据任务的分区获得无人机分区表示为:且满足以下条件:
(1.3)设计任务分配环节的无人机i的性能指标为:
3.根据权利要求2所述的多飞行器任务分配、航迹规划和编队控制一体化博弈方法,其特征在于,步骤(2)具体包括:
(2.1)在航迹规划环节中为每一架无人机配备了一个负责产生期望的飞行轨迹的虚拟智能体,设计每一架无人机与对应的虚拟智能体具有相同的系统动态,表示为:
(2.2)建立任务分配、航迹规划和编队控制三个环节的一体化博弈框架,所述一体化博弈框架为:针对无人机与任务建立匿名享乐博弈实现任务分配,使得每一架无人机根据自我的偏好,选择不同任务,并形成对应的无人机联盟;在每个无人机联盟内部,建立斯坦伯格微分图博弈,实现航迹规划和编队控制;其中,虚拟智能体担任领导者产生期望的飞行轨迹,无人机担任跟随者实现编队飞行;
(2.3)基于一体化博弈框架为无人机任务分配、航迹规划和编队控制三个环节设计一组耦合的性能指标,具体包括:
针对愿意选择加入的联盟Dk的无人机i定义其航迹规划的性能指标为Γr、编队控制环节的性能指标为Jr;其中:
设计任务分配环节的性能指标Wi为航迹规划和编队控制两个环节的性能指标相加,具体为:
4.根据权利要求2所述的多飞行器任务分配、航迹规划和编队控制一体化博弈方法,其特征在于,步骤(3)具体包括:
(3.1)设计编队控制环节的博弈控制策略模型,具体包括:
约束条件为:
(3.1.3)计算获得无人机最优编队控制策略,公式为:
(3.2)设计航迹规划环节的博弈控制策略模型,具体包括:
(3.2.1)同一联盟中的虚拟智能体的动态表征为:
航迹规划的性能指标为Γr重新表示为:
(3.2.2)无人机航迹规划环节的博弈控制策略模型为:
约束条件为:
(3.2.3)计算获得无人机最优航迹规划策略,公式为:
(3.3)设计任务分配环节的博弈控制策略模型,具体包括:
(3.3.1)任务分配环节的博弈控制策略模型为:
约束条件:
δir∈{0,1},
式中,δir是任务与无人机的匹配因子;
(3.3.2)基于步骤(3.1)与步骤(3.2)获取的最优编队控制策略与最优航迹规划策略,根据切换准则搜索获取每个无人机对应的最优无人机分区Π*;
5.根据权利要求4所述的多飞行器任务分配、航迹规划和编队控制一体化博弈方法,其特征在于,步骤(4)具体包括:
(4.1)初始化无人机的集合、任务的集合、无人机的初始分区、初始权重;
(4.2)针对当前的无人机分区,判断当前无人机的分区是否符合该无人机个体偏好,即判断下式是否成立:
若成立,则无人机离开当前联盟加入新的联盟并更新分区,转至步骤(4.3);若不成立,则输出无人机分区,转至步骤(4.4);所述公式为:
(4.3)重复步骤(4.2)直至步骤(4.2)中公式成立,则输出无人机分区,该无人机分区为最优分区;
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至5中任意一项所述的方法的步骤。
7.一种调试设备,其特征在于,存储器、处理器及在所述存储器上存储并可运行的程序,所述程序被处理器执行时实现如权利要求1至5中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211300744.6A CN115562342A (zh) | 2022-10-24 | 2022-10-24 | 多飞行器任务分配、航迹规划和编队控制一体化博弈方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211300744.6A CN115562342A (zh) | 2022-10-24 | 2022-10-24 | 多飞行器任务分配、航迹规划和编队控制一体化博弈方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115562342A true CN115562342A (zh) | 2023-01-03 |
Family
ID=84747283
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211300744.6A Pending CN115562342A (zh) | 2022-10-24 | 2022-10-24 | 多飞行器任务分配、航迹规划和编队控制一体化博弈方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115562342A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115877871A (zh) * | 2023-03-03 | 2023-03-31 | 北京航空航天大学 | 一种基于强化学习的非零和博弈无人机编队控制方法 |
CN117492446A (zh) * | 2023-12-25 | 2024-02-02 | 北京大学 | 一种基于组合混合优化的多智能体合作规划方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104359473A (zh) * | 2014-10-24 | 2015-02-18 | 南京航空航天大学 | 一种动态环境下无人机编队飞行的协同航迹智能规划方法 |
CN108229719A (zh) * | 2017-11-29 | 2018-06-29 | 合肥工业大学 | 无人机编队任务分配与航迹规划的多目标优化方法及装置 |
CN108388270A (zh) * | 2018-03-21 | 2018-08-10 | 天津大学 | 面向安全域的集群无人机轨迹姿态协同控制方法 |
CN109871032A (zh) * | 2019-03-04 | 2019-06-11 | 中科院成都信息技术股份有限公司 | 一种基于模型预测控制的多无人机编队协同控制方法 |
CN111221352A (zh) * | 2020-03-03 | 2020-06-02 | 中国科学院自动化研究所 | 基于多无人机协同博弈对抗的控制系统 |
CN113359848A (zh) * | 2021-07-06 | 2021-09-07 | 西北工业大学 | 一种基于航路点的无人机编队生成-切换航迹规划方法 |
WO2022194310A1 (zh) * | 2021-08-18 | 2022-09-22 | 中国电子科技集团公司第二十八研究所 | 一种航班飞行轨迹多目标动态规划方法 |
-
2022
- 2022-10-24 CN CN202211300744.6A patent/CN115562342A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104359473A (zh) * | 2014-10-24 | 2015-02-18 | 南京航空航天大学 | 一种动态环境下无人机编队飞行的协同航迹智能规划方法 |
CN108229719A (zh) * | 2017-11-29 | 2018-06-29 | 合肥工业大学 | 无人机编队任务分配与航迹规划的多目标优化方法及装置 |
CN108388270A (zh) * | 2018-03-21 | 2018-08-10 | 天津大学 | 面向安全域的集群无人机轨迹姿态协同控制方法 |
CN109871032A (zh) * | 2019-03-04 | 2019-06-11 | 中科院成都信息技术股份有限公司 | 一种基于模型预测控制的多无人机编队协同控制方法 |
CN111221352A (zh) * | 2020-03-03 | 2020-06-02 | 中国科学院自动化研究所 | 基于多无人机协同博弈对抗的控制系统 |
CN113359848A (zh) * | 2021-07-06 | 2021-09-07 | 西北工业大学 | 一种基于航路点的无人机编队生成-切换航迹规划方法 |
WO2022194310A1 (zh) * | 2021-08-18 | 2022-09-22 | 中国电子科技集团公司第二十八研究所 | 一种航班飞行轨迹多目标动态规划方法 |
Non-Patent Citations (1)
Title |
---|
陈侠;李光耀;于兴超;: "基于博弈策略的多无人机航迹规划研究", 战术导弹技术, no. 01, 15 January 2020 (2020-01-15) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115877871A (zh) * | 2023-03-03 | 2023-03-31 | 北京航空航天大学 | 一种基于强化学习的非零和博弈无人机编队控制方法 |
CN117492446A (zh) * | 2023-12-25 | 2024-02-02 | 北京大学 | 一种基于组合混合优化的多智能体合作规划方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115562342A (zh) | 多飞行器任务分配、航迹规划和编队控制一体化博弈方法 | |
CN113395676B (zh) | 一种基于重叠联盟形成博弈的无人机任务协作方法 | |
CN105302153B (zh) | 异构多无人机协同察打任务的规划方法 | |
CN111522258B (zh) | 多无人机协同控制仿真系统及其构建方法、仿真方法 | |
CN111552314B (zh) | 多无人机自适应编队跟踪控制方法 | |
CN111522361B (zh) | 主-从模式的多无人机编队一致性控制方法 | |
CN110502034B (zh) | 一种基于深度强化学习的固定翼无人机群集控制方法 | |
CN112511250B (zh) | 一种基于drl的多无人机空中基站动态部署方法及系统 | |
CN110673649B (zh) | 基于拓扑优化的时变信道下无人机编队一致性控制方法、系统、装置及存储介质 | |
CN110347181B (zh) | 基于能耗的无人机分布式编队控制方法 | |
CN113359437B (zh) | 基于演化博弈的多智能体编队的分层模型预测控制方法 | |
CN112650290B (zh) | 带有扰动补偿的高层消防无人机编队优化控制方法及系统 | |
CN112198892A (zh) | 一种多无人机智能协同突防对抗方法 | |
CN115877871B (zh) | 一种基于强化学习的非零和博弈无人机编队控制方法 | |
CN113485344A (zh) | 一种多智能体输出编队跟踪控制方法及系统 | |
US20230297859A1 (en) | Method and apparatus for generating multi-drone network cooperative operation plan based on reinforcement learning | |
CN116227767A (zh) | 基于深度强化学习的多无人机基站协同覆盖路径规划方法 | |
CN115016537B (zh) | 一种sead场景下异构无人机配置与任务规划联合优化方法 | |
CN113625767A (zh) | 一种基于优选信息素灰狼算法的固定翼无人机集群协同路径规划方法 | |
Abouheaf et al. | Dynamic graphical games: online adaptive learning solutions using approximate dynamic programming | |
Ghouri et al. | Attitude control of quad-copter using deterministic policy gradient algorithms (DPGA) | |
CN110032204A (zh) | 输入时延下多空间飞行器姿态协同控制方法 | |
Bai et al. | An improved PPO for multiple unmanned aerial vehicles | |
CN110716585B (zh) | 基于分布式一致性与自组网的自主协同控制方法及系统 | |
CN111596688A (zh) | 基于连续通信的多无人机编队一致性控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |