CN115562342A - 多飞行器任务分配、航迹规划和编队控制一体化博弈方法 - Google Patents

多飞行器任务分配、航迹规划和编队控制一体化博弈方法 Download PDF

Info

Publication number
CN115562342A
CN115562342A CN202211300744.6A CN202211300744A CN115562342A CN 115562342 A CN115562342 A CN 115562342A CN 202211300744 A CN202211300744 A CN 202211300744A CN 115562342 A CN115562342 A CN 115562342A
Authority
CN
China
Prior art keywords
unmanned aerial
aerial vehicle
task
formation control
partition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211300744.6A
Other languages
English (en)
Inventor
许宇航
杨浩
姜斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202211300744.6A priority Critical patent/CN115562342A/zh
Publication of CN115562342A publication Critical patent/CN115562342A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公开了一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法,包括:(1)建立单架无人机的动态模型、无人机分区、无人机的个体偏好和整个无人机集群的信息交互拓扑图;(2)建立任务分配、航迹规划和编队控制的一体化博弈框架并在该框架下为任务分配、航迹规划和编队控制三个环节设计相互耦合性能指标;(3)设计反向策略机制,遵循反向运行顺序,利用反馈信息优化各环节的性能指标并设计每个环节的最优博弈控制策略模型,解算每个环节的最优控制策略;(4)基于三个环节的最优控制策略遵循正向顺序运行获得优化的无人机任务分配、航迹规划和编队控制。本发明能够实现飞行器每个环节策略的双向调整,达到一体化博弈的纳什均衡。

Description

多飞行器任务分配、航迹规划和编队控制一体化博弈方法
技术领域
本发明涉及多飞行器控制的技术领域,具体是涉及一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法。
背景技术
集群飞行器作为一类以通信耦合的网络系统,在军事和民用方面都发挥着重要作用,例如森林防火、敌情监测等。博弈论在集群飞行器的任务分配、航迹规划和编队控制三个核心环节中有着相当广泛地应用,以寻求更优的系统性能。例如:在任务分配环节,现有技术中通过建立匿名享乐博弈,研究具有社会性抑制特性的无人机,在尽可能减少合作成员的情况下,实施联盟切换准则,形成与任务匹配的Nash稳定的无人机分区。在航迹规划环节,现有技术基于非零和博弈,实现避障条件约束下的无人机期望飞行轨迹的规划。在编队控制环节,基于非合作博弈,可以实现领导者-跟随者模式的集群编队控制。
在现有的一些博弈框架下,针对集群飞行器的任务分配、航迹规划和编队控制三个环节的策略通常是分开独立设计的,这种独立设计主要是顺着任务分配→路径规划→编队控制的方向正向调节每个环节的性能,可称之为开环设计。然而这种开环设计忽略了各个环节之间的双向互动,无法建立反馈机制,难以根据实际情况对策略进行及时地调整。因此,亟需建立针对三个环节一体化的博弈机制,使得每个环节的性能可以双向可调。
发明内容
发明目的:针对以上缺点,本发明提供一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法,通过建立一体化博弈框架并在该一体化博弈框架下关联耦合三个环节之间的指标,并结合各环节的反馈信息实现三个环节的闭环设计,实现了每个环节策略的双向调整,最终达到一体化博弈的纳什均衡。
技术方案:为解决上述问题,本发明公开一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法,具体包括以下步骤:
(1)针对多飞行器系统,建立单架无人机的动态模型、无人机分区、无人机的个体偏好和整个无人机集群的信息交互拓扑图;
(2)建立任务分配、航迹规划和编队控制的一体化博弈框架;基于步骤(1)中建立的每架无人机模型、无人机分区、无人机个体偏好在一体化博弈框架下为每架无人机任务分配、航迹规划和编队控制三个环节分别设计性能指标且任务分配的性能指标、航迹规划的性能指标和编队控制的性能指标相互耦合;
(3)设计反向策略机制,遵循编队控制、航迹规划、任务分配的运行顺序,利用反馈信息优化各环节的性能指标并设计每架无人机于每个环节的最优博弈控制策略模型,计算获取每架无人机于每个环节的最优控制策略;所述的反馈信息包括编队控制环节输出的状态误差量、编队控制环节的最优控制输入、航迹规划环节的最优控制输入;
(4)根据获取的每架无人机于三个环节的最优控制策略遵循无人机任务分配、航迹规划、编队控制的顺序运行获得优化的每架无人机任务分配、航迹规划和编队控制。
进一步的,步骤(1)具体包括:(1.1)构建一个S架无人机的集群,定义
Figure BDA0003904563740000021
为无人机的集合;即单架无人机
Figure BDA0003904563740000022
的动态模型为:
Figure BDA0003904563740000023
Figure BDA0003904563740000024
式中,
Figure BDA0003904563740000025
表示t时刻下无人机i的位置;vi(t)表示t时刻下无人机i的速度;ui(t)表示t时刻下无人机i的控制输入;
令:
Figure BDA0003904563740000026
式中,pi为无人机位置;vi为无人机速度;
单架无人机
Figure BDA0003904563740000027
的动态模型改写为:
Figure BDA0003904563740000028
式中,
Figure BDA0003904563740000029
q为正整数;xi(t)表示t时刻下xi
Figure BDA00039045637400000210
为xi(t)的动态表征;
(1.2)(1.2)根据实际期望位置所属的地理区域不同对任务进行分区,每个任务分区表示为:
Figure BDA00039045637400000211
k为任务分区编号,
Figure BDA00039045637400000212
为任务分区集合,
Figure BDA00039045637400000213
为任务分区的数量;由于无人机与任务一一匹配,故根据任务的分区获得无人机分区表示为:
Figure BDA0003904563740000031
且满足以下条件:
Figure BDA0003904563740000032
Figure BDA0003904563740000033
式中,Dk是执行任务d[k]的无人机联盟;m为任务分区集合中不为k的任务分区编号;
Figure BDA0003904563740000034
为执行任务d[m]的无人机联盟;
为每个任务分区d[k]设置nk+1个任务,即
Figure BDA0003904563740000035
若将任务
Figure BDA0003904563740000036
分配给无人机i,即无人机i重新被标记为r[k],无人机联盟Dk表示为:
Figure BDA0003904563740000037
(1.3)设计任务分配环节的无人机i的性能指标为:
Figure BDA0003904563740000038
式中,
Figure BDA0003904563740000039
Figure BDA00039045637400000310
表示期望的位置,
Figure BDA00039045637400000311
表示期望的速度;
Figure BDA00039045637400000312
表示任务--联盟对,即与nk架无人机一起执行任务
Figure BDA00039045637400000313
建立无人机偏好,对于任意一架无人机
Figure BDA00039045637400000314
定义
Figure BDA00039045637400000324
为一个偏好选择,对于
Figure BDA00039045637400000315
k≠m,
Figure BDA00039045637400000316
表达式
Figure BDA00039045637400000317
表示相较于任务--联盟对
Figure BDA00039045637400000318
无人机i更愿意选择任务-联盟对
Figure BDA00039045637400000319
即无人机的个人偏好表达式为:
Figure BDA00039045637400000320
(1.4)采用图论描述每个联盟内的无人机的信息交互得到整个无人机集群的信息交互拓扑图;其中,联盟Dk内信息交互拓扑图定义为:
Figure BDA00039045637400000321
εk为图中节点的连边,表征两架无人机之间的信息交互。
进一步的,步骤(2)具体包括:
(2.1)在航迹规划环节中为每一架无人机配备了一个负责产生期望的飞行轨迹的虚拟智能体,设计每一架无人机与对应的虚拟智能体具有相同的系统动态,表示为:
Figure BDA00039045637400000322
式中,zr(t)表示t时刻下虚拟智能体的状态;
Figure BDA00039045637400000323
表示t时刻下虚拟智能体的控制输入;
(2.2)建立任务分配、航迹规划和编队控制三个环节的一体化博弈框架,所述一体化博弈框架为:针对无人机与任务建立匿名享乐博弈实现任务分配,使得每一架无人机根据自我的偏好,选择不同任务,并形成对应的无人机联盟;在每个无人机联盟内部,建立斯坦伯格微分图博弈,实现航迹规划和编队控制;其中,虚拟智能体担任领导者产生期望的飞行轨迹,无人机担任跟随者实现编队飞行;
(2.3)基于一体化博弈框架为无人机任务分配、航迹规划和编队控制三个环节设计一组耦合的性能指标,具体包括:
针对愿意选择加入的联盟Dk的无人机i定义其航迹规划的性能指标为Γr、编队控制环节的性能指标为Jr;其中:
Figure BDA0003904563740000041
式中,zr表示智能体的状态;dr=d[k]表示无人机任务分区;
Figure BDA0003904563740000042
Gr、Fr均表示性能指标Γr中的权重矩阵;
Figure BDA0003904563740000043
表示虚拟智能体的控制输入即航迹规划环节的策略;ur表示无人机的控制输入即编队控制环节的策略;
Figure BDA0003904563740000044
式中,
Figure BDA0003904563740000045
Qr、Rr、Lr均表示性能指标Jr中的权重矩阵;
设计任务分配环节的性能指标Wi为航迹规划和编队控制两个环节的性能指标相加,具体为:
Figure BDA0003904563740000046
进一步的,步骤(3)具体包括:
(3.1)设计编队控制环节的博弈控制策略模型,具体包括:
(3.1.1)给定任意可行的无人机分区Π、任意可行的航迹规划的策略
Figure BDA0003904563740000051
定义状态误差向量
Figure BDA0003904563740000052
根据状态误差向量优化编队控制环节的性能指标为Jr得到:
Figure BDA0003904563740000053
(3.1.2)针对联盟
Figure BDA0003904563740000054
中无人机编队控制环节的博弈控制策略模型为:基于给定Π,
Figure BDA0003904563740000055
Figure BDA0003904563740000056
Figure BDA0003904563740000057
约束条件为:
Figure BDA0003904563740000058
式中,u-r表示联盟
Figure BDA0003904563740000059
中除了无人机r以外的其他无人机的策略集合;
Figure BDA00039045637400000510
为状态误差向量系统的动态表征;
Figure BDA00039045637400000511
Figure BDA00039045637400000512
(3.1.3)计算获得无人机最优编队控制策略,公式为:
Figure BDA00039045637400000513
式中,
Figure BDA00039045637400000514
为无人机最优编队控制策略;Rr为性能指标中控制输入的权重矩阵,Br为输入矩阵,Pr为不对称黎卡提微分方程的解;
(3.2)设计航迹规划环节的博弈控制策略模型,具体包括:
(3.2.1)同一联盟中的虚拟智能体的动态表征为:
式中,
Figure BDA00039045637400000515
为z的动态表征;
Figure BDA00039045637400000516
航迹规划的性能指标为Γr重新表示为:
Figure BDA0003904563740000061
式中,
Figure BDA0003904563740000062
(3.2.2)无人机航迹规划环节的博弈控制策略模型为:
Figure BDA0003904563740000063
约束条件为:
Figure BDA0003904563740000064
Figure BDA0003904563740000065
(3.2.3)计算获得无人机最优航迹规划策略,公式为:
Figure BDA0003904563740000066
式中,
Figure BDA0003904563740000067
Figure BDA0003904563740000068
为斜态变量,
Figure BDA0003904563740000069
(3.3)设计任务分配环节的博弈控制策略模型,具体包括:
(3.3.1)任务分配环节的博弈控制策略模型为:
Figure BDA00039045637400000610
约束条件:
Figure BDA00039045637400000611
δir∈{0,1},
Figure BDA00039045637400000612
Figure BDA00039045637400000613
式中,δir是任务与无人机的匹配因子;
(3.3.2)基于步骤(3.1)与步骤(3.2)获取的最优编队控制策略与最优航迹规划策略,根据切换准则搜索获取每个无人机对应的最优无人机分区Π*;所述切换准则为:对于一个无人机的分区
Figure BDA0003904563740000071
无人机i选择离开其所在的联盟
Figure BDA0003904563740000072
加入另一个联盟
Figure BDA0003904563740000073
k≠m当且仅当存在一个任务dr
Figure BDA0003904563740000074
使得:
Figure BDA0003904563740000075
则新成立的无人机分区可以表示为
Figure BDA0003904563740000076
进一步的,步骤(4)具体包括:
(4.1)初始化无人机的集合、任务的集合、无人机的初始分区、初始权重;
(4.2)针对当前的无人机分区,判断当前无人机的分区是否符合该无人机个体偏好,即判断下式是否成立:
Figure BDA0003904563740000077
式中,
Figure BDA0003904563740000078
表示联盟中无人机l的最优编队控制策略;
Figure BDA0003904563740000079
表示联盟中无人机l的最优航迹规划策略;nΠ(i)为当前分区Π的无人机数量;
若成立,则无人机离开当前联盟加入新的联盟并更新分区,转至步骤(4.3);若不成立,则输出无人机分区,转至步骤(4.4);所述公式为:
(4.3)重复步骤(4.2)直至步骤(4.2)中公式成立,则输出无人机分区,该无人机分区为最优分区;
(4.4)根据输出无人机分区,采用无人机最优航迹规划策略
Figure BDA00039045637400000710
最小化性能指标Γr获得航迹规划;
(4.5)根据获取的无人机分区、航迹规划,采用无人机最优编队控制策略
Figure BDA00039045637400000711
最小化性能指标Jr获得编队控制。
此外,本发明还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法的步骤。
有益效果:本发明所述一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法相对于现有技术,其显著优点是:通过建立一个一体化的博弈框架并在该框架下设计一组相互耦合的性能指标关联三个环节;再基于所设计的性能指标,设计反向策略设计的机制,即遵循编队控制→航迹规划→任务分配的顺序,根据该运行顺序下生成的反馈信息设计三个博弈策略模型,计算获取反向运行下的每个环节的最优策略;最后根据获得最优策略再调整正向运行策略。该方法克服了传统集群飞行器三个环节只能正向调整的局限性,有效实现了每个环节策略的双向调整和每个环节性能的双向调节。所设计的博弈策略不仅可以实现每个环节的稳定性和最优性能,而且可以实现一体化博弈的Gestalt Nash均衡。
附图说明
图1所示为本发明所述任务分配、航迹规划和编队控制三个环节一体化的博弈框架图;
图2所示为本发明所述一体化博弈框架中整体闭环设计框架图;
图3所示为本发明所述无人机执行不同任务的代价图;
图4所示为本发明所述参考飞行轨迹和真实飞行轨迹之间的轨迹误差曲线图;
图5所示为本发明实施例中无人机1-5的编队飞行轨迹图;
图6为本发明实施例中联盟
Figure BDA0003904563740000081
内无人机1-3的编队飞行轨迹图;
图7为本发明实施例中联盟
Figure BDA0003904563740000082
内无人机4-5的编队飞行轨迹图;
图8为本发明实施例中联盟
Figure BDA0003904563740000083
内无人机1-3的速度变化曲线图;
图9为本发明实施例中联盟
Figure BDA0003904563740000084
内无人机4-5的速度变化曲线图。
具体实施方式
下面结合附图对本发明的技术方案进一步说明。
如图1与图2所示,本发明提供一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法,具体包括以下步骤:
步骤一、建立单架无人机的动态模型、无人机分区、无人机的个体偏好和整个无人机集群的信息交互拓扑图;具体为:
(1)构建一个S架无人机的集群,定义
Figure BDA0003904563740000085
为无人机的集合;即单架无人机
Figure BDA0003904563740000086
的动态模型为:
Figure BDA0003904563740000087
Figure BDA0003904563740000088
式中,
Figure BDA0003904563740000091
表示t时刻下无人机i的位置;
Figure BDA0003904563740000092
表示t时刻下无人机i的速度;
Figure BDA0003904563740000093
表示t时刻下无人机i的控制输入;
通过构建:
Figure BDA0003904563740000094
无人机的动态模型进一步的改写为如下形式:
Figure BDA0003904563740000095
式中,
Figure BDA0003904563740000096
q为正整数。
(2)根据实际期望位置所属的地理区域不同对任务进行分区,每个任务分区表示为:
Figure BDA0003904563740000097
k为任务分区编号,
Figure BDA0003904563740000098
为任务分区集合。由于无人机与任务一一匹配,故根据任务的分区无人机的分区表示为:
Figure BDA0003904563740000099
且满足以下条件:
Figure BDA00039045637400000910
Figure BDA00039045637400000911
式中,Dk是执行任务d[k]的无人机联盟;
为每个任务分区d[k]设置nk+1个任务,即
Figure BDA00039045637400000912
若将任务
Figure BDA00039045637400000913
分配给无人机i,即无人机i重新被标记为r[k]。通过这种方式,无人机联盟Dk表示为:
Figure BDA00039045637400000914
由于本发明所研究的无人机和任务之间是一一对应的关系,因此本发明将使用
Figure BDA00039045637400000915
同时表征任务的索引集合以及联盟中无人机的索引集合。
(3)设计任务分配环节的无人机i的性能指标为:
Figure BDA00039045637400000916
式中,
Figure BDA00039045637400000917
Figure BDA00039045637400000918
表示期望的位置,
Figure BDA00039045637400000919
表示期望的速度;
Figure BDA00039045637400000920
表示任务--联盟对,即与nk架无人机一起执行任务
Figure BDA00039045637400000921
考虑到无人机面对不同的任务--联盟对
Figure BDA00039045637400000922
时,拥有个体的偏好选择,因此,建立如下无人机的偏好。对于任意一架无人机
Figure BDA0003904563740000101
定义
Figure BDA00039045637400001019
为一个完备的、自反的、可传递的二元关系的偏好选择。基于所建立的偏好选择,对于
Figure BDA0003904563740000102
k≠m,
Figure BDA0003904563740000103
表达式
Figure BDA0003904563740000104
表示:相较于任务-联盟对
Figure BDA0003904563740000105
无人机i更愿意选择任务-联盟对
Figure BDA0003904563740000106
即无人机的个人偏好表达式为:
Figure BDA0003904563740000107
根据上式可知无人机偏好的两个决定因素:所选择的任务
Figure BDA0003904563740000108
和合作伙伴的数量nk
(4)采用图论描述每个联盟内的无人机的信息交互得到整个无人机集群的信息交互拓扑图。其中,以联盟
Figure BDA0003904563740000109
为例,该联盟内信息交互拓扑图定义为:
Figure BDA00039045637400001010
其中
Figure BDA00039045637400001011
为图中节点的连边,表征两架无人机之间的信息交互。为了简化标记,在没有歧义的地方,采用移除上标"[·]"的方式来表征无人机和任务,即无人机r[k]将记作无人机r,任务
Figure BDA00039045637400001012
将记作任务dr。基于简化的标记,无人机0表征联盟
Figure BDA00039045637400001013
中选择任务d0的领导者无人机,无人机r(r≠0)表征联盟
Figure BDA00039045637400001014
中选择任务dr的跟随者无人机
Figure BDA00039045637400001015
r≠0。假设图
Figure BDA00039045637400001016
是连通的。
步骤二、建立任务分配、航迹规划和编队控制的一体化博弈框架,并基于该一体化博弈框架下为每架无人机任务分配、航迹规划和编队控制三个环节设计一组耦合的性能指标。具体为:
(1)构建完备的博弈局势:在航迹规划环节中为每一架无人机配备了一个负责产生期望的飞行轨迹的虚拟智能体,设计无人机与对应的虚拟智能体具有相同的系统动态,表示为:
Figure BDA00039045637400001017
式中,zr(t)表示t时刻下虚拟智能体的状态;
Figure BDA00039045637400001018
表示t时刻下虚拟智能体的控制输入。
(2)建立任务分配、航迹规划和编队控制三个环节的一体化博弈框架,其中各个玩家总结如下:
a)匿名享乐博弈的玩家:无人机和任务;
b)斯坦伯格微分图博弈的玩家:虚拟智能体和无人机。
具体的,一体化博弈框架为:首先,针对无人机与任务建立匿名享乐博弈实现任务分配,使得每一架无人机根据自我的偏好,选择不同任务,并形成对应的无人机联盟。然后,在每个无人机联盟内部,建立斯坦伯格微分图博弈,实现航迹规划和编队控制。其中,虚拟智能体担任领导者产生期望的飞行轨迹,无人机担任跟随者实现编队飞行;
(3)基于一体化博弈框架为任务分配、航迹规划和编队控制三个环节设计一组耦合的性能指标,具体包括:
针对愿意选择加入的联盟Dk的无人机i定义其航迹规划的性能指标为Γr、编队控制环节的性能指标为Jr;设计任务分配环节的性能指标Wi为航迹规划和编队控制两个环节的性能指标相加,具体为:
Figure BDA0003904563740000111
式中,ur表示无人机的控制输入,即编队控制环节的规划策略;
Figure BDA0003904563740000112
表示虚拟智能体的控制输入,即航迹规划环节策略;
如此设计的优点为:一方面,任务分配的性能可以通过航迹规划和编队控制环节的策略
Figure BDA0003904563740000113
进行调整;另一方面,航迹规划和编队控制的性能可以通过任务分配环节的策略(dr,nk)进行调整。因此,每个环节的策略可以双向可调,这有利于后续三个环节的闭环设计。
下述给出航迹规划环节Γr、编队控制环节的性能指标Jr的具体形式:
基于虚拟智能体的系统动态和任务dr中所包含的期望目的地和期望速度的信息,设计虚拟智能体r的性能指标为
Figure BDA0003904563740000114
式中,zr表示智能体的状态;
Figure BDA0003904563740000121
Gr、Fr均表示性能指标Γr中的权重矩阵,且Gr>0、Fr>0;该指标不仅考量了虚拟智能体自身的控制能耗,而且考量了无人机的控制能耗,使得编队控制对航迹规划的影响可以在斯坦伯格微分图博弈的框架下加以表征。
定义
Figure BDA0003904563740000122
领导者无人机和跟随者无人机的性能指标可以统一构造为如下形式:
Figure BDA0003904563740000123
式中,Qr、Rr、Lr均表示性能指标Jr中的权重矩阵,Lr>0;
且对于r≠0,有
Figure BDA0003904563740000124
Figure BDA0003904563740000125
为领导者无人机对应的权重矩阵;对于r≠0,有:
Figure BDA0003904563740000126
满足
Figure BDA0003904563740000127
其中每个子矩阵定义为:
Figure BDA0003904563740000128
Figure BDA0003904563740000129
式中,
Figure BDA00039045637400001210
表示跟随者无人机
Figure BDA00039045637400001211
和领导者无人机之间的权重矩阵,而
Figure BDA00039045637400001212
表示跟随者无人机r与其邻居无人机l之间的权重矩阵。
一体化博弈框架下的性能指标Jr中增加设计了
Figure BDA00039045637400001213
用于表征航迹规划对编队控制环节所施加的先行决策的影响。
步骤三、提出反向策略设计的机制,遵循编队控制→航迹规划→任务分配的顺序的运行顺序,利用反馈信息优化各环节的性能指标并设计每个环节的最优博弈控制策略,最终计算获取每架无人机于每个环节无人机的最优控制策略。具体包括:
(1)设计编队控制环节的博弈控制策略模型,具体包括:
(1.1)给定任意可行的无人机分区Π、任意可行的航迹规划的策略
Figure BDA0003904563740000131
将无人机作为在斯坦伯格微分图博弈中的跟随者玩家实现编队控制。定义状态误差向量
Figure BDA0003904563740000132
其系统动态表征为:
Figure BDA0003904563740000133
其中,
Figure BDA0003904563740000134
Figure BDA0003904563740000135
根据状态误差向量可得到编队控制环节的性能指标为Jr进一步表示为:
Figure BDA0003904563740000136
(1.2)设计联盟
Figure BDA0003904563740000137
中无人机编队控制环节的博弈控制策略模型。具体的,联盟
Figure BDA0003904563740000138
中无人机的最优编队控制的问题可以描述为:给定Π,
Figure BDA0003904563740000139
Figure BDA00039045637400001310
Figure BDA00039045637400001311
约束条件为:
Figure BDA00039045637400001312
式中,
Figure BDA00039045637400001313
表示联盟
Figure BDA00039045637400001314
中除了无人机r以外的其他无人机的策略集合;
(1.3)求解计算获得无人机最优编队控制策略。具体的,定义无人机r的哈密顿函数:
Figure BDA00039045637400001315
其中,λr是无人机r的协态变量;最优控制策略
Figure BDA0003904563740000141
满足
Figure BDA0003904563740000142
利用极小值原理,可得
Figure BDA0003904563740000143
可得无人机的最优控制策略为
Figure BDA0003904563740000144
其中λr满足:
Figure BDA0003904563740000145
为了得到最优控制策略
Figure BDA0003904563740000146
的等价状态反馈的形式,令
Figure BDA0003904563740000147
其中Pr满足以下不对称黎卡提微分方程:
Figure BDA0003904563740000148
且gr满足伴随方程:
Figure BDA0003904563740000149
可得无人机r的最优控制策略的状态反馈形式可以表示为
Figure BDA00039045637400001410
其中,Rr为性能指标中控制输入的权重矩阵,Br为输入矩阵,Pr为不对称黎卡提微分方程的解。
根据所设计的最优控制策略
Figure BDA00039045637400001411
可以实现:
Figure BDA00039045637400001412
Figure BDA00039045637400001413
Figure BDA00039045637400001414
即联盟
Figure BDA00039045637400001415
内无人机的nk+1个最优控制策略
Figure BDA00039045637400001416
构成其图博弈的Nash均衡。
(2)设计航迹规划环节的博弈控制策略模型。
将虚拟智能体作为斯坦伯格微分图博弈中的领导者玩家,实现其在编队控制约束下的最优航迹规划。
(2.1)同一联盟中的虚拟智能体r的动态表征为:
Figure BDA0003904563740000151
航迹规划的性能指标为Γr重新表示为:
Figure BDA0003904563740000152
式中,
Figure BDA0003904563740000153
(2.2)设计无人机航迹规划环节的博弈控制策略模型,具体的:在斯坦伯格微分图博弈的框架下,虚拟智能体r的最优航迹规划的问题描述为:对于给定的无人机分区,
Figure BDA0003904563740000154
约束条件为:
Figure BDA0003904563740000155
Figure BDA0003904563740000156
Figure BDA0003904563740000157
在斯坦伯格微分图博弈的框架下,通过考量无人机编队控制的最佳响应策略
Figure BDA0003904563740000158
Figure BDA0003904563740000159
使得所设计的航迹规划的策略
Figure BDA00039045637400001510
具有修正编队误差的能力,有助于实现航迹规划和编队控制之间的闭环设计。
(2.3)计算获得无人机最优航迹规划策略。具体的:定义虚拟智能体r的哈密顿函数:
Figure BDA0003904563740000161
其中,
Figure BDA0003904563740000162
是斜态变量,βr和ξr是两个拉格朗日乘子。最优航迹规划的控制策略
Figure BDA0003904563740000163
满足
Figure BDA0003904563740000164
利用极小值原理,可以导出
Figure BDA0003904563740000165
其中
Figure BDA0003904563740000166
Figure BDA0003904563740000167
因此,设计航迹规划的最优控制策略为
Figure BDA0003904563740000168
其中
Figure BDA0003904563740000169
βr和ξr分别满足
Figure BDA00039045637400001610
进而得到如下三个微分方程
Figure BDA00039045637400001611
Figure BDA00039045637400001612
Figure BDA00039045637400001613
下面设计最优控制策略
Figure BDA00039045637400001614
的状态反馈表达式。为了实现这个目标,定义:
Figure BDA00039045637400001615
Figure BDA00039045637400001616
基于以上各式,建立如下微分方程
Figure BDA0003904563740000171
Figure BDA0003904563740000172
其中:
Figure BDA0003904563740000173
Figure BDA0003904563740000174
Figure BDA0003904563740000175
设计矩阵Φ中的子矩阵为:
Figure BDA0003904563740000176
其中,
Figure BDA0003904563740000177
Figure BDA0003904563740000178
Figure BDA0003904563740000179
Figure BDA00039045637400001710
Figure BDA00039045637400001711
Figure BDA00039045637400001712
Figure BDA00039045637400001713
Figure BDA00039045637400001714
设计矩阵
Figure BDA00039045637400001715
中的子矩阵定义为:
Figure BDA0003904563740000181
Figure BDA0003904563740000182
Figure BDA0003904563740000183
Figure BDA0003904563740000184
建立矩阵Ω和Ψ的仿射关系式:
Figure BDA0003904563740000185
其中
Figure BDA0003904563740000186
满足不对称的黎卡提微分方程:
Figure BDA0003904563740000187
Figure BDA0003904563740000188
满足伴随方程:
Figure BDA0003904563740000189
基于上式,最优控制策略
Figure BDA00039045637400001810
表示为状态反馈的形式:
Figure BDA00039045637400001811
其中,
Figure BDA00039045637400001812
Figure BDA00039045637400001813
Figure BDA00039045637400001814
Figure BDA00039045637400001815
根据所设计的最优航空规划控制策略
Figure BDA00039045637400001816
实现:
Figure BDA00039045637400001817
且虚拟智能体对应的(nk+1)个最优控制策略
Figure BDA00039045637400001818
构成其图博弈的Nash均衡。
(3)设计任务分配环节的博弈控制策略模型,具体包括:
(3.1)任务分配环节的博弈控制策略模型。具体为:在航迹规划和编队控制策略的影响下,建立匿名享乐博弈实现无人机的任务分配。任务分配的问题可以描述为:
Figure BDA0003904563740000191
约束条件:
Figure BDA0003904563740000192
δir∈{0,1},
Figure BDA0003904563740000193
Figure BDA0003904563740000194
其中,δir是任务与无人机的匹配因子。如果任务dr分配给无人机i,那么δir=1;否则δir=0。
(3.2)基于所建立的无人机的个体选择偏好,建立无人机是否加入或者离开某一个联盟的切换准则。
所述切换准则为:对于一个无人机的分区
Figure BDA0003904563740000195
无人机i选择离开其所在的联盟
Figure BDA0003904563740000196
加入另一个联盟
Figure BDA0003904563740000197
k≠m当且仅当存在一个任务dr
Figure BDA0003904563740000198
使得:
Figure BDA0003904563740000199
则新成立的无人机分区可以表示为
Figure BDA00039045637400001910
通过使用上述切换准则,无人机自发地演化成不同的分区形态,其中一个稳定的形态定义为Nash稳定的分区。定义
Figure BDA00039045637400001911
为无人机i所属的分区,即
Figure BDA00039045637400001912
如果对于每一架无人机
Figure BDA00039045637400001913
都有不等式
Figure BDA00039045637400001914
成立,那么,分区Π是一个Nash稳定的分区。
针对任何可能执行的任务dr
Figure BDA00039045637400001915
如果无人机i,
Figure BDA00039045637400001916
与其对应的虚拟智能体i分别使用所设计的控制策略
Figure BDA00039045637400001917
Figure BDA00039045637400001918
那么在切换准则的作用下,任意初始的无人机分区Π0可以收敛至一个最终的无人机分区Π*。并且,这个最终的无人机分区Π*是一个Nash稳定的分区。
步骤四、根据获取的三个环节的最优控制策略遵循任务分配、航迹规划、编队控制的顺序正向运行获得多飞行器任务分配、航迹规划和编队控制。具体步骤包括:
(1)初始化无人机的集合
Figure BDA0003904563740000201
任务的集合
Figure BDA0003904563740000202
无人机的初始分区
Figure BDA0003904563740000203
初始权重
Figure BDA0003904563740000204
Gr、Fr、Qr、Rr、Lr
(2)建立匿名享乐博弈,实现任务分配。针对当前的无人机分区Π(首次迭代之时,Π=Π0),判断下述公式是否成立;
Figure BDA0003904563740000205
若成立,执行一次切换操作:具体为:
(2.1)离开当前的联盟:
Figure BDA0003904563740000206
(2.2)加入一个新的联盟:
Figure BDA0003904563740000207
(2.3)更新分区Π:分别利用联盟
Figure BDA0003904563740000208
Figure BDA0003904563740000209
替代联盟
Figure BDA00039045637400002010
Figure BDA00039045637400002011
重复步骤(2.1)-(2.3)直到分区Π收敛至最终的Nash稳定的分区Π。
(3)建立斯坦伯格微分图博弈:获取航迹规划和编队控制。
在Nash稳定的分区Π下,根据所分配的任务重新标记联盟中的无人机,并为无人机配备虚拟智能体,执行下述操作:
(3.1)根据输出无人机分区Π,采用无人机最优航迹规划策略
Figure BDA00039045637400002012
最小化性能指标Γr获得航迹规划
Figure BDA00039045637400002013
(3.2)根据获取的无人机分区Π、航迹规划
Figure BDA00039045637400002014
采用无人机最优编队控制策略
Figure BDA00039045637400002015
最小化性能指标Jr获得编队控制ur
重复步骤(2)-(3)直到策略收敛至Gestalt Nash均衡点。
本发明实施例中以一个由5架无人机构成的集群来验证所提出的一体化博弈方法有效性。
首先,初始化无人机的位置和速度。将各个无人机的初始位置分别设置为:
p1(0)=[0.480.62]T,p2(0)=[1.520.65]T,
p3(0)=[2.560.60]T,p4(0)=[5.006.00]T,
p5(0)=[7.009.00]T.
各个无人机的初始速度分别设置为:
v1(0)=[0.550.81]T,v2(0)=[0.520.86]T,
v3(0)=[0.470.86]T,v4(0)=[0.270.11]T,
v5(0)=[0.220.26]T.
设置虚拟智能体和无人机具有相同的初始条件。任务中的每个无人机期望位置和期望速度分别设置为:
Figure BDA0003904563740000211
Figure BDA0003904563740000212
Figure BDA0003904563740000213
设计性能指标中的权重矩阵,对于
Figure BDA0003904563740000214
Figure BDA0003904563740000215
Figure BDA0003904563740000216
通过使用本发明所设计的控制策略,分别得到无人机执行每一个任务所需要的代价,如图3所示。进一步,通过最小化全局的性能指标,得到各无人机任务分配的结果为:
Figure BDA0003904563740000217
Figure BDA0003904563740000218
Figure BDA0003904563740000219
Figure BDA00039045637400002110
Figure BDA00039045637400002111
结合图3所示的内容,从个体无人机的角度和整体集群的角度来分析任务分配的结果。首先,从个体无人机的角度而言:每个无人机或更倾向于选择消耗代价较小的任务。因此,自图3可以看出,无人机1-无人机3倾向于选择加入联盟
Figure BDA0003904563740000221
来一起完成任务d[1],而无人机4和无人机5倾向于加入联盟
Figure BDA0003904563740000222
来执行任务d[2]。其中,无人机4执行任务
Figure BDA0003904563740000223
和任务
Figure BDA0003904563740000224
所需要的代价是相同的。但是,由于受到社会性抑制的影响,无人机4倾向于选择加入联盟
Figure BDA0003904563740000225
而非联盟
Figure BDA0003904563740000226
其次,从整体集群的角度:任务分配的总目标是最小化全局的性能指标。虽然同样分配无人机4和无人机5执行任务
Figure BDA0003904563740000227
无人机5所需的代价会比无人机4所需的代价高,但是从最小化全局性能指标的角度来说,任务
Figure BDA0003904563740000228
仍然会被分配给无人机5。同时,分配的结果符合无人机4和无人机5的个体偏好。
综合两个角度可以看出采用本发明所述方案在任务分配环节,最终的分配结果符合每个无人机个体的偏好、同时保证集群飞行器达到全局最优的性能。
基于上述任务分配的结果,建立无人机和虚拟智能体之间的斯坦伯格微分图博弈实现航迹规划和编队控制。图4展示了各无人机真实的飞行轨迹与参考的飞行轨迹之间的轨迹误差随时间变化的曲线。图中仿真结果表明,所设计的编队控制策略可以驱使无人机跟随参考的飞行轨迹,且飞行过程中,轨迹误差渐近收敛至0。图5展示了无人机1-5实时编队的情况,结果表明,所设计的编队控制策略可以使得无人机跟随参考的飞行轨迹到达目的地。图6展示了联盟
Figure BDA0003904563740000229
中无人机1-3的实时编队情况,图7中展示了联盟
Figure BDA00039045637400002210
中无人机4和5的实时编队情况。图8和图9展示了无人机1-6在编队过程中速度随时间变化的曲线。结果表明,当无人机到达最终的目的地时,无人机达到期望的速度。综上,利用本发明所获得的轨迹规划与编队控制符合期望要求。
综上,本发明所述的方法不但可以保证多飞行器在任务分配、航迹规划和编队控制中每个环节性能的双向调节,还可以同步实现集群飞行器的稳定性和最优性能。

Claims (7)

1.一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法,其特征在于,包括以下步骤:
(1)建立单架无人机的动态模型、无人机分区、无人机的个体偏好和整个无人机集群的信息交互拓扑图;
(2)建立任务分配、航迹规划和编队控制的一体化博弈框架;基于步骤(1)中建立的每架无人机模型、无人机分区、无人机个体偏好在一体化博弈框架下为每架无人机任务分配、航迹规划和编队控制三个环节分别设计性能指标且任务分配的性能指标、航迹规划的性能指标和编队控制的性能指标相互耦合;
(3)设计反向策略机制,遵循编队控制、航迹规划、任务分配的运行顺序,利用反馈信息优化各环节的性能指标并设计每架无人机于每个环节的最优博弈控制策略模型,计算获取每架无人机于每个环节的最优控制策略;所述的反馈信息包括编队控制环节输出的状态误差量、编队控制环节的最优控制输入、航迹规划环节的最优控制输入;
(4)根据获取的每架无人机于三个环节的最优控制策略遵循无人机任务分配、航迹规划、编队控制的顺序运行获得优化的每架无人机任务分配、航迹规划和编队控制。
2.根据权利要求1所述的多飞行器任务分配、航迹规划和编队控制一体化博弈方法,其特征在于,步骤(1)具体包括:
(1.1)构建一个S架无人机的集群,定义
Figure FDA0003904563730000011
为无人机的集合;即单架无人机i,
Figure FDA0003904563730000012
的动态模型为:
Figure FDA0003904563730000013
Figure FDA0003904563730000014
式中,
Figure FDA0003904563730000015
表示t时刻下无人机i的位置;vi(t)表示t时刻下无人机i的速度;ui(t)表示t时刻下无人机i的控制输入;
令:
Figure FDA0003904563730000016
式中,pi为无人机位置;vi为无人机速度;
单架无人机i,
Figure FDA0003904563730000017
的动态模型改写为:
Figure FDA0003904563730000021
式中,
Figure FDA0003904563730000022
q为正整数;xi(t)表示t时刻下xi
Figure FDA0003904563730000023
为xi(t)的动态表征;
(1.2)根据实际期望位置所属的地理区域不同对任务进行分区,每个任务分区表示为:
Figure FDA0003904563730000024
k为任务分区编号,
Figure FDA0003904563730000025
为任务分区集合,
Figure FDA0003904563730000026
为任务分区的数量;由于无人机与任务一一匹配,故根据任务的分区获得无人机分区表示为:
Figure FDA0003904563730000027
且满足以下条件:
Figure FDA0003904563730000028
Figure FDA0003904563730000029
式中,Dk是执行任务d[k]的无人机联盟;m为任务分区集合中不为k的任务分区编号;
Figure FDA00039045637300000210
为执行任务d[m]的无人机联盟;
为每个任务分区d[k]设置nk+1个任务,即
Figure FDA00039045637300000211
若将任务
Figure FDA00039045637300000212
分配给无人机i,即无人机i重新被标记为r[k],无人机联盟Dk表示为:Dk={0[k],1[k],…,nk [k]},
Figure FDA00039045637300000213
(1.3)设计任务分配环节的无人机i的性能指标为:
Figure FDA00039045637300000214
式中,
Figure FDA00039045637300000215
Figure FDA00039045637300000216
表示期望的位置,
Figure FDA00039045637300000217
表示期望的速度;
Figure FDA00039045637300000218
表示任务--联盟对,即与nk架无人机一起执行任务
Figure FDA00039045637300000219
建立无人机偏好,对于任意一架无人机
Figure FDA00039045637300000220
定义
Figure FDA00039045637300000221
为一个偏好选择,对于k,
Figure FDA00039045637300000222
k≠m,
Figure FDA00039045637300000223
表达式
Figure FDA00039045637300000224
表示相较于任务--联盟对
Figure FDA00039045637300000225
无人机i更愿意选择任务-联盟对
Figure FDA00039045637300000226
即无人机的个人偏好表达式为:
Figure FDA00039045637300000227
(1.4)采用图论描述每个联盟内的无人机的信息交互得到整个无人机集群的信息交互拓扑图;其中,联盟Dk内信息交互拓扑图定义为:
Figure FDA0003904563730000031
εk为图中节点的连边,表征两架无人机之间的信息交互。
3.根据权利要求2所述的多飞行器任务分配、航迹规划和编队控制一体化博弈方法,其特征在于,步骤(2)具体包括:
(2.1)在航迹规划环节中为每一架无人机配备了一个负责产生期望的飞行轨迹的虚拟智能体,设计每一架无人机与对应的虚拟智能体具有相同的系统动态,表示为:
Figure FDA0003904563730000032
式中,zr(t)表示t时刻下虚拟智能体的状态;
Figure FDA0003904563730000033
表示t时刻下虚拟智能体的控制输入;
Figure FDA0003904563730000034
为zr(t)的动态表征;
(2.2)建立任务分配、航迹规划和编队控制三个环节的一体化博弈框架,所述一体化博弈框架为:针对无人机与任务建立匿名享乐博弈实现任务分配,使得每一架无人机根据自我的偏好,选择不同任务,并形成对应的无人机联盟;在每个无人机联盟内部,建立斯坦伯格微分图博弈,实现航迹规划和编队控制;其中,虚拟智能体担任领导者产生期望的飞行轨迹,无人机担任跟随者实现编队飞行;
(2.3)基于一体化博弈框架为无人机任务分配、航迹规划和编队控制三个环节设计一组耦合的性能指标,具体包括:
针对愿意选择加入的联盟Dk的无人机i定义其航迹规划的性能指标为Γr、编队控制环节的性能指标为Jr;其中:
Figure FDA0003904563730000035
式中,zr表示智能体的状态;dr=d[k]表示无人机任务分区;
Figure FDA0003904563730000036
Gr、Fr均表示性能指标Γr中的权重矩阵;
Figure FDA0003904563730000037
表示虚拟智能体的控制输入即航迹规划环节的策略;ur表示无人机的控制输入即编队控制环节的策略;
Figure FDA0003904563730000041
式中,
Figure FDA0003904563730000042
Qr、Rr、Lr均表示性能指标Jr中的权重矩阵;
设计任务分配环节的性能指标Wi为航迹规划和编队控制两个环节的性能指标相加,具体为:
Figure FDA0003904563730000043
4.根据权利要求2所述的多飞行器任务分配、航迹规划和编队控制一体化博弈方法,其特征在于,步骤(3)具体包括:
(3.1)设计编队控制环节的博弈控制策略模型,具体包括:
(3.1.1)给定任意可行的无人机分区Π、任意可行的航迹规划的策略
Figure FDA0003904563730000044
定义状态误差向量
Figure FDA0003904563730000045
根据状态误差向量优化编队控制环节的性能指标为Jr得到:
Figure FDA0003904563730000046
(3.1.2)针对联盟
Figure FDA0003904563730000047
中无人机编队控制环节的博弈控制策略模型为:基于给定Π,
Figure FDA0003904563730000048
Figure FDA0003904563730000049
Figure FDA00039045637300000410
约束条件为:
Figure FDA00039045637300000411
式中,u-r表示联盟
Figure FDA00039045637300000412
中除了无人机r以外的其他无人机的策略集合;
Figure FDA00039045637300000413
为状态误差向量系统的动态表征;
Figure FDA0003904563730000051
Figure FDA0003904563730000052
(3.1.3)计算获得无人机最优编队控制策略,公式为:
Figure FDA0003904563730000053
式中,
Figure FDA0003904563730000054
为无人机最优编队控制策略;Rr为性能指标中控制输入的权重矩阵,Br为输入矩阵,Pr为不对称黎卡提微分方程的解;
(3.2)设计航迹规划环节的博弈控制策略模型,具体包括:
(3.2.1)同一联盟中的虚拟智能体的动态表征为:
Figure FDA0003904563730000055
式中,
Figure FDA0003904563730000056
为z的动态表征;
航迹规划的性能指标为Γr重新表示为:
Figure FDA0003904563730000057
式中,
Figure FDA0003904563730000058
(3.2.2)无人机航迹规划环节的博弈控制策略模型为:
Figure FDA0003904563730000059
约束条件为:
Figure FDA00039045637300000510
Figure FDA00039045637300000511
(3.2.3)计算获得无人机最优航迹规划策略,公式为:
Figure FDA00039045637300000512
式中,
Figure FDA00039045637300000513
Figure FDA00039045637300000514
为斜态变量,
Figure FDA00039045637300000515
(3.3)设计任务分配环节的博弈控制策略模型,具体包括:
(3.3.1)任务分配环节的博弈控制策略模型为:
Figure FDA0003904563730000061
约束条件:
Figure FDA0003904563730000062
δir∈{0,1},
Figure FDA0003904563730000063
Figure FDA0003904563730000064
式中,δir是任务与无人机的匹配因子;
(3.3.2)基于步骤(3.1)与步骤(3.2)获取的最优编队控制策略与最优航迹规划策略,根据切换准则搜索获取每个无人机对应的最优无人机分区Π*
所述切换准则为:对于一个无人机的分区
Figure FDA0003904563730000065
无人机i选择离开其所在的联盟
Figure FDA0003904563730000066
加入另一个联盟
Figure FDA0003904563730000067
k≠m当且仅当存在一个任务dr
Figure FDA0003904563730000068
使得:
Figure FDA0003904563730000069
则新成立的无人机分区可以表示为
Figure FDA00039045637300000610
5.根据权利要求4所述的多飞行器任务分配、航迹规划和编队控制一体化博弈方法,其特征在于,步骤(4)具体包括:
(4.1)初始化无人机的集合、任务的集合、无人机的初始分区、初始权重;
(4.2)针对当前的无人机分区,判断当前无人机的分区是否符合该无人机个体偏好,即判断下式是否成立:
Figure FDA00039045637300000611
式中,
Figure FDA00039045637300000612
表示联盟中无人机l的最优编队控制策略;
Figure FDA00039045637300000613
表示联盟中无人机l的最优航迹规划策略;nΠ(i)为当前分区Π的无人机数量;
若成立,则无人机离开当前联盟加入新的联盟并更新分区,转至步骤(4.3);若不成立,则输出无人机分区,转至步骤(4.4);所述公式为:
(4.3)重复步骤(4.2)直至步骤(4.2)中公式成立,则输出无人机分区,该无人机分区为最优分区;
(4.4)根据输出无人机分区,采用无人机最优航迹规划策略
Figure FDA0003904563730000071
最小化性能指标Γr获得航迹规划;
(4.5)根据获取的无人机分区、航迹规划,采用无人机最优编队控制策略
Figure FDA0003904563730000072
最小化性能指标Jr获得编队控制。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至5中任意一项所述的方法的步骤。
7.一种调试设备,其特征在于,存储器、处理器及在所述存储器上存储并可运行的程序,所述程序被处理器执行时实现如权利要求1至5中任一项所述方法的步骤。
CN202211300744.6A 2022-10-24 2022-10-24 多飞行器任务分配、航迹规划和编队控制一体化博弈方法 Pending CN115562342A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211300744.6A CN115562342A (zh) 2022-10-24 2022-10-24 多飞行器任务分配、航迹规划和编队控制一体化博弈方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211300744.6A CN115562342A (zh) 2022-10-24 2022-10-24 多飞行器任务分配、航迹规划和编队控制一体化博弈方法

Publications (1)

Publication Number Publication Date
CN115562342A true CN115562342A (zh) 2023-01-03

Family

ID=84747283

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211300744.6A Pending CN115562342A (zh) 2022-10-24 2022-10-24 多飞行器任务分配、航迹规划和编队控制一体化博弈方法

Country Status (1)

Country Link
CN (1) CN115562342A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115877871A (zh) * 2023-03-03 2023-03-31 北京航空航天大学 一种基于强化学习的非零和博弈无人机编队控制方法
CN117492446A (zh) * 2023-12-25 2024-02-02 北京大学 一种基于组合混合优化的多智能体合作规划方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104359473A (zh) * 2014-10-24 2015-02-18 南京航空航天大学 一种动态环境下无人机编队飞行的协同航迹智能规划方法
CN108229719A (zh) * 2017-11-29 2018-06-29 合肥工业大学 无人机编队任务分配与航迹规划的多目标优化方法及装置
CN108388270A (zh) * 2018-03-21 2018-08-10 天津大学 面向安全域的集群无人机轨迹姿态协同控制方法
CN109871032A (zh) * 2019-03-04 2019-06-11 中科院成都信息技术股份有限公司 一种基于模型预测控制的多无人机编队协同控制方法
CN111221352A (zh) * 2020-03-03 2020-06-02 中国科学院自动化研究所 基于多无人机协同博弈对抗的控制系统
CN113359848A (zh) * 2021-07-06 2021-09-07 西北工业大学 一种基于航路点的无人机编队生成-切换航迹规划方法
WO2022194310A1 (zh) * 2021-08-18 2022-09-22 中国电子科技集团公司第二十八研究所 一种航班飞行轨迹多目标动态规划方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104359473A (zh) * 2014-10-24 2015-02-18 南京航空航天大学 一种动态环境下无人机编队飞行的协同航迹智能规划方法
CN108229719A (zh) * 2017-11-29 2018-06-29 合肥工业大学 无人机编队任务分配与航迹规划的多目标优化方法及装置
CN108388270A (zh) * 2018-03-21 2018-08-10 天津大学 面向安全域的集群无人机轨迹姿态协同控制方法
CN109871032A (zh) * 2019-03-04 2019-06-11 中科院成都信息技术股份有限公司 一种基于模型预测控制的多无人机编队协同控制方法
CN111221352A (zh) * 2020-03-03 2020-06-02 中国科学院自动化研究所 基于多无人机协同博弈对抗的控制系统
CN113359848A (zh) * 2021-07-06 2021-09-07 西北工业大学 一种基于航路点的无人机编队生成-切换航迹规划方法
WO2022194310A1 (zh) * 2021-08-18 2022-09-22 中国电子科技集团公司第二十八研究所 一种航班飞行轨迹多目标动态规划方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈侠;李光耀;于兴超;: "基于博弈策略的多无人机航迹规划研究", 战术导弹技术, no. 01, 15 January 2020 (2020-01-15) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115877871A (zh) * 2023-03-03 2023-03-31 北京航空航天大学 一种基于强化学习的非零和博弈无人机编队控制方法
CN117492446A (zh) * 2023-12-25 2024-02-02 北京大学 一种基于组合混合优化的多智能体合作规划方法及系统

Similar Documents

Publication Publication Date Title
CN115562342A (zh) 多飞行器任务分配、航迹规划和编队控制一体化博弈方法
CN113395676B (zh) 一种基于重叠联盟形成博弈的无人机任务协作方法
CN105302153B (zh) 异构多无人机协同察打任务的规划方法
CN111522258B (zh) 多无人机协同控制仿真系统及其构建方法、仿真方法
CN111552314B (zh) 多无人机自适应编队跟踪控制方法
CN111522361B (zh) 主-从模式的多无人机编队一致性控制方法
CN110502034B (zh) 一种基于深度强化学习的固定翼无人机群集控制方法
CN112511250B (zh) 一种基于drl的多无人机空中基站动态部署方法及系统
CN110673649B (zh) 基于拓扑优化的时变信道下无人机编队一致性控制方法、系统、装置及存储介质
CN110347181B (zh) 基于能耗的无人机分布式编队控制方法
CN113359437B (zh) 基于演化博弈的多智能体编队的分层模型预测控制方法
CN112650290B (zh) 带有扰动补偿的高层消防无人机编队优化控制方法及系统
CN112198892A (zh) 一种多无人机智能协同突防对抗方法
CN115877871B (zh) 一种基于强化学习的非零和博弈无人机编队控制方法
CN113485344A (zh) 一种多智能体输出编队跟踪控制方法及系统
US20230297859A1 (en) Method and apparatus for generating multi-drone network cooperative operation plan based on reinforcement learning
CN116227767A (zh) 基于深度强化学习的多无人机基站协同覆盖路径规划方法
CN115016537B (zh) 一种sead场景下异构无人机配置与任务规划联合优化方法
CN113625767A (zh) 一种基于优选信息素灰狼算法的固定翼无人机集群协同路径规划方法
Abouheaf et al. Dynamic graphical games: online adaptive learning solutions using approximate dynamic programming
Ghouri et al. Attitude control of quad-copter using deterministic policy gradient algorithms (DPGA)
CN110032204A (zh) 输入时延下多空间飞行器姿态协同控制方法
Bai et al. An improved PPO for multiple unmanned aerial vehicles
CN110716585B (zh) 基于分布式一致性与自组网的自主协同控制方法及系统
CN111596688A (zh) 基于连续通信的多无人机编队一致性控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination