CN114993108A - 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法 - Google Patents

一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法 Download PDF

Info

Publication number
CN114993108A
CN114993108A CN202210535338.1A CN202210535338A CN114993108A CN 114993108 A CN114993108 A CN 114993108A CN 202210535338 A CN202210535338 A CN 202210535338A CN 114993108 A CN114993108 A CN 114993108A
Authority
CN
China
Prior art keywords
function
guidance
cooperative
representing
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210535338.1A
Other languages
English (en)
Other versions
CN114993108B (zh
Inventor
高煜欣
刘春生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202210535338.1A priority Critical patent/CN114993108B/zh
Publication of CN114993108A publication Critical patent/CN114993108A/zh
Application granted granted Critical
Publication of CN114993108B publication Critical patent/CN114993108B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F41WEAPONS
    • F41GWEAPON SIGHTS; AIMING
    • F41G7/00Direction control systems for self-propelled missiles
    • F41G7/20Direction control systems for self-propelled missiles based on continuous observation of target position
    • F41G7/22Homing guidance systems
    • F41G7/2233Multimissile systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • General Engineering & Computer Science (AREA)
  • Aiming, Guidance, Guns With A Light Source, Armor, Camouflage, And Targets (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公开了一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法,包括如下步骤:利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑;基于通讯拓扑,推导制导模型,同时引入障碍函数,并建立局部邻域一致误差方程;基于局部邻域一致误差方程并结合周期事件触发机制,推导最优触发饱和制导策略;利用自适应动态规划技术构建评价网络,实施最优触发制导策略。本发明通过周期事件触发机制的引入,节约了通信带宽资源,提升了信息的利用率,同时避免了芝诺现象的发生。

Description

一种基于全状态动态约束的分布式周期事件触发饱和协同制 导方法
技术领域
本发明涉及多约束条件下多弹协同制导领域,尤其是一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法。
背景技术
多弹协同作战相较于一对一作战模式而言,大幅度提升了作战效率,有效降低了拦截目标的逃逸概率,是近年来制导领域研究的热点。在实际制导过程中,受导弹物理因素限制,导弹执行机构、物理器件等都存在承受范围,因此,研究约束条件下的协同制导策略具有实际意义。通常,对协同制导的研究等价为对多智能体系统的研究,且目前也有许多该策略的研究成果,但是在现有针对状态受限的多智能体协同控制研究中,约束条件大多是静态的、对称的。然而,战场环境复杂,存在许多动态非对称的情况。例如,在导弹集群作战中,为了避免与障碍物发生碰撞,需要考虑约束条件,当障碍物为机动的邻域导弹或者飞行的鸟群时,静态、对称的显然难以满足需求。并且,例如导弹尾鳍等执行机构也存在操作范围,超过范围可能会导致智能体受损。因此,考虑动态非对称和输入受限约束更加符合实际应用的要求。同时,多数研究成果仅考虑了系统的稳定性,忽略了最优性问题。因此,发展多约束下最优协同制导方法具有实际意义,该控制策略实现的前提是求解其相关的Hamilton-Jacobi-Bellman(HJB)方程,然而在非线性系统中,HJB方程求解困难。自适应动态规划技术被广泛应用于最优控制问题中,该方法利用函数近似结构来估计代价函数,用于按时间正向求解动态规划问题,可以有效近似HJB方程的解析解。此外,制导系统资源和通信带宽是有限的,而传统的时间触发控制通信压力较大,控制输入更新较为频繁,造成资源浪费。因此,在设计最优协同制导策略的过程中,提升信息利用率显得尤为重要。
发明内容
本发明所要解决的技术问题在于,提供一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法,拓展了多约束非线性协同制导领域,全状态满足动态约束,而且控制策略不仅在受限范围内,同时节约通信资源。
为解决上述技术问题,本发明提供一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法,包括如下步骤:
步骤1、利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑;
步骤2、基于通讯拓扑,推导制导模型,同时引入障碍函数,并建立局部邻域一致误差方程;
步骤3、基于局部邻域一致误差方程并结合周期事件触发机制,推导最优触发饱和制导策略;
步骤4、利用自适应动态规划技术构建评价网络,实施最优触发制导策略。
优选的,步骤1中,利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑具体为:通讯拓扑表示为如下有向图:
Figure BDA0003647777330000021
其中,
Figure BDA0003647777330000022
表示节点个体集合,
Figure BDA0003647777330000023
表示节点通讯链接集合,A=[aij]∈RN×N,aij≥0表示权值链接矩阵,如果(i,j)∈ε,则表明节点j是节点i的邻域个体,此时aij=1;否则,aij=0;将节点i的所有邻域个体的集合表示为Ni={j:(i,j)∈ε},定义入度矩阵D=diag{d1,d2,…,dN},其中
Figure BDA0003647777330000024
表示节点i的邻域个体的数量,定义图
Figure BDA0003647777330000025
的拉普拉斯矩阵为L=D-A且所有行的和为零,考虑图
Figure BDA0003647777330000026
为强联通的有向图且aii=0;另外,节点i与领导者之间的连接矩阵表示为B=diag{b1,b2,…,bN},其中,bi=1表示节点i能够接收领导者信息;否则,bi=0。
优选的,步骤2中,基于通讯拓扑,推导制导模型,同时引入障碍函数,并建立局部邻域一致误差方程具体为:二维平面N枚导弹协同拦截同一目标模型表达为如下相对运动方程:
Figure BDA0003647777330000027
Figure BDA0003647777330000028
Figure BDA0003647777330000029
Figure BDA00036477773300000210
其中Mi代表第i枚导弹,T代表目标,考虑所有导弹和目标的运动为质点运动且速度大小均为恒定值,Vi和VT分别表示第i枚导弹和目标的速度;
Figure BDA00036477773300000211
和γT分别表示第i枚导弹的目标的航迹倾角;γMiT表示第i枚导弹与目标之间视线角;ri表示第i枚导弹和目标之间的距离,则其相对速率表示为
Figure BDA0003647777330000031
ui和ν分别第i枚导弹和目标垂直于速度向量的加速度,各枚导弹之间主要依靠通讯拓扑网络进行通讯,即第i枚导弹只与其邻域导弹进行通信;
第i枚导弹和目标均表现为如下一阶自动驾驶仪:
Figure BDA0003647777330000032
Figure BDA0003647777330000033
Figure BDA0003647777330000034
Figure BDA0003647777330000035
其中
Figure BDA0003647777330000036
表示第i枚拦截弹的坐标位置;ai表示拦截弹的侧向加速度;
Figure BDA0003647777330000037
表示拦截弹自动驾驶仪时间常数,设定时间常数为0.1s;相应的目标自动驾驶仪表达式为:
Figure BDA0003647777330000038
Figure BDA0003647777330000039
Figure BDA00036477773300000310
Figure BDA00036477773300000311
其中(xT,yT)表示目标的坐标位置;aT表示目标的侧向加速度;τT表示目标自动驾驶仪时间常数,设定时间常数为0.1s;
基于隐形协同制导方式,将视线角作为协同变量,定义状态量
Figure BDA00036477773300000312
则协同拦截制导模型可以表示为如下仿射非线性动力学:
Figure BDA00036477773300000313
其中
Figure BDA00036477773300000314
分别表示第i个导弹的系统状态函数和控制系数函数,考虑控制输入受限,即满足|ui(t)|≤λi,同时,系统满足如下全状态动态约束条件:
xi(t)∈Ωi:={(t,xi):xiL(t)≤xi≤xiH(t)} (6
其中xiL(t)∈Rn,xiH(t)∈Rn分别表示系统状态的下约束函数和上约束函数,且具有如下动态:
Figure BDA0003647777330000041
其中θiL(@)、θiH(@)为有界函数使得xiL(t)、xiH(t)有界,且满足xiL(t)<0<xiH(t),为了保证系统状态满足约束条件,引入如下障碍函数:
Figure BDA0003647777330000042
且满足初始条件xiL(0)<xi(0)<xiH(0),注意到当xi(t)接近其边界时si→∞,对(4)式求导可得:
Figure BDA0003647777330000043
其中
Figure BDA0003647777330000044
Figure BDA0003647777330000045
定义Fi(xi)=si1fi(xi)+si2,Gi(xi)=si1gi(xi),第i个导弹动力学模型被重写为:
Figure BDA0003647777330000046
则针对第i个导弹,建立如下局部邻域一致误差系统:
Figure BDA0003647777330000047
其中
Figure BDA0003647777330000048
x0为领导者信号,假设x0及其导数
Figure BDA0003647777330000049
都是连续的,并且当bi≠0时,第i个导弹可以接收到领导者信息,(13)式求导可得:
Figure BDA00036477773300000410
其中
Figure BDA00036477773300000411
优选的,步骤3中,基于局部邻域一致误差方程并结合周期事件触发机制,推导最优触发饱和制导策略具体为:定义如下局部性能指标函数:
Figure BDA0003647777330000051
其中Qi,Rii,Rij为设计的正定对称矩阵,Ui(@)为关于ui的半正定函数使得控制输入满足约束条件,具体表达式如下:
Figure BDA0003647777330000052
其中
Figure BDA0003647777330000053
为由矩阵Rii对角元素组成的行矩阵,
Figure BDA0003647777330000054
为相同维度且各元素都为1的列矩阵;
定义如下Hamilton函数为:
Figure BDA0003647777330000055
针对第i个导弹,定义采样周期为h(大于零)和一个单调递增的时间瞬间序列
Figure BDA0003647777330000056
记测量采样瞬间
Figure BDA0003647777330000057
基于(8)式,一一对应关系可得触发系统状态为
Figure BDA0003647777330000058
接着,定义如下触发误差:
Figure BDA0003647777330000059
得到如下基于事件的局部邻域一致误差系统和触发测量误差为:
Figure BDA00036477773300000510
Figure BDA00036477773300000511
同时,推断出下一个触发时间为:
Figure BDA00036477773300000512
其中
Figure BDA00036477773300000513
为触发条件;
则最优饱和触发控制策略为:
Figure BDA00036477773300000514
其中
Figure BDA0003647777330000061
代入(18)式得到如下触发Hamilton函数:
Figure BDA0003647777330000062
优选的,步骤4中,利用自适应动态规划技术构建评价网络,实施最优触发制导策略具体为:构造如下评价网络近似性能指标函数,其期望形式为:
Figure BDA0003647777330000063
其中
Figure BDA0003647777330000064
为评价网络期望权值,
Figure BDA00036477773300000615
为评价网络激励函数,εi(zi)表示近似误差;
对(25)式求偏导,其关于状态的偏导数表示为:
Figure BDA0003647777330000065
其中
Figure BDA0003647777330000066
由于评价网络理想权值是未知的,利用评价网络输出信号估计理想权值,则有:
Figure BDA0003647777330000067
Figure BDA0003647777330000068
则可以推导出近似饱和触发控制策略为:
Figure BDA0003647777330000069
相应的,代入触发Hamilton函数得近似误差函数:
Figure BDA00036477773300000610
设计权值更新律使得
Figure BDA00036477773300000611
从而保证Hamilton近似误差最小,为了使得估计权值逼近理想权值,设计如下目标函数:
Figure BDA00036477773300000612
基于梯度下降法,设计权值更新律,保证目标函数最小化,同时为了保证闭环系统在学习的过程中信号的有界性,在更新律中引入一个连续可微的径向无界Lyapunov函数Ji(zi),满足
Figure BDA00036477773300000613
其中
Figure BDA00036477773300000614
表示Ji(zi)对时间的导数,
Figure BDA0003647777330000071
表示Ji(zi)对zi的偏导数,即
Figure BDA0003647777330000072
因此,权值更新律具体形式如下:
Figure BDA0003647777330000073
其中βi为学习律,
Figure BDA0003647777330000074
被定义为满足如下条件的开关函数:
Figure BDA0003647777330000075
触发条件如下:
Figure BDA0003647777330000076
其中
Figure BDA0003647777330000077
为设计的常数,κmin(·),κman(·)分别为相应矩阵的最小/大特征值,
Figure BDA0003647777330000078
为常数。
本发明的有益效果为:(1)本发明考虑了全状态动态约束下多导弹系统的协同制导问题,与现有大多数静态约束条件不同,系统状态满足的约束条件为一个动态的非对称函数;(2)本发明在设计协同制导策略的同时,考虑输入饱和受限问题,使得所设计的制导策略更加合理,更加满足系统执行机构存在物理承受范围的客观因素;(3)本发明通过周期事件触发机制的引入,节约了通信带宽资源,提升了信息的利用率,同时避免了芝诺现象的发生。
附图说明
图1为本发明的多弹协同制导二维平面相对运动示意图。
图2为本发明的方法流程示意图。
具体实施方式
如图1和图2所示,一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法,包括如下步骤:
步骤1、利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑;通讯拓扑表示为如下有向图:
Figure BDA0003647777330000081
其中,
Figure BDA0003647777330000082
表示节点个体集合,
Figure BDA0003647777330000083
表示节点通讯链接集合,A=[aij]∈RN×N,aij≥0表示权值链接矩阵,如果(i,j)∈ε,则表明节点j是节点i的邻域个体,此时aij=1;否则,aij=0;将节点i的所有邻域个体的集合表示为Ni={j:(i,j)∈ε},定义入度矩阵D=diag{d1,d2,…,dN},其中
Figure BDA0003647777330000084
表示节点i的邻域个体的数量,定义图
Figure BDA0003647777330000085
的拉普拉斯矩阵为L=D-A且所有行的和为零,考虑图
Figure BDA0003647777330000086
为强联通的有向图且aii=0;另外,节点i与领导者之间的连接矩阵表示为B=diag{b1,b2,…,bN},其中,bi=1表示节点i能够接收领导者信息;否则,bi=0。
步骤2、基于通讯拓扑,推导制导模型,同时引入障碍函数,并建立局部邻域一致误差方程;二维平面N枚导弹协同拦截同一目标模型表达为如下相对运动方程:
Figure BDA0003647777330000087
Figure BDA0003647777330000088
Figure BDA0003647777330000089
Figure BDA00036477773300000810
其中Mi代表第i枚导弹,T代表目标,考虑所有导弹和目标的运动为质点运动且速度大小均为恒定值,Vi和VT分别表示第i枚导弹和目标的速度;
Figure BDA00036477773300000811
和γT分别表示第i枚导弹的目标的航迹倾角;γMiT表示第i枚导弹与目标之间视线角;ri表示第i枚导弹和目标之间的距离,则其相对速率表示为
Figure BDA00036477773300000812
ui和ν分别第i枚导弹和目标垂直于速度向量的加速度,各枚导弹之间主要依靠通讯拓扑网络进行通讯,即第i枚导弹只与其邻域导弹进行通信;
第i枚导弹和目标均表现为如下一阶自动驾驶仪:
Figure BDA00036477773300000813
Figure BDA00036477773300000814
Figure BDA00036477773300000815
Figure BDA00036477773300000816
其中
Figure BDA0003647777330000091
表示第i枚拦截弹的坐标位置;ai表示拦截弹的侧向加速度;
Figure BDA0003647777330000092
表示拦截弹自动驾驶仪时间常数,设定时间常数为0.1s;相应的目标自动驾驶仪表达式为:
Figure BDA0003647777330000093
Figure BDA0003647777330000094
Figure BDA0003647777330000095
Figure BDA0003647777330000096
其中(xT,yT)表示目标的坐标位置;aT表示目标的侧向加速度;τT表示目标自动驾驶仪时间常数,设定时间常数为0.1s;
基于隐形协同制导方式,将视线角作为协同变量,定义状态量
Figure BDA0003647777330000097
则协同拦截制导模型可以表示为如下仿射非线性动力学:
Figure BDA0003647777330000098
其中
Figure BDA0003647777330000099
分别表示第i个导弹的系统状态函数和控制系数函数,考虑控制输入受限,即满足|ui(t)|≤λi,同时,系统满足如下全状态动态约束条件:
xi(t)∈Ωi:={(t,xi):xiL(t)≤xi≤xiH(t)} (6)
其中xiL(t)∈Rn,xiH(t)∈Rn分别表示系统状态的下约束函数和上约束函数,且具有如下动态:
Figure BDA00036477773300000910
其中θiL(·)、θiH(·)为有界函数使得xiL(t)、xiH(t)有界,且满足xiL(t)<0<xiH(t),为了保证系统状态满足约束条件,引入如下障碍函数:
Figure BDA00036477773300000911
且满足初始条件xiL(0)<xi(0)<xiH(0),注意到当xi(t)接近其边界时si→∞,对(4)式求导可得:
Figure BDA0003647777330000101
其中
Figure BDA0003647777330000102
Figure BDA0003647777330000103
定义Fi(xi)=si1fi(xi)+si2,Gi(xi)=si1gi(xi),第i个导弹动力学模型被重写为:
Figure BDA0003647777330000104
则针对第i个导弹,建立如下局部邻域一致误差系统:
Figure BDA0003647777330000105
其中
Figure BDA0003647777330000106
x0为领导者信号,假设x0及其导数
Figure BDA0003647777330000107
都是连续的,并且当bi≠0时,第i个导弹可以接收到领导者信息,(13)式求导可得:
Figure BDA0003647777330000108
其中
Figure BDA0003647777330000109
步骤3、基于局部邻域一致误差方程并结合周期事件触发机制,推导最优触发饱和制导策略;定义如下局部性能指标函数:
Figure BDA00036477773300001010
其中Qi,Rii,Rij为设计的正定对称矩阵,Ui(·)为关于ui的半正定函数使得控制输入满足约束条件,具体表达式如下:
Figure BDA00036477773300001011
其中
Figure BDA0003647777330000111
为由矩阵Rii对角元素组成的行矩阵,
Figure BDA0003647777330000112
为相同维度且各元素都为1的列矩阵;定义如下Hamilton函数为:
Figure BDA0003647777330000113
针对第i个导弹,定义采样周期为h(大于零)和一个单调递增的时间瞬间序列
Figure BDA00036477773300001117
记测量采样瞬间
Figure BDA0003647777330000114
基于(8)式,一一对应关系可得触发系统状态为
Figure BDA0003647777330000115
接着,定义如下触发误差:
Figure BDA0003647777330000116
得到如下基于事件的局部邻域一致误差系统和触发测量误差为:
Figure BDA0003647777330000117
Figure BDA0003647777330000118
同时,推断出下一个触发时间为:
Figure BDA0003647777330000119
其中
Figure BDA00036477773300001110
为触发条件;
则最优饱和触发控制策略为:
Figure BDA00036477773300001111
其中
Figure BDA00036477773300001112
代入(18)式得到如下触发Hamilton函数:
Figure BDA00036477773300001113
步骤4、利用自适应动态规划技术构建评价网络,实施最优触发制导策略;构造如下评价网络近似性能指标函数,其期望形式为:
Figure BDA00036477773300001114
其中
Figure BDA00036477773300001115
为评价网络期望权值,
Figure BDA00036477773300001116
为评价网络激励函数,εi(zi)表示近似误差;
对(25)式求偏导,其关于状态的偏导数表示为:
Figure BDA0003647777330000121
其中
Figure BDA0003647777330000122
由于评价网络理想权值是未知的,利用评价网络输出信号估计理想权值,则有:
Figure BDA0003647777330000123
Figure BDA0003647777330000124
则可以推导出近似饱和触发控制策略为:
Figure BDA0003647777330000125
相应的,代入触发Hamilton函数得近似误差函数:
Figure BDA0003647777330000126
设计权值更新律使得
Figure BDA0003647777330000127
从而保证Hamilton近似误差最小,为了使得估计权值逼近理想权值,设计如下目标函数:
Figure BDA0003647777330000128
基于梯度下降法,设计权值更新律,保证目标函数最小化,同时为了保证闭环系统在学习的过程中信号的有界性,在更新律中引入一个连续可微的径向无界Lyapunov函数Ji(zi),满足
Figure BDA0003647777330000129
其中
Figure BDA00036477773300001210
表示Ji(zi)对时间的导数,
Figure BDA00036477773300001211
表示Ji(zi)对zi的偏导数,即
Figure BDA00036477773300001212
因此,权值更新律具体形式如下:
Figure BDA00036477773300001213
其中βi为学习律,
Figure BDA00036477773300001214
被定义为满足如下条件的开关函数:
Figure BDA0003647777330000131
触发条件如下:
Figure BDA0003647777330000132
其中
Figure BDA0003647777330000133
为设计的常数,κmin(·),κman(·)分别为相应矩阵的最小/大特征值,
Figure BDA0003647777330000134
为常数。

Claims (5)

1.一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法,其特征在于,包括如下步骤:
步骤1、利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑;
步骤2、基于通讯拓扑,推导制导模型,同时引入障碍函数,并建立局部邻域一致误差方程;
步骤3、基于局部邻域一致误差方程并结合周期事件触发机制,推导最优触发饱和制导策略;
步骤4、利用自适应动态规划技术构建评价网络,实施最优触发制导策略。
2.如权利要求1所述的基于全状态动态约束的分布式周期事件触发饱和协同制导方法,其特征在于,步骤1中,利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑具体为:通讯拓扑表示为如下有向图:
Figure FDA0003647777320000011
其中,
Figure FDA0003647777320000012
表示节点个体集合,
Figure FDA0003647777320000013
表示节点通讯链接集合,A=[aij]∈RN×N,aij≥0表示权值链接矩阵,如果(i,j)∈ε,则表明节点j是节点i的邻域个体,此时aij=1;否则,aij=0;将节点i的所有邻域个体的集合表示为Ni={j:(i,j)∈ε},定义入度矩阵D=diag{d1,d2,…,dN},其中
Figure FDA0003647777320000014
表示节点i的邻域个体的数量,定义图
Figure FDA0003647777320000015
的拉普拉斯矩阵为L=D-A且所有行的和为零,考虑图
Figure FDA0003647777320000016
为强联通的有向图且aii=0;另外,节点i与领导者之间的连接矩阵表示为B=diag{b1,b2,…,bN},其中,bi=1表示节点i能够接收领导者信息;否则,bi=0。
3.如权利要求1所述的基于全状态动态约束的分布式周期事件触发饱和协同制导方法,其特征在于,步骤2中,基于通讯拓扑,推导制导模型,同时引入障碍函数,并建立局部邻域一致误差方程具体为:二维平面N枚导弹协同拦截同一目标模型表达为如下相对运动方程:
Figure FDA0003647777320000021
其中Mi代表第i枚导弹,T代表目标,考虑所有导弹和目标的运动为质点运动且速度大小均为恒定值,Vi和VT分别表示第i枚导弹和目标的速度;
Figure FDA0003647777320000022
和γT分别表示第i枚导弹的目标的航迹倾角;
Figure FDA00036477773200000211
表示第i枚导弹与目标之间视线角;ri表示第i枚导弹和目标之间的距离,则其相对速率表示为
Figure FDA0003647777320000023
ui和ν分别第i枚导弹和目标垂直于速度向量的加速度,各枚导弹之间主要依靠通讯拓扑网络进行通讯,即第i枚导弹只与其邻域导弹进行通信;
第i枚导弹和目标均表现为如下一阶自动驾驶仪:
Figure FDA0003647777320000024
其中
Figure FDA0003647777320000025
表示第i枚拦截弹的坐标位置;ai表示拦截弹的侧向加速度;
Figure FDA0003647777320000026
表示拦截弹自动驾驶仪时间常数,设定时间常数为0.1s;相应的目标自动驾驶仪表达式为:
Figure FDA0003647777320000027
其中(xT,yT)表示目标的坐标位置;aT表示目标的侧向加速度;τT表示目标自动驾驶仪时间常数,设定时间常数为0.1s;
基于隐形协同制导方式,将视线角作为协同变量,定义状态量
Figure FDA0003647777320000028
则协同拦截制导模型可以表示为如下仿射非线性动力学:
Figure FDA0003647777320000029
其中
Figure FDA00036477773200000210
分别表示第i个导弹的系统状态函数和控制系数函数,考虑控制输入受限,即满足|ui(t)|≤λi,同时,系统满足如下全状态动态约束条件:
xi(t)∈Ωi:={(t,xi):xiL(t)≤xi≤xiH(t)} (6)
其中xiL(t)∈Rn,xiH(t)∈Rn分别表示系统状态的下约束函数和上约束函数,且具有如下动态:
Figure FDA0003647777320000031
其中θiL(·)、θiH(·)为有界函数使得xiL(t)、xiH(t)有界,且满足xiL(t)<0<xiH(t),为了保证系统状态满足约束条件,引入如下障碍函数:
Figure FDA0003647777320000032
且满足初始条件xiL(0)<xi(0)<xiH(0),注意到当xi(t)接近其边界时si→∞,对(4)式求导可得:
Figure FDA0003647777320000033
其中
Figure FDA0003647777320000034
Figure FDA0003647777320000035
定义Fi(xi)=si1fi(xi)+si2,Gi(xi)=si1gi(xi),第i个导弹动力学模型被重写为:
Figure FDA0003647777320000036
则针对第i个导弹,建立如下局部邻域一致误差系统:
Figure FDA0003647777320000037
其中
Figure FDA0003647777320000038
x0为领导者信号,假设x0及其导数
Figure FDA0003647777320000041
都是连续的,并且当bi≠0时,第i个导弹可以接收到领导者信息,(13)式求导可得:
Figure FDA0003647777320000042
其中
Figure FDA0003647777320000043
4.如权利要求1所述的基于全状态动态约束的分布式周期事件触发饱和协同制导方法,其特征在于,步骤3中,基于局部邻域一致误差方程并结合周期事件触发机制,推导最优触发饱和制导策略具体为:定义如下局部性能指标函数:
Figure FDA0003647777320000044
其中Qi,Rii,Rij为设计的正定对称矩阵,Ui(·)为关于ui的半正定函数使得控制输入满足约束条件,具体表达式如下:
Figure FDA0003647777320000045
其中
Figure FDA0003647777320000046
为由矩阵Rii对角元素组成的行矩阵,
Figure FDA0003647777320000047
为相同维度且各元素都为1的列矩阵;
定义如下Hamilton函数为:
Figure FDA0003647777320000048
针对第i个导弹,定义采样周期为h(大于零)和一个单调递增的时间瞬间序列
Figure FDA0003647777320000049
记测量采样瞬间
Figure FDA00036477773200000410
基于(8)式,一一对应关系可得触发系统状态为
Figure FDA00036477773200000411
接着,定义如下触发误差:
Figure FDA00036477773200000412
得到如下基于事件的局部邻域一致误差系统和触发测量误差为:
Figure FDA00036477773200000413
Figure FDA00036477773200000414
同时,推断出下一个触发时间为:
Figure FDA0003647777320000051
其中
Figure FDA0003647777320000052
为触发条件;
则最优饱和触发控制策略为:
Figure FDA0003647777320000053
其中
Figure FDA0003647777320000054
代入(18)式得到如下触发Hamilton函数:
Figure FDA0003647777320000055
5.如权利要求1所述的基于全状态动态约束的分布式周期事件触发饱和协同制导方法,其特征在于,步骤4中,利用自适应动态规划技术构建评价网络,实施最优触发制导策略具体为:构造如下评价网络近似性能指标函数,其期望形式为:
Figure FDA0003647777320000056
其中
Figure FDA0003647777320000057
为评价网络期望权值,
Figure FDA0003647777320000058
为评价网络激励函数,εi(zi)表示近似误差;
对(25)式求偏导,其关于状态的偏导数表示为:
Figure FDA0003647777320000059
其中
Figure FDA00036477773200000510
由于评价网络理想权值是未知的,利用评价网络输出信号估计理想权值,则有:
Figure FDA00036477773200000511
Figure FDA00036477773200000512
则可以推导出近似饱和触发控制策略为:
Figure FDA00036477773200000513
相应的,代入触发Hamilton函数得近似误差函数:
Figure FDA0003647777320000061
设计权值更新律使得
Figure FDA0003647777320000062
从而保证Hamilton近似误差最小,为了使得估计权值逼近理想权值,设计如下目标函数:
Figure FDA0003647777320000063
基于梯度下降法,设计权值更新律,保证目标函数最小化,同时为了保证闭环系统在学习的过程中信号的有界性,在更新律中引入一个连续可微的径向无界Lyapunov函数Ji(zi),满足
Figure FDA0003647777320000064
其中
Figure FDA0003647777320000065
表示Ji(zi)对时间的导数,
Figure FDA0003647777320000066
表示Ji(zi)对zi的偏导数,即
Figure FDA0003647777320000067
因此,权值更新律具体形式如下:
Figure FDA0003647777320000068
其中βi为学习律,
Figure FDA0003647777320000069
被定义为满足如下条件的开关函数:
Figure FDA00036477773200000610
触发条件如下:
Figure FDA00036477773200000611
其中
Figure FDA00036477773200000612
为设计的常数,κmin(·),κman(·)分别为相应矩阵的最小/大特征值,
Figure FDA00036477773200000613
为常数。
CN202210535338.1A 2022-05-17 2022-05-17 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法 Active CN114993108B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210535338.1A CN114993108B (zh) 2022-05-17 2022-05-17 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210535338.1A CN114993108B (zh) 2022-05-17 2022-05-17 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法

Publications (2)

Publication Number Publication Date
CN114993108A true CN114993108A (zh) 2022-09-02
CN114993108B CN114993108B (zh) 2023-04-28

Family

ID=83028002

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210535338.1A Active CN114993108B (zh) 2022-05-17 2022-05-17 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法

Country Status (1)

Country Link
CN (1) CN114993108B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2423774A1 (en) * 2010-08-23 2012-02-29 MBDA UK Limited Guidance method and apparatus
CN110286691A (zh) * 2019-06-21 2019-09-27 东北大学秦皇岛分校 基于线性微分包含的多无人机编队控制方法
CN111707148A (zh) * 2020-06-28 2020-09-25 北京航空航天大学 一种时变时延条件下多导弹协同制导方法及系统
CN111812973A (zh) * 2020-05-21 2020-10-23 天津大学 一种离散时间非线性系统的事件触发优化控制方法
CN112113466A (zh) * 2020-08-19 2020-12-22 南京理工大学 一种有限时间收敛的多导弹协同制导方法
CN113325866A (zh) * 2021-05-20 2021-08-31 南京航空航天大学 一种基于事件触发的微分对策协同制导方法
CN113341727A (zh) * 2021-06-22 2021-09-03 北京理工大学 一种事件触发分布式自学习协同博弈拦截制导方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2423774A1 (en) * 2010-08-23 2012-02-29 MBDA UK Limited Guidance method and apparatus
CN110286691A (zh) * 2019-06-21 2019-09-27 东北大学秦皇岛分校 基于线性微分包含的多无人机编队控制方法
CN111812973A (zh) * 2020-05-21 2020-10-23 天津大学 一种离散时间非线性系统的事件触发优化控制方法
CN111707148A (zh) * 2020-06-28 2020-09-25 北京航空航天大学 一种时变时延条件下多导弹协同制导方法及系统
CN112113466A (zh) * 2020-08-19 2020-12-22 南京理工大学 一种有限时间收敛的多导弹协同制导方法
CN113325866A (zh) * 2021-05-20 2021-08-31 南京航空航天大学 一种基于事件触发的微分对策协同制导方法
CN113341727A (zh) * 2021-06-22 2021-09-03 北京理工大学 一种事件触发分布式自学习协同博弈拦截制导方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙景亮: "自适应动态规划研究及其在导弹拦截制导中的应用" *

Also Published As

Publication number Publication date
CN114993108B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN110007688B (zh) 一种基于强化学习的无人机集群分布式编队方法
CN110597061B (zh) 一种多智能体完全分布式自抗扰时变编队控制方法
CN112947592B (zh) 一种基于强化学习的再入飞行器轨迹规划方法
CN113325866B (zh) 一种基于事件触发的微分对策协同制导方法
CN108983800B (zh) 一种基于深度学习的飞机姿态控制方法
CN113341727B (zh) 一种事件触发分布式自学习协同博弈拦截制导方法
CN114020021B (zh) 一种多导弹分布式协同制导律的设计方法及系统
CN112698634A (zh) 基于事件触发的交通智能体系统固定时间二分一致性方法
CN109062040B (zh) 基于系统嵌套优化的预测pid方法
CN114756029A (zh) 基于动态事件触发的无人艇无模型控制方法
CN111158386B (zh) 一种干扰自主免疫的无人机姿态控制系统及实现方法
CN115877718B (zh) 数据驱动的异构导弹编队切换通信拓扑协同控制方法
CN114995129A (zh) 一种分布式最优事件触发协同制导方法
CN114993108A (zh) 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法
Jia et al. Distributed analytical formation control and cooperative guidance for gliding vehicles
CN109165444B (zh) 多飞行器同时协同拦截飞行器数量及空间位置散布的设计方法
CN116795124A (zh) 一种基于动态事件触发的四旋翼无人机姿态控制方法
CN116088317A (zh) 一种基于动态事件触发的多智能体一致性控制方法
Ding et al. Dynamics Event-Triggered-Based Time-Varying Bearing Formation Control for UAVs
Gong et al. A robust adaptive control algorithm for multimissile cooperative formation
Zhang et al. Distributed cooperative guidance strategy for multi-missile attack the maneuvering target
CN114815876A (zh) 一种基于旋翼无人机的编队领导者选择算法
CN116027790A (zh) 面向多智能体状态时滞系统的简化强化学习编队控制方法
Xi et al. Multi-missile Distributed Cooperative Guidance Law Based on De Bruijn Network
Chen et al. Research Article UAV Formation Control under Communication Constraints Based on Distributed Model Predictive Control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant