CN114993108B - 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法 - Google Patents

一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法 Download PDF

Info

Publication number
CN114993108B
CN114993108B CN202210535338.1A CN202210535338A CN114993108B CN 114993108 B CN114993108 B CN 114993108B CN 202210535338 A CN202210535338 A CN 202210535338A CN 114993108 B CN114993108 B CN 114993108B
Authority
CN
China
Prior art keywords
function
representing
guidance
following
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210535338.1A
Other languages
English (en)
Other versions
CN114993108A (zh
Inventor
高煜欣
刘春生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202210535338.1A priority Critical patent/CN114993108B/zh
Publication of CN114993108A publication Critical patent/CN114993108A/zh
Application granted granted Critical
Publication of CN114993108B publication Critical patent/CN114993108B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F41WEAPONS
    • F41GWEAPON SIGHTS; AIMING
    • F41G7/00Direction control systems for self-propelled missiles
    • F41G7/20Direction control systems for self-propelled missiles based on continuous observation of target position
    • F41G7/22Homing guidance systems
    • F41G7/2233Multimissile systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • General Engineering & Computer Science (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Aiming, Guidance, Guns With A Light Source, Armor, Camouflage, And Targets (AREA)

Abstract

本发明公开了一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法,包括如下步骤:利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑;基于通讯拓扑,推导制导模型,同时引入障碍函数,并建立局部邻域一致误差方程;基于局部邻域一致误差方程并结合周期事件触发机制,推导最优触发饱和制导策略;利用自适应动态规划技术构建评价网络,实施最优触发制导策略。本发明通过周期事件触发机制的引入,节约了通信带宽资源,提升了信息的利用率,同时避免了芝诺现象的发生。

Description

一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法
技术领域
本发明涉及多约束条件下多弹协同制导领域,尤其是一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法。
背景技术
多弹协同作战相较于一对一作战模式而言,大幅度提升了作战效率,有效降低了拦截目标的逃逸概率,是近年来制导领域研究的热点。在实际制导过程中,受导弹物理因素限制,导弹执行机构、物理器件等都存在承受范围,因此,研究约束条件下的协同制导策略具有实际意义。通常,对协同制导的研究等价为对多智能体系统的研究,且目前也有许多该策略的研究成果,但是在现有针对状态受限的多智能体协同控制研究中,约束条件大多是静态的、对称的。然而,战场环境复杂,存在许多动态非对称的情况。例如,在导弹集群作战中,为了避免与障碍物发生碰撞,需要考虑约束条件,当障碍物为机动的邻域导弹或者飞行的鸟群时,静态、对称的显然难以满足需求。并且,例如导弹尾鳍等执行机构也存在操作范围,超过范围可能会导致智能体受损。因此,考虑动态非对称和输入受限约束更加符合实际应用的要求。同时,多数研究成果仅考虑了系统的稳定性,忽略了最优性问题。因此,发展多约束下最优协同制导方法具有实际意义,该控制策略实现的前提是求解其相关的Hamilton-Jacobi-Bellman(HJB)方程,然而在非线性系统中,HJB方程求解困难。自适应动态规划技术被广泛应用于最优控制问题中,该方法利用函数近似结构来估计代价函数,用于按时间正向求解动态规划问题,可以有效近似HJB方程的解析解。此外,制导系统资源和通信带宽是有限的,而传统的时间触发控制通信压力较大,控制输入更新较为频繁,造成资源浪费。因此,在设计最优协同制导策略的过程中,提升信息利用率显得尤为重要。
发明内容
本发明所要解决的技术问题在于,提供一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法,拓展了多约束非线性协同制导领域,全状态满足动态约束,而且控制策略不仅在受限范围内,同时节约通信资源。
为解决上述技术问题,本发明提供一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法,包括如下步骤:
步骤1、利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑;
步骤2、基于通讯拓扑,推导制导模型,同时引入障碍函数,并建立局部邻域一致误差方程;
步骤3、基于局部邻域一致误差方程并结合周期事件触发机制,推导最优触发饱和制导策略;
步骤4、利用自适应动态规划技术构建评价网络,实施最优触发制导策略。
优选的,步骤1中,利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑具体为:通讯拓扑表示为如下有向图:
Figure BDA0003647777330000021
其中,
Figure BDA0003647777330000022
表示节点个体集合,
Figure BDA0003647777330000023
表示节点通讯链接集合,A=[aij]∈RN×N,aij≥0表示权值链接矩阵,如果(i,j)∈ε,则表明节点j是节点i的邻域个体,此时aij=1;否则,aij=0;将节点i的所有邻域个体的集合表示为Ni={j:(i,j)∈ε},定义入度矩阵D=diag{d1,d2,…,dN},其中
Figure BDA0003647777330000024
表示节点i的邻域个体的数量,定义图
Figure BDA0003647777330000025
的拉普拉斯矩阵为L=D-A且所有行的和为零,考虑图
Figure BDA0003647777330000026
为强联通的有向图且aii=0;另外,节点i与领导者之间的连接矩阵表示为B=diag{b1,b2,…,bN},其中,bi=1表示节点i能够接收领导者信息;否则,bi=0。
优选的,步骤2中,基于通讯拓扑,推导制导模型,同时引入障碍函数,并建立局部邻域一致误差方程具体为:二维平面N枚导弹协同拦截同一目标模型表达为如下相对运动方程:
Figure BDA0003647777330000027
Figure BDA0003647777330000028
Figure BDA0003647777330000029
Figure BDA00036477773300000210
其中Mi代表第i枚导弹,T代表目标,考虑所有导弹和目标的运动为质点运动且速度大小均为恒定值,Vi和VT分别表示第i枚导弹和目标的速度;
Figure BDA00036477773300000211
和γT分别表示第i枚导弹的目标的航迹倾角;γMiT表示第i枚导弹与目标之间视线角;ri表示第i枚导弹和目标之间的距离,则其相对速率表示为
Figure BDA0003647777330000031
ui和ν分别第i枚导弹和目标垂直于速度向量的加速度,各枚导弹之间主要依靠通讯拓扑网络进行通讯,即第i枚导弹只与其邻域导弹进行通信;
第i枚导弹和目标均表现为如下一阶自动驾驶仪:
Figure BDA0003647777330000032
Figure BDA0003647777330000033
Figure BDA0003647777330000034
Figure BDA0003647777330000035
其中
Figure BDA0003647777330000036
表示第i枚拦截弹的坐标位置;ai表示拦截弹的侧向加速度;
Figure BDA0003647777330000037
表示拦截弹自动驾驶仪时间常数,设定时间常数为0.1s;相应的目标自动驾驶仪表达式为:
Figure BDA0003647777330000038
Figure BDA0003647777330000039
Figure BDA00036477773300000310
Figure BDA00036477773300000311
其中(xT,yT)表示目标的坐标位置;aT表示目标的侧向加速度;τT表示目标自动驾驶仪时间常数,设定时间常数为0.1s;
基于隐形协同制导方式,将视线角作为协同变量,定义状态量
Figure BDA00036477773300000312
则协同拦截制导模型可以表示为如下仿射非线性动力学:
Figure BDA00036477773300000313
其中
Figure BDA00036477773300000314
分别表示第i个导弹的系统状态函数和控制系数函数,考虑控制输入受限,即满足|ui(t)|≤λi,同时,系统满足如下全状态动态约束条件:
xi(t)∈Ωi:={(t,xi):xiL(t)≤xi≤xiH(t)}  (6
其中xiL(t)∈Rn,xiH(t)∈Rn分别表示系统状态的下约束函数和上约束函数,且具有如下动态:
Figure BDA0003647777330000041
其中θiL(@)、θiH(@)为有界函数使得xiL(t)、xiH(t)有界,且满足xiL(t)<0<xiH(t),为了保证系统状态满足约束条件,引入如下障碍函数:
Figure BDA0003647777330000042
且满足初始条件xiL(0)<xi(0)<xiH(0),注意到当xi(t)接近其边界时si→∞,对(4)式求导可得:
Figure BDA0003647777330000043
其中
Figure BDA0003647777330000044
Figure BDA0003647777330000045
定义Fi(xi)=si1fi(xi)+si2,Gi(xi)=si1gi(xi),第i个导弹动力学模型被重写为:
Figure BDA0003647777330000046
则针对第i个导弹,建立如下局部邻域一致误差系统:
Figure BDA0003647777330000047
其中
Figure BDA0003647777330000048
x0为领导者信号,假设x0及其导数
Figure BDA0003647777330000049
都是连续的,并且当bi≠0时,第i个导弹可以接收到领导者信息,(13)式求导可得:
Figure BDA00036477773300000410
其中
Figure BDA00036477773300000411
优选的,步骤3中,基于局部邻域一致误差方程并结合周期事件触发机制,推导最优触发饱和制导策略具体为:定义如下局部性能指标函数:
Figure BDA0003647777330000051
其中Qi,Rii,Rij为设计的正定对称矩阵,Ui(@)为关于ui的半正定函数使得控制输入满足约束条件,具体表达式如下:
Figure BDA0003647777330000052
其中
Figure BDA0003647777330000053
为由矩阵Rii对角元素组成的行矩阵,
Figure BDA0003647777330000054
为相同维度且各元素都为1的列矩阵;
定义如下Hamilton函数为:
Figure BDA0003647777330000055
针对第i个导弹,定义采样周期为h(大于零)和一个单调递增的时间瞬间序列
Figure BDA0003647777330000056
记测量采样瞬间
Figure BDA0003647777330000057
基于(8)式,一一对应关系可得触发系统状态为
Figure BDA0003647777330000058
接着,定义如下触发误差:
Figure BDA0003647777330000059
得到如下基于事件的局部邻域一致误差系统和触发测量误差为:
Figure BDA00036477773300000510
Figure BDA00036477773300000511
同时,推断出下一个触发时间为:
Figure BDA00036477773300000512
其中
Figure BDA00036477773300000513
为触发条件;
则最优饱和触发控制策略为:
Figure BDA00036477773300000514
其中
Figure BDA0003647777330000061
代入(18)式得到如下触发Hamilton函数:
Figure BDA0003647777330000062
优选的,步骤4中,利用自适应动态规划技术构建评价网络,实施最优触发制导策略具体为:构造如下评价网络近似性能指标函数,其期望形式为:
Figure BDA0003647777330000063
其中
Figure BDA0003647777330000064
为评价网络期望权值,
Figure BDA00036477773300000615
为评价网络激励函数,εi(zi)表示近似误差;
对(25)式求偏导,其关于状态的偏导数表示为:
Figure BDA0003647777330000065
其中
Figure BDA0003647777330000066
由于评价网络理想权值是未知的,利用评价网络输出信号估计理想权值,则有:
Figure BDA0003647777330000067
Figure BDA0003647777330000068
则可以推导出近似饱和触发控制策略为:
Figure BDA0003647777330000069
相应的,代入触发Hamilton函数得近似误差函数:
Figure BDA00036477773300000610
设计权值更新律使得
Figure BDA00036477773300000611
从而保证Hamilton近似误差最小,为了使得估计权值逼近理想权值,设计如下目标函数:
Figure BDA00036477773300000612
基于梯度下降法,设计权值更新律,保证目标函数最小化,同时为了保证闭环系统在学习的过程中信号的有界性,在更新律中引入一个连续可微的径向无界Lyapunov函数Ji(zi),满足
Figure BDA00036477773300000613
其中
Figure BDA00036477773300000614
表示Ji(zi)对时间的导数,
Figure BDA0003647777330000071
表示Ji(zi)对zi的偏导数,即
Figure BDA0003647777330000072
因此,权值更新律具体形式如下:
Figure BDA0003647777330000073
其中βi为学习律,
Figure BDA0003647777330000074
被定义为满足如下条件的开关函数:
Figure BDA0003647777330000075
触发条件如下:
Figure BDA0003647777330000076
其中
Figure BDA0003647777330000077
为设计的常数,κmin(·),κman(·)分别为相应矩阵的最小/大特征值,
Figure BDA0003647777330000078
为常数。
本发明的有益效果为:(1)本发明考虑了全状态动态约束下多导弹系统的协同制导问题,与现有大多数静态约束条件不同,系统状态满足的约束条件为一个动态的非对称函数;(2)本发明在设计协同制导策略的同时,考虑输入饱和受限问题,使得所设计的制导策略更加合理,更加满足系统执行机构存在物理承受范围的客观因素;(3)本发明通过周期事件触发机制的引入,节约了通信带宽资源,提升了信息的利用率,同时避免了芝诺现象的发生。
附图说明
图1为本发明的多弹协同制导二维平面相对运动示意图。
图2为本发明的方法流程示意图。
具体实施方式
如图1和图2所示,一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法,包括如下步骤:
步骤1、利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑;通讯拓扑表示为如下有向图:
Figure BDA0003647777330000081
其中,
Figure BDA0003647777330000082
表示节点个体集合,
Figure BDA0003647777330000083
表示节点通讯链接集合,A=[aij]∈RN×N,aij≥0表示权值链接矩阵,如果(i,j)∈ε,则表明节点j是节点i的邻域个体,此时aij=1;否则,aij=0;将节点i的所有邻域个体的集合表示为Ni={j:(i,j)∈ε},定义入度矩阵D=diag{d1,d2,…,dN},其中
Figure BDA0003647777330000084
表示节点i的邻域个体的数量,定义图
Figure BDA0003647777330000085
的拉普拉斯矩阵为L=D-A且所有行的和为零,考虑图
Figure BDA0003647777330000086
为强联通的有向图且aii=0;另外,节点i与领导者之间的连接矩阵表示为B=diag{b1,b2,…,bN},其中,bi=1表示节点i能够接收领导者信息;否则,bi=0。
步骤2、基于通讯拓扑,推导制导模型,同时引入障碍函数,并建立局部邻域一致误差方程;二维平面N枚导弹协同拦截同一目标模型表达为如下相对运动方程:
Figure BDA0003647777330000087
Figure BDA0003647777330000088
Figure BDA0003647777330000089
Figure BDA00036477773300000810
其中Mi代表第i枚导弹,T代表目标,考虑所有导弹和目标的运动为质点运动且速度大小均为恒定值,Vi和VT分别表示第i枚导弹和目标的速度;
Figure BDA00036477773300000811
和γT分别表示第i枚导弹的目标的航迹倾角;γMiT表示第i枚导弹与目标之间视线角;ri表示第i枚导弹和目标之间的距离,则其相对速率表示为
Figure BDA00036477773300000812
ui和ν分别第i枚导弹和目标垂直于速度向量的加速度,各枚导弹之间主要依靠通讯拓扑网络进行通讯,即第i枚导弹只与其邻域导弹进行通信;
第i枚导弹和目标均表现为如下一阶自动驾驶仪:
Figure BDA00036477773300000813
Figure BDA00036477773300000814
Figure BDA00036477773300000815
Figure BDA00036477773300000816
其中
Figure BDA0003647777330000091
表示第i枚拦截弹的坐标位置;ai表示拦截弹的侧向加速度;
Figure BDA0003647777330000092
表示拦截弹自动驾驶仪时间常数,设定时间常数为0.1s;相应的目标自动驾驶仪表达式为:
Figure BDA0003647777330000093
Figure BDA0003647777330000094
Figure BDA0003647777330000095
Figure BDA0003647777330000096
其中(xT,yT)表示目标的坐标位置;aT表示目标的侧向加速度;τT表示目标自动驾驶仪时间常数,设定时间常数为0.1s;
基于隐形协同制导方式,将视线角作为协同变量,定义状态量
Figure BDA0003647777330000097
则协同拦截制导模型可以表示为如下仿射非线性动力学:
Figure BDA0003647777330000098
其中
Figure BDA0003647777330000099
分别表示第i个导弹的系统状态函数和控制系数函数,考虑控制输入受限,即满足|ui(t)|≤λi,同时,系统满足如下全状态动态约束条件:
xi(t)∈Ωi:={(t,xi):xiL(t)≤xi≤xiH(t)}  (6)
其中xiL(t)∈Rn,xiH(t)∈Rn分别表示系统状态的下约束函数和上约束函数,且具有如下动态:
Figure BDA00036477773300000910
其中θiL(·)、θiH(·)为有界函数使得xiL(t)、xiH(t)有界,且满足xiL(t)<0<xiH(t),为了保证系统状态满足约束条件,引入如下障碍函数:
Figure BDA00036477773300000911
且满足初始条件xiL(0)<xi(0)<xiH(0),注意到当xi(t)接近其边界时si→∞,对(4)式求导可得:
Figure BDA0003647777330000101
其中
Figure BDA0003647777330000102
Figure BDA0003647777330000103
定义Fi(xi)=si1fi(xi)+si2,Gi(xi)=si1gi(xi),第i个导弹动力学模型被重写为:
Figure BDA0003647777330000104
则针对第i个导弹,建立如下局部邻域一致误差系统:
Figure BDA0003647777330000105
其中
Figure BDA0003647777330000106
x0为领导者信号,假设x0及其导数
Figure BDA0003647777330000107
都是连续的,并且当bi≠0时,第i个导弹可以接收到领导者信息,(13)式求导可得:
Figure BDA0003647777330000108
其中
Figure BDA0003647777330000109
步骤3、基于局部邻域一致误差方程并结合周期事件触发机制,推导最优触发饱和制导策略;定义如下局部性能指标函数:
Figure BDA00036477773300001010
其中Qi,Rii,Rij为设计的正定对称矩阵,Ui(·)为关于ui的半正定函数使得控制输入满足约束条件,具体表达式如下:
Figure BDA00036477773300001011
其中
Figure BDA0003647777330000111
为由矩阵Rii对角元素组成的行矩阵,
Figure BDA0003647777330000112
为相同维度且各元素都为1的列矩阵;定义如下Hamilton函数为:
Figure BDA0003647777330000113
针对第i个导弹,定义采样周期为h(大于零)和一个单调递增的时间瞬间序列
Figure BDA00036477773300001117
记测量采样瞬间
Figure BDA0003647777330000114
基于(8)式,一一对应关系可得触发系统状态为
Figure BDA0003647777330000115
接着,定义如下触发误差:
Figure BDA0003647777330000116
得到如下基于事件的局部邻域一致误差系统和触发测量误差为:
Figure BDA0003647777330000117
Figure BDA0003647777330000118
同时,推断出下一个触发时间为:
Figure BDA0003647777330000119
其中
Figure BDA00036477773300001110
为触发条件;
则最优饱和触发控制策略为:
Figure BDA00036477773300001111
其中
Figure BDA00036477773300001112
代入(18)式得到如下触发Hamilton函数:
Figure BDA00036477773300001113
步骤4、利用自适应动态规划技术构建评价网络,实施最优触发制导策略;构造如下评价网络近似性能指标函数,其期望形式为:
Figure BDA00036477773300001114
其中
Figure BDA00036477773300001115
为评价网络期望权值,
Figure BDA00036477773300001116
为评价网络激励函数,εi(zi)表示近似误差;
对(25)式求偏导,其关于状态的偏导数表示为:
Figure BDA0003647777330000121
其中
Figure BDA0003647777330000122
由于评价网络理想权值是未知的,利用评价网络输出信号估计理想权值,则有:
Figure BDA0003647777330000123
Figure BDA0003647777330000124
则可以推导出近似饱和触发控制策略为:
Figure BDA0003647777330000125
相应的,代入触发Hamilton函数得近似误差函数:
Figure BDA0003647777330000126
设计权值更新律使得
Figure BDA0003647777330000127
从而保证Hamilton近似误差最小,为了使得估计权值逼近理想权值,设计如下目标函数:
Figure BDA0003647777330000128
基于梯度下降法,设计权值更新律,保证目标函数最小化,同时为了保证闭环系统在学习的过程中信号的有界性,在更新律中引入一个连续可微的径向无界Lyapunov函数Ji(zi),满足
Figure BDA0003647777330000129
其中
Figure BDA00036477773300001210
表示Ji(zi)对时间的导数,
Figure BDA00036477773300001211
表示Ji(zi)对zi的偏导数,即
Figure BDA00036477773300001212
因此,权值更新律具体形式如下:
Figure BDA00036477773300001213
其中βi为学习律,
Figure BDA00036477773300001214
被定义为满足如下条件的开关函数:
Figure BDA0003647777330000131
触发条件如下:
Figure BDA0003647777330000132
其中
Figure BDA0003647777330000133
为设计的常数,κmin(·),κman(·)分别为相应矩阵的最小/大特征值,
Figure BDA0003647777330000134
为常数。

Claims (2)

1.一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法,其特征在于,包括如下步骤:
步骤1、利用图论的理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑;通讯拓扑表示为如下有向图:
Figure FDA0004052366370000011
其中,
Figure FDA0004052366370000012
表示节点个体集合,
Figure FDA0004052366370000013
表示节点通讯链接集合,A=[aij]∈RN×N,aij≥0表示权值链接矩阵,如果(i,j)∈E,则表明节点j是节点i的邻域个体,此时aij=1;否则,aij=0;将节点i的所有邻域个体的集合表示为Ni={j:(i,j)∈E},定义入度矩阵D=diag{d1,d2,…,dN},其中
Figure FDA0004052366370000014
表示节点i的邻域个体的数量,定义图
Figure FDA0004052366370000015
的拉普拉斯矩阵为L=D-A且所有行的和为零,考虑图
Figure FDA0004052366370000016
为强联通的有向图且aii=0;另外,节点i与领导者之间的连接矩阵表示为B=diag{b1,b2,…,bN},其中,bi=1表示节点i能够接收领导者信息;否则,bi=0;
步骤2、基于通讯拓扑,推导制导模型,同时引入障碍函数,并建立局部邻域一致误差方程;二维平面N枚导弹协同拦截同一目标模型表达为如下相对运动方程:
Figure FDA0004052366370000017
其中Mi代表第i枚导弹,T代表目标,考虑所有导弹和目标的运动为质点运动且速度大小均为恒定值,Vi和VT分别表示第i枚导弹和目标的速度;
Figure FDA0004052366370000018
和γT分别表示第i枚导弹和目标的航迹倾角;
Figure FDA0004052366370000019
表示第i枚导弹与目标之间视线角;ri表示第i枚导弹和目标之间的距离,则其相对速率表示为
Figure FDA00040523663700000110
ui和ν分别为第i枚导弹和目标垂直于速度向量的加速度,各枚导弹之间依靠通讯拓扑网络进行通讯,即第i枚导弹只与其邻域导弹进行通信;
第i枚导弹和目标均表现为如下一阶自动驾驶仪:
Figure FDA0004052366370000021
其中
Figure FDA0004052366370000022
表示第i枚拦截弹的坐标位置;ai表示拦截弹的侧向加速度;
Figure FDA0004052366370000023
表示拦截弹自动驾驶仪时间常数,设定时间常数为0.1s;相应的目标自动驾驶仪表达式为:
Figure FDA0004052366370000024
其中(xT,yT)表示目标的坐标位置;aT表示目标的侧向加速度;τT表示目标自动驾驶仪时间常数,设定时间常数为0.1s;
基于隐形协同制导方式,将视线角作为协同变量,定义状态量
Figure FDA0004052366370000025
则协同拦截制导模型可以表示为如下仿射非线性动力学:
Figure FDA0004052366370000026
其中
Figure FDA0004052366370000027
分别表示第i个导弹的系统状态函数和控制系数函数,考虑控制输入受限,即满足|ui(t)|≤λi,同时,系统满足如下全状态动态约束条件:
xi(t)∈Ωi:={(t,xi):xiL(t)≤xi≤xiH(t)}  (6)
其中xiL(t)∈Rn,xiH(t)∈Rn分别表示系统状态的下约束函数和上约束函数,且具有如下动态:
Figure FDA0004052366370000028
其中θiL(·)、θiH(·)为有界函数使得xiL(t)、xiH(t)有界,且满足xiL(t)<0<xiH(t),为了保证系统状态满足约束条件,引入如下障碍函数:
Figure FDA0004052366370000031
且满足初始条件xiL(0)<xi(0)<xiH(0),注意到当xi(t)接近其边界时si→∞,对(4)式求导可得:
Figure FDA0004052366370000032
其中
Figure FDA0004052366370000033
Figure FDA0004052366370000034
定义Fi(xi)=si1fi(xi)+si2,Gi(xi)=si1gi(xi),第i个导弹动力学模型被重写为:
Figure FDA0004052366370000035
则针对第i个导弹,建立如下局部邻域一致误差系统:
Figure FDA0004052366370000036
其中
Figure FDA0004052366370000037
x0为领导者信号,假设x0及其导数
Figure FDA0004052366370000038
都是连续的,并且当bi≠0时,第i个导弹可以接收到领导者信息,(13)式求导可得:
Figure FDA0004052366370000039
其中
Figure FDA00040523663700000310
步骤3、基于局部邻域一致误差方程并结合周期事件触发机制,推导最优触发饱和制导策略;定义如下局部性能指标函数:
Figure FDA00040523663700000311
其中Qi,Rii,Rij为设计的正定对称矩阵,Ui(·)为关于ui的半正定函数使得控制输入满足约束条件,具体表达式如下:
Figure FDA0004052366370000041
其中
Figure FDA0004052366370000042
为由矩阵Rii对角元素组成的行矩阵,
Figure FDA0004052366370000043
为相同维度且各元素都为1的列矩阵;
定义如下Hamilton函数为:
Figure FDA0004052366370000044
针对第i个导弹,定义采样周期为h大于零和一个单调递增的时间瞬间序列
Figure FDA0004052366370000045
记测量采样瞬间
Figure FDA0004052366370000046
基于(8)式,一一对应关系可得触发系统状态为
Figure FDA0004052366370000047
接着,定义如下触发误差:
Figure FDA0004052366370000048
得到如下基于事件的局部邻域一致误差系统和触发测量误差为:
Figure FDA0004052366370000049
Figure FDA00040523663700000410
同时,推断出下一个触发时间为:
Figure FDA00040523663700000411
其中
Figure FDA00040523663700000412
为触发条件;
则最优饱和触发控制策略为:
Figure FDA00040523663700000413
其中
Figure FDA00040523663700000414
Vi *(zi)为评价网络近似性能指标函数的期望形式,代入(18)式得到如下触发Hamilton函数:
Figure FDA00040523663700000415
步骤4、利用自适应动态规划技术构建评价网络,实施最优触发制导策略。
2.如权利要求1所述的基于全状态动态约束的分布式周期事件触发饱和协同制导方法,其特征在于,步骤4中,利用自适应动态规划技术构建评价网络,实施最优触发制导策略具体为:构造如下评价网络近似性能指标函数,其期望形式为:
Figure FDA0004052366370000051
其中
Figure FDA0004052366370000052
为评价网络期望权值,
Figure FDA0004052366370000053
为评价网络激励函数,εi(zi)表示近似误差;
对(25)式求偏导,其关于状态的偏导数表示为:
Figure FDA0004052366370000054
其中
Figure FDA0004052366370000055
由于评价网络理想权值是未知的,利用评价网络输出信号估计理想权值,则有:
Figure FDA0004052366370000056
Figure FDA0004052366370000057
则可以推导出近似饱和触发控制策略为:
Figure FDA0004052366370000058
相应的,代入触发Hamilton函数得近似误差函数:
Figure FDA0004052366370000059
设计权值更新律使得
Figure FDA00040523663700000510
从而保证Hamilton近似误差最小,为了使得估计权值逼近理想权值,设计如下目标函数:
Figure FDA00040523663700000511
基于梯度下降法,设计权值更新律,保证目标函数最小化,同时为了保证闭环系统在学习的过程中信号的有界性,在更新律中引入一个连续可微的径向无界Lyapunov函数Ji(zi),满足
Figure FDA00040523663700000512
其中
Figure FDA00040523663700000513
表示Ji(zi)对时间的导数,
Figure FDA00040523663700000514
表示Ji(zi)对zi的偏导数,即
Figure FDA00040523663700000515
因此,权值更新律具体形式如下:
Figure FDA0004052366370000061
其中βi为学习律,
Figure FDA0004052366370000062
Φ(·)被定义为满足如下条件的开关函数:
Figure FDA0004052366370000063
触发条件如下:
Figure FDA0004052366370000064
其中
Figure FDA0004052366370000065
为设计的常数,κmin(·),κmax(·)分别为相应矩阵的最小/大特征值,
Figure FDA0004052366370000066
为常数。
CN202210535338.1A 2022-05-17 2022-05-17 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法 Active CN114993108B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210535338.1A CN114993108B (zh) 2022-05-17 2022-05-17 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210535338.1A CN114993108B (zh) 2022-05-17 2022-05-17 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法

Publications (2)

Publication Number Publication Date
CN114993108A CN114993108A (zh) 2022-09-02
CN114993108B true CN114993108B (zh) 2023-04-28

Family

ID=83028002

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210535338.1A Active CN114993108B (zh) 2022-05-17 2022-05-17 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法

Country Status (1)

Country Link
CN (1) CN114993108B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2423774A1 (en) * 2010-08-23 2012-02-29 MBDA UK Limited Guidance method and apparatus
CN110286691A (zh) * 2019-06-21 2019-09-27 东北大学秦皇岛分校 基于线性微分包含的多无人机编队控制方法
CN111707148A (zh) * 2020-06-28 2020-09-25 北京航空航天大学 一种时变时延条件下多导弹协同制导方法及系统
CN111812973A (zh) * 2020-05-21 2020-10-23 天津大学 一种离散时间非线性系统的事件触发优化控制方法
CN112113466A (zh) * 2020-08-19 2020-12-22 南京理工大学 一种有限时间收敛的多导弹协同制导方法
CN113325866A (zh) * 2021-05-20 2021-08-31 南京航空航天大学 一种基于事件触发的微分对策协同制导方法
CN113341727A (zh) * 2021-06-22 2021-09-03 北京理工大学 一种事件触发分布式自学习协同博弈拦截制导方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2423774A1 (en) * 2010-08-23 2012-02-29 MBDA UK Limited Guidance method and apparatus
CN110286691A (zh) * 2019-06-21 2019-09-27 东北大学秦皇岛分校 基于线性微分包含的多无人机编队控制方法
CN111812973A (zh) * 2020-05-21 2020-10-23 天津大学 一种离散时间非线性系统的事件触发优化控制方法
CN111707148A (zh) * 2020-06-28 2020-09-25 北京航空航天大学 一种时变时延条件下多导弹协同制导方法及系统
CN112113466A (zh) * 2020-08-19 2020-12-22 南京理工大学 一种有限时间收敛的多导弹协同制导方法
CN113325866A (zh) * 2021-05-20 2021-08-31 南京航空航天大学 一种基于事件触发的微分对策协同制导方法
CN113341727A (zh) * 2021-06-22 2021-09-03 北京理工大学 一种事件触发分布式自学习协同博弈拦截制导方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙景亮.自适应动态规划研究及其在导弹拦截制导中的应用.《中国博士学位论文全文数据库工程科技Ⅱ辑》.2021,(第9期),C032-1. *

Also Published As

Publication number Publication date
CN114993108A (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
Zhihao et al. Virtual target guidance-based distributed model predictive control for formation control of multiple UAVs
CN110597061B (zh) 一种多智能体完全分布式自抗扰时变编队控制方法
Lyu et al. Multiple missiles cooperative guidance with simultaneous attack requirement under directed topologies
CN113342037B (zh) 具有输入饱和的多旋翼无人机时变编队控制方法及系统
Dong et al. Fixed-time terminal angle-constrained cooperative guidance law against maneuvering target
CN113325866B (zh) 一种基于事件触发的微分对策协同制导方法
CN113178098B (zh) 一种无人船事件触发分层协同控制系统
Trémois et al. Optimal observer trajectory in bearings-only tracking for manoeuvring sources
CN114756029A (zh) 基于动态事件触发的无人艇无模型控制方法
Liu et al. Adaptive distributed finite-time formation control for multi-UAVs under input saturation without collisions
CN113341727A (zh) 一种事件触发分布式自学习协同博弈拦截制导方法
Fu et al. Adaptive finite-time event-triggered control of marine surface vehicles with prescribed performance and output constraints
Yang et al. Online hierarchical recognition method for target tactical intention in beyond-visual-range air combat
Vanni et al. Cooperative path-following of underactuated autonomous marine vehicles with logic-based communication
CN111121770B (zh) 一种交互式多弹多模型航迹融合方法
CN113569465A (zh) 一种基于深度学习的航迹矢量和目标类型联合估计系统及估计方法
CN111439392A (zh) 一种航天器编队位置协同控制方法
CN117369495A (zh) 一种基于模型预测控制的无人机编队轨迹规划方法
CN115129072A (zh) 固定翼无人机位置跟踪偏差约束下终端滑模控制方法
CN114993108B (zh) 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法
CN114995129A (zh) 一种分布式最优事件触发协同制导方法
CN115903842A (zh) 一种多智能体编队控制方法、系统及电子设备
CN115167451A (zh) 一种离散异构多自主体编队合围跟踪控制方法及系统
Ma et al. Fixed-time anti-saturation grouped cooperative guidance law with state estimations of multiple maneuvering targets
CN111216146B (zh) 一种适用于网络化机器人系统的二部一致性量化控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant