CN114995129A - 一种分布式最优事件触发协同制导方法 - Google Patents

一种分布式最优事件触发协同制导方法 Download PDF

Info

Publication number
CN114995129A
CN114995129A CN202210534990.1A CN202210534990A CN114995129A CN 114995129 A CN114995129 A CN 114995129A CN 202210534990 A CN202210534990 A CN 202210534990A CN 114995129 A CN114995129 A CN 114995129A
Authority
CN
China
Prior art keywords
cooperative
representing
target
guidance
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210534990.1A
Other languages
English (en)
Inventor
高煜欣
刘春生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202210534990.1A priority Critical patent/CN114995129A/zh
Publication of CN114995129A publication Critical patent/CN114995129A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Aiming, Guidance, Guns With A Light Source, Armor, Camouflage, And Targets (AREA)

Abstract

本发明公开了一种分布式最优事件触发协同制导方法,包括如下步骤:步骤1、利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑;步骤2、基于通讯拓扑,推导协同制导模型;步骤3、基于一致性理论并结合协同制导动力学方程,建立局部邻域一致性误差方程;步骤4、利用在线辨识技术结合模型输入输出数据,处理模型未知动态;步骤5、根据邻域一致性误差方程,推导最优触发控制策略;步骤6、利用自适应动态规划技术并结合未知动态辨识数据,实施最优触发控制策略。本发明节约了通信带宽资源,提升了信息的利用率,降低了多弹拦截目标过程中的成本。

Description

一种分布式最优事件触发协同制导方法
技术领域
本发明涉及飞行器制导技术领域,尤其是一种分布式最优事件触发协同制导方法。
背景技术
现代作战环境日益复杂,任务目标更加智能且机动能力大大提高。在这种趋势下,多弹协同作战模式成为近年来的研究热点。导弹协同制导是指使用多枚导弹执行同一攻击任务,打破作战过程中各导弹之间没有任何联系与合作的传统思想,完成从不同方向同时攻击或同角度攻击目标以确保毁伤效能的作战方式。作为一种适应未来复杂战场环境的重要方式,多弹协同攻击能够有效提升导弹在强对抗环境下的快速突防和目标毁伤能力。多枚导弹间通过信息共享、功能互补、战术协同等方式充分发挥集群作战优势,对敌方防御体系和目标进行多层次、全方位的打击,相较于一对一制导作战而言,协同拦截可以扩大己方导弹的拦截区域,扩大弹群的有效毁伤空间,减小敌方目标机动突防的概率。
在带来作战优势的同时,也对协同制导策略的设计提出了新的挑战。现有协同控制策略鲜有考虑控制策略设计的同时,考虑最优性问题。因此发展分布式最优协同策略具有实际意义,该控制策略实现的前提是求解其相关的Hamilton-Jacobi-Bellman(HJB)方程,然而在实际中多弹协同制导问题通常表现出非线性、强耦合特性,这使得HJB方程的求解变得十分困难。自适应动态规划技术是利用函数近似结构来估计代价函数,用于按时间正向求解动态规划问题,可以有效近似HJB方程的解析解。近年来,被广泛应用于最优控制问题中。此外,复杂的战场环境,使得完备的制导系统信息往往难以得到,这给控制策略的设计带来了困难,并且实际的导弹制导与控制系统资源和通信带宽是有限的,而传统的时间触发控制需要卫星根据周期采样的信息调节自身状态,通信压力较大,控制输入更新较为频繁,造成资源浪费。因此,在设计最优协同制导策略的过程中,考虑系统信息不完备、提升信息利用率显得尤为重要。
发明内容
本发明所要解决的技术问题在于,提供一种分布式最优事件触发协同制导方法,节约了通信带宽资源,提升了信息的利用率,降低了多弹拦截目标过程中的成本。
为解决上述技术问题,本发明提供一种分布式最优事件触发协同制导方法,包括如下步骤:
步骤1、利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑;
步骤2、基于通讯拓扑,推导协同制导模型;
步骤3、基于一致性理论并结合协同制导动力学方程,建立局部邻域一致性误差方程;
步骤4、利用在线辨识技术结合模型输入输出数据,处理模型未知动态;
步骤5、根据邻域一致性误差方程,推导最优触发控制策略;
步骤6、利用自适应动态规划技术并结合未知动态辨识数据,实施最优触发控制策略。
优选的,步骤1中,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑具体为:将协同制导问题考虑为多智能体协同控制问题,其通讯拓扑用如下有向图表示:
Figure BDA0003647445650000021
其中,
Figure BDA0003647445650000022
表示节点集合,
Figure BDA0003647445650000023
表示节点通讯链接集合,A=[aij]∈RN×N,aij≥0表示权值链接矩阵,如果(i,j)∈ε,则表明智能体j是智能体i的邻域智能体,此时aij=1;否则,aij=0;将智能体i的所有邻域智能体的集合表示为Ni={j:(i,j)∈ε},定义入度矩阵D=diag{d1,d2,…,dN},其中
Figure BDA0003647445650000024
表示智能体i的邻域智能体的数量,定义图
Figure BDA0003647445650000025
的拉普拉斯矩阵为L=D-A且所有行的和为零,考虑图
Figure BDA0003647445650000026
为强联通的有向图且aii=0;另外,智能体i与领导者之间的连接矩阵表示为B=diag{b1,b2,…,bN},其中,bi=1表示智能体i能够接收领导者信息;否则,bi=0。
优选的,步骤2中,基于通讯拓扑,推导协同制导模型具体为:二维平面N枚导弹协同拦截同一目标模型表达为如下相对运动方程:
Figure BDA0003647445650000027
其中Mi代表第i枚导弹,T代表目标,考虑所有导弹和目标的运动为质点运动且速度大小均为恒定值,Vi和VT分别表示第i枚导弹和目标的速度;
Figure BDA0003647445650000031
和γT分别表示第i枚导弹的目标的航迹倾角;γMiT表示第i枚导弹与目标之间视线角;ri表示第i枚导弹和目标之间的距离,则其相对速率表示为
Figure BDA0003647445650000032
ui和ν分别第i枚导弹和目标垂直于速度向量的加速度,各枚导弹之间依靠通讯拓扑网络进行通讯,即第i枚导弹只与其邻域导弹进行通信;
第i枚导弹和目标均表现为如下一阶自动驾驶仪:
Figure BDA0003647445650000033
其中
Figure BDA0003647445650000034
表示第i枚拦截弹的坐标位置;ai表示拦截弹的侧向加速度;
Figure BDA0003647445650000035
表示拦截弹自动驾驶仪时间常数,设定时间常数为0.1s;相应的目标自动驾驶仪表达式为:
Figure BDA0003647445650000036
其中(xT,yT)表示目标的坐标位置;aT表示目标的侧向加速度;τT表示目标自动驾驶仪时间常数,设定时间常数为0.1s。
优选的,步骤3中,基于一致性理论并结合协同制导动力学方程,建立局部邻域一致性误差方程具体为:基于显式协同制导方式,将剩余距离作为协同变量,通过控制各枚导弹与目标的剩余距离r1,…,rN,使得它们同时趋于零,从而保证所有导弹同时击中目标,定义状态变量
Figure BDA0003647445650000037
则协同拦截制导模型可以表示为如下仿射非线性动力学:
Figure BDA0003647445650000038
其中
Figure BDA0003647445650000039
为系统的状态函数,领导者模型表达式为:
Figure BDA0003647445650000041
领导者模型具体结构与拦截弹相同,且为了保证协同拦截制导的成功,领导者采用比例导引方式从而保证领导能够成功拦截机动目标;
结合图论,建立如下第i个节点的局部邻域一致误差系统:
Figure BDA0003647445650000042
其中
Figure BDA0003647445650000043
以及
Figure BDA0003647445650000044
导弹协同制导律设计问题被转化为非线性系统(7)的控制问题,通过针对系统(7)设计控制律,保证第i个节点的局部邻域一致误差趋于零,从而确保协同拦截制导的成功。
优选的,步骤4中,利用在线辨识技术结合模型输入输出数据,处理模型未知动态具体为:考虑系统函数fi(xi)未知,则系统(5)被近似为如下形式:
Figure BDA0003647445650000045
其中
Figure BDA0003647445650000046
表示神经网络期望权值,
Figure BDA0003647445650000047
表示激励函数,
Figure BDA0003647445650000048
表示近似误差;
为了重构未知函数,定义
Figure BDA0003647445650000049
设计如下自适应补偿在线辨识器
Figure BDA00036474456500000410
以及如下权值更新律和自适应律:
Figure BDA00036474456500000411
Figure BDA00036474456500000412
其中
Figure BDA00036474456500000413
分别表示状态和神经网络权值的估计值,sgn(δi)表示符号函数,Mi,Ei,Gi为设计的常数矩阵,αi为设计的增益常数,局部邻域一致误差系统被重写为:
Figure BDA00036474456500000414
其中
Figure BDA00036474456500000415
优选的,步骤5中,根据邻域一致性误差方程,推导最优触发控制策略具体为:定义如下局部性能指标
Figure BDA0003647445650000051
其中Qi,Rii,Rij为设计的正定对称矩阵;
定义如下Hamilton函数为:
Figure BDA0003647445650000052
其中
Figure BDA0003647445650000053
表示性能指标对状态的偏导数;
引入事件触发机制,针对第i个节点,定义一个单调递增的时间瞬间序列
Figure BDA0003647445650000054
记测量采样瞬间的系统状态为
Figure BDA0003647445650000055
则定义如下最新状态测量采样瞬间和当前状态误差为:
Figure BDA0003647445650000056
相应的,基于事件的局部邻域一致误差系统和触发测量误差为:
Figure BDA0003647445650000057
Figure BDA0003647445650000058
根据最优控制理论,推导得到最优触发控制策略为:
Figure BDA0003647445650000059
其中
Figure BDA00036474456500000510
将(18)的控制策略带入(14)得到如下触发HJB方程:
Figure BDA00036474456500000511
优选的,步骤6中,利用自适应动态规划技术并结合未知动态辨识数据,实施最优触发控制策略具体为:结合神经网络理论,构造如下评价网络近似代价函数,其期望近似形式为:
Figure BDA0003647445650000061
其中
Figure BDA0003647445650000062
为评价网络期望权值,
Figure BDA0003647445650000063
为评价网络激励函数,εi(zi)表示近似误差;
(20)式关于状态的偏导数表示为:
Figure BDA0003647445650000064
其中
Figure BDA0003647445650000065
采用如下实际近似形式:
Figure BDA0003647445650000066
Figure BDA0003647445650000067
其中,
Figure BDA0003647445650000068
Figure BDA0003647445650000069
为代价函数和权值的估计值;
则由(23)式,推导出近似触发最优控制策略表达式为:
Figure BDA00036474456500000610
结合(22)-(24),代入(19)式,得到HJB近似误差方程为:
Figure BDA00036474456500000611
评价网络设计的目的是设计合适的权值更新律使得权值估计值
Figure BDA00036474456500000612
接近期望值
Figure BDA00036474456500000613
也就是使得如下误差函数最小化:
Figure BDA00036474456500000614
为了保证闭环系统在整个学习过程中的有界性,设计一个连续可微的径向无界Lyapunov函数Ji(zi),且使得该函数能够满足如下条件
Figure BDA00036474456500000615
其中
Figure BDA00036474456500000616
表示Ji(zi)对时间的导数,
Figure BDA00036474456500000617
表示Ji(zi)对zi的偏导数,即
Figure BDA00036474456500000618
基于梯度下降方法,综合考虑闭环系统的稳定性,设计如下触发评价网络更新律:
Figure BDA0003647445650000071
其中βi>0是网络权值学习率,
Figure BDA0003647445650000072
定义为如下表达式:
Figure BDA0003647445650000073
以及设计如下触发条件:
Figure BDA0003647445650000074
本发明的有益效果为:(1)本发明考虑了多弹协同制导控制最优控制策略设计问题,利用自适应动态规划技术有效解决了非线性强耦合HJB方程求解问题,并且单评价网络结构大幅降低了控制策略设计的复杂度;(2)本发明考虑了多弹协同制导控制最优控制策略设计问题,利用自适应动态规划技术有效解决了非线性强耦合HJB方程求解问题,并且单评价网络结构大幅降低了控制策略设计的复杂度;(3)本发明通过事件触发机制的引入,节约了通信带宽资源,提升了信息的利用率,降低了多弹拦截目标过程中的成本,具有实际意义。
附图说明
图1为本发明的多弹协同制导二维平面相对运动示意图。
图2为本发明的制导方法流程示意图。
具体实施方式
如图1和图2所示,一种分布式最优事件触发协同制导方法,包括如下步骤:
步骤1、利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑。
将协同制导问题考虑为多智能体协同控制问题,其通讯拓扑用如下有向图表示:
Figure BDA0003647445650000075
其中,
Figure BDA0003647445650000076
表示节点集合,
Figure BDA0003647445650000077
表示节点通讯链接集合,A=[aij]∈RN×N,aij≥0表示权值链接矩阵,如果(i,j)∈ε,则表明智能体j是智能体i的邻域智能体,此时aij=1;否则,aij=0;将智能体i的所有邻域智能体的集合表示为Ni={j:(i,j)∈ε},定义入度矩阵D=diag{d1,d2,…,dN},其中
Figure BDA0003647445650000081
表示智能体i的邻域智能体的数量,定义图
Figure BDA0003647445650000082
的拉普拉斯矩阵为L=D-A且所有行的和为零,考虑图
Figure BDA0003647445650000083
为强联通的有向图且aii=0;另外,智能体i与领导者之间的连接矩阵表示为B=diag{b1,b2,…,bN},其中,bi=1表示智能体i能够接收领导者信息;否则,bi=0。
步骤2、基于通讯拓扑,推导协同制导模型;二维平面N枚导弹协同拦截同一目标模型表达为如下相对运动方程:
Figure BDA0003647445650000084
其中Mi代表第i枚导弹,T代表目标,考虑所有导弹和目标的运动为质点运动且速度大小均为恒定值,Vi和VT分别表示第i枚导弹和目标的速度;
Figure BDA0003647445650000085
和γT分别表示第i枚导弹的目标的航迹倾角;
Figure BDA0003647445650000086
表示第i枚导弹与目标之间视线角;ri表示第i枚导弹和目标之间的距离,则其相对速率表示为
Figure BDA0003647445650000087
ui和ν分别第i枚导弹和目标垂直于速度向量的加速度,各枚导弹之间依靠通讯拓扑网络进行通讯,即第i枚导弹只与其邻域导弹进行通信;
第i枚导弹和目标均表现为如下一阶自动驾驶仪:
Figure BDA0003647445650000088
其中
Figure BDA0003647445650000089
表示第i枚拦截弹的坐标位置;ai表示拦截弹的侧向加速度;
Figure BDA00036474456500000810
表示拦截弹自动驾驶仪时间常数,设定时间常数为0.1s;相应的目标自动驾驶仪表达式为:
Figure BDA0003647445650000091
其中(xT,yT)表示目标的坐标位置;aT表示目标的侧向加速度;τT表示目标自动驾驶仪时间常数,设定时间常数为0.1s。
步骤3、基于一致性理论并结合协同制导动力学方程,建立局部邻域一致性误差方程;基于显式协同制导方式,将剩余距离作为协同变量,定义状态变量
Figure BDA0003647445650000099
则协同拦截制导模型可以表示为如下仿射非线性动力学:
Figure BDA0003647445650000092
其中
Figure BDA0003647445650000093
为系统的状态函数,领导者模型表达式为:
Figure BDA0003647445650000094
领导者模型具体结构与拦截弹相同,且为了保证协同拦截制导的成功,领导者采用比例导引方式从而保证领导能够成功拦截机动目标;
结合图论,建立如下第i个节点的局部邻域一致误差系统:
Figure BDA0003647445650000095
其中
Figure BDA0003647445650000096
以及
Figure BDA0003647445650000097
导弹协同制导律设计问题被转化为非线性系统(7)的控制问题,通过针对系统(7)设计控制律,保证第i个节点的局部邻域一致误差趋于零,从而确保协同拦截制导的成功。
步骤4、利用在线辨识技术结合模型输入输出数据,处理模型未知动态;考虑系统函数fi(xi)未知,则系统(5)被近似为如下形式:
Figure BDA0003647445650000098
其中
Figure BDA0003647445650000101
表示神经网络期望权值,
Figure BDA0003647445650000102
表示激励函数,
Figure BDA0003647445650000103
表示近似误差;
为了重构未知函数,定义
Figure BDA0003647445650000104
设计如下自适应补偿在线辨识器
Figure BDA0003647445650000105
以及如下权值更新律和自适应律:
Figure BDA0003647445650000106
Figure BDA0003647445650000107
其中
Figure BDA0003647445650000108
分别表示状态和神经网络权值的估计值,sgn(δi)表示符号函数,Mi,Ei,Gi为设计的常数矩阵,αi为设计的增益常数,局部邻域一致误差系统被重写为:
Figure BDA0003647445650000109
其中
Figure BDA00036474456500001010
步骤5、根据邻域一致性误差方程,推导最优触发控制策略;定义如下局部性能指标
Figure BDA00036474456500001011
其中Qi,Rii,Rij为设计的正定对称矩阵;
定义如下Hamilton函数为:
Figure BDA00036474456500001012
其中
Figure BDA00036474456500001013
表示性能指标对状态的偏导数;
引入事件触发机制,针对第i个节点,定义一个单调递增的时间瞬间序列
Figure BDA00036474456500001014
记测量采样瞬间的系统状态为
Figure BDA00036474456500001015
则定义如下最新状态测量采样瞬间和当前状态误差为:
Figure BDA00036474456500001016
相应的,基于事件的局部邻域一致误差系统和触发测量误差为:
Figure BDA0003647445650000111
Figure BDA0003647445650000112
根据最优控制理论,推导得到最优触发控制策略为:
Figure BDA0003647445650000113
其中
Figure BDA0003647445650000114
将(18)的控制策略带入(14)得到如下触发HJB方程:
Figure BDA0003647445650000115
步骤6、利用自适应动态规划技术并结合未知动态辨识数据,实施最优触发控制策略;结合神经网络理论,构造如下评价网络近似代价函数,其期望近似形式为:
Figure BDA0003647445650000116
其中
Figure BDA0003647445650000117
为评价网络期望权值,
Figure BDA0003647445650000118
为评价网络激励函数,εi(zi)表示近似误差;
(20)式关于状态的偏导数表示为:
Figure BDA0003647445650000119
其中
Figure BDA00036474456500001110
采用如下实际近似形式:
Figure BDA00036474456500001111
Figure BDA00036474456500001112
其中,
Figure BDA00036474456500001113
Figure BDA00036474456500001114
为代价函数和权值的估计值;
则由(23)式,推导出近似触发最优控制策略表达式为:
Figure BDA00036474456500001115
结合(22)-(24),代入(19)式,得到HJB近似误差方程为:
Figure BDA00036474456500001116
评价网络设计的目的是设计合适的权值更新律使得权值估计值
Figure BDA0003647445650000121
接近期望值
Figure BDA0003647445650000122
也就是使得如下误差函数最小化:
Figure BDA0003647445650000123
为了保证闭环系统在整个学习过程中的有界性,设计一个连续可微的径向无界Lyapunov函数Ji(zi),且使得该函数能够满足如下条件
Figure BDA0003647445650000124
其中
Figure BDA0003647445650000125
表示Ji(zi)对时间的导数,
Figure BDA0003647445650000126
表示Ji(zi)对zi的偏导数,即
Figure BDA0003647445650000127
基于梯度下降方法,综合考虑闭环系统的稳定性,设计如下触发评价网络更新律:
Figure BDA0003647445650000128
其中βi>0是网络权值学习率,
Figure BDA0003647445650000129
Π(·)定义为如下表达式:
Figure BDA00036474456500001210
以及设计如下触发条件:
Figure BDA00036474456500001211

Claims (7)

1.一种分布式最优事件触发协同制导方法,其特征在于,包括如下步骤:
步骤1、利用图论的相关理论,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑;
步骤2、基于通讯拓扑,推导协同制导模型;
步骤3、基于一致性理论并结合协同制导动力学方程,建立局部邻域一致性误差方程;
步骤4、利用在线辨识技术结合模型输入输出数据,处理模型未知动态;
步骤5、根据邻域一致性误差方程,推导最优触发控制策略;
步骤6、利用自适应动态规划技术并结合未知动态辨识数据,实施最优触发控制策略。
2.如权利要求1所述的分布式最优事件触发协同制导方法,其特征在于,步骤1中,将协同制导问题转化为多智能体协同控制问题,构造协同制导问题的通讯拓扑具体为:将协同制导问题考虑为多智能体协同控制问题,其通讯拓扑用如下有向图表示:
Figure FDA0003647445640000011
其中,
Figure FDA0003647445640000012
表示节点集合,
Figure FDA0003647445640000013
表示节点通讯链接集合,A=[aij]∈RN×N,aij≥0表示权值链接矩阵,如果
Figure FDA0003647445640000014
则表明智能体j是智能体i的邻域智能体,此时aij=1;否则,aij=0;将智能体i的所有邻域智能体的集合表示为
Figure FDA0003647445640000015
定义入度矩阵D=diag{d1,d2,…,dN},其中
Figure FDA0003647445640000016
表示智能体i的邻域智能体的数量,定义图
Figure FDA0003647445640000017
的拉普拉斯矩阵为L=D-A且所有行的和为零,考虑图
Figure FDA0003647445640000018
为强联通的有向图且aii=0;另外,智能体i与领导者之间的连接矩阵表示为B=diag{b1,b2,…,bN},其中,bi=1表示智能体i能够接收领导者信息;否则,bi=0。
3.如权利要求1所述的分布式最优事件触发协同制导方法,其特征在于,步骤2中,基于通讯拓扑,推导协同制导模型具体为:二维平面N枚导弹协同拦截同一目标模型表达为如下相对运动方程:
Figure FDA0003647445640000021
其中Mi代表第i枚导弹,T代表目标,考虑所有导弹和目标的运动为质点运动且速度大小均为恒定值,Vi和VT分别表示第i枚导弹和目标的速度;
Figure FDA0003647445640000022
和γT分别表示第i枚导弹的目标的航迹倾角;
Figure FDA0003647445640000023
表示第i枚导弹与目标之间视线角;ri表示第i枚导弹和目标之间的距离,则其相对速率表示为
Figure FDA0003647445640000024
ui和ν分别第i枚导弹和目标垂直于速度向量的加速度,各枚导弹之间依靠通讯拓扑网络进行通讯,即第i枚导弹只与其邻域导弹进行通信;
第i枚导弹和目标均表现为如下一阶自动驾驶仪:
Figure FDA0003647445640000025
其中
Figure FDA0003647445640000026
表示第i枚拦截弹的坐标位置;ai表示拦截弹的侧向加速度;
Figure FDA0003647445640000027
表示拦截弹自动驾驶仪时间常数,设定时间常数为0.1s;相应的目标自动驾驶仪表达式为:
Figure FDA0003647445640000028
其中(xT,yT)表示目标的坐标位置;aT表示目标的侧向加速度;τT表示目标自动驾驶仪时间常数,设定时间常数为0.1s。
4.如权利要求1所述的分布式最优事件触发协同制导方法,其特征在于,步骤3中,基于一致性理论并结合协同制导动力学方程,建立局部邻域一致性误差方程具体为:基于显式协同制导方式,将剩余距离作为协同变量,通过控制各枚导弹与目标的剩余距离r1,…,rN,使得它们同时趋于零,从而保证所有导弹同时击中目标,定义状态变量
Figure FDA0003647445640000029
则协同拦截制导模型可以表示为如下仿射非线性动力学:
Figure FDA00036474456400000210
其中
Figure FDA0003647445640000031
为系统的状态函数,领导者模型表达式为:
Figure FDA0003647445640000032
领导者模型具体结构与拦截弹相同,且为了保证协同拦截制导的成功,领导者采用比例导引方式从而保证领导能够成功拦截机动目标;
结合图论,建立如下第i个节点的局部邻域一致误差系统:
Figure FDA0003647445640000033
其中
Figure FDA0003647445640000034
以及
Figure FDA0003647445640000035
导弹协同制导律设计问题被转化为非线性系统(7)的控制问题,通过针对系统(7)设计控制律,保证第i个节点的局部邻域一致误差趋于零,从而确保协同拦截制导的成功。
5.如权利要求1所述的分布式最优事件触发协同制导方法,其特征在于,步骤4中,利用在线辨识技术结合模型输入输出数据,处理模型未知动态具体为:考虑系统函数fi(xi)未知,则系统(5)被近似为如下形式:
Figure FDA0003647445640000036
其中
Figure FDA0003647445640000037
表示神经网络期望权值,
Figure FDA0003647445640000038
表示激励函数,
Figure FDA0003647445640000039
表示近似误差;
为了重构未知函数,定义
Figure FDA00036474456400000310
设计如下自适应补偿在线辨识器
Figure FDA00036474456400000311
以及如下权值更新律和自适应律:
Figure FDA00036474456400000312
Figure FDA00036474456400000313
其中
Figure FDA00036474456400000314
分别表示状态和神经网络权值的估计值,sgn(δi)表示符号函数,Mi,Ei,Gi为设计的常数矩阵,αi为设计的增益常数,局部邻域一致误差系统被重写为:
Figure FDA0003647445640000041
其中
Figure FDA0003647445640000042
6.如权利要求1所述的分布式最优事件触发协同制导方法,其特征在于,步骤5中,根据邻域一致性误差方程,推导最优触发控制策略具体为:定义如下局部性能指标
Figure FDA0003647445640000043
其中Qi,Rii,Rij为设计的正定对称矩阵;
定义如下Hamilton函数为:
Figure FDA0003647445640000044
其中
Figure FDA0003647445640000045
表示性能指标对状态的偏导数;
引入事件触发机制,针对第i个节点,定义一个单调递增的时间瞬间序列
Figure FDA0003647445640000046
记测量采样瞬间的系统状态为
Figure FDA0003647445640000047
则定义如下最新状态测量采样瞬间和当前状态误差为:
Figure FDA0003647445640000048
相应的,基于事件的局部邻域一致误差系统和触发测量误差为:
Figure FDA0003647445640000049
Figure FDA00036474456400000410
根据最优控制理论,推导得到最优触发控制策略为:
Figure FDA00036474456400000411
其中
Figure FDA00036474456400000412
将(18)的控制策略带入(14)得到如下触发HJB方程:
Figure FDA00036474456400000413
7.如权利要求1所述的分布式最优事件触发协同制导方法,其特征在于,步骤6中,利用自适应动态规划技术并结合未知动态辨识数据,实施最优触发控制策略具体为:结合神经网络理论,构造如下评价网络近似代价函数,其期望近似形式为:
Figure FDA0003647445640000051
其中
Figure FDA0003647445640000052
为评价网络期望权值,
Figure FDA0003647445640000053
为评价网络激励函数,εi(zi)表示近似误差;
(20)式关于状态的偏导数表示为:
Figure FDA0003647445640000054
其中
Figure FDA0003647445640000055
采用如下实际近似形式:
Figure FDA0003647445640000056
Figure FDA0003647445640000057
其中,
Figure FDA0003647445640000058
Figure FDA0003647445640000059
为代价函数和权值的估计值;
则由(23)式,推导出近似触发最优控制策略表达式为:
Figure FDA00036474456400000510
结合(22)-(24),代入(19)式,得到HJB近似误差方程为:
Figure FDA00036474456400000511
评价网络设计的目的是设计合适的权值更新律使得权值估计值
Figure FDA00036474456400000512
接近期望值
Figure FDA00036474456400000513
也就是使得如下误差函数最小化:
Figure FDA00036474456400000514
为了保证闭环系统在整个学习过程中的有界性,设计一个连续可微的径向无界Lyapunov函数Ji(zi),且使得该函数能够满足如下条件
Figure FDA00036474456400000515
其中
Figure FDA00036474456400000516
表示Ji(zi)对时间的导数,
Figure FDA00036474456400000517
表示Ji(zi)对zi的偏导数,即
Figure FDA00036474456400000518
基于梯度下降方法,综合考虑闭环系统的稳定性,设计如下触发评价网络更新律:
Figure FDA0003647445640000061
其中βi>0是网络权值学习率,
Figure FDA0003647445640000062
定义为如下表达式:
Figure FDA0003647445640000063
以及设计如下触发条件:
Figure FDA0003647445640000064
CN202210534990.1A 2022-05-17 2022-05-17 一种分布式最优事件触发协同制导方法 Pending CN114995129A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210534990.1A CN114995129A (zh) 2022-05-17 2022-05-17 一种分布式最优事件触发协同制导方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210534990.1A CN114995129A (zh) 2022-05-17 2022-05-17 一种分布式最优事件触发协同制导方法

Publications (1)

Publication Number Publication Date
CN114995129A true CN114995129A (zh) 2022-09-02

Family

ID=83027690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210534990.1A Pending CN114995129A (zh) 2022-05-17 2022-05-17 一种分布式最优事件触发协同制导方法

Country Status (1)

Country Link
CN (1) CN114995129A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115649240A (zh) * 2022-12-29 2023-01-31 中南大学 一种在线实时优化多列车协同巡航控制方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2727777C1 (ru) * 2019-08-05 2020-07-23 Акционерное общество "Концерн радиостроения "Вега" Способ наведения инерционного летательного аппарата с учетом несоответствия динамических свойств цели и перехватчика
CN111638726A (zh) * 2020-05-27 2020-09-08 北京理工大学 基于事件触发通信的多无人机编队一致性控制方法
CN113325866A (zh) * 2021-05-20 2021-08-31 南京航空航天大学 一种基于事件触发的微分对策协同制导方法
CN113341727A (zh) * 2021-06-22 2021-09-03 北京理工大学 一种事件触发分布式自学习协同博弈拦截制导方法
CN114326818A (zh) * 2022-01-10 2022-04-12 大连海事大学 一种基于动态事件触发的无人机输出反馈协同控制系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2727777C1 (ru) * 2019-08-05 2020-07-23 Акционерное общество "Концерн радиостроения "Вега" Способ наведения инерционного летательного аппарата с учетом несоответствия динамических свойств цели и перехватчика
CN111638726A (zh) * 2020-05-27 2020-09-08 北京理工大学 基于事件触发通信的多无人机编队一致性控制方法
CN113325866A (zh) * 2021-05-20 2021-08-31 南京航空航天大学 一种基于事件触发的微分对策协同制导方法
CN113341727A (zh) * 2021-06-22 2021-09-03 北京理工大学 一种事件触发分布式自学习协同博弈拦截制导方法
CN114326818A (zh) * 2022-01-10 2022-04-12 大连海事大学 一种基于动态事件触发的无人机输出反馈协同控制系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
毛昱天;杨明;张锐;乔治;吴丹;: "领航跟随多导弹系统分布式协同制导", 导航定位与授时, no. 02, 15 March 2016 (2016-03-15) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115649240A (zh) * 2022-12-29 2023-01-31 中南大学 一种在线实时优化多列车协同巡航控制方法及系统

Similar Documents

Publication Publication Date Title
CN113325866B (zh) 一种基于事件触发的微分对策协同制导方法
CN108680063B (zh) 一种针对大规模无人机集群动态对抗的决策方法
CN106647287B (zh) 一种基于自适应动态规划的输入受限微分对策制导方法
Zhang et al. Two-stage cooperative guidance strategy using a prescribed-time optimal consensus method
CN113341727B (zh) 一种事件触发分布式自学习协同博弈拦截制导方法
CN114330115B (zh) 一种基于粒子群搜索的神经网络空战机动决策方法
CN112577373B (zh) 一种基于比例导引律的多导弹同时攻击静目标的制导律
CN114020021B (zh) 一种多导弹分布式协同制导律的设计方法及系统
CN114995129A (zh) 一种分布式最优事件触发协同制导方法
CN115951695A (zh) 空战模拟环境中基于三方博弈的动态战术控制域解算方法
CN117332684B (zh) 一种基于强化学习的多航天器追逃博弈下的最优捕获方法
CN109165444B (zh) 多飞行器同时协同拦截飞行器数量及空间位置散布的设计方法
CN116401752A (zh) 基于超扭曲观测器的自适应滑模多飞行器协同末制导律设计方法
CN114609930A (zh) 网络环境下基于混合事件触发的无人机空地跟踪控制方法
Zhou et al. Distributed cooperative guidance for multi-missile system with time-varying delays and switching topologies
Weilin et al. Decision-making of one-on-one beyond-visual-range air combat based on improved q-network
CN114993108B (zh) 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法
Zhang et al. The time-to-go consensus of multi-missiles with communication delay
Chen et al. A Cooperative Guidance Law for Multiple Missiles based on Reinforcement Learning
Xiang et al. A distributed decision method for missiles autonomous formation based on potential game
Li et al. Three-Dimensional Cooperative Guidance with Multiple Constraints Based on Proximal Policy Optimization
Luogang et al. The multi-missile heterogeneous networked collaborative guidance method under communication delay conditions
Zheng et al. Analysis on Basic Connotation and Key Technology of Intelligent Weapon Station
CN118092151B (zh) 一种基于分布式模型预测控制的多导弹协同制导方法
CN117022676A (zh) 不完全信息下的航天器微分博弈拦截控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination