CN115357051B - 变形与机动一体化的规避与突防方法 - Google Patents
变形与机动一体化的规避与突防方法 Download PDFInfo
- Publication number
- CN115357051B CN115357051B CN202211270948.XA CN202211270948A CN115357051B CN 115357051 B CN115357051 B CN 115357051B CN 202211270948 A CN202211270948 A CN 202211270948A CN 115357051 B CN115357051 B CN 115357051B
- Authority
- CN
- China
- Prior art keywords
- aircraft
- gliding
- avoidance
- penetration
- deformation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000007123 defense Effects 0.000 title claims abstract description 12
- 230000035515 penetration Effects 0.000 claims abstract description 29
- 230000002265 prevention Effects 0.000 claims abstract description 9
- 238000005457 optimization Methods 0.000 claims description 14
- 230000009471 action Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 10
- 230000002787 reinforcement Effects 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 claims description 2
- 238000004220 aggregation Methods 0.000 claims description 2
- 230000010354 integration Effects 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 abstract description 6
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/101—Simultaneous control of position or course in three dimensions specially adapted for aircraft
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/20—Instruments for performing navigational calculations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Automation & Control Theory (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Aviation & Aerospace Engineering (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明公开了一种变形与机动一体化的规避与突防方法,涉及飞行器规避与突防技术领域,该方法适用于多种飞行器,具有泛化性。首先根据作战任务,对滑翔飞行器进行发射诸元解算与发射诸元装订,获得预设的标称轨迹。滑翔飞行器发射,并按预设的标称轨迹持续飞行。若飞行器在中段遭遇敌方拦截,则通过机翼变形实现滑翔飞行器的中段规避与突防;变形后的滑翔飞行器进行轨迹重规划,保证滑翔飞行器完成原始的作战任务。若飞行器在末段遭遇敌方拦截,则进行机动闪避在原始轨迹周围进行变轨,以实现末段规避与突防,同时进行轨迹重规划,保证在机动变轨之后仍能完成原始任务。若飞行器未遭遇敌方拦截,则按照标称轨迹持续飞行,直至完成作战任务。
Description
技术领域
本发明涉及飞行器规避与突防技术领域,具体涉及一种变形与机动一体化的规避与突防方法。
背景技术
在复杂的战场环境中,由于常规固定外形飞行器的大升阻比与大机动过载之间存在矛盾,而且在高速飞行情况下存在气动加热严重等问题,导致常规固定外形飞行器在实际飞行过程中机动能力不足,从而导致其在战场遭遇时刻的规避与突防能力不足。
面向敌方拦截的主动规避与突防方法,是当前国内外研究的重点。传统的机动突防方式通常基于飞行器的气动模型,将重力纳入模型范围,考虑再入点的空间位置、速度以及过载等约束,从机动的时刻点、机动时间和机动能力等方面对拦截器脱靶量进行仿真研究,构建线性微分对策模型,以航向误差为性能指标,借鉴数学中泛函数的双边极值问题讨论方法,最终得出飞行器的机动策略。近年来,众多专家与文献也提出了基于传统优化算法的机动突防技术,这类技术通常基于大量数据,通过优化计算得到最优策略集,根据支付函数制定战术策略,完成自主化突防任务,趋于智能化。
上述研究对飞行器主动规避与突防技术的发展起到了重要推动作用。然而,上述方法生成的规避与突防策略过于依赖模型与空气动力学参数,在实际应用中仍然是射前规划中制定的方案弹道,至于飞行器发射后如何实时面对敌方拦截,缺少临机策略指导,因此自主智能性较低。面对防御系统在中段、末段的全程拦截,我方飞行器在临机规避与突防领域的研究亟待开展。
发明内容
有鉴于此,本发明提供了一种变形与机动一体化的规避与突防方法,该方法考虑了飞行器在飞行过程中不同阶段遭遇敌方拦截时的规避与突防方法,适用于多种飞行器,具有泛化性。
为达到上述目的,本发明的技术方案包括如下步骤:
步骤1:根据作战任务,对滑翔飞行器进行发射诸元解算与发射诸元装订,获得预设的标称轨迹。
步骤2:滑翔飞行器发射,并按预设的标称轨迹持续飞行。
步骤3:若滑翔飞行器在中段遭遇敌方拦截,则通过展开弹翼,提高最大升阻比,或者通过收起弹翼,降低最大升阻比,实现滑翔飞行器的中段规避与突防;变形后的滑翔飞行器进行轨迹重规划,重规划后的轨迹保证滑翔飞行器完成原始的作战任务。
步骤4:若滑翔飞行器在末段遭遇敌方拦截,则进行机动闪避从而在原始轨迹周围进行变轨,以实现飞行器的末段规避与突防,同时进行轨迹重规划,以保证其在机动变轨之后仍能完成原始任务。
步骤5:若飞行器未遭遇敌方拦截,则按照步骤2中的标称轨迹持续飞行,直至完成作战任务。
进一步地,发射诸元包括发射方位角A、最大负攻角αm、三级俯仰角变化率φ3’、剖面参数Dc、标称攻角指令αp、标称倾侧角指令γVp。
进一步地,步骤3中,变形后的滑翔飞行器进行轨迹重规划,具体步骤为:
以变形的时机和变形后的飞行器参数组成为多目标变量。
对于多目标变量Xorigin,首先进行分解得到单目标变量(X1,…,Xm),m为单目标变量个数,之后对优化目标进行聚合更新,并验证是否满足终止条件:脱靶量大于10m且能够完成作战任务,若满足则输出最终优化结果Xbest,否则继续进行分解更新,直至满足终止条件,之后输出最终优化结果Xbest。
根据最终优化结果确定重规划后的轨迹。
进一步地,步骤4具体为:
当滑翔飞行器感知到敌方拦截时,感知单元将探测到的敌我双方实时态势信息传输给深度强化学习网络,敌我双方实时态势信息包括敌我双方相对距离R、相对视线角q作为网络的观测向量St,网络内部则进行奖励函数Rt的梯度更新。
随着攻防对抗的进行,奖励函数逐渐收敛至取值最优,从而得到一个能够稳定输出规避与突防策略π*深度强化学习神经网络模型,该网络模型用于稳定输出动作控制指令;动作控制指令包括过载控制指令或者姿态控制指令。
此时,固定该网络模型的权重参数,当再次输入感知单元观测到的实时态势信息时,该网络模型即可稳定输出连续的动作控制指令,且保证在此连续动作控制指令的指导下,滑翔飞行器实现实时的规避与突防,并且最终完成原始作战任务。
进一步地,奖励函数Rt的主线回报设计为:脱靶量大于10m且能完成原始任务。
有益效果:
1、本发明针对上述固定外形飞行器机动能力不足、飞行器在线规避与突防技术缺乏等问题,将变形方法与机动方法结合起来,从而拓展飞行器机动能力上限,同时通过在线智能算法解决临机决策问题,从而提高飞行器在实际作战过程中的战场生存能力。
2、本发明可面向某一典型飞行器,针对其在不同飞行阶段遭遇拦截时,解决对应的规避与突防问题;同时适用于多种飞行器,针对不同飞行器在各自的战场遭遇情况下,解决其对应的规避与突防问题,泛化性强。
3、本发明中飞行器变形与机动策略的生成都是基于统一的框架,基于这种框架的飞行器可以自适应地增添或删减,从而有效应对飞行器随时出现损毁或者增添的场景,增加了整个系统的鲁棒性。
附图说明
图1为一种变形与机动一体化的规避与突防方法的整体流程图;
图2为发射诸元求解方法示意图;
图3为变形策略及重规划求解方法示意图;
图4为机动策略及重规划求解方法示意图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
本发明提供了一种变形与机动一体化的规避与突防方法。该方法考虑了飞行器可变外形情况下,面向战场实时遭遇时刻,结合变形与机动一体化策略,快速、高效地生成一个可行的规避与突防方案。本发明结合多目标优化和深度强化学习方法,作为变形与机动一体化的规避与突防方案的求解算法。算法对机载计算器的硬件要求低,求解速度快。其主要实体可以包括如下:用于执行战场侦察、打击等任务的低速、亚音速、超音速以及高超音速滑翔飞行器。
如图1所示,的一种变形与机动一体化的规避与突防方法具体步骤如下:
步骤1:根据侦察、打击等作战任务,针对典型飞行器(滑翔飞行器)进行发射诸元解算并进行发射诸元装订(装订发射诸元得到预设的标称轨迹),其中发射诸元包括:发射方位角A、最大负攻角αm、三级俯仰角变化率φ3’(以三级火箭作为助推器为例)、剖面参数Dc、标称攻角指令αp、标称倾侧角指令γVp等。具体发射诸元求解方法如图2。
步骤2:飞行器发射,并按预设的标称轨迹持续飞行。
步骤3:若飞行器在中段(相对平衡的阶段)遭遇敌方拦截,通过展开机翼,提高最大升阻比,从而大幅跃起至高度更高的空域;或者通过收起机翼,降低最大升阻比,从而大幅下滑至高度更低的空域,进而实现规避与突防。同时针对变形后的飞行器进行轨迹重规划,以保证其在大幅改变飞行空域后仍能完成原始任务。具体变形策略及重规划求解方法如图3。
对于输入的多目标变量Xorigin(变形的时机、变形之后的最大升阻比),首先进行分解得到单目标变量(X1,…,Xm),之后对优化目标进行聚合更新,并验证是否满足终止条件:脱靶量大于10m且能够完成作战任务,若满足则输出最终优化结果Xbest,否则继续进行分解更新,直至满足终止条件,之后输出最终优化结果Xbest。
步骤4:若飞行器在末段遭遇敌方拦截,通过机动闪避,在原始轨迹周围进行小幅变轨,从而实现规避与突防,同时进行轨迹重规划,以保证其在机动变轨之后仍能完成原始任务。具体机动策略及重规划求解方法如图4。
当我方飞行器感知到敌方拦截时,感知单元将探测到的敌我双方相对信息(主要包括敌我双方相对距离R、相对视线角q)传输给深度强化学习网络,作为网络的观测向量St,网络内部则进行奖励函数Rt的梯度更新,其中奖励函数Rt的主线回报设计为:脱靶量大于10m且能完成原始任务。随着海量攻防对抗的进行,奖励函数逐渐收敛至取值最优,从而得到一个能够稳定输出规避与突防策略π*的深度强化学习神经网络,也即该网络模型能够稳定输出过载控制指令(Nx,Ny,Nz)或者姿态控制指令(alpha,gamma)等底层动作控制指令。此时,固定该网络模型的权重参数,当再次输入感知单元观测到的实时态势信息时,该网络即可稳定输出连续的动作控制指令,且保证在此连续动作控制指令的指导下,飞行器能够实现实时的规避与突防,并且最终完成侦察、打击等原始作战任务。
步骤5:若飞行器未遭遇敌方拦截,则按照步骤2中的标称轨迹持续飞行,直至完成作战任务。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.变形与机动一体化的规避与突防方法,其特征在于,包括:
步骤1:根据作战任务,对滑翔飞行器进行发射诸元解算与发射诸元装订,获得预设的标称轨迹;
步骤2:所述滑翔飞行器发射,并按所述预设的标称轨迹持续飞行;
步骤3:若所述滑翔飞行器在中段遭遇敌方拦截,则通过展开弹翼,提高最大升阻比,或者通过收起弹翼,降低最大升阻比,实现滑翔飞行器的中段规避与突防;变形后的滑翔飞行器进行轨迹重规划,重规划后的轨迹保证滑翔飞行器完成原始的作战任务;
步骤4:若滑翔飞行器在末段遭遇敌方拦截,则进行机动闪避从而在原始轨迹周围进行变轨,以实现飞行器的末段规避与突防,同时进行轨迹重规划,以保证其在机动变轨之后仍能完成原始任务;
具体为:当所述滑翔飞行器感知到敌方拦截时,感知单元将探测到的敌我双方实时态势信息传输给深度强化学习网络,所述敌我双方实时态势信息包括敌我双方相对距离R、相对视线角q作为网络的观测向量St,网络内部则进行奖励函数Rt的梯度更新;
随着攻防对抗的进行,奖励函数逐渐收敛至取值最优,从而得到一个能够稳定输出规避与突防策略π*的深度强化学习神经网络模型,该网络模型用于稳定输出动作控制指令;所述动作控制指令包括过载控制指令或者姿态控制指令;
此时,固定该网络模型的权重参数,当再次输入感知单元观测到的实时态势信息时,该网络模型即可稳定输出连续的动作控制指令,且保证在此连续动作控制指令的指导下,滑翔飞行器实现实时的规避与突防,并且最终完成原始作战任务;
步骤5:若飞行器未遭遇敌方拦截,则按照步骤2中的标称轨迹持续飞行,直至完成作战任务。
2.如权利要求1所述的变形与机动一体化的规避与突防方法,其特征在于,所述发射诸元包括发射方位角A、最大负攻角αm、三级俯仰角变化率φ3’、剖面参数Dc、标称攻角指令αp、标称倾侧角指令γVp。
3.如权利要求1所述的变形与机动一体化的规避与突防方法,其特征在于,所述步骤3中,变形后的滑翔飞行器进行轨迹重规划,具体步骤为:
以变形的时机和变形后的飞行器参数组成为多目标变量;
对于多目标变量Xorigin,首先进行分解得到单目标变量X1,…,Xm,m为单目标变量个数,之后对优化目标进行聚合更新,并验证是否满足终止条件:脱靶量大于10m且能够完成作战任务,若满足则输出最终优化结果Xbest,否则继续进行分解更新,直至满足终止条件,之后输出最终优化结果Xbest;
根据最终优化结果确定重规划后的轨迹。
4.如权利要求1所述的变形与机动一体化的规避与突防方法,其特征在于,所述奖励函数Rt的主线回报设计为:脱靶量大于10m且能完成原始任务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211270948.XA CN115357051B (zh) | 2022-10-18 | 2022-10-18 | 变形与机动一体化的规避与突防方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211270948.XA CN115357051B (zh) | 2022-10-18 | 2022-10-18 | 变形与机动一体化的规避与突防方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115357051A CN115357051A (zh) | 2022-11-18 |
CN115357051B true CN115357051B (zh) | 2023-02-03 |
Family
ID=84008068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211270948.XA Active CN115357051B (zh) | 2022-10-18 | 2022-10-18 | 变形与机动一体化的规避与突防方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115357051B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116430900B (zh) * | 2023-05-04 | 2023-12-05 | 四川大学 | 基于深度强化学习的高超声速弹头的博弈轨迹规划方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113050686A (zh) * | 2021-03-19 | 2021-06-29 | 北京航空航天大学 | 一种基于深度强化学习的作战策略优化方法及系统 |
CN114282833A (zh) * | 2021-12-28 | 2022-04-05 | 航天科工智能运筹与信息安全研究院(武汉)有限公司 | 一种基于规则的海空联合作战行动分层任务规划方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7841559B1 (en) * | 2006-02-16 | 2010-11-30 | Mbda Incorporated | Aerial vehicle with variable aspect ratio deployable wings |
CN106815443B (zh) * | 2017-01-23 | 2018-02-06 | 北京理工大学 | 面向变化环境的超低空飞行器三维多批多航迹规划方法 |
CN109270960A (zh) * | 2018-12-05 | 2019-01-25 | 中南大学 | 基于Radau伪谱法的在线最优反馈再入制导方法 |
CN114253296B (zh) * | 2021-12-22 | 2024-06-07 | 中国人民解放军国防科技大学 | 高超声速飞行器机载轨迹规划方法、装置、飞行器及介质 |
CN114637327A (zh) * | 2022-03-16 | 2022-06-17 | 哈尔滨逐宇航天科技有限责任公司 | 基于深度策略性梯度强化学习的在线轨迹生成制导方法 |
CN114840019A (zh) * | 2022-04-15 | 2022-08-02 | 北京航空航天大学 | 一种飞行器实时突防轨迹生成方法和系统 |
CN114675545B (zh) * | 2022-05-26 | 2022-08-23 | 中国人民解放军火箭军工程大学 | 一种基于强化学习的高超声速飞行器再入协同制导方法 |
-
2022
- 2022-10-18 CN CN202211270948.XA patent/CN115357051B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113050686A (zh) * | 2021-03-19 | 2021-06-29 | 北京航空航天大学 | 一种基于深度强化学习的作战策略优化方法及系统 |
CN114282833A (zh) * | 2021-12-28 | 2022-04-05 | 航天科工智能运筹与信息安全研究院(武汉)有限公司 | 一种基于规则的海空联合作战行动分层任务规划方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115357051A (zh) | 2022-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yang et al. | UAV air combat autonomous maneuver decision based on DDPG algorithm | |
Li et al. | Deep reinforcement learning with application to air confrontation intelligent decision-making of manned/unmanned aerial vehicle cooperative system | |
CN108153328B (zh) | 一种基于分段贝塞尔曲线的多导弹协同航迹规划方法 | |
Bai et al. | UAV maneuvering decision-making algorithm based on twin delayed deep deterministic policy gradient algorithm | |
CN111091273B (zh) | 一种基于能力预测的多弹协同任务规划方法 | |
CN113741500B (zh) | 仿哈里斯鹰智能捕食优化的无人机空战机动决策方法 | |
CN114330115B (zh) | 一种基于粒子群搜索的神经网络空战机动决策方法 | |
CN113625740B (zh) | 一种基于迁移学习鸽群优化的无人机空战博弈方法 | |
CN113282061A (zh) | 一种基于课程学习的无人机空中博弈对抗的解决方法 | |
Gong et al. | UAV cooperative air combat maneuvering confrontation based on multi-agent reinforcement learning | |
CN113625569B (zh) | 一种基于混合决策模型的小型无人机防控决策方法及系统 | |
CN115357051B (zh) | 变形与机动一体化的规避与突防方法 | |
CN115951695A (zh) | 空战模拟环境中基于三方博弈的动态战术控制域解算方法 | |
CN111176315B (zh) | 一种基于l1自适应控制的变体巡飞弹控制方法 | |
Xianyong et al. | Research on maneuvering decision algorithm based on improved deep deterministic policy gradient | |
Dong et al. | Trial input method and own-aircraft state prediction in autonomous air combat | |
CN115356935B (zh) | 基于多阶段可变外形的大空域转换飞行策略优化方法 | |
Xu et al. | Autonomous decision-making for dogfights based on a tactical pursuit point approach | |
CN113741186B (zh) | 一种基于近端策略优化的双机空战决策方法 | |
Zhu et al. | Multi-constrained intelligent gliding guidance via optimal control and DQN | |
Zhu et al. | Mastering air combat game with deep reinforcement learning | |
CN114610057B (zh) | 一种高马赫飞行器机动突防策略设计方法 | |
CN115457809A (zh) | 对面支援场景下基于多智能体强化学习的航迹规划方法 | |
Chen et al. | The Pursuit-Evasion Game Strategy of High-Speed Aircraft Based on Monte-Carlo Deep Reinforcement Learning | |
Wang et al. | Research on naval air defense intelligent operations on deep reinforcement learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20221118 Assignee: Beijing Weike Zhiyuan Technology Co.,Ltd. Assignor: BEIJING INSTITUTE OF TECHNOLOGY Contract record no.: X2023110000106 Denomination of invention: Avoidance and penetration methods for the integration of deformation and mobility Granted publication date: 20230203 License type: Common License Record date: 20230901 |