CN116859350A

CN116859350A - 一种基于无人机的组网雷达距离门联合拖引干扰方法

Info

Publication number: CN116859350A
Application number: CN202310724904.8A
Authority: CN
Inventors: 张天贤; 任鑫; 袁登蔚; 钟涵; 马智杰; 刘凯; 王舒玉; 张振兴; 魏华波; 孔令讲
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2023-06-19
Filing date: 2023-06-19
Publication date: 2023-10-10

Abstract

本发明公开一种基于无人机的组网雷达距离门联合拖引干扰方法，应用于电子对抗技术领域，针对现有技术难以满足协同约束的最优假航迹、以及对应的ECAVs控制策略，保证RGPO干扰效果的问题；本发明以RGPO假航迹为优化变量，以假航迹实施完整性为约束，以干扰性能为优化目标建立约束优化模型，并以粒子群算法为基础进行求解，针对约束非线性且难以显式表达的难点，利用Deb准则对假航迹进行评估，在约束违反度方面，基于单玩家蒙特卡洛树搜索算法与分治思想进行计算，在RGPO干扰效果方面，通过对场景的独立重复采样进行计算，实现面向组网雷达的距离门拖引干扰策略规划。

Description

一种基于无人机的组网雷达距离门联合拖引干扰方法

技术领域

本发明属于电子对抗技术领域，特别涉及一种组网雷达距离门拖引干扰技术。

背景技术

利用电子战斗飞行器集群(Electronic Combat Air Vehicles,ECAVs，也称为无人干扰机集群)对组网雷达实施航迹欺骗干扰时，如何充分发挥ECAVs能力、提高干扰效果，是研究重点关注的问题。在组网雷达航迹欺骗干扰问题中，假航迹与ECAVs是两个关键主体：假航迹是欺骗干扰的直观表现，其形态是欺骗干扰效果的决定因素；ECAVs是具体控制对象，其控制策略对假航迹实施完整性、ECAVs飞行距离产生影响。同时，由于假航迹实施依赖ECAVs的协同控制，ECAVs初始状态与机动能力将显著影响假航迹的选择。

当ECAVs初始状态和机动能力确定时，需要考虑假航迹与ECAVs相互之间引入的约束关系，协同优化假航迹与ECAVs控制策略。由于约束复杂性，当前对于假航迹与ECAVs控制策略协同规划方法的研究中，部分对场景或模型进行简化，部分将问题拆分为子问题依次求解。文献“Deception of radar systems using cooperatively controlled unmannedair vehicles”在已知假航迹必经点情况下，假设假目标呈匀速运动，协同考虑各ECAVs飞行条件建立优化模型，求解得到相邻两个必经点之间的假航迹，以及各ECAVs的飞行轨迹。文献“Radar deception through phantom track generation”针对假航迹起点和终点位置确定的场景，考虑单帧无人机和假航迹动力学约束以及二者之间关系，将无人机约束转换为对假目标点迹的约束，将多无人机动力学约束和几何约束下的假航迹规划问题看作两点边值问题，提出单步最优的假航迹和ECAVs轨迹规划方法。文献“Optimal coherentphantom track design using virtual motion camouflage”考虑假航迹实施能耗问题，研究通过指定坐标的最低能耗航迹规划方法，该方法分为内外两层搜索循环，内层循环求解假航迹实施能耗，外层循环调整假航迹的形态，该算法架构降低了问题求解难度。文献“基于多机协同的组网雷达欺骗干扰策略”考虑威胁区域避让问题，首先基于稳定性规划出可以避让威胁区域的假航迹，然后基于稳定性规划ECAVs运动轨迹，但是二者对于ECAVs与假航迹之间相互约束考虑较少，所规划假航迹的可实施性难以保证。

鉴于以上资料可以看出，部分研究以全局考虑，同时优化假航迹与ECAVs运动轨迹，但会导致优化模型复杂度高，求解难度大；部分研究分步进行求解，但是求解时对假航迹与ECAVs之间约束考虑不够全面，求得结果存在违反运动约束的可能，以致无法形成所需要的假航迹。同时，由于RGPO(Range Gate Pull Off，距离拖引)干扰需要虚假点迹的多帧联合优化，并且对虚假点迹实施时间具有精确要求，求解难度进一步增大，因此，针对组网雷达的RGPO假航迹与ECAVs控制策略协同规划方法的研究有必要进一步加深。

发明内容

为解决上述技术问题，本发明提出一种基于无人机的组网雷达距离门联合拖引干扰方法，考虑RGPO假航迹与ECAVs之间的协同约束，能够求解满足协同约束的最优假航迹、以及对应的ECAVs控制策略，保证RGPO干扰效果。

本发明采用的技术方案为：一种基于无人机的组网雷达距离门联合拖引干扰方法，包括以下步骤：

S1、构建面向组网雷达的距离门拖引干扰实施场景；考虑二维场景，假设共存在N_R个雷达站点，每个雷达的位置为存在N_F个假目标，以及一个真实目标；对每个雷达站点，在每个时刻，每个ECAV都处于雷达与虚假点迹连接视线上；

S2、分析RGPO假航迹与ECAVs控制策略之间的协同约束，建立其优化模型；每一条假航迹的实施完整性受制于ECAVs的初始状态和运动约束优化模型表达式为：

其中，θ(·)为ECAVs控制策略求解器，Φ表示空集；θ(Ψ,S_init,C_ECAV)≠Φ表示在初始状态S_init和运动约束C_ECAV下，ECAVs存在可以完整实施Ψ的控制策略；

S3、通过对时间、空间的离散化将步骤S2中ECAVs控制策略求解器建模为树的最优路径搜索问题；树的最优路径搜索问题表达式为：

其中，p为从根节点S_root到叶节点的路径，即一种ECAVs控制策略；S_k,i表示树T第k层中第i个顶点，即ECAVs的一种状态；M为该路径中除了根节点之外的顶点数量，M≤K，航迹共K帧；V(k)表示树T在第k层的顶点集合；E(S_k,i)表示以节点S_k,i为起点的边集；e(S_k,i→S_k+1,j)表示以节点S_k,i为起点以节点S_k+1,j为终点的边；C(·)为路径评价目标函数，即ECAVs控制策略评价指标；

S4、以粒子群算法为框架对最优干扰策略进行求解，随机初始化N_P个粒子的位置ψ_i及其速度v_i，每个粒子代表一种假航迹；

在粒子群算法每次迭代中，对于每个粒子，基于SP-MCTS算法对步骤S3的树的最优路径搜索问题进行搜索，根据搜索过程对假航迹进行分类，具体的：搜索过程中若存在任意一种能够完整实施假航迹的策略，即将该策略对应的假航迹放入可以完整实施粒子集合；将剩余的假航迹放入不可完整实施粒子集合；

基于Deb准则对分类后的假航迹进行评估与比较，迭代完成后得到最佳距离拖引假航迹，再次基于SP-MCTS算法对该假航迹建立的树进行搜索，最终得到ECAVs最优控制策略。

本发明的有益效果：本发明首先构建了面向组网雷达的ECAVs欺骗干扰实施场景，然后分析了RGPO假航迹与ECAVs控制策略之间的协同约束，建立其优化模型，再考虑Deb准则对假航迹进行评估，以解决协同约束问题，针对Deb准则中的约束违反度，引入单玩家蒙特卡洛树搜索算法与分治思想对其进行计算，最终根据Deb准则的评估结果对搜索方向进行引导，形成PSO-Deb-OCBA算法，完成RGPO假航迹与ECAVs控制策略协同规划。本发明考虑RGPO假航迹与ECAVs之间的协同约束，能够求解满足协同约束的最优假航迹、以及对应的ECAVs控制策略，保证RGPO干扰效果。

附图说明

图1为面向组网雷达的ECAVs欺骗干扰实施场景示意图。

图2为拖引距离指标示意图

图3为ECAVs对假航迹求解空间影响示意图。

图4为假航迹对ECAVs控制策略求解空间影响示意图。

图5为ECAVs之间相互影响示意图。

图6为单假目标路径规划场景示意图。

图7为单假目标场景路径规划树形结构示意图。

图8为多假目标路径规划场景示意图；

其中，(a)为保持匹配关系；(b)为更改匹配关系。

图9为多假目标场景路径规划树形结构示意图。

图10为约束违反程度特征示意图。

图11为不同ECAVs初始状态下算法收敛曲线。

图12为不同ECAVs运动约束下算法收敛曲线。

图13为ECAVs运动控制量对比；

其中，(a)为ECAV1-加速度控制；(b)为ECAV2-加速度控制；(c)为ECAV1-转角控制；(d)为ECAV2-转角控制。

具体实施方式

本发明主要采用数值仿真实验的方法进行验证，所有步骤、结论均在MatlabR2022a上验证正确。下面结合附图1-12对本发明内容作进一步说明。

本发明的目的是在突防进攻场景下对组网雷达进行距离门拖引干扰时，研究设计一种基于PSO-Deb-OCBA的RGPO假航迹与ECAVs控制策略协同规划方法。考虑该场景共K帧，存在N_R个雷达站点，存在N_F条RGPO假航迹，以点序列的方式表示，将第j条RGPO假航迹定义为点序列所有假航迹的集合定义为对于其中一个假目标位置，RGPO需要其满足被欺骗干扰的雷达站点、ECAV、假目标位置三者位于同一直线上，因此对于每个雷达站点来说，要完成N_F条RGPO假航迹，至少需要N_F个ECAV。本发明假设每个雷达站点均使用N_F个ECAVs进行干扰，以RGPO假航迹为优化变量，以假航迹实施完整性为约束，以干扰性能为优化目标建立约束优化模型，研究如何求解满足协同约束的最优假航迹、以及对应的ECAVs控制策略，最大化RGPO干扰效果。

步骤1：构建面向组网雷达的ECAVs欺骗干扰实施场景

考虑图1所示的突防进攻场景，我方作为进攻方和干扰方，利用进攻单元，在敌方组网雷达监控区域内执行作战任务，同时利用ECAVs产生多条虚假航迹，对敌方实施RGPO干扰，以影响组网雷达的跟踪，使跟踪航迹偏离真实目标，达到掩护我方进攻单元的目的。

在实施RGPO干扰时，假航迹形态是干扰效果的关键影响因素，不同假航迹的干扰效果不同。而对于ECAVs，需要满足对每个雷达，在每个时刻，每个ECAV都处于雷达与虚假点迹连接视线(Line of sight,LOS)上，ECAVs才能将带有时延的回波发射给雷达，使雷达检测到虚假点迹。如何在ECAVs运动约束之下，得到最优假航迹、以及对应的ECAVs控制策略，最大化RGPO干扰效果，是本发明所关心的问题。

本发明考虑二维场景，假设共存在N_R个雷达站点，每个雷达的位置为存在N_F个假目标，以及一个真实进攻单元，其中真实进攻单元也是场景中的真实目标，即被掩护目标。

首先，对真实目标进行建模，主要包括其运动模型和量测模型。

真实目标的运动模型通过状态变量法来描述，为了描述目标运动的迭代关系，将时间以ΔT的粒度均匀切分为帧，全部共考虑K帧，假设真实目标在起始时刻t₀的运动状态向量为X(0)，并定义真实目标的运动模型为

X(k+1)＝f(k,X(k))+ψ(k,X(k),ε(k)) (1)

其中，ΔT在本实施例中取值为1s，X(k)为第k帧的状态向量，ε(k)为第k帧的过程噪声向量，f(·)描述了相邻两帧的状态转移关系，ψ(·)描述了过程噪声向量空间与状态向量空间的转换关系。

真实目标运动时，所有雷达在每一帧都会对场景进行搜索与探测，并根据回波信号录取量测，定义第i个雷达的量测模型为

Z_i(k)＝h_i(k,X(k))+ω_i(k,X(k),υ_i(k)) (2)

其中，i＝1,2,…,N_R，Z_i(k)为第i个雷达在第k帧对该目标的量测，υ_i(k)为量测噪声向量，h_i(·)表示状态向量空间与量测向量空间的转换关系，ω_i(·)表示量测噪声向量空间与量测向量空间的转换关系。

式(1)与式(2)统一描述了真实目标的系统模型，具体定义根据运动特征的不同而改变。

下面对虚假目标运动模型和量测模型进行说明。

虚假目标运动模型同样用状态变量法进行描述，每个假目标的状态向量定义为其中，j＝0,1,…,N_F，且/>为初始状态，假目标的运动模型定义为

其中，为输入控制向量，/>表示相邻两帧的状态转移关系。

同样地，在每一帧，所有雷达站点分别对每个假目标进行量测，定义第i个雷达对第j个假目标的量测模型为

其中，为第i个雷达在第k帧对假目标j的量测，/>为本次量测的噪声向量，/>描述假目标状态向量空间与量测向量空间的转换关系，/>描述量测噪声向量空间与量测向量空间的转换关系。

对真、假目标的运动模型与量测模型建模后，可以得到每时刻N_R个雷达对真目标以及N_F个假目标的所有量测，定义第k帧所有雷达的量测集合为

其中，为雷达j在第k帧的量测结果集合，其定义为

其中，meas(·)函数描述雷达的量测过程，为雷达j在第k帧录取的量测数量，由于雷达分辨单元的存在，在同一个分辨单元内的两个目标只有一个量测，所以量测结果也与上述模型中真实目标量测Z_j(k)和假目标量测/>存在一定差别。

在集中式组网雷达中，数据中心负责集中处理各雷达站点的量测数据，并进行融合、跟踪等处理。

之后，数据中心会对所有量测数据进行同源检测、关联、融合等处理，在数据中心得到组网雷达量测数据，该处理过程可表示为

其中，fu(·)代表数据处理流程，处理后得到量测数量为N_fu(k)。

获取量测数据后，数据中心会以此为基础对目标进行当前帧的跟踪，本发明考虑多目标跟踪模型，假设第k帧跟踪航迹的数量为每一条航迹的状态估计为/>状态协方差估计为/>其中/>定义第k帧所有航迹的状态与状态协方差集合为

跟踪器是数据中心的一个功能。

跟踪器的对每条航迹的处理流程包括状态预测、数据关联、滤波等阶段，整个过程可表示为

其中，tr(·)表示跟踪算法，由于多目标跟踪过程中需要考虑航迹起始、航迹终止等情况，所以跟踪航迹数量随时间会发生变化，也就是说，与/>可能不同。

根据战略意图的不同，面向组网雷达的RGPO干扰有不同评价指标可以选择，下面将依次对拖引距离、拖引成功率、以及拖引成功率-拖引距离混合指标进行介绍。

在下文介绍中，真实目标跟踪航迹均指RGPO干扰实施之前对真实目标建立的航迹，由于本发明考虑多目标跟踪模型，随着RGPO干扰的实施，若真实目标成功逃脱距离跟踪波门，多目标跟踪算法会重新对真实目标起始航迹，由于新航迹较短且跟踪稳定性不强，在K帧内难以对真实目标构成威胁，所以评价干扰效果时，只考虑干扰实施之前已经建立的航迹。

(1)拖引距离

拖引距离是指RGPO干扰结束后，即第K帧时，跟踪航迹波门中心与真实目标位置的距离，其定义如图2所示，在二维场景中表示为

其中，x(·)、y(·)表示真实目标实际位置，表示跟踪系统对目标位置的估计。该指标反映了RGPO干扰使跟踪波门的偏离情况，拖引距离d越大，表示跟踪波门偏离越远，跟踪精度越低，干扰效果越好。

(2)拖引成功率

拖引成功率是指RGPO干扰结束后，真实目标是否在跟踪波门内，在第K帧真实目标不在跟踪波门内，表示拖引成功；在第K帧真实目标仍在跟踪波门内，表示拖引失败。定义变量μ表示拖引是否成功

该值的期望E[μ]表示了RGPO干扰的拖引成功率。

本发明采用椭圆波门，通过下式判断真实目标是否在跟踪波门内

d_k＝v^T(K)S^-1(K)v(K)≤γ_k (12)

其中，S(K)为第K帧新息协方差，γ_k为波门门限，当门概率为99.97％时，该值取16，v(K)为真实目标位置与波门中心的差值，其定义为

其中，x^p(K)、y^p(K)表示波门中心位置。

该指标反映了雷达对真实目标跟踪的中断情况，由于RGPO干扰特性，干扰效果好的假航迹能够中断雷达对真实目标的跟踪，掩护真实目标。拖引成功率越高，表示雷达对真实目标的跟踪中断概率越高，干扰效果越好。

(3)拖引成功率-距离混合指标

上述两个指标从不同角度对干扰效果进行评价，拖引距离体现了RGPO干扰对雷达跟踪精度的影响，拖引成功率体现了RGPO干扰对雷达跟踪器概率分步的影响；但是二者对干扰效果的评价不够全面，拖引距离较大的假航迹，存在拖引成功率低的可能，同样的，拖引成功率高的假航迹，存在拖引距离小的可能，为了综合考虑这两个指标，定义如下拖引成功率-距离混合指标。

其中，μ、d在上文均已定义；d_max表示拖引距离最大值，如果拖引距离达到或超过d_max，表示跟踪波门与真实目标的距离已足够远，RGPO实施中断后跟踪算法难以将该航迹与真实目标再建立联系；α为混合系数，其取值范围为[0,1]，取值越大表示越偏重考虑拖引成功率指标，取值越小表示越偏重考虑拖引距离指标。

步骤2：分析RGPO假航迹与ECAVs控制策略之间的协同约束，建立优化模型

2.1、RGPO假航迹与ECAVs控制策略协同约束分析。

首先对ECAV的运动约束进行说明：假设ECAV当前位置为(x_e,y_e)，下一帧需要拖引形成的假目标位置为(x_t,y_t)，由于距离门欺骗干扰原理，下一帧该ECAV需要在雷达与目标连线上，其位置(x,y)需要满足如下关系：

假设两帧之间时间差为ΔT，这段时间ECAV最长加速时间t_acc为

可行驶的最大距离d_e,max为

最长减速时间t_dec为

可行使的最小距离d_e,min为

所以，经过ΔT时间段之后，ECAV能够行驶的距离介于d_e,min和d_e,max之间，下一帧ECAV可能存在的位置需要满足如下条件

然后协同考虑假航迹与ECAVs，可以发现ECAVs初始状态和机动能力会影响假航迹规划过程，假目标的运动也会影响ECAVs控制策略规划过程，二者相互之间会产生如下四类影响：

(1)ECAVs运动约束对假目标可选空间的影响

如图3所示，假设只有一个ECAV，在第一帧，根据ECAV运动约束，可以确定此时ECAV可选位置集合为E₁，而由于拖引干扰的特点，假目标需要在雷达和ECAV的连线上，所以假目标必须在射线LOS_1,1和LOS_1,2所形成的扇形空间内，记为<LOS_1,1,LOS_1,2>，取集合S₁与该扇形空间的交集，得到假目标在第一帧的位置集合S′₁，即

S′₁＝S₁∩<LOS_1,1,LOS_1,2> (21)

也就是图3椭圆S₁内的非阴影区域，假目标必须在此区域内才能够实现。所以在图3中，经过当前帧的约束后，位置p_1,3不再可选。

对第二帧的影响同理，假设ECAV在第一帧选择位置e₁，根据运动约束，可以确定出第二帧ECAV的可选位置集合为E₂，则第二帧假目标必须在射线LOS_2,1和LOS_2,2所形成的扇形空间内，记为<LOS_2,1,LOS_2,2>，假设假目标在第一帧的位置为p_1,i，可以确定出第二帧假目标的可选位置集合S_2,i，取集合S_2，i与该扇形空间的交集，得到假目标在第二帧的位置集合S′_2，i，即

S′_2,i＝S_2,i∩<LOS_2,1,LOS_2,2> (22)

在此区域内的假目标可以实施。

(2)假目标运动约束对ECAVs行驶路径的影响

如图4所示，假设只有一个ECAV，在第一帧，根据初始位置p_init和假目标运动约束，可以计算得到假目标可能位置集合为S₁，由于拖引干扰原理，ECAV必须位于雷达与假目标的连线上，所以，ECAV必须位于射线LOS_1,1和射线LOS_1,2形成的扇形区域内，记为<LOS_1,1,LOS_1,2>，取集合E₁与扇形区域的交集，ECAV在第一帧的位置集合记为E′₁，即

E′₁＝E₁∩<LOS_1,1,LOS_1,2> (23)

也就是图4中椭圆E₁内非阴影区域，第一帧ECAV必须在此区域内才满足约束。在图4中，经过假目标约束后，位置e_1,2不再合法。

假设第一帧假目标位置为p_1,4，根据运动约束可以确定第二帧假目标的可能位置集合S_2,4；假设第一帧ECAV选择位置e_1,1，根据运动约束确定第二帧ECAV的可能位置集合E₂，同理ECAV必须位于射线LOS_2,1和射线LOS_2,2形成的扇形区域内，记为<LOS_2,1,LOS_2,2>，取集合E₂与该扇形区域的交集，得到ECAV在第二帧的位置集合E′₂，即

E′₂＝E₂∩<LOS_2,1,LOS_2,2> (24)

第二帧ECAV必须在此区域内才能满足约束。

(3)多帧之间的反向影响

考虑多帧的时候，假目标与ECAVs之间的影响包括正向和反向两个方向，若场景中共K帧，对于第k帧，正向影响是指假目标和ECAV的可选范围受到前k-1帧选择的影响，反向影响是指后续k+1～K帧假目标与ECAV之间的约束会反过来影响第k帧的可选空间；其中，正向影响就是图3、图4所示两种影响的多帧积累，其原理在上文已经介绍，下面对反向影响进行说明。

正向来看，在图3第一帧，通过ECAV约束后判定位置p_1,1满足约束，但是反向来看，在第二帧，假目标需要在扇形区域<LOS_2,1,LOS_2,2>内，而集合S_2,1与该扇形无交集，如果在第一帧选择位置p_1,1的话，第二帧无合法位置；而如果在第一帧选择位置p_1,4的话，在第二帧可以继续实施干扰。同时由于上述影响二，假目标在第一帧可选位置的变化会进而影响ECAV的可选空间。所以，第二帧引入的约束反过来同时影响到第一帧假目标和ECAV的可选空间，依此类推，第k+1～K帧引入的约束会反向影响到1～k帧。

(4)多个ECAVs之间的相互影响

当存在多个ECAVs时，需要同时满足所有ECAVs的约束。如图5所示，假设场景中存在两个ECAVs，在第一帧，假目标的可选范围既需要在雷达1和ECAV1的连线上，也需要在雷达2与ECAV2的连线上，综合来看，假目标在第一帧的位置可选区域为

也就是说，可选区域是S₁与两个扇形区域的交集。S₁′的确定反过来又影响到ECAVs位置的选择，由于ECAV2的约束，ECAV1在第一帧的可选位置为

同理，在第一帧，ECAV2的可选位置为

同时，多个ECAVs同时产生的约束会加剧帧间影响。如图5所示，正向来看，在第一帧，由于多个ECAVs的运动约束，假目标位置p_1,2、p_1,3均不可选，进而对后续帧的可选空间产生影响。反向来看，在第二帧，由于ECAV1的约束，区域S_2,1不可选，由于ECAV2的约束，区域S_2,4不可选，间接导致第一帧位置p_1,1、p_1,4不合法，综合下来，在图5所示场景下，第一帧可选范围S₁内位置p_1,1、p_1,2、p_1,3、p_1,4均不可选。

2.2、RGPO假航迹与ECAVs控制策略协同优化模型建立。RGPO假航迹规划问题的数学本质是优化问题，当不考虑ECAVs对RGPO假航迹的影响时，根据假目标运动模型，通过优化假目标控制向量，使干扰效果最大化，该优化问题可以表示为如下形式

其中，Ψ为假目标控制向量，根据该控制向量可以计算得到假航迹；Γ(·)为干扰效果评估方程，计算得到数值J，反应不同假航迹的干扰效果，数值越大，表示干扰效果越好；Σ为自变量可行域。

在实际干扰场景下，规划假航迹时ECAVs初始状态与机动能力往往是确定的，无法随意调整，所以每一条假航迹的实施完整性受制于ECAVs的初始状态和运动约束/>其中，N_F表示ECAVs数量，初始状态包括初始位置、初始速度、初始朝向等因素，运动约束包括速度约束、加速度约束、角速度约束等因素。考虑能够完整实施的RGPO假航迹，结合S_init与C_ECAV，式(28)优化模型需要修改为如下形式：

其中，θ(·)为ECAVs控制策略求解器，Φ表示空集；θ(Ψ,S_init,C_ECAV)≠Φ表示在初始状态S_init和运动约束C_ECAV下，ECAVs存在可以完整实施Ψ的控制策略，该约束需要考虑所有雷达站点以及所有ECAVs，只有针对每个雷达站点的所有ECAVs均存在可行控制策略，才表示满足该约束。

上述模型将ECAVs初始状态与机动能力引入到了RGPO假航迹规划问题中，通过求解上述优化模型，能够得到可完整实施的、干扰效果最佳的假航迹Ψ^*。确定假航迹后，通过后续介绍的ECAVs控制策略规划方法，即可得到该假航迹对应的实施策略。

步骤3：为解决步骤2中的协同约束问题，考虑Deb准则对假航迹进行评估，并引入单玩家蒙特卡洛树搜索算法(Single Player-Monte Carlo Tree Search,SP-MCTS)与分治思想计算Deb准则中的约束违反度

3.1、基于Deb准则的假航迹评估比较方法。当协同考虑RGPO假航迹与ECAVs控制策略的规划时，会为优化问题引入复杂约束，约束的复杂性体现在多个ECAVs、多帧之间的相互耦合，同时该约束难以显式表达。因此，本发明引入Deb准则对该约束进行处理，该准则从约束满足性、目标函数计算结果两个角度对算法搜索方向进行引导，可以避免复杂约束的显式表达。

对于一个求最大值的约束优化模型而言，Deb准则主要由三条准则构成：(1)两个待比较的个体都是可行解时，目标函数值较大的个体获胜；(2)两个待比较的个体一个是可行解，另一个是不可行解时，可行解获胜；(3)两个待比较的个体都是不可行解时，约束违反度较小的个体获胜。

Deb准则既考虑备选解的约束满足性，又考虑备选解的目标函数计算结果，协同考虑两方面因素对备选解优劣进行评价，对于非线性约束规划问题，该准则有两个关键点需要明确：

(1)约束满足性的判断

在本发明所述问题中，备选解Ψ的约束满足性定义为：ECAVs在当前初始状态和运动约束下，是否存在一种可行控制策略，能够完整实施Ψ所表示的假航迹。

这个问题可以通过后续介绍的ECAVs控制策略规划方法来判断：ECAVs初始状态和运动限制作为控制策略规划算法的约束，备选解Ψ表示的假航迹作为算法输入，然后利用该算法进行求解。求解过程中，无需得到最优解，只要搜索到任意一种能够完整实施该假航迹的ECAVs控制策略，就表示备选解Ψ满足约束。

需要注意的是，假航迹的约束满足性需要考虑所有ECAVs与所有雷达站点，如果雷达站点数量为N_R，则存在N_R组ECAVs分别干扰不同站点，各组ECAVs均存在可行控制策略才表示该假航迹满足约束。

(2)约束违反程度计算

对于备选解Ψ代表的假航迹，如果在当前ECAVs初始状态和机动能力下无法完整实施，则需要计算其约束违反程度；而无法完整实施的原因往往是ECAVs加速度限制或转角限制无法满足，如果能够将加速度和转角限制范围扩大，ECAVs控制策略的可行解空间也会随之扩大，该假航迹能够实施的可能性随之提高，所以将约束违反程度计算方式定义为如下形式

其中，N_F为ECAVs数量，约束违反程度为A，表示ECAVs运动约束范围扩大倍数，A_max为A的最大可能取值，表示将所有ECAVs运动约束范围均扩大A倍的控制策略求解器。

式(30)的意义是，为了完整实施该假航迹，ECAVs运动约束范围的最小扩大倍数，约束违反程度越大，表示该假航迹实现难度越高；当约束违反程度为1时，表示在当前ECAVs初始状态与机动能力下，假航迹Ψ可以完整实施，即满足协同约束。

引入Deb准则后，不同假航迹之间的比较不是单纯依赖目标函数计算值大小，需要同时考虑假航迹可实施性、干扰效果和约束违反程度，假设存在两条假航迹ψ₁、ψ₂，判定二者优劣的流程如表1所示。首先，根据ECAVs初始状态与机动能力，分别判定两条假航迹是否可以完整实施；如果二者均不可完整实施，则分别计算约束违反程度，约束违反程度更低的假航迹更优；如果二者均可以完整实施，则分别计算两条假航迹的干扰效果，干扰效果好的假航迹更优；如果只有一条假航迹可以完整实施，则可完整实施假航迹更优。

表1基于Deb准则的假航迹比较流程

在表1所示流程中，为了完备性，如果两条假航迹都可以完整实施且干扰效果相同，则根据实施假航迹的ECAVs控制策略进行比较，ECAVs飞行距离短的假航迹更优；由于假航迹干扰效果以小数形式表示，且具有一定随机性，这种情况发生的概率很低。而假航迹实施完整性判定和ECAVs飞行距离的计算都可以通过后续介绍的ECAVs控制策略规划方法来完成。

3.2、基于SP-MCTS的ECAVs控制策略规划算法

规划ECAVs控制策略时，为减小求解空间，可以在时间、空间两个维度对场景进行离散化。首先是时间维度，以ΔT为间隔将时间切分为帧，关注ECAVs在ΔT、2ΔT、3ΔT等时刻的位置。然后是空间维度，在每个时刻，ECAVs需要在雷达与虚假点迹的LOS上，为了降低搜索难度，将LOS以ΔD为间隔离散化成点序列，ΔD在本实施例中取值为2m。将问题离散化后，不同时刻ECAVs位置的转变导致ECAVs状态的变化。

当只有一个假目标时，需要一个ECAV来实施干扰，ECAV状态的变化如图6所示。假设ECAV初始位置为P_init，根据其初始速度、朝向、以及运动约束等信息，可以计算得到第一帧ECAV位置的可选范围，假设共有两个位置可选，分别为P₁₁和P₁₂，当从初始位置运动到不同位置时，所需加速度、转角等信息都不同，会导致在第一帧ECAV具有不同状态。当运动到P₁₁位置时，假设第二帧的可选位置为P₂₁、P₂₂、P₂₃，当运动到P₁₂位置时，假设第二帧的可选位置为P₂₃、P₂₄、P₂₅，同样地，运动到不同位置使得ECAV具有不同状态，基于如上状态转换关系，建立如图7所示树形结构。

当存在多个假目标时，状态转换过程还需要考虑ECAVs与假航迹之间的匹配关系，如图8所示，当利用两个ECAVs实施两条虚假航迹时，假设两个ECAVs的初始位置分别为P_1,init和P_2,init，且初始状态下ECAV1与虚假航迹1匹配，ECAV2与虚假航迹2匹配，保持匹配关系的状态转换过程如图8(a)所示，ECAV1的可选位置为P_1,11和P_1,12，ECAV2的可选位置为P_2,11和P_2,12，更改匹配关系的状态转换过程如图8(b)所示，ECAV1的可选位置为P_1,13和P_1,14，ECAV2的可选位置为P_2,13和P_2,14，根据每种情况可选位置建立状态转换关系后，得到图9所示树形结构。

综上所述，当对场景进行离散化之后，根据ECAVs的状态转换过程，可以建立以ECAVs初始状态为顶点的树T{V,E}，其中，V为树的顶点集合，每一个顶点表示ECAVs集群的一种状态，E为树的边集，每一条边表示ECAVs集群的一种状态转换过程。树T的规模与假航迹总帧数、离散化粒度、ECAVs数量相关，树的深度随假航迹帧数的增加而增加，树的宽度随离散化精细程度的提高以及ECAVs数量的增多而增加。

当树形结构建立后，可将ECAVs控制策略优化问题转变为树T中最优路径搜索问题，即搜随树中根节点到叶节点的最短路径，假设假航迹共K帧，则可转变为如下问题

其中，p为从根节点S_root到叶节点S_M,tM的路径，也就是一种ECAVs控制策略，S_k,i表示树T第k层中第i个顶点，也表示ECAVs的一种状态，M为该路径中除了根节点之外的顶点数量，由于ECAVs具有运动限制，全部K帧假航迹可能无法完整实施，所以M≤K；V(k)表示树T在第k层的顶点集合，E(S_k,i)表示以节点S_k,i为起点的边集，e(S_k,i→S_k+1,j)表示以节点S_k,i为起点以节点S_k+1,j为终点的边。C(·)为路径评价目标函数，亦即ECAVs控制策略评价指标；

ECAVs控制策略评价指标需要考虑两方面因素：假航迹实施完成度、ECAVs飞行距离。当对比不同控制策略时需要满足：(1)若两个控制策略的假航迹实施完成度不同，完成度越高的控制策略越好；(2)若两个控制策略的假航迹实施完成度相同，ECAVs飞行距离越短的控制策略越好。同时考虑假航迹的实施完整度与ECAVs集群行驶距离，可采用如下目标函数进行优化：

其中，N_F表示某一时刻需要利用ECAVs产生的虚假点迹数，v_e,i,max为ECAV的最大速度，表示从节点/>转变到节点/>时ECAVs行驶总距离，其他符号在上文均已定义。该目标函数中包含两项，第一项是所有ECAVs飞行M帧最长行驶距离，第二项是实际每一帧飞行路径平均长度，该指标协同考虑了假航迹实施完成度和ECAVs飞行距离两个因素，完成度越高的路径得到的计算值越大，相同完成度下，实际行驶距离越短的路径得到的计算值越大。

在上文中确立了ECAVs控制策略优化模型，并且通过离散化将模型转变为树的最优路径搜索问题，由于任何ECAVs状态变化均会在树中增加节点，树的规模较大，难以通过传统算法进行全局求解，因此本发明引入SP-MCTS算法求其数值解。SP-MCTS算法是一种启发式树搜索算法，其特点是路径搜索与树的建立同时进行，并且利用置信上限(UpperConfidence bounds applied to Trees,UCT)对搜索方向进行启发式指导，能够降低路径搜索计算量，适用于所述问题。基于SP-MCTS的ECAVs路径协同规划算法整体框架如表2所示：

表2基于SP-MCTS的ECAVs控制策略规划算法

表1中，t_max在本实施例的仿真中取值为100000，Eval(S_leaf)表示策略评估函数，其利用上述式(32)对控制策略进行评估，S_leaf表示叶节点，可以在树中唯一确定控制策略，r表示由Eval(S_leaf)所计算得出的策略评估结果，亦即奖励值，S_cur表示当前迭代中所选中的节点。该算法主要包括四个阶段：选择(Selection)、扩展(Expand)、模拟(Simulation)、回溯(Backpropagation)，每个阶段对应一个关键处理函数，将在后续步骤中详细描述：

(1)SP-MCTS选择阶段处理函数Selection()，其流程如表3所示

表3SP-MCTS选择阶段处理流程

在该过程中，置信上限UCT的计算需要记录树T的总访问次数N_total，以及每个节点S_i的访问次数N(S_i)和累积奖励值Q(S_i)，N(S_i)与Q(S_i)初始化为0，后续的具体迭代方法由后续的回溯阶段处理函数Backpropagation()给出。利用这些数据可计算UCT，其计算公式为

其中，c为控制系数。

选择阶段处理函数Selection()，其目的是根据UCT的引导，在树T内选择出一个叶节点S_leaf。该函数从根节点S_root开始逐步选择至叶节点，对于非叶节点，若其所有子节点均被访问过，则选择子节点中UCT值最大的节点进行下一步迭代，若存在子节点未被访问过，则随机选取一个未访问过的子节点。通过UCT的引导，使该选择过程偏向最优路径，避免对树T的全局搜索。

(2)SP-MCTS扩展阶段处理函数Expand()，其流程如表4所示

表4SP-MCTS扩展阶段处理流程

扩展阶段处理函数Expand()，其目的是根据ECAVs运动约束，计算叶节点S_leaf的所有后续节点集合V。此函数执行时需要处理ECAVs与假航迹之间的匹配关系，该处利用匹配向量m表示ECAVs与假航迹之间的匹配关系，对于编号为i的ECAV，将与之匹配的假航迹编号记为m(i)。Expand()处理时，首先将集合V初始化为空集；如果S_leaf对应最后一帧，则无后续节点，Expand()计算结果即为空集；如果不是最后一帧，则需遍历ECAVs与假航迹的每种匹配关系m，并在每种匹配关系下计算所有ECAV下一帧的可选坐标集合PS_i。对于编号为i的ECAV，根据RGPO假航迹与匹配向量m，可以得到下一帧需要形成的虚假点迹(x_t,y_t)，然后以ΔD为间隔对雷达-(x_t,y_t)连接线段进行离散化得到备选坐标集合，结合步骤2.2所推导的步骤2.1所描述的运动约束对备选坐标集合进行筛选，即可得到可行集合PS_i。得到ECAVs可选坐标之后，若当前帧针对N_F个虚假点迹的可行集合/>均不为空，则从这N_F个集合中各选择一个坐标作为对应ECAV的下一帧位置，表3中Comb()的作用是在可行集合/>中各选一个坐标，遍历所有可行选择，每种选择对应S_leaf的一个后续子节点；利用Comb()对集合V不断扩充，最终得到S_leaf后续节点集合。

(3)SP-MCTS模拟阶段处理函数Simulation()，其流程如表5所示

表5SP-MCTS模拟阶段处理流程

模拟阶段处理函数Simulation()，其目的是通过蒙特卡洛方法对输入进行评估，得到其奖励值r。该函数以一个叶节点为输入，随机选择其后续节点，产生随机策略，并计算该随机策略的奖励值r。该流程虽利用Expand()计算节点的可选子节点，但是不更新树T，不会导致树T规模的扩大。

(4)SP-MCTS回溯阶段处理函数Backpropagation()，其流程如表6所示

表6SP-MCTS回溯阶段处理流程

回溯阶段处理函数Backpropagation()，其目的是利用策略奖励值r对树T进行更新。该函数从叶节点开始，更新各节点访问次数N、奖励累积值Q、置信上限UCT，逐级往上直到根节点。

利用上述算法，将树的建立与最优策略搜索同步进行。对于单假航迹场景，经过t_max次迭代后，执行Selection()即可得到ECAVs最优控制策略；对于涉及航迹切换的多假航迹场景，可以在经过t_max迭代后，确定ECAVs与假航迹间的对应关系，将第j个ECAV的所有K帧所对应假目标点序列记为所有ECVAs的对应假航迹的点序列集合定义为/>后，以/>替换/>此时可将多假航迹场景视为N_F个无需航迹切换的单假航迹场景再次迭代寻优，即可得到ECAVs最优控制策略。

ECAVs飞行距离的计算过程需要利用该算法求解得到最优结果，而假航迹实施完整性的判定不需要利用该算法求解得到最优结果，只要在求解过程中发现任意一种能够完整实施假航迹的策略，即表示该假航迹可完整实施。

3.3、基于分治的假航迹约束违反度计算方法。

表1所示流程需要对假航迹约束违反程度进行计算，约束违反程度可以通过求解式(30)得到；如图10所示，式(30)所示问题的优化自变量维度为1，且对于自变量A的每一种取值，都只有可行和不可行的判断，求解目标是找到可行和不可行的交界值A^*。

本发明采用分治思想对约束违反程度进行求解，算法流程如表7所示。

表7基于分治的假航迹约束违反程度计算方法

在表7中，δ_A表示求解精度，取值越小，计算结果的精度越高；该算法通过A_left、A_right记录当前搜索区间，并将区间初始化为[1,A_max]，随着算法迭代，区间逐渐减小，最终收敛到A^*附近。

步骤4：根据Deb准则的评估结果对搜索方向进行引导，提出PSO-Deb-OCBA算法，完成RGPO假航迹与ECAVs控制策略协同规划

4.1、基于PSO-Deb-OCBA的RGPO假航迹与ECAVs控制策略协同规划算法。结合步骤3中所描述的假航迹比较方法、约束违反程度计算方法，得到基于PSO-Deb-OCBA的RGPO假航迹与ECAVs控制策略协同规划算法，算法流程如表8所示。

表8基于PSO-Deb-OCBA的RGPO假航迹与ECAVs控制策略协同规划算法

/>

该算法首先求解可完整实施的最优RGPO假航迹，然后利用步骤3.2所述算法对ECAVs控制策略进行规划。求解RGPO假航迹时，对于每次迭代，首先利用步骤3.2所述方法判定假航迹是否可以完整实施，然后仅计算可完整实施假航迹的干扰效果，最后根据表1所述流程比较粒子的优劣。

在表8中，涉及PSO粒子更新方式、OCBA采样次数分配准则、以及RGPO假航迹干扰效果评估方法，下面将依次对其进行介绍。

4.2、PSO(Particle Swarm Optimization，基于种群的随机优化技术算法)粒子更新方式。PSO算法迭代过程中，需要记录并更新每个粒子的位置ψ_i与速度v_i，粒子位置ψ_i表示优化模型可行解，即RGPO假航迹的可选方案，每个粒子ψ_i内包括N_F条假航迹全部K帧的距离控制量与方位控制量/>共包含2KN_F个分量。

为了PSO算法的更新，还需记录个体最佳与全局最佳状态；粒子个体最佳适应度r_i,pbest指从算法起始到现在该粒子适应度的最大值，对应位置为个体最佳位置ψ_i,pbest；全局最佳适应度r_gbest指从算法起始到现在，所有粒子适应度的最大值，其对应位置为全局最佳位置ψ_gbest。本领域技术人员应知最佳状态包括了最佳适应度和最佳位置。

算法初始化时，在界限区间[ψ_min,ψ_max]、[v_min,v_max]内，随机设置每个粒子位置ψ_i与速度v_i；算法执行时，对于每一步迭代，需要根据全局最佳位置ψ_gbest、个体最佳位置ψ_i,pbest以及粒子当前状态更新速度v_i，计算方式为

v_i＝wv_i+c₁rand()(ψ_i,pbest-ψ_i)+c₂rand()(ψ_gbest-ψ_i) (34)

其中，w为惯性权重，c₁、c₂为学习因子，rand()表示取[0,1]范围内的随机数，如果超过了速度界限区间[v_min,v_max]，则将对应分量设置为边界值，即大于v_max的分量设置为v_max，小于v_min的分量设置为v_min。本实施例中[ψ_min,ψ_max]取值为[-50m,50m]，[v_min,v_max]取值为[-5°,5°]，w取值为0.8，c₁取值为0.5，c₂取值为0.5。

速度更新后，利用式(28)更新粒子位置ψ_i

ψ_i＝ψ_i+v_i (35)

同样地，如果更新结果超过位置界限区间[ψ_min,ψ_max]，则将对应分量设置为边界值。

随着算法的迭代，各粒子逐渐趋向全局最优方向移动；算法执行结束时的全局最佳位置ψ_gbest就是RGPO假航迹规划结果。

4.3、OCBA采样次数分配算法。在表9所示算法流程中，假航迹干扰效果的计算需要对场景进行大量采样，在算法每一步迭代中，需要利用OCBA算法分配每个粒子的采样次数。OCBA算法以最大化成功选择最优粒子的概率为原则，将总采样次数N_S分配给N_P个粒子，该算法流程如表9所示。

表9 OCBA采样次数分配算法

OCBA算法首先给每个粒子分配少量采样次数n₀，然后依据n₀次采样结果作为后续采样次数分配的依据。记粒子ψ_i的采样次数为N_S,i、粒子ψ_i的第j次采样评价结果为采样次数增量为Δ，对粒子ψ_i进行N_S,i次采样后，根据采样结果，可以计算干扰效果的均值

其中，均值r_i也是对粒子ψ_i干扰效果的评价。

然后，取出当前最优粒子的下标为

最后，根据每个粒子的均值与方差，将采样次数增量Δ分配给N_P个粒子，下一步各粒子采样次数增量n_S,i需要满足如下三个条件

/>

OCBA算法能够在N_P个粒子中选择出最优粒子，满足粒子群算法的需求；对于粒子群算法，关键步骤是在每一步迭代中找到最佳粒子，并以此粒子的位置为基准对其他N_P-1个粒子进行调整。将PSO算法与OCBA算法相结合，能够有效分配采样次数，提高算法求解性能。

4.4、基于单次采样的RGPO假航迹干扰效果评估方法

在基于PSO-Deb-OCBA的RGPO假航迹规划算法中，需要依赖本地仿真系统对假航迹的干扰效果进行评价。在PSO算法中，对于每个粒子ψ_i，数字仿真系统需要模拟K帧干扰实施过程；模拟之前，首先需要根据真实目标历史运动数据建立跟踪航迹，然后对后续每一帧执行如下流程：

(1)计算后续第k帧各雷达站点量测数据。首先，根据真实目标运动模型，预测后续K帧目标位置，然后将ψ_i转换为虚假航迹，同样包含K帧，每一帧虚假点迹数量等于假目标数量N_F。然后，根据式(6)模拟各雷达站点量测过程，得到各雷达站点量测结果在上述过程中，需要利用计算机生成伪随机数模拟真实目标过程噪声与雷达量测噪声。

(2)利用量测结果根据式(7)模拟组网雷达数据中心同源点迹关联、量测融合过程，得到融合后的量测数据/>

(3)根据式(9)模拟多目标跟踪算法，利用前一帧跟踪结果以及/>对当前帧进行跟踪，得到跟踪结果/>同时将未关联的量测进行航迹起始，将长时间无关联量测的跟踪航迹终止。

将上述流程执行K帧后，得到全部K帧跟踪结果，其中，对于干扰实施前建立的真实目标跟踪航迹，后续K帧跟踪结果为第K帧状态估计为/>然后可以利用步骤1中描述的评价函数对干扰效果进行评估。

本发明的效果通过以下仿真试验进一步说明：

假设场景中存在两个雷达站点，位置分别为(0,0)和(50km,0)，量测噪声呈零均值高斯分布，距离向量测噪声标准差为10m，方位向量测噪声标准差为0.5°，雷达扫描周期为1s，目标检测概率为99％。

假设场景内存在一个真实目标，其起始位置为(15km,50km)，真实目标做匀速运动，x、y方向的运动速度分别为100m/s、-400m/s，运动过程噪声呈零均值高斯分布，x、y方向的过程噪声标准差均为5m。

假设本仿真假设数字仿真系统与雷达数据中心的跟踪算法相同，其中，跟踪模型采用匀速卡尔曼滤波，数据关联算法采用JPDA，跟踪波门采用椭圆波门，且设置门概率为99.97％、波门门限为16.0，在跟踪模型中，设置x、y方向的过程噪声呈零均值高斯分布，且标准差均为10m。

本仿真利用单条CI假航迹对组网雷达进行RGPO干扰，共实施15帧；利用本发明所述算法对RGPO假航迹与ECAVs控制策略进行规划时，设置假航迹每帧距离控制量取值范围均为[-50m,50m]，方位控制量取值范围均为[-5°,5°]，设置算法总迭代次数t_max为50、PSO粒子数量N_P为50、单次迭代中OCBA算法采样总次数N_S为10⁵。

在上述场景下，设置ECAVs具有不同初始状态与运动约束，分别进行仿真对比实验，由于PSO算法求解结果具有一定随机性，为了降低随机性的影响，每组仿真参数下均进行20次蒙特卡洛实验，利用仿真结果均值对算法进行评价。

首先验证ECAVs初始状态对规划结果的影响，由于场景内存在两个雷达站点以及一条假航迹，需要利用两个ECAVs分别实施干扰，利用ECAV1干扰位于(0,0)的雷达站点，利用ECAV2干扰位于(50km,0)的雷达站点，设置ECAVs运动约束如表10所示。

表10 ECAVs运动约束参数表

考虑ECAVs具有不同初始状态，主要包括各ECAVs的初始位置、初始速度、初始角度，设置表11所示五种情况，依次进行仿真实验。

表11不同情况下ECVAs初始状态参数表

/>

表12无协同约束RGPO假航迹在不同情况下的约束违反程度

在上述五种情况下，如果不考虑ECAVs初始状态与机动能力引入的约束，所规划RGPO假航迹无法完整实施，采用表7所示算法依次计算每种情况的约束违反程度，计算结果如表12所示。

图11给出了这五种情况下的算法收敛曲线，干扰性能采用拖引成功率-距离混合指标进行评价，且令混合系数α＝0.5。从该结果中可以看出，相比于不考虑协同约束的最优RGPO假航迹，ECAVs初始状态与机动能力影响了RGPO假航迹的选择，结合表11，从情况1到情况5，ECAVs初始状态逐渐偏离，无协同约束RGPO假航迹的约束违反程度逐渐增大，ECAVs对RGPO假航迹的限制也逐渐增大，最终能够达到的干扰性能逐渐降低。

在图11中，情况1～4均在第一步搜索到了可完整实施的假航迹，而情况5在第18步才搜索到，前17步的假航迹均无法完整实施，通过Deb准则的引导，使算法逐渐朝向可行域搜索。情况1的收敛结果最大，从情况2到情况5，ECAVs初始状态逐渐偏离情况1，最终能够达到的干扰性能也越来越低。

同样对于上文所述场景，为了验证ECAVs运动约束对RGPO干扰的影响，固定ECAVs初始状态、最小拖引距离、雷达-ECAVs最小安全距离等参数，分别在不同运动约束情况下进行仿真实验。ECAVs初始状态固定值如表13所示。

表13ECAVs初始状态参数表

在表13参数下，设置ECAVs具有不同运动约束，主要包括加速度约束、转角约束，具体设置值如表14所示。

表14不同情况下ECVAs运动约束参数表

表15无协同约束RGPO假航迹在不同情况下的约束违反程度

在表14所示三种情况中，不考虑协同约束的RGPO假航迹具有不同的约束违反程度，计算结果如表15所示，其中，情况1的约束违反程度为1，表示在此场景下，无协同约束RGPO假航迹可以被完整实施。

图12给出了这三种情况下的算法收敛曲线，干扰性能计算方式与上文相同。由于情况1满足协同约束，所以算法求解结果与五协同约束的RGPO假航迹干扰性能基本一致(微小差别来自于算法本身的随机性)；情况2与情况3场景下的干扰性能均低于情况1，结合表14、表15，随着ECAVs运动约束偏离程度的增大，约束违反程度逐渐增大，干扰效果逐渐降低。

在图12中，情况2、情况3均从第二步迭代开始搜索到了可以完整实施的假航迹，证明了Deb准则对算法的引导作用。

为了直观呈现ECAVs初始状态与机动能力对RGPO干扰的影响，在表14中情况3的场景下，图13对比了考虑协同约束、无协同约束情况下的ECAVs控制策略。结合表15与图13，对于无协同约束RGPO假航迹，ECAV1的转角约束无法满足要求，需要将其约束范围至少扩大1.237倍才可以完整实施，而本发明所述方法能够满足ECAVs运动约束。

综上所述，仅从RGPO假航迹的角度来看，不考虑协同约束时，RGPO假航迹规划算法可以进行全局求解，干扰效果更好，但是在ECAVs初始状态与机动能力确定的情况下，求解的最优RGPO假航迹无法完整实施，干扰效果难以发挥出来。本发明所述算法考虑ECAVs与RGPO假航迹的协同约束，能够求解满足协同约束的最优假航迹、以及对应的ECAVs控制策略，保证RGPO干扰效果。

本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的原理，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。

Claims

1.一种基于无人机的组网雷达距离门联合拖引干扰方法，其特征在于，包括以下步骤：

S2、分析距离门拖引假航迹与ECAVs控制策略之间的协同约束，建立其优化模型；每一条假航迹的实施完整性受制于ECAVs的初始状态S_init和运动约束C_ECAV；优化模型表达式为：

其中，Ψ为假目标控制向量，根据该控制向量可以计算得到假航迹；Γ(·)为干扰效果评估方程，计算得到数值J，反应不同假航迹的干扰效果，数值越大，表示干扰效果越好；Σ为自变量可行域；θ(·)为ECAVs控制策略求解器，Φ表示空集；θ(Ψ,S_init,C_ECAV)≠Φ表示在初始状态S_init和运动约束C_ECAV下，ECAVs存在可以完整实施Ψ的控制策略；

其中，p为从根节点S_root到叶节点的路径，即一种ECAVs控制策略；C(·)为路径评价目标函数，即ECAVs控制策略评价指标；S_k,i表示树T第k层中第i个顶点，即ECAVs的一种状态；M为该路径中除了根节点之外的顶点数量，M≤K，航迹共K帧；V(k)表示树T在第k层的顶点集合；E(S_k,i)表示以节点S_k,i为起点的边集；e(S_k,i→S_k+1,j)表示以节点S_k,i为起点以节点S_k+1,j为终点的边；

2.根据权利要求1所述的一种基于无人机的组网雷达距离门联合拖引干扰方法，其特征在于，基于Deb准则对分类后的假航迹进行评估，具体为：

计算可以完整实施粒子集合中各假航迹的干扰效果；计算不可完整实施粒子集合中各假航迹的约束违反程度；

通过对于所有假航迹两两一组进行比较，最终得到最佳距离拖引假航迹；比较过程为：如果二者均不可完整实施，约束违反程度更低的假航迹更优；如果二者均可以完整实施，则干扰效果好的假航迹更优；如果只有一条假航迹可以完整实施，则可完整实施假航迹更优。

3.根据权利要求2所述的一种基于无人机的组网雷达距离门联合拖引干扰方法，其特征在于，计算约束违反程度计算方式定义为：

其中，A为约束违反程度，表示ECAVs运动约束范围扩大倍数，A_max为A的最大可能取值，表示将所有ECAVs运动约束范围均扩大A倍的控制策略求解器。

4.根据权利要求3所述的一种基于无人机的组网雷达距离门联合拖引干扰方法，其特征在于，在计算假航迹的干扰效果过程中，采用OCBA算法分配每个粒子的采样次数。

5.根据权利要求4所述的一种基于无人机的组网雷达距离门联合拖引干扰方法，其特征在于，具体根据下式进行干扰效果评价：

其中，μ＝1时表示真实目标在波门内，μ＝0时表示真实目标不在波门内，d表示跟踪航迹波门中心与真实目标位置的距离；d_max表示拖引距离最大值，α为混合系数。

6.根据权利要求5所述的一种基于无人机的组网雷达距离门联合拖引干扰方法，其特征在于，C(p)的表达式为：

其中，N_F表示假目标的数量，v_e,i,max为ECAV的最大速度，表示从节点/>转变到节点/>时ECAVs行驶总距离，ΔT表示相邻帧的间隔时间。