CN114722710B - 一种基于随机仿真优化的距离门拖引干扰方法 - Google Patents
一种基于随机仿真优化的距离门拖引干扰方法 Download PDFInfo
- Publication number
- CN114722710B CN114722710B CN202210373255.7A CN202210373255A CN114722710B CN 114722710 B CN114722710 B CN 114722710B CN 202210373255 A CN202210373255 A CN 202210373255A CN 114722710 B CN114722710 B CN 114722710B
- Authority
- CN
- China
- Prior art keywords
- interference
- representing
- rgpo
- target
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005457 optimization Methods 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000004088 simulation Methods 0.000 title claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 33
- 230000000694 effects Effects 0.000 claims abstract description 18
- 239000002245 particle Substances 0.000 claims description 61
- 230000006870 function Effects 0.000 claims description 39
- 238000005259 measurement Methods 0.000 claims description 29
- 239000003795 chemical substances by application Substances 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 9
- IKCLCGXPQILATA-UHFFFAOYSA-N 2-chlorobenzoic acid Chemical compound OC(=O)C1=CC=CC=C1Cl IKCLCGXPQILATA-UHFFFAOYSA-N 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000007423 decrease Effects 0.000 claims description 6
- MYVIATVLJGTBFV-UHFFFAOYSA-M thiamine(1+) chloride Chemical compound [Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N MYVIATVLJGTBFV-UHFFFAOYSA-M 0.000 claims description 6
- 238000012952 Resampling Methods 0.000 claims description 4
- 230000010354 integration Effects 0.000 claims description 4
- 238000005314 correlation function Methods 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 2
- 238000002948 stochastic simulation Methods 0.000 abstract 3
- 238000010586 diagram Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 244000144980 herd Species 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S13/00—Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
- G01S13/66—Radar-tracking systems; Analogous systems
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S7/00—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
- G01S7/02—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
- G01S7/38—Jamming means, e.g. producing false echoes
Landscapes
- Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
本发明公开了一种基于随机仿真优化的RGPO干扰方法,本发明的方法将RGPO干扰策略的优化建模为一个随机仿真优化问题,设计了一种不依赖雷达跟踪系统内部知识的干扰策略评分方案,并提出了一种基于CALPSO‑OCBA的RGPO干扰策略优化算法,能够不依赖目标函数的代数描述,缓解了解空间搜索与候选解性能估计之间的冲突,克服了RGPO干扰策略定量优化的难题,相比传统随机仿真优化算法具有更高的优化效率,显著提升了干扰效果,极大地提高了干扰成功率。
Description
技术领域
本发明属于雷达电子对抗技术领域,具体涉及RGPO干扰策略生成及雷达跟踪技术。
背景技术
RGPO是一种被广泛应用的针对雷达跟踪系统的欺骗干扰方式。在该干扰方式中,干扰机通过连续多帧转发加有受控时延的雷达信号,在雷达跟踪端形成一系列有规律的虚假量测点,从而迷惑雷达跟踪系统的数据关联,进而迫使雷达跟踪系统错误地跟踪了虚假目标而丢失了真实目标。然而,RGPO干扰的效果很大程度上取决于受控时延的设置。如果受控延迟设置合理,则跟踪门将被快速地从真实目标处拖离到假目标处,否则跟踪门将不能被快速拖离,或者根本无法被拖离。因此,确定一组合理的受控延迟是提升RGPO干扰性能的关键。
目前,虽然很多文献都提到了RGPO干扰,但是大多数文献中只对RGPO干扰进行了定性描述。在文献“D.C.Schleher,Electronic Warfare in the InformationAge.Norwood,MA,USA:Artech House,1999.”和文献“D.L.Adamy,EW 101:A First Coursein Electronic Warfare.Norwood,MA,USA:Artech House,2001.”中,作者指出了受控时延的设置是影响RGPO干扰性能的主要因素,并定性分析了RGPO干扰的受控延迟的设置。这些研究的一个普遍性观点是,受控延迟应该与受干扰的雷达跟踪系统相匹配,这样才会在最大程度上破坏真实目标的轨迹。然而,这些研究并没有进一步建立一个RGPO干扰策略的优化模型,也没有给出一个定量优化RGPO干扰策略的方法。然而,为了进一步提高RGPO干扰的性能,干扰策略的优化模型和适当的优化算法是必须打破的瓶颈。
发明内容
针对现有技术存在的上述问题,本发明提出了一种基于随机仿真优化的RGPO干扰方法。
为了方便描述本发明的内容,首先对以下术语进行解释:
术语1:RGPO干扰
RGPO干扰即距离门拖引干扰,当干扰机截获到雷达信号后,会以一定的时延进行增量延迟转发,进而能够对雷达距离信息造成欺骗。
术语2:跟踪门
跟踪门是用来决策量测值是否源于目标的一个门限,它是以目标的预测值为中心的一片区域,用来确定下一帧目标量测值可能存在的范围。
术语3:PSO
PSO是粒子群优化算法(Particle Swarm Optimization),是一种基于种群的随机优化技术。粒子群优化算法模仿昆虫、兽群、鸟群和鱼群等的群集行为,这些群体按照一种合作的方式寻找食物,群体中的每个成员通过学习它自身的经验和其它成员的经验来不断改变其搜索模式。
本发明的具体技术方案为:一种基于随机仿真优化的RGPO干扰方法,包括如下步骤:
步骤一:RGPO干扰场景建模,
在第k个干扰阶段,真实目标与假目标之间的距离dk表示为:
其中,c代表光速;
设真实目标的状态方程为:
X(k)=f[k,X(k-1)]+ψ[k,X(k-1),v[X(k-1)]] (3)
其中,X(k)代表第k个干扰阶段真实目标的状态向量;X(k-1)代表第k-1个干扰阶段真实目标的状态向量;f[·]代表当前阶段状态与未来阶段状态之间的状态转换函数;v[·]代表过程噪声序列;ψ[·]代表过程噪声的分布函数;
其中,θ[·]表示将dk投影到状态空间中的投影函数。
此时,雷达跟踪系统对真实目标和假目标的状态矢量的量测值分别表示为式(5)和式(6):
Z(k)=h(k,X(k))+ω[k,X(k)] (5)
其中,h[·]为测量函数;ω[·]表示测量噪声序列。
雷达跟踪系统的数据过程如下:
其中,g[·]表示增益函数;
步骤二:建立RGPO干扰策略的优化模型
定义ξ(k)表示真实目标在第k个干扰阶段是否摆脱跟踪波门:
其中,ξ(k)=1表示真实目标已经摆脱跟踪波门,ξ(k)=0表示真实目标还没有摆脱跟踪波门;
设(x(k),y(k))和分别代表真实目标在第k个干扰阶段的位置的笛卡尔坐标和速度,和分别表示在第k个干扰阶段对真实目标的位置笛卡尔坐标和速度的估计,假设真实目标在第k个干扰阶段X(k)的状态向量和在第k个干扰阶段雷达跟踪系统对目标的状态估计分别为:
定义第k个干扰阶段的拉离距离POD(k)为:
为了评价在最后的干扰阶段对于特定RGPO干扰的干扰效果,干扰效果的评分表示为以ξ(k)和POD(k)为自变量的函数:
其中,r代表RGPO干扰策略的评分,v[·]代表评价函数,代表干扰机受控延迟的增量序列,χ=[X1,X2,...,XK]代表具有过程噪声的真实目标状态序列,W=[ω1,ω2,...,ωK]代表量测噪声序列,表示杂波序列。
选择干扰策略性能的期望值E[·]作为优化目标,定义为:
其中,Ω代表决策空间。
对公式(14)进行简化成为:
其中,dlimit表示是为防止少数异常干扰结果对干扰策略平均性能的负面影响而设置的参数;
步骤三:RGPO干扰策略的优化
首先利用LHS(Latin Hypercube Sampling)采样方法得到初始化的N个粒子,并将初始化粒子中的受控延迟原始数据代入到基于CAL(Committee-based Active Learning)的模型管理中的集成代理模型中,该集成代理中一共包含三个部分,分别为多项式回归模型、RBF(Radial Basis Function)模型和Kriging模型,三个模型的输出分别记为 因此,集成代理模型的输出是所有包含的三个模型输出的加权和:
其中,ωi表示第i个模型的输出所对应的权重,其定义为:
其中,ei表示第i个模型的均方根误差。
其中,表示第n个粒子在第t次迭代时的个体最优,αt速度更新的惯性权值,随迭代次数t线性下降,和是两个取值范围为[0,1]的随机数,c1表示粒子对自身认知的表示,作为权重系数,可以使粒子追踪其个体最优值;c2表示粒子追踪全局最优值的权重系数,的计算公式如公式(24)所示:
其中,权重系数βt随迭代次数t从βmax到βmin呈线性下降:
其中,βmax表示最大惯性权重因子,βmin表示最小惯性权重因子,tmax代表最大迭代次数。
外部PSO程序所输出的每一个粒子都将基于OCBA算法竞争剩余的采样预算,并且在后续的每个分配阶段,将根据式(26)和式(27)对计算预算增量进行分配:
最终,外部PSO程序循环所得到的全局最优解,即是经过优化的最佳RGPO干扰策略。
本发明的有益效果:本发明的方法将RGPO干扰策略的优化建模为一个随机仿真优化问题,设计了一种不依赖雷达跟踪系统内部知识的干扰策略评分方案,并提出了一种基于CALPSO-OCBA的RGPO干扰策略优化算法,能够不依赖目标函数的代数描述,缓解了解空间搜索与候选解性能估计之间的冲突,克服了RGPO干扰策略定量优化的难题,相比传统随机仿真优化算法具有更高的优化效率,显著提升了干扰效果,极大地提高了干扰成功率。
附图说明
图1是RGPO干扰过程示意图。
图2是本发明提供方法的流程框图。
图3是无干扰情况下的POD和POR的仿真结果。
图4是dlimit=450的情况下不同干扰阶段POD和POR的仿真结果。
图5是dlimit=900的情况下不同干扰阶段POD和POR的仿真结果。
图6是在粒子数等于10的情况下,七种算法的迭代收敛曲线。
图7是在粒子数等于20的情况下,七种算法的迭代收敛曲线。
图8是在粒子数等于40的情况下,七种算法的迭代收敛曲线。
具体实施方式:
本发明主要采用仿真实验的方法进行验证,所有步骤、结论都在Matlab2021b上验证正确。下面就具体实施方式对本发明作进一步的详细描述。
步骤一:RGPO干扰场景建模
1.1、首先,建立雷达跟踪系统模型,并利用初始化粒子得到集成代理中的初始数据集。
如图1所示,RGPO干扰对雷达距离跟踪器的主要作用过程可以表述为:在干扰机截获到雷达信号后,迅速地复制、调制一个干扰信号并进行转发,干扰信号捕获雷达距离波门后,当目标每被雷达照射一次,干扰机就增加受控延迟时间,让雷达距离波门逐渐随着干扰信号移动,当距离波门被拖引到足够安全的距离后,干扰机就会关闭,令雷达丢失跟踪目标。对于干扰机来说,一个跟踪帧可以看做是一个干扰阶段,设表示第个干扰阶段的受控延迟的增量,K表示干扰阶段的总数。因此,在第k个干扰阶段的干扰机信号受控延迟τk可以表示为:
因此,在第k个干扰阶段,真实目标与假目标之间的距离dk可以表示为:
其中,c代表光速。
1.2、设真实目标的状态方程为:
X(k)=f[k,X(k-1)]+ψ[k,X(k-1),v[X(k-1)]] (32)
其中,X(k)代表第k个干扰阶段真实目标的状态向量;X(k-1)代表第k-1个干扰阶段真实目标的状态向量;f[·]代表当前阶段状态与未来阶段状态之间的状态转换函数;v[·]代表过程噪声序列;ψ[·]代表过程噪声的分布函数。
其中,θ[·]是将dk投影到状态空间中的投影函数。
Z(k)=h(k,X(k))+ω[k,X(k)] (34)
其中,h[·]为测量函数;ω[·]表示测量噪声序列。
1.3、典型雷达跟踪系统的数据过程可以分为以下三步:
其中,表示对第k个干扰阶段状态的一步预测,表示雷达跟踪系统在第k-1个干扰阶段的状态估计,表示雷达跟踪系统的一步预测函数。雷达在第k个干扰阶段所接收到的数据包括真实的目标测量Z(k)、干扰测量和杂波所有这些测量值都作为输入数据被输入到雷达跟踪系统中:
通过公式(37)和(38),可以发现干扰量测值会混淆雷达跟踪系统的状态估计。然而,不同干扰策略下的干扰量测对雷达跟踪的影响差异很大。如果干扰量测没有混合进入跟踪门,干扰量测几乎不会影响雷达跟踪。相反,如果干扰量测混合到跟踪门中,那么使用干扰测量所携带的错误的距离信息进行状态估计,就会导致的误差。由干扰测量引起的中的误差分量并不限于当前的第k个干扰阶段,如公式(36)所示,将作为第k+1个干扰阶段状态预测的历史数据。因此,由引起的中的误差分量将传播到第k+1个干扰阶段状态的一步预测,这也意味着第k+1个干扰阶段的跟踪门中心将会比无干扰情况下偏移更远。
步骤二:建立RGPO干扰策略的优化模型
2.1、一般情况下,对RGPO干扰结果的评价主要取决于两点:
①真实目标是否离开跟踪门。
②波门拉离距离POD(The pull-off distance),即在一定探测帧数内距离门拖引干扰把雷达距离波门中心拖移真目标位置的距离。
所以在本发明中也利用这两项指标对干扰结果进行评价。
定义ξ(k)表示真实目标在第k个干扰阶段是否摆脱跟踪波门,其定义如下:
式中,ξ(k)=1表示真实目标已经摆脱跟踪波门,而ξ(k)=0表示真实目标还没有摆脱跟踪波门。
2.2、设(x(k),y(k))和分别代表真实目标在第k个干扰阶段的位置的笛卡尔坐标和速度,和分别表示在第k个干扰阶段对真实目标的位置笛卡尔坐标和速度的估计。假设真实目标在第k个干扰阶段X(k)的状态向量和在第k个干扰阶段雷达跟踪系统对目标的状态估计分别为:
据此,定义第k个干扰阶段的拉离距离POD(k)为:
2.3、根据2.1和2.2中所定义的两个函数,为了评价在最后的干扰阶段对于特定RGPO干扰的干扰效果,干扰效果的评分可以表示为以ξ(k)和POD(k)为自变量的函数:
其中,r代表RGPO干扰策略的评分,v[·]代表评价函数,代表干扰机受控延迟的增量序列,χ=[X1,X2,...,XK]代表具有过程噪声的真实目标状态序列,W=[ω1,ω2,...,ωK]代表量测噪声序列,表示杂波序列。
2.4、因为公式(14)中的自变量都是随机变量,所以干扰策略的评价得分也是随机的。因此,选择干扰策略性能的期望值E[·]作为优化目标,定义为:
其中,Ω代表决策空间。
2.5、对于干扰机来说,POD(k)并不容易得到,所以要对公式(43)进行简化成为:
其中,dlimit表示是为防止少数异常干扰结果对干扰策略平均性能的负面影响而设置的参数。
步骤三:RGPO干扰策略的优化
针对RGPO干扰策略,本发明提出了CALPSO-OCBA优化算法对其进行优化。CALPSO-OCBA的主体包括三个部分:外部PSO、基于OCBA的采样预算分配和基于CAL(Committee-based Active Learning)的模型管理。外部PSO用于搜索解空间并生成N个候选解。OCBA用于分配采样预算用以估计这些候选解决方案的适应性。而基于CAL的模型管理则用于提供最好的解决方案和最不确定的解决方案以协助粒子更新。具体流程如图2所示。
首先,利用LHS采样方法得到初始化的N个粒子。
3.1、算法迭代开始:
首先将初始数据代入到基于CAL的模型管理中的集成代理模型中,形成集成代理的训练数据集。该集成代理中一共包含三个部分,分别为多项式回归模型、RBF模型和Kriging模型,三个模型的输出分别记为因此,集成代理模型的输出是所有包含的三个模型输出的加权和:
其中,ωi表示第i个模型的输出所对应的权重,其定义为:
其中,ei表示第i个模型的均方根误差。
其中,表示第n个粒子在第t次迭代时的个体最优,αt速度更新的惯性权值,随迭代次数t线性下降,和是两个取值范围为[0,1]的随机数,c1是粒子对自身认知的表示,作为权重系数,可以使粒子追踪其个体最优值;c2则是粒子追踪全局最优值的权重系数,的计算公式如公式(53)所示
权重系数βt随迭代次数t从βmax到βmin呈线性下降:
其中,βmax表示最大惯性权重因子,βmin表示最小惯性权重因子,tmax代表最大迭代次数。
3.4、接下来,外部PSO程序所输出的每一个粒子都将基于OCBA算法竞争剩余的采样预算,根据式(55)和式(56)对计算预算增量进行分配:
然后,根据OCBA算法分配剩余的采样运算,并求解出得到的所有候选解的最终样本均值,更新外部PSO程序的粒子的个体最优为全局最优为同时,将本次迭代生成的最优解及其采样均值添加到集成代理中的训练数据集中,对数据集进行更新。
判断迭代次数是否达到了最大迭代次数,若未达到最大迭代次数,则重复步骤3.1至步骤3.4;若已达到最大迭代次数,则输出外部PSO程序循环所得到的全局最优解,迭代结束。
最终,外部PSO程序循环所得到的全局最优解,就是经过优化的最佳RGPO干扰策略。
本实施例中,定义在所有重采样过程中真实目标摆脱跟踪门的比值为脱离率(POR),并以POD和POR为指标检验RGPO干扰策略的具体干扰效果。
本发明的效果通过以下仿真对比试验进一步说明:
仿真场景:
为了评价所提出的RGPO干扰策略优化算法,首先采用近恒速(CV)模型和卡尔曼滤波-概率数据关联(KF-PDA)作为目标的运动模型和跟踪方法。模型的具体参数如表1所示。
表1
在仿真场景建立后,需要建立RGPO干扰策略的评价模型。在这里设K=15,dlimit=900,以公式(16)的期望作为对干扰策略的评价函数。随后,初始化RGPO干扰策略,并利用CALPSO-OCBA算法进行优化,该算法的主要参数如表2所示。
表2
经过CALPSO-OCBA算法对干扰策略的优化,最终可以得出最优的RGPO干扰策略。
为了进一步测试所提出的算法的具体干扰效果,选择经CALPSO-OCBA算法进行50次蒙特卡洛后,所得到的50个优化干扰策略中评价函数中位数值所代表的干扰策略,以POD和POR为指标检验所得到的RGPO干扰策略的具体干扰效果。如图3、图4和图5所示,分别代表了CALPSO-OCBA算法在无干扰、dlimit=450、dlimit=900的情况下RGPO干扰策略的POD箱线图和POR的曲线。
从图3可以看到,POR曲线的值几乎都为0,POD也趋于收敛,这意味着当没有干扰时,雷达对真实目标的跟踪非常稳定;从图4可以发现,随着图中干扰阶段的增加,POR逐渐增加,最终达到接近30%。同时,POD的箱线图逐渐发散,其上四分位数最终超过600m,这些结果表明,在该干扰策略下,被攻击雷达跟踪系统的可靠性显著降低,同时,干扰效果随着干扰阶段的增加而逐渐增加的趋势,也与RGPO干扰的原理相一致;与图4相比,图5中的POR值稍有下降,而POD的最大值却在增大,这是因为dlimit会干扰所生成的干扰策略的POD和POR之间的平衡。
本发明与PSO-OCBA(Optimal Computing Budget Allocation-based ParticleSwarm Optimization)进行对比:为了展示基于CAL的模型管理在CALPSO-OCBA算法中的作用。
本发明与CALPSO-OCBA-WOU(Optimal Computing Budget Allocation-basedParticle Swarm Optimization and Committee-based Active Learning without theUncertainty-based Criterion)进行对比:为了展示在基于CAL的模型管理中求出当前数据集下集成代理中的最不确定的解的作用。
本发明与CALPSO-ER(Equal Resampling-based Particle Swarm Optimizationand Committee-based Active Learning)进行对比:为了证明基于OCBA的计算预算分配的效果。
本发明与CALGA-OCBA(Optimal Computing Budget Allocation-based GeneticAlgorithm and Committee-based Active Learning)和GA-OCBA(Optimal ComputingBudget Allocation-based Genetic Algorithm)进行对比:为了对比PSO与GA两种算法的寻优效果。
仿真对比试验的结果如图6、图7、图8所示。可以看到,当粒子数N从10变化到40时,CALPSO-OCBA的性能优于其他六种算法。在基于CAL的模型管理的帮助下,CALPSO-OCBA可以生成更关键的候选解,从而在不损失候选解的估计精度的情况下提高解空间的搜索能力。当粒子数量较少(即N=10)时,CALPSO-OCBA的初始性能较差,但随着迭代次数的增加,性能迅速提高。相比之下,当粒子数较大时(即N=40)时,该算法的初始性能良好,但随着迭代次数的增加,其速度很快停止改善。这是因为,当N较小时,PSO-OCBA本身的搜索能力较差,初始的集成代理模型也不够成熟,导致在迭代开始时对解空间的搜索不足。但随着迭代次数的增加,集成代理算法逐渐成熟,该算法的搜索能力也逐渐增强。同时,当N较小时,对候选解的估计更为准确。因此,CALPSO-OCBA的性能随着迭代次数的增加而迅速提高。当粒子数量较大时,CALPSO-OCBA的初始搜索能力更强,并且可以更快地过滤出关键的候选粒子。
此外,从图6到图8可以看出,当其他算法的曲线停止增长时,CALPSO-OCBA、CALPSO-ER和CALGA-OCBA的曲线呈持续增长的趋势。这是因为,随着迭代次数的增加,集成代理模型逐渐成熟,其提出的最佳候选方案阻止了PSO和GA过早落入局部最优的陷阱,进一步证明了该算法的有效性。
综上所述,基于CALPSO-OCBA的RGPO干扰策略优化算法明显优于PSO-OCBA、CALPSO-OCBA-WOU、CALPSO-ER、PSO-ER、CALGA-OCBA和GA-OCBA。
Claims (1)
1.一种基于随机仿真优化的距离门拖引干扰方法,包括如下步骤:
步骤一:RGPO干扰场景建模,
在第k个干扰阶段,真实目标与假目标之间的距离dk表示为:
其中,c代表光速;
设真实目标的状态方程为:
X(k)=f[k,X(k-1)]+ψ[k,X(k-1),v[X(k-1)]] (3)
其中,X(k)代表第k个干扰阶段真实目标的状态向量;X(k-1)代表第k-1个干扰阶段真实目标的状态向量;f[·]代表当前阶段状态与未来阶段状态之间的状态转换函数;v[·]代表过程噪声序列;ψ[·]代表过程噪声的分布函数;
其中,θ[·]表示将dk投影到状态空间中的投影函数。
此时,雷达跟踪系统对真实目标和假目标的状态矢量的量测值分别表示为式(5)和式(6):
Z(k)=h(k,X(k))+ω[k,X(k)] (5)
其中,h[·]为测量函数;ω[·]表示测量噪声序列;
雷达跟踪系统的数据过程如下:
其中,g[·]表示增益函数;
步骤二:建立RGPO干扰策略的优化模型
定义ξ(k)表示真实目标在第k个干扰阶段是否摆脱跟踪波门:
其中,ξ(k)=1表示真实目标已经摆脱跟踪波门,ξ(k)=0表示真实目标还没有摆脱跟踪波门;
设(x(k),y(k))和分别代表真实目标在第k个干扰阶段的位置的笛卡尔坐标和速度,和分别表示在第k个干扰阶段对真实目标的位置笛卡尔坐标和速度的估计,假设真实目标在第k个干扰阶段X(k)的状态向量和在第k个干扰阶段雷达跟踪系统对目标的状态估计分别为:
定义第k个干扰阶段的拉离距离POD(k)为:
为了评价在最后的干扰阶段对于特定RGPO干扰的干扰效果,干扰效果的评分表示为以ξ(k)和POD(k)为自变量的函数:
其中,r代表RGPO干扰策略的评分,v[·]代表评价函数,代表干扰机受控延迟的增量序列,χ=[X1,X2,...,XK]代表具有过程噪声的真实目标状态序列,W=[ω1,ω2,...,ωK]代表量测噪声序列,表示杂波序列;
选择干扰策略性能的期望值E[·]作为优化目标,定义为:
其中,Ω代表决策空间。
对公式(14)进行简化成为:
其中,dlimit表示是为防止少数异常干扰结果对干扰策略平均性能的负面影响而设置的参数;
步骤三:RGPO干扰策略的优化
首先利用LHS采样方法得到初始化的N个粒子,并将初始化粒子中的受控延迟原始数据代入到基于CA的模型管理中的集成代理模型中,该集成代理中一共包含三个部分,分别为多项式回归模型、RBF模型和Kriging模型,三个模型的输出分别记为 因此,集成代理模型的输出是所有包含的三个模型输出的加权和:
其中,ωi表示第i个模型的输出所对应的权重,其定义为:
其中,ei表示第i个模型的均方根误差;
其中,表示第n个粒子在第t次迭代时的个体最优,αt速度更新的惯性权值,随迭代次数t线性下降,和是两个取值范围为[0,1]的随机数,c1表示粒子对自身认知的表示,作为权重系数,可以使粒子追踪其个体最优值;c2表示粒子追踪全局最优值的权重系数,的计算公式如公式(24)所示:
其中,权重系数βt随迭代次数t从βmax到βmin呈线性下降:
其中,βmax表示最大惯性权重因子,βmin表示最小惯性权重因子,tmax代表最大迭代次数;
外部PSO程序所输出的每一个粒子都将基于OCBA算法竞争剩余的采样预算,并且在后续的每个分配阶段,将根据式(26)和式(27)对计算预算增量进行分配:
最终,外部PSO程序循环所得到的全局最优解,即是经过优化的最佳RGPO干扰策略。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210373255.7A CN114722710B (zh) | 2022-04-11 | 2022-04-11 | 一种基于随机仿真优化的距离门拖引干扰方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210373255.7A CN114722710B (zh) | 2022-04-11 | 2022-04-11 | 一种基于随机仿真优化的距离门拖引干扰方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114722710A CN114722710A (zh) | 2022-07-08 |
CN114722710B true CN114722710B (zh) | 2023-02-24 |
Family
ID=82243411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210373255.7A Active CN114722710B (zh) | 2022-04-11 | 2022-04-11 | 一种基于随机仿真优化的距离门拖引干扰方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114722710B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113835069B (zh) * | 2021-09-22 | 2023-09-22 | 电子科技大学 | 一种距离门拖引干扰的智能生成方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105137396A (zh) * | 2015-08-24 | 2015-12-09 | 电子科技大学 | 一种smsp干扰和c&i干扰的检测方法 |
CN109633624A (zh) * | 2019-01-07 | 2019-04-16 | 西安电子科技大学 | 基于滤波数据处理的rgpo干扰鉴别方法 |
CN112213698A (zh) * | 2020-10-09 | 2021-01-12 | 合肥工业大学 | 一种基于稀疏表示分类的欺骗干扰识别方法 |
CN113835069A (zh) * | 2021-09-22 | 2021-12-24 | 电子科技大学 | 一种距离门拖引干扰的智能生成方法 |
-
2022
- 2022-04-11 CN CN202210373255.7A patent/CN114722710B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105137396A (zh) * | 2015-08-24 | 2015-12-09 | 电子科技大学 | 一种smsp干扰和c&i干扰的检测方法 |
CN109633624A (zh) * | 2019-01-07 | 2019-04-16 | 西安电子科技大学 | 基于滤波数据处理的rgpo干扰鉴别方法 |
CN112213698A (zh) * | 2020-10-09 | 2021-01-12 | 合肥工业大学 | 一种基于稀疏表示分类的欺骗干扰识别方法 |
CN113835069A (zh) * | 2021-09-22 | 2021-12-24 | 电子科技大学 | 一种距离门拖引干扰的智能生成方法 |
Non-Patent Citations (1)
Title |
---|
一种距离门拖引干扰策略的智能生成方法;贾瑞 等;《信号处理》;第37卷(第2期);276-283 * |
Also Published As
Publication number | Publication date |
---|---|
CN114722710A (zh) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | A stochastic simulation optimization-based range gate pull-off jamming method | |
Sichkar | Reinforcement learning algorithms in global path planning for mobile robot | |
US20140025613A1 (en) | Apparatus and methods for reinforcement learning in large populations of artificial spiking neurons | |
CN113627606A (zh) | 一种基于改进粒子群算法的rbf神经网络优化方法 | |
Dan et al. | A robust D–S fusion algorithm for multi-target multi-sensor with higher reliability | |
CN112904290A (zh) | 一种雷达智能认知抗干扰策略的生成方法 | |
CN114722710B (zh) | 一种基于随机仿真优化的距离门拖引干扰方法 | |
Zhao et al. | Mutation grey wolf elite PSO balanced XGBoost for radar emitter individual identification based on measured signals | |
Wang et al. | Strategy optimization for range gate pull-off track-deception jamming under black-box circumstance | |
CN111061165B (zh) | 一种船舶相对碰撞危险度模型的验证方法 | |
CN110880031A (zh) | 基于融合随机黑洞策略的灰狼优化算法的特征选择方法 | |
CN109936568A (zh) | 一种基于循环神经网络的防恶意攻击传感器数据采集方法 | |
CN114281103B (zh) | 一种零交互通信的飞行器集群协同搜索方法 | |
CN116432514A (zh) | 无人机攻防博弈的拦截意图识别策略仿真系统及方法 | |
CN114608585A (zh) | 一种移动机器人同步定位与建图方法及装置 | |
CN113296089B (zh) | 用于多预警机目标跟踪系统的lmb密度融合方法及装置 | |
CN113379063A (zh) | 基于在线增强学习模型的全流程任务时序智能决策方法 | |
CN116859350A (zh) | 一种基于无人机的组网雷达距离门联合拖引干扰方法 | |
Shi et al. | Multisensor distributed out-of-sequence-tracks fusion with track origin uncertainty | |
Gu et al. | A game theory approach to attack-defense strategy for perception of connected vehicles | |
CN117928559B (zh) | 一种基于强化学习的威胁规避下无人机路径规划方法 | |
Zhang et al. | Latent Maximum Entropy based Cognitive Radar Reward Function Estimation With Non-ideal Observations | |
Škach et al. | Efficient active fault diagnosis using adaptive particle filter | |
Goldfrank et al. | Risk Reduction in Target Motion Analysis Using Approximate Dynamic Programming | |
Wang et al. | Q learning based on self-organizing fuzzy radial basis function network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |