CN114722710B - 一种基于随机仿真优化的距离门拖引干扰方法 - Google Patents

一种基于随机仿真优化的距离门拖引干扰方法 Download PDF

Info

Publication number
CN114722710B
CN114722710B CN202210373255.7A CN202210373255A CN114722710B CN 114722710 B CN114722710 B CN 114722710B CN 202210373255 A CN202210373255 A CN 202210373255A CN 114722710 B CN114722710 B CN 114722710B
Authority
CN
China
Prior art keywords
interference
representing
rgpo
target
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210373255.7A
Other languages
English (en)
Other versions
CN114722710A (zh
Inventor
张天贤
张泽锐
马智杰
王远航
孔令讲
杨晓波
方学立
刘永坚
蔡光耀
王睿甲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202210373255.7A priority Critical patent/CN114722710B/zh
Publication of CN114722710A publication Critical patent/CN114722710A/zh
Application granted granted Critical
Publication of CN114722710B publication Critical patent/CN114722710B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/66Radar-tracking systems; Analogous systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/02Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
    • G01S7/38Jamming means, e.g. producing false echoes

Landscapes

  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明公开了一种基于随机仿真优化的RGPO干扰方法,本发明的方法将RGPO干扰策略的优化建模为一个随机仿真优化问题,设计了一种不依赖雷达跟踪系统内部知识的干扰策略评分方案,并提出了一种基于CALPSO‑OCBA的RGPO干扰策略优化算法,能够不依赖目标函数的代数描述,缓解了解空间搜索与候选解性能估计之间的冲突,克服了RGPO干扰策略定量优化的难题,相比传统随机仿真优化算法具有更高的优化效率,显著提升了干扰效果,极大地提高了干扰成功率。

Description

一种基于随机仿真优化的距离门拖引干扰方法
技术领域
本发明属于雷达电子对抗技术领域,具体涉及RGPO干扰策略生成及雷达跟踪技术。
背景技术
RGPO是一种被广泛应用的针对雷达跟踪系统的欺骗干扰方式。在该干扰方式中,干扰机通过连续多帧转发加有受控时延的雷达信号,在雷达跟踪端形成一系列有规律的虚假量测点,从而迷惑雷达跟踪系统的数据关联,进而迫使雷达跟踪系统错误地跟踪了虚假目标而丢失了真实目标。然而,RGPO干扰的效果很大程度上取决于受控时延的设置。如果受控延迟设置合理,则跟踪门将被快速地从真实目标处拖离到假目标处,否则跟踪门将不能被快速拖离,或者根本无法被拖离。因此,确定一组合理的受控延迟是提升RGPO干扰性能的关键。
目前,虽然很多文献都提到了RGPO干扰,但是大多数文献中只对RGPO干扰进行了定性描述。在文献“D.C.Schleher,Electronic Warfare in the InformationAge.Norwood,MA,USA:Artech House,1999.”和文献“D.L.Adamy,EW 101:A First Coursein Electronic Warfare.Norwood,MA,USA:Artech House,2001.”中,作者指出了受控时延的设置是影响RGPO干扰性能的主要因素,并定性分析了RGPO干扰的受控延迟的设置。这些研究的一个普遍性观点是,受控延迟应该与受干扰的雷达跟踪系统相匹配,这样才会在最大程度上破坏真实目标的轨迹。然而,这些研究并没有进一步建立一个RGPO干扰策略的优化模型,也没有给出一个定量优化RGPO干扰策略的方法。然而,为了进一步提高RGPO干扰的性能,干扰策略的优化模型和适当的优化算法是必须打破的瓶颈。
发明内容
针对现有技术存在的上述问题,本发明提出了一种基于随机仿真优化的RGPO干扰方法。
为了方便描述本发明的内容,首先对以下术语进行解释:
术语1:RGPO干扰
RGPO干扰即距离门拖引干扰,当干扰机截获到雷达信号后,会以一定的时延进行增量延迟转发,进而能够对雷达距离信息造成欺骗。
术语2:跟踪门
跟踪门是用来决策量测值是否源于目标的一个门限,它是以目标的预测值为中心的一片区域,用来确定下一帧目标量测值可能存在的范围。
术语3:PSO
PSO是粒子群优化算法(Particle Swarm Optimization),是一种基于种群的随机优化技术。粒子群优化算法模仿昆虫、兽群、鸟群和鱼群等的群集行为,这些群体按照一种合作的方式寻找食物,群体中的每个成员通过学习它自身的经验和其它成员的经验来不断改变其搜索模式。
本发明的具体技术方案为:一种基于随机仿真优化的RGPO干扰方法,包括如下步骤:
步骤一:RGPO干扰场景建模,
Figure BDA0003589648180000026
表示第
Figure BDA0003589648180000027
个干扰阶段的受控延迟的增量,K表示干扰阶段的总数,在第k个干扰阶段的干扰机信号受控延迟τk表示为:
Figure BDA0003589648180000021
在第k个干扰阶段,真实目标与假目标之间的距离dk表示为:
Figure BDA0003589648180000022
其中,c代表光速;
设真实目标的状态方程为:
X(k)=f[k,X(k-1)]+ψ[k,X(k-1),v[X(k-1)]] (3)
其中,X(k)代表第k个干扰阶段真实目标的状态向量;X(k-1)代表第k-1个干扰阶段真实目标的状态向量;f[·]代表当前阶段状态与未来阶段状态之间的状态转换函数;v[·]代表过程噪声序列;ψ[·]代表过程噪声的分布函数;
因此,在第k个干扰阶段假目标的状态
Figure BDA0003589648180000023
表示为:
Figure BDA0003589648180000024
其中,θ[·]表示将dk投影到状态空间中的投影函数。
此时,雷达跟踪系统对真实目标和假目标的状态矢量的量测值分别表示为式(5)和式(6):
Z(k)=h(k,X(k))+ω[k,X(k)] (5)
Figure BDA0003589648180000025
其中,h[·]为测量函数;ω[·]表示测量噪声序列。
雷达跟踪系统的数据过程如下:
Figure BDA0003589648180000031
其中,
Figure BDA0003589648180000032
表示对第k个干扰阶段状态的一步预测,
Figure BDA0003589648180000033
表示雷达跟踪系统在第k-1个干扰阶段的状态估计,
Figure BDA0003589648180000034
表示雷达跟踪系统的一步预测函数;
雷达在第k个干扰阶段所接收到的数据包括真实的目标测量Z(k)、干扰测量
Figure BDA0003589648180000035
和杂波
Figure BDA0003589648180000036
所有这些测量值都作为输入数据被输入到雷达跟踪系统中:
Figure BDA0003589648180000037
其中,φ[·]表示关联函数,该函数首先基于
Figure BDA0003589648180000038
建立一个跟踪门,并选择跟踪门内的测量值作为
Figure BDA0003589648180000039
表示被怀疑来自被跟踪目标的测量集,由此得出雷达跟踪系统在第k个干扰阶段的状态估计:
Figure BDA00035896481800000310
其中,g[·]表示增益函数;
步骤二:建立RGPO干扰策略的优化模型
定义ξ(k)表示真实目标在第k个干扰阶段是否摆脱跟踪波门:
Figure BDA00035896481800000311
其中,ξ(k)=1表示真实目标已经摆脱跟踪波门,ξ(k)=0表示真实目标还没有摆脱跟踪波门;
设(x(k),y(k))和
Figure BDA00035896481800000312
分别代表真实目标在第k个干扰阶段的位置的笛卡尔坐标和速度,
Figure BDA00035896481800000313
Figure BDA00035896481800000314
分别表示在第k个干扰阶段对真实目标的位置笛卡尔坐标和速度的估计,假设真实目标在第k个干扰阶段X(k)的状态向量和在第k个干扰阶段雷达跟踪系统对目标的状态估计
Figure BDA00035896481800000315
分别为:
Figure BDA00035896481800000316
Figure BDA00035896481800000317
定义第k个干扰阶段的拉离距离POD(k)为:
Figure BDA00035896481800000318
为了评价在最后的干扰阶段对于特定RGPO干扰的干扰效果,干扰效果的评分表示为以ξ(k)和POD(k)为自变量的函数:
Figure BDA0003589648180000041
其中,r代表RGPO干扰策略的评分,v[·]代表评价函数,
Figure BDA0003589648180000042
代表干扰机受控延迟的增量序列,χ=[X1,X2,...,XK]代表具有过程噪声的真实目标状态序列,W=[ω12,...,ωK]代表量测噪声序列,
Figure BDA0003589648180000043
表示杂波序列。
选择干扰策略性能的期望值E[·]作为优化目标,定义为:
Figure BDA0003589648180000044
其中,Ω代表决策空间。
对公式(14)进行简化成为:
Figure BDA0003589648180000045
其中,dlimit表示是为防止少数异常干扰结果对干扰策略平均性能的负面影响而设置的参数;
步骤三:RGPO干扰策略的优化
首先利用LHS(Latin Hypercube Sampling)采样方法得到初始化的N个粒子,并将初始化粒子中的受控延迟原始数据代入到基于CAL(Committee-based Active Learning)的模型管理中的集成代理模型中,该集成代理中一共包含三个部分,分别为多项式回归模型、RBF(Radial Basis Function)模型和Kriging模型,三个模型的输出分别记为
Figure BDA0003589648180000046
Figure BDA0003589648180000047
因此,集成代理模型的输出是所有包含的三个模型输出的加权和:
Figure BDA0003589648180000048
其中,ωi表示第i个模型的输出所对应的权重,其定义为:
Figure BDA0003589648180000049
其中,ei表示第i个模型的均方根误差。
集成代理模型的输出将成为内部PSO程序的目标函数之一,用以求出当前数据集下集成代理中的最佳解决方案,记为
Figure BDA0003589648180000051
具体公式为:
Figure BDA0003589648180000052
其中,
Figure BDA0003589648180000053
表示第t次迭代时的三个模型输出的加权和;
内部PSO的另一个目标函数描述了集成代理中任意两个模型输出之间的最大差异,记为
Figure BDA0003589648180000054
计算公式为:
Figure BDA0003589648180000055
Figure BDA0003589648180000056
为目标函数,利用内部PSO程序求出当前数据集下集成代理中的最不确定的解,记为:
Figure BDA0003589648180000057
具体公式为:
Figure BDA0003589648180000058
内部PSO程序所得到的两项输出:
Figure BDA0003589648180000059
将与初始化数据(外部PSO迭代数据)一起,作为外部PSO程序的输入。所以在外部PSO程序当中,第t次迭代中,每个粒子的位置更新如下:
Figure BDA00035896481800000510
其中,
Figure BDA00035896481800000511
表示第t次迭代,第n个粒子所对应的RGPO干扰策略,
Figure BDA00035896481800000512
表示第k个干扰阶段干扰机的受控延迟;
设粒子的个体最优为
Figure BDA00035896481800000513
全局最优为
Figure BDA00035896481800000514
则外部PSO程序的速度更新公式为:
Figure BDA00035896481800000515
其中,
Figure BDA00035896481800000516
表示第n个粒子在第t次迭代时的个体最优,αt速度更新的惯性权值,随迭代次数t线性下降,
Figure BDA00035896481800000517
Figure BDA00035896481800000518
是两个取值范围为[0,1]的随机数,c1表示粒子对自身认知的表示,作为权重系数,可以使粒子追踪其个体最优值;c2表示粒子追踪全局最优值的权重系数,
Figure BDA00035896481800000519
的计算公式如公式(24)所示:
Figure BDA00035896481800000520
其中,权重系数βt随迭代次数t从βmax到βmin呈线性下降:
Figure BDA0003589648180000061
其中,βmax表示最大惯性权重因子,βmin表示最小惯性权重因子,tmax代表最大迭代次数。
外部PSO程序所输出的每一个粒子都将基于OCBA算法竞争剩余的采样预算,并且在后续的每个分配阶段,将根据式(26)和式(27)对计算预算增量进行分配:
Figure BDA0003589648180000062
Figure BDA0003589648180000063
其中,b表示最优粒子的序号,而n和
Figure BDA0003589648180000064
则表示除最优粒子外的第n个粒子和第
Figure BDA0003589648180000065
个粒子;
Figure BDA0003589648180000066
表示截止到l+1次分配时,
Figure BDA0003589648180000067
所获得的总分配样本数;
Figure BDA0003589648180000068
分别代表
Figure BDA0003589648180000069
的采样方差,
Figure BDA00035896481800000610
分别代表
Figure BDA00035896481800000611
的采样方差,计算公式分别为:
Figure BDA00035896481800000612
Figure BDA00035896481800000613
其中,
Figure BDA00035896481800000614
分别表示
Figure BDA00035896481800000615
在第m次重采样时的评价得分,这个分配程序将循环进行,直到总预算M耗尽为止。
最终,外部PSO程序循环所得到的全局最优解,即是经过优化的最佳RGPO干扰策略。
本发明的有益效果:本发明的方法将RGPO干扰策略的优化建模为一个随机仿真优化问题,设计了一种不依赖雷达跟踪系统内部知识的干扰策略评分方案,并提出了一种基于CALPSO-OCBA的RGPO干扰策略优化算法,能够不依赖目标函数的代数描述,缓解了解空间搜索与候选解性能估计之间的冲突,克服了RGPO干扰策略定量优化的难题,相比传统随机仿真优化算法具有更高的优化效率,显著提升了干扰效果,极大地提高了干扰成功率。
附图说明
图1是RGPO干扰过程示意图。
图2是本发明提供方法的流程框图。
图3是无干扰情况下的POD和POR的仿真结果。
图4是dlimit=450的情况下不同干扰阶段POD和POR的仿真结果。
图5是dlimit=900的情况下不同干扰阶段POD和POR的仿真结果。
图6是在粒子数等于10的情况下,七种算法的迭代收敛曲线。
图7是在粒子数等于20的情况下,七种算法的迭代收敛曲线。
图8是在粒子数等于40的情况下,七种算法的迭代收敛曲线。
具体实施方式:
本发明主要采用仿真实验的方法进行验证,所有步骤、结论都在Matlab2021b上验证正确。下面就具体实施方式对本发明作进一步的详细描述。
步骤一:RGPO干扰场景建模
1.1、首先,建立雷达跟踪系统模型,并利用初始化粒子得到集成代理中的初始数据集。
如图1所示,RGPO干扰对雷达距离跟踪器的主要作用过程可以表述为:在干扰机截获到雷达信号后,迅速地复制、调制一个干扰信号并进行转发,干扰信号捕获雷达距离波门后,当目标每被雷达照射一次,干扰机就增加受控延迟时间,让雷达距离波门逐渐随着干扰信号移动,当距离波门被拖引到足够安全的距离后,干扰机就会关闭,令雷达丢失跟踪目标。对于干扰机来说,一个跟踪帧可以看做是一个干扰阶段,设
Figure BDA0003589648180000071
表示第
Figure BDA0003589648180000072
个干扰阶段的受控延迟的增量,K表示干扰阶段的总数。因此,在第k个干扰阶段的干扰机信号受控延迟τk可以表示为:
Figure BDA0003589648180000073
因此,在第k个干扰阶段,真实目标与假目标之间的距离dk可以表示为:
Figure BDA0003589648180000081
其中,c代表光速。
1.2、设真实目标的状态方程为:
X(k)=f[k,X(k-1)]+ψ[k,X(k-1),v[X(k-1)]] (32)
其中,X(k)代表第k个干扰阶段真实目标的状态向量;X(k-1)代表第k-1个干扰阶段真实目标的状态向量;f[·]代表当前阶段状态与未来阶段状态之间的状态转换函数;v[·]代表过程噪声序列;ψ[·]代表过程噪声的分布函数。
因此,在第k个干扰阶段假目标的状态
Figure BDA0003589648180000082
可以表示为:
Figure BDA0003589648180000083
其中,θ[·]是将dk投影到状态空间中的投影函数。
此时,雷达跟踪系统对真实目标和量测值Z(k)和干扰量测值
Figure BDA0003589648180000084
可以分别表示为式(34)和式(35):
Z(k)=h(k,X(k))+ω[k,X(k)] (34)
Figure BDA0003589648180000085
其中,h[·]为测量函数;ω[·]表示测量噪声序列。
1.3、典型雷达跟踪系统的数据过程可以分为以下三步:
Figure BDA0003589648180000086
其中,
Figure BDA0003589648180000087
表示对第k个干扰阶段状态的一步预测,
Figure BDA0003589648180000088
表示雷达跟踪系统在第k-1个干扰阶段的状态估计,
Figure BDA0003589648180000089
表示雷达跟踪系统的一步预测函数。雷达在第k个干扰阶段所接收到的数据包括真实的目标测量Z(k)、干扰测量
Figure BDA00035896481800000810
和杂波
Figure BDA00035896481800000811
所有这些测量值都作为输入数据被输入到雷达跟踪系统中:
Figure BDA00035896481800000812
其中,φ[·]表示关联函数,该函数首先基于
Figure BDA00035896481800000813
建立一个跟踪门,并选择跟踪门内的测量值作为
Figure BDA00035896481800000814
表示被怀疑来自被跟踪目标的测量集,由此可以得出雷达跟踪系统在第k个干扰阶段的状态估计:
Figure BDA0003589648180000091
其中,
Figure BDA0003589648180000092
表示雷达跟踪系统在第k个干扰阶段的状态估计,g[·]表示增益函数。
通过公式(37)和(38),可以发现干扰量测值
Figure BDA0003589648180000093
会混淆雷达跟踪系统的状态估计。然而,不同干扰策略下的干扰量测对雷达跟踪的影响差异很大。如果干扰量测
Figure BDA0003589648180000094
没有混合进入跟踪门,干扰量测几乎不会影响雷达跟踪。相反,如果干扰量测
Figure BDA0003589648180000095
混合到跟踪门中,那么使用干扰测量
Figure BDA0003589648180000096
所携带的错误的距离信息进行状态估计,就会导致
Figure BDA0003589648180000097
的误差。由干扰测量
Figure BDA0003589648180000098
引起的
Figure BDA0003589648180000099
中的误差分量并不限于当前的第k个干扰阶段,如公式(36)所示,
Figure BDA00035896481800000910
将作为第k+1个干扰阶段状态预测的历史数据。因此,由
Figure BDA00035896481800000911
引起的
Figure BDA00035896481800000912
中的误差分量将传播到第k+1个干扰阶段状态的一步预测,这也意味着第k+1个干扰阶段的跟踪门中心将会比无干扰情况下偏移更远。
步骤二:建立RGPO干扰策略的优化模型
2.1、一般情况下,对RGPO干扰结果的评价主要取决于两点:
①真实目标是否离开跟踪门。
②波门拉离距离POD(The pull-off distance),即在一定探测帧数内距离门拖引干扰把雷达距离波门中心拖移真目标位置的距离。
所以在本发明中也利用这两项指标对干扰结果进行评价。
定义ξ(k)表示真实目标在第k个干扰阶段是否摆脱跟踪波门,其定义如下:
Figure BDA00035896481800000913
式中,ξ(k)=1表示真实目标已经摆脱跟踪波门,而ξ(k)=0表示真实目标还没有摆脱跟踪波门。
2.2、设(x(k),y(k))和
Figure BDA00035896481800000914
分别代表真实目标在第k个干扰阶段的位置的笛卡尔坐标和速度,
Figure BDA00035896481800000915
Figure BDA00035896481800000916
分别表示在第k个干扰阶段对真实目标的位置笛卡尔坐标和速度的估计。假设真实目标在第k个干扰阶段X(k)的状态向量和在第k个干扰阶段雷达跟踪系统对目标的状态估计
Figure BDA00035896481800000917
分别为:
Figure BDA00035896481800000918
Figure BDA0003589648180000101
据此,定义第k个干扰阶段的拉离距离POD(k)为:
Figure BDA0003589648180000102
2.3、根据2.1和2.2中所定义的两个函数,为了评价在最后的干扰阶段对于特定RGPO干扰的干扰效果,干扰效果的评分可以表示为以ξ(k)和POD(k)为自变量的函数:
Figure BDA0003589648180000103
其中,r代表RGPO干扰策略的评分,v[·]代表评价函数,
Figure BDA0003589648180000104
代表干扰机受控延迟的增量序列,χ=[X1,X2,...,XK]代表具有过程噪声的真实目标状态序列,W=[ω12,...,ωK]代表量测噪声序列,
Figure BDA0003589648180000105
表示杂波序列。
2.4、因为公式(14)中的自变量都是随机变量,所以干扰策略的评价得分也是随机的。因此,选择干扰策略性能的期望值E[·]作为优化目标,定义为:
Figure BDA0003589648180000106
其中,Ω代表决策空间。
2.5、对于干扰机来说,POD(k)并不容易得到,所以要对公式(43)进行简化成为:
Figure BDA0003589648180000107
其中,dlimit表示是为防止少数异常干扰结果对干扰策略平均性能的负面影响而设置的参数。
步骤三:RGPO干扰策略的优化
针对RGPO干扰策略,本发明提出了CALPSO-OCBA优化算法对其进行优化。CALPSO-OCBA的主体包括三个部分:外部PSO、基于OCBA的采样预算分配和基于CAL(Committee-based Active Learning)的模型管理。外部PSO用于搜索解空间并生成N个候选解。OCBA用于分配采样预算用以估计这些候选解决方案的适应性。而基于CAL的模型管理则用于提供最好的解决方案和最不确定的解决方案以协助粒子更新。具体流程如图2所示。
首先,利用LHS采样方法得到初始化的N个粒子。
3.1、算法迭代开始:
首先将初始数据代入到基于CAL的模型管理中的集成代理模型中,形成集成代理的训练数据集。该集成代理中一共包含三个部分,分别为多项式回归模型、RBF模型和Kriging模型,三个模型的输出分别记为
Figure BDA0003589648180000111
因此,集成代理模型的输出是所有包含的三个模型输出的加权和:
Figure BDA0003589648180000112
其中,ωi表示第i个模型的输出所对应的权重,其定义为:
Figure BDA0003589648180000113
其中,ei表示第i个模型的均方根误差。
3.2、集成代理模型的输出将成为内部PSO程序的目标函数之一,用以求出初始数据集下集成代理中的最佳解决方案,记为
Figure BDA0003589648180000114
具体公式为:
Figure BDA0003589648180000115
内部PSO的另一个目标函数描述了集成代理中任意两个模型输出之间的最大差异,记为
Figure BDA0003589648180000116
计算公式为:
Figure BDA0003589648180000117
Figure BDA0003589648180000118
为目标函数,利用内部PSO程序求出当前数据集下集成代理中的最不确定的解,记为:
Figure BDA0003589648180000119
具体公式为:
Figure BDA00035896481800001110
3.3、内部PSO程序所得到的两项输出:
Figure BDA00035896481800001111
将与初始化粒子一起,作为外部PSO程序的输入。所以在外部PSO程序当中,第t次迭代中,每个粒子的位置更新如下:
Figure BDA00035896481800001112
其中,
Figure BDA00035896481800001113
代表第t次迭代,第n个粒子所对应的RGPO干扰策略。
Figure BDA00035896481800001114
表示第k个干扰阶段干扰机的受控延迟。设粒子的个体最优为
Figure BDA00035896481800001115
全局最优为
Figure BDA00035896481800001116
则外部PSO程序的速度更新公式为:
Figure BDA0003589648180000121
其中,
Figure BDA0003589648180000122
表示第n个粒子在第t次迭代时的个体最优,αt速度更新的惯性权值,随迭代次数t线性下降,
Figure BDA0003589648180000123
Figure BDA0003589648180000124
是两个取值范围为[0,1]的随机数,c1是粒子对自身认知的表示,作为权重系数,可以使粒子追踪其个体最优值;c2则是粒子追踪全局最优值的权重系数,
Figure BDA0003589648180000125
的计算公式如公式(53)所示
Figure BDA0003589648180000126
权重系数βt随迭代次数t从βmax到βmin呈线性下降:
Figure BDA0003589648180000127
其中,βmax表示最大惯性权重因子,βmin表示最小惯性权重因子,tmax代表最大迭代次数。
3.4、接下来,外部PSO程序所输出的每一个粒子都将基于OCBA算法竞争剩余的采样预算,根据式(55)和式(56)对计算预算增量进行分配:
Figure BDA0003589648180000128
Figure BDA0003589648180000129
其中,b表示最优粒子的序号,而n和
Figure BDA00035896481800001210
则表示除最优粒子外的第n个粒子和第
Figure BDA00035896481800001211
个粒子。
Figure BDA00035896481800001212
表示截止到l+1次分配时,
Figure BDA00035896481800001213
所获得的总分配样本数。
Figure BDA00035896481800001214
分别代表
Figure BDA00035896481800001215
的采样方差,
Figure BDA00035896481800001216
分别代表
Figure BDA00035896481800001217
的采样方差,计算公式分别为:
Figure BDA00035896481800001218
Figure BDA0003589648180000131
其中,
Figure BDA0003589648180000132
表示
Figure BDA0003589648180000133
在第m次重采样时的评价得分。
然后,根据OCBA算法分配剩余的采样运算,并求解出得到的所有候选解的最终样本均值,更新外部PSO程序的粒子的个体最优为
Figure BDA0003589648180000134
全局最优为
Figure BDA0003589648180000135
同时,将本次迭代生成的最优解
Figure BDA0003589648180000136
及其采样均值
Figure BDA0003589648180000137
添加到集成代理中的训练数据集中,对数据集进行更新。
判断迭代次数是否达到了最大迭代次数,若未达到最大迭代次数,则重复步骤3.1至步骤3.4;若已达到最大迭代次数,则输出外部PSO程序循环所得到的全局最优解,迭代结束。
最终,外部PSO程序循环所得到的全局最优解,就是经过优化的最佳RGPO干扰策略。
本实施例中,定义在所有重采样过程中真实目标摆脱跟踪门的比值为脱离率(POR),并以POD和POR为指标检验RGPO干扰策略的具体干扰效果。
本发明的效果通过以下仿真对比试验进一步说明:
仿真场景:
为了评价所提出的RGPO干扰策略优化算法,首先采用近恒速(CV)模型和卡尔曼滤波-概率数据关联(KF-PDA)作为目标的运动模型和跟踪方法。模型的具体参数如表1所示。
表1
Figure BDA0003589648180000138
在仿真场景建立后,需要建立RGPO干扰策略的评价模型。在这里设K=15,dlimit=900,以公式(16)的期望作为对干扰策略的评价函数。随后,初始化RGPO干扰策略,并利用CALPSO-OCBA算法进行优化,该算法的主要参数如表2所示。
表2
Figure BDA0003589648180000141
经过CALPSO-OCBA算法对干扰策略的优化,最终可以得出最优的RGPO干扰策略。
为了进一步测试所提出的算法的具体干扰效果,选择经CALPSO-OCBA算法进行50次蒙特卡洛后,所得到的50个优化干扰策略中评价函数中位数值所代表的干扰策略,以POD和POR为指标检验所得到的RGPO干扰策略的具体干扰效果。如图3、图4和图5所示,分别代表了CALPSO-OCBA算法在无干扰、dlimit=450、dlimit=900的情况下RGPO干扰策略的POD箱线图和POR的曲线。
从图3可以看到,POR曲线的值几乎都为0,POD也趋于收敛,这意味着当没有干扰时,雷达对真实目标的跟踪非常稳定;从图4可以发现,随着图中干扰阶段的增加,POR逐渐增加,最终达到接近30%。同时,POD的箱线图逐渐发散,其上四分位数最终超过600m,这些结果表明,在该干扰策略下,被攻击雷达跟踪系统的可靠性显著降低,同时,干扰效果随着干扰阶段的增加而逐渐增加的趋势,也与RGPO干扰的原理相一致;与图4相比,图5中的POR值稍有下降,而POD的最大值却在增大,这是因为dlimit会干扰所生成的干扰策略的POD和POR之间的平衡。
本发明与PSO-OCBA(Optimal Computing Budget Allocation-based ParticleSwarm Optimization)进行对比:为了展示基于CAL的模型管理在CALPSO-OCBA算法中的作用。
本发明与CALPSO-OCBA-WOU(Optimal Computing Budget Allocation-basedParticle Swarm Optimization and Committee-based Active Learning without theUncertainty-based Criterion)进行对比:为了展示在基于CAL的模型管理中求出当前数据集下集成代理中的最不确定的解的作用。
本发明与CALPSO-ER(Equal Resampling-based Particle Swarm Optimizationand Committee-based Active Learning)进行对比:为了证明基于OCBA的计算预算分配的效果。
本发明与CALGA-OCBA(Optimal Computing Budget Allocation-based GeneticAlgorithm and Committee-based Active Learning)和GA-OCBA(Optimal ComputingBudget Allocation-based Genetic Algorithm)进行对比:为了对比PSO与GA两种算法的寻优效果。
仿真对比试验的结果如图6、图7、图8所示。可以看到,当粒子数N从10变化到40时,CALPSO-OCBA的性能优于其他六种算法。在基于CAL的模型管理的帮助下,CALPSO-OCBA可以生成更关键的候选解,从而在不损失候选解的估计精度的情况下提高解空间的搜索能力。当粒子数量较少(即N=10)时,CALPSO-OCBA的初始性能较差,但随着迭代次数的增加,性能迅速提高。相比之下,当粒子数较大时(即N=40)时,该算法的初始性能良好,但随着迭代次数的增加,其速度很快停止改善。这是因为,当N较小时,PSO-OCBA本身的搜索能力较差,初始的集成代理模型也不够成熟,导致在迭代开始时对解空间的搜索不足。但随着迭代次数的增加,集成代理算法逐渐成熟,该算法的搜索能力也逐渐增强。同时,当N较小时,对候选解的估计更为准确。因此,CALPSO-OCBA的性能随着迭代次数的增加而迅速提高。当粒子数量较大时,CALPSO-OCBA的初始搜索能力更强,并且可以更快地过滤出关键的候选粒子。
此外,从图6到图8可以看出,当其他算法的曲线停止增长时,CALPSO-OCBA、CALPSO-ER和CALGA-OCBA的曲线呈持续增长的趋势。这是因为,随着迭代次数的增加,集成代理模型逐渐成熟,其提出的最佳候选方案阻止了PSO和GA过早落入局部最优的陷阱,进一步证明了该算法的有效性。
综上所述,基于CALPSO-OCBA的RGPO干扰策略优化算法明显优于PSO-OCBA、CALPSO-OCBA-WOU、CALPSO-ER、PSO-ER、CALGA-OCBA和GA-OCBA。

Claims (1)

1.一种基于随机仿真优化的距离门拖引干扰方法,包括如下步骤:
步骤一:RGPO干扰场景建模,
Figure FDA0003589648170000011
表示第
Figure FDA0003589648170000012
个干扰阶段的受控延迟的增量,K表示干扰阶段的总数,在第k个干扰阶段的干扰机信号受控延迟τk表示为:
Figure FDA0003589648170000013
在第k个干扰阶段,真实目标与假目标之间的距离dk表示为:
Figure FDA0003589648170000014
其中,c代表光速;
设真实目标的状态方程为:
X(k)=f[k,X(k-1)]+ψ[k,X(k-1),v[X(k-1)]] (3)
其中,X(k)代表第k个干扰阶段真实目标的状态向量;X(k-1)代表第k-1个干扰阶段真实目标的状态向量;f[·]代表当前阶段状态与未来阶段状态之间的状态转换函数;v[·]代表过程噪声序列;ψ[·]代表过程噪声的分布函数;
因此,在第k个干扰阶段假目标的状态
Figure FDA0003589648170000015
表示为:
Figure FDA0003589648170000016
其中,θ[·]表示将dk投影到状态空间中的投影函数。
此时,雷达跟踪系统对真实目标和假目标的状态矢量的量测值分别表示为式(5)和式(6):
Z(k)=h(k,X(k))+ω[k,X(k)] (5)
Figure FDA0003589648170000017
其中,h[·]为测量函数;ω[·]表示测量噪声序列;
雷达跟踪系统的数据过程如下:
Figure FDA0003589648170000018
其中,
Figure FDA0003589648170000019
表示对第k个干扰阶段状态的一步预测,
Figure FDA00035896481700000110
表示雷达跟踪系统在第k-1个干扰阶段的状态估计,
Figure FDA00035896481700000111
表示雷达跟踪系统的一步预测函数;
雷达在第k个干扰阶段所接收到的数据包括真实的目标测量Z(k)、干扰测量
Figure FDA0003589648170000021
和杂波
Figure FDA0003589648170000022
所有这些测量值都作为输入数据被输入到雷达跟踪系统中:
Figure FDA0003589648170000023
其中,φ[·]表示关联函数,该函数首先基于
Figure FDA0003589648170000024
建立一个跟踪门,并选择跟踪门内的测量值作为
Figure FDA0003589648170000025
表示被怀疑来自被跟踪目标的测量集,由此得出雷达跟踪系统在第k个干扰阶段的状态估计:
Figure FDA0003589648170000026
其中,g[·]表示增益函数;
步骤二:建立RGPO干扰策略的优化模型
定义ξ(k)表示真实目标在第k个干扰阶段是否摆脱跟踪波门:
Figure FDA0003589648170000027
其中,ξ(k)=1表示真实目标已经摆脱跟踪波门,ξ(k)=0表示真实目标还没有摆脱跟踪波门;
设(x(k),y(k))和
Figure FDA0003589648170000028
分别代表真实目标在第k个干扰阶段的位置的笛卡尔坐标和速度,
Figure FDA0003589648170000029
Figure FDA00035896481700000210
分别表示在第k个干扰阶段对真实目标的位置笛卡尔坐标和速度的估计,假设真实目标在第k个干扰阶段X(k)的状态向量和在第k个干扰阶段雷达跟踪系统对目标的状态估计
Figure FDA00035896481700000211
分别为:
Figure FDA00035896481700000212
Figure FDA00035896481700000213
定义第k个干扰阶段的拉离距离POD(k)为:
Figure FDA00035896481700000214
为了评价在最后的干扰阶段对于特定RGPO干扰的干扰效果,干扰效果的评分表示为以ξ(k)和POD(k)为自变量的函数:
Figure FDA0003589648170000031
其中,r代表RGPO干扰策略的评分,v[·]代表评价函数,
Figure FDA0003589648170000032
代表干扰机受控延迟的增量序列,χ=[X1,X2,...,XK]代表具有过程噪声的真实目标状态序列,W=[ω12,...,ωK]代表量测噪声序列,
Figure FDA0003589648170000033
表示杂波序列;
选择干扰策略性能的期望值E[·]作为优化目标,定义为:
Figure FDA0003589648170000034
其中,Ω代表决策空间。
对公式(14)进行简化成为:
Figure FDA0003589648170000035
其中,dlimit表示是为防止少数异常干扰结果对干扰策略平均性能的负面影响而设置的参数;
步骤三:RGPO干扰策略的优化
首先利用LHS采样方法得到初始化的N个粒子,并将初始化粒子中的受控延迟原始数据代入到基于CA的模型管理中的集成代理模型中,该集成代理中一共包含三个部分,分别为多项式回归模型、RBF模型和Kriging模型,三个模型的输出分别记为
Figure FDA0003589648170000036
Figure FDA0003589648170000037
因此,集成代理模型的输出是所有包含的三个模型输出的加权和:
Figure FDA0003589648170000038
其中,ωi表示第i个模型的输出所对应的权重,其定义为:
Figure FDA0003589648170000039
其中,ei表示第i个模型的均方根误差;
集成代理模型的输出将成为内部PSO程序的目标函数之一,用以求出当前数据集下集成代理中的最佳解决方案,记为
Figure FDA00035896481700000310
具体公式为:
Figure FDA00035896481700000311
其中,
Figure FDA0003589648170000041
表示第t次迭代时的三个模型输出的加权和;
内部PSO的另一个目标函数描述了集成代理中任意两个模型输出之间的最大差异,记为
Figure FDA0003589648170000042
计算公式为:
Figure FDA0003589648170000043
Figure FDA0003589648170000044
为目标函数,利用内部PSO程序求出当前数据集下集成代理中的最不确定的解,记为:
Figure FDA0003589648170000045
具体公式为:
Figure FDA0003589648170000046
内部PSO程序所得到的两项输出:
Figure FDA0003589648170000047
将与初始化数据一起,作为外部PSO程序的输入,所以在外部PSO程序当中,第t次迭代中,每个粒子的位置更新如下:
Figure FDA0003589648170000048
其中,
Figure FDA0003589648170000049
表示第t次迭代,第n个粒子所对应的RGPO干扰策略,
Figure FDA00035896481700000410
表示第k个干扰阶段干扰机的受控延迟;
设粒子的个体最优为
Figure FDA00035896481700000411
全局最优为
Figure FDA00035896481700000412
则外部PSO程序的速度更新公式为:
Figure FDA00035896481700000413
其中,
Figure FDA00035896481700000414
表示第n个粒子在第t次迭代时的个体最优,αt速度更新的惯性权值,随迭代次数t线性下降,
Figure FDA00035896481700000415
Figure FDA00035896481700000416
是两个取值范围为[0,1]的随机数,c1表示粒子对自身认知的表示,作为权重系数,可以使粒子追踪其个体最优值;c2表示粒子追踪全局最优值的权重系数,
Figure FDA00035896481700000417
的计算公式如公式(24)所示:
Figure FDA00035896481700000418
其中,权重系数βt随迭代次数t从βmax到βmin呈线性下降:
Figure FDA00035896481700000419
其中,βmax表示最大惯性权重因子,βmin表示最小惯性权重因子,tmax代表最大迭代次数;
外部PSO程序所输出的每一个粒子都将基于OCBA算法竞争剩余的采样预算,并且在后续的每个分配阶段,将根据式(26)和式(27)对计算预算增量进行分配:
Figure FDA0003589648170000051
Figure FDA0003589648170000052
其中,b表示最优粒子的序号,而n和
Figure FDA0003589648170000053
则表示除最优粒子外的第n个粒子和第
Figure FDA0003589648170000054
个粒子;
Figure FDA0003589648170000055
表示截止到l+1次分配时,
Figure FDA0003589648170000056
所获得的总分配样本数;
Figure FDA0003589648170000057
分别代表
Figure FDA0003589648170000058
的采样方差,
Figure FDA0003589648170000059
分别代表
Figure FDA00035896481700000510
的采样方差,计算公式分别为:
Figure FDA00035896481700000511
Figure FDA00035896481700000512
其中,
Figure FDA00035896481700000513
分别表示
Figure FDA00035896481700000514
在第m次重采样时的评价得分,这个分配程序将循环进行,直到总预算M耗尽为止;
最终,外部PSO程序循环所得到的全局最优解,即是经过优化的最佳RGPO干扰策略。
CN202210373255.7A 2022-04-11 2022-04-11 一种基于随机仿真优化的距离门拖引干扰方法 Active CN114722710B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210373255.7A CN114722710B (zh) 2022-04-11 2022-04-11 一种基于随机仿真优化的距离门拖引干扰方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210373255.7A CN114722710B (zh) 2022-04-11 2022-04-11 一种基于随机仿真优化的距离门拖引干扰方法

Publications (2)

Publication Number Publication Date
CN114722710A CN114722710A (zh) 2022-07-08
CN114722710B true CN114722710B (zh) 2023-02-24

Family

ID=82243411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210373255.7A Active CN114722710B (zh) 2022-04-11 2022-04-11 一种基于随机仿真优化的距离门拖引干扰方法

Country Status (1)

Country Link
CN (1) CN114722710B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113835069B (zh) * 2021-09-22 2023-09-22 电子科技大学 一种距离门拖引干扰的智能生成方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105137396A (zh) * 2015-08-24 2015-12-09 电子科技大学 一种smsp干扰和c&i干扰的检测方法
CN109633624A (zh) * 2019-01-07 2019-04-16 西安电子科技大学 基于滤波数据处理的rgpo干扰鉴别方法
CN112213698A (zh) * 2020-10-09 2021-01-12 合肥工业大学 一种基于稀疏表示分类的欺骗干扰识别方法
CN113835069A (zh) * 2021-09-22 2021-12-24 电子科技大学 一种距离门拖引干扰的智能生成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105137396A (zh) * 2015-08-24 2015-12-09 电子科技大学 一种smsp干扰和c&i干扰的检测方法
CN109633624A (zh) * 2019-01-07 2019-04-16 西安电子科技大学 基于滤波数据处理的rgpo干扰鉴别方法
CN112213698A (zh) * 2020-10-09 2021-01-12 合肥工业大学 一种基于稀疏表示分类的欺骗干扰识别方法
CN113835069A (zh) * 2021-09-22 2021-12-24 电子科技大学 一种距离门拖引干扰的智能生成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种距离门拖引干扰策略的智能生成方法;贾瑞 等;《信号处理》;第37卷(第2期);276-283 *

Also Published As

Publication number Publication date
CN114722710A (zh) 2022-07-08

Similar Documents

Publication Publication Date Title
Wang et al. A stochastic simulation optimization-based range gate pull-off jamming method
Sichkar Reinforcement learning algorithms in global path planning for mobile robot
US20140025613A1 (en) Apparatus and methods for reinforcement learning in large populations of artificial spiking neurons
CN113627606A (zh) 一种基于改进粒子群算法的rbf神经网络优化方法
Dan et al. A robust D–S fusion algorithm for multi-target multi-sensor with higher reliability
CN112904290A (zh) 一种雷达智能认知抗干扰策略的生成方法
CN114722710B (zh) 一种基于随机仿真优化的距离门拖引干扰方法
Zhao et al. Mutation grey wolf elite PSO balanced XGBoost for radar emitter individual identification based on measured signals
Wang et al. Strategy optimization for range gate pull-off track-deception jamming under black-box circumstance
CN111061165B (zh) 一种船舶相对碰撞危险度模型的验证方法
CN110880031A (zh) 基于融合随机黑洞策略的灰狼优化算法的特征选择方法
CN109936568A (zh) 一种基于循环神经网络的防恶意攻击传感器数据采集方法
CN114281103B (zh) 一种零交互通信的飞行器集群协同搜索方法
CN116432514A (zh) 无人机攻防博弈的拦截意图识别策略仿真系统及方法
CN114608585A (zh) 一种移动机器人同步定位与建图方法及装置
CN113296089B (zh) 用于多预警机目标跟踪系统的lmb密度融合方法及装置
CN113379063A (zh) 基于在线增强学习模型的全流程任务时序智能决策方法
CN116859350A (zh) 一种基于无人机的组网雷达距离门联合拖引干扰方法
Shi et al. Multisensor distributed out-of-sequence-tracks fusion with track origin uncertainty
Gu et al. A game theory approach to attack-defense strategy for perception of connected vehicles
CN117928559B (zh) 一种基于强化学习的威胁规避下无人机路径规划方法
Zhang et al. Latent Maximum Entropy based Cognitive Radar Reward Function Estimation With Non-ideal Observations
Škach et al. Efficient active fault diagnosis using adaptive particle filter
Goldfrank et al. Risk Reduction in Target Motion Analysis Using Approximate Dynamic Programming
Wang et al. Q learning based on self-organizing fuzzy radial basis function network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant