CN113238219B - 一种适用于rsn在目标跟踪任务中的波形优化方法 - Google Patents

一种适用于rsn在目标跟踪任务中的波形优化方法 Download PDF

Info

Publication number
CN113238219B
CN113238219B CN202110543132.9A CN202110543132A CN113238219B CN 113238219 B CN113238219 B CN 113238219B CN 202110543132 A CN202110543132 A CN 202110543132A CN 113238219 B CN113238219 B CN 113238219B
Authority
CN
China
Prior art keywords
radar
target
waveform
state
rsn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110543132.9A
Other languages
English (en)
Other versions
CN113238219A (zh
Inventor
梁菁
罗子涵
沈晓峰
徐泽楷
黄霞飞
敬芳菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110543132.9A priority Critical patent/CN113238219B/zh
Publication of CN113238219A publication Critical patent/CN113238219A/zh
Application granted granted Critical
Publication of CN113238219B publication Critical patent/CN113238219B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/66Radar-tracking systems; Analogous systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Operations Research (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明涉及波形优化技术领域,具体是一种适用于RSN在目标跟踪任务中的波形优化方法,用于解决现有技术中RSN中雷达进行独立优化导致的跟踪性能不佳,以及RSN硬件计算负荷较大,不利于系统长期运行的问题。本发明的波形优化方案用融合取代扩维,当RSN中的各个雷达完成了对目标状态的估计之后,将估计信息送往融合中心,融合中心将所有的目标状态估计误差协方差矩阵进行融合,得到维度不变的全局目标状态估计误差协方差矩阵,结合前后两个时刻RSN波形产生的熵态,最后对状态价值函数进行更新,产生相应的波形选择策略,指导雷达发射机发射下一轮的波形参数,从而提高了RSN中雷达的跟踪性能和降低了RSN硬件的计算负荷,更有利于系统的长期运行。

Description

一种适用于RSN在目标跟踪任务中的波形优化方法
技术领域
本发明涉及波形优化技术领域,更具体的是涉及一种适用于RSN在目标跟踪任务中的波形优化方法。
背景技术
雷达传感器网络(radar sensor network,RSN)是由多个可通过无线信道进行通信的雷达传感器节点组成的无线传感网络,主要应用于目标探测和目标跟踪,RSN通过发射不同类型的电磁波,利用信号处理技术分析目标回波以获取目标相关的信息,RSN具有灵活度高、覆盖面积广、系统容错性强的特点,被广泛应用于军事领域和民用领域,也是当前国内外科研机构的研究热点。
目标跟踪是指RSN对来自目标的回波信息进行处理,保持对机动目标当前时刻运动状态参数的估计,滤波算法是目标跟踪的核心技术手段,常见的滤波算法大多是基于贝叶斯框架的卡尔曼滤波器及其改进算法,可以概括为以下两个步骤:先根据现有状态和经验模型预测目标下一步的状态,然后利用RSN的实际量测值进行校正,得到目标状态参数的最优。
信息融合是指集成来自多个不同传感器的感知信息,从而产生更全面、更精确、更可靠的目标状态信息,信息融合的常用方法基本上可以概括为随机和人工智能两大类,随机类算法有卡尔曼滤波法、多贝叶斯估计法、证据推理等;人工智能类算法有模糊逻辑理论、神经网络、专家系统等,信息融合主要应用于包括军事目标的检测、定位、跟踪和识别,在民事应用领域也取得了较快的发展,主要应用领域包括图像融合、遥感和工业智能机器人等。
波形优化算法是指雷达根据环境的变化自适应地优化发射波形参数,从而达到与环境的最佳匹配,实现最大化目标信息获取,波形优化算法的关键是设计合理的准则函数及其相应的求解方案,波形优化算法主要应用于面向目标检测和目标跟踪的雷达系统,基于最大互信息熵准则或最小化均方误差准则,根据环境变化有针对性地对发射波形参数的优化。
强化学习是机器学习的一个重要分支,用于描述和解决智能体在与环境交互过程中通过学习策略以达成长期回报最大化或实现特定目标的问题,强化学习的关键要素为:策略、奖励、值函数和环境模型,强化学习能够针对具体问题得到一个最优的策略,使得按照该策略选择的行为序列能够获得最大的奖励,强化学习主要应用于通信系统、机器人、智能交通、自动驾驶、游戏和工业等领域。
传统雷达的工作模式是通过发射一种或者某几种固定的波形来照射目标,然后通过雷达接受机的自适应信号处理技术来最大化目标信息,随着目标机动性的不断提高,传统的雷达工作模式已经很难在复杂多变的战场环境下完成目标探测、跟踪等任务,得益于数字任意信号发射器的发展,实时发射波形优化设计得以实现,如何利用雷达接收机获取到的目标信息按照特定的准则指导雷达发射机波形的发射,形成雷达与环境(目标)的闭环智能交互结构是下一代智能化雷达的研究重点。
在目标跟踪任务中,现有的波形优化技术方法大多是针对单雷达系统,即雷达接收机中的贝叶斯滤波器根据获取到的目标量测信息完成目标状态估计更新之后,基于最大互信息熵准则或者最小化均方误差准则,设计关于当前时刻发射波形参数的奖励函数以评估其对目标跟踪的性能,最后利用动态规划方法,在与目标的交互过程中不断优化波形参数的选择策略以适应当前的机动目标,提高系统的跟踪性能。
对于现有的RSN波形优化的技术方案,主要分为两类:第一类是采用分布式融合的结构,将RSN中的每台雷达按照单雷达系统的方案独立地进行波形优化,形成局部航迹送往融合中心,最后由融合中心对局部航迹进行融合处理得到全局航迹,这一类技术方法的缺点在于RSN中每台雷达的波形优化都是针对局部航迹进行的,只关注自身获取到的目标信息最大化,而不是从系统的角度与其他雷达进行联合优化,最大化整个系统获取到的目标信息;第二类是采用集中式融合的结构,将RSN中所有雷达获取到的目标量测信息送往融合中心,融合中心按照并行滤波的形式对量测信息进行扩维(以向量的形式进行维度扩充),相应的目标状态估计误差状态估计误差的维度也会增大,然后再按照单雷达系统的波形优化流程对RSN中所有的雷达发射波形进行联合优化,虽然这类方案能够对RSN中所有雷达波形进行联合优化,但是当RSN中雷达数量增加时,融合中心对量测信息扩充的维度也会随之增加,单个雷达的不精确测量很容易影响扩充后的目标状态估计状态估计误差,导致系统的稳定性降低,且贝叶斯滤波器对目标状态的估计以及波形奖励函数的计算量显著增加,尤其是对高维矩阵的求逆,导致雷达硬件的计算负荷大幅增加。
综上,针对上述两类目标跟踪任务中的RSN波形优化技术方案,第一类计算负荷小,但是由于RNS中的雷达波形优化是针对局部航迹独立进行的,所以从RSN系统的角度来看,融合后得到的全局航迹精度欠佳;第二类RSN系统跟踪性能较好,但是随着RSN中雷达数量的不断增加,量测相关的向量和矩阵维度也将随之增大,导致RSN硬件计算负荷较大,不利于系统的长期运行。为了解决上述问题,我们特别提出了一种适用于RSN在目标跟踪任务中的波形优化方法。
发明内容
基于以上问题,本发明提供了一种适用于RSN在目标跟踪任务中的波形优化方法,用于解决现有技术中RSN中雷达进行独立优化导致的跟踪性能不佳,以及随着RSN中雷达数量的不断增加,RSN硬件计算负荷较大,不利于系统的长期运行的问题。本发明中通过RSN中所有雷达为整体对波形进行联合优化,从而提高了RSN中雷达的跟踪性能,通过RSN中雷达波形进行联合优化,用信息融合的手段代替了传统的扩维方法,从而降低了RSN硬件的计算负荷,更有利于系统的长期运行。
本发明为了实现上述目的具体采用以下技术方案:
一种适用于RSN在目标跟踪任务中的波形优化方法,包括以下步骤:
步骤1:将N台雷达部署在待探测空间,执行对单个目标的跟踪任务,雷达发射机发射任意数字信号对目标进行照射,发射信号经过待测目标反射后由雷达接收机接收,经过匹配滤波器后获得k时刻关于目标运动状态的量测信息;
步骤1中所述量测信息包括目标与雷达的径向距离r,目标朝向雷达的径向速度v;
步骤1中选择给雷达发射机配备高斯包络线性调频信号,高斯包络线性调频信号的具体表达形式如下:
Figure BDA0003072086160000031
其中,Re{}表示求信号的实部,ET表示信号的能量,fc为信号的载频,π表示圆周率,
Figure BDA0003072086160000032
表示以e为底的指数函数,t表示时刻,
Figure BDA0003072086160000033
表示高斯包络线性调频信号的复包络,其计算公式如下:
Figure BDA0003072086160000034
其中,j表示虚部,λ表示脉冲持续时间,b表示调频斜率。
步骤2:第n个雷达通过接收机中的贝叶斯滤波器对目标运动状态x=[x,y,z,vx,vy,vz]T进行估计,得到相应的估计值
Figure BDA0003072086160000035
和状态估计误差协方差矩阵
Figure BDA0003072086160000036
其中,x为目标在笛卡尔坐标系下x轴的位置坐标,y为目标在笛卡尔坐标系下y轴的位置坐标,z为目标在笛卡尔坐标系下z轴的位置坐标,vx为目标在笛卡尔坐标系下x轴向的速度,vy为目标在笛卡尔坐标系下y轴向的速度,vz为目标在笛卡尔坐标系下z轴向的速度,T表示转置操作,[x,y,z,vx,vy,vz]表示由x,y,z,vx,vy,vz组成的行向量,[x,y,z,vx,vy,vz]T表示行向量的转置,即表示由x,y,z,vx,vy,vz组成的列向量;
步骤3:雷达将各自对目标的状态估计信息反馈到融合中心,融合中心接收到所有雷达的目标状态估计值
Figure BDA0003072086160000041
和状态估计误差协方差矩阵
Figure BDA0003072086160000042
后,依据序贯滤波,对所有的状态估计误差协方差矩阵
Figure BDA0003072086160000043
进行融合,得到一个考虑了所有雷达的全局状态估计误差协方差矩阵
Figure BDA0003072086160000044
Figure BDA0003072086160000045
的维度与
Figure BDA0003072086160000046
的维度一致,其中,
Figure BDA0003072086160000047
表示第n个雷达的状态估计误差协方差矩阵;
步骤3中对所有状态估计误差协方差矩阵
Figure BDA0003072086160000048
进行融合的递推公式如下:
Figure BDA0003072086160000049
Figure BDA00030720861600000410
其中,
Figure BDA00030720861600000411
表示第n+1个雷达在第k时刻的量测向量;
Figure BDA00030720861600000412
表示第n+1个雷达的量测方程
Figure BDA00030720861600000413
在第k时刻的Jacobi矩阵;
Figure BDA00030720861600000414
表示前n个雷达对目标状态的融合估计,是一个向量;
Figure BDA00030720861600000415
表示第n+1个雷达在第k时刻的量测状态估计误差,由k时刻的发射波形参数
Figure BDA00030720861600000416
所决定;
Figure BDA00030720861600000417
表示
Figure BDA00030720861600000418
矩阵的转置,
Figure BDA00030720861600000419
表示
Figure BDA00030720861600000420
矩阵的逆;上标1~n表示的是将前n个雷达的递推之后的结果,对于一开始的第一个雷达;
Figure BDA00030720861600000421
表示前n+1个雷达状态误差协方差矩阵融合的结果;
Figure BDA00030720861600000422
表示
Figure BDA00030720861600000423
的逆;
第n+1个雷达的量测方程在第k时刻的Jacobi矩阵的计算公式如下:
Figure BDA00030720861600000424
其中,
Figure BDA00030720861600000425
表示求导,
Figure BDA00030720861600000426
表示第n+1个雷达在第k时刻的量测方程,x表示目标运动状态,|表示完成求导操作后;
对于最优雷达接收机,可等效为通过高斯线性调频信号的模糊函数计算得到的克拉美罗下界,克拉美罗下界的计算公式如下:
Figure BDA00030720861600000427
其中,
Figure BDA00030720861600000428
表示k时刻第n+1台雷达接收信号的信噪比;
Figure BDA00030720861600000429
表示第n+1个雷达在第k时刻的量测协方差矩阵,由k时刻的发射波形参数
Figure BDA00030720861600000430
所决定;c表示光速;
Figure BDA00030720861600000431
表示第n+1个雷达在第k时刻发射的高斯包络线性调频信号的脉冲持续时间;
Figure BDA0003072086160000051
表示第n+
1个雷达在第k时刻发射的高斯包络线性调频信号的调频斜率;
Figure BDA0003072086160000052
表示第n+1个雷达在第k时刻发射波形的两个优化参数,由
Figure BDA0003072086160000053
Figure BDA0003072086160000054
组成。
步骤4:融合中心将k时刻融合的最后结果反馈给各个雷达中的滤波器评估器,用于指导k+1时刻的发射机波形的优化;
步骤5:雷达中的滤波器评估器根据
Figure BDA0003072086160000055
对当前时刻RSN所有雷达发射的波形参数
Figure BDA0003072086160000056
进行评估,评估的定量指标是基于最大互信息熵准则产生的,称为熵态,即熵态
Figure BDA0003072086160000057
其中,
Figure BDA0003072086160000058
表示第k个时刻1号雷达发射的波形参数,以向量的形式表示;
Figure BDA0003072086160000059
表示第k个时刻,N号雷达发射的波形参数,以向量的形式表示,det()表示计算行列式。
步骤6:将熵态Gk存入雷达中的短时记忆单元的同时,反馈给雷达发射机;
步骤7:雷达发射机接收k时刻从雷达接收机反馈过来的熵态Gk,同时取出存放在短时记忆单元中k-1时刻的熵态Gk-1,根据Gk相对于Gk-1的变化设计了一个即时奖励函数rk,若Gk小于Gk-1时,则给与一个正向奖励,反之,则给予一个负向奖励;
步骤7中即时奖励函数为:rk=log(1+|Gk-1-Gk|)sign(Gk-1-Gk);
其中,log表示以e为底的对数函数;sign(Gk-1-Gk)表示数学符号函数,Gk-1-Gk大于0,输出1,Gk-1-Gk小于0,输出-1,Gk-1-Gk等于0,输出0;|Gk-1-Gk|表示Gk-1与Gk差值的绝对值;
步骤7中假设目标状态s只在一种状态中进行切换,结果上等效于把目标状态s忽略,状态价值函数按如下形式更新qχ(ak)←qχ(ak)+β[rk+γmaxqχ(a')-qχ(ak)];
其中,β为[0,1]之间的学习系数,rk表示即时奖励函数,γ表示[0,1]之间的折扣因子;a表示波形参数集合A中的任意一个,最后选中的波形参数为a';maxqχ(a')表示从状态价值函数qχ(a)中选择k+1时刻的发射波形行为a'所能带来的最大长期期望奖励,←表示赋值。
步骤8:根据即时奖励更新状态价值函数qχ(s,a),RSN发射波形参数a=[θ11,...,θN],再按照波形选择策略χ在以后的时刻进行发射波形参数的选择,所能够得到的长期期望奖励,其中,s表示机动目标的运动状态;
步骤8中状态价值函数的计算公式为:qχ(s,a)=Eχ{Vk|Sk=s,Ak=a},表示为k时刻目标从状态s开始,RSN发射波形参数a所能得到的长期期望奖励;
其中,Sk表示k时刻目标的状态集合,Ak表示k时刻RSN波形参数的集合,
Figure BDA0003072086160000061
表示长期奖励,γ表示[0,1]之间的折扣因子,Rk表示k时刻的期望奖励。
步骤9:根据更新后的状态价值函数qχ(s,a)更新波形的选择策略π,表示当目标处于状态s时,更新后的策略χ会从波形库中选择长期期望奖励最大的波形参数作为下一个时刻发射机所发射的波形;
步骤9中选择策略χ定义为:
Figure BDA0003072086160000062
表示从波形参数集合A中找一个波形参数a使得状态价值函数qχ(s,a)的取值最大。
本发明的有益效果如下:
(1)本发明中通过RSN中所有雷达为整体对波形进行联合优化,避免了RSN中雷达进行独立优化导致的跟踪性能不佳的问题,提高了RSN中雷达的跟踪性能。
(2)本发明中通过RSN中雷达波形进行联合优化,用信息融合的手段代替了传统的扩维方法,避免了目标状态估计和波形奖励函数计算中相关向量和矩阵维度过高而导致硬件负荷增大的问题,从而能有效延长RSN的生命周期。
(3)本发明中将雷达波形优化与强化学习相结合,对于没有显示最优解的波形优化问题,转化为动态规划问题,利用强化学习从雷达与目标的不断交互过程中完成状态价值函数的更新迭代,收敛至最优的雷达波形选择策略,从而提高了系统对目标跟踪的精度。
附图说明
图1为本发明的流程图;
图2为本发明RSN对目标跟踪的仿真场景示意图;
图3为本发明三种不同方案对目标位置估计的性能比较示意图;
图4为本发明三种不同方案对目标速度估计的性能比较示意图;
图5为本发明三种不同方案熵态的比较示意图;
具体实施方式
为了本技术领域的人员更好的理解本发明,下面结合附图和以下实施例对本发明作进一步详细描述。
实施例:
如图1-5所述,其中,图2中,x-axis y-axis z-axis分别表示x、y、z坐标,L表示两个雷达之间的距离,H表示雷达距离地面的高度,R表示目标与雷达之间的径向距离;一种适用于RSN在目标跟踪任务中的波形优化方法,包括以下步骤:
步骤1:将N台雷达部署在待探测空间,执行对单个目标的跟踪任务,雷达发射机发射任意数字信号对目标进行照射,发射信号经过待测目标反射后由雷达接收机接收,经过匹配滤波器后获得k时刻关于目标运动状态的量测信息;
其中,所述量测信息包括目标与雷达的径向距离r,目标朝向雷达的径向速度v;
选择给雷达发射机配备高斯包络线性调频信号,高斯包络线性调频信号的具体表达形式如下:
Figure BDA0003072086160000071
其中,Re{}表示求信号的实部,ET表示信号的能量,fc为信号的载频,π表示圆周率,
Figure BDA0003072086160000072
表示以e为底的指数函数,t表示时刻,
Figure BDA0003072086160000073
表示高斯包络线性调频信号的复包络,其计算公式如下:
Figure BDA0003072086160000074
其中,j表示虚部,λ表示脉冲持续时间,b表示调频斜率。
步骤2:第n个雷达通过接收机中的贝叶斯滤波器对目标运动状态x=[x,y,z,vx,vy,vz]T进行估计,得到相应的估计值
Figure BDA0003072086160000075
和状态估计误差协方差矩阵
Figure BDA0003072086160000076
由于容积卡尔曼滤波器(Cubature Kalman Filter,CKF)能够很好的处理状态转移矩阵和量测矩阵为非线性的情况,且容积规则的点和权重可以脱机计算并且预先存储以加快计算速度,所以目标状态的估计采用CKF来实现;
其中,x为目标在笛卡尔坐标系下x轴的位置坐标,y为目标在笛卡尔坐标系下y轴的位置坐标,z为目标在笛卡尔坐标系下z轴的位置坐标,vx为目标在笛卡尔坐标系下x轴向的速度,vy为目标在笛卡尔坐标系下y轴向的速度,vz为目标在笛卡尔坐标系下z轴向的速度,T表示转置操作,[x,y,z,vx,vy,vz]表示由x,y,z,vx,vy,vz组成的行向量;[x,y,z,vx,vy,vz]T表示行向量的转置,即表示由x,y,z,vx,vy,vz组成的列向量;
步骤3:雷达将各自对目标的状态估计信息反馈到融合中心,融合中心接收到所有雷达的目标状态估计值
Figure BDA0003072086160000077
和状态估计误差协方差矩阵
Figure BDA0003072086160000078
后,依据序贯滤波,对所有的状态估计误差协方差矩阵
Figure BDA0003072086160000081
进行融合,得到一个考虑了所有雷达的全局状态估计误差协方差矩阵
Figure BDA0003072086160000082
Figure BDA0003072086160000083
的维度与
Figure BDA0003072086160000084
的维度一致,从全局航迹的角度来优化雷达波形的同时并不会带来高维矩阵求逆困难所引起的计算负荷过大的问题;其中,
Figure BDA0003072086160000085
表示第n个雷达的状态估计误差协方差矩阵;所谓序贯滤波是现有技术,是一种将高维数据量测更新降低为多个低维数据量测更新的方法,能够有效降低矩阵的求逆计算。
步骤3中对所有状态估计误差协方差矩阵
Figure BDA0003072086160000086
进行融合的递推公式如下:
Figure BDA0003072086160000087
Figure BDA0003072086160000088
其中,
Figure BDA0003072086160000089
表示第n+1个雷达在第k时刻的量测向量;
Figure BDA00030720861600000810
表示第n+1个雷达的量测方程
Figure BDA00030720861600000811
在第k时刻的Jacobi矩阵;
Figure BDA00030720861600000812
表示前n个雷达对目标状态的融合估计,是一个向量;
Figure BDA00030720861600000813
表示第n+1个雷达在第k时刻的量测状态估计误差,由k时刻的发射波形参数
Figure BDA00030720861600000814
所决定;
Figure BDA00030720861600000815
表示
Figure BDA00030720861600000816
矩阵的转置,
Figure BDA00030720861600000817
表示
Figure BDA00030720861600000818
矩阵的逆;上标1~n表示的是将前n个雷达的递推之后的结果,对于一开始的第一个雷达;
Figure BDA00030720861600000819
表示前n+1个雷达状态误差协方差矩阵融合的结果;
Figure BDA00030720861600000820
表示
Figure BDA00030720861600000821
的逆;这样融合得到的全局状态误差协方差矩阵就把RSN中所有雷达的波形参数
Figure BDA00030720861600000822
都被考虑了进去;
第n+1个雷达的量测方程在第k时刻的Jacobi矩阵的计算公式如下:
Figure BDA00030720861600000823
其中,
Figure BDA00030720861600000824
表示求导,
Figure BDA00030720861600000825
表示第n+1个雷达在第k时刻的量测方程,x表示目标运动状态,|表示完成求导操作后;
对于最优雷达接收机,可等效为通过高斯线性调频信号的模糊函数计算得到的克拉美罗下界,克拉美罗下界的计算公式如下:
Figure BDA00030720861600000826
其中,
Figure BDA0003072086160000091
表示k时刻第n+1台雷达接收信号的信噪比;
Figure BDA0003072086160000092
表示第n+1个雷达在第k时刻的量测协方差矩阵,由k时刻的发射波形参数
Figure BDA0003072086160000093
所决定;c表示光速;
Figure BDA0003072086160000094
表示第n+1个雷达在第k时刻发射的高斯包络线性调频信号的脉冲持续时间;
Figure BDA0003072086160000095
表示第n+1个雷达在第k时刻发射的高斯包络线性调频信号的调频斜率;
Figure BDA0003072086160000096
表示第n+1个雷达在第k时刻发射波形的两个优化参数,由
Figure BDA0003072086160000097
Figure BDA0003072086160000098
组成。
步骤4:融合中心将k时刻融合的最后结果反馈给各个雷达中的滤波器评估器,用于指导k+1时刻的发射机波形的优化;
步骤5:雷达中的滤波器评估器根据
Figure BDA0003072086160000099
对当前时刻RSN所有雷达发射的波形参数
Figure BDA00030720861600000910
进行评估,评估的定量指标是基于最大互信息熵准则产生的,称为熵态,即熵态
Figure BDA00030720861600000911
Gk的大小反映了目标对于整个RSN不确定性大小,Gk越小,目标对于RSN的不确定性就越小,滤波器对目标的估计精度就越高;
其中,
Figure BDA00030720861600000912
表示第k个时刻1号雷达发射的波形参数,以向量的形式表示;
Figure BDA00030720861600000913
表示第k个时刻,N号雷达发射的波形参数,以向量的形式表示,det()表示计算行列式。
步骤6:将熵态Gk存入雷达中的短时记忆单元的同时,反馈给雷达发射机;
步骤7:雷达发射机接收k时刻从雷达接收机反馈过来的熵态Gk,同时取出存放在短时记忆单元中k-1时刻的熵态Gk-1,熵态Gk反应的是目标相对于RSN的不确定性大小,Gk越小,目标相对于RSN的不确定性就越小,RSN对目标的状态估计误差就越小,根据Gk相对于Gk-1的变化设计了一个即时奖励函数rk,若Gk小于Gk-1时,说明k时刻发射的波形参数能够减少目标的不确定性,也就是说能够提高RSN对目标的估计精度,则给与一个正向奖励,反之,则给予一个负向奖励;若rk为正,则为正向奖励,奖励的大小为rk的数值,若rk为负,则为负向奖励,奖励的大小为rk的相反数。
步骤7中即时奖励函数为:rk=log(1+|Gk-1-Gk|)sign(Gk-1-Gk);
其中,log表示以e为底的对数函数;sign(Gk-1-Gk)表示数学符号函数,Gk-1-Gk大于0,输出1,Gk-1-Gk小于0,输出-1,Gk-1-Gk等于0,输出0;|Gk-1-Gk|表示Gk-1与Gk差值的绝对值;
步骤7中假设目标状态s只在一种状态中进行切换,结果上等效于把目标状态s忽略,状态价值函数按如下形式更新qχ(ak)←qχ(ak)+β[rk+γmaxqχ(a')-qχ(ak)];
其中,β为[0,1]之间的学习系数,rk表示即时奖励函数,γ表示[0,1]之间的折扣因子;a表示波形参数集合A中的任意一个,最后选中的波形参数为a';maxqχ(a')表示从状态价值函数qχ(a)中选择k+1时刻的发射波形行为a'所能带来的最大长期期望奖励,←表示赋值,←表示赋值(先用原先qχ(ak)的值计算完右边,在对qχ(ak)进行赋值)。
步骤8:根据即时奖励更新状态价值函数qχ(s,a),qχ(s,a)可以理解为在状态s下,RSN发射波形参数a=[θ11,...,θN],再按照波形选择策略χ在以后的时刻进行发射波形参数的选择,所能够得到的长期期望奖励,其中,s表示机动目标的运动状态;由于此处目标真实状态无法获取,所以采用了一种无状态的状态价值函数,为动态规划问题的一种特殊形式,仍然具有收敛性,即假设目标状态s只在一种状态中进行切换,结果上等效于把状态s忽略,故可按照如下形式对状态价值函数进行更新;
qχ(s,a)=Eχ{Vk|Sk=s,Ak=a},表示为k时刻目标从状态s开始,RSN发射波形参数a所能得到的长期期望奖励;
其中,Sk表示k时刻目标的状态集合,Ak表示k时刻RSN波形参数的集合,
Figure BDA0003072086160000101
表示长期奖励,γ表示[0,1]之间的折扣因子,Rk表示k时刻的期望奖励。
步骤9:根据更新后的状态价值函数qχ(s,a)更新波形的选择策略π,表示当目标处于状态s时,更新后的策略χ会从波形库中选择长期期望奖励最大的波形参数作为下一个时刻发射机所发射的波形;
步骤9中选择策略χ定义为:
Figure BDA0003072086160000102
表示从波形参数集合A中找一个波形参数a使得状态价值函数qχ(s,a)的取值最大。
如图3-5所示,通过上述方法,通过固定波形优化、本申请的波形优化方法和独立玻形优化三种不同的优选方法,从目标位置估计的性能、目标速度估计的性能和方案熵态三个比较不难知道,本申请的波形优化方案的是用融合取代扩维,从全局角度优化RSN中所有雷达波形的同时,避免了量测相关的向量和矩阵维度的增加,减轻了RSN硬件对高维矩阵的运算压力,当RSN中的各个雷达完成了对目标状态的估计之后,将估计信息送往融合中心,其中估计信息包括目标状态估计向量和目标状态估计误差协方差矩阵,融合中心将所有的目标状态估计误差协方差矩阵按照序贯滤波的思想进行融合,得到维度不变的且考虑了所有雷达的全局目标状态估计误差协方差矩阵,用于评估当前时刻RSN发射的所有波形在目标跟踪任务中的性能,评估的结果为一个定量指标-熵态,结合前后两个时刻RSN波形产生的熵态,设计了一个即时奖励函数来描述当前时刻波形相较于上一个时刻发射波形的性能,最后根据强化学习中的Q-learning方法对状态价值函数进行更新,产生相应的波形选择策略,指导雷达发射机发射下一轮的波形参数,从而提高了RSN中雷达的跟踪性能和降低了RSN硬件的计算负荷,更有利于系统的长期运行。
如上即为本发明的实施例。上述实施例以及实施例中的具体参数仅是为了清楚表述发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准。

Claims (9)

1.一种适用于RSN在目标跟踪任务中的波形优化方法,其特征在于:包括以下步骤:
步骤1:将N台雷达部署在待探测空间,执行对单个目标的跟踪任务,雷达发射机发射任意数字信号对目标进行照射,发射信号经过待测目标反射后由雷达接收机接收,经过匹配滤波器后获得k时刻关于目标运动状态的量测信息;
步骤2:第n个雷达通过接收机中的贝叶斯滤波器对目标运动状态x=[x,y,z,vx,vy,vz]T进行估计,得到相应的估计值
Figure FDA0004156616620000011
和状态估计误差协方差矩阵
Figure FDA0004156616620000012
其中,x为目标在笛卡尔坐标系下x轴的位置坐标,y为目标在笛卡尔坐标系下y轴的位置坐标,z为目标在笛卡尔坐标系下z轴的位置坐标,vx为目标在笛卡尔坐标系下x轴向的速度,vy为目标在笛卡尔坐标系下y轴向的速度,vz为目标在笛卡尔坐标系下z轴向的速度,T表示转置操作,[x,y,z,vx,vy,vz]表示由x,y,z,vx,vy,vz组成的行向量,[x,y,z,vx,vy,vz]T表示行向量的转置,即表示由x,y,z,vx,vy,vz组成的列向量;
步骤3:雷达将各自对目标的状态估计信息反馈到融合中心,融合中心接收到所有雷达的目标状态估计值
Figure FDA0004156616620000013
和状态估计误差协方差矩阵
Figure FDA0004156616620000014
后,依据序贯滤波,对所有的状态估计误差协方差矩阵
Figure FDA0004156616620000015
进行融合,得到一个考虑了所有雷达的全局状态估计误差协方差矩阵
Figure FDA0004156616620000016
Figure FDA0004156616620000017
的维度与
Figure FDA0004156616620000018
的维度一致,其中,
Figure FDA0004156616620000019
表示第n个雷达的状态估计误差协方差矩阵;
步骤4:融合中心将k时刻融合的最后结果反馈给各个雷达中的滤波器评估器,用于指导k+1时刻的发射机波形的优化;
步骤5:雷达中的滤波器评估器根据
Figure FDA00041566166200000110
对当前时刻RSN所有雷达发射的波形参数
Figure FDA00041566166200000111
进行评估,评估的定量指标是基于最大互信息熵准则产生的,称为熵态,即熵态
Figure FDA00041566166200000112
其中,
Figure FDA00041566166200000113
表示第k个时刻1号雷达发射的波形参数,以向量的形式表示;
Figure FDA00041566166200000114
表示第k个时刻,N号雷达发射的波形参数,以向量的形式表示,det()表示计算行列式;
步骤6:将熵态Gk存入雷达中的短时记忆单元的同时,反馈给雷达发射机;
步骤7:雷达发射机接收k时刻从雷达接收机反馈过来的熵态Gk,同时取出存放在短时记忆单元中k-1时刻的熵态Gk-1,根据Gk相对于Gk-1的变化设计了一个即时奖励函数rk,若Gk小于Gk-1时,则给与一个正向奖励,反之,则给予一个负向奖励;
步骤8:根据即时奖励更新状态价值函数qχ(s,a),RSN发射波形参数a=[θ11,...,θN],再按照波形选择策略χ在以后的时刻进行发射波形参数的选择,所能够得到的长期期望奖励,其中,s表示机动目标的运动状态;
步骤9:根据更新后的状态价值函数qχ(s,a)更新波形的选择策略χ,表示当目标处于状态s时,更新后的策略χ会从波形库中选择长期期望奖励最大的波形参数作为下一个时刻发射机所发射的波形;
所述步骤7中的即时奖励函数为:rk=log(1+|Gk-1-Gk|)sign(Gk-1-Gk);
其中,log表示以e为底的对数函数;sign(Gk-1-Gk)表示数学符号函数,Gk-1-Gk大于0,输出1,Gk-1-Gk小于0,输出-1,Gk-1-Gk等于0,输出0;|Gk-1-Gk|表示Gk-1与Gk差值的绝对值。
2.根据权利要求1所述的一种适用于RSN在目标跟踪任务中的波形优化方法,其特征在于:步骤1中所述量测信息包括目标与雷达的径向距离r,目标朝向雷达的径向速度v。
3.根据权利要求1所述的一种适用于RSN在目标跟踪任务中的波形优化方法,其特征在于:步骤1中选择给雷达发射机配备高斯包络线性调频信号,高斯包络线性调频信号的具体表达形式如下:
Figure FDA0004156616620000021
其中,Re{}表示求信号的实部,ET表示信号的能量,fc为信号的载频,π表示圆周率,
Figure FDA0004156616620000022
表示以e为底的指数函数,t表示时刻,
Figure FDA0004156616620000023
表示高斯包络线性调频信号的复包络,其计算公式如下:
Figure FDA0004156616620000024
其中,j表示虚部,λ表示脉冲持续时间,b表示调频斜率。
4.根据权利要求1所述的一种适用于RSN在目标跟踪任务中的波形优化方法,其特征在于:步骤3中对所有状态估计误差协方差矩阵
Figure FDA0004156616620000025
进行融合的递推公式如下:
Figure FDA0004156616620000026
Figure FDA0004156616620000027
其中,
Figure FDA0004156616620000028
表示第n+1个雷达在第k时刻的量测向量;
Figure FDA0004156616620000029
表示第n+1个雷达的量测方程
Figure FDA0004156616620000031
在第k时刻的Jacobi矩阵;
Figure FDA0004156616620000032
表示前n个雷达对目标状态的融合估计,是一个向量;
Figure FDA0004156616620000033
表示第n+1个雷达在第k时刻的量测状态估计误差,由k时刻的发射波形参数
Figure FDA0004156616620000034
所决定;
Figure FDA0004156616620000035
表示
Figure FDA0004156616620000036
矩阵的转置,
Figure FDA0004156616620000037
表示
Figure FDA0004156616620000038
矩阵的逆;上标1~n表示的是将前n个雷达的递推之后的结果,对于一开始的第一个雷达;
Figure FDA0004156616620000039
表示前n+1个雷达状态误差协方差矩阵融合的结果;
Figure FDA00041566166200000310
表示
Figure FDA00041566166200000311
的逆。
5.根据权利要求4所述的一种适用于RSN在目标跟踪任务中的波形优化方法,其特征在于:第n+1个雷达的量测方程在第k时刻的Jacobi矩阵的计算公式如下:
Figure FDA00041566166200000312
其中,
Figure FDA00041566166200000313
表示求导,
Figure FDA00041566166200000314
表示第n+1个雷达在第k时刻的量测方程,x表示目标运动状态,|表示完成求导操作后。
6.根据权利要求5所述的一种适用于RSN在目标跟踪任务中的波形优化方法,其特征在于:对于最优雷达接收机,可等效为通过高斯线性调频信号的模糊函数计算得到的克拉美罗下界,克拉美罗下界的计算公式如下:
Figure FDA00041566166200000315
其中,
Figure FDA00041566166200000316
表示k时刻第n+1台雷达接收信号的信噪比;
Figure FDA00041566166200000317
表示第n+1个雷达在第k时刻的量测协方差矩阵,由k时刻的发射波形参数
Figure FDA00041566166200000318
所决定;c表示光速;
Figure FDA00041566166200000319
表示第n+1个雷达在第k时刻发射的高斯包络线性调频信号的脉冲持续时间;
Figure FDA00041566166200000320
表示第n+1个雷达在第k时刻发射的高斯包络线性调频信号的调频斜率;
Figure FDA00041566166200000321
表示第n+1个雷达在第k时刻发射波形的两个优化参数,由
Figure FDA00041566166200000322
Figure FDA00041566166200000323
组成。
7.根据权利要求1所述的一种适用于RSN在目标跟踪任务中的波形优化方法,其特征在于:步骤7中假设目标状态s只在一种状态中进行切换,结果上等效于把目标状态s忽略,状态价值函数按如下形式更新qχ(ak)←qχ(ak)+β[rk+γmax qχ(a′)-qχ(ak)];
其中,β为[0,1]之间的学习系数,rk表示即时奖励函数,γ表示[0,1]之间的折扣因子;maxqχ(a')表示从状态价值函数qχ(a)中选择k+1时刻的发射波形行为a'所能带来的最大长期期望奖励,←表示赋值。
8.根据权利要求1所述的一种适用于RSN在目标跟踪任务中的波形优化方法,其特征在于:步骤8中状态价值函数的计算公式为:qχ(s,a)=Eχ{Vk|Sk=s,Ak=a},表示为k时刻目标从状态s开始,RSN发射波形参数a所能得到的长期期望奖励;
其中,Sk表示k时刻目标的状态集合,Ak表示k时刻RSN波形参数的集合,
Figure FDA0004156616620000041
表示长期奖励,γ表示[0,1]之间的折扣因子,Rk表示k时刻的期望奖励。
9.根据权利要求1所述的一种适用于RSN在目标跟踪任务中的波形优化方法,其特征在于:步骤9中选择策略χ定义为:
Figure FDA0004156616620000042
表示从波形参数集合A中找一个波形参数a使得状态价值函数qχ(s,a)的取值最大。
CN202110543132.9A 2021-05-18 2021-05-18 一种适用于rsn在目标跟踪任务中的波形优化方法 Active CN113238219B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110543132.9A CN113238219B (zh) 2021-05-18 2021-05-18 一种适用于rsn在目标跟踪任务中的波形优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110543132.9A CN113238219B (zh) 2021-05-18 2021-05-18 一种适用于rsn在目标跟踪任务中的波形优化方法

Publications (2)

Publication Number Publication Date
CN113238219A CN113238219A (zh) 2021-08-10
CN113238219B true CN113238219B (zh) 2023-05-09

Family

ID=77137502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110543132.9A Active CN113238219B (zh) 2021-05-18 2021-05-18 一种适用于rsn在目标跟踪任务中的波形优化方法

Country Status (1)

Country Link
CN (1) CN113238219B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116482673B (zh) * 2023-04-27 2024-01-05 电子科技大学 基于强化学习的分布式雷达检测跟踪一体化波形实现方法
CN117169818B (zh) * 2023-10-30 2024-02-13 哈尔滨工业大学(威海) 一种面向海面机动目标跟踪的雷达波形设计方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106256146A (zh) * 2014-06-02 2016-12-21 英特尔Ip公司 获取和使用邻近wlan信息用于lte laa操作的设备和方法
CN106257302A (zh) * 2016-07-01 2016-12-28 电子科技大学 一种杂波环境下的认知雷达目标跟踪方法
CN110780351A (zh) * 2018-07-31 2020-02-11 中国石油化工股份有限公司 纵波和转换波叠前联合反演方法及系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105246173B (zh) * 2015-08-27 2018-10-16 电子科技大学 一种适用于rsn的节点分簇方法及其融合判决方法
CN106304115A (zh) * 2016-08-26 2017-01-04 电子科技大学 一种适用于雷达传感器网络的多跳分簇方法
CN107390199B (zh) * 2017-09-20 2019-06-18 哈尔滨工业大学(威海) 一种雷达机动目标跟踪波形设计方法
US20210278549A1 (en) * 2018-08-23 2021-09-09 The Regents Of The University Of California Lane-level navigation system for ground vehicles with lidar and cellular signals
CN109581334A (zh) * 2018-11-28 2019-04-05 常州工学院 双路互相关时延估计的激光测量方法及装置
CN110221288A (zh) * 2019-05-17 2019-09-10 常州第四无线电厂有限公司 一种穿墙雷达微动目标检测方法
CN110752441A (zh) * 2019-09-09 2020-02-04 西安电子科技大学 一种收发天线及手持式穿墙雷达系统
CN110755058A (zh) * 2019-11-21 2020-02-07 中国中医科学院 腕带式医生脉象过程记录仪
CN113777575B (zh) * 2021-09-14 2023-08-25 电子科技大学长三角研究院(衢州) 应用于复杂环境中mimo雷达多目标参数估计评估方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106256146A (zh) * 2014-06-02 2016-12-21 英特尔Ip公司 获取和使用邻近wlan信息用于lte laa操作的设备和方法
CN106257302A (zh) * 2016-07-01 2016-12-28 电子科技大学 一种杂波环境下的认知雷达目标跟踪方法
CN110780351A (zh) * 2018-07-31 2020-02-11 中国石油化工股份有限公司 纵波和转换波叠前联合反演方法及系统

Also Published As

Publication number Publication date
CN113238219A (zh) 2021-08-10

Similar Documents

Publication Publication Date Title
CN113238219B (zh) 一种适用于rsn在目标跟踪任务中的波形优化方法
CN108562894B (zh) 雷达波束指向与发射功率的分配方法
CN111027692A (zh) 一种目标运动态势预测方法及装置
CN114363949B (zh) 一种用于uwb定位系统的异常数据检测方法
CN114449452A (zh) 一种异构设备室内定位算法
CN101545964B (zh) 一种基于无线传感器网络的一维定位方法及装置
CN109001694A (zh) 一种动态自适应天线扫描特性模拟方法及系统
Khan et al. Motion planning for a snake robot using double deep q-learning
Kumar et al. Sensor node tracking using semi-supervised Hidden Markov Models
Leitinger et al. Cognitive indoor positioning and tracking using multipath channel information
CN116299287A (zh) 幅度信息辅助的认知雷达跟踪波形选择方法及系统
CN115906923A (zh) 一种基于神经网络与卡尔曼滤波融合的波束角度预测方法
Ulmschneider et al. Cooperative Estimation of Maps of Physical and Virtual Radio Transmitters
Wang et al. Research on Adaptive Waveform Selection Algorithm in Cognitive Radar.
Witrisal et al. Cognitive radar for the localization of RFID transponders in dense multipath environments
Cao et al. Adaptive waveform selection algorithm based on reinforcement learning for cognitive radar
Thornton et al. Waveform selection for radar tracking in target channels with memory via universal learning
CN113311386A (zh) 基于改进卡尔曼滤波器的tdoa无线定位方法
CN113281776A (zh) 针对复杂水下动态目标的激光雷达目标智能检测仪
Tsyganov et al. Adaptive eetimation of a moving object trajectory using sequential hypothesis testing
CN113534164A (zh) 一种基于主被动联合声纳阵列的目标路径跟踪方法
US6611824B1 (en) System for bearing-only contact state estimation using recurrent neural networks
Yang et al. Radar waveform design based on multi-agent reinforcement learning
CN116482673B (zh) 基于强化学习的分布式雷达检测跟踪一体化波形实现方法
Li et al. Analysis of belief propagation based cooperative localization and target tracking schemes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant