CN114021459A - 一种小样本雷达辐射源的识别方法 - Google Patents

一种小样本雷达辐射源的识别方法 Download PDF

Info

Publication number
CN114021459A
CN114021459A CN202111306937.8A CN202111306937A CN114021459A CN 114021459 A CN114021459 A CN 114021459A CN 202111306937 A CN202111306937 A CN 202111306937A CN 114021459 A CN114021459 A CN 114021459A
Authority
CN
China
Prior art keywords
signal
source domain
network
sample
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111306937.8A
Other languages
English (en)
Inventor
武斌
李鹏
李晓虎
荆泽寰
田埂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Sensing Technology Development Co ltd
Original Assignee
Xi'an Sensing Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Sensing Technology Development Co ltd filed Critical Xi'an Sensing Technology Development Co ltd
Priority to CN202111306937.8A priority Critical patent/CN114021459A/zh
Publication of CN114021459A publication Critical patent/CN114021459A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明提供了一种小样本雷达辐射源的识别方法,包括以下步骤,利用仿真软件分别生成由三类信号类型构成的源域数据集以及由七类信号类型构成的目标域数据集;从源域数据集以及目标域数据集的每类信号中,按照设定比例随机抽取信号形成源域样本和目标域样本;构建具有六层卷积层的第一卷积网络,将源域样本进行训练迭代至设定次数后,以最优结果中的前四层卷积层以及其对应的权重构建源域网络;构建具有七层卷积层的第二卷积网络,将源域网络迁移至第二卷积网络的前四层中,以形成初始源域模型,经目标域样本训练后,形成源域模型;将小样本测试集输入源域模型中,输出雷达辐射源信号的预测识别率。

Description

一种小样本雷达辐射源的识别方法
技术领域
本发明属于信号处理技术领域,特别涉及一种小样本雷达辐射源的识别方法。
背景技术
随着电子信息领域的发展,电子对抗在电子情报侦察、电子支援和威胁告警系统中发挥着重要作用,雷达辐射源信号识别是电子对抗中的重要环节。
雷达信号识别是电子支援措施ESM(Electronic Support Measures)的一个重要领域,它通过分析侦察系统收到的雷达数据来确定敌方雷达的系统、目的和型号。一般来说,雷达信号识别可以分为基于特征的识别和基于数据的识别。基于特征的识别需要从雷达信号中提取特征,并针对这些特征精心设计分类器,而基于数据的识别可以完全保留数据中的信息。随着近年来深度学习的快速发展,许多研究者利用深度学习对雷达信号识别进行了研究。与传统的特征提取不同,深度学习可以自动提取雷达信号中的深度特征。这些特征可能是抽象的,但它们更具代表性,更适合于识别。深度学习模型可以同时学习所有的表示层,通过共同特征学习,一旦模型修改了一个内部特征,所有依赖于该特征的其他特征都会自动进行相应的调整。李雪琼等人在其发表的论文“基于注意力机制的多循环神经网络的辐射源信号识别”(IEEE Communications Letters 2020年9月第24卷第9期P2000-2004页)中提出了一种基于注意力的雷达辐射源分类方法,使用递归神经网络对雷达信号进行分类。该方法通过监督学习将若干循环神经网络分配给各个特征,学习一维雷达辐射源脉冲流的脉内调制方式,然后利用优化好的模型结构来识别测试脉冲流中感兴趣的模式,从而完成辐射源分类。该方法存在的不足之处是,注意力机制的训练依赖大量训练样本,当样本不足时,模型发生过拟合,导致分类精度不高。
发明内容
本发明提供了一种小样本雷达辐射源的识别方法,其利用迁移学习将雷达辐射源相关领域的知识迁移到样本较少的领域,获取丰富的先验知识来提高小样本情况下的雷达信号识别效率,同时使用焦点损失函数替代原有交叉熵损失函数,进一步减小网络模型过拟合现象。
为了实现上述技术效果,本发明通过以下技术方案予以实现。
一种小样本雷达辐射源的识别方法,包括以下步骤,
数据集的生成:利用仿真软件分别生成由三类信号类型构成的源域数据集以及由七类信号类型构成的目标域数据集;
所述源域数据集为信号参数变化小、形式单一的信号,所述目标域数据集为信号参数变化大、形式多样的信号;
样本的形成:从源域数据集以及目标域数据集的每类信号中,按照设定比例随机抽取信号形成源域样本和目标域样本;
源域网络的构建及训练:构建具有六层卷积层的第一卷积网络,将源域样本进行训练迭代至设定次数后,以最优结果中的前四层卷积层以及其对应的权重构建源域网络;
迁移权重知识:构建具有七层卷积层的第二卷积网络,将源域网络迁移至第二卷积网络的前四层中,以形成初始源域模型,经目标域样本训练后,形成源域模型;
小样本的识别:将小样本测试集输入源域模型中,输出雷达辐射源信号的预测识别率。
首先,本发明采用参数迁移学习方法,将相关领域的先验知识迁移到样本较少的目标领域,只利用少量样本即可完成网络训练,减轻网络过拟合程度,提高了网络的训练效率,提高了小样本情况下的辐射源识别率。
其次,本发明源域数据集和目标数据集属于同构分布,但在种类、参数变化范围和调制方式上均有难易区分,源域选取常见三类雷达信号,目标域在七种复杂体制雷达基础上进行参数细化,拓展参数变化规律及范围。
再次,本发明中,以序贯模型中经典的VGG网络模型为基础,设置六层卷积层构建源域网络,这样的网络结构更容易训练且模型易于转移和调整,设置七层卷积层构建迁移权重,保持源网络和目标网络的结构相同,权重能够正常迁移。
迁移时只选择前四层,因为CNN的低层卷积层(更接近输入的前几层)可以提取更多的一般特征,即低层包含较少的特征语义但有更多的位置信息。而分类器和卷积层中的一些高层则适用于特定的特征,包含更多的特征语义,所以高层卷积层一般与任务目标及分类相关,不适合迁移,故低层卷积层更适合作为特征提取器提取一般特征进行迁移。
作为本发明的进一步改进,所述数据集的生成中,三类信号类型分别为:线性调频信号、非线性调频信号和固定频率信号。
本技术方案中,选择这三类信号,选择信号参数变化范围小,变化形式单一的信号,选择三类信号,一是该三类信号调制类型简单,参数变化范围小,更具有一般性特征。对这三类信号进行特征学习并权重迁移更具有普适性,网络泛化能力更强
进一步地,信噪比设置为5dB,每种信号样本数量为10000个,此时的样本数量比较多,进而便于后续的训练,提高模型精准度。
作为本发明的进一步改进,所述数据集的生成中,七类信号类型分别为:线性调频信号、非线性调频信号、固定频率信号、二相编码信号、四相编码信号、二频编码信号和四频编码信号。
本技术方案中,每种信号细化到不同参数,变化范围大,信噪比设置为0Db,每种信号样本数量70个,这七类信号调制方式更加复杂,参数变化范围大,对识别有一定难度,目标网络进行迁移学习后,选取少量样本情况下的这七种信号进行训练识别,更能体现迁移学习的有效性。(即学习简单的三种信号后对少量复杂的七种信号识别效果有提升)
作为本发明的进一步改进,所述样本的形成中,还包括数据集的预处理,即对所有的目标域数据集和源域数据集的信号,先进行序列的形式处理,再对其进行归一化的预处理,使其以一维信号序列的形式输出。
本技术方案中,经过一系列处理后的数据,以一维信号序列的形式输出,是因为源网络和目标域网络均是一维卷积神经网络,要求数据格式是一维。一维数据保留了信号中的原始信息,而卷积层有卷积不变性,适合一维信号的特征提取。
作为本发明的进一步改进,所述样本包括源域训练集、源域验证集、源域测试集、目标域训练集、目标域验证集和目标域测试集。
本技术方案中,在源域和目标域中分别形成训练集、测试集和验证集,进而后续的源域网络和迁移权重知识中,能够分别在这2个网络中进行运行学习,具体地,源域在源域网络中,目标域在迁移权重知识步骤中,分别划分三种数据集在2个网络中学习可以避免参数泄露的发生,减少由于测试样本在训练集中出现导致的网络模型识别率虚高,更加客观的统计准确率。
作为本发明的进一步改进,所述源域网络的构建及训练中,具体是以源域训练集进行训练,源域验证集进行验证,进而通过源域测试集进行测试的训练,最终选出迭代优化后,测试结果最优时的源域模型,作为源域网络。
本技术方案中,在源域网络中,经过网络调参和多次实验,发现批处理数选取200个网络学习效果最好,200次迭代并不是取最后一次迭代的网络模型,而是这200多次迭代过程中最优的一次训练模型。
进一步地,所述第一卷积网络中,从上至下,卷积层的卷积核个数成倍增加,
作为本发明的进一步改进,所述迁移权重知识中,还包括源域模型的优化,具体包括网络优化算法、设置网络激活函数以及焦点损失函数的增加。
本技术方案中,通过这三个函数的增加,能够确保迁移权重后的网络模型中,在拟合程度、识别率等方面,有所提高,同时解决了神经元死亡问题,避免了梯度方向锯齿问题等。
作为本发明的进一步改进,所述网络优化算法具体为AdaGrad算法,算法表示如下:
计算梯度:
Figure BDA0003340467060000051
累计平方梯度:
Figure BDA0003340467060000052
计算更新:
Figure BDA0003340467060000053
应用更新:
θ←θ+Δθ
上述算法中,r为梯度累积变量,其初始值一般设置为0;ε为全局学习率;δ为小常数,数值稳定设置为10-7;g为梯度,θ为梯度更新值,Δθ为梯度变化量,m为输入数量,x(i)为输入,i=0,1,2,...m,y(i)为真实值,f(x(i);θ)为模型输出,L(f(x(i);θ),y(i))为模型预测与真实值之间的损失值。
本技术方案中,Adagrad将学习速率与参数相适应,对频繁参数的罕见更新和较小更新执行更大的更新,它可以为不同的变量提供不同的学习率,进而增加了罕见但信息丰富的特征的影响。
作为本发明的进一步改进,网络激活函数具体为Leaky ReLU,线性整流激活函数的数学模型表示如下:
Figure BDA0003340467060000054
ai∈(1,+∞)
式中,ai是大于1的固定常参数,值可根据网络进行调整。xi表示神经元输入值,yi表示神经元输出值。
本技术方案中,采用Leaky ReLU激活函数代替传统ReLU线性整流函数,解决神经元死亡问题,在反向传播过程中,对于ReLU激活函数输入小于零的部分,Leaky ReLU也可以计算得到梯度,避免了梯度方向锯齿问题。
作为本发明的进一步改进,所述焦点损失函数具体为:
Figure BDA0003340467060000061
其中p∈[0,1]为模型预测概率,y∈{-1,1}表示样本真实标签,在交叉熵损失函数的基础上,增加一个权重因子(1-pt)γ使其变为:
FL(pt)=-(1-pt)γlog(pt)
其中
Figure BDA0003340467060000062
pt为模型预测概率p的变形,γ≥0为专注系数。
本技术方案中,采用Focal Loss损失函数代替交叉熵损失函数,在小样本情况下重新分配难易样本所占权重比,使网络更关注难样本的学习和分类,提升网络优化性能,显著降低了网络过拟合程度,提高了识别率。进一步地,pt为模型预测概率p的变形,也可认为是模型预测概率。
附图说明
图1为本发明提供的一种小样本雷达辐射源的识别方法的流程图;
图2为本发明提供的实施例3中的流程图。
具体实施方式
下面结合附图所示的各实施方式对本发明进行详细说明,但应当说明的是,这些实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代,均属于本发明的保护范围之内。
在本实施例的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明创造和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明创造的限制
此外,术语“第一”、“第二”、“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明创造的描述中,除非另有说明,“多个”的含义是两个或两个以上。术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明创造中的具体含义。
实施例1
本实施例中,以主要核心步骤为主进行介绍。
参照附图1所示,一种小样本雷达辐射源的识别方法,包括以下步骤,
数据集的生成:利用仿真软件分别生成由三类信号类型构成的源域数据集以及由七类信号类型构成的目标域数据集;
所述源域数据集为信号参数变化小、形式单一的信号,所述目标域数据集为信号参数变化大、形式多样的信号;
样本的形成:从源域数据集以及目标域数据集的每类信号中,按照设定比例随机抽取信号形成源域样本和目标域样本;
源域网络的构建及训练:构建具有六层卷积层的第一卷积网络,将源域样本进行训练迭代至设定次数后,以最优结果中的前四层卷积层以及其对应的权重构建源域网络;
迁移权重知识:构建具有七层卷积层的第二卷积网络,将源域网络迁移至第二卷积网络的前四层中,以形成初始源域模型,经目标域样本训练后,形成源域模型;
小样本的识别:将小样本测试集输入源域模型中,输出雷达辐射源信号的预测识别率。
首先,本发明采用参数迁移学习方法,将相关领域的先验知识迁移到样本较少的目标领域,只利用少量样本即可完成网络训练,减轻网络过拟合程度,提高了网络的训练效率,提高了小样本情况下的辐射源识别率。
其次,本发明源域数据集和目标数据集属于同构分布,但在种类、参数变化范围和调制方式上均有难易区分,源域选取常见三类雷达信号,目标域在七种复杂体制雷达基础上进行参数细化,拓展参数变化规律及范围。
再次,以序贯模型中经典的VGG网络模型为基础,设置六层卷积层构建源域网络,这样的网络结构更容易训练且模型易于转移和调整,设置七层卷积层构建迁移权重,保持源网络和目标网络的结构相同,权重能够正常迁移。
迁移时只选择前四层,因为CNN的低层卷积层(更接近输入的前几层)可以提取更多的一般特征,即低层包含较少的特征语义但有更多的位置信息。而分类器和卷积层中的一些高层则适用于特定的特征,包含更多的特征语义,所以高层卷积层一般与任务目标及分类相关,不适合迁移,故低层卷积层更适合作为特征提取器提取一般特征进行迁移。
实施例2
本实施例中,结合原理以及大概的过程进行介绍。
本发明公开了一种基于迁移学习及焦点损失函数的小样本雷达辐射源识别算法,主要解决现有技术对小样本情况下网络模型过拟合问题以及数据量不足导致的识别效率低下问题。其方案为:用商用软件仿真生成源域和目标域雷达信号的数据集;将雷达数据集的信号进行归一化,分别制成训练集、验证集和测试集;分别设置六层源域一维卷积神经网络和七层目标域一维卷积神经网络;使用源域训练集信号训练源域网络并保存部分卷积层权重迁移至目标域网络,进行知识迁移后使用少量目标域训练数据训练目标域神经网络。将测试集的数据输入到训练好的目标域神经网络中,输出整体测试信号的识别率。本发明能有效利用相关领域先验知识,充分精确提取小样本雷达信号特征,提高了信号的识别率,同时极大降低了网络的训练、识别时间,降低了网络过拟合程度,具有良好的泛化性能,可用于小样本情况下复杂电磁环境的雷达信号识别。
具体地,基于迁移学习及焦点损失函数的小样本雷达辐射源识别算法,包括如下:
1)用MATLAB软件仿真生成源域数据集和目标域数据集:源域数据集由三类简单辐射源信号组成,该数据集信号包括线性调频信号、非线性调频信号、固定频率信号这三种信号,信噪比设置为5dB,每种信号样本数量为10000个;目标域数据集由七类复杂雷达辐射源信号组成,该数据集信号包括线性调频信号、非线性调频信号、固定频率信号、二相编码信号、四相编码信号、二频编码信号、四频编码信号这七种信号,其中每种信号细化到不同参数,变化范围大,信噪比设置为0Db,每种信号样本数量70个,总共490个样本。所有雷达信号的采样频率均设置为10000Hz,采样点数均设置为10000个;
上述七种不同的雷达信号,其参数设置如下:
所述18种雷达信号的采样频率均设置为10000Hz,采样点数均设置为10000个;
二频编码信号有四种载频分别为50MHz、100MHz;50MHz、75MHz;250MHz、75MHz;250MHz、50MHz;编码方式采用13位巴克码,脉宽为1us,码元宽度为0.077us;
四频编码信号有四种载频分别为100MHz、150MHz;200MHz、250MHz;编码方式采用13位巴克码,脉宽为1us,码元宽度为0.077us;
固定频率信号载频有四种分别为100MHz,110MHz,120MHz,130MHz;
线性调频信号载频为100MHz,带宽有四种分别为20MHz,25MHz,30MHz,40MHz;
非线性调频信号采用余弦调制,载频为100MHz,窗函数有两种分别为汉宁窗、布拉克曼窗;
二相编码信号载频为100MHz,编码方式有四种分别采用5位、7位、11位、13位巴克码,脉宽为1us。
四相编码信号载频为100MHz,编码方式有四种分别采用11位、13位巴克码,脉宽为1us。
2)对雷达信号进行预处理,获取训练样本和测试样本:
对1)中产生数据集的信号先以序列的形式输出,再将数据集信号进行归一化处理,并以一维信号序列的形式输出;
输出的辐射源信号源域数据集,共30000个样本中,每种信号样本集中随机抽出7000个样本作为训练集,1000个样本作为验证集,2000个样本作为测试集;输出的辐射源信号目标域数据集,共490个样本中,每种信号样本集中随机抽出50个样本作为训练集,10个样本作为验证集,10个样本作为测试集;
3)训练源域一维卷积神经网络:
3a)源域构建六层一维卷积神经网络,设置一维卷积神经网络的迭代次数为200;批处理个数200;
3b)将源域不同种类信号训练样本送入一维卷积神经网络进行训练,卷积神经网络的输入是1×10000的一维信号序列,经过1×3的卷积核
Figure BDA0003340467060000101
生成featuremaps:
Figure BDA0003340467060000102
Figure BDA0003340467060000103
Figure BDA0003340467060000104
Figure BDA0003340467060000105
上述过程中,Feature map(卷积核提取的特征图)
Figure BDA0003340467060000106
为卷积核提取特征,i=0,1,2...n表示第n层卷积层,conv1D为一维卷积核运算,A为常参数,
Figure BDA0003340467060000107
为第i层神经元输出,
Figure BDA0003340467060000108
为第i层权重,
Figure BDA0003340467060000109
为第i层偏置,α为学习率,J表示网络损失,
Figure BDA00033404670600001010
为第i个卷积核。
该公式为卷积核正向传播与反向传播过程,其中,
Figure BDA0003340467060000111
Figure BDA0003340467060000112
为训练完成后可以用于迁移的知识权重。
本实施例中,经过迭代优化网络模型,迭代次数达到200时,结束训练,丢弃一维卷积神经网络最后两层卷积层以及分类器,保存其余四层卷积层权重作为知识进行迁移。其中前四层的
Figure BDA0003340467060000113
为需要保存和迁移的权重。
迁移时只选择前四层,丢弃后面几层高层卷积以及分类器:因为CNN的低层卷积层(更接近输入的前几层)可以提取更多的一般特征,即低层包含较少的特征语义但有更多的位置信息。而分类器和卷积层中的一些高层则适用于特定的特征,包含更多的特征语义,所以高层卷积层一般与任务目标及分类相关,不适合迁移,故低层卷积层更适合作为特征提取器提取一般特征进行迁移。
4)迁移权重知识至目标域网络:
4a)构建七层一维卷积神经网络,其中前四层卷积层神经元个数及卷积核大小等参数与源域网络模型前四层卷积层相同,将3)中保存好的权重
Figure BDA0003340467060000114
进行权重加载,知识迁移。
本实施例中,具体是通过Adagrad算法,算法表示如下:
计算梯度:
Figure BDA0003340467060000115
累计平方梯度:
Figure BDA0003340467060000116
计算更新:
Figure BDA0003340467060000117
应用更新:
θ←θ+Δθ
上述算法中,r为梯度累积变量,r的初始值为0。ε为全局学习率,需要自己设置。δ为小常数,为了数值稳定大约设置为10-7
网络激活函数Leaky ReLU,表示如下:
Figure BDA0003340467060000121
ai∈(1,+∞)
Focal Loss损失函数,表示如下:
FL(pt)=-(1-pt)γlog(pt)
其中
Figure BDA0003340467060000122
为模型预测概率,y∈{-1,1}表示样本真实标签,γ≥0为专注系数。
4b)将不同种类的小样本信号的训练样本数据送入目标域网络模型,训练优化,当迭代次数达到300时,结束训练,得到训练好的网络模型;
进一步地,七层一维卷积神经网络,具体结构如下:
源域一维神经网络结构:第一层是输入层;第二层是卷积层,卷积核大小为1×3,卷积核个数为32个;第三层最大值池化层,池化大小1×2;第四层是卷积层,卷积核大小为1×3,卷积核个数为64个;第五层最大值池化层,池化大小1×2;第六层卷积层,卷积核大小为1×5,卷积核个数为128个;第七层最大值池化层,池化大小1×2;第八层卷积核大小为1×5,卷积核个数为256个;第九层最大值池化层,池化大小1×2;第十层卷积核大小为1×5,卷积核个数为256个;第十一层最大值池化层,池化大小1×2;第十二层卷积核大小为1×5,卷积核个数为512个;第十三层最大值池化层,池化大小1×2;第十四层是神经元个数为32,激活函数为Leaky ReLU的全连接层,第十五层是神经元个数为3的softmax分类层,最后一层是输出层。
目标域一维神经网络结构:输入层、前四层卷积层与池化层与源域网络参数相同。第十层卷积核大小为1×7,卷积核个数为256个;第十一层最大值池化层,池化大小1×4;第十二层卷积核大小为1×7,卷积核个数为256个;第十三层最大值池化层,池化大小1×4;第十四层卷积核大小为1×7,卷积核个数为256个;第十五层最大值池化层,池化大小1×4;第十六层是神经元个数为128,激活函数为Leaky ReLU的全连接层,第十七层是神经元个数为7的softmax分类层,最后一层是输出层。
5)将测试集的数据输入到训练好的目标域一维卷积神经网络中,输出雷达辐射源信号整体识别率。
实施例3
本实施例中,详细介绍实施例1-2的步骤。
参照附图1-2所示,本实施例中,参照图1,本发明的基于迁移学习及焦点损失函数的小样本雷达辐射源识别算法,其实现步骤如下:
步骤1:生成源域及目标域雷达信号数据集。
用MATLAB软件仿真生成源域数据集和目标域数据集:源域数据集由三类简单辐射源信号组成,该数据集信号包括线性调频信号、非线性调频信号、固定频率信号这三种信号,信噪比设置为5dB,每种信号样本数量为10000个;目标域数据集由七类复杂雷达辐射源信号组成,该数据集信号包括线性调频信号、非线性调频信号、固定频率信号、二相编码信号、四相编码信号、二频编码信号、四频编码信号这七种信号,其中每种信号细化到不同参数,变化范围大,信噪比设置为0Db,每种信号样本数量70个,总共490个样本。所有雷达信号的采样频率均设置为10000Hz,采样点数均设置为10000个;雷达辐射源详细参数如下:
二频编码信号有四种载频分别为50MHz、100MHz;50MHz、75MHz;250MHz、75MHz;250MHz、50MHz;编码方式采用13位巴克码,脉宽为1us,码元宽度为0.077us;
四频编码信号有四种载频分别为100MHz、150MHz;200MHz、250MHz;编码方式采用13位巴克码,脉宽为1us,码元宽度为0.077us;
固定频率信号载频有四种分别为100MHz,110MHz,120MHz,130MHz;
线性调频信号载频为100MHz,带宽有四种分别为20MHz,25MHz,30MHz,40MHz;
非线性调频信号采用余弦调制,载频为100MHz,窗函数有两种分别为汉宁窗、布拉克曼窗;
二相编码信号载频为100MHz,编码方式有四种分别采用5位、7位、11位、13位巴克码,脉宽为1us。
四相编码信号载频为100MHz,编码方式有四种分别采用11位、13位巴克码,脉宽为1us。
步骤2:对雷达信号进行预处理,获取训练样本和测试样本。
对步骤1产生数据集的信号先以序列的形式输出,再将数据集信号进行归一化处理,并以一维信号序列的形式输出;
输出的辐射源信号源域数据集,共30000个样本中,每种信号样本集中随机抽出7000个样本作为训练集,1000个样本作为验证集,2000个样本作为测试集;输出的辐射源信号目标域数据集,共490个样本中,每种信号样本集中随机抽出50个样本作为训练集,10个样本作为验证集,10个样本作为测试集;
步骤3:训练源域网络保存前四层卷积层权重:
3a)源域构建六层一维卷积神经网络,设置一维卷积神经网络的迭代次数为200;批处理个数200;网络参数设置如下:其中第一层卷积核大小为1×3,卷积核个数为32个;第二层卷积核大小为1×3,卷积核个数为64个;第三层卷积核大小为1×5,卷积核个数为128个;第四层卷积核大小为1×5,卷积核个数为256个;第五层卷积核大小为1×5,卷积核个数为256个;第六层卷积核大小为1×5,卷积核个数为512个;
3b)将源域不同种类信号训练样本送入一维卷积神经网络进行训练,卷积神经网络的输入是1×10000的一维信号序列,经过1×3的卷积核
Figure BDA0003340467060000141
生成featuremaps:
Figure BDA0003340467060000142
Figure BDA0003340467060000143
Figure BDA0003340467060000144
Figure BDA0003340467060000145
经过迭代优化网络模型,迭代次数达到200时,结束训练,丢弃一维卷积神经网络最后两层卷积层以及分类器,保存其余四层卷积层权重作为知识进行迁移。其中前四层的
Figure BDA0003340467060000151
为需要保存和迁移的权重。
步骤4:迁移权重知识至目标域网络:
4a)构建七层一维卷积神经网络,其中前四层卷积层神经元个数及卷积核大小等参数与源域网络模型前四层卷积层相同;第五层卷积核大小为1×7,卷积核个数为256个;第六层卷积核大小为1×7,卷积核个数为256个;第七层卷积核大小为1×7,卷积核个数为512个;加载源域权重至目标域网络模型。
4a1)设置网络优化算法AdaGrad:
常见的网络优化算法有随机梯度下降算法、小批量梯度下降算法、AdaGrad算法和AdamOptimizer算法,本实例选用AdaGrad算法,算法表示如下:
计算梯度:
Figure BDA0003340467060000152
累计平方梯度:
Figure BDA0003340467060000153
计算更新:
Figure BDA0003340467060000154
应用更新:
θ←θ+Δθ
上述算法中,r为梯度累积变量,其初始值一般设置为0;ε为全局学习率;δ为小常数,数值稳定设置为10-7;g为梯度,θ为梯度更新值,Δθ为梯度变化量,m为输入数量,x(i)为输入,i=0,1,2,...m,y(i)为真实值,f(x(i);θ)为模型输出,L(f(x(i);θ),y(i))为模型预测与真实值之间的损失值。
4a2)设置网络激活函数Leaky ReLU:
常见的激活函数有sigmoid激活函数、tanh激活函数、双曲正切激活函数、非线性单元激活函数、线性整流函数ReLU和指数线性单元激活函数,本实例选用Leaky ReLU,线性整流激活函数的数学模型表示如下:
Figure BDA0003340467060000161
ai∈(1,+∞)
式中,ai是大于1的固定常参数,值可根据网络进行调整。xi表示神经元输入值,yi表示神经元输出值。
4b)使用Focal Loss函数代替交叉熵损失函数,原有交叉熵损失函数crossentropy(CE)为:
Figure BDA0003340467060000162
其中p∈[0,1]为模型预测概率,y∈{-1,1}表示样本真实标签,在交叉熵损失函数的基础上,增加一个权重因子(1-pt)γ使其变为:
FL(pt)=-(1-pt)γlog(pt)
其中
Figure BDA0003340467060000163
γ≥0为专注系数,当一个样本被分错的时候,模型输出pt接近于0,那么调制因子1-pt接近1,损失不被影响;当样本简单易分时,模型输出pt接近1,因子1-pt接近0,那么简单易分的样本的权值就被调低了。同时专注系数γ值的选取影响损失的下降速率。因此通过调制因子可以改变难易样本对总体损失的影响,从而进一步通过减小易分样本的权重缓解网络过拟合问题。
本实施例中,采用Focal Loss损失函数代替交叉熵损失函数,在小样本情况下重新分配难易样本所占权重比,使网络更关注难样本的学习和分类,提升网络优化性能,显著降低了网络过拟合程度,提高了识别率。进一步地,pt为模型预测概率p的变形,也可认为是模型预测概率。
4c)将不同种类的小样本信号的训练样本数据送入目标域网络模型,训练优化,当迭代次数达到300时,结束训练,得到训练好的网络模型;
步骤5:将测试集的数据输入到训练好的目标域一维卷积神经网络中,输出测试信号的预测识别率。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将权利要求落在等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (10)

1.一种小样本雷达辐射源的识别方法,其特征在于,包括以下步骤,
数据集的生成:利用仿真软件分别生成由三类信号类型构成的源域数据集以及由七类信号类型构成的目标域数据集;
所述源域数据集为信号参数变化小、形式单一的信号,所述目标域数据集为信号参数变化大、形式多样的信号;
样本的形成:从源域数据集以及目标域数据集的每类信号中,按照设定比例随机抽取信号形成源域样本和目标域样本;
源域网络的构建及训练:构建具有六层卷积层的第一卷积网络,将源域样本进行训练迭代至设定次数后,以最优结果中的前四层卷积层以及其对应的权重构建源域网络;
迁移权重知识:构建具有七层卷积层的第二卷积网络,将源域网络迁移至第二卷积网络的前四层中,以形成初始源域模型,经目标域样本训练后,形成源域模型;
小样本的识别:将小样本测试集输入源域模型中,输出雷达辐射源信号的预测识别率。
2.根据权利要求1所述的一种小样本雷达辐射源的识别方法,其特征在于,所述数据集的生成中,三类信号类型分别为:线性调频信号、非线性调频信号和固定频率信号。
3.根据权利要求1所述的一种小样本雷达辐射源的识别方法,其特征在于,所述数据集的生成中,七类信号类型分别为:线性调频信号、非线性调频信号、固定频率信号、二相编码信号、四相编码信号、二频编码信号和四频编码信号。
4.根据权利要求1所述的一种小样本雷达辐射源的识别方法,其特征在于,所述样本的形成中,还包括数据集的预处理,即对所有的目标域数据集和源域数据集的信号,先进行序列的形式处理,再对其进行归一化的预处理,使其以一维信号序列的形式输出。
5.根据权利要求1所述的一种小样本雷达辐射源的识别方法,其特征在于,所述样本包括源域训练集、源域验证集、源域测试集、目标域训练集、目标域验证集和目标域测试集。
6.根据权利要求5所述的一种小样本雷达辐射源的识别方法,其特征在于,所述源域网络的构建及训练中,具体是以源域训练集进行训练,源域验证集进行验证,进而通过源域测试集进行测试的训练,最终选出迭代优化后,测试结果最优时的源域模型,作为源域网络。
所述第一卷积网络中,从上至下,卷积层的卷积核个数成倍增加。
7.根据权利要求1-6任意之一所述的一种小样本雷达辐射源的识别方法,其特征在于,所述迁移权重知识中,还包括源域模型的优化,具体包括网络优化算法、设置网络激活函数以及焦点损失函数的增加。
8.根据权利要求7所述的一种小样本雷达辐射源的识别方法,其特征在于,所述网络优化算法具体为AdaGrad算法,算法表示如下:
计算梯度:
Figure FDA0003340467050000021
累计平方梯度:
Figure FDA0003340467050000022
计算更新:
Figure FDA0003340467050000023
应用更新:
θ←θ+Δθ
上述算法中,r为梯度累积变量,其初始值一般设置为0;ε为全局学习率;δ为小常数,数值稳定设置为10-7;g为梯度,θ为梯度更新值,Δθ为梯度变化量,m为输入数量,x(i)为输入,i=0,1,2,...m,y(i)为真实值,f(x(i);θ)为模型输出,L(f(x(i);θ),y(i))为模型预测与真实值之间的损失值。
9.根据权利要求7所述的一种小样本雷达辐射源的识别方法,其特征在于,网络激活函数具体为Leaky ReLU,线性整流激活函数的数学模型表示如下式(1):
Figure FDA0003340467050000031
式(1)中,ai是大于1的固定常参数,值可根据网络进行调整。xi表示神经元输入值,yi表示神经元输出值。
10.根据权利要求7所述的一种小样本雷达辐射源的识别方法,其特征在于,所述焦点损失函数具体为:
Figure FDA0003340467050000032
式(2)中,p∈[0,1]为模型预测概率,y∈{-1,1}表示样本真实标签,在交叉熵损失函数的基础上,增加一个权重因子(1-pt)γ使其变为:
FL(pt)=-(1-pt)γlog(pt)
其中
Figure FDA0003340467050000033
pt为模型预测概率p的变形,γ≥0为专注系数。
CN202111306937.8A 2021-11-05 2021-11-05 一种小样本雷达辐射源的识别方法 Pending CN114021459A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111306937.8A CN114021459A (zh) 2021-11-05 2021-11-05 一种小样本雷达辐射源的识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111306937.8A CN114021459A (zh) 2021-11-05 2021-11-05 一种小样本雷达辐射源的识别方法

Publications (1)

Publication Number Publication Date
CN114021459A true CN114021459A (zh) 2022-02-08

Family

ID=80061639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111306937.8A Pending CN114021459A (zh) 2021-11-05 2021-11-05 一种小样本雷达辐射源的识别方法

Country Status (1)

Country Link
CN (1) CN114021459A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114564982A (zh) * 2022-01-19 2022-05-31 中国电子科技集团公司第十研究所 雷达信号调制类型的自动识别方法
CN115081487A (zh) * 2022-07-08 2022-09-20 电子科技大学 一种基于多域迁移学习的跨时间辐射源个体识别方法
CN117407785A (zh) * 2023-12-15 2024-01-16 西安晟昕科技股份有限公司 雷达信号识别模型的训练方法、雷达信号识别方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218405A (zh) * 2013-03-20 2013-07-24 西安电子科技大学 基于维数约简的集成迁移文本分类方法
CN107220606A (zh) * 2017-05-22 2017-09-29 西安电子科技大学 基于一维卷积神经网络的雷达辐射源信号的识别方法
CN108508411A (zh) * 2018-03-22 2018-09-07 天津大学 基于迁移学习的被动雷达外辐射源信号识别方法
CN110378205A (zh) * 2019-06-06 2019-10-25 西安电子科技大学 一种基于改进型cnn网络的复杂雷达辐射源识别算法
CN112098957A (zh) * 2020-09-15 2020-12-18 西安电子科技大学 基于一维自步卷积神经网络的复杂雷达辐射源识别方法
CN113156376A (zh) * 2021-04-15 2021-07-23 中国人民解放军空军航空大学 基于sacnn的雷达辐射源信号识别方法
AU2021105247A4 (en) * 2021-08-10 2021-10-07 Naval Aviation University Deep transfer learning-based method for radar HRRP target recognition with small sample size

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218405A (zh) * 2013-03-20 2013-07-24 西安电子科技大学 基于维数约简的集成迁移文本分类方法
CN107220606A (zh) * 2017-05-22 2017-09-29 西安电子科技大学 基于一维卷积神经网络的雷达辐射源信号的识别方法
CN108508411A (zh) * 2018-03-22 2018-09-07 天津大学 基于迁移学习的被动雷达外辐射源信号识别方法
CN110378205A (zh) * 2019-06-06 2019-10-25 西安电子科技大学 一种基于改进型cnn网络的复杂雷达辐射源识别算法
CN112098957A (zh) * 2020-09-15 2020-12-18 西安电子科技大学 基于一维自步卷积神经网络的复杂雷达辐射源识别方法
CN113156376A (zh) * 2021-04-15 2021-07-23 中国人民解放军空军航空大学 基于sacnn的雷达辐射源信号识别方法
AU2021105247A4 (en) * 2021-08-10 2021-10-07 Naval Aviation University Deep transfer learning-based method for radar HRRP target recognition with small sample size

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
于濛: ""基于深度学习的雷达信号识别技术研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
史冰莹等: "基于CNN的农作物病虫害图像识别模型", 《计算机系统应用》 *
张义德 等: ""基于卷积神经网络的遥感图像飞机检测"", 《光电子技术》 *
李蒙等: "数据库样本缺失下的雷达辐射源识别", 《电讯技术》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114564982A (zh) * 2022-01-19 2022-05-31 中国电子科技集团公司第十研究所 雷达信号调制类型的自动识别方法
CN114564982B (zh) * 2022-01-19 2023-09-26 中国电子科技集团公司第十研究所 雷达信号调制类型的自动识别方法
CN115081487A (zh) * 2022-07-08 2022-09-20 电子科技大学 一种基于多域迁移学习的跨时间辐射源个体识别方法
CN117407785A (zh) * 2023-12-15 2024-01-16 西安晟昕科技股份有限公司 雷达信号识别模型的训练方法、雷达信号识别方法及装置
CN117407785B (zh) * 2023-12-15 2024-03-01 西安晟昕科技股份有限公司 雷达信号识别模型的训练方法、雷达信号识别方法及装置

Similar Documents

Publication Publication Date Title
CN114021459A (zh) 一种小样本雷达辐射源的识别方法
CN110598029B (zh) 基于注意力转移机制的细粒度图像分类方法
CN110135267B (zh) 一种大场景sar图像细微目标检测方法
Rahman et al. Classification of drones and birds using convolutional neural networks applied to radar micro‐Doppler spectrogram images
CN108764006B (zh) 一种基于深度强化学习的sar图像目标检测方法
CN112883839B (zh) 基于自适应样本集构造与深度学习的遥感影像解译方法
CN110133599B (zh) 基于长短时记忆模型的智能雷达辐射源信号分类方法
CN112668579A (zh) 基于自适应亲和力和类别分配的弱监督语义分割方法
CN110082738B (zh) 基于高斯混合和张量循环神经网络的雷达目标识别方法
CN114895263A (zh) 基于深度迁移学习的雷达有源干扰信号识别方法
CN116047427B (zh) 一种小样本雷达有源干扰识别方法
CN111192240B (zh) 一种基于随机接入记忆的遥感图像目标检测方法
CN114973019A (zh) 一种基于深度学习的地理空间信息变化检测分类方法及系统
CN114170446A (zh) 一种基于深层融合神经网络的温度、亮度特征提取方法
CN111368653B (zh) 一种基于r-d图与深度神经网络的低空小目标检测方法
CN110969203B (zh) 基于自相关和cam网络的hrrp数据去冗余方法
CN116311067A (zh) 基于高维特征图谱的目标综合识别方法、装置及设备
CN115796017A (zh) 一种基于模糊理论的可解释交通认知方法
CN115409705A (zh) 一种面向sar图像目标识别模型的对抗样本生成方法
CN115393631A (zh) 基于贝叶斯层图卷积神经网络的高光谱图像分类方法
CN114296067A (zh) 基于lstm模型的脉冲多普勒雷达低慢小目标识别方法
CN114202671A (zh) 一种图像预测优化处理方法及装置
Zhang et al. A novel dilated convolutional neural network model for road scene segmentation
CN113126052A (zh) 基于逐级分段训练的高分辨距离像目标识别在线建库方法
CN117407785B (zh) 雷达信号识别模型的训练方法、雷达信号识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220208