CN115563485A - 一种基于深度学习的低复杂度干扰识别方法 - Google Patents
一种基于深度学习的低复杂度干扰识别方法 Download PDFInfo
- Publication number
- CN115563485A CN115563485A CN202211115475.6A CN202211115475A CN115563485A CN 115563485 A CN115563485 A CN 115563485A CN 202211115475 A CN202211115475 A CN 202211115475A CN 115563485 A CN115563485 A CN 115563485A
- Authority
- CN
- China
- Prior art keywords
- network
- interference
- time
- output
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000013135 deep learning Methods 0.000 title claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims abstract description 18
- 230000008569 process Effects 0.000 claims abstract description 6
- 238000010586 diagram Methods 0.000 claims description 31
- 230000006870 function Effects 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 28
- 230000004913 activation Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 230000001902 propagating effect Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 abstract description 24
- 238000004422 calculation algorithm Methods 0.000 abstract description 7
- 238000005457 optimization Methods 0.000 abstract description 4
- 238000013527 convolutional neural network Methods 0.000 description 17
- 238000013528 artificial neural network Methods 0.000 description 13
- 238000009966 trimming Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000008447 perception Effects 0.000 description 6
- 238000013139 quantization Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000007476 Maximum Likelihood Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 238000013138 pruning Methods 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 208000032365 Electromagnetic interference Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/30—Monitoring; Testing of propagation channels
- H04B17/309—Measuring or estimating channel quality parameters
- H04B17/336—Signal-to-interference ratio [SIR] or carrier-to-interference ratio [CIR]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/30—Monitoring; Testing of propagation channels
- H04B17/309—Measuring or estimating channel quality parameters
- H04B17/345—Interference values
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Electromagnetism (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Noise Elimination (AREA)
Abstract
本发明属于通信技术领域,尤其涉及一种基于深度学习的低复杂度干扰识别方法。本发明搭建的网络引入了时频分量感知的模块,在卷积提取干扰信号的时频图的特征之前,对时频分量的位置和重要的部分进行定位,并在执行卷积运算时只计算重要位置处的干扰特征,从而减少了冗余的计算;此外,为了进一步降低计算复杂度,引入了一种新的自适应前向传播算法,网络可以在推理过程中根据样本的干噪比确定前向传播的深度;使用所提出的方法有效降低了网络在干扰识别的部署成本,且计算复杂度低于现有方法,并在某些情况下低复杂度网络的识别精度甚至可以超过对应优化前的网络;本发明有显著优势,而且本发明易于实现,具有很强的应用价值。
Description
技术领域
本发明属于通信技术领域,尤其涉及无线通信抗干扰系统中干扰信号的识别方法。
背景技术
由于无线传播固有的开放性,无线通信系统容易受到电磁攻击或通信设备的相互干扰,其中敌意电磁攻击和人为干扰对通信系统的影响最大;这些非合作的电磁干扰可以极大地降低接收信噪比,从而降低通信性能并造成了大量误码,甚至当干扰信号功率较大时,通信信号会淹没在干扰信号中导致通信中断;为了解决无线通信中系统的抗干扰性能优化和提高无线通信系统的安全性和鲁棒性,许多研究者提出了多种通信抗干扰技术,包括干扰对消、干扰躲避和干扰抑制等;其中无线干扰识别(Wireless InterferenceIdentification,WII)在通信抗干扰和非协作通信系统中至关重要,因为在进行干扰抑制、干扰躲避和干扰对消之前,需要对干扰进行检测和识别,为这些抗干扰技术提供先验信息,因此无线干扰识别是无线通信抗干扰的前提和基础,它的作用是在没有任何先验信息的情况下识别接收到的干扰信号的类型,提升无线通信系统的可靠性;无线干扰识别技术在军事通信领域和民用通信领域有广泛的应用,如在军事无线通信中,无线干扰识别用于发现和识别来自非合作方的干扰信号,以及电磁频谱的感知和对截获信号的分析;在民用无线通信中,无线干扰识别技术可以通过避免用户之间的相互干扰来提高传输效率;总结而言,无线干扰识别技术应用领域广泛,例如认知无线电、频谱管理、安全通信和通信电子战等;无线干扰识别精度会影响通信系统抗干扰的性能,并且如果干扰的类型识别不准确,使得在接收端在后续的干扰抑制和干扰参数估计等技术难以提升系统的抗干扰能力,并且在干扰识别中消耗的过多的计算资源,这会极大地影响接收端处理的速度,甚至在资源有限的硬件上难以部署;因此如何实现同时具有高精度和低复杂度部署的干扰识别是识别中一个难题。
传统的无线干扰识别方法主要有基于最大似然(Maximum Likelihood,ML)的方法和基于基于特征提取(Feature Extract,FE)的方法,其中基于最大似然的方法根据贝叶斯最小误判准则构建检验统计量并与最优决策门限进行比较来获得干扰的类型,然而,该方法只能提供理论分析,因为它需要获得无线信道的特性信息,这在大多数通信场景中是难以获得的;基于特征提取的方法通常提取干扰信号的特征,包括高阶统计特性、幅度和相位等,然后根据这些信号特征应用支持向量机或者决策树的分类器进行分类,但是,这类方法由于独立的优化特征提取和分类器,造成了识别性能低,而且采用例如决策树的分类器在不同信道环境下由于很难制定统一的最优决策门限导致性能并不鲁棒。
国内外学者目前主要基于深度学习的方法识别干扰,如采用卷积神经网络(Convolutional Neural Networks,CNN),该方法通过训练神经网络使得网络可以自动提取干扰信号的特征并联合优化网络的特征提取和分类器参数,使得识别性能显著超过了传统的干扰识别方法;然而基于深度学习的方法由于存在大量的训练参数,这给低复杂度实现带来了挑战;因此目前很多学者也研究了无线干扰识别基于CNN的低复杂度部署问题,目前公开的文献采用的方法主要有:
1)基于低位宽量化的神经网络干扰识别方法:该方法通过量化神经网络的权重和激活函数降低存储资源需求,量化的神经网络通过预先定义的量化函数将权重和激活直接转换为量化值,由于不可微的量化函数,直通估计器常用于反向传播期间训练深度模型,量化的方法可以有效地减少存储资源,但此方法相比于相应的全精度网络,不可避免地会导致性能严重下降;
2)基于网络剪枝的神经网络干扰识别方法:该方法通过网络剪枝降低神经网络冗余达到低复杂度部署,实现过程中对网络中的神经元进行重要性评价,去除网络中不重要的神经元,保留重要的神经元,使得修剪后的网络输出值尽可能接近修剪前网络的输出值,期望修剪后网络和修剪前网络具有一致的性能,然而该方法修剪后的网络是非规则的,对硬件部署并不友好,有时修剪后的网络比修剪前的网络计算速度更慢,且修剪后的网络还需要微调,这使得网络需要更长的训练时间,另外修剪后的网络也会带来识别精度损失较多的不足;
3)基于轻量级架构设计的神经网络干扰识别方法:该方法通过改变网络的结构降低网络的复杂度,如残差网络使用了的短连接结构,以及近年出现的深度可分离卷积和组卷积,这些方法通过低复杂度的结构替换了高复杂度的卷积结构,使得网络整体的复杂度下降,然而神经网络的轻量级设计架构没有理论指导,往往需要大量的尝试,而且如采用了组卷积和深度可分离卷积会增加内存开销,降低运算速度,并且识别精度也会不可避免的下降;
4)基于自适应前向传播的神经网络干扰识别方法:该方法通过引入自适应前向传播(Adaptive Forward Propagation,AFP)算法降低网络计算复杂度和识别时间,自适应前向传播算法可以使得网络根据输入样本的难度自适应地决定前向传播的深度,即网络对于简单的样本通过少量层数即可识别正确,深层网络的计算将不被执行,对于较难的样本,网络将引入更多层数的计算以保证准确率,该方法实现简单,且在精度降低并不明显,计算复杂度降低明显,然而此方法中,计算复杂度仅考虑了网络深度方面,并没有考虑输入冗余,因此该方法仍有进一步降低复杂度的空间。
综合现有的基于深度学习的低复杂度无线干扰识别方法,基于低位宽量化的神经网络干扰识别方法在同时量化网络权重和激活函数时会带来严重的性能下降,难以满足高精度识别要求;基于网络剪枝的神经网络干扰识别方法和基于轻量级架构设计的神经网络干扰识别方法的方法可降低计算复杂度,然而识别精度会有损失且网络运算效率降低;基于自适应前向传播的神经网络干扰识别方法可通过动态选择网络深度,使得在降低计算复杂度的同时,识别精度损失不明显,然而该方法只考虑网络深度的这一维度,计算复杂度降低有限;因此,无论是干扰识别性能还是复杂度,现有基于深度学习的低复杂干扰识别方法还有进一步的提升空间。
发明内容
为解决现有技术的不足,本发明提供了一种基于时频分量感知的卷积神经网络(Time-frequency Component-aware Convolutional Neural Network,TFCCNN)的干扰识别方法,该网络可以极大的降低计算成本需求,且保持高识别精度;提出的TFCCNN干扰识别主要原理为:1)采用了时频分量感知模块(Time-frequency Component-aware Module,TFCAM)在使用卷积层自动提取输入干扰信号时频图的特征时,时频分量感知模块对时频分量的位置和重要的部分进行定位,并在执行每一层卷积运算时只计算这些重要的位置处的特征,因此可以大大降低计算复杂度,而且这种方法去除了输入时频图的冗余,使得网络可以专注于对重要特征的提取和学习,识别精度不但没有损失,而且在某些情况下甚至会超过传统的卷积计算结果;2)为了进一步减少计算量,本发明引入了自适应前向传播算法以进一步降低推理过程中的计算复杂度,AFP算法首先估计样本的干噪比(Interference-to-noise Ratio,INR),网络可以根据样本的INR动态地确定前向传播的深度,具体来说,当输入干扰信号样本的INR很高时,此时对应的该样本时频图非常清晰,网络只需要少量传播几个卷积层就可以得到正确的结果,因此网络可以跳过后面的卷积层操作,提前输出识别结果,相反,当输入干扰信号样本的INR较低时,对应的时频图由于噪声过大出现了模糊,网络需要更多的卷积层计算才能正确识别该样本,这样网络可以根据输入样本的INR动态地分配对应的卷积计算层数,从而避免了计算资源的浪费,进一步降低复杂度并确保了较高的识别精度。
下面给出TFCCNN干扰识别的方法。
时频分量感知的卷积神经网络在训练阶段具体步骤如下:
其中,m和k分别表示时间和频率的离散参数,NSTFT为STFT的FFT点数,w[n]为窗函数,w*[n]为窗函数的共轭表示,xi[n]为第i个干扰样本的采样数据序列,长度为N点,yi∈1,2,...,C为时频图xi对应的标签,C是干扰类的总数,N是样本个数;
S2、搭建干扰识别网络,包括时频分量感知模块、多输出层的卷积主干网络,所述时频分量感知模块用于接收xi并进行如下处理:
其中S∈R1×h×w是时频分量感知模块的输出,S中的元素是二进制值{0,1},f(·)指的是时频分量感知中的轻量级计算,σ(·)表示sigmoid函数;将S中等于1的元素定义为时频分量存在的位置和重要的部分,而将S中等于0的部分定义为对应于非重要的部分;
时频分量感知模块的输出S输入到卷积模块中进行特征提取,卷积层的输出表示为:
所述多输出层的卷积主干网络由K个卷积层堆叠而成,且包含M(M≤K)个输出层,每个输出层为全连接操作,对应的激活函数为softmax函数,M个输出层的位置分布具体为卷积主干网络最后一个卷积层后添加一个输出层,其余的M-1输出层嵌入到不同卷积层之后,且保证每个卷积层之后最多嵌入一个输出层,因此第M个输出层为最终的识别结果,其余M-1输出层为中间识别结果,输出分布表示为并设定每个输出层的干噪比门限ΩmdB,Ω1>Ω2>Ω3...>ΩM;
S3、利用训练集训练S2中搭建的干扰识别网络,设置训练循环次数为E,批量大小为B,在反向传播过程中,令时频分量感知模块的输出表示为Π1,将Π2设置为1-Π1,从而将S在反向传播时表示为其中gi表示噪声,τ是温度因子并设置为1,实现通过反向传播中更新网络的参数;采用的损失函数由稀疏损失和交叉熵组成:
其中表示第m个输出层的交叉熵,表示为其中q(xi)和pm(xi)为第i个样本xi的真实标签分布和网络第m个中间层的输出分布,稀疏损失为Ls=||S||1/(hw)-Λ,||·||1表示矩阵的一范数,Λ是控制计算复杂度的因素,α是超参数,通过反向传播更新量化网络参数,即其中θ为网络所有可训练参数,η为学习率;
令所有的输入样本经过干扰识别网络的处理并达到训练循环次数E,保存此时网络训练得到的θ,得到训练好的干扰识别网络;
S4、进行干扰识别:干扰检测设备得到干扰信号后,通过时频变换得到干扰信号的时频图,送给训练好的干扰识别网络,并通过干噪比估计模块估计该信号的干噪比,记为依次比较估计的值和每一个分类器的干噪比门限,网络的最终输出分布是第一个门限低于的输出层所得到的结果,即选择的输出层为输出的结果为
本发明的有益效果是:
本发明提供了一种基于时频分量感知的卷积神经网络的干扰识别方法,搭建的网络引入了时频分量感知的模块,在卷积提取干扰信号的时频图的特征之前,对时频分量的位置和重要的部分进行定位,并在执行卷积运算时只计算重要位置处的干扰特征,从而减少了冗余的计算;此外,为了进一步降低计算复杂度,本发明引入了一种新的自适应前向传播算法,网络可以在推理过程中根据样本的干噪比确定前向传播的深度;使用所提出的方法有效降低了网络在干扰识别的部署成本,且计算复杂度低于现有方法,并在某些情况下低复杂度网络的识别精度甚至可以超过对应优化前的网络;本发明的干扰识别低复杂度优化方法与现有的低复杂度方法相比,具有显著优势,而且本发明易于实现,具有很强的应用价值。
附图说明
图1是各个干扰的时频图;
图2是基于TFCCNN的低复杂度干扰识别的方法示意图;
图3是TFCCNN干扰识别网络中的时频分量感知模块(TFCAM)示意图;
图4是CNN和无TFCAM的干扰识别网络各个输出层识别性能仿真对比示意图;
图5是CNN和TFCCNN干扰识别网络的各个输出层识别性能仿真对比示意图;
图6是TFCCNN干扰识别网络的输出层1在INR=-8dB下的各干扰混淆矩阵示意图;
图7是TFCCNN干扰识别网络的最后输出层在INR=-8dB下的各干扰混淆矩阵示意图;
图8是TFCCNN干扰识别网络的输出层1各干扰识别精度仿真对比示意图;
图9是TFCCNN干扰识别网络的最后输出层各干扰识别精度仿真对比示意图。
具体实施方式
下面结合实施例和附图,详细描述本发明的技术方法。
本发明考虑了空对地干扰的特点,在实施例中选取信道类型为AWGN信道,干扰信号的样式包含8种:调幅(Amplitude Modulation,AM)、二进制相移键控(Binary PhaseShift Keying,BPSK)、单音干扰(Single-Tone,ST)、线性调频(Linear FrequencyModulation,LFM)、多音干扰(Multiple Tone,MT)、噪声调幅(Noise AmplitudeModulation,NAM)、部分频带噪声(Partial Band Noise,PBN)、正弦调频(SinusoidalFrequency Modulation,SFM);网络的输入为干扰信号的时频图,分辨率为50×50,具有三个通道(RGB);训练数据包含每种干扰类型的3600个样本,测试数据包含每种干扰类型和每种INR的100个样本,INR的范围从-14dB到8dB,间隔为2dB,每个样本的干扰参数在Matlab中随机生成。
在表1展示了TFCCNN结构,从表中可以看出,TFCCNN由时频分量感知模块和多中间层输出的卷积神经网络组成,本发明中时频分量感知模块使用了具有3个输入通道和1个输出通道的3×3大小的卷积核的深度卷积,即DepthConv(3,1,3×3),它由一个输入通道数和输出通道数以及分组数都为3的卷积与一个卷积核为1×1和输出通道数为1的卷积组成,并使用5个卷积层作为主干网络,Conv(3,16,3×3)表示具有3个输入通道和16个输出通道的3×3卷积,在第一和第三层卷积之后插入两个中间输出层,批量归一化层(Batchnormalization,BN)和ReLU激活函数层也加入到网络中,最后采用了全局平均池化(globalaverage pooling,GAP)和全连接层(fully connected layer,FC)用于分类;为了比较,表1中的骨干网络(5层卷积和最后的输出层)称为CNN网络;与CNN网络相比,由于增加了中间输出层,所提出的方法在每秒浮点运算(Floating-point Operations Per Second,FLOPs)和参数上几乎没有增加,时频分量感知模块的运算可以忽略不计;在表1中的时频分量感知的卷积神经网络中若删除了时频分量感知模块,则称为多输出卷积神经网络(MultipleOutput Convolutional Neural Networks,MulCNN);训练阶段使用动量为0.9且权重衰减为0.0005的随机梯度(Stochastic Gradient Descent,SGD)优化器,批量的大小设置为64,学习率初始化为0.001。
表1 TFCCNN结构
图1显示了每个干扰干扰信号的时频图,包括ST,SFM,AM,PBN,BPSK,LFM,NAM,MT;如ST时频图所示,可以看到它的时频分量是浅色部分,时频图中的黑色部分表示没有时频分量存在,因此,在使用卷积提取时频图的特征图时,时频分量的位置对于卷积计算更为重要,对于时频图中黑色部分的卷积计算可能是冗余的,本发明的TFCCNN只计算时频分量或者重要部分存在的位置,这样可以大大降低计算复杂度。
图2给出了TFCCNN干扰识别方法的总体结构,在卷积层提取特征之前,输入的时频图首先经过时频分量感知模块(TFCAM)确定时频分量的位置和重要的部分进行定位,并在执行卷积运算时只计算重要的位置处的特征,从而减少了冗余的计算;另外通过提供的自适应前向传播算法,网络可以根据样本的难度确定前向传播的深度,在识别时进一步减小网络的计算复从杂度。
基于TFCCNN的低复杂度干扰识别方法具体步骤为:
a、准备训练集记为其中xi为第i个训练样本,它是由短时傅里叶变换(STFT)的方法得到的时频图,它的尺寸为xi∈R50×50×3,其中h=50和w=50表示时频图的尺寸大小,Cin=3表示3通道的RGB图像,计算过程可以表示为其中,m和k分别表示时间和频率的离散参数,NSTFT=1024为STFT的FFT点数,w[n]为窗函数,w*[n]为窗函数的共轭表示,本例采用汉明窗,即w[n]=α0-(1-α0)cos[2πn/(NSTFT-1)],窗长为1024点,xi[n]为第i个干扰样本的采样数据序列,长度为N=1024,yi∈1,2,...,C是时频图xi对应的标签,C=8是干扰类的总数,N是样本个数,设置训练循环次数为E=50,批量大小为B=128,学习率为η=0.001;
b、搭建CNN网络和网络的中间输出层,设置卷积网络的层数为K=5个,每层卷积后添加了ReLU函数作为激活函数,其中BN的表达为其中γ和β为可学习的参数,u和σ2为输入样本的均值和方差,ε为一个很小的正数以防止分母等于0,激活函数的表达式为ReLU(x)=max(x,0),全连接的层数为M=3个,它们的激活函数都采用了softmax函数作为激活函数,其中网络最后一层有一个全连接层用于最终的识别结果,另外其余的2个全连接层连接在网络的不同深度,因此网络共有3个输出层的输出分布表示为并制定每个输出层的干噪比门限Ωm dB,Ω1>Ω2>Ω3...>ΩM,单位为dB;
c、为b中搭建好的模型添加时频分量感知模块(TFCAM),如图3所示,在CNN网络提取特征之前,xi首先经过TFCAM,它由一个低复杂度计算网络实现,具体的实现过程表示为,其中S∈R1×h×w是TFCAM的输出,S中的元素是二进制值{0,1},f(·)指的是时频分量感知中的轻量级计算,在本发明采用了深度可分离卷积层,它由一个输入通道数和输出通道数以及分组数相等的卷积与一个卷积核为1×1卷积层组成,σ(·)表示sigmoid函数,即σ(x)=1/[1+exp(-x)];本发明将S中等于1的元素定义为时频分量存在的位置和重要的部分,而将S中等于0的部分定义为对应于非重要的部分;
d、进行所有卷积操作仅对时频分量感知模块(TFCAM)获得的位置进行运算,即在空间维度上卷积只计算S中等于1的元素对应的位置,即Y表示每层卷积的输出,由于TFCAM中存在比较运算,这导致了该模块整体是不可微分的,不能通过端到端的反向传播方式进行优化网络,为此本发明在反向传播过程中对网络的梯度做了修正,具体来说将TFCAM的输出表示为Π1,将Π2设置为1-Π1,S在反向传播时可以表示为其中gi表示噪声,τ是温度因子并设置为1,这样使得TFCAM变得可微分,可以通过反向传播中更新网络的参数;
e、构造由稀疏损失和交叉熵组成的损失函数其中表示第m个输出层的交叉熵,表示为其中q(xi)和pm(xi)为第i个样本xi的真实标签分布和网络第m个中间层的输出分布,稀疏损失为Ls=||S||1/(50×50)-Λ,||·||1表示矩阵的一范数,Λ是控制计算复杂度的因素,α是超参数,通过反向传播更新量化网络参数,即其中θ为网络所有可训练参数,η=0.001为学习率;
f、判断是否所有的输入样本经过处理网络的处理并达到训练循环次数E=50,若是则停止训练,保存此时网络训练得到的θ;否则转步骤c;
训练得到TFCCNN模型和参数后,可以部署到软硬件平台中,该网络识别干扰信号的具体步骤如下:
g、测试时,为识别网络加载保存的网络模型和参数θ;
在图4和图5中分别报告了在无TFCAM的干扰识别网络(MulCNN)和TFCCNN干扰识别网络的性能,其中Λ设置为0.55,从图中可以看出,对于MulCNN和TFCCNN,所提出干扰识别网络模型的最终输出的识别性能优于前两个中间输出层的识别性能,因为它具有最多的计算资源;MulCNN和TFCCNN的最终输出的识别性能也超过了CNN,因为多个输出层降低了网络更新时反向传播的难度,使网络更容易优化;与MulCNN相比,所提出的TFCCNN消除了空间计算冗余,并且基本不会导致所有输出层的网络识别性能下降。
对于TFCCNN干扰识别网络,图6和图7给出了Λ设置为0.55时中间输出层1和最终输出的各个干扰在INR为-8dB的混淆矩阵,中间输出层1的混淆概率高于最终输出,这使得每个干扰信号的识别准确率低于最终输出。
对于TFCCNN干扰识别网络,图8和图9给出了Λ设置为0.55时中间输出层1和最终输出的各干扰类型的识别精度,在低INR时,中间输出层1的混淆概率高于最终输出,这使得识别每个干扰类型的精度低于最终输出的精度,为了更详细地比较不同Λ对识别性能的影响,本发明在训练期间改变Λ并将结果报告在表2中,从表2中可以看出随着Λ的减小,Flops逐渐减小;增加TFCAM去除空间计算冗余后,如Λ=0.85和Λ=0.55,识别性能会更好。因此可以推断,减少空间冗余后,网络更容易优化;当Λ继续减小,比如小于0.3时,计算量进一步减少,识别性能也会下降。
最后,本发明结合了TFCCNN和自适应机制前向传播AFP来进一步降低计算复杂度,结果列于表3中,从表3可以得出结论,所提出的方法在进一步平衡了识别精度和计算复杂度,使得复杂度保持很低的情况下,识别精度仍可以达到80%以上,通过调整阈值Ω和Λ,TFCCNN可以轻松实现精度和计算复杂度之间的平衡。
表2不同Λ对识别性能和计算计算复杂度的平衡
表3自适应机制AFP
Claims (1)
1.一种基于深度学习的低复杂度干扰识别方法,其特征在于,包括以下步骤:
其中,m和k分别表示时间和频率的离散参数,NSTFT为STFT的FFT点数,w[n]为窗函数,w*[n]为窗函数的共轭表示,xi[n]为第i个干扰样本的采样数据序列,长度为N点,yi∈1,2,...,C为时频图xi对应的标签,C是干扰类的总数,N是样本个数;
S2、搭建干扰识别网络,包括时频分量感知模块、多输出层的卷积主干网络,所述时频分量感知模块用于接收xi并进行如下处理:
其中S∈R1×h×w是时频分量感知模块的输出,S中的元素是二进制值{0,1},f(·)指的是时频分量感知中的轻量级计算,σ(·)表示sigmoid函数;将S中等于1的元素定义为时频分量存在的位置和重要的部分,而将S中等于0的部分定义为对应于非重要的部分;
时频分量感知模块的输出S输入到卷积模块中进行特征提取,卷积层的输出表示为:
所述多输出层的卷积主干网络由K个卷积层堆叠而成,且包含M个输出层,M≤K,每个输出层为全连接操作,对应的激活函数为softmax函数,在卷积主干网络最后一个卷积层后添加一个输出层,其余的M-1个输出层嵌入到不同卷积层之后,且保证每个卷积层之后最多嵌入一个输出层,因此第M个输出层为最终的识别结果,其余M-1个输出层为中间识别结果,输出分布表示为并设定每个输出层的干噪比门限Ωm dB,Ω1>Ω2>Ω3...>ΩM;
S3、利用训练集训练S2中搭建的干扰识别网络,设置训练循环次数为E,批量大小为B,在反向传播过程中,令时频分量感知模块的输出表示为Π1,将Π2设置为1-Π1,从而将S在反向传播时表示为其中gi表示噪声,τ是温度因子并设置为1,实现通过反向传播中更新网络的参数;采用的损失函数由稀疏损失和交叉熵组成:
其中表示第m个输出层的交叉熵,表示为其中q(xi)和pm(xi)为第i个样本xi的真实标签分布和网络第m个中间层的输出分布,稀疏损失为Ls=||S||1/(hw)-Λ,||·||1表示矩阵的一范数,Λ是控制计算复杂度的因素,α是超参数,通过反向传播更新量化网络参数,即其中θ为网络所有可训练参数,η为学习率;
令所有的输入样本经过干扰识别网络的处理并达到训练循环次数E,保存此时网络训练得到的θ,得到训练好的干扰识别网络;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211115475.6A CN115563485A (zh) | 2022-09-14 | 2022-09-14 | 一种基于深度学习的低复杂度干扰识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211115475.6A CN115563485A (zh) | 2022-09-14 | 2022-09-14 | 一种基于深度学习的低复杂度干扰识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115563485A true CN115563485A (zh) | 2023-01-03 |
Family
ID=84741533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211115475.6A Pending CN115563485A (zh) | 2022-09-14 | 2022-09-14 | 一种基于深度学习的低复杂度干扰识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115563485A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116405158A (zh) * | 2023-04-04 | 2023-07-07 | 电子科技大学 | 一种非高斯噪声下基于深度学习的端到端通信系统 |
CN116614189A (zh) * | 2023-07-18 | 2023-08-18 | 中国人民解放军国防科技大学 | 一种无线电干扰识别的对抗样本生成方法及装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509911A (zh) * | 2018-04-03 | 2018-09-07 | 电子科技大学 | 基于卷积神经网络的干扰信号识别方法 |
CN110515096A (zh) * | 2019-08-20 | 2019-11-29 | 东南大学 | 基于卷积神经网络的卫星导航干扰信号识别装置及其方法 |
CN110826630A (zh) * | 2019-11-08 | 2020-02-21 | 哈尔滨工业大学 | 基于深度卷积神经网络的雷达干扰信号特征级融合识别方法 |
US20200153535A1 (en) * | 2018-11-09 | 2020-05-14 | Bluecom Systems and Consulting LLC | Reinforcement learning based cognitive anti-jamming communications system and method |
US20200341109A1 (en) * | 2019-03-14 | 2020-10-29 | Infineon Technologies Ag | Fmcw radar with interference signal suppression using artificial neural network |
CN112731309A (zh) * | 2021-01-06 | 2021-04-30 | 哈尔滨工程大学 | 一种基于双线性高效神经网络的有源干扰识别方法 |
CN113298846A (zh) * | 2020-11-18 | 2021-08-24 | 西北工业大学 | 基于时频语义感知的干扰智能检测方法 |
CN113569742A (zh) * | 2021-07-29 | 2021-10-29 | 西南交通大学 | 一种基于卷积神经网络的宽频带电磁干扰源识别方法 |
CN114358064A (zh) * | 2021-12-23 | 2022-04-15 | 中国人民解放军海军工程大学 | 一种基于深度支持向量数据描述的干扰检测装置及方法 |
US20220209885A1 (en) * | 2020-12-24 | 2022-06-30 | Viettel Group | Method and apparatus for adaptive anti-jamming communications based on deep double-q reinforcement learning |
-
2022
- 2022-09-14 CN CN202211115475.6A patent/CN115563485A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509911A (zh) * | 2018-04-03 | 2018-09-07 | 电子科技大学 | 基于卷积神经网络的干扰信号识别方法 |
US20200153535A1 (en) * | 2018-11-09 | 2020-05-14 | Bluecom Systems and Consulting LLC | Reinforcement learning based cognitive anti-jamming communications system and method |
US20200341109A1 (en) * | 2019-03-14 | 2020-10-29 | Infineon Technologies Ag | Fmcw radar with interference signal suppression using artificial neural network |
CN110515096A (zh) * | 2019-08-20 | 2019-11-29 | 东南大学 | 基于卷积神经网络的卫星导航干扰信号识别装置及其方法 |
CN110826630A (zh) * | 2019-11-08 | 2020-02-21 | 哈尔滨工业大学 | 基于深度卷积神经网络的雷达干扰信号特征级融合识别方法 |
CN113298846A (zh) * | 2020-11-18 | 2021-08-24 | 西北工业大学 | 基于时频语义感知的干扰智能检测方法 |
US20220209885A1 (en) * | 2020-12-24 | 2022-06-30 | Viettel Group | Method and apparatus for adaptive anti-jamming communications based on deep double-q reinforcement learning |
CN112731309A (zh) * | 2021-01-06 | 2021-04-30 | 哈尔滨工程大学 | 一种基于双线性高效神经网络的有源干扰识别方法 |
CN113569742A (zh) * | 2021-07-29 | 2021-10-29 | 西南交通大学 | 一种基于卷积神经网络的宽频带电磁干扰源识别方法 |
CN114358064A (zh) * | 2021-12-23 | 2022-04-15 | 中国人民解放军海军工程大学 | 一种基于深度支持向量数据描述的干扰检测装置及方法 |
Non-Patent Citations (7)
Title |
---|
MITSUBISHI ELECTRIC CO.: "R1-1705817 "Summary of analysis of nonlinear precoding schemes for NR"", 3GPP TSG_RAN\\WG1_RL1, no. 1 * |
P. THUBERT, ED.; CISCO SYSTEMS; G.Z. PAPADOPOULOS; IMT ATLANTIQUE; R. BUDDENBERG;: "Reliable and Available Wireless Architecture/Framework draft-pthubert-raw-architecture-04", IETF * |
张婧;冯振明;: "基于神经网络和SVM的GPS干扰类型识别", 信息与电子工程, no. 05 * |
张智博;樊雅玄;孟骁;: "基于谱图和神经网络的通信干扰模式识别方法", 太赫兹科学与电子信息学报, no. 06 * |
杨兴宇;阮怀林;: "基于栈式稀疏自编码器的新型干扰识别", 现代雷达, no. 05 * |
梁金弟;程郁凡;杜越;王鹏宇;: "联合多维特征的干扰识别技术研究", 信号处理, no. 12 * |
王鹏宇等: "Time-Frequency Component-Aware Convolutional Neural Network for Wireless Interference Classification", 《IEEE》, pages 1 - 4 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116405158A (zh) * | 2023-04-04 | 2023-07-07 | 电子科技大学 | 一种非高斯噪声下基于深度学习的端到端通信系统 |
CN116405158B (zh) * | 2023-04-04 | 2024-10-22 | 电子科技大学 | 一种非高斯噪声下基于深度学习的端到端通信系统 |
CN116614189A (zh) * | 2023-07-18 | 2023-08-18 | 中国人民解放军国防科技大学 | 一种无线电干扰识别的对抗样本生成方法及装置 |
CN116614189B (zh) * | 2023-07-18 | 2023-11-03 | 中国人民解放军国防科技大学 | 一种无线电干扰识别的对抗样本生成方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112418014B (zh) | 基于小波变换和卷积长短期记忆神经网络的调制信号识别方法 | |
CN108509911B (zh) | 基于卷积神经网络的干扰信号识别方法 | |
CN116866129A (zh) | 一种无线通信信号检测方法 | |
CN111314257B (zh) | 一种基于复值神经网络的调制方式识别方法 | |
CN109495214B (zh) | 基于一维Inception结构的信道编码类型识别方法 | |
CN115563485A (zh) | 一种基于深度学习的低复杂度干扰识别方法 | |
CN112364729A (zh) | 基于特征参数与bp神经网络的调制识别方法 | |
CN111614584B (zh) | 基于神经网络的变换域自适应滤波信道估计方法 | |
CN114337880B (zh) | 一种考虑主用户信号随机到达和离开的频谱感知方法 | |
CN112910811B (zh) | 基于联合学习的噪声水平未知条件下的盲调制识别方法和装置 | |
CN112039820A (zh) | 量子象群机制演化bp神经网络的通信信号调制识别方法 | |
KR102073935B1 (ko) | 전파신호 변조인식시스템 | |
CN110659684A (zh) | 一种基于卷积神经网络stbc信号识别方法 | |
CN113014524A (zh) | 一种基于深度学习的数字信号调制识别方法 | |
CN110929842B (zh) | 非合作无线电信号突发时间区域精确智能检测方法 | |
CN113315593A (zh) | 一种基于flom协方差矩阵和lstm神经网络的频谱感知算法 | |
CN115296759A (zh) | 一种基于深度学习的干扰识别方法 | |
CN114943245A (zh) | 一种基于数据增强和特征嵌入的自动调制识别方法和装置 | |
CN109450573A (zh) | 一种基于深度神经网络的频谱感知方法 | |
CN114595729A (zh) | 基于残差神经网络与元学习融合的通信信号调制识别方法 | |
CN112487933B (zh) | 一种基于自动化深度学习的雷达波形识别方法及系统 | |
CN113076925A (zh) | 基于cnn和elm的m-qam信号调制模式识别方法 | |
CN110995631B (zh) | 一种基于lstm和svm的通信信号调制模式识别方法及系统 | |
Zhang et al. | Machine learning based protocol classification in unlicensed 5 GHz bands | |
CN108834043B (zh) | 基于先验知识的压缩感知多目标无源定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |