CN116055270A - 一种调制识别模型及其训练方法、信号调制处理方法 - Google Patents
一种调制识别模型及其训练方法、信号调制处理方法 Download PDFInfo
- Publication number
- CN116055270A CN116055270A CN202310056757.1A CN202310056757A CN116055270A CN 116055270 A CN116055270 A CN 116055270A CN 202310056757 A CN202310056757 A CN 202310056757A CN 116055270 A CN116055270 A CN 116055270A
- Authority
- CN
- China
- Prior art keywords
- feature extraction
- layer
- model
- network
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 49
- 238000012549 training Methods 0.000 title claims description 28
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000000605 extraction Methods 0.000 claims abstract description 240
- 230000009466 transformation Effects 0.000 claims abstract description 40
- 238000004891 communication Methods 0.000 claims abstract description 29
- 238000010586 diagram Methods 0.000 claims description 40
- 238000011176 pooling Methods 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 26
- 238000010606 normalization Methods 0.000 claims description 24
- 230000002441 reversible effect Effects 0.000 claims description 21
- 230000004913 activation Effects 0.000 claims description 19
- 230000009467 reduction Effects 0.000 claims description 12
- 230000008447 perception Effects 0.000 claims description 9
- 235000004257 Cordia myxa Nutrition 0.000 claims description 3
- 244000157795 Cordia myxa Species 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 210000004196 psta Anatomy 0.000 description 31
- 238000013528 artificial neural network Methods 0.000 description 25
- 210000004270 pstb Anatomy 0.000 description 19
- 230000000306 recurrent effect Effects 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 15
- 238000012360 testing method Methods 0.000 description 10
- 238000013527 convolutional neural network Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 238000005562 fading Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 230000006735 deficit Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012854 evaluation process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L27/00—Modulated-carrier systems
- H04L27/0012—Modulated-carrier systems arrangements for identifying the type of modulation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种调制识别模型,用于识别输入无线通信信号的调制类型,所述模型包括卷积模块、倒金字塔特征提取网络以及分类器,其中:所述卷积模块用于对输入无线通信信号进行特征提取以获取其对应的第一特征图;所述倒金字塔特征提取网络用于对所述第一特征图按照倒金字塔的规则进行特征提取,其中,所述倒金字塔特征提取网络包括多阶段的特征提取模块,相邻阶段的特征提取模块之间设置有尺度变换卷积层;所述分类器用于基于所述倒金字塔特征提取网络输出的特征图进行输入无线通信信号对应的调制类型的分类。
Description
技术领域
本发明涉及无线通信技术领域,具体来说,涉及无线通信技术领域的信号调制识别技术,更具体地说,涉及一种调制识别模型及其训练方法、信号调制处理方法。
背景技术
自动调制识别(Automatic modulation recognition,AMR)能够在先验知识不足和诸多参数未知的情况下识别接收到的无线通信信号的调制类型。自动调制识别作为信号解调的必备技术,在过去的几十年里,它被广泛应用于军事和民用领域,比如认知无线电、电子战、频谱监测、无线电检错等领域。一般来说,自动调制识别方法分为两类,一类是模型驱动的自动调制识别方法,另一类是数据驱动的自动调制识别方法。
模型驱动的自动调制识别方法主要分为基于似然的(likelihood-based,LB)自动调制识别方法和基于特征的(feature-based,FB)的自动调制识别方法。基于似然的自动调制识别方法从贝叶斯意义角度、通过最大化正确分类的概率获得了最佳识别率,但是,由于该方法的计算复杂性高且极易受到未知信道损伤的影响,因此难以在资源受限的设备中部署基于似然的自动调制识别方法。相比之下,基于特征的自动调制识别方法的计算成本较低,但是该方法以牺牲信号识别性能为代价,并且高度依赖专家知识来设计判别特征,一旦缺乏专家知识设计的判别特征就会在信号识别任务中表现不佳。
随着深度学习技术(deep learning,DL)的发展,数据驱动的自动调制识别方法开始盛行,该方法能够自动从如I/Q、星座图、时频频谱、循环频谱等数据中提取特征并基于其识别接收到的无线通信信号的调制类型。典型的深度学习模型包括卷积神经网络(convolution neural network,CNN)和递归神经网络(recurrent neural network,RNN),其中,卷积神经网络可以在多个尺度上学习数据的局部空间特征表示,这激发了其在自动调制识别中的应用;递归神经网络模拟时间序列信号的自然生成过程,即当前时刻的隐藏状态取决于之前时刻的隐藏状态,这种固有的顺序性使得递归神经网络已成为顺序建模任务的事实标准,例如自然语言处理任务、时间序列数据挖掘任务和自动调制识别任务,并且递归神经网络与卷积神经网络相比,可以有效地对序列信号中的时间依赖性进行建模。虽然基于卷积神经网络和递归神经网络的自动调制识别方法的性能较模型驱动的自动调制识别方法有所进步,但它们仍然存在几个主要缺点:(1)由于卷积神经网络中卷积核的感受域有限且固定,基于卷积神经网络的自动调制识别方法难以仅靠常规卷积实现有效地提取信号序列的长距离依赖性,若想捕获长距离依赖性,则需要非常深的网络,这将会导致卷积神经网络产生高的计算复杂度和内存消耗;(2)由于递归神经网络难以实现并行化,因此难以应用到长序列信号识别中,并且递归神经网络受限于梯度消失问题,即使经过精心设计,基于递归神经网络变种的长短期记忆网络(long and short time memory network,LSTM)和门控循环单元(gate recurrent unit,GRU)实际上也只能保持有限时间步的信息,也就是说递归神经网络无法学习序列信号的长距离依赖关系;(3)由于缺乏长距离依赖关系,卷积神经网络和递归神经网络无法适应复杂的现实世界环境,当面对衰落信道时,它们的性能会严重恶化进而影响信号识别任务的效果。
近年来,研究人员在其他诸如计算机视觉领域的相关任务中发现,Transformer模型在捕捉长距离依赖关系方面优于卷积神经网络和递归神经网络。而Transformer之所以能够捕获长距离依赖关系,主要归功于其内部的多头自注意力(multi-head selfattention,MHSA)网络,其提供了几个关键优点,使得Transformer较为适合建模时间序列数据:(1)它彻底地放弃了递归和卷积结构,而是完全依赖自注意力网络来建模输入和输出之间的依赖关系(或交互关系),从而实现了长距离依赖(全局关系);(2)给定长距离交互特性,Transformer可以通过选择性地关注最相关的输入序列元素并根据重要特征进行分类,并通过抑制不相关的特征,使其更能抵抗信道损伤。基于此,研究人员提出使用Transformer作为主干网络骨架来对序列信号的全局关系进行建模,以突破卷积神经网络和递归神经网络在衰落信道中的限制。
尽管Transformer模型表现出比卷积神经网络和递归神经网络更大的潜力,但是Transformer仍存在三个主要缺点:(1)Transformer中的多头自注意力网络(MHSA)的计算复杂度和内存使用与序列信号长度成二次方关系,其在处理长的序列信号时存在巨大的计算资源消耗和内存消耗;(2)尽管Transformer在全局关系建模中表现优于卷积神经网络,但由于其缺乏卷积神经网络中那样的归纳偏置,其提取序列信号中的细粒度的局部低级特征的能力(局部关系提取)差于卷积神经网络;(3)现有的基于Transformer的自动调制识别方法中输入序列信号都是固定尺度的(长度是不变的),且基于Transformer的自动调制识别方法仅限于使用单尺度特征图,缺少了多尺度特征,而有相关研究表明多尺度特征表示对自动调制识别是有益的。正如前面所说的,由于Transformer本身固有的缺点,若不对其做任何修正,直接将Transformer应用于自动调制识别中,仍然存在计算资源占用量大、局部特征提取能力弱、缺乏多尺度特征等问题,从而不利于提升信号识别任务的效果。
发明内容
因此,本发明的目的在于克服上述现有技术的缺陷,提供一种调制识别模型、一种调制识别模型的训练方法和一种信号调制处理方法。
根据本发明的第一方面,提供一种调制识别模型,所述模型包括卷积模块、倒金字塔特征提取网络以及分类器,其中:所述卷积模块用于对输入无线通信信号进行特征提取以获取其对应的第一特征图;所述倒金字塔特征提取网络用于对所述第一特征图按照倒金字塔的规则进行特征提取,其中,所述倒金字塔特征提取网络包括多阶段的特征提取模块,相邻阶段的特征提取模块之间设置有尺度变换卷积层,所述每个尺度变换卷积层用于对接收到的上一阶段特征提取模块提取到的特征图进行尺度缩减变换并传递给下一阶段特征提取模块,所述每个阶段特征提取模块用于对输入其的特征图进行特征提取并将最后一个阶段特征提取模块提取到的特征图作为倒金字塔特征提取网络的输出;所述分类器用于基于所述倒金字塔特征提取网络输出的特征图进行输入无线通信信号对应的调制类型的分类。
在本发明的一些实施例中,所述卷积模块由依次连接的第一卷积层、BatchNorm、第一激活函数以及池化层组成。
优选的,所述第一激活函数为RELU或者SELU函数;所述池化层为最大池化层。
优选的,所述第一卷积层的卷积核大小为3、步长2,所述池化层的卷积核大小为3、步长为2。
在本发明的一些实施例中,所述卷积模块与所述倒金字塔特征提取网络之间设置有第二卷积层,所述第二卷积层用于提取所述第一特征图的局部特征。
在本发明的一些实施例中,所述倒金字塔特征提取网络包括依次连接的第一阶段特征提取模块、第二阶段特征提取模块、第三阶段特征提取模块和第四阶段特征提取模块。
优选的,所述每个尺度变换卷积层的卷积核大小均为3、步长均为2。
在本发明的一些实施例中,所述每个阶段的特征提取模块包括一个或多个特征提取子模块。
在本发明的一些实施例中,所述特征提取子模块为Transformer。
在本发明的一些实施例中,所述特征提取子模块包括依次连接的局部感知单元、第一归一化层、线性多头自注意力网络、第二归一化层和反向残差前馈网络,其中:所述局部感知单元用于对输入的特征图进行局部特征提取并将其与输入的特征图合并后传递给所述第一归一化层和所述第二归一化层;所述第一归一化层用于对接收到的特征图进行归一化处理后传递给所述线性多头自注意力网络;所述线性多头自注意力网络用于对接收到的特征图进行处理以捕获输入特征提取子模块的特征图的全局依赖关系,并将处理后的特征图传递给第二归一化层;所述第二归一化层用于对接收到的特征图进行归一化处理后传递给所述反向残差前馈网络;所述反向残差前馈网络用于对接收到的特征图进行局部特征提取;其中,所述特征提取子模块还将经所述反向残差前馈网络处理后的特征图、经所述线性多头自注意力网络处理后的特征图以及经所述局部感知单元处理的特征图合并后作为输出。
优选的,所述局部感知单元包括第一深度卷积层,其卷积核大小为3。
在本发明的一些实施例中,所述线性多头自注意力网络包括全局池化层、第一线性层、第二线性层、第三线性层和多头自注意力网络,其中:所述全局池化层用于对线性多头自注意力网络接收到的特征图进行维度变换后传递给第二线性层、第三线性层;所述第一线性层用于对所述线性多头自注意力网络接收到的特征图进行线性变换后传递给所述多头自注意力网络;所述第二线性层、第三线性层用于对经所述全局池化层处理后的特征图进行线性变换后传递给所述多头自注意力网络;所述多头自注意力网络用于对接收到的特征图进行处理以获得输入线性多头自注意力网络的特征图的全局依赖关系。
在本发明的一些实施例中,所述反向残差前馈网络包括依次连接的第三卷积层、BatchNorm、第二激活函数、第二深度卷积层、BatchNorm、第三激活函数、第四卷积层和BatchNorm。
优选的,所述第三卷积层、第四卷积层的卷积核大小均为1,所述第二激活函数、第三激活函数均为GELU函数,所述第二深度卷积层的卷积核大小为11。
在本发明的一些实施例中,所述分类器包括全局池化层或展平层、全连接层。
根据本发明的第二方面,提供一种调制识别模型的训练方法,所述方法包括如下步骤:S1、获取训练集,所述训练集包括多个调制信号,且每个调制信号中标记有该信号对应的调制类别标签;S2、采用步骤S1得到的训练集将如本发明第一方面所述的模型训练至收敛。
根据本发明的第二方面,提供一种信号调制处理方法,所述方法包括如下步骤:T1、获取待处理信号;T2、采用如本发明第一方面所述的模型对待处理信号进行处理以识别其调制类型。
与现有技术相比,本发明的优点在于:采用逐阶段收缩的倒金字塔特征提取网络用以提取多尺度特征并减少计算量;采用线性多头自注意力网络代替多头自注意力网络实现了线性时间复杂度和内存使用,并且线性多头自注意力网络能对相关的特征进行软搜索,并从多个子空间中学习最适合决策的特征,从而使得模型更稳健(可容忍信道衰落);使用反向残差前馈网络来替换Transformer中的残差前馈网络,并引入局部感知单元和卷积模块提升模型对于局部特征的提取能力。
附图说明
以下参照附图对本发明实施例作进一步说明,其中:
图1为根据本发明实施例的调制识别模型结构示意图;
图2为在数据集RadioML2016.10B上各种信噪比(SNR)中测试不同模型的准确率对比示意图;
图3在数据集RadioRML2018.01A上各种信噪比(SNR)中测试不同模型的准确率对比示意图;
图4在数据集HisarMod2019.1上各种信噪比(SNR)中测试不同模型的准确率对比示意图。
具体实施方式
为了使本发明的目的,技术方案及优点更加清楚明白,以下通过具体实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如背景技术提到的,现有技术中将Transformer直接应用于自动调制识别中,存在计算资源占用量大、局部特征提取能力弱、缺乏多尺度特征等问题,从而不利于提升信号识别任务的效果。
针对以上缺陷,本发明提出一种能够降低计算消耗、增强局部特征提取能力以及获取多尺度特征的模型。在本发明的方案中,采用逐阶段尺度缩减的方式对输入无线通信信号的尺度进行尺度缩减以降低处理长序列信号的计算和内存开销使模型能够应用到计算资源受限的移动设备中,并对尺度缩减后的输入无线通信信号进行特征提取获取多尺度特征以提升模型执行信号识别任务的效果;还采用多个卷积层进行局部特征提取以增强模型的局部特征提取能力。概括的说,为了达到上述目的,本发明提出一种调制识别模型,该模型包括用于对输入无线通信信号进行局部特征提取的卷积模块,用于对输入无线通信信号进行尺度缩减变换和特征提取的倒金字塔特征提取网络,以及用于对输入无线通信信号进行调制类型分类的分类器;其中,倒金字塔特征提取网络包括多阶段的特征提取模块,且相邻阶段的特征提取模块之间设置有尺度变换卷积层,通过尺度变换卷积层和特征提取模块能够对输入无线通信信号进行尺度缩减变换以及尺度缩减变换后的特征提取操作。
为了更好的理解本发明,下面结合附图和实施例从调制识别模型、调制识别模型训练过程以及调制识别模型评价过程对本发明进行详细的说明。
一、调制识别模型
根据本发明的一个实施例,如图1所示,本发明提出一种调制识别模型,所述模型包括卷积模块、倒金字塔特征提取网络以及分类器,下面分别对卷积模块、倒金字塔特征提取网络及分类器进行说明。
1、卷积模块
由于现有技术直接将Transformer应用于调制识别存在局部特征提取能力弱的问题,因此本发明在调制识别模型中设置卷积模块用以增强模型的局部特征提取能力,同时卷积模块的设置还使得调制识别模型在训练稳定性和峰值性能方面表现更好。
本发明中的卷积模块用于对输入无线通信信号进行特征提取以获取其对应的第一特征图。根据本发明的一个实施例,所述卷积模块由依次连接的第一卷积层、BatchNorm(BN)、第一激活函数、以及池化层组成,其中,所述第一卷积层的卷积核大小为3、步长为2;所述第一激活函数为RELU或者SELU函数;所述池化层为最大池化层,其卷积核大小为3、步长为2。根据本发明的一个示例,按照实施例中卷积模块各个网络层设定的参数对输入其的无线通信信号进行特征提取,其处理过程为:假定输入无线通信信号为L×2的IQ信号,L为信号的长度,2为信号通道的大小,将其输入卷积模块中,依次经第一卷积层进行特征提取、BatchNorm进行批次规范化、激活函数进行非线性变换、池化层进行下采样后得到第一特征图并将其传递给倒金字塔特征提取网络,其中,由于第一卷积层和池化层中的步长均设置为2(在神经网络中,通过改变卷积核步长的大小可以改变输出矩阵的大小,此种方式为神经网络中常见的处理方式,在此不作详细说明),经卷积模块处理后得到大小为L/4×M的第一特征图,L/4为第一特征图的长度,M为第一特征图通道的大小。需要说明的是,在卷积模块中对于第一卷积层、最大池化层的参数设置以及激活函数的选取可以根据实际需求作出调整,本发明不做具体限制。
2、倒金字塔特征提取网络
由于现有技术直接将Transformer应用于调制识别存在计算资源占用量大以及缺乏多尺度特征的问题,因此本发明在调制识别模型中设置倒金字塔特征提取网络对输入无线通信信号进行尺度缩减变换及特征提取,在降低计算资源占用量的同时还能够获取多尺度特征以提升信号识别任务的效果。
本发明的倒金字塔特征提取网络用于对所述第一特征图按照倒金字塔的规则进行特征提取,其中,所述倒金字塔特征提取网络包括多阶段的特征提取模块,相邻阶段的特征提取模块之间设置有尺度变换卷积层,所述每个尺度变换卷积层用于对接收到的上一阶段特征提取模块提取到的特征图进行尺度缩减变换并传递给下一阶段特征提取模块,所述每个阶段特征提取模块用于对输入其的特征图进行特征提取并将最后一个阶段特征提取模块提取到的特征图作为倒金字塔特征提取网络的输出。根据本发明的一个实施例,所述倒金字塔特征提取网络包括依次连接的第一阶段特征提取模块、第二阶段特征提取模块、第三阶段特征提取模块和第四阶段特征提取模块,且第一阶段特征提取模块与第二阶段特征提取模块之间设置有第一尺度变换卷积层,第二阶段特征提取模块与第三阶段特征提取模块之间设置有第二尺度变换卷积层,第三阶段特征提取模块与第四阶段特征提取模块之间设置有第三尺度变换卷积层。根据本发明的一个实施例,所述每个尺度变换卷积层的卷积核大小均为3、步长均为2。根据本发明的一个示例,还是以输入无线通信信号为L×2的IQ信号为例,将该IQ信号输入至卷积模块处理得到L/4×M的第一特征图之后,按照实施例中倒金字塔特征提取网络设置的4个阶段的特征提取模块,以及3个尺度变换卷积层对L/4×M的第一特征图进行尺度缩减变换及特征提取,具体的处理过程如下:
首先由第一阶段特征提取模块对L/4×M的第一特征图进行特征提取得到大小为L/4×M第一尺度特征图,再由第一尺度变换卷积层将第一尺度特征图的尺度缩减为L/8×M后传递给第二阶段特征提取模块进行特征提取得到大小为L/8×M第二尺度特征图,再由第二尺度变换卷积层将第二尺度特征图的尺度缩减为L/16×M后传递给第三阶段特征提取模块进行特征提取得到大小为L/16×M第三尺度特征图,再由第三尺度变换卷积层将第三尺度特征图的尺度缩减为L/32×M后传递给第四阶段特征提取模块进行特征提取得到大小为L/32×M第四尺度特征图,并将大小为L/32×M第四尺度特征图作为倒金字塔特征提取网络的输出传递给分类器。经过四个阶段的特征提取和三次尺度缩减变换后可以获得四个不同尺度的特征图,分别为L/4×M的第一尺度特征图、L/8×M的第二尺度特征图、L/16×M第三尺度特征图和L/32×M的第四尺度特征图,进而可以帮助提升调制识别模型执行信号识别任务的效果;同时由于经过了三次尺度缩减变换,最终输出的第四尺度特征图的大小缩减为输入L×2的IQ信号的1/32,从而降低了计算资源占用量。
此外,为了更好的提取输入无线通信信号的局部相关特征,可以在调制识别模型中增加卷积层进一步提升模型的局部特征提取能力。根据本发明的一个实施例,所述卷积模块与所述倒金字塔特征提取网络之间设置有第二卷积层,所述第二卷积层用于提取所述第一特征图的局部特征,优选的,可将第二卷积层的卷积核大小设置为3、步长设置为1。第二卷积层的卷积核大小及步长的设置可以根据实际需求作出调整,本发明不做具体限制。在卷积模块与倒金字塔特征提取网络之间设置了第二卷积层后,此种情况下倒金字塔特征提取网络接收到的特征图有所变化,还是以输入无线通信信号为L×2的IQ信号为例进行说明,此时卷积模块对输入无线通信信号处理后得到第一特征图并传递给第二卷积层,由第二卷积层对第一特征图进行特征提取后传递给倒金字塔特征提取网络处理,后续倒金字塔特征提取网络的处理过程原理同上,此处不再赘述详细的处理过程。其中,对于倒金字塔特征提取网络中特征提取模块数量、尺度变换卷积层的参数设置可以根据实际需求调整变换,本发明不做具体限制。
由于特征提取模块是倒金字塔特征提取网络的重要组成部分,为了更好的理解本发明,下面对特征提取模块的组成结构进行详细的说明。
根据本发明的一个实施例,所述每个阶段的特征提取模块包括一个或多个特征提取子模块。根据本发明的一个实施例,所述特征提取子模块为Transformer,之所以采用Transformer作为特征提取子模块,是因为若直接将Transformer应用于自动调制识别中,存在计算资源占用量大、局部特征提取能力弱、缺乏多尺度特征等问题,从而不利于提升信号识别任务的效果。在本发明的方案中,Transformer作为调制识别模型组成的一部分,与卷积模块、倒金字塔特征提取网络中的尺度变换卷积层协同处理输入的无线通信信号,从而能够有效提升调制识别模型处理信号识别任务的性能,其中,卷积模块用于增强模型的局部特征提取能力,倒金字塔特征提取网络中每个阶段特征提取模块的Transformer用于执行特征提取任务以获取获取多尺度特征,同时尺度变换卷积层用于执行尺度缩减任务以降低模型的计算资源占用量。需要说明的是,Transformer是神经网络中常见的模型,此处不再赘述。
虽然以Transformer作为特征提取子模块能够有效提升调制识别模型处理信号识别任务的性能,但是,为了进一步地提升调制识别模型的性能,本发明还提出以Transformer的网络结构为基准,对其网络结构进行优化调整并以优化调整后的网络结构作为特征提取子模块。根据本发明的一个实施例,所述特征提取子模块包括依次连接的局部感知单元、第一归一化层、线性多头自注意力网络、第二归一化层和反向残差前馈网络,其中:
所述局部感知单元(Local Perception Unit)用于对输入的特征图进行局部特征提取并将其与输入的特征图合并后传递给所述第一归一化层和所述第二归一化层。根据本发明的一个实施例,所述局部感知单元包括第一深度卷积层,其卷积核大小为3。之所以要设置局部感知单元是因为纯粹的Transformer忽略了局部结构关系,为了缓解这些限制,本方案提出设置局部感知单元来提取局部信息。为了更好的理解局部感知单元对其编码过程作简要说明,以X作为局部感知单元的输入特征向量,则局部感知单元对X编码后的输出可以表示为:LPU(X)=X+DWConv(X),其中,LPU(X)表示经局部感知单元编码后的输出,DWConv表示深度可分卷积。需要说明的是,第一深度卷积层的卷积核大小设置可以根据实际需求作调制,本发明不做具体限制。
所述第一归一化层用于对接收到的特征图进行归一化处理后传递给所述线性多头自注意力网络。通过归一化处理能够尽量保留输入无线通信信号内不同特征之间的大小关系,提升模型识别性能。
所述线性多头自注意力网络用于对接收到的特征图进行处理以捕获输入特征提取子模块的特征图的全局依赖关系,并将处理后的特征图传递给第二归一化层。为了更好的理解线性多头自注意力网络,先对Transformer中的多头自注意力网络进行注意力计算过程进行说明。将一向量表示(其中元素称之为token)作为多头自注意力网络的输入,其中,N表示元素(token)的数量,C表示元素(token)嵌入维度。原始的缩放点积注意力(scaled dot-product attention,SA)将元素(token)嵌入序列线性变换到qkv空间,查询键和值 然后通过来计算所有输入元素(token)的加权和。由于缩放点击注意力的内存复杂度O(N2)和时间复杂度O(N2C)会占用较大的计算和内存开销,使得多头自注意力网络在处理长序列时效率变得极低。为了解决这个问题,本发明提出以线性多头自注意力网络代替多头自注意力网络以降低计算和内存开销。根据本发明的一个实施例,所述线性多头自注意力网络包括全局池化层、第一线性层、第二线性层、第三线性层和多头自注意力网络,其中:所述全局池化层用于对线性多头自注意力网络接收到的特征图进行维度变换后传递给第二线性层、第三线性层;所述第一线性层用于对所述线性多头自注意力网络接收到的特征图进行线性变换后传递给所述多头自注意力网络;所述第二线性层、第三线性层用于对经所述全局池化层处理后的特征图进行线性变换后传递给所述多头自注意力网络;所述多头自注意力网络用于对接收到的特征图进行处理以获得输入线性多头自注意力网络的特征图的全局依赖关系。线性多头自注意力网络之所以能够降低计算和内存开销是因为线性多头自注意力网络能够通过全局池化层将K,V下采样至常数,具体来说,其对输入序列长度,利用衰减因子进行序列变换,从而降低时间和内存复杂度以降低计算和内存开销。具体计算过程由下式表述:
SR(Z)=Norm(Reshape(Z,Ri))
其中,Z表示输入序列,包括和Norm表示归一化处理;Reshape(Z,Ri)表示将输入序列维度变换为Ri表示第i阶段特征提取模块的注意力层对输入序列衰减的衰减因子,即(常数),即内存复杂度和时间复杂度变为O(N),与输入序列的长度无关,从而获得了线性的时间复杂度和内存占用。需要说明的是,衰减因子的设置可以根据实际需求作出调整,本发明不做具体的限制。
所述第二归一化层用于对接收到的特征图进行归一化处理后传递给所述反向残差前馈网络。
所述反向残差前馈网络用于对接收到的特征图进行局部特征提取。设置反向残差前馈网络的原因在于:虽然Transformer中的自注意力机制可以捕获全局上下文,但其原始的前馈神经网络对每个元素(token)分别执行逐点操作,因此在局部特征方面受到限制。因此,本发明方案中引入了反向残差前馈网络来解决这个限制。具体来说,反向残差前馈网络在原始前馈神经网络中通过短连接(short connect)插入深度卷积,类似于倒置残差块,这样能够极大地提高模型的局部特征提取能力,而额外的计算开销可以忽略不计。根据本发明的一个实施例,所述反向残差前馈网络包括依次连接的第三卷积层、BatchNorm、第二激活函数、第二深度卷积层、BatchNorm、第三激活函数、第四卷积层和BatchNorm,其中,所述第三卷积层、第四卷积层的卷积核大小均为1,所述第二激活函数、第三激活函数均为GELU函数,所述第二深度卷积层的卷积核大小为11。需要说明的是,反向残差前馈网络中各个网络的参数设置可以根据实际需求作出调整,本发明不做具体的限制。
最终,所述特征提取子模块将经所述反向残差前馈网络处理后的特征图、经所述线性多头自注意力网络处理后的特征图以及经所述局部感知单元处理的特征图合并后作为输出。
3、分类器
所述分类器用于基于所述倒金字塔特征提取网络输出的特征图进行输入无线通信信号对应的调制类型的分类。根据本发明的一个实施例,所述分类器包括全局池化层(Global average pooling,GAP)或展平层(Flatten)、全连接层(fully-connect,FC)。
二、调制识别模型的训练过程
为了更好的理解本发明,下面对调制识别模型的训练过程作简要的说明。
本发明方案中,采用RadioML2016.10B、RadioRML2018.01A和HisarMod2019.1开源数据集对调制识别模型进行训练。针对每一个数据集,以6:2:2的比例将其划分为训练集、验证集与测试集,分别用于模型的训练、验证和测试,其中:
在模型训练过程中,采用训练集将调制识别模型训练至收敛,且训练方式为有监督学习方式,即训练集中所有样本均标注有与其对应调制类型的标签。
在验证过程中,采用验证集对调制识别模型进行测试以确定最优的模型训练参数,包含批次大小设置、优化器、最大迭代次数等,当模型在验证集上的精度随着迭代次数的增加,不再增加时认为模型已经收敛,则提前停止训练,防止模型出现过拟合效应。
在测试过程中,采用测试对训练好的调制识别模型进行测试,以评价调试识别模型的性能,当模型性能达到预设要求时,则认为模型性能表现良好。
需要说明的是,由于采用数据集对模型进行训练是本领域技术人员的常规技术手段,本发明在此不再赘述。
三、调制识别模型的评价过程
为了验证本发明所提出的模型的识别效果。下面采用VGG、MCNet、MSNet、ResNet、LSTM和Mcformer等神经网络中常见的网络结构作为基准模型,与基于前述第一部分内容得到的四种调制识别模型(PSTa、PSTb、PSTc、PSTd)执行相同的信号识别任务,并评价每一模型的识别性能。其中,如表1所示,Channels表示模型中四个阶段特征提取模块的特征的维度;Blocks表示四个阶段特征提取模块堆叠的特征提取子模块的个数;Heads表示四个阶段特征提取模块中每一特征提取子模块中线性多头自注意力网络使用的注意力的个数;isGA表示模型分类器中采用的是全连接层还是展平层,并且以打勾表示采用的是全连接层,打叉表示采用的是展平层。根据表一的内容可知,模型PSTa、PSTb、PSTc、PSTd的配置如下:
模型PSTa包括四个阶段的特征提取模块,即第一阶段特征提取模块、第二阶段特征提取模块、第三阶段特征提取模块、第四阶段特征提取模块,并且每个阶段的特征提取模块的特征的维度为16;每个阶段的特征提取模块包括一个特征提取子模块;第一阶段特征提取模块的特征提取子模块中线性多头自注意力网络使用的注意力个数为1;第二阶段特征提取模块的特征提取子模块中线性多头自注意力网络使用的注意力个数为2;第三阶段特征提取模块的特征提取子模块中线性多头自注意力网络使用的注意力个数为4;第四阶段特征提取模块的特征提取子模块中线性多头自注意力网络使用的注意力个数为8;模型分类器采用的是全连接层。
模型PSTb包括四个阶段的特征提取模块,即第一阶段特征提取模块、第二阶段特征提取模块、第三阶段特征提取模块、第四阶段特征提取模块,并且每个阶段的特征提取模块的特征的维度为32;每个阶段的特征提取模块包括一个特征提取子模块;第一阶段特征提取模块的特征提取子模块中线性多头自注意力网络使用的注意力个数为1;第二阶段特征提取模块的特征提取子模块中线性多头自注意力网络使用的注意力个数为2;第三阶段特征提取模块的特征提取子模块中线性多头自注意力网络使用的注意力个数为4;第四阶段特征提取模块的特征提取子模块中线性多头自注意力网络使用的注意力个数为8;模型分类器采用的是全连接层。
模型PSTc包括四个阶段的特征提取模块,即第一阶段特征提取模块、第二阶段特征提取模块、第三阶段特征提取模块、第四阶段特征提取模块,并且每个阶段的特征提取模块的特征的维度为32;每个阶段的特征提取模块包括一个特征提取子模块;第一阶段特征提取模块的特征提取子模块中线性多头自注意力网络使用的注意力个数为1;第二阶段特征提取模块的特征提取子模块中线性多头自注意力网络使用的注意力个数为2;第三阶段特征提取模块的特征提取子模块中线性多头自注意力网络使用的注意力个数为4;第四阶段特征提取模块的特征提取子模块中线性多头自注意力网络使用的注意力个数为8;模型分类器采用的是展平层。
模型PSTd包括四个阶段的特征提取模块,即第一阶段特征提取模块、第二阶段特征提取模块、第三阶段特征提取模块、第四阶段特征提取模块,并且每个阶段的特征提取模块的特征的维度为32;第一阶段特征提取模块、第二阶段特征提取模块以及第四阶段特征提取模块均包括两个特征提取子模块,第三阶段特征提取模块包括六个特征提取子模块;第一阶段特征提取模块所有的特征提取子模块中线性多头自注意力网络使用的注意力个数均为1;第二阶段特征提取模块所有的特征提取子模块中线性多头自注意力网络使用的注意力个数为均为2;第三阶段特征提取模块所有的特征提取子模块中线性多头自注意力网络使用的注意力个数均为4;第四阶段特征提取模块所有的特征提取子模块中线性多头自注意力网络使用的注意力个数均为8;模型分类器采用的是展平层。
表1
模型 | #Channels | #Blocks | #Heads | isGAP |
PSTa | {16,16,16,16} | {1,1,1,1} | {1,2,4,8} | √ |
PSTb | {32,32,32,32} | {1,1,1,1} | {1,2,4,8} | √ |
PSTc | {32,32,32,32} | {1,1,1,1} | {1,2,4,8} | × |
PSTd | {32,32,32,32} | {2,2,6,2} | {1,2,4,8} | × |
综合考虑四种调制识别模型参数的差异性,分别利用不同的数据集对其进行对比评价。
首先,采用数据集RadioML2016.10B比较模型PSTa相较于基准模型(VGG、MCNet、MSNet、ResNet、LSTM和Mcformer)是否可以有效地处理短序列、简单调制方式(低阶调制)的数据。数据集RadioML2016.10B由11种调制类型(8种数字和3种模拟)组成,信噪比(SNR)从-20dB到+18dB变化,间隔为2dB,每个信噪比(SNR)下每种调制类型的详细信息为1000个样本,总共包含1200000个样本,该数据集中包含的样本序列长度较短(样本长度为128)。分别使用基准模型(VGG、MCNet、MSNet、ResNet、LSTM和Mcformer)和模型PSTa处理数据集RadioML2016.10B,根据各个模型的处理结果得到如表2和图2所示的结果,其中:
表2表示在数据集RadioML2016.10B上不同模型的参数,如表2所示,模型PSTa与模型VGG相比,模型PSTa拥有更高的精度,计算开销减少了11倍,参数量减少了5.82倍,但内存成本高于模型VGG;模型PSTa与模型MCNet相比,模型PSTa拥有更高的精度,计算开销减少了3倍,参数量减少了3.68倍,但内存成本高于模型MCNet;模型PSTa与模型MSNet相比,模型PSTa拥有更高的精度,计算开销减少了9.3倍,参数量减少了4.32倍,且内存成本小于模型MSNet;模型PSTa与模型ResNet相比,PSTa的精度提高了1.15%,计算成本降低了20.6倍,参数降低了8.14倍;模型PSTa与模型LSTM相比,模型PSTa达到0.98%更高的精度提高,同时将计算开销减少89.6倍,参数量减少9.25倍,但内存成本略高;模型PSTa与模型MCformer相比,PSTa的准确率提高了1.2%,计算开销降低了23.8倍,参数降低了3.3倍,内存降低了11.1倍。
表2
图2表示在数据集RadioML2016.10B上各种信噪比(SNR)中测试不同模型的准确率对比示意图,且由图2可知,在不同的信噪比(SNR)中,模型PSTa的准确率优于其他基准模型。
综合表2和图2可知,模型PSTa相较于基准模型,其处理短序列、简单调制方式(低阶调制)的数据的能力更好,并且由于模型PSTa的参数量、计算量以及内存占用量都较低,能够满足在计算资源受限制的设备上使用。
其次,采用一个大而复杂的数据集RadioRML2018.01A比较模型PSTa、PSTb相较于基准模型(VGG、MCNet、MSNet、ResNet、LSTM和Mcformer)是否可以有效地处理极长的输入序列、较为复杂的高阶数字调制和模拟调制的数据。数据集RadioRML2018.01A由24种调制类型组成,信噪比从-20dB到+30dB变化,间隔为2dB,该数据集超过200万个样本,每个信噪比(SNR)下每种调制类型有4096个样本。分别使用基准模型(VGG、MCNet、MSNet、ResNet、LSTM和Mcformer)和模型PSTa、PSTb处理数据集RadioRML2018.01A,根据各个模型的处理结果得到如表3和图3所示的结果,其中:
表3表示在数据集RadioRML2018.01A上不同模型的参数,如表3所示,模型PSTa、PSTb与模型VGG相比,模型PSTa、PSTb拥有更高的精度,更小的计算量和参数量,但内存成本略高于模型VGG;模型PSTa、PSTb与模型MCNet相比,模型PSTa、PSTb拥有更高的精度,更小的计算量和参数量,但内存成本略高于模型MCNet;模型PSTa、PSTb与模型MSNet相比,模型PSTa、PSTb拥有更高的精度,更小的计算量和参数量,模型PSTa内存成本小于模型MSNet,模型PSTb内存成本略高于模型MSNet;模型PSTa、PSTb与ResNet相比,模型PSTa、PSTb拥有更高的精度,更小的计算量和参数量,且内存成本小于模型MCNet;模型PSTa、PSTb与模型LSTM相比,模型PSTa、PSTb拥有更高的精度,更小的计算量和参数量,但是模型PSTa、PSTb的内存成本高于模型LSTM;模型PSTa、PSTb与MCformer相比,模型PSTa、PSTb拥有更高的精度,模型PSTa的参数量小于模型Mcformer,模型PSTb与Mcformer参数量相当,模型PSTa、PSTb拥有更小的计算量和内存占用量。
表3
图3表示在数据集RadioRML2018.01A上各种信噪比(SNR)中测试不同模型的准确率,且由图3可知,在不同的信噪比(SNR)中,模型PSTa、PSTb的在低信噪比范围内(小于8dB)优于其他模型,在高信噪比下仅略逊于LSTM和MCformer。
综合表3和图3可知,模型PSTa、PSTb相较于基准模型,其处理长序列、较为复杂的高阶数字调制和模拟调制的数据的能力更好,并且由于模型PSTa、PSTb的参数量、计算量以及内存占用量都较低,能够满足在计算资源受限制的设备上使用。
最后,采用数据集HisarMod2019.1比较模型PSTc、PSTd相较于基准模型(VGG、MCNet、MSNet、ResNet、LSTM和Mcformer)是否可以有效地处理极长的输入序列、含有信道损伤的数据。数据集HisarMod2019.1由26种调制类型组成,信噪比(SNR)从-20dB到+20dB变化,间隔为2dB,其包含的信号长度为1024,包含5种衰落信道:AWGN、Static、Rayleigh、Rician和Nakagami,该数据集还包含一些其他的信号损伤,例如载波频率偏移和相位偏移等。分别使用基准模型(VGG、MCNet、MSNet、ResNet、LSTM和Mcformer)和模型PSTc、PSTd处理数据集HisarMod2019.1,根据各个模型的处理结果图4所示的结果,图4表示在数据集HisarMod2019.1各种信噪比(SNR)中测试不同模型的准确率,由图4可知,模型PSTc、PSTd在所有信噪比上都优于现有的基准模型,并且在低信噪比下它们的优势更加突出。例如,在-20dB的信噪比(SNR)下,模型PSTd达到了75%的准确率,远超第二名的ReNet(55%)和第三名的LSTM(45%)。同时,为了达到相同的识别率(75%),其他基准模型要求信噪比(SNR)至少为0dB,因此模型PSTd获得了至少20dB的性能增益。由于多头自注意力网络能够有效抵抗衰落信道,且与模型PSTc相比,模型PSTd在每阶段的特征提取模块中堆叠有更多的特征处理子模块,即模型PSTd中拥有更多的线性多头自注意力网络,又由于模型PSTd具有更高的精度,这证明了可以通过线性多头自注意力网络有效地抗衰落信道。
本发明的有益效果在于:采用逐阶段收缩的倒金字塔特征提取网络用以提取多尺度特征并减少计算量;采用线性多头自注意力网络代替多头自注意力网络实现了线性时间复杂度和内存使用,并且线性多头自注意力网络能对相关的特征进行软搜索,并从多个子空间中学习最适合决策的特征,从而使得模型更稳健(可容忍信道衰落);使用反向残差前馈网络来替换Transformer中的残差前馈网络,并引入局部感知单元和卷积模块提升模型对于局部特征的提取能力。
需要说明的是,虽然上文按照特定顺序描述了各个步骤,但是并不意味着必须按照上述特定顺序来执行各个步骤,实际上,这些步骤中的一些可以并发执行,甚至改变顺序,只要能够实现所需要的功能即可。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以包括但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (19)
1.一种调制识别模型,用于识别输入无线通信信号的调制类型,其特征在于,所述模型包括卷积模块、倒金字塔特征提取网络以及分类器,其中:
所述卷积模块用于对输入无线通信信号进行特征提取以获取其对应的第一特征图;
所述倒金字塔特征提取网络用于对所述第一特征图按照倒金字塔的规则进行特征提取,其中,所述倒金字塔特征提取网络包括多阶段的特征提取模块,相邻阶段的特征提取模块之间设置有尺度变换卷积层,所述每个尺度变换卷积层用于对接收到的上一阶段特征提取模块提取到的特征图进行尺度缩减变换并传递给下一阶段特征提取模块,所述每个阶段特征提取模块用于对输入其的特征图进行特征提取并将最后一个阶段特征提取模块提取到的特征图作为倒金字塔特征提取网络的输出;
所述分类器用于基于所述倒金字塔特征提取网络输出的特征图进行输入无线通信信号对应的调制类型的分类。
2.根据权利要求1所述的模型,其特征在于,所述卷积模块由依次连接的第一卷积层、BatchNorm、第一激活函数以及池化层组成。
3.根据权利要求2所述的模型,其特征在于,所述第一激活函数为RELU或者SELU函数;所述池化层为最大池化层。
4.根据权利要求3所述的模型,其特征在于,所述第一卷积层的卷积核大小为3、步长2,所述池化层的卷积核大小为3、步长为2。
5.根据权利要求4所述的模型,其特征在于,所述卷积模块与所述倒金字塔特征提取网络之间设置有第二卷积层,所述第二卷积层用于提取所述第一特征图的局部特征。
6.根据权利要求5所述的模型,其特征在于,所述倒金字塔特征提取网络包括依次连接的第一阶段特征提取模块、第二阶段特征提取模块、第三阶段特征提取模块和第四阶段特征提取模块。
7.根据权利要求6所述的模型,其特征在于,所述每个尺度变换卷积层的卷积核大小均为3、步长均为2。
8.根据权利要求7所述的模型,其特征在于,所述每个阶段的特征提取模块包括一个或多个特征提取子模块。
9.根据权利要求8所述的模型,其特征在于,所述特征提取子模块为Transformer。
10.根据权利要求8所述的模型,其特征在于,所述特征提取子模块包括依次连接的局部感知单元、第一归一化层、线性多头自注意力网络、第二归一化层和反向残差前馈网络,其中:
所述局部感知单元用于对输入的特征图进行局部特征提取并将其与输入的特征图合并后传递给所述第一归一化层和所述第二归一化层;
所述第一归一化层用于对接收到的特征图进行归一化处理后传递给所述线性多头自注意力网络;
所述线性多头自注意力网络用于对接收到的特征图进行处理以捕获输入特征提取子模块的特征图的全局依赖关系,并将处理后的特征图传递给第二归一化层;
所述第二归一化层用于对接收到的特征图进行归一化处理后传递给所述反向残差前馈网络;
所述反向残差前馈网络用于对接收到的特征图进行局部特征提取;
其中,所述特征提取子模块还将经所述反向残差前馈网络处理后的特征图、经所述线性多头自注意力网络处理后的特征图以及经所述局部感知单元处理的特征图合并后作为输出。
11.根据权利要求10所述的模型,其特征在于,所述局部感知单元包括第一深度卷积层,其卷积核大小为3。
12.根据权利要求11所述的模型,其特征在于,所述线性多头自注意力网络包括全局池化层、第一线性层、第二线性层、第三线性层和多头自注意力网络,其中:
所述全局池化层用于对线性多头自注意力网络接收到的特征图进行维度变换后传递给第二线性层、第三线性层;
所述第一线性层用于对所述线性多头自注意力网络接收到的特征图进行线性变换后传递给所述多头自注意力网络;
所述第二线性层、第三线性层用于对经所述全局池化层处理后的特征图进行线性变换后传递给所述多头自注意力网络;
所述多头自注意力网络用于对接收到的特征图进行处理以获得输入线性多头自注意力网络的特征图的全局依赖关系。
13.根据权利要求12所述的模型,其特征在于,所述反向残差前馈网络包括依次连接的第三卷积层、BatchNorm、第二激活函数、第二深度卷积层、BatchNorm、第三激活函数、第四卷积层和BatchNorm。
14.根据权利要求13所述的模型,其特征在于,所述第三卷积层、第四卷积层的卷积核大小均为1,所述第二激活函数、第三激活函数均为GELU函数,所述第二深度卷积层的卷积核大小为11。
15.根据权利要求1所述的模型,其特征在于,所述分类器包括全局池化层或展平层、全连接层。
16.一种调制识别模型的训练方法,其特征在于,所述方法包括如下步骤:
S1、获取训练集,所述训练集包括多个调制信号,且每个调制信号中标记有该信号对应的调制类别标签;
S2、采用步骤S1得到的训练集将如权利要求1-15任一所述的模型训练至收敛。
17.一种信号调制处理方法,其特征在于,所述方法包括如下步骤:
T1、获取待处理信号;
T2、采用如权利要求1-15任一所述的模型对待处理信号进行处理以识别其调制类型。
18.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序可被处理器执行以实现权利要求16、17中任一所述方法的步骤。
19.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现如权利要求16、17中任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310056757.1A CN116055270B (zh) | 2023-01-16 | 2023-01-16 | 一种调制识别模型及其训练方法、信号调制处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310056757.1A CN116055270B (zh) | 2023-01-16 | 2023-01-16 | 一种调制识别模型及其训练方法、信号调制处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116055270A true CN116055270A (zh) | 2023-05-02 |
CN116055270B CN116055270B (zh) | 2024-06-11 |
Family
ID=86121770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310056757.1A Active CN116055270B (zh) | 2023-01-16 | 2023-01-16 | 一种调制识别模型及其训练方法、信号调制处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116055270B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117743946A (zh) * | 2024-02-19 | 2024-03-22 | 山东大学 | 基于融合特征和组卷积ViT网络的信号类型识别方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200260306A1 (en) * | 2013-03-15 | 2020-08-13 | Digital Global Systems, Inc. | Systems, methods, and devices for automatic signal detection with temporal feature extraction within a spectrum |
CN112308133A (zh) * | 2020-10-29 | 2021-02-02 | 成都明杰科技有限公司 | 基于卷积神经网络的调制识别方法 |
CN113239788A (zh) * | 2021-05-11 | 2021-08-10 | 嘉兴学院 | 一种基于Mask R-CNN的无线通信调制模式识别方法 |
CN113298031A (zh) * | 2021-06-16 | 2021-08-24 | 中国人民解放军国防科技大学 | 一种考虑信号物理和时序特性的信号调制识别方法及应用 |
CN113627401A (zh) * | 2021-10-12 | 2021-11-09 | 四川大学 | 融合双注意力机制的特征金字塔网络的肌电手势识别方法 |
CN113902095A (zh) * | 2021-09-28 | 2022-01-07 | 中国科学院计算技术研究所 | 一种无线通信自动调制识别方法、装置与系统 |
CN114553648A (zh) * | 2022-01-26 | 2022-05-27 | 嘉兴学院 | 基于时空图卷积神经网络的无线通信调制模式识别方法 |
CN114881092A (zh) * | 2022-06-16 | 2022-08-09 | 杭州电子科技大学 | 一种基于特征融合的信号调制识别方法 |
CN114912489A (zh) * | 2022-05-09 | 2022-08-16 | 中国人民解放军空军工程大学 | 一种信号调制识别方法 |
CN115238748A (zh) * | 2022-08-04 | 2022-10-25 | 中国人民解放军军事科学院系统工程研究院 | 一种基于Transformer和决策融合的调制识别方法 |
CN115238749A (zh) * | 2022-08-04 | 2022-10-25 | 中国人民解放军军事科学院系统工程研究院 | 一种基于Transformer的特征融合的调制识别方法 |
-
2023
- 2023-01-16 CN CN202310056757.1A patent/CN116055270B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200260306A1 (en) * | 2013-03-15 | 2020-08-13 | Digital Global Systems, Inc. | Systems, methods, and devices for automatic signal detection with temporal feature extraction within a spectrum |
CN112308133A (zh) * | 2020-10-29 | 2021-02-02 | 成都明杰科技有限公司 | 基于卷积神经网络的调制识别方法 |
CN113239788A (zh) * | 2021-05-11 | 2021-08-10 | 嘉兴学院 | 一种基于Mask R-CNN的无线通信调制模式识别方法 |
CN113298031A (zh) * | 2021-06-16 | 2021-08-24 | 中国人民解放军国防科技大学 | 一种考虑信号物理和时序特性的信号调制识别方法及应用 |
CN113902095A (zh) * | 2021-09-28 | 2022-01-07 | 中国科学院计算技术研究所 | 一种无线通信自动调制识别方法、装置与系统 |
CN113627401A (zh) * | 2021-10-12 | 2021-11-09 | 四川大学 | 融合双注意力机制的特征金字塔网络的肌电手势识别方法 |
CN114553648A (zh) * | 2022-01-26 | 2022-05-27 | 嘉兴学院 | 基于时空图卷积神经网络的无线通信调制模式识别方法 |
CN114912489A (zh) * | 2022-05-09 | 2022-08-16 | 中国人民解放军空军工程大学 | 一种信号调制识别方法 |
CN114881092A (zh) * | 2022-06-16 | 2022-08-09 | 杭州电子科技大学 | 一种基于特征融合的信号调制识别方法 |
CN115238748A (zh) * | 2022-08-04 | 2022-10-25 | 中国人民解放军军事科学院系统工程研究院 | 一种基于Transformer和决策融合的调制识别方法 |
CN115238749A (zh) * | 2022-08-04 | 2022-10-25 | 中国人民解放军军事科学院系统工程研究院 | 一种基于Transformer的特征融合的调制识别方法 |
Non-Patent Citations (4)
Title |
---|
XIAOJIE FAN: ""Joint Optical Performance Monitoring and Modulation Format/Bit-Rate Identification by CNN-Based Multi-Task Learning"", 《 IEEE PHOTONICS JOURNAL》, 12 September 2018 (2018-09-12) * |
李书恋;郑美芳;杨林森;: "基于卷积神经网络的调制信号识别", 科技经济导刊, no. 27, 25 September 2020 (2020-09-25) * |
杨洁;夏卉;: "基于卷积神经网络的通信信号调制识别研究", 计算机测量与控制, no. 07, 25 July 2020 (2020-07-25) * |
钱磊: ""基于数值特征与图像特征融合的调制识别方法"", 《电子技术应用》, 6 November 2022 (2022-11-06) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117743946A (zh) * | 2024-02-19 | 2024-03-22 | 山东大学 | 基于融合特征和组卷积ViT网络的信号类型识别方法及系统 |
CN117743946B (zh) * | 2024-02-19 | 2024-04-30 | 山东大学 | 基于融合特征和组卷积ViT网络的信号类型识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116055270B (zh) | 2024-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190042743A1 (en) | Malware detection and classification using artificial neural network | |
CN109495214B (zh) | 基于一维Inception结构的信道编码类型识别方法 | |
CN111460936A (zh) | 基于U-Net网络的遥感影像建筑物提取方法、系统、电子设备 | |
CN107491729B (zh) | 基于余弦相似度激活的卷积神经网络的手写数字识别方法 | |
CN112232395B (zh) | 一种基于联合训练生成对抗网络的半监督图像分类方法 | |
CN111753995B (zh) | 一种基于梯度提升树的局部可解释方法 | |
Chen et al. | Convolutional neural network for classification of solar radio spectrum | |
CN116055270B (zh) | 一种调制识别模型及其训练方法、信号调制处理方法 | |
CN112183742A (zh) | 基于渐进式量化和Hessian信息的神经网络混合量化方法 | |
CN112949481A (zh) | 一种用于说话人无关的唇语识别方法及系统 | |
CN115659254A (zh) | 一种双模态特征融合的配电网电能质量扰动分析方法 | |
CN110781822B (zh) | 基于自适应多方位角字典对学习的sar图像目标识别方法 | |
CN111046896A (zh) | 一种跳频信号电台分选方法 | |
CN115982613A (zh) | 一种基于改进卷积神经网络的信号调制识别系统及方法 | |
CN115359294A (zh) | 一种基于相似性正则化类内挖掘的跨粒度小样本学习方法 | |
CN111242028A (zh) | 基于U-Net的遥感图像地物分割方法 | |
CN118260571A (zh) | 基于多模态特征融合和深度学习的卫星信号个体识别方法 | |
CN112464836A (zh) | 一种基于稀疏表示学习的ais辐射源个体识别方法 | |
CN110995631B (zh) | 一种基于lstm和svm的通信信号调制模式识别方法及系统 | |
CN116614333A (zh) | 一种基于马尔可夫转换场与深度学习的调制识别方法 | |
CN113343924B (zh) | 一种基于循环谱特征和生成对抗网络的调制信号识别方法 | |
CN113364540B (zh) | 基于堆栈降噪自编码的lte上行干扰分类方法及系统 | |
CN115329821A (zh) | 一种基于配对编码网络和对比学习的舰船噪声识别方法 | |
CN112132007B (zh) | 一种基于ResNet-SVM的调制方式识别方法及系统 | |
CN118038185B (zh) | 一种基于多样化自适应知识蒸馏的图像分类方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |