CN116257750A - 一种基于样本增强和深度学习的射频指纹识别方法 - Google Patents
一种基于样本增强和深度学习的射频指纹识别方法 Download PDFInfo
- Publication number
- CN116257750A CN116257750A CN202310119656.4A CN202310119656A CN116257750A CN 116257750 A CN116257750 A CN 116257750A CN 202310119656 A CN202310119656 A CN 202310119656A CN 116257750 A CN116257750 A CN 116257750A
- Authority
- CN
- China
- Prior art keywords
- network
- data
- domain
- training
- radio frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000013135 deep learning Methods 0.000 title claims description 16
- 238000012549 training Methods 0.000 claims abstract description 107
- 238000012360 testing method Methods 0.000 claims abstract description 31
- 238000004891 communication Methods 0.000 claims abstract description 24
- 238000013528 artificial neural network Methods 0.000 claims abstract description 23
- 230000008569 process Effects 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 230000010354 integration Effects 0.000 claims abstract description 4
- 238000011176 pooling Methods 0.000 claims description 42
- 230000006870 function Effects 0.000 claims description 27
- 238000000605 extraction Methods 0.000 claims description 23
- 238000009826 distribution Methods 0.000 claims description 16
- 230000007704 transition Effects 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000013526 transfer learning Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 238000013508 migration Methods 0.000 claims description 4
- 230000005012 migration Effects 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 230000003042 antagnostic effect Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 2
- 230000004069 differentiation Effects 0.000 claims 1
- 238000013527 convolutional neural network Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000011161 development Methods 0.000 description 7
- 230000008034 disappearance Effects 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005562 fading Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000725302 Adult diarrheal rotavirus Species 0.000 description 1
- 241000893313 Helochara delta Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
一种基于样本增强和深度学习的射频指纹识别方法,S1、从无线通信设备接收端采集原始射频数据并存储到PC端;S2、将无线通信设备接收端采集到的Raw‑IQ数据样本进行预处理,将数据划分为训练集和测试集,再进一步将训练集划分为源域和目标域;S3、构建DSEN‑TL神经网络并输入训练集对其进行训练,训练过程中判定H散度是否达到平衡,若过大或者过小则须调整射频个体识别网络和域分类网络的层数和参数重新训练,优化损失函数;S4、将测试集输入DSEN‑TL网络并输出设备识别类型;S5、将训练好的DSEN‑TL网络嵌入实际板级系统进行测试,在收发数据的同时准确识别射频设备个体,实现通信感知一体化。
Description
技术领域
本发明属于神经网络和射频指纹识别技术领域,具体涉及一种基于样本增强和深度学习的射频指纹识别方法。
背景技术
随着无线通信技术的高速发展,信号环境日益密集,无线通信设备的数量呈现指数级增长,随之便出现了军用和民用领域中设备隐私安全性方面的挑战。例如,在人机协同的宽带自组网基带收发机中,由于成本和功耗等的限制,发射机向接收机传输的数据往往是不加密或者弱加密的,这就带来了安全隐患。由于无线电电路中不可避免会存在一些微小的硬件级缺陷,且电子元器件和印刷电路板在制造和使用过程中会存在制造容差和漂移容差,因此无线通信设备的射频指纹识别技术可以通过提取射频信号中的特征达到识别无线电子设备的目的。
射频指纹识别方法主要包括人工特征提取识别和机器学习识别。特征提取通过统计信号的瞬时幅度、频率、相位信息对其时域、频域和功率谱等进行分析,提取一定的统计特征作为识别依据。随着人工智能技术的发展,深度学习和通信领域的结合越来越密切,在信号调制识别方面有较为成功的进展,而射频指纹识别本质上也是一种模式识别。深度学习的特点在于构建合适的深层网络结构,通过每一层中的非线性激活变换完成原始数据特征的选择和提取。借助深度神经网络的自学习机制,能够提高复杂环境下的通信设备识别率问题,解决噪声、干扰、衰落、码间串扰,以及硬件缺陷等各种实时环境因素的影响,是研究射频指纹识别技术的必然趋势。深度学习方法中应用于射频指纹识别的方法主要有卷积神经网络(CNN)和循环神经网络(RNN)等。
目前的射频指纹识别领域存在如下问题:(1)随着CNN网络越来越深,传统的CNN需要大量的训练数据且训练时间较长,训练过程中随着层数的增加,梯度几乎不会增加,从而导致梯度消失的问题,因此识别精度下降。(2)传统的数据预处理方式是先对Raw-IQ数据进行时间同步、频率偏移补偿、相位补偿等操作再输入神经网络模型,但是这些方式预处理之后的数据特征可能会覆盖原始IQ数据中的射频指纹特征。(3)虽然CNN、ResNet、LSTM等网络已经获得了较好的识别准确率,有研究已对不同信噪比(SNR)的数据做数据增强,但仍未深入考虑射频指纹识别领域的难题:训练数据与测试数据不在同一天采集、使用不同接收机采集数据,都将会导致训练集和测试集分布之间的差异,从而使得深度学习模型性能恶化,网络模型鲁棒性较差。
发明内容
本发明目的是,为了克服上述传统CNN网络梯度消失、训练时间和计算成本过大的问题,本发明提出一种将密集连接卷积网络(DenseNet)算法应用于无线通信设备射频指纹识别的方法,并采集了设备接收端原始的IQ样本(Raw-IQ,表示的是信号的某段时间,各等间隔采样时刻下的瞬时IQ值。单个IQ样本点表示的是某瞬时时刻下该信号的IQ瞬时值),通过迁移学习(Transfer Learning,TL)进行样本增强,增加了在不同日期采集数据、采用不同接收机接收同一射频源数据时训练集和测试集分布存在较大差异情况下的泛化能力。本发明将该神经网络命名为DSEN-TL网络,为所用的深度学习网络DenseNet(密集连接卷积网络)简化的缩写。
为达到上述发明目的,本发明通过以下技术方案实现:一种基于样本增强和深度学习的射频指纹识别方法,包括以下步骤:
步骤S1、从无线通信设备接收端采集原始射频数据并存储到PC端;
步骤S2、将无线通信设备接收端采集到的Raw-IQ数据样本进行预处理,将数据划分为训练集和测试集,再进一步将训练集划分为源域和目标域;
步骤S3、构建DSEN-TL神经网络并输入训练集对其进行训练,训练过程中判定H散度是否达到平衡,若过大或者过小则须调整射频个体识别网络和域分类网络的层数和参数重新训练,优化损失函数;
步骤S4、将测试集输入DSEN-TL网络并输出设备识别类型;
步骤S5、将训练好的DSEN-TL网络嵌入实际板级系统进行测试,在收发数据的同时准确识别射频设备个体,实现通信感知一体化。
进一步地,所述步骤S1中无线通信设备采用的是AD的官方开发板ADRV9361-Z7035,搭建的测试平台包括4个发射机和4个接收机,分别标号为T1-T4和R1-R4。具体的数据采集方式为:发射机通过天线发射数据,接收机实时连续捕获空口原始IQ样本,并存为文件传输到PC端。数据集使用的是IEEE802.11a(WiFi)标准传输的IQ样本。为了增加鲁棒性,采集了不同日期、不同距离下不同设备发射的数据集和不同接收机接收同一射频源的数据集。
进一步地,所述步骤S2中数据样本预处理和数据划分的具体步骤为:
S21、将不同日期采集的数据先划分为训练集和测试集,其比例为8:2,再进一步将训练集划分为源域和目标域。对不同日期采集的训练集作以下划分:先把第一天采集的数据设为初始源域(D1),其为有标签的训练信号(训练集X1),将第二天采集的数据设为初始目标域(D2),其为无标签的待识别信号(训练集X2)。第一天和第二天完成一轮训练测试之后得到一轮网络参数,再把第三天采集的数据设为新目标域(D3,即训练集X3)进行训练,以此类推,直到达到较高的准确率。同样的,对同一射频源不同接收机采集的数据作以下划分:先把所有采集到的数据划分为8:2的训练集和测试集,然后先把R1采集的数据作为初始源域(DR1,即训练集XR1),R2采集的数据作为初始目标域(DR2,即训练集XR2),训练测试过后设置新的目标域。源域和目标域具有相同射频源的指纹特征和类别,但是由于不同日期、不同接收机采集的数据样本特征分布不一致,会导致传统神经网络性能的恶化。通过迁移学习,源域信号学习到的识别网络对目标域有较好识别效果。
S22、Raw-IQ数据样本是未经处理过的原始数据,其未发生信息流失,也未对其中不利于射频指纹识别的混杂因素进行抑制。将捕获到的Raw-IQ样本预处理为2×1024的二维数组,Raw-IQ样本的第一行是同相采样,第二行是正交采样。训练集将以1×2×1024的黑白图片形式馈入DenseNet神经网络。
进一步地,所述步骤S3中DSEN-TL神经网络包括三个部分:DenseNet特征提取网络、射频指纹个体识别网络和域分类网络。
进一步地,所述步骤S3中DenseNet特征提取网络具体结构如下:
S31、DenseNet特征提取网络包含依次连接的输入层、第一卷积层、第一池化层、3个DenseBlock模块和其包含的2个过渡层和第二池化层。第一轮训练时网络的输入层包括带有标签的源域信号D1(第一天采集的训练信号)和不带标签的目标域信号D2(第二天采集的待识别信号)。
S311、第一卷积层的输入是2×N的二维数据,用来提取输入数据中的隐含特征,使用Conv2D对数据进行二维卷积。第一池化层选择MaxPool最大池化策略,计算局部最大值。具体来说,先经过BN层,再经过ReLU激活函数层,最后进行池化区域大小为(2×3)且步长为(2×2)的最大池化,为模型降低计算的参数量并减小过拟合。
S312、DenseBlock模块数量为3,每个DenseNet网络包含5个卷积层,每个卷积层由a个维度为(b,c)的卷积层组成。与ResNet网络相比,DenseNet网络不是通过求和来传递特征,而是每经过一次卷积就通过拼接操作将之前每层卷积的输入拼接起来,作为新的输入送给下一卷积层。DenseNet不是从极深或极宽的架构中汲取表征能力,而是通过特征重用利用网络的潜力,产生易于训练且参数效率高的浓缩模型,通过连接不同层学习的特征图增加了后续层输入的变化并提高了效率。每两个DenseNet中间使用一个过渡层,过渡层结构为BN-ReLU-AveragePool,采用池化区域大小为(2×2)且步长为(2×2)的均值池化。过渡层不仅有连接两个DenseBlock模块的作用,还可以通过减少前一个DenseBlock模块输入过渡层的特征图数量来减小模型宽度使得模型更简洁。
S313、第二池化层选择MaxPool最大池化策略,进行池化区域大小为(2×3)且步长为(2×2)的最大池化。经过最大池化后的数据分别输入射频指纹个体识别网络和域分类网络,分别进行源域和目标域的训练和迁移学习。
进一步地,所述步骤S3中射频指纹个体识别网络和域分类网络具体如下:
S32、源域数据从第二池化层中提取到的特征向量f会输入到射频指纹个体识别网络,最终得到射频设备标签y,即射频指纹识别结果。同时源域信号和目标域信号的特征向量会共同输入到域分类网络中,得到域标签d。
S321、射频指纹个体识别网络包含两个全连接层,用Softmax函数作为输出层计算每个类别的概率,并输出y1到ym,表示识别到m种不同设备的概率。同时,在全连接层之前加入丢弃因子(Dropout)技术,将Dropout系数设置为0.5,即同一时刻只有一半的神经元处于激活状态,防止训练过程中因神经网络过深、训练时间过长或者没有足够数据而导致的过拟合现象。
S322、域识别网络包含梯度反转层(GRL)、全连接层和SoftMax分类器。输入域分类网络层之前的特征向量都要通过一个梯度反转层(GRL),该层在前向传播中是个恒等变换,反向传播时会自动实现梯度反转。梯度反转通过对域分类器的损失乘上一负系数δ,使得其前后网络的训练目标相反,达到和生成对抗网络(GAN)类似的生成对抗效果,即特征提取网络Gf和域分类网络Gd的训练目标是对抗的。δ在训练阶段,取值会随着迭代次数的增加从0变化到1,如下式所示:
进一步地,所述步骤S3中所述的H散度是为衡量D1和D2分布差异而设定的度量准则,可以由其判别数据样本属于源域还是目标域,从而得出分类网络能迁移到目标域上的条件,即需要同时最小化H散度和在源域及目标域上的分类误差之和。当H散度足够大时,源域和目标域数据间的数据差异很大,极易区分,此时分类误差极小。但为将网络迁移到目标域上,又要使得源域和目标域间的区别更小,保证两域数据分布近似,因而网络在训练阶段是一个类似生成对抗网络(GAN)的对抗优化过程。
H散度提供了一种量化描述不同领域差异的方法,即用其中一个领域的数据训练出来的分类器,在两个领域上预测结果,其结果的差异作为这两个领域差异的上界(UpperBound)。
进一步地,所述步骤S3中需要优化的损失函数是结合特征提取网络、射频指纹个体识别网络和域分类网络的参数得到的。通过优化整个模型的损失函数,可以使得特征提取网络提取到既具有区分度又有域不变性的特征,由此解决不同日期、不同接收端信号分布不一致的问题。在训练过程中,需要平衡射频指纹个体识别网络和域分类网络。具体来说,在H散度较大,即两个域很容易区分开时,会导致域分类器的网络训练过好,导致梯度回传的时候占比太小不起作用,无法引导特征提取网络提取到具有域不变性的特征,这时就需要通过调整两个网络的层数和节点数来降低域分类器的性能。
本发明的有益效果:本发明采集了原始IQ样本(Raw-IQ),构建了DSEN-TL网络,通过特征重用缓解了传统CNN网络中的梯度消失的问题,减少了训练参数和训练时间,并且通过迁移学习进行样本增强,增加了射频指纹识别网络的鲁棒性。还有如下特点:
(1)使用密集连接卷积神经网络(DenseNet)进行射频指纹识别,在传统CNN的基础上,将之前各尺度层的特征融合,更有效地利用了特征(feature),缓解了梯度消失的问题,减少了训练参数和训练时间。
(2)数据集采用原始样本(Raw-IQ),未发生信息流失,也未对其中不利于射频指纹识别的混杂因素进行抑制。传统射频指纹识别虽然也采取了样本增强的方式,比如添加噪声、建立信道衰落模型、频率偏移模拟、伪随机积分等,但未考虑不同日期、不同接收端数据的识别。本发明使用迁移学习训练了不同日期、不同接收端的样本,增加了无线通信设备射频指纹识别网络的鲁棒性,且具有移动性。
(3)已嵌入小型无线宽带自组网基带系统,可进一步应用于大规模通信感知一体化智能通信领域中。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明的技术流程图。
图2是本发明的系统结构图和数据捕获结构图。
图3是本发明的基带接收机结构示意图。
图4A是本发明的不同日期采集数据集划分示意图。,图4B为不同接收机采集数据集划分示意图。
图5是本发明构建的DSN-TL网络结构示意图。
图6是本发明的DSN-TL网络结构中DenseBlock模块连接示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明。
下面结合附图详细说明本发明的具体实施方式。
如图1所示,一种基于样本增强和深度学习的射频指纹识别方法包括如下步骤:
步骤S1、从无线通信设备接收端采集原始射频数据并存储到PC端;
步骤S2、将无线通信设备接收端采集到的Raw-IQ数据样本进行预处理,将数据划分为训练集和测试集,再进一步将训练集划分为源域和目标域;
步骤S3、构建DSEN-TL神经网络并输入训练集对其进行训练,训练过程中判定H散度是否达到平衡,若过大或者过小则须调整射频个体识别网络和域分类网络的层数和参数重新训练,优化损失函数;
步骤S4、将测试集输入DSEN-TL网络并输出设备识别类型;
步骤S5、将训练好的DSEN-TL网络嵌入实际板级系统进行测试,在收发数据的同时准确识别射频设备个体,实现通信感知一体化。
如图2所示,本文的数据集来源是基于802.11a(WiFi)物理层传输协议搭建的一套2×2MIMO无线通信系统,该系统在MATLAB理论仿真的基础上进行FPGA硬件实现,并利用AD官方开发板ADRV9361-Z7035进行板级测试。ADRV9361-Z7035结合了Analog DevicesAD9361集成射频捷变收发器与Xilinx Z7035 Zynq-7000All Programmable SoC,在70MHz至6GHz范围内提供宽带2×2接收和发送路径。由于AD9361具有自动增益控制(AGC)功能,在调整好AGC参数之后,可以在移动设备的情况下仍保持接收端低于1%的误码率,便于移动环境下数据的采集。
如图3所示是基带接收机结构示意图,本发明的样本采集点在对数据ADC之后、定时同步之前。WiFi标准使用正交频分复用(OFDM)并因此使用多个子载波来发送每个数字符号,可以使用BPSK、QPSK、16QAM或64QAM调制,具有不同级别的卷积编码(1/2或者3/4)。L-STF为传统短训练字段,主要用于初始定时同步、初始频偏估计以及AGC的设置。L-LTF为传统长训练字段,主要用于精确定时同步、精确频偏估计以及信道估计。发送端通过CRC、加扰、BCC编码、打孔交织、调制、IFFT、循环移位、插CP等模块对原始数据进行处理。接收端通过粗同步、频偏估计、FFT、信道估计、最大比合并、解码等模块得到接收数据。
本发明的数据样本以2.4GHz的中心频率发出,并以20MHz采样率传输,调制编码方式采用MCS0(即BPSK调制,码率为1/2),传输速率约为5.34Mbps。在接收端设置增益控制方式为AGC,可以在改变天线距离且慢速移动设备的情况下保持接收信号的幅值和功率稳定,增加所采集数据的多样性。
进一步地,所述步骤S1中样本导出的具体步骤为:
S11、不同日期在室内空旷楼道对不同距离的不同设备进行数据采集。第一天,在空旷的楼道内固定好接收机R1,然后先把发射机T1放在距离R1为1m的位置,进行时长为30s的数据捕获;接着将T1缓慢移动到距离R1为5m的位置,再进行30s数据捕获;最后将T1缓慢移动到距离R1为10m的位置,再进行30s数据捕获。接着将发射机依次换成T2、T3、T4,再重复上述过程。第2天在同样的时间和同样的地点固定接收机并换不同的发射机重复第一天的捕获过程。接下来,在同一天内,在固定位置固定发射机T1,先在分别在1m、5m、10m的位置放置接收机R1,再同样的分别放置R2、R3、R4。
S12、单台设备捕获准备过程:将官方开发板ADRV9361-Z7035通过串口线、网线连接至主机并上电,在板上linux系统中启动发送数据开关,并确定接收端数据正常接收。
S13、在板上linux系统中运行python捕获程序,将开发板实时接收到的空口数据保存为txt文件并传输到PC端,文件中保存实时的I路和Q路数据。
如图4A和图4B所示是步骤2中的数据样本划分的具体步骤:
S21、将不同日期采集的数据先划分训练集和测试集,其比例为8:2,再进一步将训练集划分为源域和目标域。对不同日期采集的训练集作以下划分:先把第一天采集的数据设为初始源域(D1),其为有标签的训练信号(训练集X1),将第二天采集的数据设为初始目标域(D2),其为无标签的待识别信号(训练集X2)。第一天和第二天完成一轮训练测试之后得到一轮网络参数,再把第三天采集的数据设为新目标域(D3,即训练集X3)进行训练,以此类推,直到达到较高的准确率。同样的,对同一射频源不同接收机采集的数据作以下划分:先把所有采集到的数据划分为8:2的训练集和测试集,然后先把R1采集的数据作为初始源域(DR1,即训练集XR1),R2采集的数据作为初始目标域(DR2,即训练集XR2),训练测试过后设置新的目标域。源域和目标域具有相同射频源的指纹特征和类别,但是由于不同日期、不同接收机采集的数据样本特征分布不一致,会导致传统神经网络性能的恶化。通过迁移学习,源域信号学习到的识别网络对目标域有较好识别效果。
S22、Raw-IQ数据样本是未经定时同步、频率校正、FFT、信道估计与均衡等处理过的原始数据,其未发生信息流失,也未对其中不利于射频指纹识别的混杂因素进行抑制。将捕获到的Raw-IQ样本预处理为2×1024的二维数组,Raw-IQ样本的第一行是同相采样,第二行是正交采样。训练集将以1×2×1024的黑白图片形式馈入DenseNet神经网络。
如图5所示,所述步骤S3中DSEN-TL神经网络包括三个部分:DenseNet特征提取网络、射频指纹个体识别网络和域分类网络。
S31、DenseNet特征提取网络包含依次连接的输入层、第一卷积层、第一池化层、3个DenseBlock模块和其包含的2个过渡层和第二池化层。第一轮训练时网络的输入层包括带有标签的源域信号D1(第一天采集的训练信号)和不带标签的目标域信号D2(第二天采集的待识别信号)。
S311、第一卷积层的输入是2×N的二维数据,用来提取输入数据中的隐含特征,使用Conv2D对数据进行二维卷积。卷积神经网络中每层的神经元只与前一层网络的部分神经元节点相连,且同一层中的神经元的参数共享,具有局部感知、权重共享和移位不变性的特点。第一池化层选择MaxPool最大池化策略,计算局部最大值。具体来说,先经过BN层,再经过ReLU激活函数层,最后进行池化区域大小为(2×3)且步长为(2×2)的最大池化,为模型降低计算的参数量并减小过拟合。
S312、DenseBlock模块数量为3,如图6所示,每个DenseNet网络包含5个卷积层,第1个卷积层由32个维度为(1,3)的卷积核组成,第2个卷积层由32个维度为(2,3)的卷积核组成,第3个卷积层由32个维度为(1,3)的卷积核组成,第4个卷积层由32个维度为(2,3)的卷积核组成,第5个卷积层由32个维度为(2,3)的卷积核组成。与ResNet网络相比,DenseNet网络不是通过求和来传递特征,而是每经过一次卷积就通过拼接操作将之前每层卷积的输入拼接起来,作为新的输入送给下一卷积层。DenseNet不是从极深或极宽的架构中汲取表征能力,而是通过特征重用利用网络的潜力,产生易于训练且参数效率高的浓缩模型,通过连接不同层学习的特征图增加了后续层输入的变化并提高了效率。具体来说,第一个卷积层的输入为原始输入x0,并输出x1;第二个卷积层的输入为x0和x1拼接成的新矩阵,网络输出为x2;第三层的输入为x0、x1和x2拼接成的新矩阵,依次类推。每一层的输入都来自之前所有层的输出,会连接前面所有的层作为输入:
xl=Hl([x0,x1,…,xl-1])
Hl(·)代表非线性转化函数,它是一个组合操作,其包括一系列的BN(BatchNormalization),ReLU及Conv操作。xl代表第l层的输出。每个神经网络层都会从输入数据中提取特征,随着层深度的增加特征会变得更明显。特征传递方式是直接将前面所有层的特征concat后传到下一层,而不是前面层都要有一个箭头指向后面的所有层。ReLU表示激活函数为ReLU函数的激活层,5个卷积层均使用ReLU函数可有利于非线性拟合。
每两个DenseNet中间使用一个过渡层,过渡层结构为BN-ReLU-AveragePool,采用池化区域大小为(2×2)且步长为(2×2)的均值池化。过渡层不仅有连接两个DenseBlock模块的作用,还可以通过减少前一个DenseBlock模块输入过渡层的特征图数量来减小模型宽度使得模型更简洁。
S313、第二池化层选择MaxPool最大池化策略,进行池化区域大小为(2×3)且步长为(2×2)的最大池化。经过最大池化后的数据分别输入射频指纹个体识别网络和域分类网络,分别进行源域和目标域的训练和迁移学习。
进一步地,所述步骤S3中射频指纹个体识别网络和域分类网络具体如下:
S32、源域数据从第二池化层中提取到的特征向量f会输入到射频指纹个体识别网络,最终得到射频设备标签y,即射频指纹识别结果。同时源域信号和目标域信号的特征向量会共同输入到域分类网络中,得到域标签d。
S321、射频指纹个体识别网络包含两个全连接层,用Softmax函数作为输出层计算每个类别的概率,并输出y1到ym,表示识别到m种不同设备的概率。同时,在全连接层之前加入丢弃因子(Dropout)技术,将Dropout系数设置为0.5,即同一时刻只有一半的神经元处于激活状态,防止训练过程中因神经网络过深、训练时间过长或者没有足够数据而导致的过拟合现象。
S322、域识别网络包含梯度反转层(GRL)、全连接层和SoftMax分类器。输入域分类网络层之前的特征向量都要通过一个梯度反转层(GRL),该层在前向传播中是个恒等变换,反向传播时会自动实现梯度反转。梯度反转通过对域分类器的损失(预测值和真实值的差距)乘上一负系数δ,使得其前后网络的训练目标相反,达到和生成对抗网络(GAN)类似的生成对抗效果,即特征提取网络Gf和域分类网络Gd的训练目标是对抗的。δ在训练阶段,取值会随着迭代次数的增加从0变化到1,如下式所示:
其中γ是一个超参数,一般设为常数10。p随着训练从0变为1,表示当前迭代次数/总迭代次数。
进一步地,所述步骤S3中所述H散度的定义如下:
为衡量D1和D2的分布差异,采用H散度作为度量准则:
其中X是经过神经网络映射的特征空间,H是一个假设空间,h是此空间上一个用于二分类的函数,即h:X→{0,1}。若h满足以下条件则能较好地区分源域和目标域数据:以极接近于1的概率将源域数据判为类别1,且以极接近于0的概率将目标域数据判为类别1:
基于H散度,定义HΔH距离公式如下:
其中h1和h2是判别函数,用于判别数据属于源域还是目标域。从上式可知HΔH可用于衡量两个判别函数h1和h2判别结果不相等的概率。
HΔH={η:η(x*=1)}
因此通过对HΔH距离求极值即可找到源域和目标域间h1和h2判别结果的最大误差,即H散度。其应满足下式:
其中λ为常数。上式表明,基于源域数据训练出的神经网络在用于对目标域数据进行分类时产生的误差主要由两个因素引起:首先是源域上网络自带的分类误差,若源域数据集充足则这一部分相对较小;其次是源域和目标域数据分布之间的HΔH距离。若要降低分类网络在目标域数据上的分类误差,一方面需要减小在源域上网络的分类误差,另一方面需要缩小源域和目标域数据分布间的距离。上式可简化为:
dHΔH(D1,D2)=2(1-min(∈1(h)+∈2(h)))
根据上式,为了模糊源域和目标域之间的界限,需要最大化网络在源域和目标域上分类误差之和,因而问题的本质是优化极大极小函数,如下式所示:
上式表明,分类网络要迁移到目标域上,需要同时最小化H散度和在源域及目标域上的分类误差之和。当H散度足够大时,源域和目标域数据间的数据差异很大,极易区分,此时分类误差极小。但为将网络迁移到目标域上,又要使得源域和目标域间的区别更小,保证两域数据分布近似,因而网络在训练阶段是一个类似生成对抗网络(GAN)的对抗优化过程。
进一步地,所述步骤3中损失函数的计算方式如下:
训练数据先经过特征提取网络的映射转换为一维特征向量:f=Gf(a;θf),然后特征向量分支到两个网络,射频指纹个体识别网络Gy(a;θy)和域分类网络Gd(a;θd)。计算整个模型的损失函数为:
E(θf,θy,θd)
=∑i=1,2…NLy(Gy(Gf(ai;θf);θy),yi)+δ
∑i=1,2…NLd(Gd(RλGf(ai;θf);θd),yi)
通过优化上述损失函数,可以使得特征提取网络提取到既具有区分度又有域不变性的特征,由此解决不同日期、不同接收机采集的信号分布不一致的问题。在训练过程中,需要平衡射频指纹个体识别网络和域分类网络。具体来说,在H散度较大,即两个域很容易区分开时,会导致域分类器的网络训练过好,导致梯度回传的时候占比太小不起作用,无法引导特征提取网络提取到具有域不变性的特征,这时就需要通过调整两个网络的层数和节点数来降低域分类器的性能。
Claims (7)
1.一种基于样本增强和深度学习的射频指纹识别方法,其特征是,包括以下步骤:
步骤S1、从无线通信设备接收端采集原始射频数据并存储到PC端;
步骤S2、将无线通信设备接收端采集到的Raw-IQ数据样本进行预处理,将数据划分为训练集和测试集,再进一步将训练集划分为源域和目标域;
步骤S3、构建DSEN-TL神经网络并输入训练集对其进行训练,训练过程中判定H散度是否达到平衡,若过大或者过小则须调整射频个体识别网络和域分类网络的层数和参数重新训练,优化损失函数;
步骤S4、将测试集输入DSEN-TL网络并输出设备识别类型;
步骤S5、将训练好的DSEN-TL网络嵌入实际板级系统进行测试,在收发数据的同时准确识别射频设备个体,实现通信感知一体化。
2.根据权利要求1所述的基于样本增强和深度学习的射频指纹识别方法,其特征是,所述步骤S1中无线通信设备采用的ADRV9361-Z7035,搭建的测试平台包括4个发射机和4个接收机,分别标号为T1-T4和R1-R4;具体的数据采集方式为:发射机通过天线发射数据,接收机实时连续捕获空口原始IQ样本,并存为文件传输到PC端;数据集使用的是IEEE802.11a(WiFi)标准传输的IQ样本;为了增加鲁棒性,采集了不同日期、不同距离下不同设备发射的数据集和不同接收机接收同一射频源的数据集。
3.根据权利要求1所述的基于样本增强和深度学习的射频指纹识别方法,其特征是,所述步骤S2中数据样本预处理和数据划分的具体步骤为:
S21、将不同日期采集的数据先划分训练集和测试集,其比例为8:2,再进一步将训练集划分为源域和目标域。对不同日期采集的训练集作以下划分:先把第一天采集的数据设为初始源域(D1),其为有标签的训练信号(训练集X1),将第二天采集的数据设为初始目标域(D2),其为无标签的待识别信号(训练集X2);第一天和第二天完成一轮训练测试之后得到一轮网络参数,再把第三天采集的数据设为新目标域(D3,即训练集X3)进行训练,以此类推,直到达到较高的准确率。同样的,对同一射频源不同接收机采集的数据作以下划分:先把所有采集到的数据划分为8:2的训练集和测试集,然后先把R1采集的数据作为初始源域(DR1,即训练集XR1),R2采集的数据作为初始目标域(DR2,即训练集XR2),训练测试过后设置新的目标域;源域和目标域具有相同射频源的指纹特征和类别,但是由于不同日期、不同接收机采集的数据样本特征分布不一致,会导致传统神经网络性能的恶化;通过迁移学习,源域信号学习到的识别网络对目标域有较好识别效果;
S22、Raw-IQ数据样本是未经处理过的原始数据,其未发生信息流失,也未对其中不利于射频指纹识别的混杂因素进行抑制。将捕获到的Raw-IQ样本预处理为2×1024的二维数组,Raw-IQ样本的第一行是同相采样,第二行是正交采样;训练集将以1×2×1024的黑白图片形式馈入DenseNet神经网络。
4.根据权利要求1所述的基于样本增强和深度学习的射频指纹识别方法,其特征是,所述步骤S3中DSEN-TL神经网络包括三个部分:DenseNet特征提取网络、射频指纹个体识别网络和域分类网络;所述步骤S3中DenseNet特征提取网络具体结构如下:
S31、DenseNet特征提取网络包含依次连接的输入层、第一卷积层、第一池化层、3个DenseBlock模块和其包含的2个过渡层和第二池化层。第一轮训练时网络的输入层包括带有标签的源域信号D1(第一天采集的训练信号)和不带标签的目标域信号D2(第二天采集的待识别信号)。
S311、第一卷积层的输入是2×N的二维数据,用来提取输入数据中的隐含特征,使用Conv2D对数据进行二维卷积。第一池化层选择MaxPool最大池化策略,计算局部最大值。具体来说,先经过BN层,再经过ReLU激活函数层,最后进行池化区域大小为(2×3)且步长为(2×2)的最大池化,为模型降低计算的参数量并减小过拟合。
S312、DenseBlock模块数量为3,每个DenseNet网络包含5个卷积层,每个卷积层由a个维度为(b,c)的卷积层组成;与ResNet网络相比,DenseNet网络不是通过求和来传递特征,而是每经过一次卷积就通过拼接操作将之前每层卷积的输入拼接起来,作为新的输入送给下一卷积层;DenseNet不是从极深或极宽的架构中汲取表征能力,而是通过特征重用利用网络的潜力,产生易于训练且参数效率高的浓缩模型,通过连接不同层学习的特征图增加了后续层输入的变化并提高了效率;每两个DenseNet中间使用一个过渡层,过渡层结构为BN-ReLU-AveragePool,采用池化区域大小为(2×2)且步长为(2×2)的均值池化。过渡层不仅有连接两个DenseBlock模块的作用,还可以通过减少前一个DenseBlock模块输入过渡层的特征图数量来减小模型宽度使得模型更简洁。
S313、第二池化层选择MaxPool最大池化策略,进行池化区域大小为(2×3)且步长为(2×2)的最大池化;经过最大池化后的数据分别输入射频指纹个体识别网络和域分类网络,分别进行源域和目标域的训练和迁移学习。
5.根据权利要求1所述的基于样本增强和深度学习的射频指纹识别方法,其特征是,所述步骤S3中射频指纹个体识别网络和域分类网络具体如下:
S32、源域数据从第二池化层中提取到的特征向量f会输入到射频指纹个体识别网络,最终得到射频设备标签y,即射频指纹识别结果;同时源域信号和目标域信号的特征向量会共同输入到域分类网络中,得到域标签d。
S321、射频指纹个体识别网络包含两个全连接层,用Softmax函数作为输出层计算每个类别的概率,并输出y1到ym,表示识别到m种不同设备的概率;同时,在全连接层之前加入丢弃因子(Dropout)技术,将Dropout系数设置为0.5,即同一时刻只有一半的神经元处于激活状态,防止训练过程中因神经网络过深、训练时间过长或者没有足够数据而导致的过拟合现象;
S322、域识别网络包含梯度反转层(GRL)、全连接层和SoftMax分类器;输入域分类网络层之前的特征向量都要通过一个梯度反转层(GRL),该层在前向传播中是个恒等变换,反向传播时会自动实现梯度反转;梯度反转通过对域分类器的损失乘上一负系数δ,使得其前后网络的训练目标相反,达到和生成对抗网络(GAN)类似的生成对抗效果,即特征提取网络Gf和域分类网络Gd的训练目标是对抗的;δ在训练阶段,取值会随着迭代次数的增加从0变化到1,如下式所示:
所述步骤S3中所述的H散度是为衡量D1和D2分布差异而设定的度量准则,可以由其判别数据样本属于源域还是目标域,从而得出分类网络能迁移到目标域上的条件,即需要同时最小化H散度和在源域及目标域上的分类误差之和;当H散度足够大时,源域和目标域数据间的数据差异很大,极易区分,此时分类误差极小;但为将网络迁移到目标域上,又要使得源域和目标域间的区别更小,保证两域数据分布近似,因而网络在训练阶段是一个类似生成对抗网络(GAN)的对抗优化过程。
6.根据权利要求1所述的基于样本增强和深度学习的射频指纹识别方法,其特征是,所述步骤S3中需要优化的损失函数是结合特征提取网络、射频指纹个体识别网络和域分类网络的参数得到的。通过优化整个模型的损失函数,使得特征提取网络提取到既具有区分度又有域不变性的特征,由此解决不同日期、不同接收端信号分布不一致的问题;在训练过程中,需要平衡射频指纹个体识别网络和域分类网络。
7.根据权利要求1所述的基于样本增强和深度学习的射频指纹识别方法,其特征是,当H散度较大,即两个域很容易区分开时,会导致域分类器的网络训练过好,导致梯度回传的时候占比太小不起作用,无法引导特征提取网络提取到具有域不变性的特征,这时就需要通过调整两个网络的层数和节点数来降低域分类器的性能。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2022114015882 | 2022-11-09 | ||
CN202211401588 | 2022-11-09 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116257750A true CN116257750A (zh) | 2023-06-13 |
Family
ID=86678884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310119656.4A Pending CN116257750A (zh) | 2022-11-09 | 2023-02-15 | 一种基于样本增强和深度学习的射频指纹识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116257750A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116910632A (zh) * | 2023-09-14 | 2023-10-20 | 硕橙(厦门)科技有限公司 | 基于迁移学习的射频指纹识别方法、装置、设备及介质 |
CN117113061A (zh) * | 2023-09-14 | 2023-11-24 | 中国人民解放军军事科学院系统工程研究院 | 跨接收机辐射源指纹识别方法和装置 |
CN117544963A (zh) * | 2024-01-04 | 2024-02-09 | 四川大学 | 一种基于FTGan-Yolo的跨模态通信信号的辐射源识别方法及设备 |
-
2023
- 2023-02-15 CN CN202310119656.4A patent/CN116257750A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116910632A (zh) * | 2023-09-14 | 2023-10-20 | 硕橙(厦门)科技有限公司 | 基于迁移学习的射频指纹识别方法、装置、设备及介质 |
CN117113061A (zh) * | 2023-09-14 | 2023-11-24 | 中国人民解放军军事科学院系统工程研究院 | 跨接收机辐射源指纹识别方法和装置 |
CN116910632B (zh) * | 2023-09-14 | 2023-12-12 | 硕橙(厦门)科技有限公司 | 基于迁移学习的射频指纹识别方法、装置、设备及介质 |
CN117113061B (zh) * | 2023-09-14 | 2024-02-23 | 中国人民解放军军事科学院系统工程研究院 | 跨接收机辐射源指纹识别方法和装置 |
CN117544963A (zh) * | 2024-01-04 | 2024-02-09 | 四川大学 | 一种基于FTGan-Yolo的跨模态通信信号的辐射源识别方法及设备 |
CN117544963B (zh) * | 2024-01-04 | 2024-03-26 | 四川大学 | 一种基于FTGan-Yolo的跨模态通信信号的辐射源识别方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110855591B (zh) | 一种基于卷积神经网络结构的qam和psk信号类内调制分类方法 | |
CN116257750A (zh) | 一种基于样本增强和深度学习的射频指纹识别方法 | |
Hu et al. | Deep neural network for robust modulation classification under uncertain noise conditions | |
CN112702294B (zh) | 一种基于深度学习的多层次特征提取的调制识别方法 | |
CN110086737A (zh) | 一种基于图神经网络的通信信号调制方式的识别方法 | |
CN106059972B (zh) | 一种基于机器学习算法的mimo相关信道下的调制识别方法 | |
CN110300078B (zh) | 基于课程学习的调制信号识别方法 | |
CN1061493C (zh) | 接收方法与cdma(码分多址)接收机 | |
CN110569752A (zh) | 基于卷积神经网络的雷达信号类别确定方法 | |
CN111628833B (zh) | 基于卷积神经网络的mimo天线数目估计方法 | |
CN108566253B (zh) | 一种基于对信号功率谱拟合特征提取的信号识别方法 | |
CN102647391A (zh) | 一种基于决策层数据融合的协作调制信号识别方法 | |
Zhang et al. | Modulated autocorrelation convolution networks for automatic modulation classification based on small sample set | |
CN111431825B (zh) | 一种基于深度多流神经网络的信号自动分类识别方法 | |
CN115294615A (zh) | 一种基于机器学习的射频指纹识别方法 | |
Jagannath et al. | Embedding-assisted attentional deep learning for real-world RF fingerprinting of Bluetooth | |
CN114745248A (zh) | 基于卷积神经网络的dm-gsm信号检测方法 | |
Wang et al. | Residual learning based RF signal denoising | |
Tian et al. | Transfer learning-based radio frequency fingerprint identification using ConvMixer network | |
CN113239788A (zh) | 一种基于Mask R-CNN的无线通信调制模式识别方法 | |
Brandes et al. | RF waveform synthesis guided by deep reinforcement learning | |
CN115866615B (zh) | 一种基于电磁频谱特征的无线网络通联关系发现方法 | |
CN114422310B (zh) | 一种基于联合分布矩阵与多输入神经网络的数字正交调制信号识别方法 | |
CN113541726B (zh) | 一种基于循环神经网络的码索引扩频水声通信方法 | |
CN113242201B (zh) | 基于生成分类网络的无线信号增强解调方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |