CN115664905A - 基于多域物理层指纹特征的Wi-Fi设备识别系统及方法 - Google Patents

基于多域物理层指纹特征的Wi-Fi设备识别系统及方法 Download PDF

Info

Publication number
CN115664905A
CN115664905A CN202211272403.2A CN202211272403A CN115664905A CN 115664905 A CN115664905 A CN 115664905A CN 202211272403 A CN202211272403 A CN 202211272403A CN 115664905 A CN115664905 A CN 115664905A
Authority
CN
China
Prior art keywords
features
domain
signal
modulation
training sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211272403.2A
Other languages
English (en)
Inventor
张竞慧
翁财善
徐正佳
凌振
杨明
罗军舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202211272403.2A priority Critical patent/CN115664905A/zh
Publication of CN115664905A publication Critical patent/CN115664905A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)

Abstract

本发明公开了一种基于多域物理层指纹特征的Wi‑Fi设备识别系统及方法,包括信号采集与处理模块、特征提取模块及指纹识别模块,信号采集与处理模块利用USRP采集无线电信号,经USRP解调后的复数基带信号的采样信号作为无线接收机输入,软件解调后,采样信号被解码至数据链路层,输出帧数据;特征提取模块对帧数据进行信号处理与特征提取,提取射频信号具有的调制域特征、波形域特征以及统计度量和调制编码方案特征;指纹识别模块基于提取的特征进行分类模型训练,根据特征的维度及特征间的相关性选择最佳的分类模型,将WIFI信号经机器学习后生成的输入特征量传给最佳分类模型,进行设备的指纹匹配,实现设备的识别,大幅度提升Wi‑Fi设备指纹识别的准确率和效率。

Description

基于多域物理层指纹特征的Wi-Fi设备识别系统及方法
技术领域
本发明属于设备识别的技术领域,主要涉及了一种基于多域物理层指纹特征的Wi-Fi设备识别系统及方法。
背景技术
随着物联网的快速发展,Wi-Fi作为物联网中常用无线技术逐步成为现代计算平台和嵌入式系统中不可缺少的部分,准确识别无线网络中的设备越发重要。在无线设备接入网络阶段,由于物联网设备计算资源紧缺,传统的基于密码学的认证协议难以实现。而在无线设备进行无线通信过程中,由于无线传输的广播特性,恶意用户极易接入网络以实施诸如中间人、拒绝服务等攻击,而伪造成合法设备是攻击成功的重要前提,诸如IP地址、MAC地址等标识符容易通过软件改写。此外,在无线附属服务可用性方面,许多基于无线协议的定位、资产追踪、行程时间估计以及行为建模等服务,例如Yfind、Skyhook和Nomi等商业产品,其服务的有效性需要目标设备在一段时间内被唯一识别。
针对上述这些问题,无线设备指纹识别是一个颇具前景的解决方案,识别所依赖的各种特征可以从物理层、数据链路层以及协议栈上层被提取以生成各层指纹。然而,目前IEEE 802.11协议的数据链路层以上已被加密:据WiGLE统计,截至2021年3月,只有3.02%的Wi-Fi网络没有加密,这意味着许多基于上层指纹的识别系统适用范围狭小甚至难以实现。而基于数据链层的指纹往往只能识别不同厂商的设备,无法区别设备个体且指纹较易伪造。
基于物理层特征的指纹识别需要用到特殊的硬件设备,如信号分析仪或USRP(Universal Software Radio Peripheral),以获得原始无线信号或原始信号的复包络(Complex Envelope),设备的选择与处理的信号部位有关。从物理层提取的特征可以分为信道相关特征、硬件相关特征和其他特征三类。在提取特征之后,紧接着是对特征的处理与指纹生成识别。考虑到提取的特征可能相关,因此降维分析等手段被用来做特征选择。而指纹生成比对算法一般分为基于相似度度量、基于分类以及基于无监督学习的识别算法三类。大部分针对物理层指纹特征识别技术的研究存在以下几点问题。其一,没有充分考虑硬件对实际落地的限制,基于信号分析仪的信号采集成本过高。其二,在真实环境下,对于物理层调制方式较复杂的无线协议,如采用了OFDM调制方式的IEEE 802.11,其识别准确率与决策速度也有待提高。
发明内容
本发明正是针对现有技术中物理层指纹特征的设备识别提取特征代价高,真实环境中无线设备其识别准确率与速度低的问题,提供一种基于多域物理层指纹特征的Wi-Fi设备识别系统及方法,包括信号采集与处理模块、特征提取模块及指纹识别模块,所述信号采集与处理模块:利用USRP采集无线电信号,经USRP解调后的复数基带信号的采样信号作为无线接收机输入,软件解调后,采样信号被解码至数据链路层,输出帧数据并传输至特征提取模块;所述特征提取模块:对信号采集与处理模块输出的帧数据,进行信号处理与特征提取,提取射频信号具有的调制域特征、波形域特征以及统计度量和调制编码方案特征;所述波形域特征提取包括时域特征和频域特征;所述指纹识别模块:基于提取的特征进行分类模型训练,根据特征的维度及特征间的相关性选择最佳的分类模型,将WIFI信号经机器学习后生成的输入特征量传给最佳分类模型,进行设备的指纹匹配,实现设备的识别。
为了实现上述目的,本发明采取的技术方案是:基于多域物理层指纹特征的Wi-Fi设备识别系统,包括信号采集与处理模块、特征提取模块及指纹识别模块,
所述信号采集与处理模块:利用USRP采集无线电信号,经USRP解调后的复数基带信号的采样信号作为无线接收机输入,软件解调后,采样信号被解码至数据链路层,输出帧数据并传输至特征提取模块;
所述特征提取模块:对信号采集与处理模块输出的帧数据,进行信号处理与特征提取,提取射频信号具有的调制域特征、波形域特征以及统计度量和调制编码方案特征;所述波形域特征提取包括时域特征和频域特征;
所述指纹识别模块:基于提取的特征进行分类模型训练,根据特征的维度及特征间的相关性选择最佳的分类模型,将WIFI信号经机器学习后生成的输入特征量传给最佳分类模型,进行设备的指纹匹配,实现设备的识别。
为了实现上述目的,本发明还采取的技术方案是:基于多域物理层指纹特征的Wi-Fi设备识别方法,包括如下步骤:
S1,信号采集与处理:
信号采集:利用USRP采集无线电信号,经USRP解调后的复数基带信号的采样信号作为无线接收机输入;采样信息经过软件解调后,被解码至数据链路层,输出帧数据;所述软件解调包括帧检测和解调解码,帧检测利用协议前导码部分的自相关特性,检测出每条帧的出现并作相位纠偏;所述解调解码至少包括对信道的估计、对信号的数字解调、采样频率补偿及符号均衡;
S2,特征提取:对经过步骤S1处理好的帧数据进行特征提取,提取射频信号具有的调制域特征、波形域特征、统计度量及调制编码特征;
所述调制域特征包括载波频率偏移特征、同步相关性特征及星座图特征,其中,载波频率偏移特征根据帧数据的前导码提取,同步相关性特征根据帧数据前导码的短训练序列提取,星座图特征根据帧数据前导码的数据字段经过信道估计均衡后提取;
所述波形域特征包括时域特征和频域特征;
所述统计度量特征包括方差、偏度及峰度,基于最大特征系数的特征做选择;
S3,模型训练:对步骤S2提取的特征进行数据预处理,并进行分类模型训练,根据特征的维度及特征间的相关性选择最佳的分类模型;
S4,指纹识别:将WIFI信号经机器学习后生成的输入特征量传给最佳分类模型,进行设备的指纹匹配,实现设备的识别。
作为本发明的一种改进,所述步骤S1中经USRP解调后的复数基带信号的采样信号,即原始无线信号S(t)的复包络
Figure BDA0003895577630000031
的采样,具体为:
s(t)=I(t)cos 2πfct-Q(t)sin 2πfct
Figure BDA0003895577630000041
Figure BDA0003895577630000042
其中,I(t)和Q(t)分别是接收端处输入进I/Q调制的信号的同相成分和正交成分;fc是载波频率。
作为本发明的一种改进,所述步骤S2中载波频率偏移特征提取的具体方式为:
S21:利用帧数据前导码的短训练序列对相位偏移进行粗粒度估计,其中Sm表示第m个复数采样点;
Figure BDA0003895577630000043
S22:利用估计出的
Figure BDA0003895577630000044
对短训练序列后的长训练序列采样点进行粗粒度纠偏,采样点变为
Figure BDA0003895577630000045
S23:利用帧数据前导码的长训练序列对相位偏移进行细粒度估计;
Figure BDA0003895577630000046
S24:利用估计出的
Figure BDA0003895577630000047
对长训练序列的采样点进行细粒度纠偏,采样点变为
Figure BDA0003895577630000048
S25:获得载波频率偏移造成的相位偏移因子
Figure BDA0003895577630000049
通过下式由相位偏移因子推出载波频率偏移
Figure BDA00038955776300000410
所述同步相关性特征的提取方式具体为:根据帧数据的短训练序列采样点个数,每固定个数个采样点重复一次作为子序列,依次对当前子序列和下一串子序列作下式计算:
Figure BDA00038955776300000411
其中,xi表示第i串子序列,
Figure BDA0003895577630000051
表示第i串子序列的期望值,
Figure BDA0003895577630000052
表示第i串子序列的标准差,循环一轮后求得皮尔逊相关系数的平均数,即得到同步相关性特征;
所述星座图特征根据帧数据前导码的数据字段经过信道估计均衡后提取,包括错误向量幅度、相位错误、幅度错误以及I/Q偏移调制域特征。
作为本发明另一种改进,所述步骤S2中的时域特征提取时,利用下列公式将信号从调制域映射为时域上的离散信号,提取过零率和能量熵特征,并根据特征在前导码长、短训练序列上的变化提取各特征变化率,
Figure BDA0003895577630000053
所述频域特征提取时,按下列公式做离散傅立叶变换,将时域信号映射至频域
Figure BDA0003895577630000054
所述频域特征提取包括谱质心、短训练序列频谱延展度、频谱熵、频谱通量以及长、短训练序列频谱延展度变化率特征。
作为本发明的更进一步改进,所述步骤S3中,特征数据的预处理至少包括对星座图特征的去噪处理及数据归一化,所述去噪处理包括载波频率偏移噪声的去除和信道估计与均衡,所述归一化处理采用了RobustScaler标准化方法,根据两个四分位数之间的距离来缩放数据。
与现有技术相比,本发明具有的有益效果:提供了一种基于多域物理层指纹特征的Wi-Fi设备识别系统,解决了物理层指纹特征的设备识别提取特征代价高,真实环境中无线设备其识别准确率与速度低的问题,从而提升Wi-Fi设备指纹识别的准确率和效率,本发明每一个步骤的优势包括:
(1)传统基于信号分析仪的信号采集成本过高,利用本发明步骤一方式采集,可以降低信号采集的成本,便于硬件落地应用;
(2)根据本发明步骤二特征提取,利用802.11中的OFDM调制方式实现了调制域特征的提取,并且提出了基于物理帧前导码(preamble)长、短训练序列的波形域特征,并引入了统计度量特征以及调制编码方案特征,成功提升了基于物理层指纹特征的Wi-Fi设备识别的准确率;
(3)根据本发明步骤三模型训练,基于python中的机器学习库sklearn所提供的机器学习模型进行分析筛选,可以找到最佳的分类模型完成基于前文所述特征的Wi-Fi设备分类识别任务。
附图说明
图1为本发明基于多域物理层指纹特征的Wi-Fi设备识别方法的步骤流程示意图;
图2为本发明基于多域物理层指纹特征的Wi-Fi设备识别方法步骤S1信号采集过程的示意图;
图3为本发明基于多域物理层指纹特征的Wi-Fi设备识别方法步骤S2特征提取部位的示意图;
图4为本发明802.11OFDM帧格式的结构图;
图5为本发明实施例2中星座图调制域特征的示意图。
具体实施方式
下面结合附图和具体实施方式,进一步阐明本发明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。
实施例1
基于多域物理层指纹特征的Wi-Fi设备识别系统,包括信号采集与处理模块、特征提取模块及指纹识别模块。基于物理层特征的指纹识别分成三个步骤:射频信号采集、特征提取以及指纹比对,其中,射频信号的采集需要用到特殊的硬件设备,如信号分析仪或USRP(Universal Software Radio Peripheral),以获得原始无线信号或原始信号的复包络(Complex Envelope),设备的选择与处理的信号部位有关。通信过程的射频信号一般可分成瞬态(transient)、前导以及数据三部分。在特征提取阶段,通过在时域、频域、调制域上对信号进行处理从无线信号的各个部位提取特征。处理射频信号的方式可划分为波形域和调制域,波形域技术在时域和频域上表示信号,而调制域技术则以I/Q符号的形式表示信号进行处理。
本实施例的基于多域物理层指纹特征的Wi-Fi设备识别系统中,信号采集与处理模块利用USRP采集无线电信号,并结合GNU Radio在PC上实现针对802.11a/p/g的接收机,无线接收机的输入是经USRP解调后的复数基带信号的采样信号,在PC机上完成相应的信号处理软件解调后,采样信号被解码至数据链路层,输出帧数据并传输至特征提取模块;所述特征提取模块对信号采集与处理模块输出的帧数据,进行信号处理与特征提取,分别从调制域和波形域上提取多域射频特征,其中波形域包括时域以及频域。首先根据OFDM帧前导码字段的长、短训练序列用来提取载波频率偏移特征、同步相关性特征、星座图特征。然后利用相应公式把信号从调制域的I/Q样本形式映射回时域,从时域上提取特征,利用离散傅立叶变换转换至频域,在频域上提取特征。最后从前导码的短训练序列和长训练序列字段提取载波偏移特征,在长训练序列和信号(Signal)字段提取调制编码方案特征,在数据字段提取信号在星座图上的调制域特征,同时结合了统计度量特征与物理层所用调制编码特征;最后指纹识别模块基于提取的特征进行分类模型训练,根据特征的维度及特征间的相关性选择最佳的分类模型,将WIFI信号经机器学习后生成的输入特征量传给最佳分类模型,进行设备的指纹匹配,实现设备的识别。
本实施例系统解决了物理层指纹特征的设备识别提取特征代价高,真实环境中无线设备其识别准确率与速度低的问题,大幅度提升Wi-Fi设备指纹识别的准确率和效率。
实施例2
基于多域物理层指纹特征的Wi-Fi设备识别方法,如图1所示,包括如下步骤:
S1,信号采集与处理:
射频信号采集阶段:首先利用SDR(Software Defined Radio)技术,可以实现针对802.11的接收机。然后接收机利用USRP捕获无线信号,将解调后的数字信号通过以太网接口或USB接口传输给PC机,最后在PC机上完成相应的信号处理。
①构建无线电信号接收机:利用USRP采集无线电信号,并结合GNU Radio在PC上实现针对802.11a/p/g的接收机。
②无线接收机的输入:经USRP解调后的复数基带信号的采样信号,如图2所示,即原始无线信号S(t)的复包络
Figure BDA0003895577630000081
的采样,即
s(t)=I(t)cos 2πfct-Q(t)sin 2πfct
Figure BDA0003895577630000082
Figure BDA0003895577630000083
其中I(t)和Q(t)分别是接收端处输入进I/Q调制的信号的同相成分和正交成分,fc是载波频率。
信号处理阶段:采样信息经过软件解调后,被解码至数据链路层,输出帧数据;软件解调可分为两部分,即帧检测部分和解调解码部分。帧检测部分利用协议前导码部分的自相关特性,从而检测出每条帧的出现并作相位纠偏。解调解码部分完成了对信道的估计以及对信号的数字解调、采样频率补偿、符号均衡等工作,最后该信号将被解码至数据链路层。
S2,特征提取:
802.11 OFDM帧分为前导码和数据两字段,如图4所示,前导码字段的长、短训练序列用来提取载波频率偏移特征、同步相关性特征、星座图特征。利用相应公式把信号从调制域的I/Q样本形式映射回时域,从时域上提取特征,利用离散傅立叶变换转换至频域,在频域上提取特征。根据样本前导码划分子帧提取统计度量特征,前导码字段的信号字段用来提取调制编码方案MCS(Modulation and Coding Scheme)特征,而经过信道估计均衡后的数据字段的符号则用来提取无线信号在星座图上的错误向量幅度(Error VectorMagnitude,EVM)、幅度错误(Magnitude Error)、相位错误(Phase Error)以及I/Q偏移调制域特征,如图3所示。最后,所选全部共22个特征如下表1所示。
表1物理层指纹识别所采用特征
Figure BDA0003895577630000091
对于一个典型的802.11OFDM帧格式如图4所示,利用相应公式把信号从调制域的I/Q样本形式映射回时域,从时域上提取特征,利用离散傅立叶变换转换至频域,在频域上提取特征。并从前导码的短训练序列和长训练序列字段提取载波偏移特征,在长训练序列和信号(Signal)字段提取调制编码方案特征,在数据字段提取信号在星座图上的调制域特征。
①调制域特征提取:
1)载波频率偏移特征:利用802.11OFDM帧的前导码提取载波频率偏移特征。
载波频率偏移由于发射机的晶振器无法产生与预设完全一致的载波频率fc产生的,属于晶振器制造工艺上不可避免的误差。本发明假设存在误差ε,导致实际载波频率变成(1+ε)fc,该误差会对接收端收到的无线信号造成影响,在每个采样点引入相位偏移
Figure BDA0003895577630000101
第n个采样点将乘以因子
Figure BDA0003895577630000102
其中
Figure BDA0003895577630000103
和ε的关系下。
Figure BDA0003895577630000104
其中Ts为采样周期。利用接收端的无线信号可估计出
Figure BDA0003895577630000105
以得到
Figure BDA0003895577630000106
步骤如下:
a.利用帧前导码的短训练序列对相位偏移进行粗粒度估计,其中Sm表示第m个复数采样点;
Figure BDA0003895577630000107
b.利用估计出的
Figure BDA0003895577630000108
对短训练序列后的长训练序列采样点进行粗粒度纠偏,采样点变为
Figure BDA0003895577630000109
c.利用帧前导码的长训练序列对相位偏移进行细粒度估计;
Figure BDA00038955776300001010
d.利用估计出的
Figure BDA00038955776300001011
对长训练序列的采样点进行细粒度纠偏,采样点变为
Figure BDA00038955776300001012
f.最后获得载波频率偏移造成的相位偏移因子
Figure BDA00038955776300001013
再利用公式
Figure BDA00038955776300001014
由相位偏移因子推出载波频率偏移。
该特征能很好地反映发射机模拟电路在晶振器模块制造上的差异。并且上述过程中,该特征将作用于信号完成对载波频率偏移的纠偏,同时也为后续在信号调制域提取特征实现了一定程度的去噪。
2)同步相关性特征:利用802.11OFDM帧前导码的短训练序列提取同步相关性特征。
同步相关性反映了前导码用来同步的短训练序列存在的特征。本发明采样的802.11a/p/g帧的短训练序列共128个采样点,每16个采样点重复一次作为子序列。本发明依次对当前子序列和下一串子序列作相关计算,如下公式所示,其中xi表示第i串子序列,
Figure BDA0003895577630000111
表示第i串子序列的期望值,
Figure BDA0003895577630000112
表示第i串子序列的标准差。循环一轮后共得到8个皮尔逊相关系数,再求其平均得到同步相关性特征。
Figure BDA0003895577630000113
3)星座图特征:利用802.11 OFDM帧前导码的数据字段经过信道估计均衡后提取载波频率偏移特征。
在提取星座图特征之前,本发明拟完成对环境噪声的去噪处理。该模块将利用长训练序列计算得出接收信号的信噪比,进而计算接收信号强度RSS、信道状态信息CSI,并利用这些信息完成符号均衡,同时,对采样频率也完成了纠偏,进一步去除了噪声。均衡后的信号符号将会投射至星座图,如图5(a)所示,实际接受的信号和理想信号存在一定程度的偏离,利用这一点可以提取信号在调制域上的特征,包括错误向量幅度、相位错误、幅度错误以及I/Q偏移,如图5(b)所示。
通过计算错误向量E幅度的均方根与参照信号R幅度的均方根的比值,可求得错误向量幅度。
Figure BDA0003895577630000114
相位错误和幅度错误分别指的是实际测得的信号和参照信号存在一定程度的角度偏移和幅度误差。遍历接收到的一个帧的每个OFDM符号的每个采样点,本发明将匹配其在星座图上对应的参照点,计算出角度偏移和幅度误差,最后求平均得到以上两个星座图特征。
I/Q偏移,该特征的产生原因是由于发射机和接收机各自的两个本地振荡器存在硬件制造上不可避免的偏差,使得I(t)和Q(t)两路调制解调信号的幅度不完全相同,而其相位也无法准确相差90度。所以,该特征可以很好地反映发射机的硬件特性。I/Q偏移的特征提取算法先从OFDM帧的数据字段里抽取出10个符号共480个采样点,再根据bpsk、qpsk、16qam、64qam的调制方案不同将采样点映射至对应的星座图上,接着找出星座图坐标中样本点最少的坐标并求得该坐标处的样本点数min_count,然后遍历每个坐标取min_count个点作向量求和,最后所得向量与原点的距离即为估计出的I/Q偏移。
②波形域特征提取:对于波形域的特征,本实施例利用BPSK的前导码字段提取波形域特征,把以调制域表示的信号采样点映射回时域,再用离散傅立叶变化映射至频域。首先在时域上提取短训练序列过零率、长训练序列能量熵以及长、短训练序列能量熵变化率特征;其次在频域上提取谱质心、短训练序列频谱延展度、频谱熵、频谱通量以及长、短训练序列频谱延展度变化率特征。
具体操作如下:
1)提取时域特征,首先利用下列公式将信号从调制域映射为时域上的离散信号,然后提取过零率、能量熵特征,并且可以根据特征在前导码长、短训练序列上的变化提取各特征变化率。
Figure BDA0003895577630000121
利用过零率来描述OFDM帧前导码字段信号的符号的变化频率。通过统计出采样点值从正数变到负数或从负数变到正数的次数除以帧的长度得出,如下公式。
Figure BDA0003895577630000122
Figure BDA0003895577630000131
利用能量熵用来反映前导码信号能量波动的剧烈程度,信号能量波动越剧烈熵值越大,越平稳熵值越小。为了计算训练序列能量熵,本发明将有128个采样点的训练序列以固定样本点数16分成了8个子帧。然后,按下列公式
Figure BDA0003895577630000132
计算每个子帧j的能量,并除以训练序列的总能量,
Figure BDA0003895577630000133
得到一串子帧能量概率序列ej,j=1,2,…,8。最后,子帧序列的熵值就可以由下列公式计算得出,即是训练序列的能量熵。
Figure BDA0003895577630000134
另外,本发明选择提取能量熵变化率来反映短训练序列能量熵和长训练序列能量熵的变化,由长训练序列能量熵除以短训练序列能量熵得到。
2)频域特征提取
频域特征反映了信号的频谱分布特性,按下列公式做离散傅立叶变换可将时域信号映射至频域,然后提取谱质心、短训练序列频谱延展度、频谱熵、频谱通量以及长、短训练序列频谱延展度变化率共五个特征。
Figure BDA0003895577630000135
通过提取前导码的谱质心来反映发射器射频信号中主谐波的基频值的特性,由如下公式可得到谱质心C,其中xk,k=1,2,…,256是前导码的DFT系数的大小。
Figure BDA0003895577630000136
利用频谱延展度来反映信号前导码短训练序列频谱的第二中心位置,根据以下公式可计算出频谱与频谱质心的偏差,即频谱延展度,其中,C表示了前导码的谱质心。另外,本发明提取频谱延展度变化率来反映短训练序列频谱延展度和长训练序列频谱延展度的变化,由长训练序列频谱延展度除以短训练序列频谱延展度得到。
Figure BDA0003895577630000141
频谱熵描述了信号能量在各频率载波上的变化剧烈程度,频谱熵越大则变化越剧烈,反之则越平稳,其与信号的能量熵对应,在频域计算求得。本发明利用频谱熵反映前导码各载波能量的变化剧烈程度,由公式计算得出。
Figure BDA0003895577630000142
具体来说,首先将信号时域上的采样点做离散傅立叶变换映射到频域,再将其划分为32个子带,每个子带8个点,按公式计算出每个子带的能量Ef,f=1,2,…,32,并将其按公式
Figure BDA0003895577630000143
做归一化,最后由以下公式计算出训练序列的频谱熵。
Figure BDA0003895577630000144
本实施例利用频谱通量描述短训练序列与长训练序列的频谱幅度变化:
Figure BDA0003895577630000145
其中ENLTS(k)、ENSTS(k)分别为长训练序列、短训练序列的第k个归一化DFT系数,按公式(4-13b)求得,每个训练序列分别为128个采样点。
Figure BDA0003895577630000146
③统计度量及调制编码特征提取:
对波形域特征可分别提取方差、偏度以及峰度。本发明将256个样本点的前导码以每个窗口w个点划分成子帧,在每个子帧中分别提取时域中的能量、频域中的频谱熵、谱质心、频谱延展度、频谱通量特征,最后分别计算每个子帧的方差、偏度以及蜂度得出统计度量特征。需要注意的是,对于各特征的方差、偏度、峰度统计度量,本发明基于最大信息系数作了特征选择并进行了实验分析,以筛选出合适的窗口大小w以及对本发明的识别场景而言较为重要的统计度量特征。
前导码中的调制编码方案特征提取,对前导码中的信号字段进行解码,可以提取出该特征。该特征与发射机采用的具体调制方案有关,由于每个设备采用的具体调制方式以及编码方式有所不同,会导致不同的调制方式与比特率组合,如有3Mbps或4.5Mbps的二进制相移键控(BPSK)、6Mbps或9Mbps的正交相移键控(QPSK)、12Mbps或18Mbps的16QAM以及24Mbps或27Mbps的64QAM调制方案。
④基于最大信息系数的特征选择:
为了选出最合适的特征以及特征参数,本发明采用最大信息系数(Maximalinformation coefficient)来衡量提取的特征与设备的关联程度。
最大信息系数的计算首先通过X和Y的概率密度以及联合概率密度得到互信息I(X;Y),接着对互信息归一化处理后得到最大信息系数。MIC越大表示X和Y的相关性越高,B(n)的建议取值为n0.6,n为样本数量。
Figure BDA0003895577630000151
Figure BDA0003895577630000152
S3,模型训练:对步骤S2提取的特征进行数据预处理,并进行分类模型训练,根据特征的维度及特征间的相关性选择最佳的分类模型;所述步骤具体包括:
①数据预处理
1)针对星座图特征提取的去噪处理
星座图受载波频率偏移、信道传输特性不理想以及信道噪声的影响,而为了让星座图特征能更好的反映设备在硬件上的差异,本发明在提取星座图特征之前,将对这些噪声进行去除。
其一,载波频率偏移噪声的去除,利用前导码的短训练序列、长训练序列按前文所示公式计算出载波频率偏移然后对帧的后续符号即提取星座图特征的信号部位进行相位纠偏。
其二,OFDM信道估计与均衡。将利用OFDM导频和最小二乘算法(Least Square,LS)对信道完成估计,其基本原理就是使接收信号和原始信号之间噪声的平方达到最小,具体算法如下,假设发送端信号为X,接收信号为Y,信道为H,噪声为N,构建表达式为:Y=XH+N,则LS信道估计的目标即是:
Figure BDA0003895577630000161
Figure BDA0003895577630000162
等于其极限值0,并对H求导进而得到信道响应,如以下公式所示:
Figure BDA0003895577630000163
本发明利用OFDM规定的4个导频X[i]以及接收端实际收到的4个导频Y[i]利用公式
Figure BDA0003895577630000164
估计出信道响应H,再利用估计的信道响应H对接收的48个OFDM数据子载波进行补偿估计出发射端的原始信号以完成信道噪声去除。最后,经过载波频率偏移纠偏和信道均衡后的符号将被用于星座图特征的提取。
2)归一化
本实施例将对特征作归一化。而由于真实环境下的无线设备众多,无线信号之间的干扰可能导致信号波动较大,提取的特征异常值较多,使用均值和方差对数据归一化并不合适,因此,本实施例采用了RobustScaler标准化方法,该归一化方法根据两个四分位数之间的距离来缩放数据。另外,在分类识别之前本发明将抛弃校验和不正确的帧。
②分类模型训练
对于特定问题而言,各分类模型的性能都各不相同,所以无法找到一个通用的最佳算法。因此,曾尝试多种经典的机器学习模型进行测试并对结果进行分析,以找到最佳的分类模型完成基于前文所述特征的WiFi设备分类识别任务。
发明对python机器学习库sklearn所提供的机器学习模型进行了实验筛选,在实验中,总共测试了8种模型,包括K近邻、随机森林(Random Forest)、决策树、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)、朴素贝叶斯、多层感知机、支持向量机(Support Vector Machines,SVM)等,并利用sklearn提供的API GridSearchCV对各模型的各参数的取值进行遍历尝试并以十折交叉验证法进行验证。根据提取特征的维度以及特征间的相关性,初步判断支持向量机、多层感知机以及基于决策树的分类模型如随机森林和梯度提升决策树会取得较好的分类效果。
S4:指纹识别
将WiFi信号采集到的信号,利用前文的机器学习的方法将数据处理模块生成的输入特征向量传给已经训练好的模型,进行设备指纹匹配,实现对设备的识别。
综上所述,本发明的信号采集方式可以降低信号采集的成本,便于硬件落地应用;在特征提取中,创新提出将调制域特征提取算法引入OFDM调制方式中,并提出了基于物理层帧前导码部位的波形域特征,同时结合了统计度量特征与物理层所用调制编码特征,成功提升了基于物理层指纹特征的Wi-Fi设备识别的准确率。本发明系统基于软件无线电技术实现了802.11a/p/g无线信号的采集,在此基础上完成了相应信号数据的收集与物理层特征的提取,提高了基于物理层指纹特征的Wi-Fi设备识别的准确率与效率。
需要说明的是,以上内容仅仅说明了本发明的技术思想,不能以此限定本发明的保护范围,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰均落入本发明权利要求书的保护范围之内。

Claims (9)

1.基于多域物理层指纹特征的Wi-Fi设备识别系统,其特征在于,包括信号采集与处理模块、特征提取模块及指纹识别模块,
所述信号采集与处理模块:利用USRP采集无线电信号,经USRP解调后的复数基带信号的采样信号作为无线接收机输入,软件解调后,采样信号被解码至数据链路层,输出帧数据并传输至特征提取模块;
所述特征提取模块:对信号采集与处理模块输出的帧数据,进行信号处理与特征提取,提取射频信号具有的调制域特征、波形域特征以及统计度量和调制编码方案特征;所述波形域特征提取包括时域特征和频域特征;
所述指纹识别模块:基于提取的特征进行分类模型训练,根据特征的维度及特征间的相关性选择最佳的分类模型,将WIFI信号经机器学习后生成的输入特征量传给最佳分类模型,进行设备的指纹匹配,实现设备的识别。
2.如权利要求1所述的基于多域物理层指纹特征的Wi-Fi设备识别系统,其特征在于:所述信号采集与处理模块中,软件解调依次经历帧检测和解调解码,所述帧检测利用协议前导码部分的自相关特性,检测出每条帧的出现并作相位纠偏;所述解调解码至少完成了对信道的估计、对信号的数字解调、采样频率补偿及符号均衡。
3.如权利要求2所述的基于多域物理层指纹特征的Wi-Fi设备识别系统,其特征在于:所述特征提取模块中,首先根据帧数据前导码字段的长、短训练序列提取调制域特征,所述调制域特征至少包括载波频率偏移特征、同步相关性特征和星座图特征,再提取波形域特征,利用BPSK的前导码字段提取波形域特征,所述波形域特征包括时域特征与频域特征;特征提取模块中具体是把以调制域表示的信号采样点映射回时域,提取短训练序列过零率、长训练序列能量熵以及长、短训练序列能量熵变化率特征;再用离散傅立叶变化映射至频域,提取谱质心、短训练序列频谱延展度、频谱熵、频谱通量以及长、短训练序列频谱延展度变化率特征,然后提取统计度量及调制编码特征,对样本的前导码按窗口划分子帧,最后分别计算每个子帧的方差、偏度以及峰度得出统计度量特征;对前导码中的信号字段进行解码,提取出调制编码方案特征。
4.如权利要求2所述基于多域物理层指纹特征的Wi-Fi设备识别系统,其特征在于:所述指纹识别模块中的分类模型为支持向量机、多层感知机及基于决策树的分类模型。
5.使用如权利要求1所述系统的基于多域物理层指纹特征的Wi-Fi设备识别方法,其特征在于,包括如下步骤:
S1,信号采集与处理:利用USRP采集无线电信号,经USRP解调后的复数基带信号的采样信号作为无线接收机输入;采样信息经过软件解调后,被解码至数据链路层,输出帧数据;所述软件解调包括帧检测和解调解码,帧检测利用协议前导码部分的自相关特性,检测出每条帧的出现并作相位纠偏;所述解调解码至少包括对信道的估计、对信号的数字解调、采样频率补偿及符号均衡;
S2,特征提取:对经过步骤S1处理好的帧数据进行特征提取,提取射频信号具有的调制域特征、波形域特征、统计度量及调制编码特征;
所述调制域特征包括载波频率偏移特征、同步相关性特征及星座图特征,其中,载波频率偏移特征根据帧数据的前导码提取,同步相关性特征根据帧数据前导码的短训练序列提取,星座图特征根据帧数据前导码的数据字段经过信道估计均衡后提取;
所述波形域特征包括时域特征和频域特征;
所述统计度量特征包括方差、偏度及峰度,基于最大特征系数的特征做选择;
S3,模型训练:对步骤S2提取的特征进行数据预处理,并进行分类模型训练,根据特征的维度及特征间的相关性选择最佳的分类模型;
S4,指纹识别:将WIFI信号经机器学习后生成的输入特征量传给最佳分类模型,进行设备的指纹匹配,实现设备的识别。
6.如权利要求5所述的基于多域物理层指纹特征的Wi-Fi设备识别方法,其特征在于:所述步骤S1中经USRP解调后的复数基带信号的采样信号,即原始无线信号S(t)的复包络
Figure FDA0003895577620000021
的采样,具体为:
s(t)=I(t)cos2πfct-Q(t)sin2πfct
Figure FDA0003895577620000031
Figure FDA0003895577620000032
其中,I(t)和Q(t)分别是接收端处输入进I/Q调制的信号的同相成分和正交成分;fc是载波频率。
7.如权利要求6所述的基于多域物理层指纹特征的Wi-Fi设备识别方法,其特征在于:所述步骤S2中载波频率偏移特征提取的具体方式为:
S21:利用帧数据前导码的短训练序列对相位偏移进行粗粒度估计,其中Sm表示第m个复数采样点;
Figure FDA0003895577620000033
S22:利用估计出的
Figure FDA0003895577620000034
对短训练序列后的长训练序列采样点进行粗粒度纠偏,采样点变为
Figure FDA0003895577620000035
S23:利用帧数据前导码的长训练序列对相位偏移进行细粒度估计;
Figure FDA0003895577620000036
S24:利用估计出的
Figure FDA0003895577620000037
对长训练序列的采样点进行细粒度纠偏,采样点变为
Figure FDA0003895577620000038
S25:获得载波频率偏移造成的相位偏移因子
Figure FDA0003895577620000039
通过下式由相位偏移因子推出载波频率偏移
Figure FDA00038955776200000310
所述同步相关性特征的提取方式具体为:根据帧数据的短训练序列采样点个数,每固定个数个采样点重复一次作为子序列,依次对当前子序列和下一串子序列作下式计算:
Figure FDA00038955776200000311
其中,xi表示第i串子序列,
Figure FDA00038955776200000312
表示第i串子序列的期望值,
Figure FDA00038955776200000313
表示第i串子序列的标准差,循环一轮后求得皮尔逊相关系数的平均数,即得到同步相关性特征;
所述星座图特征根据帧数据前导码的数据字段经过信道估计均衡后提取,包括错误向量幅度、相位错误、幅度错误以及I/Q偏移调制域特征。
8.如权利要求7所述的基于多域物理层指纹特征的Wi-Fi设备识别方法,其特征在于:所述步骤S2中的时域特征提取时,利用下列公式将信号从调制域映射为时域上的离散信号,提取过零率和能量熵特征,并根据特征在前导码长、短训练序列上的变化提取各特征变化率,
Figure FDA0003895577620000041
所述频域特征提取时,按下列公式做离散傅立叶变换,将时域信号映射至频域
Figure FDA0003895577620000042
所述频域特征提取包括谱质心、短训练序列频谱延展度、频谱熵、频谱通量以及长、短训练序列频谱延展度变化率特征。
9.如权利要求5所述的基于多域物理层指纹特征的Wi-Fi设备识别方法,其特征在于:所述步骤S3中,特征数据的预处理至少包括对星座图特征的去噪处理及数据归一化,所述去噪处理包括载波频率偏移噪声的去除和信道估计与均衡,所述归一化处理采用了RobustScaler标准化方法,根据两个四分位数之间的距离来缩放数据。
CN202211272403.2A 2022-10-18 2022-10-18 基于多域物理层指纹特征的Wi-Fi设备识别系统及方法 Pending CN115664905A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211272403.2A CN115664905A (zh) 2022-10-18 2022-10-18 基于多域物理层指纹特征的Wi-Fi设备识别系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211272403.2A CN115664905A (zh) 2022-10-18 2022-10-18 基于多域物理层指纹特征的Wi-Fi设备识别系统及方法

Publications (1)

Publication Number Publication Date
CN115664905A true CN115664905A (zh) 2023-01-31

Family

ID=84988939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211272403.2A Pending CN115664905A (zh) 2022-10-18 2022-10-18 基于多域物理层指纹特征的Wi-Fi设备识别系统及方法

Country Status (1)

Country Link
CN (1) CN115664905A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116582195A (zh) * 2023-06-12 2023-08-11 浙江瑞通电子科技有限公司 一种基于人工智能的无人机信号频谱识别算法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116582195A (zh) * 2023-06-12 2023-08-11 浙江瑞通电子科技有限公司 一种基于人工智能的无人机信号频谱识别算法
CN116582195B (zh) * 2023-06-12 2023-12-26 浙江瑞通电子科技有限公司 一种基于人工智能的无人机信号频谱识别方法

Similar Documents

Publication Publication Date Title
Dobre et al. Blind modulation classification: a concept whose time has come
Like et al. Signal classification in fading channels using cyclic spectral analysis
CN104270234B (zh) 一种基于欠奈奎斯特采样的宽带信号检测识别方法
CN112398553A (zh) 一种基于差分等势星球图的通信辐射源个体识别方法
CN109120563B (zh) 一种基于神经网络集成的调制识别方法
CN110113288A (zh) 一种基于机器学习的ofdm解调器的设计和解调方法
CN104022981A (zh) 一种正交幅度调制信号的盲载波频偏估计方法
CN112347871A (zh) 一种用于通信载波监视系统的干扰信号调制识别方法
CN112398552A (zh) 基于差分复数深度神经网络的通信辐射源个体识别方法
CN108243130A (zh) 解调方法、装置、频谱检测仪及计算机可读存储介质
CN108881089A (zh) 遥测系统中soqpsk调制信号的导频检测方法
Ahmadi Using fuzzy clustering and TTSAS algorithm for modulation classification based on constellation diagram
CN115664905A (zh) 基于多域物理层指纹特征的Wi-Fi设备识别系统及方法
CN113225282A (zh) 一种基于bp神经网络的通信信号调制识别方法
CN109450829B (zh) 数字调制信号码速率估计方法和装置
CN111628950A (zh) 基于差分星座轨迹图的oqpsk信号盲频偏估计方法
CN112367282B (zh) 一种适用于新型智慧城市的mpsk调制多符号检测方法
CN111624632B (zh) 一种卫星导航信号捕获方法及装置
CN117425152A (zh) 一种动态自适应的移动设备射频指纹识别方法和装置
Jajoo et al. Blind signal modulation recognition through density spread of constellation signature
CN106878218A (zh) 一种用于ieee802.15.4的高可靠性解调方法
Zhang et al. Wi-Fi device identification based on multi-domain physical layer fingerprint
Kubankova et al. Extended method of digital modulation recognition and its testing
CN108809876B (zh) 基于不变检验的bpsk信号单符号差分检测方法及装置
Lakhdari et al. Hybrid blind symbol rate estimation for linearly modulated signals

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination