CN113313156A - 一种基于时序负载流量指纹的物联网设备识别方法及系统 - Google Patents
一种基于时序负载流量指纹的物联网设备识别方法及系统 Download PDFInfo
- Publication number
- CN113313156A CN113313156A CN202110557882.1A CN202110557882A CN113313156A CN 113313156 A CN113313156 A CN 113313156A CN 202110557882 A CN202110557882 A CN 202110557882A CN 113313156 A CN113313156 A CN 113313156A
- Authority
- CN
- China
- Prior art keywords
- internet
- flow
- things equipment
- load
- fingerprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000013528 artificial neural network Methods 0.000 claims abstract description 21
- 238000000605 extraction Methods 0.000 claims abstract description 17
- 230000008569 process Effects 0.000 claims abstract description 16
- 238000010276 construction Methods 0.000 claims abstract description 11
- 238000003062 neural network model Methods 0.000 claims abstract description 5
- 230000007246 mechanism Effects 0.000 claims description 22
- 239000011159 matrix material Substances 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 5
- 238000013145 classification model Methods 0.000 claims description 4
- 238000011049 filling Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims 1
- 238000002474 experimental method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 238000012795 verification Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011423 initialization method Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010972 statistical evaluation Methods 0.000 description 1
- 238000012418 validation experiment Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/041—Abduction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y30/00—IoT infrastructure
- G16Y30/10—Security thereof
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y40/00—IoT characterised by the purpose of the information processing
- G16Y40/20—Analytics; Diagnosis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Security & Cryptography (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于时序负载流量指纹的物联网设备流量识别方法及系统,本方法的具体工作流程可以分为训练阶段和分类阶段。在训练阶段,根据已标记类别的物联网设备流量的报文长度序列信息和报文字节序列信息,训练神经网络中的可学习参数,从而实现自动化的物联网设备流量指纹提取和物联网设备识别。在分类阶段,基于已训练完成的神经网络模型,对待识别物联网设备流量进行物联网设备流量指纹构建,并完成不同物联网设备的流量识别。本发明从不同的特征维度对于任何物联网设备产生的网络流量进行准确刻画,从而形成更具表达能力的物联网设备流量指纹,在物联网设备流量识别过程中具有高准确率、高度泛化能力和鲁棒性。
Description
技术领域
本发明属于物联网和物联网安全领域,涉及物联网设备识别技术,特别涉及一种基于时序负载流量指纹的物联网设备识别方法及系统。
背景技术
近年来,物联网技术的蓬勃发展使得现实世界中物联网设备的种类和数量都在不断膨胀,目前物联网设备已经融入社会的各个角落之中。然而,随着物联网技术的不断发展以及物联网中设备数量的不断激增,物联网领域同样面临着重要的问题与挑战。当前物联网领域中的热点与难点问题之一就是对不同物联网设备产生流量的准确分类,对于物联网设备的准确分类有助于为网络服务提供商提供更好的网络管理和网络安全保障。第一,对于网络管理而言,由于物联网设备具有较高的异构性,不同的物联网设备对于服务质量(QoS)有着不同的实际需求。因此,网络服务提供商需要为不同的物联网设备所产生的网络流量提供差异化的服务。第二,对于网络安全而言,物联网设备的识别与分类是异常检测、网络防火墙和过滤不需要的流量等活动的第一步。对于网络运营服务提供商来说,及时获得物联网设备的相关信息可以帮助他们对未正常工作或者已经遭受攻击的物联网设备所产生的网络流量进行及时、积极地处理或者屏蔽隔离。因此,在实践中,准确的物联网设备识别方法将有利于提高物联网网络的可靠性和安全性。
物联网设备识别方法可以分为两大类,基于物联网设备唯一标识的识别方法和基于物联网设备流量指纹的识别方法。基于物联网设备唯一标识的识别方法主要通过:(1)MAC地址信息(2)DHCP信息,两种信息作为设备标识。其中基于MAC地址信息方法,由于MAC地址特性,只有当设备与运营商处于同一广播域时MAC地址才可能有效,然而当设备与运营商之间跨越多个网段时,运营商无法检测到设备MAC地址,难以作为物联网设备分类的依据。基于DHCP信息的方法,由于近年许多物联网设备在DHCP请求中没有设置主机名,而且还有许多主机名没有意义,因此也难以作为准确分类的依据。当前基于物联网设备流量指纹的识别方法,通过对物联网设备流量进行特征工程得到物联网设备流量指纹,并结合机器学习等人工智能方法进行分类,得到了较好的分类准确率。本发明针对物联网设备流量指纹识别工作展开相关讨论。
目前,现有的基于物联网设备流量指纹的识别方法虽在一定的场景下取得了较好的实验效果,但此类方法在设计与提取网络流量指纹信息时都需要研究人员对所分析的网络流量数据具有一定程度的先验知识。具体地说,目前的指纹提取工作对于网络流量是否为加密的,传输层协议是可靠传输协议(TCP)还是不可靠传输协议(UDP),以及网络流具体使用了哪些应用层流量等因素过于敏感,这就导致在进行指纹提取的过程中,工作人员在面对多样化的物联网设备流量时,需要对于网络流量有更加具体的了解,并设计更有针对性的指纹信息。然而这对于物联网服务提供商而言,这无疑是一项需要大量人力资源且十分繁琐的工作。同时在当今物联网设备不断增加的大背景下,每一次物联网设备的更新,对于指纹提取工作的工作量可能是几何倍的增长。因此在物联网设备识别领域,如何设计一种具有高度泛化能和鲁棒性的物联网设备网络流量指纹,并进行准确的物联网设备识别是当今的研究热点。
附图说明
图1是基于时序负载流量指纹的物联网设备识别方法的总体流程图。
图2是基于时序负载流量指纹的物联网设备识别方法训练阶段流程图。
图3是物联网设备流量分类模型所构建的神经网络结构图。
图4是多分支结构卷积示意图。
图5是基于时序负载流量指纹的物联网设备识别方法识别阶段流程图。
图6是基于时序负载流量指纹的物联网设备识别系统架构图。
图7是物联网设备流量在验证集上的分类实验结果图。
图8是物联网设备流量在测试集上的分类实验结果图。
发明内容
本发明的目的在于设计并实现一种基于时序负载流量指纹的物联网设备识别方法及系统,从而有效地降低构建物联网设备流量指纹过程中所需要的先验知识,进而能够从复杂多样的物联网环境中识别各种物联网设备。
为实现上述目的,本发明采用的技术方案如下:
一种基于时序负载流量指纹的物联网设备流量识别方法,本方法的具体工作流程如图1所示,可以分为训练阶段和分类阶段。
所述训练阶段包括如下步骤:
1)将IP数据包组装为TCP/UDP单向流,提取每条单向流中每个带负载数据包的负载长度,并将其组合成为一个负载长度序列,从而获得一个单向流的报文长度序列信息;提取每一条单向流中第一个负载数据包的负载数据,获得每一个单向流的报文字节序列信息。分别将报文长度序列信息和报文字节序列信息限制为固定的长度。
2)以步骤1)得到的报文长度序列信息和报文字节序列信息作为输入,形成离线训练数据集,采用有监督学习的方式,构建设备流量识别模型;
所述分类阶段包括如下步骤:
3)以物联网设备流量数据为输入,获取待识别物联网设备流量单向流,并将待测单向流转换为与步骤1)相同的定长报文长度序列信息和报文字节序列信息;
4)判断此时是否有已训练完成的设备流量识别模型,若没有训练好的模型,则先返回训练阶段进行设备流量识别模型训练。若有已经训练好的设备流量识别模型,则使用该模型进行设备识别。
5)根据训练阶段中步骤2)得到的设备流量识别模型,对目标流量数据的物联网设备流量类别进行识别,并输出识别结果。
一种基于时序负载流量指纹的物联网设备识别系统,包括用于训练阶段的物联网设备流量采集处理模块、设备流量识别模型构建模块,以及用于分类阶段的物联网设备流量采集处理模块、物联网设备流量识别模块;其中,
物联网设备流量采集处理模块负责从输入的原始网络流量数据中,提取报文长度序列信息和报文字节序列信息,并将这两部分分别地处理为等长的序列信息;
训练阶段的设备流量识别模型构建模块,负责构建设备流量识别模型所使用的神经网络,并使用已标记类别的、包含有不同物联网设备流量的报文长度序列信息和报文字节序列信息集合对神经网络中的网络参数进行调整,使设备流量识别模型满足训练终止条件,以供分类阶段使用;
分类阶段的物联网设备流量识别模块负责根据训练阶段生成的设备流量识别模型,对物联网设备流量采集处理模块获取的待识别物联网设备报文长度序列信息和报文字节序列信息的物联网设备流量类别属性进行判别,并输出判别结果。
本发明的关键技术点在于:
1.采用基于自注意力机制的方式处理报文长度序列信息,得到可以刻画物联网设备流量报文状态转移关系的时序特征;采用基于独热编码与卷积相结合的方式处理报文字节序列信息,得到可以刻画物联网设备流量应用协议格式信息的流量负载特征。
2.设计了具有时间卷积和负载卷积两个分支的卷积神经网络结构构建类别敏感指纹,该结构可以将时序特征和流量负载特征分别地构建为时序指纹和负载指纹,从而形成可以从两个方面准确地刻画物联网设备流量指纹。
3.设计了基于全局平均池化的指纹融合结构,该结构能够将时序指纹和负载指纹进行融合,形成包含有时序和负载两个方面信息的物联网设备流量指纹,从而形成物联网设备流量的鲁棒表示。
本发明公开了一种基于时序负载流量指纹的物联网设备识别方法及系统。与已公开的相关技术相比,该方法及系统主要有如下优点:
1)该物联网设备流量识别方法具有高度泛化能力和鲁棒性。本发明不事先假定物联网设备产生的网络流量是明文流量或者是密文流量。该发明可适用于传输层协议使用了TCP协议或UDP协议的物联网设备流量,且对于应用层所使用的具体协议类型不敏感;
2)本发明使用自注意力机制提取流量时序指纹,并使用独热编码和带分支的卷积神经网络提取流量负载指纹,将两种指纹融合后得到物联网设备流量指纹,从而可以从不同的特征维度对于任何物联网设备产生的网络流量进行准确刻画。
具体实施方式
本方法的具体工作流程可以分为训练阶段和分类阶段。在训练阶段,根据已标记类别的物联网设备流量的报文长度序列信息和报文字节序列信息,训练神经网络中的可学习参数,从而实现自动化的物联网设备流量指纹提取和物联网设备识别。在分类阶段,基于已训练完成的神经网络模型,对待识别的物联网设备流量进行物联网设备流量指纹构建,并完成不同物联网设备的流量识别。
训练阶段中,本方法的关键技术部分在于对物联网设备流量识别模型的构建。整体的流程如图2所示,训练阶段的输入是总体流程中提到的报文长度序列信息和报文字节序列信息。物联网设备流量分类模型所构建的神经网络结构如图3所示,训练阶段的结束条件为E。物联网设备流量识别模型构建过程的输出为满足物联网设备流量分类需求的物联网设备流量指纹提取模型和物联网设备流量识别模型。
本方法的设备流量识别模型基于深度神经网络模型的训练方法来构建,其具体实施步骤如下:
1.将IP数据包组装为TCP/UDP单向流,数据包组装单向流操作是利用网络五元组作为一个TCP/UDP流的唯一标识,将符合五元组标识的数据包构成一个网络单向流。
本发明所述的五元组是指数据包的源IP地址(ip.src)、目的IP地址(ip.dst)、源端口(port.src)、目的端口(port.dst)、第四层通信协议(protocol),即(ip.src,ip.dst,port.src,port.dst,protocol)。
提取每条TCP/UDP单向流中所有带负载的数据包的负载长度,并将其组合成为一个负载长度序列,从而获得一个单向流的报文长度序列信息(训练集合中包含N条物联网设备流量单向流,li表示每一条单向流的报文长度序列信息)。提取每一条单向流中第一个负载数据包的负载数据,获得该单向流的报文字节序列信息(集合包含N条物联网设备流量单向流,pi表示每一条单向流的报文字节序列信息)。将单向流提取出来的两部分信息合并得到物联网设备的单向流信息集合
将物联网设备流量信息中的报文长度序列信息和报文字节序列信息分别进行长度一致化操作。对长度小于长度基准的信息进行补“0”填充操作,长度大于基准的信息进行截断操作。将报文长度序列信息L处理为定长报文长度序列信息每条流的报文长度序列信息l'i长度设为NL。将报文字节序列信息P处理为定长报文字节序列信息每条流的报文字节序列信息p'i长度设为NP,其中NL、NP两个参数是可以根据物联网设备流量指纹生成模型需要进行调节、设置的。
2.在开始神经网络结构训练前,需要根据超参数设置,对神经网络中的可训练参数进行初始化。神经网络参数初始化可以使用加载现有模型参数、随机初始化、自定义初始化等方法进行,在本方法中,使用随机初始化的方法为神经网络中的所有可训练参数赋予初始值。若使用后需要对本方法中神经网络的可学习参数进行微调,也可跳过此步骤,不进行参数初始化,而是直接加载原有参数,在原有参数基础上调整模型效果。
3.通过时序特征提取器对定长报文序列信息L'进行处理,得到可以刻画物联网设备流量报文状态转移关系的时序特征,基于时序特征利用时间卷积模块得到时序指纹,Ft。接下来,为了便于说明,将以其中一条流的报文长度序列信息l'为例,具体步骤如下:
3.1.此步骤是嵌入编码(Embedding)。嵌入编码中包含一个可训练的参数矩阵wE,其维度为(NL×de)。将l'作为输入的嵌入编码操作可以看成一个查找操作,对给定l'中任一个元素lj'(j∈[1,NL]),可以在wE中查找到其对应的de维度嵌入向量因此l'可以被转换为嵌入矩阵其中嵌入向量的维度de可以根据模型需要而改变,本发明实例实验中de=1024。
3.2.此步骤是位置编码操作。进行添加位置编码(Positional Encoding)操作,将位置编码张量PE与嵌入编码计算后得到的张量X相结合得到位置敏感的张量X',PE维度为(NL×de)与嵌入编码得到的张量X相同。具体步骤如下所示,
X'=X+PE
带有位置编码的张量X'的维度为(NL×de)。本步骤中所使用的位置编码的构造方法是基于不同频率的正弦和余弦函数计算,位置编码矩阵PE的具体计算公式如下:
在以上公式中,pos表示嵌入向量在报文长度序列中的出现的位置;de表示嵌入向量的维度;j表示嵌入向量的某一个维度。
3.3.此步骤是自注意力机制模型,该部分将上一步骤计算得到的X'输入给时序特征提取器中的自注意力机制模型,进而形成时序特征。自注意力机制模型是由ND个相同层堆叠所组成,ND可以根据需要进行自行设置,本发明的验证实验中ND=1。每个层是由两个子层所构成,第一个子层是多头自注意力机制(multi-head self-attention mechanism)模型;第二个子层是一个全连接前馈网络(fully connected feed-forward network)。每一个子层之后都会有残差连接(residual connection)和层标准化操作(layernormalization)。流量时序特征提取的具体步骤如下所示:
3.3.1.此步骤进行多头自注意力机制操作的第一个子层操作,多头注意力机制是h个并行的不同自注意力机制结构,并行数量可以进行自行设置,本方法中h=8,多头自注意力机制又可分为3个子步骤:分别是
1).首先,将数据X'分别输入到h个自注意力机制结构中,得到h个自注意力机制运算之后的特征矩阵Zi,i∈{1,2,...,h}。这里本发明以一个自注意力机制为例,来介绍自注意力机制的计算方法,具体步骤如下:以X'作为输入,首先对X'分别进行三个不同的线性变换操作(Linear)(注意本部分的线性变换在多头自注意力机制中的各个头中所使用的权重参数不共享),即分别与三个权值矩阵WQ,WK,WV进行矩阵乘法运算,矩阵维度分别为(de×dq),(de×dk),(de×dv),从而将X'转换为三个不同的张量,Query张量(Q)维度为(NL×dq)、Key张量(K)维度为(NL×dk)和Value张量(V)维度为(NL×dv),具体表示如下:在本发明实例验证实验中,dq=dk=dv=64。接下来对于Q和K进行矩阵乘法计算得到得分张量S,S的维度为(NL×NL),为了梯度稳定对S进行归一化处理,即除以得到S',之后对于S'使用归一化指数函数(softmax)得到S”,再用S”矩阵乘V,得到自注意力机制的输出张量Zi,维度为(NL×dh)。单个自注意力机制的具体的计算过程如下公式所示。
2)其次,将得到的h个Zi进行拼接操作形成一个表达能力更强的特征矩阵,具体的操作步骤是在第二个维度(即dv所在维度)进行拼接,得到一个(NL×(h×dv))维度的张量。
3)最后,将特征矩阵输入给一个全连接层(fully connected layer)进行线性变换操作,即与权重矩阵WO进行矩阵乘法运算,WO的维度为((h×dv)×de),经线性变换后得到最后的输出Z维度为(NL×de),计算公式如下。
Z=MultiHead(Q,K,V)=Concat(Z1,...,Zi)WO,i∈{1,2,...,h}
将得到的输出进行残差连接操作和层标准化操作得到最终的输出Z',其维度为(NL×de)。
Z'=LayerNorm(X'+Z)
3.3.2.此步骤是全连接前馈网络部分,具体操作如下。首先进行第一个线性变换操作(Linear),即与一个权重矩阵W1进行矩阵乘法运算并添加偏置值b1,W1的维度为(de×dhh);然后,执行一个线性整流函数(ReLU)操作;再进行第二个线性变换操作(Linear),即与一个权重矩阵W2进行矩阵乘法运算并添加偏置值b2,W2的维度为(dhh×de),其中隐藏层维度可以根据需要自行进行修改,计算公式如下所示。
y=FFN(Z')=max(0,Z'W1+b1)W2+b2
并将得到的结果进行残差连接和层标准化操作得到最终一个编码器层输出结果y,维度
为(NL×de):
y'=LayerNorm(X'+y)
3.3.3.从第二个自注意力机制层开始每一层的输入是上一个层的输出y'。重复步骤3.3.1和3.3.2步骤ND次,得到最终结果Y。此时,得到的最终结果Y的维度为(NL×de)。
3.3.4.由于自注意力机制得到的输出结果Y的特征维度过高,因此本发明通过两步2D卷积操作对输出结果Y进行降维操作,使得输出更容易处理。首先将得到的Y增加一个通道维度,维度变换为(1×NL×de)。之后对于Y进行第一步2D卷积操作,卷积的维度变
换计算方法如下:
f(d)=(d-kernel size+2×padding)/2+1
卷积核数量为C1,卷积核大小为(3,3),步长为2,卷积核数量可以自行设置,本方法中C1=32得到维度为(C1×NL'×de')的张量Y',其中NL'=f(NL),de'=f(de)。对Y'进行第二步2D卷积操作,卷积核数量为1,卷积核大小为(3,3),步长为2,得到最终维度为(1×NL”×de”)的张量Y”,其中NL”=f(NL'),de”=f(de')。本步骤中两步卷积的参数可以根据需要自行设置。
3.4此步骤为时间卷积,首先将Y”的第一维度进行压缩维度操作,再在第二维度进行增加维度操作,使Y”变为维度为((NL”×de”)×1)的二维张量,在这一部分使用一个1D卷积操作,卷积核数量为dclass,卷积核大小为1,步长为1,得到一个维度为(dclass×1)的二维张量,再进行维度压缩操作得到输出维度为dclass的张量。本方法中dclass是物联网设备类别的数目。本步骤的输出的每一个维度与物联网类别一一对应,最终得到一个维度为dclass的类敏感流量时序指纹i表示第i条单向流,j表示输出指纹中第j类的维度。
4.以处理后的定长报文负载信息P'作为输入,通过基于独热编码和卷积神经网络的神经网络模型处理报文的负载信息,并基于负载特征利用负载卷积模块得到负载指纹,Fp。下面的部分中为了便于说明,将以其中一条流的报文序列信息p'为例,具体操作步骤如下:
4.1.首先对p'进行独热编码(One-Hot Encoding)操作,独热编码的具体操作流程如下,本发明将p'中的每个字节,均转换为维度为256的独热向量wg。对于集合中p'的第g个字节p'g,假设其字节取值为u,u∈[0,255],且u∈N(因为数据包原始报文负载信息中字节的十进制取值范围是在0~255之间),则其对应的256维度独热向量wg表示为u维度元素取值为1、除第u位以外其余元素取值为0的向量,形如wg={0,0,…,1,…,0},其中元素1在向量wg中的坐标为w(g,u)。经过独热编码变换后,维度为(NP×1)的张量p'转换为维度为(NP×256)的张量W。
4.2.对得到的二维矩阵向量W,首先进行添加维度操作得到维度为(1×NP×256)的张量,并进行2D卷积操作,卷积核数量为H1,卷积核大小为(1×256),步长为1,本发明验证实验中设H1=32。2D卷积后得到的输出结果为R1,R1的维度为(H1×NP×1)。
4.3.对上一步骤2D卷积得到的输出结果进行分支卷积,图4展示了分支卷积操作的示意图。首先,对R1最后一个维度进行维度压缩操作得到维度为(H1×NP)的张量,并以其作为输入,分别输入给三个并行1D卷积,卷积核数量都为H2,卷积核大小分别为1,3,5,步长都为1,填充大小分别为0、1和2,使每个分支卷积后特征图的长度不变。经过三个并行1D卷积操作后,得到三个维度为(H2×NP)的张量,本发明验证实验中设H2=150。将三个并行卷积得到的张量分别输入同一个1D卷积层,卷积核数量为H3,卷积核大小为1,步长为1,得到三个维度为(H3×NP)的张量,分别表示为R1.1,R1.2,R1.3。本方法中H3=32。分支卷积结构中各个分支卷积的卷积核数量和卷积核大小可以根据需求调节。将得到的三个张量R1.1,R1.2,R1.3进行矩阵加法操作得到最终并行卷积的输出结果R2,R2的维度为(H3×NP)。
4.4.R2与R1进行残差融合并进行批标准化操作(batch normalization)得到R3。
R3=BatchNorm(R1+R2)
4.5.此步骤将使用两个线性变换操作(Linear)对特征R3进行维度压缩操作。第一步使用维度变换操作将R3展平;第二部进入丢弃层(dropout layer)进行随机特征选取操作;第三步进入一个全连接层,输出维度为H4,本方法中H4=256,得到维度为的H4张量;
第四步对H4执行线性整流函数(ReLU);第五步进入第二个全连接层,输出维度为H5,本方法中H5=128。得到最终维度为H5的一维张量R4。
4.6.此步骤为负载卷积,首先将上一步骤得到的张量R4进行添加维度操作,得到一个维度为(H5×1)的张量。并对该张量进行一个1D卷积操作,卷积核数量为dclass,卷积核大小为1,卷积步长为1,卷积得到维度为(dclass×1)的张量。然后,再进行维度压缩操作,得到维度为dclass的类别敏感的流量负载指纹其中i表示第i条单向流,j表示输出指纹中第j类的维度。
5.将得到的流量时序指纹Fti和流量负载指纹Fpi进行指纹融合操作,即对Fti和Fpi在对应的维度j处进行拼接操作,得到一个维度为(dclass×2)的类别敏感的物联网设备流量指纹这样就得到了包含有流量时序指纹信息和流量负载指纹信息的物联网设备流量指纹。
6.该步骤对物联网设备流量指纹Fi进行不同类型特征的融合。具体地说,在每一个维度j上(j∈[1,λ])使用全局平均池化(global average pooling)操作融合流量时序指纹和流量负载指纹,从而得到一个维度为dclass的张量,并使用归一化指数函数(softmax)给出每个类别的置信度,取置信度值最大的维度作为本次运算对于该物联网设备流量类别的推断,使用网络得到的物联网设备流量推断类别计算损失函数,以评估当前计算结果与实际数据的拟合程度。本方法所使用的损失函数为交叉熵函数(Cross Entropy)。
7.判断此时训练状况是否满足终止条件E,若满足终止条件,则停止神经网络训练过程,将包含训练后神经网络参数值的物联网设备流量指纹提取模型和物联网设备流量识别模型作为训练阶段最终的结果输出,以供分类阶段进行物联网设备流量识别;若不满足条件,则根据网络计算的损失函数值,使用反向传播更新神经网络参数,并重复步骤3-6。结束条件E的设置,可包括但不局限于下述条件:达到最大迭代周期、达到期望损失函数值、达到期望统计评价指标等。
分类阶段的工作流程如图5所示,该阶段以训练阶段所得到的物联网设备流量指纹提取模型和物联网设备流量识别模型参数为基础、以物联网设备流量为输入,对待识别的物联网设备类别进行识别。
1.本方法的首先将待识别物联网设备流量按照上述训练阶段步骤1所述方法,得到待识别物联网设备流量的定长报文长度序列信息和报文字节序列信息。
2.物联网设备识别模块依据训练阶段生成的物联网设备流量识别模型,以经过预处理的格式化数据作为输入,进行物联网设备流量指纹的提取并最终得到输入的物联网设备流量所代表的物联网设备类别。
本方法在实际应用过程中,可根据方法在不同数据集上的识别效果、识别物联网设备类型的变动等因素,重新启动训练阶段,对神经网络进行调整、重新训练。通过训练阶段与分类阶段的多次迭代,对本方法所使用的神经网络参数进行更新,保证本方法性能满足应用协议分类的需求。
结合上述基于时序负载流量指纹的物联网设备识别方法,本专利同时公开了一种基于时序负载流量指纹的物联网设备识别系统。本系统主要由训练阶段和分类阶段两个阶段构成,系统图架构如图6所示。
1.训练阶段。首先,以已知物联网设备流量为输入,由(1)组合单向流数据预处理模块形成单向流的两部分信息,报文长度序列信息和报文字节序列信息;(1)组合单向流数据预处理模块将所有报文长度序列信息和报文字节序列信息执行截断或补零操作,使同一种信息的长度相同,将报文序列信息进行嵌入操作,将报文负载信息进行独热编码操作,作为目标物联网设备流量数据集。本方法设计的物联网设备流量识别模型,需要事先进行训练方可进行目标物联网设备识别工作。由(2)物联网设备流量识别模型构建训练模块使用目标物联网设备流量数据集,对本方法设计的物联网设备流量识别模型进行训练,使物联网设备流量识别模型的性能满足分类需求。(2)物联网设备流量识别模型构建模块的输出结果是完成构建的设备识别模型。
2.分类阶段。分类阶段以待识别物联网设备流量数据为输入,由(1)组合单向流数据预处理模块对待识别物联网设备流量数据进行处理,形成单向流的两部分信息,包括报文长度序列信息和报文字节序列信息,分别统一序列的长度并转化为嵌入张量和独热编码形式,作为待测数据集。(3)物联网设备流量识别模块以待测数据集为输入,使用(2)物联网设备流量识别模型构建模块所生成的设备识别模型,对待测数据集中的各个样本所属的物联网设备类型进行判别。分类阶段的输出结果为待识别物联网设备流量所对应的物联网设备类型的具体判断结果。
在验证实验中,本发明对18种不同类型的物联网设备产生的网络流量开展实例验证。实验中所使用的每种物联网设备产生的网络流量的具体信息如表1所示。其中,对于每个设备类别,本发明随机地选择了3千条网络流,如果某一类别的流数不足3000,则选择全部的数据。此外,在实验数据集上开展了5折交叉验证,其中训练集,验证集和测试集的划分比例为3:1:1。
表格1:验证实验中所使用的公共数据集中的物联网设备名称及各个设备的网络流量相关信息,其中M代表106,K代表103,G代表106。
物联网设备流量的分类模型设计完成以后,为了评估其分类性能,必须定义合适的分类评估指标。对于正在分析的特定应用程序r,定义如下指标来评估分类器的分类性能:
(1)物联网设备r的真阳率(True Positive Rate,TPR):
(2)物联网设备r的假阳率(False Positive Rate,FPR):
(3)TPRr和FPRr分别反映了整个系统的两方面的分类表现,FTFr指标则是TPRr与FPRr指标之间的折衷,其具体定义如下:
(4)本发明是针对混杂物联网设备流量的多类别分类,多种物联网设备的系统整体分类表现采用准确率指标(Accuracy)来评估,ACC指标的具体定义如下:
其中,λ表示需要分类的物联网设备类别数。
在验证实验中,有以下三个重要参数,分别是(1)NL,代表用于分类的网络数据流的前多少个数据报文的个数;(2)de,代表嵌入编码层的嵌入向量维度;(3)NP,代表网络流第一个报文中用于分类的报文长度的不同取值。在以下针对本发明的评估实验中,具体的参数选择范围是NL∈{8,16,32},de=1024,NP∈{16,32,64}。接下来,介绍具体的物联网设备流量分类的实验结果。
图7绘制了当参数NP和NL为不同取值时,18种物联网设备流量在实验数据集的验证集上的Accuracy数值的变化情况。对于不同的参数设置,ACC数值在97.505%–98.423%的范围内变化。验证数据集上的最佳参数值为NL=32,d=1024和NP=64,相应的ACC数值为98.423%。图7可以清楚地注意到,对于较低的NP值,Accuracy数值都会降低。此外,还可以注意到,对于较低的NL值,本发明的Accuracy数值通常下降不大。
图8绘制了当参数NP和NL为不同取值时,18种物联网设备流量在实验数据集的测试集上的Accuracy数值的变化情况。值得注意的是在验证集上分类表现最好的参数设置(NL=32,d=1024和NP=64),其在测试集上的分类准确率为98.320%。
表格2:与现有流量分类方法对比实验结果
表格2展示了本发明与现有最先进的流量分类方法(BSNN方法是面向负载的流量分类方法,FS-Net是面向报文长度序列的流量分类方法)的实验对比结果。表格2详细地展示了每种设备的TPR、FPR,平均TPR、平均FPR以及FTF几种评价指标下的实验结果值。从表格2中,可以明显地观察到,本发明在实验数据集上的FTF数值是98.23;现有流量分类方法BSNN和FS-Net的FTF数值分别是94.203和82.264。因此,本发明的实验效果优于BSNN和FS-Net方法。
Claims (8)
1.一种基于时序负载流量指纹的物联网设备识别方法,其特征在于,包括训练阶段和分类阶段;
所述训练阶段包括如下步骤:
1)以已知物联网设备流量类型的网络数据包集合为输入,将IP数据包重组为TCP/UDP单向流,提取每条单向流中每个带负载数据包的负载长度,并将其组合成为一个负载长度序列,从而获得一个单向流的报文长度序列信息;提取每一条单向流中第一个负载数据包的负载数据,获得每一个单向流的报文字节序列信息;分别将报文长度序列信息和报文字节序列信息转换为固定长度;
2)以步骤1)得到的报文长度序列信息和报文字节序列信息作为输入,形成离线训练数据集,采用有监督学习的方式,构建设备流量识别模型;
所述分类阶段包括如下步骤:
3)以物联网设备流量数据为输入,获取待识别物联网设备流量网络单向流,并将待测单向流转换为与步骤1)相同的定长报文长度序列信息和报文字节序列信息;
4)根据训练阶段中步骤2)得到的设备流量识别模型,对目标流量数据的物联网设备流量类别进行识别,并输出识别结果。
2.如权利要求1所述的一种基于时序负载流量指纹的物联网设备识别方法,其特征在于,步骤1)进行字节流序列转换的具体操作方法是:
1-1)利用网络五元组将数据包组合为网络单向流,提取每条单向流中每个带负载数据包的负载长度,并将其组合成为一个负载长度序列,从而获得一个单向流的报文长度序列信息;提取每一条单向流中第一个负载数据包的负载数据,获得每一个单向流的报文字节序列信息;
1-2)将物联网设备流量信息中的报文长度序列信息和报文字节序列信息分别进行长度一致化操作;对长度小于长度基准的信息进行补“0”填充操作,长度大于基准的信息进行截断操作。
3.如权利要求1所述的一种基于时序负载流量指纹的物联网设备识别方法,其特征在于,步骤2)构建所述特征提取网络模型和应用协议分类模型的方法是:
2-1)以步骤1)得到的定长报文长度序列信息作为输入,通过时序特征提取器对定长报文序列信息进行时序特征提取操作,得到刻画物联网设备流量报文状态转移关系的时序特征,基于时序特征利用时间卷积模块得到流量时序指纹;
2-2)以步骤1)得到的定长报文负载信息为输入,通过基于独热编码和卷积神经网络的神经网络模型处理报文负载信息进行流量负载特征提取操作,得到可以刻画物联网设备流量应用协议格式信息的负载特征,基于负载特征利用负载卷积模块得到流量负载指纹;
2-3)以步骤2-1)得到的流量时序指纹和步骤2-2)得到的流量负载指纹为输入,进行指纹融合操作,得到包含有流量时序指纹信息和流量负载指纹信息两部分信息的物联网设备流量指纹;并使用归一化指数函数,进行物联网设备流量识别操作,得到物联网设备流量所属的物联网设备流量类别;
2-4)以步骤2-3)得到的物联网设备流量类别与步骤1)中的物联网设备流量的真实物联网设备类型为输入,计算模型分类准确率、损失函数值等指标,若指标满足终止条件E,则停止神经网络训练过程,将包含训练后神经网络参数值的物联网设备流量指纹提取模型和物联网设备流量识别模型作为训练阶段最终的结果输出,以供分类阶段进行物联网设备流量识别;若指标不满足终止条件,则根据网络计算的损失函数值,使用反向传播更新神经网络参数,并重复步骤2-1)~步骤2-3)。
4.如权利要求3所述的一种基于时序负载流量指纹的物联网设备识别方法,其特征在于,步骤2-1)所述的时序特征提取操作的具体操作方法是:
2-1-1)嵌入编码层,以1-2)中得到的定长报文长度序列信息作为输入进行嵌入编码操作;嵌入操作是在一个可训练的参数矩阵中,对输入向量中的每一个元素进行查找,并得到查找后的嵌入编码张量;
2-1-2)位置编码层,对嵌入编码张量进行添加位置编码操作,将嵌入编码张量与位置编码进行张量加法操作,得到有位置信息的嵌入编码张量;其中位置编码的构造方法是基于不同频率的正弦和余弦函数计算;
2-1-3)将有位置信息的嵌入编码张量作为时序特征提取器中的自注意力机制模型的输入,进行自注意力时序特征提取操作,进而形成高维度的时序特征张量;
2-1-4)以高维度的时序特征张量作为输入,使用两个2D卷积进行特征降维操作,得到时序特征;其中第一个卷积的卷积核数量为C1,卷积核大小为b,步长为s;第二个卷积的卷积核数量为1,卷积核大小为b,步长为s;
2-1-5)将时序特征作为输入,使用1D卷积进行时间卷积操作,得到类别敏感的流量时序指纹;1D卷积的卷积核数量为已知物联网设备类型总数λ,卷积核大小为1,步长为1。
5.如权利要求3所述的一种基于时序负载流量指纹的物联网设备识别方法,其特征在于,步骤2-2)所述的流量负载特征提取操作的具体操作方法是:
2-2-1)对1-2)中得到的定长报文负载信息进行独热编码操作,得到独热编码张量;具体地说,将其每个字节转换为十进制表示的取值范围为[0,255]之间的整数;将所有字节转换为256维的独热向量,其特征在于,除代表该字节实际取值的一位为1之外,向量其余各位取值为0;
2-2-2)以独热编码张量作为输入,使用卷积核数量为H1,卷积核大小为(1×k)的2D卷积层进行卷积操作,得到定长报文负载信息的初始特征表征张量;
2-2-3)以初始特征表征张量为输入,使用3个并行的卷积神经网络分支对初始特征表征张量进行处理,得到各分支特征张量;其中,每个分支包括两层1D卷积神经网络层,设分支第一层1D卷积层的卷积核数都为H2,卷积核尺寸分别为1、3、5,步长都为1,填充大小分别为0、1、2;第二层1D卷积层的卷积核数为H3,卷积核尺寸为1,步长为1,各分支共享该层参数,变换上层获取的特征,生成分支特征张量;对各分支得到的分支特征张量执行加法操作得到分支融合特征张量;
2-2-4)将初始特征表征张量与分支融合特征张量相加,进行残差融合操作,并进行批标准化操作,得到标准化后的分支融合特征张量;
2-2-5)以标准化后的分支融合特征张量作为输入,使用不少一层全连接层,逐层进行降低维度操作,得到负载特征;其中全连接层之间使用线性整流函数;
2-2-6)以负载特征作为输入,使用1D卷积进行负载卷积操作,得到类别敏感的流量负载指纹;1D卷积的卷积核数量为已知物联网设备类型总数λ,卷积核大小为1,步长为1。
6.如权利要求3所述的一种基于时序负载流量指纹的物联网设备识别方法,其特征在于,步骤2-3)所述的指纹融合操作的具体操作方法是:
2-3-1)将步骤2-1)得到的流量时序指纹和步骤2-2)得到的流量负载指纹按特征维度进行拼接操作得到拼接张量;以拼接张量作为输入,使用全局平均池化操作(globalaveragepooling)进行计算得到物联网设备流量指纹;
2-3-2)以物联网设备流量指纹作为输入,使用归一化指数函数,得到每个类别的置信度,取置信度值最大的类别作为本次运算对于该物联网设备流量类别的推断。
7.如权利要求4所述的一种基于时序负载流量指纹的物联网设备识别方法,其特征在于,步骤2-1-3)所述的自注意力时序特征提取操作的具体操作方法是:
2-1-3-1)以步骤2-1-2)有位置信息的嵌入编码张量作为输入使用不少于一个的并行自注意力机制,进行多头自注意力机制操作子层操作,得到多个加权后的特征矩阵;
2-1-3-2)执行全连接前馈网络操作;全连接前馈网络是由两个全连接层构成,并在两个全连接层之中引用了线性整流函数;以多个加权后特征矩阵作为输入,得到全连接前馈网络的输出张量;并将该输出张量加权后特征矩阵相加,进行残差融合,并进行层标准化,得到高维度的时序特征张量。
8.一种利用权利要求1-4任一所述方法进行的基于时序负载流量指纹的物联网设备识别系统,包括用于训练阶段的物联网设备流量采集处理模块、设备流量识别模型构建模块,以及用于分类阶段的物联网设备流量采集处理模块、物联网设备流量识别模块;其中,
物联网设备流量采集处理模块负责从输入的原始网络流量数据中,提取报文长度序列信息和报文字节序列信息,将两部分分别处理为等长序列信息;
训练阶段的设备流量识别模型构建模块,负责构建设备流量识别模型所使用的神经网络,并使用已标记的、包含有不同物联网设备流量的报文长度序列信息和报文字节序列信息集合对神经网络中的网络参数进行调整,使设备流量识别模型满足训练终止条件,以供分类阶段使用;
分类阶段的物联网设备流量识别模块负责根据训练阶段生成的设备流量识别模型,对物联网设备流量采集处理模块获取的待识别物联网设备报文长度序列信息和报文字节序列信息的物联网设备流量类别属性进行,并输出判别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110557882.1A CN113313156A (zh) | 2021-05-21 | 2021-05-21 | 一种基于时序负载流量指纹的物联网设备识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110557882.1A CN113313156A (zh) | 2021-05-21 | 2021-05-21 | 一种基于时序负载流量指纹的物联网设备识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113313156A true CN113313156A (zh) | 2021-08-27 |
Family
ID=77373949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110557882.1A Pending CN113313156A (zh) | 2021-05-21 | 2021-05-21 | 一种基于时序负载流量指纹的物联网设备识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113313156A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113839941A (zh) * | 2021-09-22 | 2021-12-24 | 国网湖北省电力有限公司检修公司 | 基于smote和并行随机森林的物联网设备准入检测方法和系统 |
CN114067356A (zh) * | 2021-10-21 | 2022-02-18 | 电子科技大学 | 基于联合局部引导与属性聚类的行人重识别方法 |
CN114118131A (zh) * | 2021-09-29 | 2022-03-01 | 北京交通大学 | 基于注意力机制的多特征融合无线设备射频指纹提取方法 |
CN114221992A (zh) * | 2021-11-12 | 2022-03-22 | 国网山西省电力公司电力科学研究院 | 一种基于跨层指纹的细粒度设备识别方法 |
CN114386514A (zh) * | 2022-01-13 | 2022-04-22 | 中国人民解放军国防科技大学 | 基于动态网络环境下的未知流量数据识别方法及装置 |
CN114553790A (zh) * | 2022-03-12 | 2022-05-27 | 北京工业大学 | 一种基于多模态特征的小样本学习物联网流量分类方法及系统 |
CN114679318A (zh) * | 2022-03-25 | 2022-06-28 | 东南大学 | 一种高速网络中轻量级的物联网设备识别方法 |
CN114745155A (zh) * | 2022-03-14 | 2022-07-12 | 河海大学 | 一种网络异常流量检测方法、装置及存储介质 |
CN115277071A (zh) * | 2022-06-17 | 2022-11-01 | 中国科学院信息工程研究所 | 设备异常通信行为检测方法及装置 |
CN116192765A (zh) * | 2023-03-14 | 2023-05-30 | 东南大学 | 一种基于注意力机制的物联网设备流量早期识别方法 |
CN116233011A (zh) * | 2023-03-03 | 2023-06-06 | 国家计算机网络与信息安全管理中心 | 一种基于包长度序列和消息长度序列深度融合的物联网流量分类方法及系统 |
CN116915720A (zh) * | 2023-09-12 | 2023-10-20 | 武汉烽火凯卓科技有限公司 | 物联网设备流量识别方法、系统、电子设备及存储介质 |
CN118035853A (zh) * | 2024-04-12 | 2024-05-14 | 中国移动紫金(江苏)创新研究院有限公司 | 基于流量指纹的工控设备识别方法、相关设备及产品 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10263868B1 (en) * | 2012-04-11 | 2019-04-16 | Narus, Inc. | User-specific policy enforcement based on network traffic fingerprinting |
CN110380989A (zh) * | 2019-07-26 | 2019-10-25 | 东南大学 | 网络流量指纹特征二阶段多分类的物联网设备识别方法 |
CN112564974A (zh) * | 2020-12-08 | 2021-03-26 | 武汉大学 | 一种基于深度学习的物联网设备指纹识别方法 |
-
2021
- 2021-05-21 CN CN202110557882.1A patent/CN113313156A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10263868B1 (en) * | 2012-04-11 | 2019-04-16 | Narus, Inc. | User-specific policy enforcement based on network traffic fingerprinting |
CN110380989A (zh) * | 2019-07-26 | 2019-10-25 | 东南大学 | 网络流量指纹特征二阶段多分类的物联网设备识别方法 |
CN112564974A (zh) * | 2020-12-08 | 2021-03-26 | 武汉大学 | 一种基于深度学习的物联网设备指纹识别方法 |
Non-Patent Citations (1)
Title |
---|
杨威超;郭渊博;钟雅;甄帅辉;: "基于设备型号分类和BP神经网络的物联网流量异常检测", 信息网络安全, no. 12, 10 December 2019 (2019-12-10), pages 59 - 69 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113839941B (zh) * | 2021-09-22 | 2023-08-29 | 国网湖北省电力有限公司检修公司 | 基于smote和并行随机森林的物联网设备准入检测方法和系统 |
CN113839941A (zh) * | 2021-09-22 | 2021-12-24 | 国网湖北省电力有限公司检修公司 | 基于smote和并行随机森林的物联网设备准入检测方法和系统 |
CN114118131A (zh) * | 2021-09-29 | 2022-03-01 | 北京交通大学 | 基于注意力机制的多特征融合无线设备射频指纹提取方法 |
CN114067356A (zh) * | 2021-10-21 | 2022-02-18 | 电子科技大学 | 基于联合局部引导与属性聚类的行人重识别方法 |
CN114221992A (zh) * | 2021-11-12 | 2022-03-22 | 国网山西省电力公司电力科学研究院 | 一种基于跨层指纹的细粒度设备识别方法 |
CN114386514A (zh) * | 2022-01-13 | 2022-04-22 | 中国人民解放军国防科技大学 | 基于动态网络环境下的未知流量数据识别方法及装置 |
CN114553790A (zh) * | 2022-03-12 | 2022-05-27 | 北京工业大学 | 一种基于多模态特征的小样本学习物联网流量分类方法及系统 |
CN114745155B (zh) * | 2022-03-14 | 2023-04-07 | 河海大学 | 一种网络异常流量检测方法、装置及存储介质 |
CN114745155A (zh) * | 2022-03-14 | 2022-07-12 | 河海大学 | 一种网络异常流量检测方法、装置及存储介质 |
CN114679318A (zh) * | 2022-03-25 | 2022-06-28 | 东南大学 | 一种高速网络中轻量级的物联网设备识别方法 |
CN114679318B (zh) * | 2022-03-25 | 2024-04-23 | 东南大学 | 一种高速网络中轻量级的物联网设备识别方法 |
CN115277071A (zh) * | 2022-06-17 | 2022-11-01 | 中国科学院信息工程研究所 | 设备异常通信行为检测方法及装置 |
CN115277071B (zh) * | 2022-06-17 | 2024-04-02 | 中国科学院信息工程研究所 | 设备异常通信行为检测方法及装置 |
CN116233011A (zh) * | 2023-03-03 | 2023-06-06 | 国家计算机网络与信息安全管理中心 | 一种基于包长度序列和消息长度序列深度融合的物联网流量分类方法及系统 |
CN116192765A (zh) * | 2023-03-14 | 2023-05-30 | 东南大学 | 一种基于注意力机制的物联网设备流量早期识别方法 |
CN116915720A (zh) * | 2023-09-12 | 2023-10-20 | 武汉烽火凯卓科技有限公司 | 物联网设备流量识别方法、系统、电子设备及存储介质 |
CN116915720B (zh) * | 2023-09-12 | 2023-12-01 | 武汉烽火凯卓科技有限公司 | 物联网设备流量识别方法、系统、电子设备及存储介质 |
CN118035853A (zh) * | 2024-04-12 | 2024-05-14 | 中国移动紫金(江苏)创新研究院有限公司 | 基于流量指纹的工控设备识别方法、相关设备及产品 |
CN118035853B (zh) * | 2024-04-12 | 2024-07-26 | 中国移动紫金(江苏)创新研究院有限公司 | 基于流量指纹的工控设备识别方法、相关设备及产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113313156A (zh) | 一种基于时序负载流量指纹的物联网设备识别方法及系统 | |
Ridgeway et al. | Learning deep disentangled embeddings with the f-statistic loss | |
CN110380989B (zh) | 网络流量指纹特征二阶段多分类的物联网设备识别方法 | |
CN108229539B (zh) | 用于训练神经网络的系统 | |
WO2020228141A1 (zh) | 基于内隐知识构建图卷积网络的电磁信号识别方法及装置 | |
Wang et al. | App-net: A hybrid neural network for encrypted mobile traffic classification | |
CN114462520A (zh) | 一种基于流量分类的网络入侵检测方法 | |
CN112367273B (zh) | 基于知识蒸馏的深度神经网络模型的流量分类方法及装置 | |
US11658989B1 (en) | Method and device for identifying unknown traffic data based dynamic network environment | |
CN112001292B (zh) | 一种基于多尺度注意力机制深度哈希的指静脉索引方法 | |
CN104462196A (zh) | 多特征联合哈希信息检索方法 | |
CN116929815A (zh) | 基于物联网的设备工作状态监测系统及其方法 | |
CN115577248A (zh) | 风力发电机组的故障诊断系统及其方法 | |
CN113628059A (zh) | 一种基于多层图注意力网络的关联用户识别方法及装置 | |
CN116702156A (zh) | 信息安全风险评价系统及其方法 | |
CN115982736A (zh) | 用于计算机网络信息的数据加密方法及系统 | |
CN116405419A (zh) | 一种基于小样本学习的未知网络协议分类方法 | |
CN117938970B (zh) | 一种双向网络通讯方法及系统 | |
CN113778718A (zh) | 基于动态路由的微服务资源管理方法、系统和电子设备 | |
CN117056902A (zh) | 物联网密码管理方法及系统 | |
CN116930042A (zh) | 建筑防水材料性能检测设备及方法 | |
CN116827873A (zh) | 一种基于局部-全局特征注意力的加密应用流量分类方法及系统 | |
CN114666254A (zh) | 用于全屋路由器系统的网络性能测试方法及其系统 | |
CN110796182A (zh) | 一种少量样本的票据分类方法及系统 | |
CN117633627A (zh) | 一种基于证据不确定性评估的深度学习未知网络流量分类方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |