CN112511555A - 基于稀疏表示和卷积神经网络的私有加密协议报文分类法 - Google Patents

基于稀疏表示和卷积神经网络的私有加密协议报文分类法 Download PDF

Info

Publication number
CN112511555A
CN112511555A CN202011474852.6A CN202011474852A CN112511555A CN 112511555 A CN112511555 A CN 112511555A CN 202011474852 A CN202011474852 A CN 202011474852A CN 112511555 A CN112511555 A CN 112511555A
Authority
CN
China
Prior art keywords
data
neural network
convolutional neural
private encryption
encryption protocol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011474852.6A
Other languages
English (en)
Inventor
吉庆兵
张文政
潘炜
张李军
于飞
刘成
谈程
尹浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 30 Research Institute
Original Assignee
CETC 30 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 30 Research Institute filed Critical CETC 30 Research Institute
Priority to CN202011474852.6A priority Critical patent/CN112511555A/zh
Publication of CN112511555A publication Critical patent/CN112511555A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/06Notations for structuring of protocol data, e.g. abstract syntax notation one [ASN.1]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/08Protocols for interworking; Protocol conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/26Special purpose or proprietary protocols or architectures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)

Abstract

本发明涉及网络信息技术领域,具体涉及基于稀疏表示和卷积神经网络的私有加密协议报文分类法,包括获取网络流量数据并进行预处理,得到数据集文件以及标签文件;将数据集文件导入稀疏自编码器进行无监督的特征学习,得到维度更小的输入数据;使用稀疏表示后的训练集和训练集标签对二维卷积神经网络进行训练,进行卷积和池化并最小化误差,得到分类器。本发明公开的分类法自动从原始的网络流量中学习到私有加密协议报文的分类特征,实现分类识别;不依赖网络流量数据包头部的IP地址、端口号信息,分类模型泛化能力强;利用稀疏表示学习私有加密协议报文的局部特征,二维卷积神经网络学习私有加密协议报文的全局特征,提高分类器的识别精度。

Description

基于稀疏表示和卷积神经网络的私有加密协议报文分类法
技术领域
本发明涉及网络信息技术领域,具体涉及基于稀疏表示和卷积神经网络的私有加密协议报文分类法。
背景技术
随着网络环境越来越复杂,很多企业、公司都使用自己的私有加密协议来进行通信,私有加密协议是企业内部制定的协议标准,协议格式是不公开的,报文数据是加密的。从网络安全与监测管理的角度,需要对私有加密协议报文进行有效识别。
基于端口号匹配和DPI(Dots Per Inch,每英寸点数)等根据规则匹配的流量分类方法需要先解析报文内容,再进行规则匹配最后实现分类,这些并不适用于私有加密协议报文。使用机器学习的分类方法不需要对报文的内容进行解析便可以完成分类,因此近年来越来越多的研究机构和人员使用机器学习的方法对网络进行分类。
使用机器学习方法对私有加密协议报文进行分类时,按使用的机器学习算法不同可以分为传统机器学习算法(浅层学习)和深度学习。传统机器学习算法对私有加密协议报文分类主要存在两个问题:一个是需要对待分类的报文人工设计一个可以普遍反映流量特征的特征集,另一个就是传统机器学习方法有很大的局限性,例如对复杂函数难以表示、容易陷入局部最优解等。由于以上两个原因,导致传统机器学习方法对私有加密协议报文分类的准确率不是很高。
因此,需要提出更为合理的技术方案,解决现有技术中存在的技术问题。
发明内容
为了克服上述内容中提到的现有技术存在的缺陷,本发明提供了基于稀疏表示和卷积神经网络的私有加密协议报文分类法,旨在利用深度学习方法自动学习私有加密协议报文数据的局部特征和全局特征,以有效识别网络流量数据中承载的私有加密协议报文的应用类型。
为了实现上述目的,本发明具体采用的技术方案是:
基于稀疏表示和卷积神经网络的私有加密协议报文分类法,包括:
获取网络流量数据并进行预处理,得到训练数据集、测试数据集、训练标签文件以及测试标签文件;
将训练数据集和测试数据集导入稀疏自编码器进行无监督的特征学习,得到维度更小的输入数据;
使用稀疏表示后的训练集和训练集标签对二维卷积神经网络进行训练,进行卷积和池化并最小化误差,得到用于对测试集进行分类的分类器。
上述公开的报文分类法,通过稀疏自编码器和二维卷积神经网络对数据进行处理,可有效识别出网络流量数据中承载的私有加密协议报文应用类型。
进一步的,按照上述公开的方法,在完成分类器的训练后,使用二维卷积神经网络训练完成的私有加密协议报文分类器对测试数据集进行测试,将测试结果与测试集标签进行对比,验证私有加密协议报文分类的准确性。
在私有协议报文分类模型和分类器的设计过程中时,需要考虑分类器的有效输入问题,以提高分类识别的效率。不论是采用公开的数据集,还是研究人员自己采集的网络业务数据流量,原始流量格式均为pcap格式,并不能直接用于基于深度学习模型的私有加密协议报文分类器输入,需要将数据格式转换为idx格式。原始数据除了可能存在数据格式的问题,还可能存在数据信息不完整等问题。因此,必须对真实的网络流量数据进行预处理。采用报文划分、数据归一化、数据可视化以及数据转换的预处理流程。
进一步的,上述公开的技术方案中,所述的数据预处理包括报文划分,将连续的网络流量切分成离散单位,然后分离出传输层以上的报文载荷数据。
再进一步,将连续的网络流量切分成离散单位时,按照流和会话作为切分粒度,即具有相同五元组(源IP地址、源端口、目的IP地址、目的端口和传输层协议)的所有包按照时间顺序组合称之为流,双向流则组成会话,即源IP地址和目的IP地址可以互换。
进一步的,所述的数据预处理包括数据归一化处理,按照统一的长度对报文数据进行截取,即在大于指定长度的数据内截取指定长度的数据,在小于指定长度的数据的末尾补0至指定长度,最终将获得的指定长度的数据存入特定数组内。
进一步的,所述的数据预处理包括数据可视化处理,将存入特定数组内的数据,按照一个字节对应一个灰度值的方式,将各规定长度的数据转化为长宽相同的单通道灰度图。
再进一步,数据转换将灰度图转换为可以输入神经网络模型的idx格式数据,其中idx3格式数据作为训练和测试的数据集,idx1格式数据作为标签集。
进一步的,所述的将训练数据集和测试数据集导入稀疏自编码器进行无监督的特征学习,得到维度更小的输入数据,按照如下方式进行数据处理:
将训练数据集和测试数据集中预处理后的私有加密协议报文数据
Figure BDA0002837139440000041
输入稀疏自编码器,输入层到隐层的偏置为W,隐层的偏置为b,隐含层的输出值h为
h=WX+b
隐层到输出层权值W′,偏置为b′,则稀疏自编码器的输出Y为
Y=W′h+b′
通过X、Y和W计算代价函数J(W,b)
J(W,b)=σ(Y-X)+λW
计算稀疏自编码器的代价函数Jsparse(W,b),并根据Jsparse(W,b)使用梯度下降法调整权值W
Figure BDA0002837139440000042
其中λ是学习率,σ代表用于计算Y-X的L2泛数,η代表学习率;权值调整完成后,最终得到私有加密协议报文数据X的特征表示h。该步骤的实施不仅可以减少卷积神经网络每轮的训练时间,也可以对特征进行更加准确地提取,最终增加私有加密协议报文分类器的分类准确率。
进一步的,使用稀疏表示后的训练集和训练集标签对二维卷积神经网络进行训练以得到分类器的步骤,按照如下方法进行:
私有加密协议报文X1:n经过稀疏自编码特征学习得到特征的表示为X′1:n,将它作为二维卷积神经网络的输入,按照如下方法对经过截取的网络流量经过一个卷积操作得到特征ci
ci=f(ωi·X′i,i+h-1+b)
其中,ωi∈Rh,b表示卷积神经网络偏置,h表示卷积核宽度,f是卷积神经网络中的激活函数,在卷积神经网络中使用ReLU函数;
卷积核运算后,每个输入数据会得到多个特征序列,以如下特征图的形式表示
C=[c1,c2,…,ci]
得到特征映射以后,进行时序性的最大池化操作,对私有加密协议报文特征图进行压缩,减少训练参数,得到最大值
cmax=max_pooling(c1,c2,…,ci)
二维卷积神经网络模型由多个卷积层和池化层构成,在经过多次卷积池化操作以后,最终特征映射进入一个全连接层和softmax层输出。
进一步的,上述技术方案中公开的采用稀疏自编码器进行特征学习和数据获取,可采用如下具体可行的方案:通过两层稀疏自编码器对预处理得到的数据进行特征提取,第一层稀疏自编码器和第二层稀疏自编码器连续将数据进行降维处理。
再进一步,上述技术方案中公开的训练二维卷积神经网络模型,在二维卷积神经网络模型内的卷积层和池化层进行训练时,依次经过两个卷积核的两层卷积层和池化层,数据介入两层全连接层,两层全连接层连续将数据进行转换并对报文种类、数目进行预测。
最终,使用二维卷积神经网络训练完成的私有加密协议报文分类器对IDX3测试集进行测试,将结果与测试集标签进行对比,验证私有加密协议报文分类的准确性。
与现有技术相比,本发明具有的有益效果是:
1、本发明公开的分类法不需要对私有加密协议报文进行特征设计,可以自动从原始的网络流量中学习到私有加密协议报文的分类特征,实现分类识别。
2、基于网络流量数据中传输层之上的载荷数据进行学习与分类,不依赖于网络流量数据包头部的IP地址、端口号信息,分类模型的泛化能力强。
3、能够利用稀疏表示学习私有加密协议报文的局部特征,利用二维卷积神经网络学习私有加密协议报文的全局特征,提高分类器的识别精度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅表示出了本发明的部分实施例,因此不应看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
图1为私有加密协议报文分类模型图。
图2为数据预处理的流程示意图。
图3为私有加密协议报文分类算法中的SAE-2dCNN结构图。
具体实施方式
下面结合附图及具体实施例对本发明做进一步阐释。
在此需要说明的是,对于这些实施例方式的说明用于帮助理解本发明,但并不构成对本发明的限定。本文公开的特定结构和功能细节仅用于描述本发明的示例实施例。然而,可用很多备选的形式来体现本发明,并且不应当理解为本发明限制在本文阐述的实施例中。
实施例
本实施例针对传统机器学习方法对私有加密协议报文分类的准确率不高的现状,提出了优化的技术方案,以具体解决现有技术中的问题。
具体的,本实施例采用的技术方案如下。
如图1所示,基于稀疏表示和卷积神经网络的私有加密协议报文分类法,包括:
获取网络流量数据并进行预处理,得到idx3格式的训练数据集、测试数据集,以及idx1格式的训练标签文件以及测试标签文件;
将训练数据集和测试数据集导入稀疏自编码器进行无监督的特征学习,得到维度更小的输入数据;
使用稀疏表示后的训练集和训练集标签对二维卷积神经网络进行训练,进行卷积和池化并最小化误差,得到用于对测试集进行分类的分类器。
上述公开的报文分类法,通过稀疏自编码器和二维卷积神经网络对数据进行处理,可有效识别出网络流量数据中承载的私有加密协议报文应用类型。
按照上述公开的方法,在完成分类器的训练后,使用二维卷积神经网络训练完成的私有加密协议报文分类器对测试数据集进行测试,将测试结果与测试集标签进行对比,验证私有加密协议报文分类的准确性。
在私有协议报文分类模型和分类器的设计过程中时,需要考虑分类器的有效输入问题,以提高分类识别的效率。不论是采用公开的数据集,还是研究人员自己采集的网络业务数据流量,原始流量格式均为pcap格式,并不能直接用于基于深度学习模型的私有加密协议报文分类器输入,需要将数据格式转换为idx格式。原始数据除了可能存在数据格式的问题,还可能存在数据信息不完整等问题。因此,必须对真实的网络流量数据进行预处理。采用报文划分、数据归一化、数据可视化以及数据转换的预处理流程。
如图2所示,上述公开的技术方案中,所述的数据预处理包括报文划分,可采用按照切分方式进行流量的划分或按照协议层次清洗流量两种方式,将连续的网络流量切分成离散单位,然后分离出传输层以上的报文载荷数据。
本实施例中,将连续的网络流量切分成离散单位时,按照流和会话作为切分粒度,即具有相同五元组(源IP地址、源端口、目的IP地址、目的端口和传输层协议)的所有包按照时间顺序组合称之为流,双向流则组成会话,即源IP地址和目的IP地址可以互换。
所述的数据预处理包括数据归一化处理,按照统一的长度对报文数据进行截取,即在大于指定长度的数据内截取指定长度的数据,在小于指定长度的数据的末尾补0至指定长度,最终将获得的指定长度的数据存入特定数组内。在本实施例中,截取的数据长度设定为n个字节,因此将每个报文截取n个字节,有些长度不足的报文在末尾补0至第n个字节。
所述的数据预处理包括数据可视化处理,将存入特定数组(array数组)内的数据,按照一个字节对应一个灰度值的方式,将各规定长度的数据转化为长宽相同的单通道灰度图。
数据转换将灰度图转换为可以输入神经网络模型的idx格式数据,其中idx3格式数据作为训练和测试的数据集,idx1格式数据作为标签集。
上述技术方案中,所述的将训练数据集和测试数据集导入稀疏自编码器进行无监督的特征学习,得到维度更小的输入数据,按照如下方式进行数据处理:
将idx3中预处理后的私有加密协议报文数据
Figure BDA0002837139440000081
输入稀疏自编码器,输入层到隐层的偏置为W,隐层的偏置为b,隐含层的输出值h为
h=WX+b
隐层到输出层权值W′,偏置为b′,则稀疏自编码器的输出Y为
Y=W′h+b′
通过X、Y和W计算代价函数J(W,b)
J(W,b)=σ(Y-X)+λW
计算稀疏自编码器的代价函数Jsparse(W,b),并根据Jsparse(W,b)使用梯度下降法调整权值W
Figure BDA0002837139440000091
其中λ是学习率,σ代表用于计算Y-X的L2泛数,η代表学习率;权值调整完成后,最终得到私有加密协议报文数据X的特征表示h。该步骤的实施不仅可以减少卷积神经网络每轮的训练时间,也可以对特征进行更加准确地提取,最终增加私有加密协议报文分类器的分类准确率。
上述技术方案中,使用稀疏表示后的训练集和训练集标签对二维卷积神经网络进行训练以得到分类器的步骤,按照如下方法进行:
私有加密协议报文X1:n经过稀疏自编码特征学习得到特征的表示为X′1:n,将它作为二维卷积神经网络的输入,按照如下方法对经过截取的网络流量经过一个卷积操作得到特征ci
ci=f(ωi·X′i,i+h-1+b)
其中,ωi∈Rh,b表示卷积神经网络偏置,h表示卷积核宽度,f是卷积神经网络中的激活函数,在卷积神经网络中使用ReLU函数;
卷积核运算后,每个输入数据会得到多个特征序列,以如下特征图的形式表示
C=[c1,c2,…,ci]
得到特征映射以后,进行时序性的最大池化操作,对私有加密协议报文特征图进行压缩,减少训练参数,得到最大值
cmax=max_pooling(c1,c2,…,ci)
二维卷积神经网络模型由多个卷积层和池化层构成,在经过多次卷积池化操作以后,最终特征映射进入一个全连接层和softmax层输出。
上述技术方案中公开的采用稀疏自编码器进行特征学习和数据获取,可采用如下具体可行的方案:通过两层稀疏自编码器对预处理得到的数据进行特征提取,第一层稀疏自编码器和第二层稀疏自编码器连续将数据进行降维处理。
优选的,如图3所示,自编码器的稀疏性参数待定,第一层自编码器将784字节图片降维成为400字节的图片,第二层自编码器将400字节的图片降维成为144字节的图片,在输入卷积神经网络前,将图片重设成为12*12的大小。
上述技术方案中公开的训练二维卷积神经网络模型,在二维卷积神经网络模型内的卷积层和池化层进行训练时,依次经过两个卷积核的两层卷积层和池化层,数据介入两层全连接层,两层全连接层连续将数据进行转换并对报文种类、数目进行预测。
优选的,本实施例中,经过卷积核大小为5*5的C1卷积层卷积后,生成输出大小为12*12*32,也就是32张12*12大小的特征图,经过池化层P1的2*2最大池化后将每张图片尺寸变为6*6,图片数量不变,因此输出是6*6*32。再经过卷积核大小同样是5*5的第二层卷积层C2,得到输出为6*6*64,生成的特征图数量变为64张,同样经过池化层P2的2*2最大池化后每张图片尺寸变为3*3,输出为3*3*64。
经过两层卷积层和池化层后加入两层全连接层,第一层全连接层将64张3*3的特征图转换为一个1024维的向量,第二层全连接层最终将1024维向量转换为一个12维的向量,表示预测的报文种类数目。
最终,使用二维卷积神经网络训练完成的私有加密协议报文分类器对IDX3测试集进行测试,将结果与测试集标签进行对比,验证私有加密协议报文分类的准确性。
以上即为本发明列举的实施方式,但本发明不局限于上述可选的实施方式,本领域技术人员可根据上述方式相互任意组合得到其他多种实施方式,任何人在本发明的启示下都可得出其他各种形式的实施方式。上述具体实施方式不应理解成对本发明的保护范围的限制,本发明的保护范围应当以权利要求书中界定的为准,并且说明书可以用于解释权利要求书。

Claims (10)

1.基于稀疏表示和卷积神经网络的私有加密协议报文分类法,其特征在于,包括:
获取网络流量数据并进行预处理,得到训练数据集、测试数据集、训练标签文件以及测试标签文件;
将训练数据集和测试数据集导入稀疏自编码器进行无监督的特征学习,得到维度更小的输入数据;
使用稀疏表示后的训练集和训练集标签对二维卷积神经网络进行训练,进行卷积和池化并最小化误差,得到用于对测试集进行分类的分类器。
2.根据权利要求1所述的基于稀疏表示和卷积神经网络的私有加密协议报文分类法,其特征在于:在完成分类器的训练后,使用二维卷积神经网络训练完成的私有加密协议报文分类器对测试数据集进行测试,将测试结果与测试集标签进行对比,验证私有加密协议报文分类的准确性。
3.根据权利要求1所述的基于稀疏表示和卷积神经网络的私有加密协议报文分类法,其特征在于:所述的数据预处理包括报文划分,将连续的网络流量切分成离散单位,然后分离出传输层以上的报文载荷数据。
4.根据权利要求3所述的基于稀疏表示和卷积神经网络的私有加密协议报文分类法,其特征在于:将连续的网络流量切分成离散单位时,按照流和会话作为切分粒度。
5.根据权利要求1所述的基于稀疏表示和卷积神经网络的私有加密协议报文分类法,其特征在于:所述的数据预处理包括数据归一化处理,按照统一的长度对报文数据进行截取,即在大于指定长度的数据内截取指定长度的数据,在小于指定长度的数据的末尾补0至指定长度,最终将获得的指定长度的数据存入特定数组内。
6.根据权利要求5所述的基于稀疏表示和卷积神经网络的私有加密协议报文分类法,其特征在于:所述的数据预处理包括数据可视化处理,将存入特定数组内的数据,按照一个字节对应一个灰度值的方式,将各规定长度的数据转化为长宽相同的单通道灰度图。
7.根据权利要求1所述的基于稀疏表示和卷积神经网络的私有加密协议报文分类法,所述的将训练数据集和测试数据集导入稀疏自编码器进行无监督的特征学习,得到维度更小的输入数据,其特征在于,按照如下方式进行数据处理:
将训练数据集和测试数据集中预处理后的私有加密协议报文数据
Figure FDA0002837139430000021
输入稀疏自编码器,输入层到隐层的偏置为W,隐层的偏置为b,隐含层的输出值h为
h=WX+b
隐层到输出层权值W′,偏置为b′,则稀疏自编码器的输出Y为
Y=W′h+b′
通过X、Y和W计算代价函数J(W,b)
J(W,b)=σ(Y-X)+λW
计算稀疏自编码器的代价函数Jsparse(W,b),并根据Jsparse(W,b)使用梯度下降法调整权值W
Figure FDA0002837139430000022
其中λ是学习率,σ代表用于计算Y-X的L2泛数,η代表学习率;权值调整完成后,最终得到私有加密协议报文数据X的特征表示h。
8.根据权利要求1所述的基于稀疏表示和卷积神经网络的私有加密协议报文分类法,使用稀疏表示后的训练集和训练集标签对二维卷积神经网络进行训练以得到分类器的步骤,其特征在于,按照如下方法进行:
私有加密协议报文X1:n经过稀疏自编码特征学习得到特征的表示为X′1:n,将它作为二维卷积神经网络的输入,按照如下方法对经过截取的网络流量经过一个卷积操作得到特征ci
ci=f(ωi·X′i,i+h-1+b)
其中,ωi∈Rh,b表示卷积神经网络偏置,h表示卷积核宽度,f是卷积神经网络中的激活函数,在卷积神经网络中使用ReLU函数;
卷积核运算后,每个输入数据会得到多个特征序列,以如下特征图的形式表示
C=[c1,c2,…,ci]
得到特征映射以后,进行时序性的最大池化操作,对私有加密协议报文特征图进行压缩,减少训练参数,得到最大值
cmax=max_pooling(c1,c2,…,ci)
二维卷积神经网络模型由多个卷积层和池化层构成,在经过多次卷积池化操作以后,最终特征映射进入一个全连接层和softmax层输出。
9.根据权利要求1所述的基于稀疏表示和卷积神经网络的私有加密协议报文分类法,其特征在于:通过两层稀疏自编码器对预处理得到的数据进行特征提取,第一层稀疏自编码器和第二层稀疏自编码器连续将数据进行降维处理。
10.根据权利要求1所述的基于稀疏表示和卷积神经网络的私有加密协议报文分类法,其特征在于:在二维卷积神经网络模型内进行训练时,依次经过两个卷积核的两层卷积层和池化层,数据介入两层全连接层,两层全连接层连续将数据进行转换并对报文种类、数目进行预测。
CN202011474852.6A 2020-12-15 2020-12-15 基于稀疏表示和卷积神经网络的私有加密协议报文分类法 Pending CN112511555A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011474852.6A CN112511555A (zh) 2020-12-15 2020-12-15 基于稀疏表示和卷积神经网络的私有加密协议报文分类法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011474852.6A CN112511555A (zh) 2020-12-15 2020-12-15 基于稀疏表示和卷积神经网络的私有加密协议报文分类法

Publications (1)

Publication Number Publication Date
CN112511555A true CN112511555A (zh) 2021-03-16

Family

ID=74972208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011474852.6A Pending CN112511555A (zh) 2020-12-15 2020-12-15 基于稀疏表示和卷积神经网络的私有加密协议报文分类法

Country Status (1)

Country Link
CN (1) CN112511555A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113132397A (zh) * 2021-04-23 2021-07-16 信阳农林学院 一种基于深度学习的网络加密流量识别方法、装置及设备
CN113489794A (zh) * 2021-07-07 2021-10-08 智洋创新科技股份有限公司 一种变电站智能识别主站与智能站端设备的通信交互方法
CN113591942A (zh) * 2021-07-13 2021-11-02 中国电子科技集团公司第三十研究所 大规模数据的密文机器学习模型训练方法
CN113949653A (zh) * 2021-10-18 2022-01-18 中铁二院工程集团有限责任公司 一种基于深度学习的加密协议识别方法及系统
CN114070621A (zh) * 2021-11-16 2022-02-18 苏州大学 面向网络数据流分类的在线稀疏学习方法及系统
CN114553722A (zh) * 2022-01-12 2022-05-27 西安电子科技大学 基于多视角一维卷积神经网络的VPN和non-VPN网络流量分类方法
CN115276818A (zh) * 2022-08-04 2022-11-01 西南交通大学 一种基于深度学习的光载无线传输链路解调方法
CN115277888A (zh) * 2022-09-26 2022-11-01 中国电子科技集团公司第三十研究所 一种移动应用加密协议报文类型解析方法及系统
CN115883263A (zh) * 2023-03-02 2023-03-31 中国电子科技集团公司第三十研究所 基于多尺度载荷语义挖掘的加密应用协议类型识别方法
CN116319465A (zh) * 2023-03-17 2023-06-23 中国华能集团有限公司北京招标分公司 一种网络流量端口分析方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106452733A (zh) * 2016-11-24 2017-02-22 中国电子科技集团公司第三十研究所 一种基于密文分析的分组密码识别方法
CN106895975A (zh) * 2017-01-17 2017-06-27 苏州大学 基于Stacked SAE深度神经网络的轴承故障诊断方法
CN107563430A (zh) * 2017-08-28 2018-01-09 昆明理工大学 一种基于稀疏自动编码器和灰度关联分析法的卷积神经网络算法优化方法
CN107682216A (zh) * 2017-09-01 2018-02-09 南京南瑞集团公司 一种基于深度学习的网络流量协议识别方法
EP3619644A2 (en) * 2017-05-05 2020-03-11 HRL Laboratories, LLC Zero shot machine vision system via joint sparse representations
US20200184339A1 (en) * 2018-12-10 2020-06-11 Baidu Usa Llc Representation learning for input classification via topic sparse autoencoder and entity embedding

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106452733A (zh) * 2016-11-24 2017-02-22 中国电子科技集团公司第三十研究所 一种基于密文分析的分组密码识别方法
CN106895975A (zh) * 2017-01-17 2017-06-27 苏州大学 基于Stacked SAE深度神经网络的轴承故障诊断方法
EP3619644A2 (en) * 2017-05-05 2020-03-11 HRL Laboratories, LLC Zero shot machine vision system via joint sparse representations
CN107563430A (zh) * 2017-08-28 2018-01-09 昆明理工大学 一种基于稀疏自动编码器和灰度关联分析法的卷积神经网络算法优化方法
CN107682216A (zh) * 2017-09-01 2018-02-09 南京南瑞集团公司 一种基于深度学习的网络流量协议识别方法
US20200184339A1 (en) * 2018-12-10 2020-06-11 Baidu Usa Llc Representation learning for input classification via topic sparse autoencoder and entity embedding

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
KAPOK: "稀疏自编码器到底有什么用?和卷积核到底是是没关系?", 《知乎 HTTPS://WWW.ZHIHU.COM/QUE》 *
吴凡: "基于卷积神经网络的P2P流量识别研究", 《中国优秀硕士学位论文全文数据库 (信息科技辑) 》 *
逾之: "Softmax多分类器与Softmax层", 《百度 HTTPS://BLOG.ZHONGYUE.SITE/POST/SOFTMAX_LAYER/》 *
陈敏: "《认知计算导论》", 30 June 2017, 华中科技大学出版社 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113132397A (zh) * 2021-04-23 2021-07-16 信阳农林学院 一种基于深度学习的网络加密流量识别方法、装置及设备
CN113489794A (zh) * 2021-07-07 2021-10-08 智洋创新科技股份有限公司 一种变电站智能识别主站与智能站端设备的通信交互方法
CN113591942A (zh) * 2021-07-13 2021-11-02 中国电子科技集团公司第三十研究所 大规模数据的密文机器学习模型训练方法
CN113591942B (zh) * 2021-07-13 2023-05-09 中国电子科技集团公司第三十研究所 大规模数据的密文机器学习模型训练方法
CN113949653A (zh) * 2021-10-18 2022-01-18 中铁二院工程集团有限责任公司 一种基于深度学习的加密协议识别方法及系统
CN114070621B (zh) * 2021-11-16 2023-01-17 苏州大学 面向网络数据流分类的在线稀疏学习方法及系统
CN114070621A (zh) * 2021-11-16 2022-02-18 苏州大学 面向网络数据流分类的在线稀疏学习方法及系统
CN114553722A (zh) * 2022-01-12 2022-05-27 西安电子科技大学 基于多视角一维卷积神经网络的VPN和non-VPN网络流量分类方法
CN115276818A (zh) * 2022-08-04 2022-11-01 西南交通大学 一种基于深度学习的光载无线传输链路解调方法
CN115276818B (zh) * 2022-08-04 2023-09-29 西南交通大学 一种基于深度学习的光载无线传输链路解调方法
CN115277888B (zh) * 2022-09-26 2023-01-31 中国电子科技集团公司第三十研究所 一种移动应用加密协议报文类型解析方法及系统
CN115277888A (zh) * 2022-09-26 2022-11-01 中国电子科技集团公司第三十研究所 一种移动应用加密协议报文类型解析方法及系统
CN115883263A (zh) * 2023-03-02 2023-03-31 中国电子科技集团公司第三十研究所 基于多尺度载荷语义挖掘的加密应用协议类型识别方法
CN115883263B (zh) * 2023-03-02 2023-05-09 中国电子科技集团公司第三十研究所 基于多尺度载荷语义挖掘的加密应用协议类型识别方法
CN116319465A (zh) * 2023-03-17 2023-06-23 中国华能集团有限公司北京招标分公司 一种网络流量端口分析方法

Similar Documents

Publication Publication Date Title
CN112511555A (zh) 基于稀疏表示和卷积神经网络的私有加密协议报文分类法
CN110730140B (zh) 基于时空特性相结合的深度学习流量分类方法
WO2022041394A1 (zh) 一种网络加密流量识别方法及装置
CN113179223B (zh) 一种基于深度学习和序列化特征的网络应用识别方法及系统
Zhang et al. Autonomous unknown-application filtering and labeling for dl-based traffic classifier update
CN111340191B (zh) 基于集成学习的僵尸网络恶意流量分类方法及系统
WO2020119481A1 (zh) 一种基于深度学习的网络流量分类方法、系统及电子设备
CN110311829B (zh) 一种基于机器学习加速的网络流量分类方法
CN111860628A (zh) 一种基于深度学习的流量识别与特征提取方法
CN113162908B (zh) 一种基于深度学习的加密流量检测方法及系统
CN111147396B (zh) 一种基于序列特征的加密流量分类方法
Guo et al. Deep learning-based real-time VPN encrypted traffic identification methods
CN112311814B (zh) 基于深度学习的恶意加密流量识别方法、系统及电子设备
CN111131069A (zh) 一种基于深度学习策略的异常加密流量检测与分类方法
CN110225001B (zh) 一种基于主题模型的动态自更新网络流量分类方法
CN114039901A (zh) 基于残差网络和循环神经网络混合模型的协议识别方法
CN111611280A (zh) 一种基于cnn和sae的加密流量识别方法
US20230215125A1 (en) Data identification method and apparatus
CN114915575B (zh) 一种基于人工智能的网络流量检测装置
CN112804253A (zh) 一种网络流量分类检测方法、系统及存储介质
CN112887291A (zh) 基于深度学习的i2p流量识别方法及系统
CN117633627A (zh) 一种基于证据不确定性评估的深度学习未知网络流量分类方法及系统
CN115225310B (zh) 基于优化元学习的轻量恶意软件流量检测方法及装置
CN111291078A (zh) 一种域名匹配检测方法及装置
CN114358177B (zh) 一种基于多维度特征紧凑决策边界的未知网络流量分类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210316

RJ01 Rejection of invention patent application after publication