CN109361617B - 一种基于网络包载荷的卷积神经网络流量分类方法及系统 - Google Patents

一种基于网络包载荷的卷积神经网络流量分类方法及系统 Download PDF

Info

Publication number
CN109361617B
CN109361617B CN201811122301.6A CN201811122301A CN109361617B CN 109361617 B CN109361617 B CN 109361617B CN 201811122301 A CN201811122301 A CN 201811122301A CN 109361617 B CN109361617 B CN 109361617B
Authority
CN
China
Prior art keywords
data
packet
model
neural network
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811122301.6A
Other languages
English (en)
Other versions
CN109361617A (zh
Inventor
周旭
徐陆阳
任勇毛
覃毅芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Network Information Center of CAS
Original Assignee
Computer Network Information Center of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Network Information Center of CAS filed Critical Computer Network Information Center of CAS
Priority to CN201811122301.6A priority Critical patent/CN109361617B/zh
Publication of CN109361617A publication Critical patent/CN109361617A/zh
Application granted granted Critical
Publication of CN109361617B publication Critical patent/CN109361617B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2441Traffic characterised by specific attributes, e.g. priority or QoS relying on flow classification, e.g. using integrated services [IntServ]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种基于网络包载荷的卷积神经网络流量分类方法及系统,其中,方法包括以下步骤:将网络抓包所得pcap文件中所有的数据包传输层的去除头部后的载荷数据提出取来,将数据包的载荷的信息转换为字节序列,随机打乱数据顺序并且进行训练集、验证集和测试集的分割;将结构化的数据输入一维卷积神经网络进行训练,完成神经网络隐藏单元的权重参数调整;在验证集和测试集上进行性能验证,若达不到性能指标,则反馈给模型训练模块继续调整模型参数。本发明可以免除繁琐的人工标注工作,只需要流量数据包的载荷数据即可完成高精度分类。用户只需将模型部署到合适的位置,即可随时随机的截取链路中的数据包输入模型即可得到流量类别结果。

Description

一种基于网络包载荷的卷积神经网络流量分类方法及系统
技术领域
本发明涉及计算机网络与网络安全领域中的流量识别、分类与检测方法,具体而言,本发明涉及一种基于网络流量包载荷分析的卷积神经网络(Convolutional NeuralNetwork,CNN)流量分类方法及系统。
背景技术
网络流量分类是根据不同的业务流或者应用流将在网络链路中的流量数据划分并识别为某种确切的种类。网络流量分类是现代通讯网络中的一个重要任务,它为网络质量检测、网络入侵检测、恶意软件检测、运营商监管调控与定价等应用领域提供了判断依据与底层技术支持。随着当今移动互联网的蓬勃发展,移动端与终端侧大量新型网络应用的出现,致使当今的网络流量出现了以下三个特点:1、网络流量数据规模庞大;2、网络应用类型复杂且繁多;3、网络协议异构且多样。针对新型的网络特点,如何精准高效的对网络流量进行分类是一个亟待解决的问题。
传统的网络流量分类方法主要有一下三种:1、基于固定端口的分类方法。我们熟知的HTTP类型应用的端口为80,MySQL应用端口为3306等。但是越来越多的应用采用不固定的端口或者动态端口,对于当今的海量网络应用,该种流量分类方法已不能满足要求。2.基于DPI(Deep Packet Inspection)技术的分类方法。深度包解析技术需要对数据包从底层至顶层依次解析报文来查看数据包具体的各个字段的信息以及负载。DPI技术需要大量的匹配规则,同时对于计算能力和内存的消耗较大,在实际工程中部署限制较大。3.基于统计规则的机器学习识别方法。基于统计特征的方法首先都要进行繁琐耗时的人工的特征提取工作,例如数据包大小的平均值、方差,同一条流内的数据包的到达时间间隔等特征。此方法需要大量的手工标注工作来统计整理特征数据。
考虑到当前网络与网络应用的特点,固定的端口和固定的匹配规则、计算和内存资源的大量消耗、繁琐的人工特征统计过程都扼杀了在网络链路上进行实时分类的可能性。
发明内容
本发明的目的在于,鉴于上述问题,为提高网络流量分类的准确率,降低工程上的资源消耗,同时可以达到在链路上的实时部署。
为实现上述目的,一方面,本发明提供了一种基于网络包载荷的卷积神经网络流量分类方法,该方法包括以下步骤:
将网络抓包所得pcap文件中所有的数据包传输层的去除头部后的载荷数据提出取来,将数据包的载荷的信息转换为字节序列,随机打乱数据顺序并且进行训练集、验证集和测试集的分割;将结构化的数据输入一维卷积神经网络进行训练,完成神经网络隐藏单元的权重参数调整;在验证集和测试集上进行性能验证,若达不到性能指标,则反馈给模型训练模块继续调整模型参数。
优选地,本发明提取数据包载荷的前784个字节,不足的用0x00补齐,将其作为一个1*784的序列,使用一维卷积神经网络处理包载荷序列,完成流量数据包的分类。
优选地,本发明对于pcap文件,依次遍历每一个数据包,移除传输层头部,将每一个数据包的TCP或者UDP的载荷部分提取出来并且按照字节形成10进制表示的数据文件。
优选地,本发明选取数据集中未经VPN加密的流量作为训练数据,根据采集流量的应用类型将流量数据划分为六类。
优选地,当训练集样例分布不均衡时,采用过采样或者欠采样方式来弥补数据不均衡对分类精度带来的影响。
另一方面,本发明提供了一种基于网络包载荷的卷积神经网络流量分类系统,该系统包括数据预处理模块、模型训练模块和模型验证模块。
数据预处理模块用于将网络抓包所得pcap文件中所有的数据包传输层的去除头部后的载荷数据提出取来,将数据包的载荷的信息转换为字节序列,随机打乱数据顺序并且进行训练集、验证集和测试集的分割。
模型训练模块用于将结构化的数据输入一维卷积神经网络进行训练,完成神经网络隐藏单元的权重参数调整。
模型验证模块用于在验证集和测试集上的性能验证,若达不到性能指标,则反馈给模型训练模块继续调整模型参数。
本发明的有益效果在于:
1、流量分类效果良好,正确率可以达到93.33%,精度可以达到93%,召回率可以达到94%,F1-score可以达到0.92。
2.本发明可以免除繁琐的人工标注工作,只需要流量数据包的载荷数据即可完成高精度分类。
3.在实际网络链路中部署简单。用户只需将模型部署到合适的位置,即可随时随机的截取链路中的数据包输入模型即可得到流量类别结果,且不用区分TCP流和UDP流,为工程部署提供了技术支持。
附图说明
图1为本发明实施例提供的一种基于网络包载荷的卷积神经网络流量分类方法流程示意图;
图2为本发明实施例提供的一种基于网络包载荷的卷积神经网络流量分类系统结构示意图;
图3为二维卷积神经网络结构示意图;
图4为流量数据可视化示意图;
图5为train.csv文件各应用类别分布示意图;
图6为模型训练性能指标;
图7为单类别分类效果评价指标;
图8为多算法分类结果对比示意图;
图9为分类结果单类别精度评测指标示意图;
图10为分类结果单类别召回率评测指标示意图。
具体实施方式
下面结合附图和实施例,对本发明的技术方案做进一步的详细描述。
本发明实施例采用一种基于深度学习技术的网络流量分类方法,利用深度神经网络自动提取特征的特性来解决繁琐的人工特征标注与提取工作。深度卷积神经网络将网络包传输层以上的字节载荷作为神经网络的输入特征,利用卷积运算挖掘和学习数据内部的数据关联,最终模型根据最大概率给出流量类别预测。
深度学习技术在当前的计算机视觉、自然语言处理、自动驾驶等多领域均起到了革命性的作用,深度学习的方法也被运用到各个领域来解决实际的问题。深度学习较于传统机器学习方法的好处是神经网络可以自动从数据中提取与学习特征,从而避免了数据预处理阶段的人工标注特征的繁琐工作。这也是本发明的创新之处,利用卷积神经网络来挖掘和学习数据包载荷的内在数据含义和深层联系,而不用人工按照网络流来统计流的特征,例如一条网络流中数据包的大小、包到达时间间隔等。因此在实时的网络流量分类与识别中,本方案不用去追踪整条网络流,只要随机的选取网络链路中的数据包,分析载荷即可给出一个最大概率的最优类别判断。
图1为本发明实施例提供的一种基于网络包载荷的卷积神经网络流量分类方法流程示意图。如图1所示,该方法包括步骤S101-S103:
步骤S101,将网络抓包所得pcap文件中所有的数据包传输层的去除头部后的载荷数据提出取来,将数据包的载荷的信息转换为字节序列,随机打乱数据顺序并且进行训练集、验证集和测试集的分割。
优选地,对于pcap文件,依次遍历每一个数据包,移除头部,将每一个数据包的TCP或者UDP的载荷部分提取出来并且按照字节形成10进制表示的数据文件。为了节省计算资源,将数据包载荷的前784个字节,不足的用0x00补齐,将其作为一个1*784的序列,序列每一维度是一字节,并表示为0-255的整型值。使用一维卷积神经网络处理包载荷序列,完成流量数据包的分类。
步骤S102,将结构化的数据输入一维卷积神经网络进行训练,完成神经网络隐藏单元的权重参数调整;
步骤S103,在验证集和测试集上的性能验证,若达不到性能指标,则反馈给模型训练模块继续调整模型参数。
图2为本发明实施例提供的一种基于网络包载荷的卷积神经网络流量分类系统结构示意图。如图2所示,该系统主要涵盖的数据预处理模块、模型训练模块和模型验证模块三大模块。
数据预处理模块主要负责将网络抓包的所得pcap文件中所有的数据包传输层的去除头部后的载荷数据提出取来,将数据包的载荷的信息转换为字节序列,随机打乱数据顺序并且进行训练集、验证集和测试集的分割。模型训练模块将结构化的数据输入一维卷积神经网络进行训练,完成神经网络隐藏单元的权重参数调整。模型验证模块主要负责模型在验证集和测试集上的性能验证,若达不到性能指标,则反馈给模型训练模块继续调整模型参数。深度学习技术是基于大数据驱动的,故我们在模块中加入了定时更新训练数据的模块来增强模型对于多变网络环境和应用种类的普适能力。
深度学习中的卷积神经网络是一个非常重要的方法,二维卷积神经网络的典型结构如图3所示。卷积神经网络有如下三个特征使其不仅可以挖掘数据深层关联关系,提取数据的主要特征,同时可以降低能耗。1.局部感受野(local receptive fields)。使用局部感受野,神经元能够提取边缘,角点等视觉特征,这些特征在下一层中进行结合形成更高层的特征。2.权值共享(shared weights)。将局部感受野位于序列不同位置的一组神经元设置为相同的权值。3.下采样(sub-sampling)。在神经网络卷积层提取的数据特征中选取权值最大的点代表该局部区域的核心特征,同时降低运算复杂度。
优选地,本发明实施例将网络数据包的传输层的载荷提取出来(TCP和UDP协议的载荷信息),取数据包载荷的前784个字节,不足的用0x00补齐,将其转为一个1*784的序列,使用一维卷积神经网络处理包载荷序列,完成流量数据包的分类。
本发明具有以下优点及突出效果:1.流量分类效果良好,正确率可以达到93.33%,精度可以达到93%,召回率可以达到94%,F1-score可以达到0.92。2.本发明可以免除繁琐的人工标注工作,只需要流量数据包的载荷数据即可完成高精度分类。3.在实际网络链路中部署简单。用户只需将模型部署到合适的位置,即可随时随机的截取链路中的数据包输入模型即可得到流量类别结果,且不用区分TCP流和UDP流。为工程部署提供了技术支持。
述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可以依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下将以基于本发明的具体实施方式进行描述。
本发明实施例设计的一种基于包载荷的卷积神经网络流量分类方法,该方法可以在网络链路上进行实时流量分类,提高分类精度,降低能耗消耗,同时可以定时更新模型。本示例型实施例从如下几个部分详细说明:一、关于数据集
鉴于自采集的数据流量在数据规模、流量分布、安全性等方面都存在诸多问题会破坏数据的公正性,同时会影响流量分类模型的普适性与泛化能力。本发明采用UNB ISCXVPN-nonVPN数据集做示例验证,该数据集由位于加拿大的纽布伦斯威克大学的网络空间安全项目组于2016年开源。该数据集采集的流量均来自于当今流行的多种应用。数据的详细介绍与下载地址为http://unb.ca/cic/research/datasets/index.html。本例证选取数据集中未经VPN加密的流量作为训练数据,根据应用类型将应用分为6类应用类型,即最终的分类标签,详细信息如表1所示。
流量标签 包含应用
Email Email,Gmail(SMPT,POP3,IMAP)
Chat ICQ,AIM,Skype,Facebook,Hangouts
Stream Vimeo,Youtube,Netflix,Spotify
P2P uTorrent,Bittorrent
VoIP Facebook,Skype,Hangouts,Voipbuster
FT(File Transfer) Skype,FTPS,SFTP
表1业务类型与其包含的应用
不同类型的业务应用的流量通常会呈现出不同的特性信息。表征特征(流统计特征)例如流内数据包个数、数据包大小、包达到时间间隔等会呈现出不同的特性。数据包载荷的隐含特征也会呈现出不同,但不可通过统计方法观测。原始流量的文件根据流量的应用类型划分为以上6类,并给每种类型的网络流量分别标注类型标签。
二、数据表示
Scapy库是开源的网络流量包解析库,对于数据集中的pcap文件,依次遍历每一个数据包,移除头部,将每一个数据包的TCP或者UDP的载荷部分提取出来并且按照字节形成16进制表示的数据文件。为了节省计算资源,例证选取每个载荷的前784个字节,如果载荷长度不足784字节使用0x00填充,反之截断。虽然这样会丢失部分信息,但这是一种折中策略。每个数据包被表示为一个1*784维的向量,序列每一维度是一字节,并表示为0-255的整型值。为了直观上展示数据格式,本部分采用二维的形式将1*784的序列转换为28*28的图像进行可视化显示,如图4所示,左图表示一个chat类型的数据包的载荷信息,右图表示一个mail类型的数据包的载荷信息。
三、模型训练
由于实际网络上的各种应用的分布不同,在训练集中不同类别的应用类型呈现出了巨大的不均衡,对实验分类结果的精度会产生巨大的影响。以训练数据为例,其类别分布如图5所示。其中mail、chat、stream三种类别的样例记录数太少,与FT(File Transfer)类别呈现指数级的样例差。
针对于训练集样例分布不均衡的情况,通常采用过采样(OverSampleing)或者欠采样(underSampling)来弥补数据不均衡对分类精度带来的影响。过采样是针对数据中样例较少的类别进行重复的采样来增加样本数量,过采样过分强调被放大的样本类型,因此过采样最大的风险就是过采样的样例会出现过拟合。欠采样对数量较大的样例样本随机删除,欠采样的问题是弱化了大量样本类别的影响,可能会造成很大的偏差,同时丢弃掉了部分数据信息,致使模型训练不充分。针对图4的情况,由于样本间的分布偏差过大,本例证同时采用欠采样和过采样两种方法来弥补数据不均衡的影响。
训练服务器的配置信息如表2所示,训练过程采用GPU加速。
Figure BDA0001811549300000081
Figure BDA0001811549300000091
表2服务器配置
我们对模型设置超参batch size为1000,优化器为RMSprop,验证集比例为15%,对模型进行20轮迭代,得到模型的分类结果,模型的性能与分析在以下一个部分说明。
四、模型评估与分析
对于分类任务中通常采用的指标为准确率(Accuracy),准确率为所有被正确分类的样本占所有样本的比例。但是对于类别不均衡的分类任务,模型可能在较大样本类别上产生过拟合,准确率只能作为一个参考指标。
对于不均衡的任务的衡量指标通常可以参考精度(precision)、召回率(Recall)、F1分数(F1score)。以二分类问题为例,以上各指标的定义如下,混淆矩阵如表3所示。
Figure BDA0001811549300000092
表3二分类混淆矩阵
Figure BDA0001811549300000093
Figure BDA0001811549300000094
Figure BDA0001811549300000095
F1score是precision和recall的加权平均,取值为[0,1],数值越大,表明模型的预测效果越好。
本实施例的流量分类的最终分类结果为训练集的平均验证准确率为0.9307,验证集的识别准确率为0.9249。训练集与验证集的准确率和损失指标如图6所示。
最终分类类别的编码对应关系如表4所示。每个类别的分类精度,召回率,F1-score如图6所示。
类别 P2P VOIP STREAM CHAT MAIL FT
编码 0 1 2 3 4 5
表4类别编码关系
Lashkari et al在此数据集上使用基于统计特征的机器学习分类方法进行流量分类,本实施例与其结果对比如表5和图7所示所示。
模型 C4.5 KNN 1DCNN(本实例)
精度Precision 0.885 0.837 0.93
召回率Recall 0.8628 0.82 0.94
表5多算法分类结果对比
针对流量分类结果的单类别评测指标如表6、图8和图9所示。
Figure BDA0001811549300000101
表6分类结果单类别评测指标
实验结果显示,对比与基于流统计特征的机器学习分类方法(C4.5,KNN),基于网络包载荷卷积神经网络流量分类方法(1DCNN)在精度和召回率上均比其它两种方法精准。同时由图9可以看出,本实施例的单类别的的精度都有明显优于传统机器学习算法的分类结果。最重要的是:本实施例可以完全避免繁琐流特征的手工标注过程,在实际的网络链路中,只需要随机随时提取数据包即可给出最优的类别判断。该方法可以显著提升性能且降低能耗,免除人工标注。
需要说明的是,在此提供的算法和显示不与任何特定计算机、网络设备或者其它设备固有相关。各种通用设备也可以与基于在此的示教一起使用。根据上面的描述,构造这类网络所要求的结构是显而易见的。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于网络包载荷的卷积神经网络流量分类方法,其特征在于,包括以下步骤:
将网络抓包所得pcap文件中所有的数据包传输层的去除头部后的载荷数据提出取来,将数据包的载荷的信息转换为字节序列,随机打乱数据顺序并且进行训练集、验证集和测试集的分割;将结构化的数据输入一维卷积神经网络进行训练,完成神经网络隐藏单元的权重参数调整;
在验证集和测试集上进行性能验证,若达不到性能指标,则反馈给模型训练模块继续调整模;
对于所述pcap文件,依次遍历每一个数据包,移除头部,将每一个数据包的TCP或者UDP的载荷部分提取出来并且按照字节形成16进制表示的数据文件;截取数据包载荷的前784个字节,不足的用0x00补齐,将其转化为一个1*784的序列,序列每一维度是一字节,并表示为0-255的十进制整型值;使用一维卷积神经网络处理包载荷序列,完成流量数据包的分类;
训练数据为数据集中未经VPN加密的流量,以及根据采集流量的应用类型将流量数据划分为六类,并给每种类型的网络流量分别标注类型标签;
当训练集样例分布不均衡时,采用过采样或欠采样方式来弥补数据不均衡对分类精度带来的影响;对于不均衡的任务的衡量指标,参考精度precision、召回率recall和F1分数;
Figure FDA0003674802260000011
F1分数是precision和recall的加权平均,取值为[0,1],数值越大,表明模型的预测效果越好。
2.一种基于网络包载荷的卷积神经网络流量分类系统,其特征在于,包括数据预处理模块、模型训练模块和模型验证模块;其中,
数据预处理模块,用于将网络抓包所得pcap文件中所有的数据包传输层的去除头部后的载荷数据提出取来,将数据包的载荷的信息转换为字节序列,随机打乱数据顺序并且进行训练集、验证集和测试集的分割;对于所述pcap文件,依次遍历每一个数据包,移除头部,将每一个数据包的TCP或者UDP的载荷部分提取出来并且按照字节形成16进制表示的数据文件;提取数据包载荷的前784个字节,不足的用0x00补齐,将其转化为一个1*784的序列,使用一维卷积神经网络处理包载荷序列,完成流量数据包的分类;
模型训练模块,用于将结构化的数据输入一维卷积神经网络进行训练,完成神经网络隐藏单元的权重参数调整;训练数据为数据集中未经VPN加密的流量,以及根据采集流量的应用类型将流量数据划分为六类,并给每种类型的网络流量分别标注类型标签;
模型验证模块,用于在验证集和测试集上的性能验证,若达不到性能指标,则反馈给模型训练模块继续调整模型参数;
当训练集样例分布不均衡时,采用过采样或欠采样方式来弥补数据不均衡对分类精度带来的影响,对于不均衡的任务的衡量指标,参考精度precision、召回率recall和F1分数;
Figure FDA0003674802260000021
F1分数是precision和recall的加权平均,取值为[0,1],数值越大,表明模型的预测效果越好。
CN201811122301.6A 2018-09-26 2018-09-26 一种基于网络包载荷的卷积神经网络流量分类方法及系统 Active CN109361617B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811122301.6A CN109361617B (zh) 2018-09-26 2018-09-26 一种基于网络包载荷的卷积神经网络流量分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811122301.6A CN109361617B (zh) 2018-09-26 2018-09-26 一种基于网络包载荷的卷积神经网络流量分类方法及系统

Publications (2)

Publication Number Publication Date
CN109361617A CN109361617A (zh) 2019-02-19
CN109361617B true CN109361617B (zh) 2022-09-27

Family

ID=65347636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811122301.6A Active CN109361617B (zh) 2018-09-26 2018-09-26 一种基于网络包载荷的卷积神经网络流量分类方法及系统

Country Status (1)

Country Link
CN (1) CN109361617B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197234B (zh) * 2019-06-13 2020-05-19 四川大学 一种基于双通道卷积神经网络的加密流量分类方法
CN110247930B (zh) * 2019-07-01 2020-05-12 北京理工大学 一种基于深度神经网络的加密网络流量识别方法
CN110889427B (zh) * 2019-10-15 2023-07-07 同济大学 一种拥堵交通流溯源分析方法
CN111026917B (zh) * 2019-11-07 2021-07-20 中国科学院计算技术研究所 一种基于卷积神经网络的数据包分类方法及系统
CN110896381B (zh) * 2019-11-25 2021-10-29 中国科学院深圳先进技术研究院 一种基于深度神经网络的流量分类方法、系统及电子设备
CN111064678A (zh) * 2019-11-26 2020-04-24 西安电子科技大学 基于轻量级卷积神经网络的网络流量分类方法
CN111160427B (zh) * 2019-12-17 2023-04-18 博雅信安科技(北京)有限公司 一种基于神经网络的海量流量数据类型的检测方法
CN111310801B (zh) * 2020-01-20 2024-02-02 桂林航天工业学院 一种基于卷积神经网络的混合维度流量分类方法及其系统
CN111556018B (zh) * 2020-03-25 2021-07-27 中国科学院信息工程研究所 一种基于cnn的网络入侵检测方法及电子装置
CN111556316B (zh) * 2020-04-08 2022-06-03 北京航空航天大学杭州创新研究院 一种基于深度神经网络加速的快速块分割编码方法和装置
CN111860628A (zh) * 2020-07-08 2020-10-30 上海乘安科技集团有限公司 一种基于深度学习的流量识别与特征提取方法
CN111835769A (zh) * 2020-07-14 2020-10-27 南方电网科学研究院有限责任公司 基于vgg神经网络的恶意流量检测方法、装置、设备及介质
CN112329839B (zh) * 2020-11-03 2022-02-08 北京理工大学 一种基于单向突发流量特征的加密流量精细化分类方法
CN112951271A (zh) * 2020-11-27 2021-06-11 长沙理工大学 一种基于声学辅助的隧道交通安全警示方法、系统
CN114726741A (zh) * 2020-12-18 2022-07-08 中国科学院沈阳自动化研究所 基于表征学习的边缘网络状态感知建模方法
CN113128626A (zh) * 2021-05-28 2021-07-16 安徽师范大学 基于一维卷积神经网络模型的多媒体流细分类方法
CN113378961A (zh) * 2021-06-23 2021-09-10 中移(杭州)信息技术有限公司 网络流量识别方法、装置、设备以及计算机程序产品
CN114553722B (zh) * 2022-01-12 2023-04-28 西安电子科技大学 基于多视角一维卷积神经网络的VPN和non-VPN网络流量分类方法
CN114091087B (zh) * 2022-01-17 2022-04-15 北京浩瀚深度信息技术股份有限公司 一种基于人工智能算法的加密流量识别方法
CN115242496B (zh) * 2022-07-20 2024-04-16 安徽工业大学 一种基于残差网络的Tor加密流量应用行为分类方法及装置
CN117313004B (zh) * 2023-11-29 2024-03-12 南京邮电大学 一种在物联网中基于深度学习的QoS流分类方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102700A (zh) * 2014-07-04 2014-10-15 华南理工大学 一种面向因特网不平衡应用流的分类方法
US9563825B2 (en) * 2014-11-20 2017-02-07 Adobe Systems Incorporated Convolutional neural network using a binarized convolution layer
CN104766098A (zh) * 2015-04-30 2015-07-08 哈尔滨工业大学 一种分类器的构建方法
CN105516027B (zh) * 2016-01-12 2019-03-12 北京奇虎科技有限公司 应用识别模型建立方法、流量数据的识别方法及装置
CN108173704A (zh) * 2017-11-24 2018-06-15 中国科学院声学研究所 一种基于表征学习的网络流量分类的方法及装置
CN108564097B (zh) * 2017-12-05 2020-09-22 华南理工大学 一种基于深度卷积神经网络的多尺度目标检测方法

Also Published As

Publication number Publication date
CN109361617A (zh) 2019-02-19

Similar Documents

Publication Publication Date Title
CN109361617B (zh) 一种基于网络包载荷的卷积神经网络流量分类方法及系统
CN110311829B (zh) 一种基于机器学习加速的网络流量分类方法
CN111340191B (zh) 基于集成学习的僵尸网络恶意流量分类方法及系统
CN107846326B (zh) 一种自适应的半监督网络流量分类方法、系统及设备
CN110730140A (zh) 基于时空特性相结合的深度学习流量分类方法
Nakao et al. Toward in-network deep machine learning for identifying mobile applications and enabling application specific network slicing
CN109218223B (zh) 一种基于主动学习的鲁棒性网络流量分类方法及系统
CN114615093B (zh) 基于流量重构与继承学习的匿名网络流量识别方法及装置
CN112491643B (zh) 深度报文检测方法、装置、设备及存储介质
CN110808971B (zh) 一种基于深度嵌入的未知恶意流量主动检测系统及方法
CN110290022A (zh) 一种基于自适应聚类的未知应用层协议识别方法
CN112054967A (zh) 网络流量分类方法、装置、电子设备及存储介质
CN111191767A (zh) 一种基于向量化的恶意流量攻击类型的判断方法
Beikmohammadi et al. SWP-LeafNET: A novel multistage approach for plant leaf identification based on deep CNN
CN107819698A (zh) 一种基于半监督学习的网络流量分类方法、计算机设备
CN108540338B (zh) 基于深度循环神经网络的应用层通信协议识别的方法
CN114553475A (zh) 一种基于网络流量属性有向拓扑的网络攻击检测方法
CN111260568B (zh) 基于多辨别器对抗网络的碑帖二值化背景噪声去除方法
CN110532564A (zh) 一种基于cnn和lstm混合模型的应用层协议在线识别方法
CN112884121A (zh) 基于生成对抗深度卷积网络的流量识别方法
CN108234452B (zh) 一种网络数据包多层协议识别的系统和方法
CN112910881A (zh) 一种基于通信协议的数据监控方法及系统
CN110442842A (zh) 合同内容的提取方法及装置、计算机设备、存储介质
CN113705604A (zh) 僵尸网络流量分类检测方法、装置、电子设备及存储介质
CN114726802A (zh) 一种基于不同数据维度的网络流量识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant