CN102571486A - 一种基于BoW模型和统计特征的流量识别方法 - Google Patents

一种基于BoW模型和统计特征的流量识别方法 Download PDF

Info

Publication number
CN102571486A
CN102571486A CN2011104192670A CN201110419267A CN102571486A CN 102571486 A CN102571486 A CN 102571486A CN 2011104192670 A CN2011104192670 A CN 2011104192670A CN 201110419267 A CN201110419267 A CN 201110419267A CN 102571486 A CN102571486 A CN 102571486A
Authority
CN
China
Prior art keywords
vector
classification
bow
dimensional
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011104192670A
Other languages
English (en)
Other versions
CN102571486B (zh
Inventor
陈凯
张寅�
周曲
周异
杨小康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI SHENYOU INTELLIGENT TECHNOLOGY CO., LTD
Xiamen Shang Ji Network Technology Co., Ltd.
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201110419267.0A priority Critical patent/CN102571486B/zh
Publication of CN102571486A publication Critical patent/CN102571486A/zh
Application granted granted Critical
Publication of CN102571486B publication Critical patent/CN102571486B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于BoW模型和统计特征的流量识别方法,该方法采用了BoW模型,配合提出的特征提取方法,训练采集到的网络流量特征,从而获得每一个网络类别所对应的特征向量。对于新来的网络流量,同样能够通过提取其流量特征,利用BoW建模得到其相应的特征向量,然后依次与先前建立好的每一个网络类别的特征向量进行比较,取匹配度最高的特征向量所对应的类别作为新来的网络流量的分类标签。本发明使用的BoW方法是结合了非监督的k-means聚类方法以及有监督的K-近邻方法,因而更适合于进行多分类。由于Bow模型对于空间位置不敏感,因而在提取特征时不需要按照特征的时序进行排列,方便进行处理。

Description

一种基于BoW模型和统计特征的流量识别方法
技术领域
本发明涉及一种对网络数据流进行识别的方法,特别是采用BoW(Bag ofWords)这一机器学习模型配合提出的特征提取方法来进行预测建模。
背景技术
在20世纪90年代末、本世纪初,涌现出了一批又一批关于互联网流量分类技术的实验和尝试,其中更包含有革命性的技术创新。科学技术研究的一大主要推动力即是实际的应用需求,纵观整个互联网发展过程,流量识别主要在如下几个方面扮演着极其重要的角色:
●互联网服务提供商们(ISPs)需要知道他们的用户正在使用哪些应用、或是获取应用的发展趋势,从而实施各种商业目标。诸如为不同优先级别的用户动态分配网络资源、提供特定的QoS服务,锁定使用了违反条例或相关法律的应用的特定用户,或者分析应用发展趋势来规划未来的业务分布;
●充当入侵检测系统(IDS)的核心部件,通过模式匹配等方法帮助实时监测识别出如拒绝服务攻击(DoS)、蠕虫(Worm)攻击等恶意网络行为;
●互联网流量识别也是政府基于ISP来监控、侦听网络的一种重要手段。
目前在市面上广泛应用的流量识别技术是基于报文载荷内容的DPI识别技术,尽管DPI技术精确度高,但是除了其分类速度慢且对于加密载荷无法识别以外,其对报文内容的窥探也被普遍地诟病为是对用户隐私的侵犯。
经检索,中国发明专利申请号:200910034643.7,公开号为101645806,该专利自述为:“本发明公开了一种DPI和DFI相结合的网络流量分类系统及分类方法,包括DPI业务识别系统和DFI流量识别系统两个模块结合而成;其中DPI模块又包括流表检测模块和流量识别模块;DFI模块包括样本获取模块,分类器训练模块和分类器分类预测模块。样本获取模块将DPI中的流量识别模块能够准确识别的数据流划分成几个大类,并且将其作为样本对分类器训练模块进行训练,获得能对网络流量进行大类区分的分类模型,然后DPI的流量识别模块无法识别的流量再通过DFI的分类器分类预测模块就能达到对DPI无法识别的流量进行大类区分的目的。”但是同样的,该技术仍旧没有解决上述的问题。
因此科研工作者们就转换思路,利用网络流量的特征来进行机器学习,构造流量分类器来对数据流进行识别。因此本发明同样地继承了这一思路,利用目前十分常用的BoW模型来对网络数据流进行识别。
BoW(Bag Of Words)算法也称为词袋算法,起源于基于语义的文本检索算法,是一种有效地基于语义特征提取与描述的物体识别算法。以文本检索为例,介绍一下BoW模型的特性,BoW模型在进行信息检索时,假定对于一个文本,忽略其词序和语法、句法,将其仅仅看做是一个词集合,或者说是词的一个组合,文本中每一个词的出现都是独立的,不依赖于其他词的是否出现,或者说当这篇文章的作者在任意一个位置选择一个词汇都不受前面句子的影响而独立选择。简而言之,就是BoW对于特征的顺序以及它们之间的逻辑关系不敏感。这在一些情况下可能会导致一些问题的出现,然而在流量识别领域,这反倒成为了一个优势,使得在提取流量特征的时候不需要考虑按照特征的时序进行顺序排列,简化了特征提取的过程。另外,由于本发明BoW模型结合了非监督的聚类方法以及有监督的K-近邻方法,因而更适合于进行多分类。
发明内容
本发明的目的在于针对当前网络流量识别过程中DPI方法的种种缺陷,提供一种基于BoW模型和统计特征的流量识别方法,创造性地利用网络流量特征结合BoW方法,从而实现对于网络流量快速、精确的识别。
为实现上述目的,本发明方法采用了BoW模型,配合特征提取方法,训练采集到的网络流量特征,从而获得每一个网络类别所对应的特征向量。对于新来的网络流量,同样能够通过提取其流量特征,利用BoW建模得到其相应的特征向量,然后依次与先前建立好的每一个网络类别的特征向量进行比较,取匹配度最高的特征向量所对应的类别作为新来的网络流量的分类标签。
本发明所述的基于BoW模型和统计特征的流量识别方法,包括以下步骤:
(1)如果类别特征向量尚未建立,执行步骤(2),否则转入步骤(4);
(2)采用预设的特征采集方法获取训练集中各个网络流量对象的向量表示;
(3)BoW模型第一步,先将这些训练集中的向量聚为k个中心点,即k个words;
(4)BoW模型第二步,利用K-NN将对应类别的所有向量与这k个words进行近邻分析,
最终得出各个类别的特征向量;
(5)利用得到的类别特征向量与待测网络流经过处理后得到的特征向量进行匹配,预测出待测网络流的识别标签;
(6)结束。
上述方法步骤:
所述步骤(2)中,首先必须从训练集中获取各个网络流量对象的特征,然后将其整理成为该流量对象的向量表示,具体过程如下:
①从每个网络流量对象当中提取前M个报文,每个报文包含N维的特征向量,目前是提取前五个报文,每个报文是一个四维向量即源端口、目的端口、协议、报文长度;
②将这N维向量进行离散化或是归一化处理,以用来平衡各维之间的数值大小;
③训练集当中的数据流个数为X个,则这样总共得到XM个N维向量。
所述步骤(3),首先随机选取训练集中的若干向量对聚类中心进行初始化,然后通过一个循环体不断优化聚类结果,该循环体每一轮内嵌了两个子循环,具体过程如下:
①对上述训练集中的XM个N维向量,第一个子循环用来循环考察每一个向量与各聚类中心之间的距离,在该子循环的每一轮中,找出与所考察向量距离最近的聚类中心,并将所考察向量置于与该聚类中心对应的集合之中;
②然后第二个子循环用来重置所有的聚类中心,在该子循环的每一轮中,将与当前集合中所有向量具有最小平均距离的向量作为新的聚类中心;
③在第二个子循环结束以后,如果所有的聚类中心均未发生变化,则结束步骤(3),即生成了k个words,否则返回第一个子循环继续聚类过程。
步骤(4)中,具体如下:
①对任一个类别的特征向量,初始化一个k维零向量;
②假定某一类别的向量总数为m,则该类别共有mM个向量,计算每一个向量与k个words之间的距离,选取最近的K个,这个参数K是由K-NN决定的,然后给这K个中心对应的k维向量相应维度上的值加上相应的权值;权值一般为1。
③算完这mM个对象,就得到了该类别对应的k维特征向量。
所述步骤(5),具体如下:
①对于新来的未知流,同样采用步骤(2)方法处理,提取其前M个报文,每一个报文包含了N维的特征向量,将这N维向量进行离散化或是归一化处理,以用来平衡各维之间的数值大小,对于这M个N维向量,采用步骤4的办法即向量总数m=1,从而得到该新来的未知流的k维向量;
②最后将每一个类别的k维特征向量与该未知流的k维特征向量进行匹配,取匹配度最高的类别作为该未知流的预测类别标签。
与背景技术相比,本发明具有的有益结果:本发明给出了一种基于BoW模型和统计特征的流量识别方法,该方法基于BoW模型,对特征时序不敏感,简化了特征提取过程,并且适合多分类,能够快速、准确地识别待测流量的类别,克服了DPI所带来的隐私和效率问题。
附图说明
图1是数据收集装置的工作流程图。
图2是本发明方法步骤的流程图。
图3是本发明使用的k-means聚类方法的训练流程图。
图4是本发明基于聚类结果结合K-NN建立类别特征向量的流程图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例以本发明技术方案为前提,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,真实网络上的流量数据存放于数据对象收集装置中(具体来说这个装置就是一个个路由器或是交换机抑或是服务器,总之就是一系列网络的核心设置之中),假设该装置中存储了N个数据流对象,同时用其他技术(例如DPI或是手工识别等)对每一个数据流对象所属的网络流量类别(如WEB,P2P,VOIP......等)进行标记,则这些流对象就成为了机器学习的训练集数据对象了。之后通过预设的特征采集方法获取这些训练集数据对象的向量表示,然后采用基于BoW模型的机器学习方法进行建模,如图2所示。该技术采用了无监督的k-means聚类结合有监督K-近邻方法建立了各个类别的特征向量,最后利用这些类别的特征向量与新的待测数据流的特征向量进行匹配,将匹配度最大的类别赋予待测数据流,也就是预测出待测数据流的分类。
本发明的方法步骤如图2所示。步骤1是起初动作。
步骤2判断类别特征向量是否已经训练完毕,若训练好了则可以开始进行预测匹配了,执行步骤6;否则需要进行训练,执行步骤3。
步骤3采用预设的特征采集方法获取训练集中各个网络流量对象的特征,具体来说,从每个网络流量对象当中提取前M个报文,每个报文包含N维的特征向量,目前是提取前五个报文,每个报文是一个四维向量(源端口、目的端口、协议、报文长度),最后将这N维向量进行离散化或是归一化处理,以用来平衡各维之间的数值大小。由此,每一个数据流对象Xi包含M个N维向量,即 X i = ( F i 11 F i 12 F i 13 · · · F i 1 N , F i 21 F i 22 F i 23 · · · F i 2 N , . . . , F i M 1 F i M 2 F i M 3 · · · F i MN ) (其中
Figure BDA0000120063900000052
代表网络流i中的数据包a的第b个特征)
步骤4中采用了无监督的k-means聚类,其详细说明如图3所示。这里简单地采用欧式距离来度量两个向量之间的距离,此外k-means聚类过程中的参数k(聚类数目)由经验值或根据实际需要实验人员决定,它决定了聚类的中心数以及最终类别特征向量的维数(即维度等于聚类数目)。
接着步骤5基于聚类所得的结果,采用K-NN的办法得到最终的类别特征向量,其详细说明如图4所示,其中采用的K-NN中的K(近邻数目,与特征维度和聚类数目不同)也由经验值或是实验人员决定。
步骤6接受待测流对象并生成相应的特征向量,具体来说,就是从待测网络流对象当中提取前M个报文,每个报文包含N维的特征向量,最后将这N维向量进行离散化或是归一化处理,以用来平衡各维之间的数值大小(这个过程基本上与步骤3相似)。然后再利用K-NN与训练集的k个聚类中心进行近邻比较,从而得到相应的k维特征向量(这个过程基本上与步骤5相似)。
步骤7使用训练所得的各个类别的特征向量与待测流对象的特征向量进行匹配,这里的匹配度用余弦距离来表示。
步骤8输出与待测流对象的特征向量匹配度最高(余弦距离最小)的类别作为待测对象的最终类别;所述余弦距离
Figure BDA0000120063900000061
最后步骤9结束待测流类别预测过程。
图3给出了图2中步骤4的详细描述,具体说明了如何对本发明涉及的流对象向量进行聚类,图中的k代表聚类的类别数而N代表的是空间中向量的总数。
图3中的步骤400是起始状态,步骤401至步骤404构成一个循环体,在循环的每一轮中从训练集S中随机选取一个向量Mj作为中心向量,用于初始化集合Cj。向量的选取过程采用非重复取样的方式,即先前选出的向量不再用于后续的向量选取过程。
当上述的初始化过程完成了以后,步骤405至414构成一个循环体,用于实现聚类过程。其中,该循环体还分别包含了两个子循环体,即步骤406至409以及步骤410至413。在第一个子循环中,步骤407基于欧式距离找出与第i个向量距离最近的中心向量,记为随后,步骤408将该向量Vi置于集合
Figure BDA0000120063900000063
中。在该子循环完成以后,每个集合Cj(1≤j≤k)均包含若干向量,每个向量对应于空间中的一个聚类。在第二个子循环中,步骤412基于欧式距离找出集合Cj的中心。该中心为与Cj中的所有向量具有最小平均距离的向量,由此利用该向量来更新中心向量Mj并将Cj重置为仅包含该向量的集合。在第二个子循环结束以后,步骤414判断是否所有的中心向量均再未更新过,如果否则返回步骤405,如果是则转入结束状态。
图4给出了图2中步骤5的详细描述,具体说明了如何基于聚类的结果得到最终的类别特征向量。图中的k代表聚类的类别数,K代表K-NN中的近邻数,R代表类别总数,mi代表某一类别的流总数,Mi代表该流取得的数据包个数,因此该类别总共有miMi个向量。
图4中的步骤500是起始状态,步骤501至步骤514是一个大循环,其中嵌套一个子循环,为步骤503至512,而该子循环中又嵌套一个子循环,为步骤507至511,因此总共是三重循环。第一重循环主要是针对类别进行循环,假设这时枚举的是类别i,那么就先为类别i创建一个k维的零向量。第二重循环主要是对类别i中的向量进行枚举,枚举类别i中的每一个向量计算其与k个中心向量之间的距离,假设这时枚举的是向量j。第三重循环是对向量j的K-近邻的枚举,即枚举与向量j距离最近的K个中心点,然后将这K个中心点对应地在k维向量的维度中加上相应的权值。第三重循环结束之后就得到了向量j对于类别i的k维特征向量的更新,第二重循结束之后就得到了类别i的特征向量,第一重循环结束了以后就得到了所有类别的特征向量了。
本发明提出的方法,采用了BoW(Bag of Words)这一十分著名的模型,配合提出的特征提取方法,训练采集到的网络流量特征,从而获得每一个网络类别(WEB,P2P,VOIP......)所对应的特征向量。对于新来的网络流量,同样能够通过提取其流量特征,利用BoW建模得到其相应的特征向量,然后依次与先前建立好的每一个网络类别的特征向量进行比较,取匹配度最高的特征向量所对应的类别作为新来的网络流量的分类标签。本发明使用的BoW方法是结合了非监督的k-means聚类方法以及有监督的K-近邻方法,因而更适合于进行多分类。由于Bow模型对于空间位置不敏感,因而在提取特征时不需要按照特征的时序进行排列,方便进行处理。
熟知本领域的技术人员将理解,虽然这里为了便于解释已描述了具体的实施例,但是可在不背离本发明精神和范围的情况下作出各种改变。因此,除了所附权利要求之外不能用于限制本发明。

Claims (6)

1.一种基于BoW模型和统计特征的流量识别方法,包括以下步骤:
(1)如果类别特征向量尚未建立,执行步骤(2),否则转入步骤(4);
(2)采用特征采集方法获取训练集中各个网络流量对象的向量表示;
(3)BoW模型第一步,先将这些训练集中的向量聚为k个中心点,即k个words;
(4)BoW模型第二步,利用K-NN将对应类别的所有向量与这k个words进行近邻分析,最终得出各个类别的特征向量;
(5)利用得到的类别特征向量与待测网络流经过处理后得到的特征向量进行匹配,识别出待测网络流的分类标签;
(6)结束。
2.根据权利要求1所述的基于BoW模型和统计特征的流量识别方法,其特征是步骤(2)中,首先必须从训练集中获取各个网络流量对象的特征,然后将其整理成为该流量对象的向量表示,具体过程如下:
①从每个网络流量对象当中提取前M个报文,每个报文包含N维的特征向量,目前是提取前五个报文,每个报文是一个四维向量即源端口、目的端口、协议、报文长度;
②将这N维向量进行离散化或是归一化处理,以用来平衡各维之间的数值大小;
③训练集当中的数据流个数为X个,则这样总共得到XM个N维向量。
3.根据权利要求1或2所述的基于BoW模型和统计特征的流量识别方法,其特征是步骤(3),首先随机选取训练集中的若干向量对聚类中心进行初始化,然后通过一个循环体不断优化聚类结果,该循环体每一轮内嵌了两个子循环,具体过程如下:
①对上述训练集中的XM个N维向量,第一个子循环用来循环考察每一个向量与各聚类中心之间的距离,在该子循环的每一轮中,找出与所考察向量距离最近的聚类中心,并将所考察向量置于与该聚类中心对应的集合之中;
②然后第二个子循环用来重置所有的聚类中心,在该子循环的每一轮中,将与当前集合中所有向量具有最小平均距离的向量作为新的聚类中心;
③在第二个子循环结束以后,如果所有的聚类中心均未发生变化,则结束步骤(3),即生成了k个words,否则返回第一个子循环继续聚类过程。
4.根据权利要求1所述的基于BoW模型和统计特征的流量识别方法,其特征是步骤(4)中,具体如下:
①对任一个类别的特征向量,初始化一个k维零向量;
②假定某一类别的向量总数为m,则该类别共有mM个向量,计算每一个向量与k个words之间的距离,选取最近的K个,这个参数K是由K-NN决定的,然后给这K个中心对应的k维向量相应维度上的值加上相应的权值;
③算完这mM个对象,就得到了该类别对应的k维特征向量。
5.根据权利要求4所述的基于BoW模型和统计特征的流量识别方法,其特征是所述给这K个中心对应的k维向量相应维度上的值加上相应的权值,其权值为1。
6.根据权利要求1或2所述的基于BoW模型和统计特征的流量识别方法,其特征是步骤(5),具体如下:
①对于新来的未知流,同样采用步骤(2)方法处理,提取其前M个报文,每一个报文包含了N维的特征向量,将这N维向量进行离散化或是归一化处理,以用来平衡各维之间的数值大小,对于这M个N维向量,采用步骤(4)的办法即向量总数m=1,从而得到该新来的未知流的k维向量;
②最后将每一个类别的k维特征向量与该未知流的k维特征向量进行匹配,取匹配度最高的类别作为该未知流的预测类别标签。
CN201110419267.0A 2011-12-14 2011-12-14 一种基于BoW模型和统计特征的流量识别方法 Active CN102571486B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110419267.0A CN102571486B (zh) 2011-12-14 2011-12-14 一种基于BoW模型和统计特征的流量识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110419267.0A CN102571486B (zh) 2011-12-14 2011-12-14 一种基于BoW模型和统计特征的流量识别方法

Publications (2)

Publication Number Publication Date
CN102571486A true CN102571486A (zh) 2012-07-11
CN102571486B CN102571486B (zh) 2014-08-27

Family

ID=46416006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110419267.0A Active CN102571486B (zh) 2011-12-14 2011-12-14 一种基于BoW模型和统计特征的流量识别方法

Country Status (1)

Country Link
CN (1) CN102571486B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103200133A (zh) * 2013-03-21 2013-07-10 南京邮电大学 一种基于网络流引力聚类的流量识别方法
WO2015021484A1 (en) * 2013-08-09 2015-02-12 Behavioral Recognition Systems, Inc. Cognitive information security using a behavior recognition system
CN104519031A (zh) * 2013-09-30 2015-04-15 西门子公司 一种用于恶意网络行为检测的方法和装置
CN104883278A (zh) * 2014-09-28 2015-09-02 北京匡恩网络科技有限责任公司 一种利用机器学习对网络设备进行分类的方法
WO2015154484A1 (zh) * 2014-09-11 2015-10-15 中兴通讯股份有限公司 流量数据分类方法及装置
CN105024993A (zh) * 2015-05-25 2015-11-04 上海南邮实业有限公司 一种基于向量运算的协议比对方法
CN106713324A (zh) * 2016-12-28 2017-05-24 北京奇艺世纪科技有限公司 一种流量检测方法及装置
CN106790069A (zh) * 2016-12-21 2017-05-31 电子科技大学 基于向量同态加密的隐私保护k‑nn分类方法
CN106850338A (zh) * 2016-12-30 2017-06-13 西可通信技术设备(河源)有限公司 一种基于语义分析的r+1类应用层协议识别方法与装置
CN106911669A (zh) * 2017-01-10 2017-06-30 浙江工商大学 一种基于深度学习的ddos检测方法
CN107395640A (zh) * 2017-08-30 2017-11-24 信阳师范学院 一种基于划分和特征变化的入侵检测系统及方法
CN108650194A (zh) * 2018-05-14 2018-10-12 南开大学 基于K_means和KNN融合算法的网络流量分类方法
CN108897739A (zh) * 2018-07-20 2018-11-27 西安交通大学 一种智能化的应用流量识别特征自动挖掘方法与系统
CN109714335A (zh) * 2018-12-26 2019-05-03 北京天融信网络安全技术有限公司 一种信息检测方法及信息检测装置
CN109951462A (zh) * 2019-03-07 2019-06-28 中国科学院信息工程研究所 一种基于全息建模的应用软件流量异常检测系统及方法
CN109995611A (zh) * 2019-03-18 2019-07-09 新华三信息安全技术有限公司 流量分类模型建立及流量分类方法、装置、设备和服务器
CN110148428A (zh) * 2019-05-27 2019-08-20 哈尔滨工业大学 一种基于子空间表示学习的声学事件识别方法
CN110324323A (zh) * 2019-06-19 2019-10-11 全球能源互联网研究院有限公司 一种新能源厂站涉网端实时交互过程异常检测方法及系统
CN113014549A (zh) * 2021-02-01 2021-06-22 北京邮电大学 基于http的恶意流量分类方法及相关设备
CN114205164A (zh) * 2021-12-16 2022-03-18 北京百度网讯科技有限公司 流量分类方法及装置、训练方法及装置、设备和介质
CN117673953A (zh) * 2023-12-06 2024-03-08 国网山东省电力公司莒县供电公司 一种基于无人机的电力线路运维检修系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101505276A (zh) * 2009-03-23 2009-08-12 杭州华三通信技术有限公司 网络应用流量识别方法和装置及网络应用流量管理设备
CN102073713A (zh) * 2010-12-31 2011-05-25 北京理工大学 一种基于优化BoW模型的三维模型检索方法
US20120191231A1 (en) * 2010-05-04 2012-07-26 Shazam Entertainment Ltd. Methods and Systems for Identifying Content in Data Stream by a Client Device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101505276A (zh) * 2009-03-23 2009-08-12 杭州华三通信技术有限公司 网络应用流量识别方法和装置及网络应用流量管理设备
US20120191231A1 (en) * 2010-05-04 2012-07-26 Shazam Entertainment Ltd. Methods and Systems for Identifying Content in Data Stream by a Client Device
CN102073713A (zh) * 2010-12-31 2011-05-25 北京理工大学 一种基于优化BoW模型的三维模型检索方法

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103200133A (zh) * 2013-03-21 2013-07-10 南京邮电大学 一种基于网络流引力聚类的流量识别方法
US11991194B2 (en) 2013-08-09 2024-05-21 Intellective Ai, Inc. Cognitive neuro-linguistic behavior recognition system for multi-sensor data fusion
US10735446B2 (en) 2013-08-09 2020-08-04 Intellective Ai, Inc. Cognitive information security using a behavioral recognition system
WO2015021484A1 (en) * 2013-08-09 2015-02-12 Behavioral Recognition Systems, Inc. Cognitive information security using a behavior recognition system
US11818155B2 (en) 2013-08-09 2023-11-14 Intellective Ai, Inc. Cognitive information security using a behavior recognition system
US9973523B2 (en) 2013-08-09 2018-05-15 Omni Ai, Inc. Cognitive information security using a behavioral recognition system
US9507768B2 (en) 2013-08-09 2016-11-29 Behavioral Recognition Systems, Inc. Cognitive information security using a behavioral recognition system
US10187415B2 (en) 2013-08-09 2019-01-22 Omni Ai, Inc. Cognitive information security using a behavioral recognition system
US9639521B2 (en) 2013-08-09 2017-05-02 Omni Ai, Inc. Cognitive neuro-linguistic behavior recognition system for multi-sensor data fusion
CN105637519A (zh) * 2013-08-09 2016-06-01 行为识别系统公司 使用行为辨识系统的认知信息安全性
CN104519031A (zh) * 2013-09-30 2015-04-15 西门子公司 一种用于恶意网络行为检测的方法和装置
CN104519031B (zh) * 2013-09-30 2018-03-09 西门子公司 一种用于恶意网络行为检测的方法和装置
CN105471670A (zh) * 2014-09-11 2016-04-06 中兴通讯股份有限公司 流量数据分类方法及装置
CN105471670B (zh) * 2014-09-11 2019-08-02 中兴通讯股份有限公司 流量数据分类方法及装置
WO2015154484A1 (zh) * 2014-09-11 2015-10-15 中兴通讯股份有限公司 流量数据分类方法及装置
CN104883278A (zh) * 2014-09-28 2015-09-02 北京匡恩网络科技有限责任公司 一种利用机器学习对网络设备进行分类的方法
CN105024993A (zh) * 2015-05-25 2015-11-04 上海南邮实业有限公司 一种基于向量运算的协议比对方法
CN106790069A (zh) * 2016-12-21 2017-05-31 电子科技大学 基于向量同态加密的隐私保护k‑nn分类方法
CN106790069B (zh) * 2016-12-21 2020-03-31 电子科技大学 基于向量同态加密的隐私保护k-nn分类方法
CN106713324A (zh) * 2016-12-28 2017-05-24 北京奇艺世纪科技有限公司 一种流量检测方法及装置
CN106850338B (zh) * 2016-12-30 2020-12-04 西可通信技术设备(河源)有限公司 一种基于语义分析的r+1类应用层协议识别方法与装置
CN106850338A (zh) * 2016-12-30 2017-06-13 西可通信技术设备(河源)有限公司 一种基于语义分析的r+1类应用层协议识别方法与装置
CN106911669A (zh) * 2017-01-10 2017-06-30 浙江工商大学 一种基于深度学习的ddos检测方法
CN107395640B (zh) * 2017-08-30 2020-05-12 信阳师范学院 一种基于划分和特征变化的入侵检测系统及方法
CN107395640A (zh) * 2017-08-30 2017-11-24 信阳师范学院 一种基于划分和特征变化的入侵检测系统及方法
CN108650194A (zh) * 2018-05-14 2018-10-12 南开大学 基于K_means和KNN融合算法的网络流量分类方法
CN108650194B (zh) * 2018-05-14 2022-03-25 南开大学 基于K_means和KNN融合算法的网络流量分类方法
CN108897739A (zh) * 2018-07-20 2018-11-27 西安交通大学 一种智能化的应用流量识别特征自动挖掘方法与系统
CN108897739B (zh) * 2018-07-20 2020-06-26 西安交通大学 一种智能化的应用流量识别特征自动挖掘方法与系统
CN109714335A (zh) * 2018-12-26 2019-05-03 北京天融信网络安全技术有限公司 一种信息检测方法及信息检测装置
CN109951462A (zh) * 2019-03-07 2019-06-28 中国科学院信息工程研究所 一种基于全息建模的应用软件流量异常检测系统及方法
CN109995611B (zh) * 2019-03-18 2021-06-25 新华三信息安全技术有限公司 流量分类模型建立及流量分类方法、装置、设备和服务器
CN109995611A (zh) * 2019-03-18 2019-07-09 新华三信息安全技术有限公司 流量分类模型建立及流量分类方法、装置、设备和服务器
CN110148428B (zh) * 2019-05-27 2021-04-02 哈尔滨工业大学 一种基于子空间表示学习的声学事件识别方法
CN110148428A (zh) * 2019-05-27 2019-08-20 哈尔滨工业大学 一种基于子空间表示学习的声学事件识别方法
CN110324323A (zh) * 2019-06-19 2019-10-11 全球能源互联网研究院有限公司 一种新能源厂站涉网端实时交互过程异常检测方法及系统
CN110324323B (zh) * 2019-06-19 2024-01-19 全球能源互联网研究院有限公司 一种新能源厂站涉网端实时交互过程异常检测方法及系统
CN113014549A (zh) * 2021-02-01 2021-06-22 北京邮电大学 基于http的恶意流量分类方法及相关设备
CN113014549B (zh) * 2021-02-01 2022-04-08 北京邮电大学 基于http的恶意流量分类方法及相关设备
CN114205164A (zh) * 2021-12-16 2022-03-18 北京百度网讯科技有限公司 流量分类方法及装置、训练方法及装置、设备和介质
CN114205164B (zh) * 2021-12-16 2023-07-18 北京百度网讯科技有限公司 流量分类方法及装置、训练方法及装置、设备和介质
CN117673953A (zh) * 2023-12-06 2024-03-08 国网山东省电力公司莒县供电公司 一种基于无人机的电力线路运维检修系统及方法

Also Published As

Publication number Publication date
CN102571486B (zh) 2014-08-27

Similar Documents

Publication Publication Date Title
CN102571486B (zh) 一种基于BoW模型和统计特征的流量识别方法
CN110391958B (zh) 一种对网络加密流量自动进行特征提取和识别的方法
CN104598813B (zh) 一种基于集成学习和半监督svm的计算机入侵检测方法
Mohamad Tahir et al. Hybrid machine learning technique for intrusion detection system
CN110519128B (zh) 一种基于随机森林的操作系统识别方法
CN104468262B (zh) 一种基于语义敏感的网络协议识别方法及系统
CN113489685B (zh) 一种基于核主成分分析的二次特征提取及恶意攻击识别方法
CN102176698A (zh) 一种基于迁移学习的用户异常行为检测方法
CN107145778B (zh) 一种入侵检测方法及装置
CN111008337A (zh) 一种基于三元特征的深度注意力谣言鉴别方法及装置
CN110245693B (zh) 结合混合随机森林的关键信息基础设施资产识别方法
CN104809393A (zh) 一种基于流行度分类特征的托攻击检测算法
CN108234452B (zh) 一种网络数据包多层协议识别的系统和方法
CN109660656A (zh) 一种智能终端应用程序识别方法
CN116684877A (zh) 一种基于gyac-lstm的5g网络流量异常检测方法及系统
CN111130942A (zh) 一种基于消息大小分析的应用流量识别方法
CN113486935A (zh) 基于dpi和cnn的区块链应用流量识别方法
Wang et al. Temperature forecast based on SVM optimized by PSO algorithm
Bigdeli et al. A fast noise resilient anomaly detection using GMM-based collective labelling
Panja et al. Anomaly detection in iot using extended isolation forest
Wang et al. Unknown pattern extraction for statistical network protocol identification
CN110417786B (zh) 一种基于深度特征的p2p流量细粒度识别方法
Wang et al. FCM algorithm and index CS for the signal sorting of radiant points
Zhenxiang et al. Research of P2P traffic comprehensive identification method
CN113010673A (zh) 一种基于熵优化支持向量机的漏洞自动分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20181011

Address after: 211299 No. 368 zhe Ning Road, zhe Tang Town, Lishui Economic Development Zone, Nanjing, Jiangsu

Patentee after: Nanjing Ji Yun Information technology company limited

Address before: 200240 800 Dongchuan Road, Shanghai, Minhang District, Shanghai.

Patentee before: Shanghai Jiao Tong University

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190103

Address after: 201100 Shanghai Minhang District, Jianchuan Road 951 Building 5 1 Floor

Patentee after: SHANGHAI SHENYOU INTELLIGENT TECHNOLOGY CO., LTD

Address before: 211299 No. 368 zhe Ning Road, zhe Tang Town, Lishui Economic Development Zone, Nanjing, Jiangsu

Patentee before: Nanjing Ji Yun Information technology company limited

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190820

Address after: 201100 Shanghai Minhang District, Jianchuan Road 951 Building 5 1 Floor

Co-patentee after: Xiamen Shang Ji Network Technology Co., Ltd.

Patentee after: SHANGHAI SHENYOU INTELLIGENT TECHNOLOGY CO., LTD

Address before: 201100 Shanghai Minhang District, Jianchuan Road 951 Building 5 1 Floor

Patentee before: SHANGHAI SHENYOU INTELLIGENT TECHNOLOGY CO., LTD