CN104244035A - 基于多层聚类的网络视频流分类方法 - Google Patents

基于多层聚类的网络视频流分类方法 Download PDF

Info

Publication number
CN104244035A
CN104244035A CN201410432130.2A CN201410432130A CN104244035A CN 104244035 A CN104244035 A CN 104244035A CN 201410432130 A CN201410432130 A CN 201410432130A CN 104244035 A CN104244035 A CN 104244035A
Authority
CN
China
Prior art keywords
video
network
stream
feature
statistical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410432130.2A
Other languages
English (en)
Other versions
CN104244035B (zh
Inventor
董育宁
姚利涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201410432130.2A priority Critical patent/CN104244035B/zh
Publication of CN104244035A publication Critical patent/CN104244035A/zh
Application granted granted Critical
Publication of CN104244035B publication Critical patent/CN104244035B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了基于多层聚类的网络视频流分类方法,该方法包括如下步骤:步骤1:在开放的网络环境中获取所需的视频业务数据,对原始的视频数据流进行基本的流量统计特征计算;步骤2:对上述的基本流统计特征进行深入地统计分析,选取具有实际意义的QoS相关的统计特征;步骤3:将获得的特征进行适当的组合来标识原始的网络数据流,通过多层聚类分类器的多层聚类识别,得到最后的分类结果。本发明方法是一种基于视频流统计特征的业务流分类方法,采用分层聚类的方法,配合有效的特征组合,能取得较好的分类效果。

Description

基于多层聚类的网络视频流分类方法
技术领域
本发明涉及一种基于多层聚类的网络视频流分类方法,属于模式识别与分类技术领域。
背景技术
随着因特网的迅速发展,网络被广泛地应用于人们生活的各个领域。网络中的视频业务的增长尤为迅速,与此同时,各种新的复杂应用和未知协议使得我们的网络环境日趋复杂,一系列的问题如有效的网管、不同业务的QoS保证等也随之产生。对于网络服务提供商(ISP)和网络环境监管者来说,快速准确地识别不同的网络业务流是一种行之有效的解决方法。
常用的识别和分类方法主要有基于端口的方法、基于深度包检测的和基于统计特征的方法。基于端口的识别方法是根据国际互联网代理成员管理局(IANA)建议的非强制端口号来区分不同的应用类型,随着P2P和被动FTP的新型网络应用的日益流行,数据传输中使用大量的随机端口,使得这种方法识别效率很低,分类准确度不高。为了突破基于端口的方法的限制,有大量文献尝试对应用层、载荷等进行深度包检测,该方法通过网络应用在传输过程中的特征来区分不同的应用。它需要解析数据包并获得特征字段,准确性很高,但随着应用负载加密和新型应用的不断涌现,该方法的有效性逐步下降。因此很多研究人员尝试借助业务流的统计特征识别业务流。该方法不需要获取分组的负载,仅通过流的统计特征就能够识别不同的网络业务。然而,如何找到确实有效的业务流统计特征,是一个巨大的挑战。
目前网络业务流分类研究主要集中在基于流统计特征的机器学习的方法。这种方法可以避免基于端口和基于负载检测的方法在应对动态端口、加密流和用户隐私方面的不足。通过深入的研究证明包到达时间间隔业务流分类过程中的重要作用。Mujtaba,G等利用各类业务流的包长分布,对加密通道中的的网络流量进行业务识别和区分,取得了良好的效果。IbrahimH A H,Mohd Nor S,Ahmed A采用平均包大小和平均包到达时间间隔这两个特征识别在线游戏,同样取得了不错的效果。Erman等提出了一种半监督的方法,使用K均值方法分类业务流数据集,但只强调对方法的改进。上述的工作要么针对某种特定的业务类型,要么只强调对方法的改进而忽略问题的关键,即,如何从原始流的属性中提取有意义的特征组合来标识原始流,进而提高流量分类模型的分类有效性。而本发明能够很好地解决上面的问题。
发明内容
本发明目的在于针对网络视频业务进行识别分类的问题,提出一种多层聚类网络视频流分类方法,该方法基于网络视频流的统计特征,通过采用QoS相关的统计特征组合标识不同的原始视频业务流,在不同层次的聚类中采用不同的分类特征或分类特征组合标识业务流数据作为分类器的输入,经过多层聚类后,得到最终的聚类结果,将该方法用于分析非对称(如在线播放视频)标清、非对称高清、HTTP下载、QQ、Xunlei、Sopcast六种网络视频流应用,实验结果表明,与现有同类方法相比,本方法对上述六种应用能够获得更高的分类准确性。
本发明解决其技术问题所采取的技术方案是:本发明提出了一种基于多层聚类的网络视频流分类方法,该方法通过大量的特征计算和统计分析,找到了一些典型视频业务流的QoS相关统计特征,并验证了这些统计特征组合用于分类的有效性。在基本FCM聚类方法的基础上采用分层聚类的新思路,搭配有效的特征组合设计一种新的网络视频流分类方法。
方法流程:
步骤1:在开放的网络环境中获取所需的视频业务数据,对原始的视频数据流进行基本的流量统计特征计算,具体步骤为:
步骤1-1:在开放的网络环境中,通过WireShark网络分析工具抓取所需的网络视频数据流,然后将抓取的原始数据流保存成包含五列数据的标准文本格式,其中包括包到达时间(s)、源IP地址、目的IP地址、协议、包尺寸五列原始信息。
步骤1-2:对原始的视频数据流进行基本的流量统计特征计算,这些特征包括:包尺寸、包到达时间间隔、字节速率、分组速率、包大小的信息熵、包到达时间间隔的概率密度函数,包到达时间间隔的累积密度函数等。
步骤2:对上述的基本流统计特征进行深入地统计分析,选取具有实际意义的QoS相关的统计特征,具体步骤为:
步骤2-1:通过对基本的流统计特征进行大量的统计分析和实验验证,得出具有一定区分效果的QoS相关的统计特征;
步骤2-2:对于区分实际分析的网络视频流所选取的QoS相关特征有四个,其特征包括:
1)下上行字节数之比
下上行字节数之比即一条流中去除开销之后剩余的数据中下行字节数与上行字节数的比值。该特征能够有效地避免网络环境变化对识别结果的影响,具有较好的稳定性。在区分对称(如P2P流)和非对称业务时具有较好的区分效果,结合下面介绍的下行包大小的信息熵或下行子流片段数目能够有效地区分对称和非对称视频业务。
2)下行包大小的信息熵
下行包大小的信息熵可用来衡量一条流下行包大小的分布均匀程度。该值越大,说明某种业务的包大小分布越均匀。大量的实验证明该参数对于区分对称业务中的QQ、Xunlei和Sopcast具有较好的效果。下行子流片段数目连续的出现相同源IP的数据包称为子流片段,这些IP地址可以重复。研究表明对称业务中经常出现不同IP地址与本地IP交互的情况,因而对称业务流中的子流片段数目较多。
3)下行子流片段数目
连续的出现相同源IP的数据包称为子流片段,这些IP地址可以重复。研究表明对称业务中经常出现不同IP地址与本地IP交互的情况,因而对称业务流中的子流片段数目较多。
4)下行有效IP数目
在数据流抓取的过程中会出现不同的IP地址与本地IP信息交互的情况,由于在运行过程中避免不了会有一些后台应用,因而可能出现一些与该流无关的IP地址。在这种情况下,定义持续持续时间大于0.5秒的IP地址为有效IP地址。下行有效IP数目也就是指下行数据中总的持续时间大于0.5秒的源IP地址数目的总和。
步骤3:将获得的特征进行适当的组合来标识原始的网络数据流,通过多层聚类分类器(即FCM)的多层聚类识别,得到最后的分类结果,具体步骤为:
步骤3-1:经分析发现对称业务和非对称业务在下上行字节数之比和下行子流片段数目这两个特征上有很大的差异,因此选取该二维特征空间作为区分对称视频业务和非对称视频业务的特征组合;
步骤3-2:对称视频业务中的QQ、Xunlei和Sopcast这三种业务:QQ的下行包大小的信息熵较后两者明显偏大,而Sopcast的下行包大小的信息熵比其余两种都要小,Xunlei的下行包大小的信息熵跨度较大,但与其余两者也都有一定的区分度,并且在下行子流片段数目这维特征空间上QQ与Xunlei、Sopcast也有明显的区别。因此,选取下行包大小的信息熵和下行子流片段数目作为区分对称业务的有效特征组合;
步骤3-3:非对称标清、非对称高清和HTTP下载这三种业务:HTTP下载是一种传统的应用类型,它类似于FTP服务,只是两个IP之间的交互,因而该业务的有效IP数目必然较少。而对于非对称的高清和标清业务,虽然某一时刻也同样是两个IP之间的信息交互,但是本发明所要获取的资源不仅仅存在于一个视频服务器中,可能由于网络环境的影响,与当前连接的服务器断掉了,这样本地IP就要重新获取其他服务器上的资源,因而这两种业务的下行有效IP数目必然偏多。采用这个特征基本上能将HTTP下载和非对称的标清、高清区分开。对于非对称的标清和高清而言,从现有的特征空间看,只有下上行字节数之比能将他们近似分开。
步骤3-4:采用上面所述的特征组合表示原始的网络视频流,采用基于(线性和高斯)核函数的FCM进行多层聚类,多层聚类方法的步骤包括:
步骤1:将所有的原始数据流使用二维特征矢量(Ti,Tj)标识进行第一层聚类,得到两大类聚类结果C1,C2;
步骤2:对一层聚类结果C1,C2的数据流分别使用特征矢量Vi,Vj进行标识,进行第三次聚类得到聚类结果C21,C22,...;
步骤3:对上层聚类结果采用同样的方法再次进行聚类,直到最终的聚类结果等于给定的类别数就停止;
步骤4:统计聚类输出结果。
有益效果:
1、本发明与现有的采用基本流统计特征的视频业务识别分类技术相比,采用的是具有较好区分度的特征组合标识原始视频数据,能够取得更高的分类准确性。
2、本发明是一种基于视频流统计特征的业务流分类方法,采用分层聚类的方法,配合有效的特征组合,能取得较好的分类效果。
附图说明
图1为本发明视频业务特征分析与分类方法的流程框图。
图2为本发明所选特征组合有效性验证图。
标识说明:(a)表示三维特征组合(下上行字节数之比、下行子流片段数目和下行包大小的信息熵)的整体区分效果图;(b)表示二维特征组合(下上行字节数之比和下行包大小的信息熵)区分对称业务和非对称业务的效果图;(c)表示二维特征组合(下行包大小的信息熵和下行子流片段数目的对数)区分对称业务的效果图;(d)表示二维特征组合(下上行字节数之比和下行有效IP数目)区分非对称业务的效果图。
图3为本发明与现有技术F-measure性能上的对比效果图,现有技术采用基本的流统计特征(平均包大小和平均包到达时间间隔)。
具体实施方式
以下结合说明书附图对本发明创造作进一步的详细说明。
如图1所示,本发明提出的一种基于多层聚类的网络视频流分类方法,该方法包括:流量的获取及统计特征的计算、统计特征分析及选择、多层FCM聚类输出结果统计等。主要具体步骤为:
步骤1,流量的获取及统计特征的计算:通过网络分析工具WireShark在开放的网络环境中获取待分析的网络视频数据,其中包括非对称标清(以youku标清为例)、非对称高清(以youku高清为例)、HTTP下载、交互式视频通信类(以QQ为例)、P2P文件共享类(以Xunlei为例)、网络在线直播类(以Sopcast为例)六类视频应用。将获取的网络视频流数据保存成TXT文档格式(即为一条流),其中包含5列,从左至右依次是包到达时间、源IP地址、目的IP地址、协议、分组大小。流是指同种业务在30分钟时间内所抓取的数据包序列,在次称其为一条流,每种业务都抓取60条流来分析问题。然后,将原始的视频流输入到网络数据流处理平台,进行统计特征计算,最后得到一些列的网络视频流的QoS相关的统计特征。
步骤2,统计特征分析及选择:通过大量的统计实验和分析验证,发现采用下上行字节数之比、下行包大小的信息熵、下行子流片段数目和下行有效IP数目四个特征对所选取的典型网络视频流进行分类识别。
在实验中,本发明首先采用三维特征向量V=(Vi,Vj,Vk)来标识原始的网络视频流,其中Vi是下上行字节数之比,Vj是下行包大小的信息熵,Vk是下行子流片段数目。具体的区分效果如图2的(a)所示。从图中可以看出不同的网络视频流业务在上述三个统计特征上具有明显的差异。特别地,对于对称的QQ、Xunlei、Sopcast三种业务和非对称的高清、标清、HTTP三种业务在下上行字节数之比这一维度上有明显的区别。对称业务的下上行字节数之比较非对称业务明显偏少;而其中的QQ、Xunlei这两种业务的下行包大小的信息熵与非对称业务区别也相当明显,Sopcast应用在这一维度上却与非对称的几种业务区分并不明显。如图2的(b)所示,在二维空间上使用下行包大小的信息熵和下上行字节数之比可以将对称和非对称业务区分。而从任意单维特征都无法将两大类业务区分开,从这个意义上讲文中选取的这对特征组合是有效的。
接着从更细的角度划分两大类业务流,如图2的(c)所示,对于对称的三种视频业务,同样的从任何一个单维特征空间都无法将三种业务流分开,而在本发明的二维特征空间中就可以将三种业务基本分开,也可以看出QQ和Xunlei之间在包大小的信息熵上有交叠的情况。但从整体上看,这两个特征对于区分对称的三种业务也是有效的。强调一点,在本发明的实验过程中发现,采用下行子流片段数目的对数形式要比直接采用下行子流片段数目具有更佳的分类效果。
对于非对称业务而言,如图2的(d)所示,仅使用上述的三个统计特征无法将它们分开,因而,本发明又引入一维新的特征即下行有效IP数目。HTTP下载是一种传统的应用类型,它类似于FTP服务,只是两个IP之间的交互,因而该业务的有效IP数目必然较少。而对于非对称的高清和标清业务,虽然某一时刻也同样是两个IP之间的信息交互,但是,本发明所要获取的资源不仅仅存在于一个视频服务器中,可能由于网络环境的影响,与当前连接的服务器断掉了,这样本地IP就要重新获取其他服务器上的资源,因而这两种业务的下行有效IP数目必然偏多。采用这个特征基本上能将HTTP下载和另外两种业务区分开,但也不可避免的存在一些交叠的情况。
因此,可以选择上述三组二维特征矢量作为本发明的特征组合。
步骤3,多层FCM聚类输出结果统计,其实现方法为:采用上述的QoS相关统计特征组合,标识原始的网络视频业务流,实施多层FCM聚类分类方法。
本发明的多层聚类方法步骤包括:
步骤:将所有的原始数据流使用二维特征矢量(Ti,Tj)标识进行第一层聚类,得到两大类聚类结果C1,C2;
步骤2:对一层聚类结果C1,C2的数据流分别使用特征矢量Vi,Vj进行标识,进行第三次聚类得到聚类结果C21,C22,...;
步骤3:对上层聚类结果采用同样的方法再次进行聚类,直到最终的聚类结果等于给定的类别数就停止;
步骤4:统计聚类输出结果。
本发明的实验结果:
为了进一步验证本发明选取的统计特征的有效性,本发明采用上述的特征组合标识六种网络视频流数据,利用本发明中提出的多层聚类方法进行聚类识别。主要从衡量网络流分类性能的综合指标F测度(F-measure)进行对比验证。
在图3中展示了两种方法对于六种网络视频业务的F-测度值。其中Original是采用平均包大小和平均包到达时间间隔两个特征进行网络流量分类的分类结果,Improved是采用本发明提出的统计特征组合利用基于径向基核函数的多层聚类方法的分类结果。从整体上观察,对于F-measure值来说,本方法对六种网络视频流的识别结果都有较明显的改善。

Claims (6)

1.基于多层聚类的网络视频流分类方法,其特征在于,所述方法步骤包括:
步骤1:在开放的网络环境中获取所需的视频业务数据,对原始的视频数据流进行基本的流量统计特征计算;
步骤2:对上述的基本流统计特征进行深入地统计分析,选取具有实际意义的QoS相关的统计特征;
步骤3:将获得的特征进行适当的组合来标识原始的网络数据流,通过多层聚类分类器的多层聚类识别,得到最后的分类结果。
2.根据权利要求1所述的基于多层聚类的网络视频流分类方法,其特征在于,所述方法的步骤1中包括如下步骤:
步骤1-1:在开放的网络环境中,通过WireShark网络分析工具抓取所需的网络视频数据流,然后将抓取的原始数据流保存成包含五列数据的标准文本格式,其中包括包到达时间、源IP地址、目的IP地址、协议、包尺寸五列原始信息;
步骤1-2:对原始的视频数据流进行基本的流量统计特征计算,这些特征包括:包尺寸、包到达时间间隔、字节速率、分组速率、包大小的信息熵、包到达时间间隔的概率密度函数,包到达时间间隔的累积密度函数。
3.根据权利要求1所述的基于多层FCM的视频业务特征分析与分类方法,其特征在于,所述方法的步骤2中包括如下步骤:
步骤2-1:通过对基本的流统计特征进行大量的统计分析和实验验证,得出具有一定区分效果的QoS相关的统计特征;
步骤2-2:对于区分实际分析的网络视频流所选取的QoS相关特征有四个。
4.根据权利要求3所述的基于多层FCM的视频业务特征分析与分类方法,其特征在于,上述步骤2-2中的QoS特征包括:
1)下上行字节数之比;
下上行字节数之比即一条流中去除开销之后剩余的数据中下行字节数与上行字节数的比值;
2)下行包大小的信息熵;
下行包大小的信息熵可用来衡量一条流下行包大小的分布均匀程度;该值越大,说明某种业务的包大小分布越均匀;
3)下行子流片段数目;
连续的出现相同源IP的数据包称为子流片段,这些IP地址能重复;对称业务流中的子流片段数目较多;
4)下行有效IP数目;
定义持续时间大于0.5秒的IP地址为有效IP地址;下行有效IP数目是指下行数据中总的持续时间大于0.5秒的源IP地址数目的总和。
5.根据权利要求1所述的基于多层聚类的网络视频流分类方法,其特征在于,所述方法的步骤3中包括如下步骤:
步骤3-1:经分析发现对称业务和非对称业务在下上行字节数之比和下行子流片段数目这两个特征上有很大的差异,因此选取该二维特征空间作为区分对称视频业务和非对称视频业务的特征组合;
步骤3-2:对称视频业务中的QQ、Xunlei和Sopcast这三种业务:QQ的下行包大小的信息熵较后两者明显偏大,而Sopcast的下行包大小的信息熵比其余两种都要小,Xunlei的下行包大小的信息熵跨度较大,但与其余两者也都有一定的区分度,并且在下行子流片段数目这维特征空间上QQ与Xunlei、Sopcast也有明显的区别;选取下行包大小的信息熵和下行子流片段数目作为区分对称业务的有效特征组合;
步骤3-3:非对称标清、非对称高清和HTTP下载这三种业务:HTTP下载是一种传统的应用类型,它类似于FTP服务,只是两个IP之间的交互,因而该业务的有效IP数目必然较少;而对于非对称的高清和标清业务,虽然某一时刻也同样是两个IP之间的信息交互,但是本发明所要获取的资源不仅仅存在于一个视频服务器中,可能由于网络环境的影响,与当前连接的服务器断掉了,这样本地IP就要重新获取其他服务器上的资源,因而这两种业务的下行有效IP数目必然偏多;采用这个特征基本上能将HTTP下载和非对称的标清、高清区分开;对于非对称的标清和高清而言,从现有的特征空间看,只有下上行字节数之比能将他们近似分开;
步骤3-4:采用所述的特征组合表示原始的网络视频流,采用核函数的FCM进行多层聚类。
6.根据权利要求5所述的基于多层聚类的网络视频流分类方法,其特征在于,上述步骤3-4中多层聚类的方法,包括如下步骤:
步骤1:将所有的原始数据流使用二维特征矢量(Ti,Tj)标识进行第一层聚类,得到两大类聚类结果C1,C2;
步骤2:对一层聚类结果C1,C2的数据流分别使用特征矢量Vi,Vj进行标识,进行第三次聚类得到聚类结果C21,C22,...;
步骤3:对上层聚类结果采用同样的方法再次进行聚类,直到最终的聚类结果等于给定的类别数就停止;
步骤4:统计聚类输出结果。
CN201410432130.2A 2014-08-27 2014-08-27 基于多层聚类的网络视频流分类方法 Active CN104244035B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410432130.2A CN104244035B (zh) 2014-08-27 2014-08-27 基于多层聚类的网络视频流分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410432130.2A CN104244035B (zh) 2014-08-27 2014-08-27 基于多层聚类的网络视频流分类方法

Publications (2)

Publication Number Publication Date
CN104244035A true CN104244035A (zh) 2014-12-24
CN104244035B CN104244035B (zh) 2018-10-02

Family

ID=52231245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410432130.2A Active CN104244035B (zh) 2014-08-27 2014-08-27 基于多层聚类的网络视频流分类方法

Country Status (1)

Country Link
CN (1) CN104244035B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657747A (zh) * 2015-01-30 2015-05-27 南京邮电大学 一种基于统计特征的网络游戏流分类方法
CN105069469A (zh) * 2015-07-30 2015-11-18 天津师范大学 一种基于模糊c均值聚类算法和熵理论的数据流检测方法
CN105163181A (zh) * 2015-08-05 2015-12-16 中国科学院声学研究所 一种在线视频节目分类方法及其装置
CN105787512A (zh) * 2016-02-29 2016-07-20 南京邮电大学 基于新型特征选择方法的网络浏览与视频分类方法
CN106203474A (zh) * 2016-06-27 2016-12-07 东北大学 一种基于密度值动态变化的流数据聚类方法
CN106789349A (zh) * 2017-01-20 2017-05-31 南京邮电大学 一种基于体验质量建模分析及会话流分类的方法
CN107648854A (zh) * 2017-08-30 2018-02-02 武汉斗鱼网络科技有限公司 一种游戏分类方法、装置及电子设备
CN108206788A (zh) * 2016-12-16 2018-06-26 中国移动通信有限公司研究院 一种流量的业务识别方法及相关设备
CN108764141A (zh) * 2018-05-25 2018-11-06 广州虎牙信息科技有限公司 一种游戏场景描述方法、装置、设备及其存储介质
CN108900862A (zh) * 2018-02-14 2018-11-27 南京邮电大学 基于统计分析的网络视频流QoE-QoS参数映射方法
CN110381356A (zh) * 2019-07-19 2019-10-25 北京字节跳动网络技术有限公司 音视频生成方法、装置、电子设备及可读介质
CN111488400A (zh) * 2019-04-28 2020-08-04 北京京东尚科信息技术有限公司 数据分类方法、装置和计算机可读存储介质
CN112671670A (zh) * 2021-01-08 2021-04-16 鹏城实验室 一种vr视频业务识别方法、装置、智能终端及存储介质
CN113128626A (zh) * 2021-05-28 2021-07-16 安徽师范大学 基于一维卷积神经网络模型的多媒体流细分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1452130A (zh) * 2003-05-29 2003-10-29 上海交通大学 多目标图像的分层聚类方法
US8316024B1 (en) * 2011-02-04 2012-11-20 Google Inc. Implicit hierarchical clustering

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1452130A (zh) * 2003-05-29 2003-10-29 上海交通大学 多目标图像的分层聚类方法
US8316024B1 (en) * 2011-02-04 2012-11-20 Google Inc. Implicit hierarchical clustering

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
安文娟: "基于聚类算法的实时IP流量识别技术研究", 《中国优秀硕士学位论文全文数据库-信息科技辑》 *
张剑等: "在线聚类的网络流量识别", 《北京邮电大学学报》 *
王再见等: "一种异构网络中基于聚集流的水平QoS映射方法", 《电子与信息学报》 *
胡婷等: "网络流量分类方法的比较研究", 《桂林电子科技大学学报》 *
董育宁等: "多媒体通信业务流识别与分类方法综述", 《南京邮电大学学报(自然科学版)》 *
金慧珍等: "大规模数据集的多层聚类算法", 《杭州电子科技大学学报》 *
陈厦等: "模糊聚类算法综述", 《生命科学仪器》 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657747A (zh) * 2015-01-30 2015-05-27 南京邮电大学 一种基于统计特征的网络游戏流分类方法
CN105069469A (zh) * 2015-07-30 2015-11-18 天津师范大学 一种基于模糊c均值聚类算法和熵理论的数据流检测方法
CN105069469B (zh) * 2015-07-30 2018-03-27 天津师范大学 一种基于模糊c均值聚类算法和熵理论的数据流检测方法
CN105163181B (zh) * 2015-08-05 2018-04-17 中国科学院声学研究所 一种在线视频节目分类方法及其装置
CN105163181A (zh) * 2015-08-05 2015-12-16 中国科学院声学研究所 一种在线视频节目分类方法及其装置
CN105787512A (zh) * 2016-02-29 2016-07-20 南京邮电大学 基于新型特征选择方法的网络浏览与视频分类方法
CN105787512B (zh) * 2016-02-29 2019-08-02 南京邮电大学 基于特征选择方法的网络浏览与视频分类方法
CN106203474A (zh) * 2016-06-27 2016-12-07 东北大学 一种基于密度值动态变化的流数据聚类方法
CN108206788A (zh) * 2016-12-16 2018-06-26 中国移动通信有限公司研究院 一种流量的业务识别方法及相关设备
CN108206788B (zh) * 2016-12-16 2021-07-06 中国移动通信有限公司研究院 一种流量的业务识别方法及相关设备
CN106789349A (zh) * 2017-01-20 2017-05-31 南京邮电大学 一种基于体验质量建模分析及会话流分类的方法
CN106789349B (zh) * 2017-01-20 2020-04-07 南京邮电大学 一种基于体验质量建模分析及会话流分类的方法
CN107648854B (zh) * 2017-08-30 2020-09-08 武汉斗鱼网络科技有限公司 一种游戏分类方法、装置及电子设备
CN107648854A (zh) * 2017-08-30 2018-02-02 武汉斗鱼网络科技有限公司 一种游戏分类方法、装置及电子设备
CN108900862A (zh) * 2018-02-14 2018-11-27 南京邮电大学 基于统计分析的网络视频流QoE-QoS参数映射方法
CN108764141A (zh) * 2018-05-25 2018-11-06 广州虎牙信息科技有限公司 一种游戏场景描述方法、装置、设备及其存储介质
CN108764141B (zh) * 2018-05-25 2021-07-02 广州虎牙信息科技有限公司 一种游戏场景描述方法、装置、设备及其存储介质
CN111488400A (zh) * 2019-04-28 2020-08-04 北京京东尚科信息技术有限公司 数据分类方法、装置和计算机可读存储介质
CN110381356A (zh) * 2019-07-19 2019-10-25 北京字节跳动网络技术有限公司 音视频生成方法、装置、电子设备及可读介质
CN112671670A (zh) * 2021-01-08 2021-04-16 鹏城实验室 一种vr视频业务识别方法、装置、智能终端及存储介质
CN113128626A (zh) * 2021-05-28 2021-07-16 安徽师范大学 基于一维卷积神经网络模型的多媒体流细分类方法

Also Published As

Publication number Publication date
CN104244035B (zh) 2018-10-02

Similar Documents

Publication Publication Date Title
CN104244035B (zh) 基于多层聚类的网络视频流分类方法
Chen et al. Seq2img: A sequence-to-image based approach towards ip traffic classification using convolutional neural networks
Homayoun et al. BoTShark: A deep learning approach for botnet traffic detection
Qin et al. Robust application identification methods for P2P and VoIP traffic classification in backbone networks
WO2018054342A1 (zh) 一种网络数据流分类的方法及系统
Singh Performance analysis of unsupervised machine learning techniques for network traffic classification
Grimaudo et al. Select: Self-learning classifier for internet traffic
CN111492635A (zh) 恶意软件主机网络流分析系统和方法
AU2012200642B2 (en) A method and apparatus for communications analysis
CN110611640A (zh) 一种基于随机森林的dns协议隐蔽通道检测方法
CN104052639A (zh) 基于支持向量机的实时多应用网络流量识别方法
CN109151880A (zh) 基于多层分类器的移动应用流量识别方法
Niu et al. A heuristic statistical testing based approach for encrypted network traffic identification
CN107967311A (zh) 一种对网络数据流进行分类的方法和装置
CN111953552A (zh) 数据流的分类方法和报文转发设备
CN104994016A (zh) 用于分组分类的方法和装置
CN103973589A (zh) 网络流量分类方法及装置
Himura et al. Synoptic graphlet: Bridging the gap between supervised and unsupervised profiling of host-level network traffic
Chung et al. An effective similarity metric for application traffic classification
Min et al. Online Internet traffic identification algorithm based on multistage classifier
Qin et al. MUCM: multilevel user cluster mining based on behavior profiles for network monitoring
CN108494620A (zh) 基于多目标自适应演化算法的网络业务流特征选择与分类方法
CN108141377B (zh) 网络流早期分类
CN101854366A (zh) 一种对等网络流量识别的方法及装置
CN114362988B (zh) 网络流量的识别方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant