CN107465543A - 一种网络流行为的特征刻画方法和系统 - Google Patents
一种网络流行为的特征刻画方法和系统 Download PDFInfo
- Publication number
- CN107465543A CN107465543A CN201710659588.5A CN201710659588A CN107465543A CN 107465543 A CN107465543 A CN 107465543A CN 201710659588 A CN201710659588 A CN 201710659588A CN 107465543 A CN107465543 A CN 107465543A
- Authority
- CN
- China
- Prior art keywords
- network flow
- network
- random
- higher order
- flow data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种网络流行为的特征刻画方法和系统,所述方法包括:随机抓取网络流量数据;计算所述网络流量数据的高阶矩和高阶累积量;根据所述高阶矩和高阶累积量对网络流进行分类识别。
Description
技术领域
本发明涉及网络流数据统计技术,尤指一种网络流行为的特征刻画方法和系统。
背景技术
网络流量通常涉及到主机、网络、应用以及用户等多个紧密联系的实体,是一个多因素融合的、复杂的系统概念。每个网络应用都有自己的流量行为特征,随着各种网络新型应用和网络应用协议的不断出现,网络流量的复杂性也日益增加,其多变、动态、异质的特性更加明显。
但是,目前对网络流量分类识别技术的研究没有得到足够的重视,缺乏对用户网络行为的准确理解与描述,难以进行精确的网络趋势分析,进而也难以实施有效的网络动态管理,影响了人们对网络资源的利用。
发明内容
为了解决上述技术问题,本发明提供了一种网络流行为的特征刻画方法和系统,实现了对网络流量的分类识别。
为了达到本发明目的,本发明提供了一种网络流行为的特征刻画方法,所述方法包括:
随机抓取网络流量数据;
计算所述网络流量数据的高阶矩和高阶累积量;
根据所述高阶矩和高阶累积量对所述网络流进行分类识别。
可选的,所述方法还包括:
根据所述高阶矩和高阶累积量判断网络是否被干扰。
可选的,所述随机抓取网络流量数据,包括:
利用网络封包分析工具随机抓取网络流量数据。
本发明还提供了一种网络流行为的特征刻画系统,所述系统包括:
数据获取模块,用于随机抓取网络流量数据;
网络流行为分析模块,用于计算所述网络流量数据的高阶矩和高阶累积量,根据所述高阶矩和高阶累积量对所述网络流进行分类识别。
可选的,所述网络流行为分析模块,还用于根据所述高阶矩和高阶累积量判断网络是否被干扰。
可选的,数据获取模块,用于随机抓取网络流量数据,包括:
数据获取模块,用于利用网络封包分析工具随机抓取网络流量数据。
与现有技术相比,本发明包括随机抓取网络流量数据;计算所述网络流量数据的高阶矩和高阶累积量;根据所述高阶矩和高阶累积量对网络流量进行分类识别。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明实施例提供的网络流行为的特征刻画方法流程图;
图2为本发明实施例提供的网络流行为的特征刻画系统组成图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明实施例提供了一种网络流行为的特征刻画方法,如图1所示,所述方法包括:
S101随机抓取网络流量数据;
可选的,可利用网络封包分析工具随机抓取网络流量数据,如利用Wireshark随机抓取网络流量数据;
S102计算所述网络流量数据的高阶矩和高阶累积量;
对于多个随机变量情形:
阶数r=k1+k2+…+kn的联合矩定义为:
其中,Φ(ω1,ω2,…,ωn)是n维随机变量(x1,x2,…,xn)的联合特征函数;
Φ(ω1,ω2,…,ωn)=E[expj(ω1x1+ω2x2+…+ωnxn)]
阶数r=k1+k2+…+kn的联合累积量定义为:
其中,Ψ(ω1,ω2,…,ωn)是n维随机变量(x1,x2,…,xn)的第二联合特征函数,
Ψ(ω1,ω2,…,ωn)=lnΦ(ω1,ω2,…,ωn)。
对于非零均值随机变量,前三阶联合累积量与前三阶联合矩相同,而四阶及高于四阶的联合累积量与相应阶次的联合矩不同。
S103根据所述高阶矩和高阶累积量对所述网络流进行分类识别。
由于高阶矩和高阶累计量包含了网络流的丰富信息,可辨识非因果、非最小相位、非线性系统;可抑制高斯或非高斯的有色噪声,因此可根据高阶矩和高阶累积量识别网络流类型。
可选的,还可以根据所述高阶矩和高阶累积量判断网络是否被干扰。
由于网络流行为高阶统计特征集受数据量大小、数据纯净度以及特征样本区分度这三种因素的影响,当网络被干扰时,所述三种因素会对网络流数据产生影响,造成高阶统计特征集存在较高的错误率,因此可以根据高阶统计特征集的错误率大小判断网络是否被干扰。所述高阶统计特征集的错误率的计算方法属于本领域技术人员的公知常识,此处不再累述。
通过上述实施例实现了对网络流量的分类识别。
本发明实施例还提供了一种网络流行为的特征刻画系统,如图2所示,所述系统包括:
数据获取模块201,用于随机抓取网络流量数据;
可选的,所述数据获取模块201可利用网络封包分析工具随机抓取网络流量数据,如利用Wireshark随机抓取网络流量数据;
网络流行为分析模块202,用于计算所述网络流量数据的高阶矩和高阶累积量,根据所述高阶矩和高阶累积量对所述网络流进行分类识别。
由于高阶矩和高阶累计量包含了网络流的丰富信息,可辨识非因果、非最小相位、非线性系统;可抑制高斯或非高斯的有色噪声,因此可根据高阶矩和高阶累积量识别网络流类型。
对于多个随机变量情形:
阶数r=k1+k2+…+kn的联合矩定义为:
其中,Φ(ω1,ω2,…,ωn)是n维随机变量(x1,x2,…,xn)的联合特征函数;
Φ(ω1,ω2,…,ωn)=E[expj(ω1x1+ω2x2+…+ωnxn)]
阶数r=k1+k2+…+kn的联合累积量定义为:
其中,Ψ(ω1,ω2,…,ωn)是n维随机变量(x1,x2,…,xn)的第二联合特征函数,
Ψ(ω1,ω2,…,ωn)=lnΦ(ω1,ω2,…,ωn)。
对于非零均值随机变量,前三阶联合累积量与前三阶联合矩相同,而四阶及高于四阶的联合累积量与相应阶次的联合矩不同。
可选的,所述网络流行为分析模块202,还用于根据所述网络流的高阶矩和高阶累积量判断网络是否被干扰。
由于网络流行为高阶统计特征集受数据量大小、数据纯净度以及特征样本区分度这三种因素的影响,当网络被干扰时,所述三种因素会对网络流数据产生影响,造成高阶统计特征集存在较高的错误率,因此可以根据高阶统计特征集的错误率大小判断网络是否被干扰。所述高阶统计特征集的错误率的计算方法属于本领域技术人员的公知常识,此处不再累述。
通过上述实施例实现了对网络流量的分类识别。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (6)
1.一种网络流行为的特征刻画方法,其特征在于,所述方法包括:
随机抓取网络流量数据;
计算所述网络流量数据的高阶矩和高阶累积量;
根据所述高阶矩和高阶累积量对所述网络流进行分类识别。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述高阶矩和高阶累积量判断网络是否被干扰。
3.根据权利要求1所述的方法,其特征在于,所述随机抓取网络流量数据,包括:
利用网络封包分析工具随机抓取网络流量数据。
4.一种网络流行为的特征刻画系统,其特征在于,所述系统包括:
数据获取模块,用于随机抓取网络流量数据;
网络流行为分析模块,用于计算所述网络流量数据的高阶矩和高阶累积量,根据所述高阶矩和高阶累积量对所述网络流进行分类识别。
5.根据权利要求4所述的系统,其特征在于,
所述网络流行为分析模块,还用于根据所述高阶矩和高阶累积量判断网络是否被干扰。
6.根据权利要求4所述的系统,其特征在于,数据获取模块,用于随机抓取网络流量数据,包括:
数据获取模块,用于利用网络封包分析工具随机抓取网络流量数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710659588.5A CN107465543A (zh) | 2017-08-04 | 2017-08-04 | 一种网络流行为的特征刻画方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710659588.5A CN107465543A (zh) | 2017-08-04 | 2017-08-04 | 一种网络流行为的特征刻画方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107465543A true CN107465543A (zh) | 2017-12-12 |
Family
ID=60548397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710659588.5A Pending CN107465543A (zh) | 2017-08-04 | 2017-08-04 | 一种网络流行为的特征刻画方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107465543A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104935570A (zh) * | 2015-04-22 | 2015-09-23 | 电子科技大学 | 基于网络流连接图的网络流连接行为特征分析方法 |
EP3065341A1 (en) * | 2015-03-05 | 2016-09-07 | Mitsubishi Electric R&D Centre Europe B.V. | Content classification medthod and device |
-
2017
- 2017-08-04 CN CN201710659588.5A patent/CN107465543A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3065341A1 (en) * | 2015-03-05 | 2016-09-07 | Mitsubishi Electric R&D Centre Europe B.V. | Content classification medthod and device |
CN104935570A (zh) * | 2015-04-22 | 2015-09-23 | 电子科技大学 | 基于网络流连接图的网络流连接行为特征分析方法 |
Non-Patent Citations (1)
Title |
---|
朱文波: ""流统计特征在网络流量分类中的应用研究"", 《中国优秀硕士学位论文全文数据库(电子期刊)》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111865815B (zh) | 一种基于联邦学习的流量分类方法及系统 | |
Song et al. | A software deep packet inspection system for network traffic analysis and anomaly detection | |
Shittu et al. | Intrusion alert prioritisation and attack detection using post-correlation analysis | |
US20160357424A1 (en) | Collapsing and placement of applications | |
Liu et al. | A class-oriented feature selection approach for multi-class imbalanced network traffic datasets based on local and global metrics fusion | |
Cui et al. | A session-packets-based encrypted traffic classification using capsule neural networks | |
CN107690776A (zh) | 用于异常检测中的将特征分组为具有选择的箱边界的箱的方法和装置 | |
CN106101015A (zh) | 一种移动互联网流量类别标记方法和系统 | |
CN108847957B (zh) | 发现与呈现网络应用访问信息的方法和系统 | |
CN107294966A (zh) | 一种基于内网流量的ip白名单构建方法 | |
CN102202064A (zh) | 基于网络数据流分析的木马通信行为特征提取方法 | |
Huang et al. | Software-defined QoS provisioning for fog computing advanced wireless sensor networks | |
Ghosh et al. | Internet of things based video surveillance systems for security applications | |
CN104935570A (zh) | 基于网络流连接图的网络流连接行为特征分析方法 | |
CN105871803A (zh) | 基于流量的网络状态快速感知系统 | |
Park et al. | NetCube: a comprehensive network traffic analysis model based on multidimensional OLAP data cube | |
Dong et al. | RETRACTED: Flow online identification method for the encrypted Skype | |
Pham et al. | Lightweight Convolutional Neural Network Based Intrusion Detection System. | |
Lee et al. | High performance payload signature-based Internet traffic classification system | |
CN113382039A (zh) | 一种基于5g移动网络流量分析的应用识别方法和系统 | |
CN107465543A (zh) | 一种网络流行为的特征刻画方法和系统 | |
CN106101839A (zh) | 一种识别电视端用户集合的方法 | |
CN106169974A (zh) | 本地邮件数据的搜集方法及系统 | |
CN106130880A (zh) | 网络邮件数据的搜集方法及系统 | |
Al-Saadi et al. | Unsupervised machine learning-based elephant and mice flow identification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171212 |