CN105376105A - 一种基于时间滑动窗口的互联网流量建模方法 - Google Patents

一种基于时间滑动窗口的互联网流量建模方法 Download PDF

Info

Publication number
CN105376105A
CN105376105A CN201410425563.5A CN201410425563A CN105376105A CN 105376105 A CN105376105 A CN 105376105A CN 201410425563 A CN201410425563 A CN 201410425563A CN 105376105 A CN105376105 A CN 105376105A
Authority
CN
China
Prior art keywords
time
flow
window
flow diagram
limit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410425563.5A
Other languages
English (en)
Inventor
吴晓非
禹可
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Dashuju Information Technology Co Ltd
Original Assignee
Suzhou Dashuju Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Dashuju Information Technology Co Ltd filed Critical Suzhou Dashuju Information Technology Co Ltd
Priority to CN201410425563.5A priority Critical patent/CN105376105A/zh
Publication of CN105376105A publication Critical patent/CN105376105A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于时间滑动窗口的互联网流量建模方法,具体包括以下几个步骤:(1)通过网络中的流量监控设备对不同时刻产生的流信息进行采集,采集到的每个流信息对应一条流记录;(2)对采集到的流信息建立流量图;(3)利用时间窗口的滑动对流量图进行迭代更新,(1a)在时间窗口W1中建立一个流量图G1;(2a)将时间窗口W1往后滑动τ形成时间窗口W2,并对流量图G1进行更新,形成流量图G2;(4)通过时间窗口的滑动,生成一系列的流量图,通过对流量图进行对比分析,得出网络流量的动态变化特性。本发明引入时间滑动窗口,既表征了网络流量的动态变化特性,又避免了流量的时间累积效应,降低了模型的分析处理复杂度。

Description

一种基于时间滑动窗口的互联网流量建模方法
技术领域
本发明涉及互联网流量建模技术领域,具体涉及一种基于时间滑动窗口的互联网流量建模方法。
背景技术
随着近年来网络技术、规模和业务的发展,互联网已经成为人类社会的重要基础设施,它从根本上改变了人们以前的交流方式和生活方式。互联网的繁荣带来了许多新的挑战,网络流量爆炸式增长,应用变化发展和推陈出新的速度非常迅速,用户行为趋于复杂化。互联网流量建模有助于把握应用流量特征,为流量预测、网络维护、网络设施升级、网络安全防御等提供基础的数据支撑能力,具有明显的现实意义。
流量建模是网络测量领域的一个重要方面,产生了种类繁多的网络流量模型。传统的流量模型包括泊松模型、马尔可夫模型、自回归模型等。最早的泊松模型是根据电话业务流量的特征提出来的,是指在时间序列t内,呼叫或数据包到达的数量符合参数为t的泊松分布,其相应的呼叫或包到达的时间间隔序列呈负指数分布。马尔可夫模型针对分组交换网络流量,每次状态转换代表一个新的到达,未来状态只依赖于当前状态,而描述一个状态持续时间的随机变量的分布呈指数分布(连续时间)或几何分布(离散时间)。自回归模型采用自动回归法,强调时间序列未来的点数由同一时间序列过去的值来决定。上述流量模型只存在短相关性,即在不同的时间尺度上有不同特性,并且大量源叠加会平缓突发性,与实际数据网络流量特征存在较大的偏差。
互联网研究人员随后发现实际业务流在各个时间尺度下表现出自相似的突发特性,在相关函数上表现为长相关特性,又相继提出了若干长相关模型,包括重尾分布的ON/OFF模型、分形布朗运动模型、FARIMA模型等。重尾分布的ON/OFF模型首先叠加大量的ON/OFF源,每个源都有两个状态,即周期交替的ON和OFF,在ON状态中,数据源连续地发送数据包;在OFF状态中,数据源不发送任何数据包。每个发送源的ON状态和OFF状态的时长独立地符合重尾分布(如Pareto分布)。分形布朗运动模型是一种统计自相似过程的数学模型,它是一个均值为0的连续高斯过程,其平稳增量过程是分形高斯噪声。FARIMA模型是一个时间序列模型,它是一个二阶渐进自相似过程,通过3个参数来控制自相关结构。上述流量模型可以描述流量的突发性和长相关性,刻画了业务流量的自相似特性。
以上流量模型大多从纯粹的数学角度对网络流量的性质进行挖掘,通过包长、包到达时刻、包到达时间间隔、包突发数量等微观性质的数学描述,试图找出最有效的建模方式,但却忽略了网络流量的现实意义,即流量是为网络交互而产生,天然具有多个参与者的特性,而不仅仅是通信单方或双方的问题。此外,现有的一些长相关流量模型存在较高的计算复杂度,由于其结构复杂、参数众多,导致算法收敛速度慢,已无法实际应用于网络流量管理和预测中。
发明内容
针对现有技术存在的不足,本发明目的是提供一种基于时间滑动窗口的互联网流量建模方法,引入时间滑动窗口,既表征了网络流量的动态变化特性,又避免了流量的时间累积效应,降低了模型的分析处理复杂度。
为了实现上述目的,本发明是通过如下的技术方案来实现:
本发明的一种基于时间滑动窗口的互联网流量建模方法,具体包括以下几个步骤:
(1)通过网络中的流量监控设备对不同时刻产生的流信息进行采集,采集到的每个流信息对应一条流记录;
(2)根据步骤(1)采集到的流信息建立流量图,流量图的建图方法如下:
将流记录中的源主机和目的主机作为节点,将源主机和目的主机之间的流量交互作为边,将边上的流量交互总和设为边的权值,节点的强度为与它相连的所有边的权值总和;
(3)利用时间窗口的滑动对流量图进行迭代更新,时间窗口包含窗口大小W和滑动时间间隔τ两个参数,具体迭代更新方法如下:
(1a)在时间窗口W1中,通过步骤(2)的建图方法建立一个流量图G1;
(2a)将时间窗口W1往后滑动τ,从而形成时间窗口W2,并对流量图G1进行更新,具体更新方法如下:
若时间窗口W2包含了新的流记录,则在流量图G1上增加新的节点和边;
对每条在时间窗口W1中已经存在的旧边(即W1中有一条流记录,但是W2中无相同节点对之间的流记录,或者W2中的一条流记录具有相同的节点对),仅对该边的权值进行更新,即减去W1中流记录的流量大小,再加上W2中流记录的流量大小(可能为0);若旧边的权值已减为0,则删除该旧边;若旧节点已无边相连,则删除该节点,从而形成流量图G2;
(4)通过步骤(3)中时间窗口的滑动,从而生成一系列的流量图,通过对流量图的统计特性如度分布进行对比分析(对比分析的方法为现有技术),可得出网络流量的动态变化特性。
步骤(1)中,每条流记录的内容包括发生时间、源和目的IP地址、源和目的端口、包数及字节数和应用类型。
步骤(1)中,在固定网络中,流量监控设备可安装在接入网和骨干网之间的链路上;
在移动网络中,流量监控设备可安装在GPRS网络中SGSN和GGSN之间的链路上;
通过这些链路的所有流信息均被流量监控设备记录和分析。
步骤(3)中,可通过流量图的度分布和强度分布的幂指数来确定窗口大小W。
在P2P流量测试中,窗口大小W设为60分钟。
步骤(3)中,通过流持续时间的经验值或流量图的重边比例来确定滑动时间间隔τ。
在P2P流量测试中,滑动时间间隔τ设为10分钟。
本发明的有益效果如下:
(1)从宏观层面而非微观层面考虑流量建模问题,涉及到网络多个用户的多维通信,而忽略一个流或一个包的微观特征,便于大规模网络流量建模;
(2)从实际流量数据出发建立流量图模型,准确表征了网络用户的交互行为,通过图结构统计特性易于挖掘全局流量特征;
(3)引入时间滑动窗口,既表征了网络流量的动态变化特性,又避免了流量的时间累积效应,降低了模型的分析处理复杂度。
附图说明
图1为本发明的基于时间滑动窗口的互联网流量建模方法原理图(图中虚线框表示W1,实线框表示W2)。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
网络流量数据通过部署于运营商网络中的流量监控设备进行采集。在固定网络中,流量监控设备可部署于接入网和骨干网之间的链路上;而在移动网络中,流量监控设备可部署于GPRS网络中SGSN和GGSN之间的链路上。通过这些链路的所有流信息均被流量监控设备记录和分析,一天24小时就能产生上亿条流记录。
对于如此大规模的流量数据,采用基于时间滑动窗口的流量图模型进行建模。
参见图1,一条竖线代表某时刻产生的一条流记录,竖线的粗细表示了这条流记录中的流量大小(以包数或字节数表示)。用一个时间窗口覆盖一部分流记录,窗口大小设定为W,每次向后滑动τ。在时间窗口W1中,建立一个流量图G1,其节点为流记录中的源/目的IP地址,源和目的之间的流量传送形成边,边上的权值为传送的流量大小。当时间窗口从W1往后滑动τ形成时间窗口W2时,将G1更新为G2:W2中新的流记录使得G1增加新的节点和边;已在G1中存在的边(旧边)减去相应的权值;若边的权值已减为0,则删除该边;若节点已无边相连,则删除该节点。
时间滑动窗口的两个重要参数为窗口大小W和滑动时间间隔τ,可根据实际流量情况进行配置。如使用流量图的度分布和强度分布的幂指数来确定窗口大小W。实际P2P流量测试发现当窗口大小W小于60分钟时,流量图的度分布和强度分布的幂指数快速变化,当W大于60分钟时,幂指数基本稳定,因此可设窗口大小W为60分钟。使用流持续时间的经验值或流量图的重边比例来确定滑动时间间隔τ。实际P2P流量测试发现当滑动时间间隔τ小于10分钟时,流量图的重边比例快速增加,当τ大于10分钟后,重边比例基本稳定,因此可设滑动时间间隔τ为10分钟。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (7)

1.一种基于时间滑动窗口的互联网流量建模方法,其特征在于,具体包括以下几个步骤:
(1)通过网络中的流量监控设备对不同时刻产生的流信息进行采集,采集到的每个流信息对应一条流记录;
(2)根据步骤(1)采集到的流信息建立流量图,所述流量图的建图方法如下:
将流记录中的源主机和目的主机作为节点,将源主机和目的主机之间的流量交互作为边,将所述边上的流量交互总和设为边的权值,所述节点的强度为与它相连的所有边的权值总和;
(3)利用时间窗口的滑动对流量图进行迭代更新,所述时间窗口包含窗口大小W和滑动时间间隔τ两个参数,具体迭代更新方法如下:
(1a)在时间窗口W1中,通过步骤(2)的建图方法建立一个流量图G1;
(2a)将时间窗口W1往后滑动τ,从而形成时间窗口W2,并对流量图G1进行更新,具体更新方法如下:
若时间窗口W2包含了新的流记录,则在流量图G1上增加新的节点和边;
对每条在时间窗口W1中已经存在的旧边,所述旧边即时间窗口W1中有一条流记录,但时间窗口W2中无相同节点对之间的流记录,或者时间窗口W2中的一条流记录具有相同的节点对;仅对该旧边的权值进行更新,即减去时间窗口W1中流记录的流量大小,再加上时间窗口W2中流记录的流量大小;若旧边的权值已减为0,则删除该旧边;若旧节点已无边相连,则删除该节点,从而形成流量图G2;
(4)通过步骤(3)中时间窗口的滑动,从而生成一系列的流量图,通过对流量图进行对比分析,可得出网络流量的动态变化特性。
2.根据权利要求1所述的基于时间滑动窗口的互联网流量建模方法,其特征在于,
步骤(1)中,每条所述流记录的内容包括发生时间、源和目的IP地址、源和目的端口、包数及字节数和应用类型。
3.根据权利要求1所述的基于时间滑动窗口的互联网流量建模方法,其特征在于,
步骤(1)中,在固定网络中,所述流量监控设备可安装在接入网和骨干网之间的链路上;
在移动网络中,所述流量监控设备可安装在GPRS网络中SGSN和GGSN之间的链路上;
通过这些链路的所有流信息均被所述流量监控设备记录和分析。
4.根据权利要求1所述的基于时间滑动窗口的互联网流量建模方法,其特征在于,
步骤(3)中,可通过流量图的度分布和强度分布的幂指数来确定窗口大小W。
5.根据权利要求1所述的基于时间滑动窗口的互联网流量建模方法,其特征在于,
在P2P流量测试中,所述窗口大小W设为60分钟。
6.根据权利要求1所述的基于时间滑动窗口的互联网流量建模方法,其特征在于,
步骤(3)中,通过流持续时间的经验值或流量图的重边比例来确定滑动时间间隔τ。
7.根据权利要求1所述的基于时间滑动窗口的互联网流量建模方法,其特征在于,
在P2P流量测试中,所述滑动时间间隔τ设为10分钟。
CN201410425563.5A 2014-08-27 2014-08-27 一种基于时间滑动窗口的互联网流量建模方法 Pending CN105376105A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410425563.5A CN105376105A (zh) 2014-08-27 2014-08-27 一种基于时间滑动窗口的互联网流量建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410425563.5A CN105376105A (zh) 2014-08-27 2014-08-27 一种基于时间滑动窗口的互联网流量建模方法

Publications (1)

Publication Number Publication Date
CN105376105A true CN105376105A (zh) 2016-03-02

Family

ID=55377932

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410425563.5A Pending CN105376105A (zh) 2014-08-27 2014-08-27 一种基于时间滑动窗口的互联网流量建模方法

Country Status (1)

Country Link
CN (1) CN105376105A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106888107A (zh) * 2016-06-08 2017-06-23 阿里巴巴集团控股有限公司 一种滑动窗口业务数据确定方法及装置
CN108199910A (zh) * 2017-12-07 2018-06-22 南京富士通南大软件技术有限公司 一种动态绘制网络流量速率图形的方法
CN110557294A (zh) * 2019-09-25 2019-12-10 南昌航空大学 一种基于网络变化度的psn网络的时间切片方法
CN111095868A (zh) * 2017-09-12 2020-05-01 华为技术有限公司 软件定义网络中的数据流量管理
CN111614514A (zh) * 2020-04-30 2020-09-01 北京邮电大学 一种网络流量识别方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102088403A (zh) * 2010-11-10 2011-06-08 中国人民解放军信息工程大学 一种网络链路动态带宽的计算方法及系统
US20130136000A1 (en) * 2011-11-29 2013-05-30 Hughes Networks Systems, Llc Method and system for controlling tcp traffic with random early detection and window size adjustments

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102088403A (zh) * 2010-11-10 2011-06-08 中国人民解放军信息工程大学 一种网络链路动态带宽的计算方法及系统
US20130136000A1 (en) * 2011-11-29 2013-05-30 Hughes Networks Systems, Llc Method and system for controlling tcp traffic with random early detection and window size adjustments

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
KE YU等: "Using traffic flow data to analyze the large-scale social networking behavior", 《16TH INTERNATIONAL SYMPOSIUM ON WIRELESS PERSONAL MULTIMEDIA COMMUNICATIONS (WPMC)》 *
XINYU ZHANG等: "Analysis of Internet flow graph with high-degree nodes based on complex network theory", 《3RD IEEE INTERNATIONAL CONFERENCE ON NETWORK INFRASTRUCTURE AND DIGITAL CONTENT (IC-NIDC)》 *
梁昇等: "基于统计的网络流量异常检测模型", 《计算机工程》 *
赖军等: "挖掘滑动时间衰减窗口中网络流频繁项集", 《计算机应用》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106888107A (zh) * 2016-06-08 2017-06-23 阿里巴巴集团控股有限公司 一种滑动窗口业务数据确定方法及装置
CN106888107B (zh) * 2016-06-08 2019-11-22 阿里巴巴集团控股有限公司 一种滑动窗口业务数据确定方法及装置
CN111095868A (zh) * 2017-09-12 2020-05-01 华为技术有限公司 软件定义网络中的数据流量管理
CN108199910A (zh) * 2017-12-07 2018-06-22 南京富士通南大软件技术有限公司 一种动态绘制网络流量速率图形的方法
CN110557294A (zh) * 2019-09-25 2019-12-10 南昌航空大学 一种基于网络变化度的psn网络的时间切片方法
CN111614514A (zh) * 2020-04-30 2020-09-01 北京邮电大学 一种网络流量识别方法及装置
CN111614514B (zh) * 2020-04-30 2021-09-24 北京邮电大学 一种网络流量识别方法及装置

Similar Documents

Publication Publication Date Title
CN105376105A (zh) 一种基于时间滑动窗口的互联网流量建模方法
Tayeh et al. A distributed real-time data prediction and adaptive sensing approach for wireless sensor networks
CN109495317B (zh) 数据网流量预测方法及装置
Munjal et al. Smooth: a simple way to model human mobility
CN104376005B (zh) 软件心跳机制信令接入探针用户详单处理方法及系统
Jian et al. Beta/M/1 model for machine type communication
CN104463351A (zh) 基于电力业务需求的通信带宽预测方法及装置
CN104168131A (zh) 一种基于组播通信的电力调度交换网的流量生成方法
CN114039918A (zh) 一种信息年龄优化方法、装置、计算机设备及存储介质
CN109413683A (zh) 一种获取发射概率、转移概率以及序列定位的方法和装置
CN109840720A (zh) 车联网社区动态演化方法
CN105577473B (zh) 一种基于网络流量模型的多业务流量生成系统
CN106850253A (zh) 一种基于多状态网络的传输时间可靠性测量的方法
CN103259731B (zh) 一种基于开/关源模型的网络关键节点自相似流量生成简化方法
CN103944748A (zh) 基于遗传算法的网络关键节点的自相似流量生成简化方法
Hao et al. Study of a traffic model based on adaptive chaotic mapping for mMTC services
Fras et al. Estimating the parameters of measured self similar traffic for modeling in OPNET
Li et al. Predicting internet of things data traffic through LSTM and autoregressive spectrum analysis
Donthi Study of delay and loss behavior of Internet switch-Markovian modelling using circulant Markov modulated Poisson process (CMMPP)
Tomaras Crowdsourcing techniques for smart urban mobility
Li et al. Gamma-modulated Wavelet model for Internet of Things traffic
Arfeen et al. Fractal renewal process based analysis of emerging network traffic in access networks
Czachórski et al. Delays in IP routers, a Markov model
Karimov et al. Models of network processes for describing operation of network protection tools
CN110505087A (zh) 一种量子保密通信网络的模拟方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160302