CN111030869B - 一种网络流量的预测方法及预测装置 - Google Patents
一种网络流量的预测方法及预测装置 Download PDFInfo
- Publication number
- CN111030869B CN111030869B CN201911327866.2A CN201911327866A CN111030869B CN 111030869 B CN111030869 B CN 111030869B CN 201911327866 A CN201911327866 A CN 201911327866A CN 111030869 B CN111030869 B CN 111030869B
- Authority
- CN
- China
- Prior art keywords
- sequence
- sub
- network traffic
- period
- network flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000012549 training Methods 0.000 claims description 43
- 230000001932 seasonal effect Effects 0.000 claims description 33
- 230000006870 function Effects 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 21
- 230000000694 effects Effects 0.000 claims description 19
- 230000001186 cumulative effect Effects 0.000 claims description 17
- 238000005315 distribution function Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 10
- 238000009827 uniform distribution Methods 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 239000000654 additive Substances 0.000 claims description 6
- 230000000996 additive effect Effects 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 2
- 238000013461 design Methods 0.000 description 29
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 238000010295 mobile communication Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请公开了一种网络流量的预测方法及预测装置,该方法包括:预测装置根据出口网关设备在第一时间内的历史网络流量序列训练模型库中预存的各预测模型,得到第一时段之后的第二时段的预测网络流量序列;基于第二时段的实际网络流量序列和预测网络流量序列之间的对比结果,判断预测网络流量序列不满足预期目标时,根据网络流量误差值大于预设阈值的第二时段中的至少一个子时段的实际网络流量更新至少一个子时段的预测模型。通过这种方式,预测装置可以根据不同子时段对应的历史网络流量,训练对应子时段的预测模型,从而可以提高预测装置预测出口网关设备的网络流量的准确性,满足了用户和运营商的实际使用需求。
Description
技术领域
本申请涉及机器学习及大数据结合的技术领域,尤指一种网络流量的预测方法及预测装置。
背景技术
用户的上网体验与网络设备的流量负载以及网络设备的性能息息相关,若带宽达到了网络设备的性能瓶颈,则会对用户体验造成影响。随着网络规模和互联网应用的快速增长,预测网络设备的流量或带宽使用的变化趋势,在到达网络设备性能瓶颈前做出预警,对用户整体的网络规划和网络升级有着重要的意义。
传统的业务流量预测工作,通常采用线性规划算法,但是网络流量通常不是简单的线性增长,而是呈现显著的周期性的变化,且伴随着可能有潜在规律的突发流量,特别是节假日期间,往往会出现突升或突降,使得预测结果与实际网络流量偏差较大,预测的网络流量误差较大,无法满足用户和运营商的实际使用需求。
现有的网络流量预测方案中,通常使用单一的预测模型对网络流量进行预测,得到不同时段的网络流量的预测结果。但是,由于现在方案中使用单一的预测模型对网络流量进行预测,导致了预测结果的准确性较差。
发明内容
本申请实施例提供一种网络流量的预测方法,用以提高网络流量的预测结果的准确性。
第一方面,本申请实施例提供一种网络流量的预测方法,包括:
按照时间先后顺序对出口网关设备在第一时段内出口的各个历史网络流量进行排列,得到历史网络流量序列;
根据所述历史网络流量序列训练模型库中预存的各预测模型,根据训练后的各预测模型预测所述第一时段之后的第二时段的网络流量,得到所述第二时段的预测网络流量序列;所述第二时段的时长所述第一时段的时长;
基于所述第二时段的实际网络流量序列和所述预测网络流量序列之间的对比结果,判断所述预测网络流量序列是否满足预期目标;
若所述预测网络流量序列满足所述预期目标,则输出所述预测网络流量序列;若所述预测网络流量序列不满足所述预期目标,则根据所述对比结果对所述第二时段中的各个子时段的网络流量误差进行分析,确定网络流量误差值大于预设阈值的至少一个子时段,根据所述至少一个子时段的实际网络流量更新所述至少一个子时段的预测模型;所述网络流量误差值为预测网络流量与实际网络流量之间的误差值。
在一种可能的设计中,按照时间先后顺序对出口网关设备在第一时段内出口的各个历史网络流量进行排列,包括:
根据最大值滤波对所述各个历史网络流量进行预处理;
按照时间先后顺序将经过预处理后的各个历史网络流量进行排列。
在一种可能的设计中,根据所述至少一个子时段的实际网络流量更新所述至少一个子时段的预测模型之后,所述方法还包括:
将更新后的所述至少一个子时段的预测模型加入所述模型库中。
在一种可能的设计中,输出所述预测网络流量序列之后,所述方法还包括:
若根据所述预测网络流量序列确定所述出口网关设备在所述各个子时段中的第一子时段的网络流量超出所述出口网关设备能够负载的最大网络流量,则输出预警信息;所述预警信息用于提示所述出口网关设备将在所述第一子时段到达网络流量的负载瓶颈。
在一种可能的设计中,基于所述对比结果,判断所述预测网络流量序列是否满足预期目标,包括:
获取预先设置的衡量网络流量误差的预设规则;
根据所述预设规则处理所述对比结果,得到所述预测网络流量序列对应的网络流量误差值;
判断所述网络流量误差值是否处于预设的网络流量误差范围内。
在一种可能的设计中,根据所述历史网络流量序列训练模型库中预存的各预测模型,根据训练后的各预测模型预测第二时段的网络流量,得到所述第二时段的预测网络流量序列,包括:
根据所述各预测模型对应的子时段切分所述历史网络流量序列,得到至少一个历史网络流量子序列;其中,所述各预测模型对应的子时段构成所述第一时段;
根据所述至少一个历史网络流量子序列中的每个历史网络流量子序列训练对应的预测模型,得到所述各预测模型的最佳参数;
将所述各预测模型的最佳参数和对应的子时段的选定时刻输入所述各预测模型中,计算得到所述各个子时段对应的预测网络流量子序列;
合并各个预测网络流量子序列,得到所述第二时段的预测网络流量序列。
在一种可能的设计中,根据所述至少一个历史网络流量子序列中的每个历史网络流量子序列训练对应的预测模型,包括:
采用加性方法分解所述每个历史网络流量子序列对应的预测模型,得到所述每个历史网络流量子序列对应的预测模型的五个组成部分:流量总体趋势Ti(t)、流量季节性效应Si(t)、流量假日效应Hi(t)、流量突发效应Pi(t)、设备噪音Ri(t);其中,i表示所述每个历史网络流量子序列对应的序号,t表示所述每个历史网络流量子序列对应的子时段中的选定时刻;
根据所述每个历史网络流量子序列分别训练所述五个组成部分。
在一种可能的设计中,根据所述每个历史网络流量子序列训练所述流量突发效应Pi(t),包括:
根据所述各个历史网络流量统计所述每个历史网络流量子序列中的每个数据粒度的误差分布,得到突发网络流量的经验累积分布函数;所述突发网络流量表示所述每个历史网络流量子序列对应的子时段内瞬时升高的网络流量;
根据所述经验累积分布函数,生成随机数pi,d,h(t);其中,d表示所述每个历史网络流量子序列中对应的一周内的每天对应的序号,h表示一天中的每个数据粒度对应的序号;
对所述经验累积分布函数进行逆变换,得到所述随机数pi,d,h(t)对应的Pi(t);
将所述Pi(t)作为所述每个历史网络流量子序列对应的子时段中的网络流量突发值的预测;
其中,Pi(t)=ECDF-1(pi,d,h(t)),pi,d,h(t)~U(0,1);ECDF-1(pi,d,h(t))表示对pi,d,h(t)进行逆变换,pi,d,h(t)~U(0,1)表示pi,d,h(t)服从(0,1)均匀分布。
在一种可能的设计中,根据所述每个历史网络流量子序列训练所述流量季节性效应Si(t),包括:
将所述流量季节性效应Si(t)分为以周为单位的流量季节性效应Si,w(t)和以天为单位的流量季节性效应Si,d(t);其中, w表示所述每个历史网络流量子序列中对应的一周对应的序号,N1与所述一周对应的序号的大小相等,N2与所述一周中的每天对应的序号的大小相等,a1、a2、b1、b2为常数,T1的取值为7,T2的取值为1;
根据所述每个历史网络流量子序列分别训练流量季节性效应Si,w(t)和流量季节性效应Si,d(t)。
在一种可能的设计中,所述流量总体趋势Ti(t)为连续的分段函数,其中,每段函数Ti,j(t)=a3t+b3,其中,a3、b3为常数,j表示连续的分段函数中的每段函数对应的序号;
所述流量假日效应Hi(t)=kz(t),其中,k表示每个节日的权重;z(t)用于判断所述每个历史网络流量子序列对应的当前日期是否为节假日;
所述设备噪音Ri(t)=βγmax,γmax表示历史设备噪音中的最大值,β为服从(0,1)均匀分布的常数。
第二方面,本申请实施例提供一种预测装置,包括:
处理单元,用于按照时间先后顺序对出口网关设备在第一时段内出口的各个历史网络流量进行排列,得到历史网络流量序列;
训练单元,用于根据所述历史网络流量序列训练模型库中预存的各预测模型,根据训练后的各预测模型预测所述第一时段之后的第二时段的网络流量,得到所述第二时段的预测网络流量序列;所述第二时段的时长等于所述第一时段的时长;
判断单元,用于基于所述第二时段的实际网络流量序列和所述预测网络流量序列之间的对比结果,判断所述预测网络流量序列是否满足预期目标;
输出单元,用于在所述判断单元确定所述预测网络流量序列满足所述预期目标时,输出所述预测网络流量序列;
所述处理单元,还用于在所述判断单元确定所述预测网络流量序列不满足所述预期目标时,根据所述对比结果对所述第二时段中的各个子时段的网络流量误差进行分析,确定网络流量误差值大于预设阈值的至少一个子时段;所述网络流量误差值为预测网络流量与实际网络流量之间的误差值;
所述训练单元,还用于根据所述至少一个子时段的实际网络流量更新所述至少一个子时段的预测模型。
在一种可能的设计中,所述处理单元具体用于:
根据最大值滤波对所述各个历史网络流量进行预处理;
按照时间先后顺序将经过预处理后的各个历史网络流量进行排列。
在一种可能的设计中,所述处理单元还用于:
将更新后的所述至少一个子时段的预测模型加入所述模型库中。
在一种可能的设计中,所述输出单元还用于:
若根据所述预测网络流量序列确定所述出口网关设备在所述各个子时段中的第一子时段的网络流量超出所述出口网关设备能够负载的最大网络流量,则输出预警信息;所述预警信息用于提示所述出口网关设备将在所述第一子时段到达网络流量的负载瓶颈。
在一种可能的设计中,所述处理单元具体用于:
获取预先设置的衡量网络流量误差的预设规则;
根据所述预设规则处理所述对比结果,得到所述预测网络流量序列对应的网络流量误差值;
所述判断单元具体用于:
判断所述网络流量误差值是否处于预设的网络流量误差范围内。
在一种可能的设计中,所述训练单元具体用于:
根据所述各预测模型对应的子时段切分对所述历史网络流量序列,得到至少一个历史网络流量子序列;其中,所述各预测模型对应的子时段构成所述第一时段;
根据所述至少一个历史网络流量子序列中的每个历史网络流量子序列训练对应的预测模型,得到所述各预测模型的最佳参数;
将所述各预测模型的最佳参数和对应的子时段的选定时刻输入所述各预测模型中,计算得到所述各个子时段对应的预测网络流量子序列;
合并各个预测网络流量子序列,得到所述第二时段预测网络流量序列。
在一种可能的设计中,所述训练单元具体用于:
采用加性方法分解所述每个历史网络流量子序列对应的预测模型,得到所述每个历史网络流量子序列对应的预测模型的五个组成部分:流量总体趋势Ti(t)、流量季节性效应Si(t)、流量假日效应Hi(t)、流量突发效应Pi(t)、设备噪音Ri(t);其中,i表示所述每个历史网络流量子序列对应的序号,t表示所述每个历史网络流量子序列对应的子时段的选定时刻;
根据所述每个历史网络流量子序列分别训练所述五个组成部分。
在一种可能的设计中,所述训练单元具体用于:
根据所述各个历史网络流量统计所述每个历史网络流量子序列中的每个数据粒度的误差分布,得到突发网络流量的经验累积分布函数;所述突发网络流量表示所述每个历史网络流量子序列对应的子时段内瞬时升高的网络流量;
根据所述经验累积分布函数,生成随机数pi,d,h(t);其中,d表示所述每个历史网络流量子序列中对应的一周内的每天对应的序号,h表示一天中的每个数据粒度对应的序号;
对所述经验累积分布函数进行逆变换,得到所述随机数pi,d,h(t)对应的Pi(t);
将所述Pi(t)作为所述每个历史网络流量子序列对应的子时段中的网络流量突发值的预测;
其中,Pi(t)=ECDF-1(pi,d,h(t)),pi,d,h(t)~U(0,1);ECDF-1(pi,d,h(t))表示对pi,d,h(t)进行逆变换,pi,d,h(t)~U(0,1)表示pi,d,h(t)服从(0,1)均匀分布。
在一种可能的设计中,所述训练单元具体用于:
将所述流量季节性效应Si(t)分为以周为单位的流量季节性效应Si,w(t)和以天为单位的流量季节性效应Si,d(t);其中, w表示所述每个历史网络流量子序列中对应的一周对应的序号,N1与所述一周对应的序号的大小相等,N2与所述一周中的每天对应的序号的大小相等,a1、a2、b1、b2为常数,T1的取值为7,T2的取值为1;
根据所述每个历史网络流量子序列分别训练流量季节性效应Si,w(t)和流量季节性效应Si,d(t)。
在一种可能的设计中,所述流量总体趋势Ti(t)为连续的分段函数,其中,每段函数Ti,j(t)=a3t+b3,其中,a3、b3为常数,j表示连续的分段函数中的每段函数对应的序号;
所述流量假日效应Hi(t)=kz(t),其中,k表示每个节日的权重;z(t)用于判断所述每个历史网络流量子序列对应的当前日期是否为节假日;
所述设备噪音Ri(t)=βγmax,γmax表示历史设备噪音中的最大值,β为服从(0,1)均匀分布的常数。
第三方面,本申请实施例提供一种预测装置,应用于出口网关设备出口的网络流量的预测,所述预测装置包括:至少一个处理器和存储器;其中,所述存储器用于存储一个或多个计算机程序;当所述存储器存储的一个或多个计算机程序被所述至少一个处理器执行时,使得所述预测装置能够执行上述第一方面或上述第一方面的任意一种可能的设计的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得所述计算机能够执行上述第一方面或上述第一方面的任意一种可能的设计的方法。
本申请有益效果如下:
本申请实施例的技术方案中,预测装置按照时间先后顺序对出口网关设备在第一时段内出口的各个历史网络流量进行排列,得到历史网络流量序列;根据历史网络流量序列训练模型库中预存的各预测模型,根据训练后的各预测模型预测第一时段之后的第二时段的网络流量,得到第二时段的预测网络流量序列;第二时段的时长等于第一时段的时长;基于第二时段的实际网络流量序列和所述预测网络流量序列之间的对比结果,判断预测网络流量序列是否满足预期目标;若预测网络流量序列满足预期目标,则输出预测网络流量序列;若预测网络流量序列不满足预期目标,则根据对比结果对第二时段中的各个子时段的网络流量误差进行分析,确定网络流量误差值大于预设阈值的至少一个子时段,根据至少一个子时段的实际网络流量更新至少一个子时段的预测模型;网络流量误差值为预测网络流量与实际网络流量之间的误差值。通过这种方式,预测装置可以根据不同子时段对应的历史网络流量,训练对应子时段的预测模型,从而可以提高预测装置预测出口网关设备的网络流量的准确性,进而可以满足用户和运营商的实际使用需求。
附图说明
图1为本申请实施例提供的一种应用场景的示意图;
图2为本申请实施例提供的一种网络流量的预测方法的流程示意图;
图3为本申请实施例提供的一种历史网络流量序列的示意图;
图4为本申请实施例提供的一种预测网络流量序列的示意图;
图5为本申请实施例提供的一种预测装置的结构示意图;
图6为本申请实施例提供的一种预测装置的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
附图中各部件的形状和大小不反映真实比例,目的只是示意说明本申请内容。
以下,对本申请实施例中的部分用语进行解释说明,以便于本领域技术人员理解。
(1)本申请实施例中,出口网关设备为核心网关设备,比如一个区域(例如城市、城镇或者一个小区等)的网关设备,本申请实施例不限定。
(2)本申请实施例中,网络流量的预测装置可以是服务器,或者其它装置,本申请实施例不限定。
(3)本申请实施例中,任何可以使用网络流量进行各项工作(播放视频、网页浏览等)的终端,均可以是移动通信终端,例如笔记本电脑、网络电视、移动终端(比如手机、平板)等等,本申请实施例不限定。
(4)本申请实施例中,“第一”、“第二”是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的保护。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了本领域技术人员便于理解本申请实施例中的技术方案,下面介绍本申请实施例的应用场景。
示例性的,请参考图1所示,为本申请实施例提供的一种应用场景的示意图。如图1所示,该应用场景中包括:出口网关设备100、预测装置101和各种移动通信终端(比如笔记本电脑1021、网络电视1022、移动终端1023等)。其中,出口网关设备100和各种移动通信终端、预测装置101进行通信。
请继续参考图1所示,出口网关设备100出口网络流量供给各种移动通信终端使用。一般,出口网关设备100出口的网络流量是根据各种移动通信终端的所需进行的。因此,出口网关设备100出口的网络流量是根据各种移动通信终端的需求变化而变化。比如,在周末或者节假日,绝大多数用户在休息时,使用移动通信终端进行娱乐活动(例如播放视频)的情况比较频繁。因此,一般而言,出口网关设备100在周末或者节假日出口的网络流量相较于在工作日出口的网络流量比较大。因此,需要对出口网关设备100出口的网络流量进行预测,以满足用户和运营商的实际使用需求。
由前述内容可知,在现有方案中,由于现在方案中使用单一的预测模型对网络流量进行预测,导致网络流量的预测结果的准确性较差。
为了解决该问题,在本申请实施例中,预测装置101可以获取出口网关设备100在第一时段内出口的各个历史网络流量,根据获取的各个历史网络流量训练模型库中预测的各预测模型,得到出口网关设备100在第二时段内出口的网络流量的预测结果。其中,第二时段位于第一时段之后,且第二时段的时长等于第一时段的时长。之后,出口网关设备100可以根据该预测结果出口网络流量,从而可以满足用户和运营商的实际使用需求。
比如,预测装置101可以按照时间先后顺序对获取的各个历史网络流量进行排列,得到历史网络流量序列。之后,预测装置101获取模型库中预存的各个预测模型,根据历史网络流量序列训练各预测模型,根据训练后的各预测模型预测第一时段之后的第二时段的网络流量,得到第二时段的预测网络流量序列(即预测结果)。预测装置101可以根据第二时段的实际网络流量序列和预测网络流量序列之间的对比结果,判断预测网络流量序列是否满足预期目标。若预测网络流量序列满足预期目标,预测装置101则输出预测网络流量序列,之后,出口网关设备100可以根据预测网络流量序列出口网络流量。
可选地,若预测网络流量序列不满足预期目标,预测装置101则可以根据对比结果对第二时段中的各个子时段的网络流量误差进行分析,确定网络流量误差值大于预设阈值的至少一个子时段,之后,根据至少一个子时段的实际网络流量更新至少一个子时段的预测模型。其中,网络流量误差值为预测网络流量与实际网络流量之间的误差值。之后,预测装置101可以根据至少一个子时段的实际网络流量,重新训练至少一个子时段更新后的预测模型,得到至少一个子时段的预测网络流量,从而解决了至少一个子时段内仍存在预测网络流量与实际网络流量偏差较大的问题。
在本申请实施例中,预测装置可以通过出口网关设备在第一时段内出口的各个历史网络流量对模型库中预存的各预测模型进行训练,预测出口网关设备在第二时段内出口的网络流量,相较于现有方案中使用单一的预测模型预测出口网关设备出口的网络流量,提高了网络流量的预测结果的准确性。另外,预测装置还可以进行网络流量误差分析,并更新网络流量误差值大于预设阈值的第二时段中的至少一个子时段的预测模型,解决了网络流量存在误差的子时段内仍存在预测网络流量与实际网络流量偏差较大的问题,进一步的提高了网络流量的预测结果的准确性。
下面具体介绍本申请实施例中预测装置预测出口网关设备出口的网络流量的过程。
示例性的,请参考图2所示,为本申请实施例提供的一种网络流量的预测方法的流程示意图。其中,该方法可以应用于上述应用场景或者与上述应用场景类似的应用场景中。图2中以执行主体为预测装置为例。如图2所示,该方法流程包括:
S201、按照时间先后顺序对出口网关设备在第一时段内出口的各个历史网络流量进行排列,得到历史网络流量序列。
可选地,第一时段可以是一天、一周、一个月、一个季度和一年等。示例性的,请参考图3所示,预测装置可以按照时间先后顺序对各个历史网络流量进行排序得到历史网络流量序列。
在具体的实现过程中,由于突发网络流量(瞬时升高的网络流量)往往可能会较靠近(即逼近或者超出)出口网关设备所承载的最大网络流量。为了更好的预测到出口网络设备的最大网络流量。在本申请实施例中,当预测装置获取出口网关设备在第一时段内出口的各个历史网络流量后,可以根据最大值滤波对各个历史网络流量进行预处理,并按照时间先后顺序将经过预处理后的各个历史网络流量进行排列,得到历史网络流量序列。比如,根据最大值滤波滤出每个数据粒度(例如1个小时)中历史网络流量大于预先设定的阈值的历史网络流量,然后,按照每个数据粒度的先后顺序将滤出的各个历史网络流量进行排序,得到历史网络流量序列。
在本申请实施例中,预测装置可以根据最大值滤波对各个历史网络流量进行预处理,并按照时间先后顺序将经过预处理后的各个历史网络流量进行排列,得到历史网络流量序列,从而使得预测装置在后续根据该历史网络流量序列训练模型库中的各预测模型得到第二时段的预测网络流量序列的过程中,能够更好的预测出出口网关设备出口的最大网络流量,以使技术人员可以通过预测网络流量序列可以知道出口网关设备在未来需要出口的网络流量是否达到出口网关设备所能承载的最大网络流量,以便技术人员可以更好的预防出口网关设备在未来需要出口的网络流量达到出口网关设备所能承载的最大网络流量的情况,从而可以满足用户和运营商的实际使用需求。
S202、根据历史网络流量序列训练模型库中预存的各预测模型,根据训练后的各预测模型预测第一时段之后的第二时段的网络流量,得到第二时段的预测网络流量序列;第二时段的时长等于第一时段的时长。
可选地,模型库可以存储于预测装置中,或者是存储于与预测装置连接的其它设备(例如服务器)中,本申请实施例不限定。
在具体的实现过程中,在初始使用模型库时,模型库预存有一个预测模型,即预测装置在初始使用模型库时,可以根据历史网络流量序列训练该预测模型。预测装置在后续使用模型库时,模型库中可以增添新的预测模型,且每个预测模型可以对应不同的子时段(如何添加新的预测模型在下文介绍)。
可选地,预测装置得到历史网络流量序列后,可以根据各预测模型对应的子时段,对历史网络流量序列进行切分,得到至少一个历史网络流量子序列。比如,请继续参考图3所示,历史网络流量序列可以切分为Ts_h1、Ts_h2、Ts_h3等历史网络流量子序列。其中,各预测模型对应的子时段构成第一时段,且各预测模型中的每个预测模型对应的子时段可以相同也可以不相同,本发明实施例不限定。
之后,预测装置可以根据至少一个历史网络流量子序列中的每个历史网络流量子序列训练对应的预测模型,得到各预测模型的最佳参数(下文介绍),并将各预测模型的最佳参数和对应的子时段的选定时刻输入各预测模型中,计算得到各个子时段对应的预测网络流量子序列。
示例性的,请结合图3-4所示,历史网络流量子序列Ts_h1对应的预测网络流量子序列为Ts_f1、历史网络流量子序列Ts_h2对应的预测网络流量子序列为Ts_f2、历史网络流量子序列Ts_h3对应的预测网络流量子序列为Ts_f3,等等。如图4所示,预测装置可以将各个预测网络流量子序列进行合并,得到第二时段的预测网络流量序列。
需要说明的是,第一时段的子时段与第二时段的子时段一一对应且相同,且第一时段和第二时段的子时段可以根据实际需求进行设置,本申请实施例不限定。比如,当第一时段和第二时段为一周时,第一时段中的某个子时段为一天时,第二时段中与该子时段对应的子时段则为一天,或者该子时段为白天半天时,第二时段中与该子时段对应的子时段则为白天半天,等等。
在本申请实施例中,预测装置可以根据每个预测模型对应的子时段切分历史网络流量序列,得到至少一个历史网络流量子序列;根据至少一个历史网络流量子序列中的每个历史网络流量子序列训练对应的预测模型,得到各预测模型的最佳参数;将各预测模型的最佳参数和对应的子时段的选定时刻输入各预测模型中,计算得到各个子时段对应的预测网络流量子序列;预测装置将各个预测网络流量子序列进行合并,得到第二时段的预测网络流量序列。通过这种方式,预测装置可以根据不同子时段对应的历史网络流量,训练对应子时段的预测模型,从而可以提高预测装置预测出口网关设备的网络流量的准确性,进而可以满足用户和运营商的实际使用需求。
在具体的实现过程中,由于出口网关设备出口的网络流量具有突发性,且受到节假日、季节等影响,另外,在预测出口网关设备的网络流量时,有可能会受到设备噪音的影响。在本申请实施例中,为了避免这些因素影响到预测出口网关设备的网络流量的预测,预测装置在根据至少一个历史网络流量子序列中的每个历史网络流量子序列训练对应的预测模型的过程中,预测装置可以采用加性方法分解每个历史网络流量子序列对应的预测模型,得到每个历史网络流量子序列对应的预测模型的五个组成部分:流量总体趋势Ti(t)、流量季节性效应Si(t)、流量假日效应Hi(t)、流量突发效应Pi(t)、设备噪音Ri(t);其中,i表示每个历史网络流量子序列对应的序号,t表示每个历史网络流量子序列对应子时段的选定时刻。之后,预测装置可以根据每个历史网络流量子序列分别训练五个组成部分。具体地每个预测模型可以表征为:
本申请实施例中,预测装置可以采用加性方法对每个预测模型进行分解,并根据每个历史网络流量子序列分别训练每个预测模型的每个分解部分,从而可以避免网络流量的影响因素影响到出口网关设备的网络流量的预测,提高了预测装置预测出口网关设备的网络流量的准确性,进而可以满足用户和运营商的实际使用需求。
可选地,预测装置在根据每个历史网络流量子序列训练流量突发效应Pi(t)的过程中,可以根据获取到的各个历史网络流量统计每个历史网络流量子序列中的每个数据粒度的误差分布,得到突发网络流量的经验累积分布函数。之后,预测装置可以根据经验累积分布函数,生成随机数pi,d,h(t),即随机数pi,d,h(t)为每个历史网络流量子序列对应的预测模型中的一个最佳参数。预测装置可以对经验累积分布函数进行逆变换,得到随机数pi,d,h(t)对应的Pi(t),将Pi(t)作为每个历史网络流量子序列对应的子时段中的网络流量突发值的预测。其中,Pi(t)可以表征为:
Pi(t)=ECDF-1(pi,d,h(t)),pi,d,h(t)~U(0,1)
其中,ECDF-1(pi,d,h(t))表示对pi,d,h(t)进行逆变换,pi,d,h(t)~U(0,1)表示pi,d,h(t)服从(0,1)均匀分布,d表示每个历史网络流量子序列中对应的一周内的每天对应的序号,h表示一天中的每个数据粒度对应的序号,突发网络流量表示每个历史网络流量子序列对应的子时段内瞬时升高的网络流量。
在本申请实施例中,预测装置可以根据出口网关设备的历史网络流量统计每个历史网络流量子序列中的每个数据粒度的误差分布,得到突发网络流量的经验累积分布函数,从而使得预测装置根据该经验累积分布函数预测每个历史网络流量子序列对应的子时段中的突发网络流量时,可以提高预测装置预测每个历史网络流量子序列对应的子时段的突发网络流量的准确性,从而可以满足用户和运营商的实际使用需求。
可选地,预测装置在根据每个历史网络流量子序列训练流量季节性效应Si(t)的过程中,可以将流量季节性效应Si(t)分为以周为单位的流量季节性效应Si,w(t)和以天为单位的流量季节性效应Si,d(t)。之后,预测装置可以根据每个历史网络流量子序列分别训练流量季节性效应Si,w(t)和流量季节性效应Si,d(t),得到每个历史网络流量子序列对应的预测模型的最佳参数a1、a2、b1和b2。其中,Si,w(t)可以表征为:
Si,d(t)可以表征为:
其中,w表示每个历史网络流量子序列中对应的一周对应的序号,N1与一周对应的序号的大小相等,N2与一周中的每天对应的序号的大小相等,a1、a2、b1、b2为常数,T1的取值为7,T2的取值为1。
在本申请实施例中,预测装置可以根据每个历史网络流量子序列训练流量季节性效应Si(t),从而可以针对不同子时段的网络流量进行预测,提高了预测装置预测每个历史网络流量子序列对应的子时段的网络流量的准确性,从而可以满足用户和运营商的实际使用需求。
在具体的实现过程中,由于网络流量不是呈现周期性变化的。因此,在本申请实施例中,流量总体趋势Ti(t)设置连续的分段函数,其中,每段函数Ti,j(t)=a3t+b3,用于对不同子时段的网络流量进行预测。其中,a3、b3为常数,j表示连续的分段函数中的每段函数对应的序号。当预测装置根据每个历史网络流量子序列训练流量总体趋势Ti(t)后,可以得到每个历史网络流量子序列对应的预测模型的最佳参数a3、b3。
在本申请实施例中,预测装置可以根据每个历史网络流量子序列训练流量总体趋势Ti(t),从而可以针对不同子时段的网络流量进行预测,避免了网络流量的变化影响到网络流量的预测,提高了预测装置预测不同子时段的网络流量的准确性,从而可以满足用户和运营商的实际使用需求。
在具体的实现过程中,由于网络流量在节假日往往比较高,因此,在本申请实施例中,设置流量假日效应Hi(t)=kz(t),用于预测节假日的网络流量,其中,k表示每个节日的权重;z(t)用于判断每个历史网络流量子序列对应的当前日期是否为节假日。当预测装置根据每个历史网络流量子序列训练流量假日效应Hi(t)=kz(t)后,可以得到每个历史网络流量子序列对应的预测模型的最佳参数k。通过这种方式,可以避免节假日因素影响到网络流量的预测,提高了预测装置预测每个历史网络流量子序列对应的子时段的网络流量的准确性,从而可以满足用户和运营商的实际使用需求。
在具体的实现过程中,由于设备噪音有可能会影响到网络流量的预测,因此,在本申请实施例中,设置设备噪音Ri(t)=βγmax,γmax表示历史设备噪音中的最大值,β为服从(0,1)均匀分布的常数。当预测装置根据每个历史网络流量子序列训练设备噪音Ri(t)=βγmax后,可以得到每个历史网络流量子序列对应的预测模型的最佳参数β。通过这种方式,可以避免设备噪音影响到网络流量的预测,提高了预测装置预测每个子时段的网络流量的准确性,从而可以满足用户和运营商的实际使用需求。
S203、基于第二时段的实际网络流量序列和预测网络流量序列之间的对比结果,判断预测网络流量序列是否满足预期目标;若预测网络流量序列满足预期目标,执行S204,若预测网络流量序列不满足预期目标,执行S205-S206。
可选地,为了判断第二时段的预测网络流量序列是否存在误差,预测装置可以将第二时段的实际网络流量序列和预测网络流量序列进行对比,得到第二时段的实际网络流量序列和预测网络流量序列之间的对比结果。预测装置根据该对比结果即可确定第二时段的预测网络流量序列是否存在误差。
可选地,预测装置可以预先设置衡量网络流量误差的预设规则。其中,预设规则可以平均绝对百分比误差(Mean Absolute Percentage Error,MAPE),或者是平均绝对偏差(Mean Absolute Deviation,MAD),或者是均方误差(Mean Sequared Eroor,MSE),等等,本申请实施例不限定。
可选地,预测装置可以根据预设规则处理对比结果,得到预测网络流量序列对应的网络流量误差值,之后,预测装置可以判断网络流量误差值是否处于预设的网络流量误差范围内,从而可以确定预测网络流量序列是否满足预期目标。
S204、输出预测网络流量序列。
可选地,预测装置确定预测网络流量序列满足预期目标后,若根据预测网络流量序列,确定出口网关设备在第二时段中的第一子时段的网络流量超出出口网关设备能够负载的最大网络流量,预测装置则可以输出预警信息,用于提示出口网关设备将在第一子时段到达网络流量的负载瓶颈,从可以使得技术人员知道出口网关设备在第一子时段的网络流量超出出口网关设备能够负载的最大网络流量,以便技术人员可以更好的预防出口网关设备在未来需要出口的网络流量达到出口网关设备所能承载的最大网络流量的情况,从而可以满足用户和运营商的实际使用需求。
S205、根据对比结果对第二时段中的各个子时段的网络流量误差进行分析,确定网络流量误差值大于预设阈值的至少一个子时段;其中,网络流量误差值为预测网络流量与实际网络流量之间的误差值。
可选地,当预测装置确定预测网络流量序列不满足预期目标时,预测装置可以根据对比结果对第二时段中的各个子时段的网络流量误差进行分析,确定网络流量误差值大于预设阈值的至少一个子时段。比如,请继续结合图3、4所示,预测装置可以根据对比结果,确定Ts_h3_2对应的子时段的网络流量误差值大于预设阈值。
S206、根据至少一个子时段的实际网络流量更新至少一个子时段的预测模型,返回执行S202。
可选地,当预测装置确定出网络流量误差值大于预设阈值的至少一个子时段后,预测装置可以根据至少一个子时段的实际网络流量更新至少一个子时段的预测模型。比如,请继续结合图3、4所示,预测装置可以根据Ts_f3_2的实际网络流量更新Ts_h3_2对应的子时段的预测模型。即Ts_h3对应的预测模型由一个预测模型变成两个预测模型,例如,Ts_h3_1对应的预测模型为Ts_h3对应的预测模型,Ts_h3_2对应的预测模型为更新后的预测模型。
可选地,预测装置可以将至少一个子时段的更新后的预测模型加入模型库中,返回执行S202,重新对出口网关设备的网络流量进行预测。
在本申请实施例中,预测装置可以不断的更新网络流量误差值大于预设阈值的子时段对应的预测模型,从而通过出口网关设备的历史网络流量训练模型库中的各预测模型预测出口网关设备的网络流量时,可以提高预测出口网关设备的准确性,从而可以满足用户和运营商的实际使用需求。
通过以上描述可知,本申请实施例的技术方案中,预测装置按照时间先后顺序对出口网关设备在第一时段内出口的各个历史网络流量进行排列,得到历史网络流量序列;根据历史网络流量序列训练模型库中预存的各预测模型,根据训练后的各预测模型预测第一时段之后的第二时段的网络流量,得到第二时段的预测网络流量序列;第二时段的时长等于第一时段的时长;基于第二时段的实际网络流量序列和所述预测网络流量序列之间的对比结果,判断预测网络流量序列是否满足预期目标;若预测网络流量序列满足预期目标,则输出预测网络流量序列;若预测网络流量序列不满足预期目标,则根据对比结果对第二时段中的各个子时段的网络流量误差进行分析,确定网络流量误差值大于预设阈值的至少一个子时段,根据至少一个子时段的实际网络流量更新至少一个子时段的预测模型;网络流量误差值为预测网络流量与实际网络流量之间的误差值。通过这种方式,预测装置可以根据不同子时段对应的历史网络流量,训练对应子时段的预测模型,从而可以提高预测装置预测出口网关设备的网络流量的准确性,进而可以满足用户和运营商的实际使用需求。
基于同一发明构思下,本申请实施例提供了一种预测装置。请参考图5所示,为本申请实施例提供的一种预测装置的结构示意图。
如图5所示,预测装置500包括:
处理单元501,用于按照时间先后顺序对出口网关设备在第一时段内出口的各个历史网络流量进行排列,得到历史网络流量序列;
训练单元502,用于根据历史网络流量序列训练模型库中预存的各预测模型,根据训练后的各预测模型预测第一时段之后的第二时段的网络流量,得到第二时段的预测网络流量序列;第二时段的时长等于第一时段的时长;
判断单元503,用于基于第二时段的实际网络流量序列和预测网络流量序列之间的对比结果,判断预测网络流量序列是否满足预期目标;
输出单元504,用于在判断单元503确定预测网络流量序列满足预期目标时,输出预测网络流量序列;
处理单元501,还用于在判断单元503确定预测网络流量序列不满足预期目标时,根据对比结果对第二时段中的各个子时段的网络流量误差进行分析,确定网络流量误差值大于预设阈值的至少一个子时段;网络流量误差值为预测网络流量与实际网络流量之间的误差值;
训练单元502,还用于根据至少一个子时段的实际网络流量更新至少一个子时段的预测模型。
在一种可能的设计中,处理单元501具体用于:
根据最大值滤波对各个历史网络流量进行预处理;
按照时间先后顺序将经过预处理后的各个历史网络流量进行排列。
在一种可能的设计中,处理单元501还用于:
将更新后的至少一个子时段的预测模型加入模型库中。
在一种可能的设计中,输出单元504还用于:
若根据预测网络流量序列确定出口网关设备在各个子时段中的第一子时段的网络流量超出出口网关设备能够负载的最大网络流量,则输出预警信息;预警信息用于提示出口网关设备将在第一子时段到达网络流量的负载瓶颈。
在一种可能的设计中,处理单元501具体用于:
获取预先设置的衡量网络流量误差的预设规则;
根据预设规则处理对比结果,得到预测网络流量序列对应的网络流量误差值;
判断单元503具体用于:
判断网络流量误差值是否处于预设的网络流量误差范围内。
在一种可能的设计中,训练单元502具体用于:
根据各预测模型对应的子时段切分历史网络流量序列,得到至少一个历史网络流量子序列;其中,各预测模型对应的子时段构成第一时段;
根据至少一个历史网络流量子序列中的每个历史网络流量子序列训练对应的预测模型,得到各预测模型的最佳参数;
将各预测模型的最佳参数和对应的子时段的选定时刻输入各预测模型中,计算得到各个子时段对应的预测网络流量子序列;
合并各个预测网络流量子序列,得到第二时段的预测网络流量序列。
在一种可能的设计中,训练单元502具体用于:
采用加性方法分解每个历史网络流量子序列对应的预测模型,得到每个历史网络流量子序列对应的预测模型的五个组成部分:流量总体趋势Ti(t)、流量季节性效应Si(t)、流量假日效应Hi(t)、流量突发效应Pi(t)、设备噪音Ri(t);其中,i表示每个历史网络流量子序列对应的序号,t表示每个历史网络流量子序列对应的子时段的选定时刻;
根据每个历史网络流量子序列分别训练五个组成部分。
在一种可能的设计中,训练单元502具体用于:
根据各个历史网络流量统计每个历史网络流量子序列中的每个数据粒度的误差分布,得到突发网络流量的经验累积分布函数;突发网络流量表示每个历史网络流量子序列对应的子时段内瞬时升高的网络流量;
根据经验累积分布函数,生成随机数pi,d,h(t);其中,d表示每个历史网络流量子序列中对应的一周内的每天对应的序号,h表示一天中的每个数据粒度对应的序号;
对经验累积分布函数进行逆变换,得到随机数pi,d,h(t)对应的Pi(t);
将Pi(t)作为每个历史网络流量子序列对应的子时段中的网络流量突发值的预测;
其中,Pi(t)=ECDF-1(pi,d,h(t)),pi,d,h(t)~U(0,1);ECDF-1(pi,d,h(t))表示对pi,d,h(t)进行逆变换,pi,d,h(t)~U(0,1)表示pi,d,h(t)服从(0,1)均匀分布。
在一种可能的设计中,训练单元502具体用于:
将流量季节性效应Si(t)分为以周为单位的流量季节性效应Si,w(t)和以天为单位的流量季节性效应Si,d(t);其中, w表示每个历史网络流量子序列中对应的一周对应的序号,N1与一周对应的序号的大小相等,N2与一周中的每天对应的序号的大小相等,a1、a2、b1、b2为常数,T1的取值为7,T2的取值为1;
根据每个历史网络流量子序列分别训练流量季节性效应Si,w(t)和流量季节性效应Si,d(t)。
在一种可能的设计中,流量总体趋势Ti(t)为连续的分段函数,其中,每段函数Ti,j(t)=a3t+b3,其中,a3、b3为常数,j表示连续的分段函数中的每段函数对应的序号;
流量假日效应Hi(t)=kz(t),其中,k表示每个节日的权重;z(t)用于判断每个历史网络流量子序列对应的当前日期是否为节假日;
设备噪音Ri(t)=βγmax,γmax表示历史设备噪音中的最大值,β为服从(0,1)均匀分布的常数。
本申请实施例中的预测装置500与前述图2所示的网络流量的预测方法是基于同一构思下的发明,通过前述对网络流量的预测方法的详细描述,本领域技术人员可以清楚的了解本实施例中预测装置500的实施过程,所以为了说明书的简洁,在此不再赘述。
基于同一发明构思下,本申请实施例提供了一种预测装置。请参考图6所示,为本申请实施例提供的一种预测装置的结构示意图。
如图6所示,预测装置600包括:
存储器601,用于存储一个或多个计算机指令;
至少一个处理器602,用于读取存储器601中的计算机指令,使得电子设备600能够实现图2所示的实施例中的全部或部分步骤。
可选地,存储器601可以包括高速随机存取存储器,还可以包括非易失存储器,例如磁盘存储器件、闪存器件或其他非易失性固态存储器件等,本申请实施例不作限定。
可选地,处理器602可以是通用的处理器(central processing unit,CPU),或ASIC,或FPGA,也可以是一个或多个用于控制程序执行的集成电路。
在一些实施例中,存储器601和处理器602可以在同一芯片上实现,在另一些实施例中,它们也可以在独立的芯片上分别实现,本申请实施例不作限定。
基于同一发明构思下,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,当计算机指令被计算机执行时,使计算执行上述网络流量的预测方法的步骤。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (13)
1.一种网络流量的预测方法,其特征在于,包括:
按照时间先后顺序对出口网关设备在第一时段内出口的各个历史网络流量进行排列,得到历史网络流量序列;
根据所述历史网络流量序列训练模型库中预存的各预测模型,根据训练后的各预测模型预测所述第一时段之后的第二时段的网络流量,得到所述第二时段的预测网络流量序列;所述第二时段的时长等于所述第一时段的时长;
基于所述第二时段的实际网络流量序列和所述预测网络流量序列之间的对比结果,判断所述预测网络流量序列是否满足预期目标;
若所述预测网络流量序列满足所述预期目标,则输出所述预测网络流量序列;若所述预测网络流量序列不满足所述预期目标,则根据所述对比结果对所述第二时段中的各个子时段的网络流量误差进行分析,确定网络流量误差值大于预设阈值的至少一个子时段,根据所述至少一个子时段的实际网络流量更新所述至少一个子时段的预测模型;所述网络流量误差值为预测网络流量与实际网络流量之间的误差值。
2.如权利要求1所述的方法,其特征在于,按照时间先后顺序对出口网关设备在第一时段内出口的各个历史网络流量进行排列,包括:
根据最大值滤波对所述各个历史网络流量进行预处理;
按照时间先后顺序将经过预处理后的各个历史网络流量进行排列。
3.如权利要求1所述的方法,其特征在于,根据所述至少一个子时段的实际网络流量更新所述至少一个子时段的预测模型之后,所述方法还包括:
将更新后的所述至少一个子时段的预测模型加入所述模型库中。
4.如权利要求1所述的方法,其特征在于,输出所述预测网络流量序列之后,所述方法还包括:
若根据所述预测网络流量序列确定所述出口网关设备在所述各个子时段中的第一子时段的网络流量超出所述出口网关设备能够负载的最大网络流量,则输出预警信息;所述预警信息用于提示所述出口网关设备将在所述第一子时段到达网络流量的负载瓶颈。
5.如权利要求1所述的方法,其特征在于,基于所述对比结果,判断所述预测网络流量序列是否满足预期目标,包括:
获取预先设置的衡量网络流量误差的预设规则;
根据所述预设规则处理所述对比结果,得到所述预测网络流量序列对应的网络流量误差值;
判断所述网络流量误差值是否处于预设的网络流量误差范围内。
6.如权利要求1-5任一项所述的方法,其特征在于,根据所述历史网络流量序列训练模型库中预存的各预测模型,根据训练后的各预测模型预测第二时段的网络流量,得到所述第二时段的预测网络流量序列,包括:
根据所述各预测模型对应的子时段切分所述历史网络流量序列,得到至少一个历史网络流量子序列;其中,所述各预测模型对应的子时段构成所述第一时段;
根据所述至少一个历史网络流量子序列中的每个历史网络流量子序列训练对应的预测模型,得到所述各预测模型的最佳参数;
将所述各预测模型的最佳参数和对应的子时段的选定时刻输入所述各预测模型中,计算得到所述各个子时段对应的预测网络流量子序列;
合并各个预测网络流量子序列,得到所述第二时段的预测网络流量序列。
7.如权利要求6所述的方法,其特征在于,根据所述至少一个历史网络流量子序列中的每个历史网络流量子序列训练对应的预测模型,包括:
采用加性方法分解所述每个历史网络流量子序列对应的预测模型,得到所述每个历史网络流量子序列对应的预测模型的五个组成部分:流量总体趋势Ti(t)、流量季节性效应Si(t)、流量假日效应Hi(t)、流量突发效应Pi(t)、设备噪音Ri(t);其中,i表示所述每个历史网络流量子序列对应的序号,t表示所述每个历史网络流量子序列对应的子时段的选定时刻;
根据所述每个历史网络流量子序列分别训练所述五个组成部分。
8.如权利要求7所述的方法,其特征在于,根据所述每个历史网络流量子序列训练所述流量突发效应Pi(t),包括:
根据所述各个历史网络流量统计所述每个历史网络流量子序列中的每个数据粒度的误差分布,得到突发网络流量的经验累积分布函数;所述突发网络流量表示所述每个历史网络流量子序列对应的子时段内瞬时升高的网络流量;
根据所述经验累积分布函数,生成随机数pi,d,h(t);其中,d表示所述每个历史网络流量子序列中对应的一周内的每天对应的序号,h表示一天中的每个数据粒度对应的序号;
对所述经验累积分布函数进行逆变换,得到所述随机数pi,d,h(t)对应的Pi(t);
将所述Pi(t)作为所述每个历史网络流量子序列对应的子时段中的网络流量突发值的预测;
其中,Pi(t)=ECDF-1(pi,d,h(t)),pi,d,h(t)~U(0,1);ECDF-1(pi,d,h(t))表示对pi,d,h(t)进行逆变换,pi,d,h(t)~U(0,1)表示pi,d,h(t)服从(0,1)均匀分布。
10.如权利要求7所述的方法,其特征在于,所述流量总体趋势Ti(t)为连续的分段函数,其中,每段函数Ti,j(t)=a3t+b3,其中,a3、b3为常数,j表示连续的分段函数中的每段函数对应的序号;
所述流量假日效应Hi(t)=kz(t),其中,k表示每个节日的权重;z(t)用于判断所述每个历史网络流量子序列对应的当前日期是否为节假日;
所述设备噪音Ri(t)=βγmax,γmax表示历史设备噪音中的最大值,β为服从(0,1)均匀分布的常数。
11.一种预测装置,其特征在于,所述预测装置包括:
处理单元,用于按照时间先后顺序对出口网关设备在第一时段内出口的各个历史网络流量进行排列,得到历史网络流量序列;
训练单元,用于根据所述历史网络流量序列训练模型库中预存的各预测模型,根据训练后的各预测模型预测所述第一时段之后的第二时段的网络流量,得到所述第二时段的预测网络流量序列;所述第二时段的时长等于所述第一时段的时长;
判断单元,用于基于所述第二时段的实际网络流量序列和所述预测网络流量序列之间的对比结果,判断所述预测网络流量序列是否满足预期目标;
输出单元,用于在所述判断单元确定所述预测网络流量序列满足所述预期目标时,输出所述预测网络流量序列;
所述处理单元,还用于在所述判断单元确定所述预测网络流量序列不满足所述预期目标时,根据所述对比结果对所述第二时段中的各个子时段的网络流量误差进行分析,确定网络流量误差值大于预设阈值的至少一个子时段;所述网络流量误差值为预测网络流量与实际网络流量之间的误差值;
所述训练单元,还用于根据所述至少一个子时段的实际网络流量更新所述至少一个子时段的预测模型。
12.一种预测装置,其特征在于,所述预测装置包括至少一个处理器和存储器;
所述存储器用于存储一个或多个计算机程序;
当所述存储器存储的一个或多个计算机程序被所述至少一个处理器执行时,使得所述预测装置执行如权利要求1-10任一项所述的方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得所述计算机执行如权利要求1-10任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911327866.2A CN111030869B (zh) | 2019-12-20 | 2019-12-20 | 一种网络流量的预测方法及预测装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911327866.2A CN111030869B (zh) | 2019-12-20 | 2019-12-20 | 一种网络流量的预测方法及预测装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111030869A CN111030869A (zh) | 2020-04-17 |
CN111030869B true CN111030869B (zh) | 2022-09-20 |
Family
ID=70212325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911327866.2A Active CN111030869B (zh) | 2019-12-20 | 2019-12-20 | 一种网络流量的预测方法及预测装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111030869B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114077912A (zh) * | 2020-08-14 | 2022-02-22 | 华为技术有限公司 | 数据预测方法以及数据预测装置 |
CN114124733B (zh) * | 2020-08-27 | 2024-05-14 | 中国电信股份有限公司 | 业务流量的预测方法和装置 |
CN112994978B (zh) * | 2021-02-25 | 2023-01-24 | 网宿科技股份有限公司 | 一种网络流量监测方法及装置 |
CN113259158B (zh) * | 2021-05-11 | 2022-12-27 | 北京沃东天骏信息技术有限公司 | 网络流量预测方法和设备、模型构建及训练方法和装置 |
CN113518000B (zh) * | 2021-05-12 | 2023-04-07 | 北京奇艺世纪科技有限公司 | 在线服务的实例数量调整的方法、装置及电子设备 |
CN113572752B (zh) * | 2021-07-20 | 2023-11-07 | 上海明略人工智能(集团)有限公司 | 异常流量的检测方法和装置、电子设备、存储介质 |
CN113992525B (zh) * | 2021-10-12 | 2024-06-21 | 支付宝(杭州)信息技术有限公司 | 一种应用的容器数量调节方法及装置 |
CN114500298A (zh) * | 2022-01-10 | 2022-05-13 | 南昌首页科技发展有限公司 | 一种网络流量的调度方法、系统、设备及存储介质 |
CN115037642B (zh) * | 2022-03-30 | 2023-11-21 | 武汉烽火技术服务有限公司 | 一种识别流量瓶颈的方法和装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102369689A (zh) * | 2011-08-11 | 2012-03-07 | 华为技术有限公司 | 一种网络流量的长期预测方法及装置 |
US9426036B1 (en) * | 2013-09-26 | 2016-08-23 | Amazon Technologies, Inc. | Mixture model approach for network forecasting |
CN106909990A (zh) * | 2017-03-01 | 2017-06-30 | 腾讯科技(深圳)有限公司 | 一种基于历史数据的预测方法及装置 |
CN107171848A (zh) * | 2017-05-27 | 2017-09-15 | 华为技术有限公司 | 一种流量预测方法和装置 |
CN107948166A (zh) * | 2017-11-29 | 2018-04-20 | 广东亿迅科技有限公司 | 基于深度学习的流量异常检测方法及装置 |
CN109842563A (zh) * | 2017-11-24 | 2019-06-04 | 中国电信股份有限公司 | 内容分发网络流量调度方法、装置和计算机可读存储介质 |
CN110213784A (zh) * | 2019-07-05 | 2019-09-06 | 中国联合网络通信集团有限公司 | 一种流量预测方法及装置 |
CN110474808A (zh) * | 2019-08-20 | 2019-11-19 | 中国联合网络通信集团有限公司 | 一种流量预测方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10880321B2 (en) * | 2017-01-27 | 2020-12-29 | Vectra Ai, Inc. | Method and system for learning representations of network flow traffic |
-
2019
- 2019-12-20 CN CN201911327866.2A patent/CN111030869B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102369689A (zh) * | 2011-08-11 | 2012-03-07 | 华为技术有限公司 | 一种网络流量的长期预测方法及装置 |
US9426036B1 (en) * | 2013-09-26 | 2016-08-23 | Amazon Technologies, Inc. | Mixture model approach for network forecasting |
CN106909990A (zh) * | 2017-03-01 | 2017-06-30 | 腾讯科技(深圳)有限公司 | 一种基于历史数据的预测方法及装置 |
CN107171848A (zh) * | 2017-05-27 | 2017-09-15 | 华为技术有限公司 | 一种流量预测方法和装置 |
CN109842563A (zh) * | 2017-11-24 | 2019-06-04 | 中国电信股份有限公司 | 内容分发网络流量调度方法、装置和计算机可读存储介质 |
CN107948166A (zh) * | 2017-11-29 | 2018-04-20 | 广东亿迅科技有限公司 | 基于深度学习的流量异常检测方法及装置 |
CN110213784A (zh) * | 2019-07-05 | 2019-09-06 | 中国联合网络通信集团有限公司 | 一种流量预测方法及装置 |
CN110474808A (zh) * | 2019-08-20 | 2019-11-19 | 中国联合网络通信集团有限公司 | 一种流量预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111030869A (zh) | 2020-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111030869B (zh) | 一种网络流量的预测方法及预测装置 | |
CN109495318B (zh) | 一种移动通信网络流量预测方法、装置及可读存储介质 | |
CN105205297B (zh) | 一种基于时间序列的业务预测方法及系统 | |
CN109921950B (zh) | 一种网络带宽需求预测方法、装置及电子设备 | |
CN110390425A (zh) | 预测方法以及装置 | |
CN110378522A (zh) | 预测配送状态信息的方法、装置、存储介质及电子设备 | |
CN109872535A (zh) | 一种智慧交通通行预测方法、装置及服务器 | |
CN111813524B (zh) | 一种任务执行方法、装置、电子设备和存储介质 | |
CN112819258A (zh) | 银行网点到店客户数量预测方法及装置 | |
CN116362527B (zh) | 车辆调度方法、装置、计算机设备和存储介质 | |
CN111832876A (zh) | 车辆调度方法、可读存储介质和电子设备 | |
WO2023029680A1 (zh) | 一种确定磁盘可使用时长的方法及装置 | |
CN111079993A (zh) | 一种交通流量预测方法、装置、电子设备及存储介质 | |
CN116645132A (zh) | 基于多因子变量的时序预测方法、装置、电子设备及介质 | |
CN117934247B (zh) | 基于时序分解的碳排放因子预测方法、装置、电子设备及存储介质 | |
JP2010128679A (ja) | 製造工期モデル作成装置、納期達成率予測装置、製造着手目標時期算出装置、製造工期モデル作成方法、納期達成率予測方法、製造着手目標時期算出方法、プログラム、及びコンピュータ読み取り可能な記憶媒体 | |
CN111105050B (zh) | 风机维护计划的生成方法、装置、设备及存储介质 | |
JP2023120168A (ja) | 半導体工場における待ち時間予測のための方法 | |
CN111800807A (zh) | 一种基站用户数量告警的方法及装置 | |
CN110928634B (zh) | 数据处理方法、装置及设备 | |
CN116681198A (zh) | 一种模具投放方案生成方法、电子设备及存储介质 | |
CN113837782B (zh) | 时间序列模型的周期项参数优化方法、装置、计算机设备 | |
CN109543930B (zh) | 基于机台多级别稳态生产速率的派工方法及系统 | |
CN111666535A (zh) | 确定用户活跃时长的方法、装置、电子设备及存储介质 | |
CN111327449A (zh) | 一种网络异常的确定方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |