CN112232604A - 基于Prophet模型提取网络流量的预测方法 - Google Patents

基于Prophet模型提取网络流量的预测方法 Download PDF

Info

Publication number
CN112232604A
CN112232604A CN202011426660.8A CN202011426660A CN112232604A CN 112232604 A CN112232604 A CN 112232604A CN 202011426660 A CN202011426660 A CN 202011426660A CN 112232604 A CN112232604 A CN 112232604A
Authority
CN
China
Prior art keywords
model
prediction
data
network traffic
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011426660.8A
Other languages
English (en)
Other versions
CN112232604B (zh
Inventor
朱江
潘成胜
孔志翔
石怀峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN202011426660.8A priority Critical patent/CN112232604B/zh
Publication of CN112232604A publication Critical patent/CN112232604A/zh
Application granted granted Critical
Publication of CN112232604B publication Critical patent/CN112232604B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于Prophet模型提取网络流量的预测方法,针对网络流量的多分形特性,通过Prophet模型的可分解方法,对附加分量
Figure 359192DEST_PATH_IMAGE001
建立Prophet模型预测,对非线性分量
Figure 229060DEST_PATH_IMAGE002
建立卷积神经网络和基于注意力机制的长短期记忆网络模型预测,实现粗细粒度特征提取的融合,并给重要的特征分配更多的权重以提高其对结果的影响,在预测精度和预测速度上效果显著提升。本发明的网络流量的预测方法相较传统的流量预测方法具有明显的有效性和先进性。

Description

基于Prophet模型提取网络流量的预测方法
技术领域
本发明涉及一种网络流量预测方法,尤其涉及一种基于Prophet模型提取网络流量的预测方法。
背景技术
网络流量预测是网络管理和规划的重要依据,对于网络监测、资源分配和威胁检测起着重要的作用。准确的流量预测能够帮助管理者提前制定网络资源分配策略,有效解决即将到来的拥塞事件。因此,建立准确的流量预测模型具有重要的实际意义。现有网络流量的预测方法可总结为两类:适用于线性系统预测的统计方法和非线性预测系统的机器学习方法。典型的时间序列预测模型有自回归(AR)、自回归滑动平均(ARMA)和基于它们的改进模型。但网络的发展导致网络流量的复杂性及突发性愈发加强,传统的泊松分布、高斯分布等线性模型已不能满足现代网络流量的特点。
由于网络流量在大时间尺度下具有长相关特性,在小的时间尺度下又具有更复杂的混沌特性。传统的网络流量预测模型无法有效提取流量的这种多分形特性,导致预测精度效果不好的缺陷。
发明内容
本发明的目的在于提供一种融合粗细粒度特征的基于Prophet模型提取网络流量预测方法。
技术方案:本发明的基于Prophet模型提取网络流量的预测方法,包括以下步骤:
步骤1、获取网络流量数据
Figure 16354DEST_PATH_IMAGE001
步骤2、利用Prophet模型将网络流量数据
Figure 199073DEST_PATH_IMAGE001
分解成非线性分量
Figure 182073DEST_PATH_IMAGE002
与附加分量
Figure 240597DEST_PATH_IMAGE003
步骤3、将非线性分量
Figure 992652DEST_PATH_IMAGE002
预处理后依次通过卷积神经网络模型和基于注意力机制的 长短期记忆网络模型进行预测;
步骤4、将附加分量
Figure 221640DEST_PATH_IMAGE003
通过Prophet模型进行预测;
步骤5、将步骤3和步骤4的预测结果相加得到最终的网络流量预测值;
步骤6、对比网络流量数据的原始值与预测值,验证模型的有效性。
进一步地,步骤2中,所述非线性分量
Figure 285410DEST_PATH_IMAGE002
包括趋势项
Figure 890835DEST_PATH_IMAGE004
和随机项
Figure 294135DEST_PATH_IMAGE005
;所述附加 分量
Figure 84236DEST_PATH_IMAGE003
包括季节项
Figure 245090DEST_PATH_IMAGE006
和节假日
Figure 716523DEST_PATH_IMAGE007
进一步地,步骤3中,所述预处理包括读取数据流,数据分集和归一化处理。
进一步地,步骤3中,所述预测的方法包括以下步骤:
(1)将前70%-80%的数据作训练集,初次训练选取训练集中10%-15%的数据作为验证集,保存好最佳模型后继续用完整的训练集进行训练,后20%-30%组作测试集;
(2)将数据进行归一化处理,利用MinMaxScaler函数将数据规范在
Figure 36646DEST_PATH_IMAGE008
区间内,输出 结果前再进行反归一化操作,
Figure 873015DEST_PATH_IMAGE009
时刻
Figure 849061DEST_PATH_IMAGE002
归一化的结果为
Figure 655343DEST_PATH_IMAGE010
Figure 970918DEST_PATH_IMAGE011
(1)
其中,
Figure 40505DEST_PATH_IMAGE012
Figure 566164DEST_PATH_IMAGE013
分别为流量数据的最大值和最小值;
(3)利用滑动窗口T对步骤(2)的结果进行处理实现单步预测;
(4)将单步预测后的数据输入卷积神经网络模型中,提取时间序列的细粒度特征;
(5)通过基于注意力机制的长短期记忆网络模型从前端抽取出细粒度特征中的粗粒度特征,同时对细粒度特征和粗粒度特征的维度使用注意力机制,并对特征分配权重,其中注意力层的权重为:
Figure 51503DEST_PATH_IMAGE014
(2)
其中,
Figure 283902DEST_PATH_IMAGE015
是评价函数,可表达为
Figure 852286DEST_PATH_IMAGE016
,W为训练参数,对注意力层权重 求和得到最后的特征向量:
Figure 206520DEST_PATH_IMAGE017
(3)
其中,
Figure 823446DEST_PATH_IMAGE018
表示输入序列,
Figure 707088DEST_PATH_IMAGE019
表示学习得到的输入序列
Figure 321740DEST_PATH_IMAGE020
的特征,
Figure 494096DEST_PATH_IMAGE021
表示各特征 的注意力权重。
进一步地,步骤4中,所述Prophet模型预测的方法为通过建模与评估模型两个模块的循环迭代优化出结果。
进一步地,步骤6中,所述对比采用选取平均绝对百分比误差MAPE和决定系数
Figure 711450DEST_PATH_IMAGE022
这两个评价指标对比。
进一步地,所述平均绝对百分比误差MAPE的取值范围为
Figure 590545DEST_PATH_IMAGE023
,具体公式如下:
Figure 438415DEST_PATH_IMAGE024
(4)
其中,
Figure 160383DEST_PATH_IMAGE025
表示第
Figure 791216DEST_PATH_IMAGE026
时刻网络流量的实际值,
Figure 587134DEST_PATH_IMAGE027
表示第
Figure 402643DEST_PATH_IMAGE026
时刻网络流量的预测值,
Figure 487274DEST_PATH_IMAGE028
表示数据样本的均值,
Figure 249693DEST_PATH_IMAGE029
为样本数量。
进一步地,所述决定系数
Figure 962434DEST_PATH_IMAGE022
的取值范围为
Figure 824211DEST_PATH_IMAGE030
,具体公式如下:
Figure 255192DEST_PATH_IMAGE031
(5)
其中,
Figure 555724DEST_PATH_IMAGE025
表示第
Figure 529496DEST_PATH_IMAGE026
时刻网络流量的实际值,
Figure 421229DEST_PATH_IMAGE027
表示第
Figure 542768DEST_PATH_IMAGE026
时刻网络流量的预测值,
Figure 584674DEST_PATH_IMAGE028
表示数据样本的均值,
Figure 6428DEST_PATH_IMAGE029
为样本数量。
有益效果:与现有技术相比,本发明具有如下显著优点:
(1)本发明通过Prophet模型的可分解方法,对附加分量
Figure 537903DEST_PATH_IMAGE003
建立Prophet模型预测,对 非线性分量
Figure 821773DEST_PATH_IMAGE002
建立卷积神经网络和基于注意力机制的长短期记忆网络模型预测,实现粗 细粒度特征提取的融合,并给重要的特征分配更多的权重以提高其对结果的影响,在预测 精度和预测速度上效果显著提升。
(2)本发明的的预测方法流程简单,可操作性强,应用范围广。
附图说明
图1是本发明基于Prophet模型融合粗细粒度特征提取的网络流量预测模型图;
图2是本发明使用的网络流量原始数据图;
图3是本发明利用Prophet模型分解的网络流量趋势图;
图4是本发明利用Prophet模型分解的网络流量假期性图;
图5是本发明利用Prophet模型分解的网络流量周季节性图;
图6是本发明利用Prophet模型分解的网络流量日季节性图;
图7是本发明基于Attention的LSTM网络结构图;
图8是本发明Prophet模型工作流程图;
图9是本发明CNN模型和LSTM模型的预测结果图;
图10是本发明CNN模型和基于注意力机制的LSTM模型的预测结果图;
图11是本发明基于Prophet模型融合粗细粒度特征提取的网络流量预测结果图。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。
本发明提出的基于Prophet模型融合粗细粒度特征提取的网络流量预测方法PFMGNet(Prophet Fusion of Multi-grained Network)继承了Prophet模型的优点,同时弥补了传统神经网络模型预测方法的不足,针对网络流量的多分形特性将各流量分量分解后分别进行预测。
图1为本发明基于Prophet模型融合粗细粒度特征提取的网络流量预测模型图。首先要获取原始流量数据,本发明选取一个开放的数据集MAWILab中骨干网一条链路的流量作为实验数据。采集2020年5月1日0点至2020年5月30日23点,周期为1h的平均网络流量,共720组数据。图2显示了本发明所使用的网络流量原始数据图。
图3、4、5、6显示了Prophet模型分解原始数据的各成分分量,利用Prophet模型的 可分解方法,将网络流量历史数据
Figure 526423DEST_PATH_IMAGE001
分解成趋势项
Figure 271526DEST_PATH_IMAGE004
,随机项
Figure 646006DEST_PATH_IMAGE005
,季节项
Figure 538876DEST_PATH_IMAGE006
和节假日
Figure 657005DEST_PATH_IMAGE007
。其中,前两项称为非线性分量
Figure 256613DEST_PATH_IMAGE002
,后两项称为附加分量
Figure 192208DEST_PATH_IMAGE003
。由图3可以看出网络流 量在5月8日达到峰值后开始下降,自5月14日起缓慢上升,其中图3、图4中ds为采样时间,单 位为日。图5中显示双休的流量值低于周一至周五的流量值,考虑到这种情况主要因为周一 至周五是工作日造成,周六周日人们休息,使用网络的时间减少导致网络流量值低。图6中 显示了一天中的流量分布,其中ds为采样时间,单位为小时,可以看出白天的流量值普遍高 于夜晚的流量值,在凌晨4点至5点间达到一天的最低值,下午3点左右到达最高,这种网络 流量使用情况的谷值与峰值分布符合实际情况,说明了所选数据的可靠性。
对非线性分量
Figure 182161DEST_PATH_IMAGE002
建立卷积神经网络模型(以下简称CNN)和基于注意力机制的长 短期记忆网络模型(以下简称LSTM)进行预测。其过程具体实现如下:
(1)将前80%的数据作训练集,初次训练选取训练集中10%的数据作为验证集,保存好最佳模型后继续用完整的训练集进行训练,后20%作测试集;
(2)为消除指标之间的量纲影响,使后面结果分析中的指标处于同一数量。将数据进行 归一化处理,利用MinMaxScaler函数将数据规范在
Figure 166297DEST_PATH_IMAGE008
区间,输出结果前再进行反归一 化操作,
Figure 948309DEST_PATH_IMAGE009
时刻
Figure 664592DEST_PATH_IMAGE002
归一化的结果为
Figure 469737DEST_PATH_IMAGE010
Figure 319881DEST_PATH_IMAGE011
(1)
其中,
Figure 566186DEST_PATH_IMAGE012
Figure 781267DEST_PATH_IMAGE013
分别为流量数据的最大值和最小值;
(3)利用滑动窗口T对(2)的结果进行处理实现单步预测,其原理为:通过一系列历史流 量数据(
Figure 870445DEST_PATH_IMAGE032
)来预测未来
Figure 134068DEST_PATH_IMAGE033
时刻的流量;
(4)将(3)中处理后的数据输入CNN模型中,CNN能将时间序列的高维特征提取出来,达到细粒度特征提取的效果。卷积部分包含两个1DCNN和最大池化层,卷积层的卷积核尺寸均为2,1DCNN_1、1DCNN_2的过滤器的个数分别为256和128,1D最大池化层的核尺寸也为2。
(5)基于注意力机制的LSTM模型从前端抽取出的细粒度特征中抽取粗粒度特征,并且能够一定程度避免因步长过长造成的记忆丢失和梯度消失。同时,注意力机制对细粒度特征和粗粒度特征的维度使用注意力机制(Dimensions Attention),给重要的特征分配更多的权重以提高其对结果的影响。在LSTM层加入了丢弃算法(Dropout)以防止模型的过拟合,在经过LSTM层后使用全连接层得到注意力权重,对特征赋予权值。这里,LSTM层的输出单元大小设置为100。然后加入一个带激活函数(Relu)的全连接层,最后再加入一个输出节点给出预测结果实现单步预测。综合(4)(5)部分实现对流量数据粗细粒度特征提取的融合,完整的反映了网络流量的特征。
图7是基于Attention的LSTM网络结构图。Attention的任务是对于LSTM网络得到 隐层输出序列
Figure 562775DEST_PATH_IMAGE034
,根据权重分配计算不同特征向量对应的概率,不断更新迭代出较优的 权重参数矩阵
Figure 11074DEST_PATH_IMAGE035
,将其与特征向量
Figure 462915DEST_PATH_IMAGE034
加权求和后作为Attention的输出,最后通过全连 接层计算出预测的结果。其中,
Figure 592545DEST_PATH_IMAGE036
表示输入序列,
Figure 938075DEST_PATH_IMAGE037
表示学习得到的输入序列
Figure 429712DEST_PATH_IMAGE036
的特 征,
Figure 431166DEST_PATH_IMAGE038
表示各特征的注意力权重,
Figure 161225DEST_PATH_IMAGE039
表示输出结果。
其中Attention层的权重为:
Figure 236628DEST_PATH_IMAGE040
(2)
其中
Figure 229992DEST_PATH_IMAGE015
是评价函数,可表达为
Figure 515480DEST_PATH_IMAGE016
,W为训练参数,对Attention层权 重求和得到最后的特征向量:
Figure 924596DEST_PATH_IMAGE041
(3)
本研究试验环境为:Python3.7编程环境,网络框架使用Keras搭建;操作系统为Windows10 64bit,处理器为Intel(R) Core(TM) i7-9700CPU @ 3.00GHz,内存为32GB。优化器选用Adam,学习率设置为0.0001,模型训练的迭代次数epoch为100,dropout设为0.5。
由于Prophet模型相较于LSTM而言对时间序列的季节性、假期性更为敏感,擅长处 理具有大异常值和趋势变化的日常周期数据。所以对附加分量
Figure 182402DEST_PATH_IMAGE042
建立Prophet模型进行 预测。Prophet是一种新型的预测模型,擅长处理具有大异常值和趋势变化的日常周期数 据,其拟合程序运行速度极快。Prophet模型总体运行过程如图8所示,通过建模与评估模型 两个模块的循环迭代最终优化出结果。
Prophet模型可将序列分解成三个函数,其中
Figure 143404DEST_PATH_IMAGE043
为随机项。
Figure 791555DEST_PATH_IMAGE044
(6)
上式中
Figure 66678DEST_PATH_IMAGE045
为趋势项,用来表示时间序列的非线性性趋势,函数表达式为:
Figure 241307DEST_PATH_IMAGE046
(7)
其中,
Figure 248578DEST_PATH_IMAGE047
表示模型容量,
Figure 711920DEST_PATH_IMAGE048
分别表示增长率和偏移量,随着
Figure 321893DEST_PATH_IMAGE049
的增长模型趋向于
Figure 491974DEST_PATH_IMAGE047
Figure 529200DEST_PATH_IMAGE050
为季节项,用来表示时间序列的周期性变化(例如日季节性、周季节性),函数表达式 为:
Figure 479839DEST_PATH_IMAGE051
(8)
其中,
Figure 34448DEST_PATH_IMAGE052
为目标序列的周期,
Figure 121353DEST_PATH_IMAGE053
为要估计的系数参数,服从
Figure 595060DEST_PATH_IMAGE054
分布。
Figure 705098DEST_PATH_IMAGE055
为假期项,表示假期等特殊因素对时间序列造成的影响,函数表达式为:
Figure 860136DEST_PATH_IMAGE056
(9)
其中,
Figure 863864DEST_PATH_IMAGE057
表示假期
Figure 398486DEST_PATH_IMAGE058
对应的日期,
Figure 58138DEST_PATH_IMAGE059
表示时间
Figure 813604DEST_PATH_IMAGE060
是否是假期,是为1,不是为0。参数
Figure 547205DEST_PATH_IMAGE061
服从
Figure 628294DEST_PATH_IMAGE062
Figure 447345DEST_PATH_IMAGE063
越小则模型适应波动的能力越小,反之越大。
将非线性分量
Figure 944185DEST_PATH_IMAGE064
与附加分量
Figure 922506DEST_PATH_IMAGE065
经模型输出后的结果进行相加得到最终的网 络流量预测值,选取两种评价指标作为评判测试集预测数据与原始数据对比的指标:
(1)平均绝对百分比误差(MAPE),MAPE之所以可以描述准确度是因为MAPE本身常用于 衡量预测准确性的统计指标,如时间序列的预测。MAPE的取值范围为
Figure 784283DEST_PATH_IMAGE023
,越接近于0说 明模型越好。具体公式如下:
Figure 418526DEST_PATH_IMAGE024
(4)
(2)确定性相关系数(
Figure 781374DEST_PATH_IMAGE066
score),
Figure 223988DEST_PATH_IMAGE066
的取值反应模型的优异程度。
Figure 584562DEST_PATH_IMAGE066
的范围为
Figure 768419DEST_PATH_IMAGE030
,与 MAPE相反,
Figure 279166DEST_PATH_IMAGE066
的值越接近于1说明模型越好,反之越差。具体公式如下:
Figure 169762DEST_PATH_IMAGE031
(5)
其中,
Figure 497975DEST_PATH_IMAGE067
表示第
Figure 778915DEST_PATH_IMAGE068
时刻网络流量的实际值,
Figure 686828DEST_PATH_IMAGE069
表示第
Figure 228667DEST_PATH_IMAGE068
时刻网络流量的预测值,
Figure 868727DEST_PATH_IMAGE070
表示数据样本的均值,
Figure 699280DEST_PATH_IMAGE071
为样本数量。
表1对比了一些传统流量预测方法与本发明提出的方法在精度和时耗两方面的数据,各模型训练好后在测试集测试5次后取平均值作为最终结果。
表1 不同模型评价指标结果
Figure 942043DEST_PATH_IMAGE072
可以看出本发明所采用的PFMGNet模型,较其他模型效果显著,MAPE指标比LSTM模型减 少了25.3%、
Figure 476405DEST_PATH_IMAGE066
指标比LSTM模型提高了0.106。训练时耗虽比不上传统预测模型,但较其他 神经网络模型也有较大的缩短。图9、图10、图11分别为CNN+LSTM、CNN+LSTM+Attention和本 发明提出模型的预测结果图,可以看出CNN+LSTM模型虽融合了两种模型的特点,但对于一 些异局部特征附近预测效果很差,且在部分时间段的预测出现了一定的滞后现象。CNN+ LSTM+Attention模型由于注意力机制的效果,使模型的特征提取更注重于显著特征的提取 上,根据图10可看出模型对突变点的预测更加准确(例如图10中时间点250、580附近的峰 值),相较于CNN+LSTM模型一定程度上减少了显著特征的丢失。而本发明提出的模型在各项 精度指标上为最优,且时耗也比其他神经网络快。模型综合了CNN+LSTM+Attention中模型 优点的同时也优化了对序列局部特征的提取,对于实际网络流量的变化趋势的预测基本一 致。说明模型对于时间序列的季节性分量、节假日因素有着很好的预测效果。
通过实验可以看出,单一的模型不能很好的预测网络流量,更好的方式是根据网 络流量的特性通过模型的分解、组合后再进行预测。同时结果表明,本发明提出的基于 Prophet模型融合粗细粒度特征提取的网络流量预测方法对于网络流量的预测具有更好的 效果,MAPE评价指标为12.5%,
Figure 349683DEST_PATH_IMAGE066
分数达到0.716;相较于传统的LSTM模型,MAPE降低了 25.3%、
Figure 464269DEST_PATH_IMAGE066
提高了0.106。

Claims (8)

1.一种基于Prophet模型提取网络流量的预测方法,其特征在于,包括以下步骤:
步骤1、获取网络流量数据
Figure 82852DEST_PATH_IMAGE001
步骤2、利用Prophet模型将网络流量数据
Figure 531150DEST_PATH_IMAGE001
分解成非线性分量
Figure 45308DEST_PATH_IMAGE002
与附加分量
Figure 237255DEST_PATH_IMAGE003
步骤3、将非线性分量
Figure 786048DEST_PATH_IMAGE002
预处理后依次通过卷积神经网络模型和基于注意力机制的长 短期记忆网络模型进行预测;
步骤4、将附加分量
Figure 943930DEST_PATH_IMAGE003
通过Prophet模型进行预测;
步骤5、将步骤3和步骤4的预测结果相加得到最终的网络流量预测值;
步骤6、对比网络流量数据的原始值与预测值,验证模型的有效性。
2.根据权利要求1所述的基于Prophet模型提取网络流量的预测方法,其特征在于,步 骤2中,所述非线性分量
Figure 7701DEST_PATH_IMAGE002
包括趋势项
Figure 488492DEST_PATH_IMAGE004
和随机项
Figure 891791DEST_PATH_IMAGE005
;所述附加分量
Figure 681893DEST_PATH_IMAGE003
包括季节项
Figure 967380DEST_PATH_IMAGE006
和节假日
Figure 438813DEST_PATH_IMAGE007
3.根据权利要求1所述的基于Prophet模型提取网络流量的预测方法,其特征在于,步骤3中,所述预处理包括读取数据流,数据分集和归一化处理。
4.根据权利要求1所述的基于Prophet模型提取网络流量的预测方法,其特征在于,步骤3中,所述预测的方法包括以下步骤:
(1)将前70%-80%的数据作训练集,初次训练选取训练集中10%-15%的数据作为验证集,保存好最佳模型后继续用完整的训练集进行训练,后20%-30%组作测试集;
(2)将数据进行归一化处理,利用MinMaxScaler函数将数据规范在
Figure 493357DEST_PATH_IMAGE008
区间内,输出 结果前再进行反归一化操作,
Figure 470671DEST_PATH_IMAGE009
时刻
Figure 446717DEST_PATH_IMAGE002
归一化的结果为
Figure 518579DEST_PATH_IMAGE010
Figure 693208DEST_PATH_IMAGE011
(1)
其中,
Figure 559533DEST_PATH_IMAGE012
Figure 22875DEST_PATH_IMAGE013
分别为流量数据的最大值和最小值;
(3)利用滑动窗口T对步骤(2)的结果进行处理实现单步预测;
(4)将单步预测后的数据输入卷积神经网络模型中,提取时间序列的细粒度特征;
(5)通过基于注意力机制的长短期记忆网络模型从前端抽取出细粒度特征中的粗粒度特征,同时对细粒度特征和粗粒度特征的维度使用注意力机制,并对特征分配权重,其中注意力层的权重为:
Figure 649160DEST_PATH_IMAGE014
(2)
其中,
Figure 881558DEST_PATH_IMAGE015
是评价函数,可表达为
Figure 184363DEST_PATH_IMAGE016
,W为训练参数,对注意力层权重 求和得到最后的特征向量:
Figure 931739DEST_PATH_IMAGE017
(3)
其中,
Figure 345403DEST_PATH_IMAGE018
表示输入序列,
Figure 432308DEST_PATH_IMAGE019
表示学习得到的输入序列
Figure 919397DEST_PATH_IMAGE020
的特征,
Figure 888490DEST_PATH_IMAGE021
表示各特征 的注意力权重。
5.根据权利要求1所述的基于Prophet模型提取网络流量的预测方法,其特征在于,步骤4中,所述Prophet模型预测的方法为通过建模与评估模型两个模块的循环迭代优化出结果。
6.根据权利要求1所述的基于Prophet模型提取网络流量的预测方法,其特征在于,步 骤6中,所述对比采用选取平均绝对百分比误差MAPE和决定系数
Figure 43527DEST_PATH_IMAGE022
这两个评价指标对比。
7.根据权利要求6所述的基于Prophet模型提取网络流量的预测方法,其特征在于,所 述平均绝对百分比误差MAPE的取值范围为
Figure 312835DEST_PATH_IMAGE023
,具体公式如下:
Figure 160705DEST_PATH_IMAGE024
(4)
其中,
Figure 617094DEST_PATH_IMAGE025
表示第
Figure 388872DEST_PATH_IMAGE026
时刻网络流量的实际值,
Figure 184790DEST_PATH_IMAGE027
表示第
Figure 299DEST_PATH_IMAGE026
时刻网络流量的预测值,
Figure 209564DEST_PATH_IMAGE028
表示数据样本的均值,
Figure 971983DEST_PATH_IMAGE029
为样本数量。
8.根据权利要求6所述的基于Prophet模型提取网络流量的预测方法,其特征在于,所 述决定系数
Figure 684724DEST_PATH_IMAGE022
的取值范围为
Figure 421867DEST_PATH_IMAGE030
,具体公式如下:
Figure 56111DEST_PATH_IMAGE031
(5)
其中,
Figure 418959DEST_PATH_IMAGE025
表示第
Figure 251786DEST_PATH_IMAGE026
时刻网络流量的实际值,
Figure 346781DEST_PATH_IMAGE027
表示第
Figure 265058DEST_PATH_IMAGE026
时刻网络流量的预测值,
Figure 182330DEST_PATH_IMAGE028
表示数据样本的均值,
Figure 807346DEST_PATH_IMAGE029
为样本数量。
CN202011426660.8A 2020-12-09 2020-12-09 基于Prophet模型提取网络流量的预测方法 Active CN112232604B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011426660.8A CN112232604B (zh) 2020-12-09 2020-12-09 基于Prophet模型提取网络流量的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011426660.8A CN112232604B (zh) 2020-12-09 2020-12-09 基于Prophet模型提取网络流量的预测方法

Publications (2)

Publication Number Publication Date
CN112232604A true CN112232604A (zh) 2021-01-15
CN112232604B CN112232604B (zh) 2021-06-11

Family

ID=74124690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011426660.8A Active CN112232604B (zh) 2020-12-09 2020-12-09 基于Prophet模型提取网络流量的预测方法

Country Status (1)

Country Link
CN (1) CN112232604B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906673A (zh) * 2021-04-09 2021-06-04 河北工业大学 一种基于注意力机制的下肢运动意图预测方法
CN113592058A (zh) * 2021-07-05 2021-11-02 西安邮电大学 一种定量预测微博转发广度与深度的方法
CN113949644A (zh) * 2021-10-22 2022-01-18 山东省计算中心(国家超级计算济南中心) 基于LSTM-prophet的网站访问量预测方法及系统
CN115118511A (zh) * 2022-06-29 2022-09-27 北京奇艺世纪科技有限公司 异常流量识别方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109002904A (zh) * 2018-06-21 2018-12-14 中南大学 一种基于Prophet-ARMA的医院门诊就诊量预测方法
CN110210658A (zh) * 2019-05-22 2019-09-06 东南大学 基于小波变换的Prophet与高斯过程用户网络流量预测方法
CN111585789A (zh) * 2020-04-13 2020-08-25 中国联合网络通信集团有限公司 数据预测方法及装置
CN112053004A (zh) * 2020-09-14 2020-12-08 胜斗士(上海)科技技术发展有限公司 用于时间序列预测的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109002904A (zh) * 2018-06-21 2018-12-14 中南大学 一种基于Prophet-ARMA的医院门诊就诊量预测方法
CN110210658A (zh) * 2019-05-22 2019-09-06 东南大学 基于小波变换的Prophet与高斯过程用户网络流量预测方法
CN111585789A (zh) * 2020-04-13 2020-08-25 中国联合网络通信集团有限公司 数据预测方法及装置
CN112053004A (zh) * 2020-09-14 2020-12-08 胜斗士(上海)科技技术发展有限公司 用于时间序列预测的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王晓等: "基于Prophet算法的铁路客流量预测研究", 《计算机技术与发展》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906673A (zh) * 2021-04-09 2021-06-04 河北工业大学 一种基于注意力机制的下肢运动意图预测方法
CN113592058A (zh) * 2021-07-05 2021-11-02 西安邮电大学 一种定量预测微博转发广度与深度的方法
CN113592058B (zh) * 2021-07-05 2024-03-12 西安邮电大学 一种定量预测微博转发广度与深度的方法
CN113949644A (zh) * 2021-10-22 2022-01-18 山东省计算中心(国家超级计算济南中心) 基于LSTM-prophet的网站访问量预测方法及系统
CN115118511A (zh) * 2022-06-29 2022-09-27 北京奇艺世纪科技有限公司 异常流量识别方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN112232604B (zh) 2021-06-11

Similar Documents

Publication Publication Date Title
CN112232604B (zh) 基于Prophet模型提取网络流量的预测方法
Rangapuram et al. Deep state space models for time series forecasting
CN109034861B (zh) 基于移动端日志行为数据的用户流失预测方法及装置
CN116757534A (zh) 一种基于神经训练网络的智能冰箱可靠性分析方法
CN111861013B (zh) 一种电力负荷预测方法及装置
CN111723929A (zh) 一种基于神经网络的数值预报产品订正方法、装置和系统
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN111652425A (zh) 一种基于粗糙集和长短期记忆网络的河流水质预测方法
CN114330934A (zh) 一种模型参数自适应的gru新能源短期发电功率预测方法
CN113205223A (zh) 一种电量预测系统及其预测方法
CN110807508B (zh) 计及复杂气象影响的母线峰值负荷预测方法
CN114881347A (zh) 一种采用加权残差聚类的天然气负荷预测区间估计方法
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
Thi et al. One-class collective anomaly detection based on long short-term memory recurrent neural networks
CN116885699A (zh) 基于双重注意力机制的电力负荷预测方法
CN116739130A (zh) TCN-BiLSTM网络的多时间尺度负荷预测方法
CN114862032B (zh) 一种基于XGBoost-LSTM的电网负荷预测方法及装置
CN116542701A (zh) 一种基于cnn-lstm组合模型的碳价预测方法及系统
Peng et al. Stock price prediction based on recurrent neural network with long short-term memory units
CN115794805A (zh) 一种中低压配网量测数据补齐方法
CN115730744A (zh) 基于用户模式与深度学习联合模型的用水量预测方法及系统
Li et al. Hydropower generation forecasting via deep neural network
CN114037138A (zh) 基于双层分解和深度学习的地铁短时进站客流预测系统及实施方法
CN113723660A (zh) 一种基于dnn-lstm融合模型的特定行为类型预测方法及系统
CN112561153A (zh) 一种基于模型集成的景区人群聚集预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant