CN112350899A - 一种基于图卷积网络融合多特征输入的网络流量预测方法 - Google Patents

一种基于图卷积网络融合多特征输入的网络流量预测方法 Download PDF

Info

Publication number
CN112350899A
CN112350899A CN202110018129.5A CN202110018129A CN112350899A CN 112350899 A CN112350899 A CN 112350899A CN 202110018129 A CN202110018129 A CN 202110018129A CN 112350899 A CN112350899 A CN 112350899A
Authority
CN
China
Prior art keywords
network
time
matrix
gcn
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110018129.5A
Other languages
English (en)
Other versions
CN112350899B (zh
Inventor
潘成胜
朱江
石怀峰
杨雯升
孔志翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Science and Technology
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology, Nanjing University of Information Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN202110018129.5A priority Critical patent/CN112350899B/zh
Publication of CN112350899A publication Critical patent/CN112350899A/zh
Application granted granted Critical
Publication of CN112350899B publication Critical patent/CN112350899B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Educational Administration (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于图卷积网络融合多特征输入的网络流量预测方法,步骤为:获取网络流量数据;利用皮尔森相关系数对流量进行相关性分析;采用时空特征提取单元来提取流量间的时空特征;提取历史上每周同一时刻的网络流量数据;特征融合得到预测结果。本发明解决了传统网络流量预测模型存在无法有效提取流量间的时空特性缺陷而导致的预测误差高、精度低的问题。

Description

一种基于图卷积网络融合多特征输入的网络流量预测方法
技术领域
本发明属于信息工程领域,特别涉及了一种网络流量预测方法。
背景技术
随着网络的快速发展,网络流量任务的需求量日益增大,及时准确的流量预测对于网络管理和规划愈发重要,它能够帮助管理者提前制定资源分配策略,从而有效解决即将到来的过载事件。但是,由于流量间复杂的时空关系,导致传统的预测模型难以准确地预测网络流量。
现有的时间序列预测模型分为线性预测模型以及非线性预测模型,网络流量为典型的时间序列,最初有很多线性模型被用来解决它的预测问题。例如历史平均(HA)模型,它使用历史的平均值作为预测。还有自回归滑动平均(ARMA)和以它为基础组合改进的模型,例如M. Laner等利用ARMA模型对远程相关的网络流量简单拟合预测;Rishabh等利用离散小波变化(DWT)将流量数据分解为非线性(近似)和线性(分量),之后再利用自回归差分移动平均(ARIMA)对非线性分量进行预测。但是,随着网络的发展,网络流量的复杂性及突发性愈发加强,传统的泊松分布、高斯分布等线性模型已不能满足现代网络流量的特点。
随着人工智能的发展,很多机器学习模型被用来预测网络流量,这类非线性预测模型对于非平稳的序列具有很好的预测效果。例如,Qian等提出利用支持向量回归(SVR)模型预测经相空间重构处理后的去噪流量数据。Bie等通过极限学习机(ELM)和结合分解果蝇优化算法的ELM(FOA-ELM)预测流量分解后的低频分量和高频分量。K. Sebastian等利用门控循环单元(GRU)模型来预测基站流量,GRU是循环神经网络(RNN)的一种变体,有一定解决RNN长期依赖的能力。这些模型能很好地提取流量数据的时间特征,但忽略了序列间的空间相关性。
为了更好地提取流量数据的空间特征,Li等提出卷积神经网络(CNN)融合长短期记忆网络(LSTM)的模型进行预测,CNN通过卷积层和池化层能有效地捕捉空间相关性。但是,CNN通常应用于图像这类规则的欧式数据,不能从本质上很好地描述网络复杂拓扑节点间的空间相关性。Q. Zhang等人将图论与神经网络结合起来,定义了图在傅里叶域的滤波器,随后图卷积网络(GCN)被广泛应用在知识图谱以及交通流量的预测上。但传统GCN只能描述网络节点间的连通性,不能捕捉网络节点间的近相关性,进而不能有效提取网络流量的时空相关性。
发明内容
为了解决上述背景技术提到的技术问题,本发明提出了一种基于图卷积网络融合多特征输入的网络流量预测方法。
为了实现上述技术目的,本发明的技术方案为:
一种基于图卷积网络融合多特征输入的网络流量预测方法,其特征在于,包括以下步骤:
(1)获取网络流量数据;
(2)利用皮尔森相关系数对流量进行相关性分析;
(3)采用时空特征提取单元来提取流量间的时空特征;所述时空特征提取单元通过双通道GCN模型提取空间特征,通过GRU模型提取时间特征,时空特征提取单元的输出为
Figure 871227DEST_PATH_IMAGE001
;所述双通道GCN模型包括邻接特征提取模块AGCN和相关特征提取模块PGCN;所述邻接特征提取模块AGCN包括两层GCN模型,其输入为网络流量特征矩阵X及其邻接矩阵;所述相关特征提取模块PGCN包括两层GCN模型,其输入为网络流量特征矩阵X及其相关系数矩阵;
(4)提取历史上每周同一时刻的网络流量数据
Figure 788368DEST_PATH_IMAGE002
,将
Figure 755056DEST_PATH_IMAGE002
构建成与步骤(3)中
Figure 150265DEST_PATH_IMAGE001
相同尺寸的矩阵;
(5)特征融合得到预测结果:
Figure 902320DEST_PATH_IMAGE003
其中,
Figure 724783DEST_PATH_IMAGE004
为权值,
Figure 991816DEST_PATH_IMAGE005
表示哈达玛乘子,
Figure 380597DEST_PATH_IMAGE006
为预测结果。
进一步地,在步骤(3)中,设
Figure 49475DEST_PATH_IMAGE007
为双通道GCN模型的输出,
Figure 42839DEST_PATH_IMAGE008
为邻接特征提取模块AGCN的输出,
Figure 734852DEST_PATH_IMAGE009
为相关特征提取模块PGCN的输出,则:
Figure 471864DEST_PATH_IMAGE010
其中,“|”表示矩阵的拼接,A为邻接矩阵,P为相关系数矩阵。
进一步地,邻接特征提取模块AGCN的输出
Figure 995249DEST_PATH_IMAGE008
的表达式如下:
Figure 612044DEST_PATH_IMAGE011
其中,
Figure 853669DEST_PATH_IMAGE012
为单位矩阵,
Figure 66476DEST_PATH_IMAGE013
Figure 709947DEST_PATH_IMAGE014
的第i行第j列的元素,
Figure 45113DEST_PATH_IMAGE015
为对角矩阵
Figure 960985DEST_PATH_IMAGE016
的第i行第i列的元素,
Figure 39800DEST_PATH_IMAGE017
为输入层到隐藏层的权重,
Figure 537777DEST_PATH_IMAGE018
为隐藏层到输出层的权重,
Figure 247107DEST_PATH_IMAGE019
表示修正线性单元。
进一步地,在步骤(3)中,时空特征提取单元的计算过程如下:
Figure 197746DEST_PATH_IMAGE020
其中,
Figure 80251DEST_PATH_IMAGE021
为T时刻网络流量特征
Figure 619686DEST_PATH_IMAGE022
对应的双通道GCN模型的输出,
Figure 562234DEST_PATH_IMAGE023
为GRU模型中的更新门,
Figure 937852DEST_PATH_IMAGE024
为GRU模型中的重置门,
Figure 358469DEST_PATH_IMAGE025
为激活函数,
Figure 9200DEST_PATH_IMAGE026
为T时刻隐藏状态,
Figure 122650DEST_PATH_IMAGE027
为T-1时刻隐藏状态,
Figure 47880DEST_PATH_IMAGE028
为T时刻候选隐藏状态,
Figure 209871DEST_PATH_IMAGE029
为权重,
Figure 271368DEST_PATH_IMAGE030
为偏置项。
进一步地,在步骤(5)中,采用PSO算法选出
Figure 555719DEST_PATH_IMAGE031
的最优值。
采用上述技术方案带来的有益效果:
本发明融合了流量的时空特征和周历史信息特征,其中,时空特征由基于邻接特征提取模块AGCN和相关特征提取模块PGCN构成的双通道GCN和GRU提取,解决了传统网络流量预测模型存在无法有效提取流量间的时空特性的缺陷而导致的预测误差高、精度低的问题。分析结果表明,与传统ARIMA模型相比,以10分钟的预测长度为例,本发明的RMSE和Accuracy分别降低了1.694和提高了21.1%,预测效果明显提高,且本发明具有长期预测的能力。
附图说明
图1是网络流量的空间依赖图;
图2是网络流量的周趋势图;
图3是网络流量的日趋势图;
图4是本发明利用皮尔森相关系数对数据进行相关性分析的热度图;
图5是本发明提出的双通道GCN结构图;
图6是GRU模型的结构图;
图7是本发明的整体方法流程图;
图8是本发明利用PSO算法选择权值的结果图;
图9是本发明多步预测后的Accuracy和
Figure 155196DEST_PATH_IMAGE032
结果图。
具体实施方式
以下将结合附图,对本发明的技术方案进行详细说明。
本发明提出了一种基于图卷积网络融合多特征输入的网络流量预测方法,能够捕捉网络流量间的时空相关性。
首先要获取原始流量数据,为了验证有效性,本发明选取一个开放的数据集作为实验数据。这个数据集包含米兰市流量网络数据,其下载网址为https://dataverse.harvard.edu/dataset.xhtml.persistentId=doi:10.7910/DVN/EGZHFV。数据集的采样频率为10min/次,即一天包含144个采样点。选用9个区域的两组数组进行模型评估:(1)工作日:2013年11月1日-2014年11月29日;(2)节假日:2013年11月3日-2013年12月1日。
图1、图2、图3描述了网络流量的时空相关性。图1中每个节点间的线代表他们之间相互影响的权重,其中,颜色越深代表权重越大。可以看出节点A不同位置的相邻节点对它的影响是不同的,同一个节点在一天内不同时刻对A点的影响也是变化的。A节点一周以及一天内的流量变化分别如图2、3所示,可以看出网络流量在一周内呈现周期性变化;一天内的流量也会随着时间的变化表现出白天高、晚上低的趋势。总之,当前的网络流量会受到前一刻、甚至是历史一周相同时刻的流量的影响,并且在时间和空间维度上都是相互依赖的。因此,有效提取数据的时空特性对于准确地预测网络流量至关重要。
图4是利用皮尔森相关系数对数据进行相关性分析的热度图。图是一种数据格式,通过点、边来描述个体以及个体间的关系。图卷积网络(GCN)是图结构数据在深度学习中的应用,与传统的卷积神经网络(CNN)不同的是,GCN对图信号的卷积操作是在傅里叶域进行。处理图结构首先需要获取拉普拉斯矩阵
Figure 183195DEST_PATH_IMAGE033
,将矩阵L归一化可得:
Figure 364778DEST_PATH_IMAGE034
其中,
Figure 492134DEST_PATH_IMAGE035
为单位矩阵;D为节点构成的度矩阵,度矩阵为对角矩阵,
Figure 391957DEST_PATH_IMAGE036
Figure 958067DEST_PATH_IMAGE037
为邻接矩阵A中的元素;等式后半部分由拉普拉斯矩阵L分解得到,
Figure 446686DEST_PATH_IMAGE038
分别为分解后的特征向量及特征值构成的对角矩阵。
频谱卷积可定义为信号和滤波器在傅里叶域的乘积,本发明利用一阶的切比雪夫多项式近似计算(k=1),结果如下式所示:
Figure 807261DEST_PATH_IMAGE039
其中,
Figure 194380DEST_PATH_IMAGE040
表示卷积核,
Figure 501864DEST_PATH_IMAGE041
为模型参数。为避免数值过大导致梯度消失,令
Figure 392460DEST_PATH_IMAGE042
,则第l层的输出可表示为:
Figure 189515DEST_PATH_IMAGE043
Figure 985301DEST_PATH_IMAGE044
是类似于ReLU、sigmoid的激活函数,
Figure 158793DEST_PATH_IMAGE045
Figure 169475DEST_PATH_IMAGE046
层的权重参数。因此,给定网络流量特征矩阵X和邻接矩阵A,GCN可以通过输入节点的频谱卷积来提取节点间的空间特征。结合上式,令
Figure 75114DEST_PATH_IMAGE047
,输入经两层GCN模型的映射后为:
Figure 171246DEST_PATH_IMAGE048
其中,
Figure 72730DEST_PATH_IMAGE049
分别表示输入层到隐藏层、隐藏层到输出层的权重。这里H为隐藏层单元数,属于超参数。
传统GCN都是根据节点间的连通性来设置邻接矩阵,本发明设置的邻接矩阵元素定义如下:
Figure 937918DEST_PATH_IMAGE050
这种确定流量网络邻接矩阵的方法具有一定的合理性,认为联通节点间的相关程度比不连通的节点高。但是每个目标节点都有多个联通节点,不是每个联通节点对目标节点的影响都相同。为解决这一问题,本发明利用皮尔森相关系数
Figure 76775DEST_PATH_IMAGE051
对不同节点间的影响进行分析,
Figure 660204DEST_PATH_IMAGE051
的定义如下:
Figure 847602DEST_PATH_IMAGE052
其中,
Figure 832876DEST_PATH_IMAGE053
为连续变量
Figure 142635DEST_PATH_IMAGE054
之间的协方差,
Figure 400309DEST_PATH_IMAGE055
分别为
Figure 453716DEST_PATH_IMAGE056
的标准差。
从图4可以看出,不同网络节点之间具有空间相关性。其次,相邻节点(B,C,D,E)与目标节点A的空间相关性不同,存在相关系数小于0.9的节点,而到A点需要多跳的节点相关系数有大于0.9的。因此,传统设置邻接矩阵的方式不能很好的描述流量网络的空间关系。本发明提出一种新的双通道GCN模型来提取空间特征,其模型结构如图5所示。双通道GCN模型在基础的GCN模型上构建,由邻接特征提取模块AGCN和相关特征提取模块PGCN构成,Concat后的结果为:
Figure 293496DEST_PATH_IMAGE057
其中,“|”代表矩阵的拼接,相关特征提取模块的邻接矩阵由皮尔森相关系数矩阵代替,与邻接特征提取模块提取的特征融合,更加全面的提取了网络节点的空间特征。
图6是GRU模型的结构图。其中,
Figure 711839DEST_PATH_IMAGE027
表示T-1时刻的隐藏状态,
Figure 4280DEST_PATH_IMAGE058
表示T时刻的流量特征。T时刻的隐藏状态
Figure 861378DEST_PATH_IMAGE059
通过更新门
Figure 742615DEST_PATH_IMAGE060
来确定是维持上一时刻的隐藏状态
Figure 394176DEST_PATH_IMAGE061
,还是更新为T时刻的候选隐藏状态
Figure 439493DEST_PATH_IMAGE062
Figure 772385DEST_PATH_IMAGE063
通过
Figure 321178DEST_PATH_IMAGE044
函数来使自身等于近似于0或1的值。
Figure 409220DEST_PATH_IMAGE064
为重置门,用于控制忽略上一状态信息
Figure 863204DEST_PATH_IMAGE027
的程度。GRU的结构可以捕捉非常长范围的依赖,能很好的提取长相关性序列的时间特征,非常适用于网络流量这种典型时间序列的预测。
对获取的原始流量数据建立基于图卷积网络融合多特征输入的模型进行预测。其过程具体实现如下:
(1)每组数据为
Figure 62104DEST_PATH_IMAGE065
个,其中前80%作为训练集,初次训练选取训练集中10%的数据作为验证集,保存好最佳模型后继续用完整的训练集进行训练,后20%数据作测试集。预测前利用MinMaxScaler函数对样本数据进行归一化操作,使数据规范在
Figure 465403DEST_PATH_IMAGE066
区间,输出结果前再进行反归一化操作。
(2)为同时提取流量数据的时空相关性,本发明提出一种基于图卷积网络融合多特征输入(MF-GCN)的网络流量预测方法,模型结构如图7所示。将(1)中处理好的数据输入MF-GCN模型,其过程具体实现如下:
(21)首先数据输入时空特征提取单元,下式为具体计算过程,其中,
Figure 662029DEST_PATH_IMAGE021
为输入经GCN提取空间特性后的输出,Wb分别为权重和偏置项,经时空特征提取单元提取后的输出为
Figure 416359DEST_PATH_IMAGE001
Figure 153371DEST_PATH_IMAGE067
(22)由于当前网络流量会受到历史时刻的影响,因此本发明提取历史上每周同一时刻的网络流量信息
Figure 866636DEST_PATH_IMAGE002
,将
Figure 296481DEST_PATH_IMAGE002
直接构建成与(21)中输出
Figure 272527DEST_PATH_IMAGE001
同尺寸的矩阵。
(23)特征融合:
Figure 750913DEST_PATH_IMAGE068
。使用
Figure 394384DEST_PATH_IMAGE069
加权后的和
Figure 729550DEST_PATH_IMAGE006
作为最终的预测结果,其中,利用PSO算法选出最优权值
Figure 583105DEST_PATH_IMAGE070
Figure 661920DEST_PATH_IMAGE071
(3)为了充分验证模型的预测能力,本发明进行了单步预测与多步预测来预测未来10分钟、20分钟和30分钟网络流量。此外,本发明选取了三种评价指标作为评判模型效果好坏的指标,具体如下:
(31)均方根误差(RMSE),RMSE反映了模型预测误差。RMSE的取值范围为
Figure 346848DEST_PATH_IMAGE072
,越接近于0说明模型越好。具体公式如下:
Figure 852916DEST_PATH_IMAGE073
(32)准确率(Accuracy),准确率反映了模型预测的精度。准确率的范围为
Figure 69133DEST_PATH_IMAGE074
,与RMSE相反,准确率的值越接近于1说明模型越好,反之越差:
Figure 889322DEST_PATH_IMAGE075
(33)确定性相关系数(
Figure 241806DEST_PATH_IMAGE032
score),
Figure 184354DEST_PATH_IMAGE032
的取值反应模型的优异程度。范围与准确率相同,具体公式如下:
Figure 809239DEST_PATH_IMAGE076
其中,
Figure 229856DEST_PATH_IMAGE077
表示第t时刻网络流量的实际值,
Figure 702426DEST_PATH_IMAGE078
表示第t时刻网络流量的预测值,
Figure 487979DEST_PATH_IMAGE079
表示数据样本的均值。
本试验优化器选用Adam,学习率设置为0.001,模型训练的迭代次数epoch为2000,批量设置为16,隐藏层数量为64。PSO中惯性因子为0.8,学习因子
Figure 413210DEST_PATH_IMAGE080
都设置为2。
图8显示了PSO在工作日和节假日两个数据集上训练的权值变化,本发明将确定性相关系数(
Figure 827398DEST_PATH_IMAGE032
score)设置为PSO算法的目标函数,通过50次迭代选出
Figure 154474DEST_PATH_IMAGE032
最大时的权值
Figure 438825DEST_PATH_IMAGE031
,它们分别代表时空特征提取单元提取后的特征与周历史数据对最终预测结果的贡献程度。从图8可以看出,最终
Figure 789035DEST_PATH_IMAGE031
在两个数据集上的值分别为(0.922,0.175)和(0.856,0.179)。
本发明设计的MF-GCN与传统时序预测模型和机器学习模型对比:
表1 不同模型评价指标结果
Figure 551455DEST_PATH_IMAGE081
(1)HA:历史平均模型,使用历史的平均值作为预测,在本发明中使用最后4个时间的平均值来预测下一时刻的值。
(2)ARIMA:自回归整合移动平均模型,广泛应用于时间序列的预测模型之一。
(3)SVR:支持向量回归模型,通过对历史数据的训练得到预测结果,具有训练参数少、效果好的优点。本发明采用线性核函数,惩罚系数设置为0.001。
(4)GRU:门控循环单元,循环神经网络的一种变体,能很好的解决输入长序列后梯度消失的问题。
表1显示了不同模型在不同数据集(工作日、节假日)上对未来10分钟、20分钟和30分钟的预测结果评价。其中,各模型分别训练5次后取平均值作为最终结果,由于ARIMA的
Figure 733037DEST_PATH_IMAGE032
值太小,*代表结果数据可忽略。分析表1可看出:
(1)MF-GCN模型的预测误差、预测精度以及相关系数都是最优的。以工作日10分钟的预测步长为例,MF-GCN的Accuracy和
Figure 375240DEST_PATH_IMAGE032
值分别比HA模型高了3.3%和2.7%,RMSE降低了0.533。与ARIMA模型相比,MF-GCN的RMSE和Accuracy分别降低了1.694和提高了21.1%;而与SVR相比,MF-GCN的Accuracy和
Figure 275063DEST_PATH_IMAGE032
提高了3%和2.4%,由于SVR使用的是线性核函数,因此预测效果较差。可以看出,基于神经网络的模型,不管是MF-GCN还是GRU都比其他对比模型的效果要好,分析是由于HA和ARIMA对与这种长序列不平稳数据的拟合能力差,而神经网络模型对非线性数据的拟合能力较好所导致。
(2)MF-GCN模型具有长期预测能力。随着预测时间的增加,MF-GCN模型的预测效果有所降低,但对比其他模型的预测误差、预测精度等评价指标,MF-GCN模型的预测效果仍然是最好的。图9显示了MF-GCN模型在工作日数据集上随着预测时间的增加,Accuracy和
Figure 841174DEST_PATH_IMAGE032
的变化,可以看出Accuracy和
Figure 814946DEST_PATH_IMAGE032
随着预测时间的变化下降。但是下降趋势非常平缓,因此,认为MF-GCN模型受预测时间的影响小,具有稳定的长期预测能力。
(3)对比工作日和节假日两个数据集的预测结果,可以看出MF-GCN模型对于节假日网络流量的预测效果比工作日差。这是由于节假日的网络流量峰值要比工作日的峰值高,流量更具有突变性,因此不容易预测。此外,由于节假日的网络流量不像较为规律的工作日流量,节假日的网络流量随机性更大,因此MF-GCN模型对于工作日的流量预测比节假日的预测更准确。
本发明提出了一种基于图卷积网络融合多特征输入(MF-GCN)的网络流量预测方法,该方法融合了流量的时空特征和周历史信息特征,其中,时空特征由基于邻接特征提取模块AGCN和相关特征提取模块PGCN构成的双通道GCN和GRU提取。在两组真实的数据集上进行训练,结果表明,该模型的预测误差、预测精度和相关系数都优于现有的模型,且具有长期预测的能力。与传统ARIMA模型相比,在工作日数据集上以10分钟的预测长度为例,MF-GCN模型的RMSE和Accuracy分别降低了1.694和提高了21.1%,预测效果明显提高。
实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

Claims (5)

1.一种基于图卷积网络融合多特征输入的网络流量预测方法,其特征在于,包括以下步骤:
(1)获取网络流量数据;
(2)利用皮尔森相关系数对流量进行相关性分析;
(3)采用时空特征提取单元来提取流量间的时空特征;所述时空特征提取单元通过双通道GCN模型提取空间特征,通过GRU模型提取时间特征,时空特征提取单元的输出为
Figure DEST_PATH_IMAGE001
;所述双通道GCN模型包括邻接特征提取模块AGCN和相关特征提取模块PGCN;所述邻接特征提取模块AGCN包括两层GCN模型,其输入为网络流量特征矩阵X及其邻接矩阵;所述相关特征提取模块PGCN包括两层GCN模型,其输入为网络流量特征矩阵X及其相关系数矩阵;
(4)提取历史上每周同一时刻的网络流量数据
Figure 731011DEST_PATH_IMAGE002
,将
Figure 545383DEST_PATH_IMAGE002
构建成与步骤(3)中
Figure 367845DEST_PATH_IMAGE001
相同尺寸的矩阵;
(5)特征融合得到预测结果:
Figure DEST_PATH_IMAGE003
其中,
Figure 444998DEST_PATH_IMAGE004
为权值,
Figure DEST_PATH_IMAGE005
表示哈达玛乘子,
Figure 706215DEST_PATH_IMAGE006
为预测结果。
2.根据权利要求1所述基于图卷积网络融合多特征输入的网络流量预测方法,其特征在于,在步骤(3)中,设
Figure DEST_PATH_IMAGE007
为双通道GCN模型的输出,
Figure 375094DEST_PATH_IMAGE008
为邻接特征提取模块AGCN的输出,
Figure DEST_PATH_IMAGE009
为相关特征提取模块PGCN的输出,则:
Figure 181507DEST_PATH_IMAGE010
其中,“|”表示矩阵的拼接,A为邻接矩阵,P为相关系数矩阵。
3.根据权利要求2所述基于图卷积网络融合多特征输入的网络流量预测方法,其特征在于,邻接特征提取模块AGCN的输出
Figure 935837DEST_PATH_IMAGE008
的表达式如下:
Figure DEST_PATH_IMAGE011
其中,
Figure 745DEST_PATH_IMAGE012
为单位矩阵,
Figure DEST_PATH_IMAGE013
Figure 337179DEST_PATH_IMAGE014
的第i行第j列的元素,
Figure DEST_PATH_IMAGE015
为对角矩阵
Figure 501444DEST_PATH_IMAGE016
的第i行第i列的元素,
Figure DEST_PATH_IMAGE017
为输入层到隐藏层的权重,
Figure 805387DEST_PATH_IMAGE018
为隐藏层到输出层的权重,
Figure DEST_PATH_IMAGE019
表示修正线性单元。
4.根据权利要求2所述基于图卷积网络融合多特征输入的网络流量预测方法,其特征在于,在步骤(3)中,时空特征提取单元的计算过程如下:
Figure 346089DEST_PATH_IMAGE020
其中,
Figure DEST_PATH_IMAGE021
为T时刻网络流量特征
Figure 537030DEST_PATH_IMAGE022
对应的双通道GCN模型的输出,
Figure DEST_PATH_IMAGE023
为GRU模型中的更新门,
Figure 200093DEST_PATH_IMAGE024
为GRU模型中的重置门,
Figure DEST_PATH_IMAGE025
为激活函数,
Figure 663435DEST_PATH_IMAGE026
为T时刻隐藏状态,
Figure DEST_PATH_IMAGE027
为T-1时刻隐藏状态,
Figure 817949DEST_PATH_IMAGE028
为T时刻候选隐藏状态,
Figure DEST_PATH_IMAGE029
为权重,
Figure 112664DEST_PATH_IMAGE030
为偏置项。
5.根据权利要求1所述基于图卷积网络融合多特征输入的网络流量预测方法,其特征在于,在步骤(5)中,采用PSO算法选出
Figure DEST_PATH_IMAGE031
的最优值。
CN202110018129.5A 2021-01-07 2021-01-07 一种基于图卷积网络融合多特征输入的网络流量预测方法 Active CN112350899B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110018129.5A CN112350899B (zh) 2021-01-07 2021-01-07 一种基于图卷积网络融合多特征输入的网络流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110018129.5A CN112350899B (zh) 2021-01-07 2021-01-07 一种基于图卷积网络融合多特征输入的网络流量预测方法

Publications (2)

Publication Number Publication Date
CN112350899A true CN112350899A (zh) 2021-02-09
CN112350899B CN112350899B (zh) 2021-04-06

Family

ID=74427344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110018129.5A Active CN112350899B (zh) 2021-01-07 2021-01-07 一种基于图卷积网络融合多特征输入的网络流量预测方法

Country Status (1)

Country Link
CN (1) CN112350899B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113114672A (zh) * 2021-04-12 2021-07-13 常熟市国瑞科技股份有限公司 一种视频传输数据精细化测量方法
CN113159280A (zh) * 2021-03-23 2021-07-23 出门问问信息科技有限公司 一种六轴传感信号的转换方法及装置
CN113288050A (zh) * 2021-04-23 2021-08-24 山东师范大学 基于图卷积网络的多维增强癫痫发作预测系统
CN113537626A (zh) * 2021-08-03 2021-10-22 西北工业大学 一种聚合信息差异的神经网络结合时间序列预测的方法
CN113660676A (zh) * 2021-07-20 2021-11-16 山东师范大学 基站流量预测方法、系统、存储介质及设备
CN113689052A (zh) * 2021-09-06 2021-11-23 北京航空航天大学 一种基于张量积神经网络的出行需求预测方法
CN113810226A (zh) * 2021-09-07 2021-12-17 清华大学 结合离散特征编码和聚类修正的广域网单点流量预测方法
CN114120637A (zh) * 2021-11-05 2022-03-01 江苏中路工程技术研究院有限公司 一种基于连续监测器的智慧高速交通流量预测方法
CN114124734A (zh) * 2021-11-20 2022-03-01 四川大学 一种基于GCN-Transformer集成模型的网络流量预测方法
CN114158085A (zh) * 2021-11-18 2022-03-08 湖北工业大学 一种基于时空聚合图卷积网络的移动蜂窝流量高效预测方法
CN114238758A (zh) * 2021-12-14 2022-03-25 杭州电子科技大学 一种基于多源跨界数据融合的用户画像预测方法
CN114611383A (zh) * 2022-02-25 2022-06-10 武汉大学 一种基于时空多尺度图卷积网络的交通流预测模型的构建方法以及交通流预测方法
CN114944939A (zh) * 2022-04-26 2022-08-26 武汉大学 网络攻击态势预测模型构建方法、装置、设备及存储介质
CN115225543A (zh) * 2022-07-08 2022-10-21 北京百度网讯科技有限公司 一种流量预测方法、装置、电子设备和存储介质
CN115277258A (zh) * 2022-09-27 2022-11-01 广东财经大学 一种基于时空特征融合的网络攻击检测方法和系统
CN116094758A (zh) * 2022-12-02 2023-05-09 肇庆医学高等专科学校 一种大规模网络流量采集方法及系统
CN116633803A (zh) * 2023-07-24 2023-08-22 四川众力佳华信息技术有限公司 一种新型的网络流量组合预测模型
CN117010567A (zh) * 2023-08-07 2023-11-07 大连理工大学 基于静态时空图的化工过程动态预测方法
CN117421699A (zh) * 2023-12-15 2024-01-19 佳源科技股份有限公司 一种电能表故障融合预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109754605A (zh) * 2019-02-27 2019-05-14 中南大学 一种基于注意力时态图卷积网络的交通预测方法
CN110264709A (zh) * 2019-05-06 2019-09-20 北京交通大学 基于图卷积网络的道路的交通流量的预测方法
CN110555018A (zh) * 2019-07-29 2019-12-10 浙江工业大学 一种交通流量补全与预测方法
US10691998B2 (en) * 2016-12-20 2020-06-23 Google Llc Generating templated documents using machine learning techniques

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10691998B2 (en) * 2016-12-20 2020-06-23 Google Llc Generating templated documents using machine learning techniques
CN109754605A (zh) * 2019-02-27 2019-05-14 中南大学 一种基于注意力时态图卷积网络的交通预测方法
CN110264709A (zh) * 2019-05-06 2019-09-20 北京交通大学 基于图卷积网络的道路的交通流量的预测方法
CN110555018A (zh) * 2019-07-29 2019-12-10 浙江工业大学 一种交通流量补全与预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LI YANG等: "A Noval Satellite Network Traffic Prediction Method Based on GCN-GRU", 《2020 INTERNATIONAL CONFERENCE ON WIRELESS COMMUNICATIONS AND SIGNAL PROCESSING (WCSP)》 *

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159280A (zh) * 2021-03-23 2021-07-23 出门问问信息科技有限公司 一种六轴传感信号的转换方法及装置
CN113114672A (zh) * 2021-04-12 2021-07-13 常熟市国瑞科技股份有限公司 一种视频传输数据精细化测量方法
CN113114672B (zh) * 2021-04-12 2023-02-28 常熟市国瑞科技股份有限公司 一种视频传输数据精细化测量方法
CN113288050A (zh) * 2021-04-23 2021-08-24 山东师范大学 基于图卷积网络的多维增强癫痫发作预测系统
CN113288050B (zh) * 2021-04-23 2022-10-04 山东师范大学 基于图卷积网络的多维增强癫痫发作预测系统
CN113660676A (zh) * 2021-07-20 2021-11-16 山东师范大学 基站流量预测方法、系统、存储介质及设备
CN113660676B (zh) * 2021-07-20 2024-04-30 山东师范大学 基站流量预测方法、系统、存储介质及设备
CN113537626A (zh) * 2021-08-03 2021-10-22 西北工业大学 一种聚合信息差异的神经网络结合时间序列预测的方法
CN113689052A (zh) * 2021-09-06 2021-11-23 北京航空航天大学 一种基于张量积神经网络的出行需求预测方法
CN113810226B (zh) * 2021-09-07 2022-05-03 清华大学 结合离散特征编码和聚类修正的广域网单点流量预测方法
CN113810226A (zh) * 2021-09-07 2021-12-17 清华大学 结合离散特征编码和聚类修正的广域网单点流量预测方法
CN114120637A (zh) * 2021-11-05 2022-03-01 江苏中路工程技术研究院有限公司 一种基于连续监测器的智慧高速交通流量预测方法
CN114158085A (zh) * 2021-11-18 2022-03-08 湖北工业大学 一种基于时空聚合图卷积网络的移动蜂窝流量高效预测方法
CN114124734B (zh) * 2021-11-20 2023-04-07 四川大学 一种基于GCN-Transformer集成模型的网络流量预测方法
CN114124734A (zh) * 2021-11-20 2022-03-01 四川大学 一种基于GCN-Transformer集成模型的网络流量预测方法
CN114238758A (zh) * 2021-12-14 2022-03-25 杭州电子科技大学 一种基于多源跨界数据融合的用户画像预测方法
CN114238758B (zh) * 2021-12-14 2023-04-11 杭州电子科技大学 一种基于多源跨界数据融合的用户画像预测方法
CN114611383A (zh) * 2022-02-25 2022-06-10 武汉大学 一种基于时空多尺度图卷积网络的交通流预测模型的构建方法以及交通流预测方法
CN114611383B (zh) * 2022-02-25 2024-08-09 武汉大学 一种基于时空多尺度图卷积网络的交通流预测模型的构建方法以及交通流预测方法
CN114944939A (zh) * 2022-04-26 2022-08-26 武汉大学 网络攻击态势预测模型构建方法、装置、设备及存储介质
CN114944939B (zh) * 2022-04-26 2023-07-04 武汉大学 网络攻击态势预测模型构建方法、装置、设备及存储介质
CN115225543B (zh) * 2022-07-08 2023-10-20 北京百度网讯科技有限公司 一种流量预测方法、装置、电子设备和存储介质
CN115225543A (zh) * 2022-07-08 2022-10-21 北京百度网讯科技有限公司 一种流量预测方法、装置、电子设备和存储介质
CN115277258A (zh) * 2022-09-27 2022-11-01 广东财经大学 一种基于时空特征融合的网络攻击检测方法和系统
CN116094758A (zh) * 2022-12-02 2023-05-09 肇庆医学高等专科学校 一种大规模网络流量采集方法及系统
CN116094758B (zh) * 2022-12-02 2023-07-21 肇庆医学高等专科学校 一种大规模网络流量采集方法及系统
CN116633803B (zh) * 2023-07-24 2023-10-20 四川众力佳华信息技术有限公司 一种新型的网络流量组合预测模型
CN116633803A (zh) * 2023-07-24 2023-08-22 四川众力佳华信息技术有限公司 一种新型的网络流量组合预测模型
CN117010567A (zh) * 2023-08-07 2023-11-07 大连理工大学 基于静态时空图的化工过程动态预测方法
CN117421699A (zh) * 2023-12-15 2024-01-19 佳源科技股份有限公司 一种电能表故障融合预测方法及系统
CN117421699B (zh) * 2023-12-15 2024-03-01 佳源科技股份有限公司 一种电能表故障融合预测方法及系统

Also Published As

Publication number Publication date
CN112350899B (zh) 2021-04-06

Similar Documents

Publication Publication Date Title
CN112350899B (zh) 一种基于图卷积网络融合多特征输入的网络流量预测方法
CN113450568B (zh) 一种基于时空注意力机制的卷积网络交通流预测模型
CN113313947B (zh) 短期交通预测图卷积网络的路况评估方法
CN110675623B (zh) 基于混合深度学习的短时交通流量预测方法、系统、装置
CN113705880B (zh) 基于时空注意力图卷积网络的交通速度预测方法和装置
CN113852492A (zh) 基于注意力机制和图卷积神经网络的网络流量预测方法
CN112350876A (zh) 一种基于图神经网络的网络流量预测方法
CN110851782A (zh) 一种基于轻量级时空深度学习模型的网络流量预测方法
CN113887328A (zh) 一种eca-cnn融合双通道rnn并行提取光子晶体空间透射谱时空特征的方法
CN110570035A (zh) 同时建模时空依赖性和每日流量相关性的人流量预测系统
CN115828990A (zh) 融合自适应图扩散卷积网络的时空图节点属性预测方法
CN115691129A (zh) 基于注意力的深度残差时空图卷积网络的交通流预测方法
CN110110794A (zh) 基于特征函数滤波的神经网络参数更新的图像分类方法
CN114694379B (zh) 一种基于自适应动态图卷积的交通流预测方法及系统
CN115810149A (zh) 基于超像素与图卷积的高分辨率遥感图像建筑物提取方法
CN114124734B (zh) 一种基于GCN-Transformer集成模型的网络流量预测方法
CN118116194A (zh) 一种基于自适应动态时空图卷积网络的交通状态预测方法
CN118298618A (zh) 一种基于交互空间增强图卷积模型的交通流预测方法
CN117593877A (zh) 一种基于集成图卷积神经网络的短时交通流预测方法
CN114338416A (zh) 一种时空多指标预测方法、装置和存储介质
CN116975642A (zh) 一种使用动态多图融合进行交通流量预测的方法
CN116630113A (zh) 一种基于scc-rce预测单元的预测网络及网格化pm2.5浓度预测方法
CN116070778A (zh) 一种基于多尺度空间特征挖掘的交通流量预测方法
Liu et al. Non-local mean filtering algorithm based on deep learning
CN115841753A (zh) 一种考虑动态空间关系的交通流预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant