CN112350899B - 一种基于图卷积网络融合多特征输入的网络流量预测方法 - Google Patents

一种基于图卷积网络融合多特征输入的网络流量预测方法 Download PDF

Info

Publication number
CN112350899B
CN112350899B CN202110018129.5A CN202110018129A CN112350899B CN 112350899 B CN112350899 B CN 112350899B CN 202110018129 A CN202110018129 A CN 202110018129A CN 112350899 B CN112350899 B CN 112350899B
Authority
CN
China
Prior art keywords
time
gcn
network
matrix
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110018129.5A
Other languages
English (en)
Other versions
CN112350899A (zh
Inventor
潘成胜
朱江
石怀峰
杨雯升
孔志翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Science and Technology
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology, Nanjing University of Information Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN202110018129.5A priority Critical patent/CN112350899B/zh
Publication of CN112350899A publication Critical patent/CN112350899A/zh
Application granted granted Critical
Publication of CN112350899B publication Critical patent/CN112350899B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Educational Administration (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于图卷积网络融合多特征输入的网络流量预测方法,步骤为:获取网络流量数据;利用皮尔森相关系数对流量进行相关性分析;采用时空特征提取单元来提取流量间的时空特征;提取历史上每周同一时刻的网络流量数据;特征融合得到预测结果。本发明解决了传统网络流量预测模型存在无法有效提取流量间的时空特性缺陷而导致的预测误差高、精度低的问题。

Description

一种基于图卷积网络融合多特征输入的网络流量预测方法
技术领域
本发明属于信息工程领域,特别涉及了一种网络流量预测方法。
背景技术
随着网络的快速发展,网络流量任务的需求量日益增大,及时准确的流量预测对于网络管理和规划愈发重要,它能够帮助管理者提前制定资源分配策略,从而有效解决即将到来的过载事件。但是,由于流量间复杂的时空关系,导致传统的预测模型难以准确地预测网络流量。
现有的时间序列预测模型分为线性预测模型以及非线性预测模型,网络流量为典型的时间序列,最初有很多线性模型被用来解决它的预测问题。例如历史平均(HA)模型,它使用历史的平均值作为预测。还有自回归滑动平均(ARMA)和以它为基础组合改进的模型,例如M.Laner等利用ARMA模型对远程相关的网络流量简单拟合预测;Rishabh等利用离散小波变化(DWT)将流量数据分解为非线性(近似)和线性(分量),之后再利用自回归差分移动平均(ARIMA)对非线性分量进行预测。但是,随着网络的发展,网络流量的复杂性及突发性愈发加强,传统的泊松分布、高斯分布等线性模型已不能满足现代网络流量的特点。
随着人工智能的发展,很多机器学习模型被用来预测网络流量,这类非线性预测模型对于非平稳的序列具有很好的预测效果。例如,Qian等提出利用支持向量回归(SVR)模型预测经相空间重构处理后的去噪流量数据。Bie等通过极限学习机(ELM)和结合分解果蝇优化算法的ELM(FOA-ELM)预测流量分解后的低频分量和高频分量。K.Sebastian等利用门控循环单元(GRU)模型来预测基站流量,GRU是循环神经网络(RNN)的一种变体,有一定解决RNN长期依赖的能力。这些模型能很好地提取流量数据的时间特征,但忽略了序列间的空间相关性。
为了更好地提取流量数据的空间特征,Li等提出卷积神经网络(CNN)融合长短期记忆网络(LSTM)的模型进行预测,CNN通过卷积层和池化层能有效地捕捉空间相关性。但是,CNN通常应用于图像这类规则的欧式数据,不能从本质上很好地描述网络复杂拓扑节点间的空间相关性。Q.Zhang等人将图论与神经网络结合起来,定义了图在傅里叶域的滤波器,随后图卷积网络(GCN)被广泛应用在知识图谱以及交通流量的预测上。但传统GCN只能描述网络节点间的连通性,不能捕捉网络节点间的近相关性,进而不能有效提取网络流量的时空相关性。
发明内容
为了解决上述背景技术提到的技术问题,本发明提出了一种基于图卷积网络融合多特征输入的网络流量预测方法。
为了实现上述技术目的,本发明的技术方案为:
一种基于图卷积网络融合多特征输入的网络流量预测方法,其特征在于,包括以下步骤:
(1)获取网络流量数据;
(2)利用皮尔森相关系数对流量进行相关性分析;
(3)采用时空特征提取单元来提取流量间的时空特征;所述时空特征提取单元通过双通道GCN模型提取空间特征,通过GRU模型提取时间特征,时空特征提取单元的输出为
Figure GDA0002954024310000021
所述双通道GCN模型包括邻接特征提取模块AGCN和相关特征提取模块PGCN;所述邻接特征提取模块AGCN包括两层GCN模型,其输入为网络流量特征矩阵X及其邻接矩阵;所述相关特征提取模块PGCN包括两层GCN模型,其输入为网络流量特征矩阵X及其相关系数矩阵;
(4)提取历史上每周同一时刻的网络流量数据
Figure GDA0002954024310000031
Figure GDA0002954024310000032
构建成与步骤(3)中
Figure GDA0002954024310000033
相同尺寸的矩阵;
(5)特征融合得到预测结果:
Figure GDA0002954024310000034
其中,P1、P2为权值,⊙表示哈达玛乘子,
Figure GDA0002954024310000035
为预测结果。
进一步地,在步骤(3)中,设f(X,A,P)为双通道GCN模型的输出,f(X,A)为邻接特征提取模块AGCN的输出,f(X,P)为相关特征提取模块PGCN的输出,则:
f(X,A,P)=[f(X,A)|f(X,P)]
其中,“|”表示矩阵的拼接,A为邻接矩阵,P为相关系数矩阵。
进一步地,邻接特征提取模块AGCN的输出f(X,A)的表达式如下:
Figure GDA0002954024310000036
其中,
Figure GDA0002954024310000037
II为单位矩阵,
Figure GDA0002954024310000038
Figure GDA0002954024310000039
Figure GDA00029540243100000310
的第i行第j列的元素,
Figure GDA00029540243100000311
为对角矩阵
Figure GDA00029540243100000312
的第i行第i列的元素,W(l-1)为输入层到隐藏层的权重,W(l)为隐藏层到输出层的权重,ReLU表示修正线性单元。
进一步地,在步骤(3)中,时空特征提取单元的计算过程如下:
Γu=σ(Wu[f(XT,A,P),hT-1]+bu)
Γr=σ(Wr[f(XT,A,P),hT-1]+br)
Figure GDA00029540243100000313
Figure GDA00029540243100000314
其中,f(XT,A,P)为T时刻网络流量特征XT对应的双通道GCN模型的输出,Γu为GRU模型中的更新门,Γr为GRU模型中的重置门,σ为激活函数,hT为T时刻隐藏状态,hT-1为T-1时刻隐藏状态,
Figure GDA00029540243100000315
为T时刻候选隐藏状态,Wu、Wr、Wc为权重,bu、br、bc为偏置项。
进一步地,在步骤(5)中,采用PSO算法选出P1、P2的最优值。
采用上述技术方案带来的有益效果:
本发明融合了流量的时空特征和周历史信息特征,其中,时空特征由基于邻接特征提取模块AGCN和相关特征提取模块PGCN构成的双通道GCN和GRU提取,解决了传统网络流量预测模型存在无法有效提取流量间的时空特性的缺陷而导致的预测误差高、精度低的问题。分析结果表明,与传统ARIMA模型相比,以10分钟的预测长度为例,本发明的RMSE和Accuracy分别降低了1.694和提高了21.1%,预测效果明显提高,且本发明具有长期预测的能力。
附图说明
图1是网络流量的空间依赖图;
图2是网络流量的周趋势图;
图3是网络流量的日趋势图;
图4是本发明利用皮尔森相关系数对数据进行相关性分析的热度图;
图5是本发明提出的双通道GCN结构图;
图6是GRU模型的结构图;
图7是本发明的整体方法流程图;
图8是本发明利用PSO算法选择权值的结果图;
图9是本发明多步预测后的Accuracy和R2结果图。
具体实施方式
以下将结合附图,对本发明的技术方案进行详细说明。
本发明提出了一种基于图卷积网络融合多特征输入的网络流量预测方法,能够捕捉网络流量间的时空相关性。
首先要获取原始流量数据,为了验证有效性,本发明选取一个开放的数据集作为实验数据。这个数据集包含米兰市流量网络数据,其下载地址为https://dataverse.harvard.edu/dataset.xhtmlpersistentId=doi:10.7910/DVN/EGZHFV。数据集的采样频率为10min/次,即一天包含144个采样点。选用9个区域的两组数组进行模型评估:(1)工作日:2013年11月1日-2014年11月29日;(2)节假日:2013年11月3日-2013年12月1日。
图1、图2、图3描述了网络流量的时空相关性。图1中每个节点间的线代表他们之间相互影响的权重,其中,颜色越深代表权重越大。可以看出节点A不同位置的相邻节点对它的影响是不同的,同一个节点在一天内不同时刻对A点的影响也是变化的。A节点一周以及一天内的流量变化分别如图2、3所示,可以看出网络流量在一周内呈现周期性变化;一天内的流量也会随着时间的变化表现出白天高、晚上低的趋势。总之,当前的网络流量会受到前一刻、甚至是历史一周相同时刻的流量的影响,并且在时间和空间维度上都是相互依赖的。因此,有效提取数据的时空特性对于准确地预测网络流量至关重要。
图4是利用皮尔森相关系数对数据进行相关性分析的热度图。图是一种数据格式,通过点、边来描述个体以及个体间的关系。图卷积网络(GCN)是图结构数据在深度学习中的应用,与传统的卷积神经网络(CNN)不同的是,GCN对图信号的卷积操作是在傅里叶域进行。处理图结构首先需要获取拉普拉斯矩阵L=D-A,将矩阵L归一化可得:
Figure GDA0002954024310000051
其中,II为单位矩阵;D为节点构成的度矩阵,度矩阵为对角矩阵,Dii=∑jAij,Aij为邻接矩阵A中的元素;等式后半部分由拉普拉斯矩阵L分解得到,U=(u1,...,ui)、Λ=diag([λ1,...,λi])分别为分解后的特征向量及特征值构成的对角矩阵。
频谱卷积可定义为信号和滤波器在傅里叶域的乘积,本发明利用一阶的切比雪夫多项式近似计算(k=1),结果如下式所示:
Figure GDA0002954024310000061
其中,gθ表示卷积核,θ为模型参数。为避免数值过大导致梯度消失,令
Figure GDA0002954024310000062
Figure GDA0002954024310000063
则第l层的输出可表示为:
Figure GDA0002954024310000064
σ是类似于ReLU、sigmoid的激活函数,W(l-1)是l-1层的权重参数。因此,给定网络流量特征矩阵X和邻接矩阵A,GCN可以通过输入节点的频谱卷积来提取节点间的空间特征。结合上式,令
Figure GDA0002954024310000065
输入经两层GCN模型的映射后为:
Figure GDA0002954024310000066
其中,
Figure GDA0002954024310000067
分别表示输入层到隐藏层、隐藏层到输出层的权重。这里H为隐藏层单元数,属于超参数。
传统GCN都是根据节点间的连通性来设置邻接矩阵,本发明设置的邻接矩阵元素定义如下:
Figure GDA0002954024310000068
这种确定流量网络邻接矩阵的方法具有一定的合理性,认为联通节点间的相关程度比不连通的节点高。但是每个目标节点都有多个联通节点,不是每个联通节点对目标节点的影响都相同。为解决这一问题,本发明利用皮尔森相关系数PX,Y对不同节点间的影响进行分析,PX,Y的定义如下:
Figure GDA0002954024310000069
其中,cov(X,Y)为连续变量(X,Y)之间的协方差,σX、σY分别为X、Y的标准差。
从图4可以看出,不同网络节点之间具有空间相关性。其次,相邻节点(B,C,D,E)与目标节点A的空间相关性不同,存在相关系数小于0.9的节点,而到A点需要多跳的节点相关系数有大于0.9的。因此,传统设置邻接矩阵的方式不能很好的描述流量网络的空间关系。本发明提出一种新的双通道GCN模型来提取空间特征,其模型结构如图5所示。双通道GCN模型在基础的GCN模型上构建,由邻接特征提取模块AGCN和相关特征提取模块PGCN构成,Concat后的结果为:
f(X,A,P)=[f(X,A)|f(X,P)]
其中,“|”代表矩阵的拼接,相关特征提取模块的邻接矩阵由皮尔森相关系数矩阵代替,与邻接特征提取模块提取的特征融合,更加全面的提取了网络节点的空间特征。
图6是GRU模型的结构图。其中,hT-1表示T-1时刻的隐藏状态,XT表示T时刻的流量特征。T时刻的隐藏状态hT通过更新门Γu来确定是维持上一时刻的隐藏状态hT-1,还是更新为T时刻的候选隐藏状态
Figure GDA0002954024310000071
Γu通过σ函数来使自身等于近似于0或1的值。Γr为重置门,用于控制忽略上一状态信息hT-1的程度。GRU的结构可以捕捉非常长范围的依赖,能很好的提取长相关性序列的时间特征,非常适用于网络流量这种典型时间序列的预测。
对获取的原始流量数据建立基于图卷积网络融合多特征输入的模型进行预测。其过程具体实现如下:
(1)每组数据为9×288个,其中前80%作为训练集,初次训练选取训练集中10%的数据作为验证集,保存好最佳模型后继续用完整的训练集进行训练,后20%数据作测试集。预测前利用MinMaxScaler函数对样本数据进行归一化操作,使数据规范在[0,1]区间,输出结果前再进行反归一化操作。
(2)为同时提取流量数据的时空相关性,本发明提出一种基于图卷积网络融合多特征输入(MF-GCN)的网络流量预测方法,模型结构如图7所示。将(1)中处理好的数据输入MF-GCN模型,其过程具体实现如下:
(21)首先数据输入时空特征提取单元,下式为具体计算过程,其中,f(XT,A,P)为输入经GCN提取空间特性后的输出,W、b分别为权重和偏置项,经时空特征提取单元提取后的输出为
Figure GDA0002954024310000081
Γu=σ(Wu[f(XT,A,P),hT-1]+bu)
Γr=σ(Wr[f(XT,A,P),hT-1]+br)
Figure GDA0002954024310000082
Figure GDA0002954024310000083
(22)由于当前网络流量会受到历史时刻的影响,因此本发明提取历史上每周同一时刻的网络流量信息
Figure GDA0002954024310000084
Figure GDA0002954024310000085
直接构建成与(21)中输出
Figure GDA0002954024310000086
同尺寸的矩阵。
(23)特征融合:
Figure GDA0002954024310000087
使用
Figure GDA0002954024310000088
Figure GDA0002954024310000089
加权后的和
Figure GDA00029540243100000810
作为最终的预测结果,其中,利用PSO算法选出最优权值P1和P2
(3)为了充分验证模型的预测能力,本发明进行了单步预测与多步预测来预测未来10分钟、20分钟和30分钟网络流量。此外,本发明选取了三种评价指标作为评判模型效果好坏的指标,具体如下:
(31)均方根误差(RMSE),RMSE反映了模型预测误差。RMSE的取值范围为[0,+∞),越接近于0说明模型越好。具体公式如下:
Figure GDA00029540243100000811
(32)准确率(Accuracy),准确率反映了模型预测的精度。准确率的范围为[0,1],与RMSE相反,准确率的值越接近于1说明模型越好,反之越差:
Figure GDA00029540243100000812
(33)确定性相关系数(R2 score),R2的取值反应模型的优异程度。范围与准确率相同,具体公式如下:
Figure GDA0002954024310000091
其中,Yt表示第t时刻网络流量的实际值,
Figure GDA0002954024310000092
表示第t时刻网络流量的预测值,
Figure GDA0002954024310000093
表示数据样本的均值。
本试验优化器选用Adam,学习率设置为0.001,模型训练的迭代次数epoch为2000,批量设置为16,隐藏层数量为64。PSO中惯性因子为0.8,学习因子c1,c2都设置为2。
图8显示了PSO在工作日和节假日两个数据集上训练的权值变化,本发明将确定性相关系数(R2 score)设置为PSO算法的目标函数,通过50次迭代选出R2最大时的权值P1、P2,它们分别代表时空特征提取单元提取后的特征与周历史数据对最终预测结果的贡献程度。从图8可以看出,最终P1、P2在两个数据集上的值分别为(0.922,0.175)和(0.856,0.179)。
本发明设计的MF-GCN与传统时序预测模型和机器学习模型对比:
表1不同模型评价指标结果
Figure GDA0002954024310000094
(1)HA:历史平均模型,使用历史的平均值作为预测,在本发明中使用最后4个时间的平均值来预测下一时刻的值。
(2)ARIMA:自回归整合移动平均模型,广泛应用于时间序列的预测模型之一。
(3)SVR:支持向量回归模型,通过对历史数据的训练得到预测结果,具有训练参数少、效果好的优点。本发明采用线性核函数,惩罚系数设置为0.001。
(4)GRU:门控循环单元,循环神经网络的一种变体,能很好的解决输入长序列后梯度消失的问题。
表1显示了不同模型在不同数据集(工作日、节假日)上对未来10分钟、20分钟和30分钟的预测结果评价。其中,各模型分别训练5次后取平均值作为最终结果,由于ARIMA的R2值太小,*代表结果数据可忽略。分析表1可看出:
(1)MF-GCN模型的预测误差、预测精度以及相关系数都是最优的。以工作日10分钟的预测步长为例,MF-GCN的Accuracy和R2值分别比HA模型高了3.3%和2.7%,RMSE降低了0.533。与ARIMA模型相比,MF-GCN的RMSE和Accuracy分别降低了1.694和提高了21.1%;而与SVR相比,MF-GCN的Accuracy和R2提高了3%和2.4%,由于SVR使用的是线性核函数,因此预测效果较差。可以看出,基于神经网络的模型,不管是MF-GCN还是GRU都比其他对比模型的效果要好,分析是由于HA和ARIMA对与这种长序列不平稳数据的拟合能力差,而神经网络模型对非线性数据的拟合能力较好所导致。
(2)MF-GCN模型具有长期预测能力。随着预测时间的增加,MF-GCN模型的预测效果有所降低,但对比其他模型的预测误差、预测精度等评价指标,MF-GCN模型的预测效果仍然是最好的。图9显示了MF-GCN模型在工作日数据集上随着预测时间的增加,Accuracy和R2的变化,可以看出Accuracy和R2随着预测时间的变化下降。但是下降趋势非常平缓,因此,认为MF-GCN模型受预测时间的影响小,具有稳定的长期预测能力。
(3)对比工作日和节假日两个数据集的预测结果,可以看出MF-GCN模型对于节假日网络流量的预测效果比工作日差。这是由于节假日的网络流量峰值要比工作日的峰值高,流量更具有突变性,因此不容易预测。此外,由于节假日的网络流量不像较为规律的工作日流量,节假日的网络流量随机性更大,因此MF-GCN模型对于工作日的流量预测比节假日的预测更准确。
本发明提出了一种基于图卷积网络融合多特征输入(MF-GCN)的网络流量预测方法,该方法融合了流量的时空特征和周历史信息特征,其中,时空特征由基于邻接特征提取模块AGCN和相关特征提取模块PGCN构成的双通道GCN和GRU提取。在两组真实的数据集上进行训练,结果表明,该模型的预测误差、预测精度和相关系数都优于现有的模型,且具有长期预测的能力。与传统ARIMA模型相比,在工作日数据集上以10分钟的预测长度为例,MF-GCN模型的RMSE和Accuracy分别降低了1.694和提高了21.1%,预测效果明显提高。
实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

Claims (2)

1.一种基于图卷积网络融合多特征输入的网络流量预测方法,其特征在于,包括以下步骤:
(1)获取网络流量数据;
(2)利用皮尔森相关系数对流量进行相关性分析;
(3)采用时空特征提取单元来提取流量间的时空特征;所述时空特征提取单元通过双通道GCN模型提取空间特征,通过GRU模型提取时间特征,时空特征提取单元的输出为
Figure FDA0002954024300000011
所述双通道GCN模型包括邻接特征提取模块AGCN和相关特征提取模块PGCN;所述邻接特征提取模块AGCN包括两层GCN模型,其输入为网络流量特征矩阵X及其邻接矩阵;所述相关特征提取模块PGCN包括两层GCN模型,其输入为网络流量特征矩阵X及其相关系数矩阵;
设f(X,A,P)为双通道GCN模型的输出,f(X,A)为邻接特征提取模块AGCN的输出,f(X,P)为相关特征提取模块PGCN的输出,则:
f(X,A,P)=[f(X,A)|f(X,P)]
其中,“|”表示矩阵的拼接,A为邻接矩阵,P为相关系数矩阵;
邻接特征提取模块AGCN的输出f(X,A)的表达式如下:
Figure FDA0002954024300000012
其中,
Figure FDA0002954024300000013
II为单位矩阵,
Figure FDA0002954024300000014
Figure FDA0002954024300000015
的第i行第j列的元素,
Figure FDA0002954024300000016
为对角矩阵
Figure FDA0002954024300000017
的第i行第i列的元素,W(l-1)为输入层到隐藏层的权重,W(l)为隐藏层到输出层的权重,ReLU表示修正线性单元;
时空特征提取单元的计算过程如下:
Γu=σ(Wu[f(XT,A,P),hT-1]+bu)
Γr=σ(Wr[f(XT,A,P),hT-1]+br)
Figure FDA0002954024300000021
Figure FDA0002954024300000022
其中,f(XT,A,P)为T时刻网络流量特征XT对应的双通道GCN模型的输出,Γu为GRU模型中的更新门,Γr为GRU模型中的重置门,σ为激活函数,hT为T时刻隐藏状态,hT-1为T-1时刻隐藏状态,
Figure FDA0002954024300000023
为T时刻候选隐藏状态,Wu、Wr、Wc为权重,bu、br、bc为偏置项;
(4)提取历史上每周同一时刻的网络流量数据
Figure FDA0002954024300000024
Figure FDA0002954024300000025
构建成与步骤(3)中
Figure FDA0002954024300000026
相同尺寸的矩阵;
(5)特征融合得到预测结果:
Figure FDA0002954024300000027
其中,P1、P2为权值,⊙表示哈达玛乘子,
Figure FDA0002954024300000028
为预测结果。
2.根据权利要求1所述基于图卷积网络融合多特征输入的网络流量预测方法,其特征在于,在步骤(5)中,采用PSO算法选出P1、P2的最优值。
CN202110018129.5A 2021-01-07 2021-01-07 一种基于图卷积网络融合多特征输入的网络流量预测方法 Active CN112350899B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110018129.5A CN112350899B (zh) 2021-01-07 2021-01-07 一种基于图卷积网络融合多特征输入的网络流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110018129.5A CN112350899B (zh) 2021-01-07 2021-01-07 一种基于图卷积网络融合多特征输入的网络流量预测方法

Publications (2)

Publication Number Publication Date
CN112350899A CN112350899A (zh) 2021-02-09
CN112350899B true CN112350899B (zh) 2021-04-06

Family

ID=74427344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110018129.5A Active CN112350899B (zh) 2021-01-07 2021-01-07 一种基于图卷积网络融合多特征输入的网络流量预测方法

Country Status (1)

Country Link
CN (1) CN112350899B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159280A (zh) * 2021-03-23 2021-07-23 出门问问信息科技有限公司 一种六轴传感信号的转换方法及装置
CN113114672B (zh) * 2021-04-12 2023-02-28 常熟市国瑞科技股份有限公司 一种视频传输数据精细化测量方法
CN113288050B (zh) * 2021-04-23 2022-10-04 山东师范大学 基于图卷积网络的多维增强癫痫发作预测系统
CN113660676B (zh) * 2021-07-20 2024-04-30 山东师范大学 基站流量预测方法、系统、存储介质及设备
CN113537626B (zh) * 2021-08-03 2023-05-05 西北工业大学 一种聚合信息差异的神经网络结合时间序列预测的方法
CN113689052A (zh) * 2021-09-06 2021-11-23 北京航空航天大学 一种基于张量积神经网络的出行需求预测方法
CN113810226B (zh) * 2021-09-07 2022-05-03 清华大学 结合离散特征编码和聚类修正的广域网单点流量预测方法
CN114120637A (zh) * 2021-11-05 2022-03-01 江苏中路工程技术研究院有限公司 一种基于连续监测器的智慧高速交通流量预测方法
CN114158085B (zh) * 2021-11-18 2023-07-21 湖北工业大学 一种基于时空聚合图卷积网络的移动蜂窝流量高效预测方法
CN114124734B (zh) * 2021-11-20 2023-04-07 四川大学 一种基于GCN-Transformer集成模型的网络流量预测方法
CN114238758B (zh) * 2021-12-14 2023-04-11 杭州电子科技大学 一种基于多源跨界数据融合的用户画像预测方法
CN114944939B (zh) * 2022-04-26 2023-07-04 武汉大学 网络攻击态势预测模型构建方法、装置、设备及存储介质
CN115225543B (zh) * 2022-07-08 2023-10-20 北京百度网讯科技有限公司 一种流量预测方法、装置、电子设备和存储介质
CN115277258B (zh) * 2022-09-27 2022-12-20 广东财经大学 一种基于时空特征融合的网络攻击检测方法和系统
CN116094758B (zh) * 2022-12-02 2023-07-21 肇庆医学高等专科学校 一种大规模网络流量采集方法及系统
CN116633803B (zh) * 2023-07-24 2023-10-20 四川众力佳华信息技术有限公司 一种新型的网络流量组合预测模型
CN117010567A (zh) * 2023-08-07 2023-11-07 大连理工大学 基于静态时空图的化工过程动态预测方法
CN117421699B (zh) * 2023-12-15 2024-03-01 佳源科技股份有限公司 一种电能表故障融合预测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110264709A (zh) * 2019-05-06 2019-09-20 北京交通大学 基于图卷积网络的道路的交通流量的预测方法
CN110555018A (zh) * 2019-07-29 2019-12-10 浙江工业大学 一种交通流量补全与预测方法
US10691998B2 (en) * 2016-12-20 2020-06-23 Google Llc Generating templated documents using machine learning techniques

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109754605B (zh) * 2019-02-27 2021-12-07 中南大学 一种基于注意力时态图卷积网络的交通预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10691998B2 (en) * 2016-12-20 2020-06-23 Google Llc Generating templated documents using machine learning techniques
CN110264709A (zh) * 2019-05-06 2019-09-20 北京交通大学 基于图卷积网络的道路的交通流量的预测方法
CN110555018A (zh) * 2019-07-29 2019-12-10 浙江工业大学 一种交通流量补全与预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
A Noval Satellite Network Traffic Prediction Method Based on GCN-GRU;Li Yang等;《2020 International Conference on Wireless Communications and Signal Processing (WCSP)》;20201023;全文 *

Also Published As

Publication number Publication date
CN112350899A (zh) 2021-02-09

Similar Documents

Publication Publication Date Title
CN112350899B (zh) 一种基于图卷积网络融合多特征输入的网络流量预测方法
CN110675623B (zh) 基于混合深度学习的短时交通流量预测方法、系统、装置
CN112801404B (zh) 一种基于自适应空间自注意力图卷积的交通预测方法
CN113450568B (zh) 一种基于时空注意力机制的卷积网络交通流预测模型
CN113313947B (zh) 短期交通预测图卷积网络的路况评估方法
CN113852492A (zh) 基于注意力机制和图卷积神经网络的网络流量预测方法
CN113053115B (zh) 一种基于多尺度图卷积网络模型的交通预测方法
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
CN112350876A (zh) 一种基于图神经网络的网络流量预测方法
CN112988723A (zh) 一种基于空间自注意力图卷积循环神经网络的交通数据修复方法
CN109886387B (zh) 一种基于门控网络和梯度提升回归的交通时序预测方法
CN110570035B (zh) 同时建模时空依赖性和每日流量相关性的人流量预测系统
CN114221790A (zh) 一种基于图注意力网络的bgp异常检测方法及系统
CN113887328A (zh) 一种eca-cnn融合双通道rnn并行提取光子晶体空间透射谱时空特征的方法
CN112560918A (zh) 一种基于改进YOLO v3的菜品识别方法
CN110689183A (zh) 一种集群光伏功率概率预测方法、系统、介质及电子设备
CN113505924A (zh) 一种基于级联时空特征的信息传播预测方法及系统
CN114124734B (zh) 一种基于GCN-Transformer集成模型的网络流量预测方法
CN115828990A (zh) 融合自适应图扩散卷积网络的时空图节点属性预测方法
Feng et al. Hyperspectral band selection based on ternary weight convolutional neural network
CN114338416B (zh) 一种时空多指标预测方法、装置和存储介质
CN116094758B (zh) 一种大规模网络流量采集方法及系统
CN116386312A (zh) 一种交通量预测模型的构建方法和系统
CN115496202A (zh) 面向交通拥堵预测的可解释性时空分析方法
CN113988415A (zh) 一种中长期电力负荷预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant