CN112911626A - 基于多图卷积的无线网络流量预测方法 - Google Patents

基于多图卷积的无线网络流量预测方法 Download PDF

Info

Publication number
CN112911626A
CN112911626A CN202110134411.XA CN202110134411A CN112911626A CN 112911626 A CN112911626 A CN 112911626A CN 202110134411 A CN202110134411 A CN 202110134411A CN 112911626 A CN112911626 A CN 112911626A
Authority
CN
China
Prior art keywords
flow
graph
matrix
traffic
graph convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110134411.XA
Other languages
English (en)
Other versions
CN112911626B (zh
Inventor
陈由甲
林建圣
郑海峰
胡锦松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN202110134411.XA priority Critical patent/CN112911626B/zh
Publication of CN112911626A publication Critical patent/CN112911626A/zh
Application granted granted Critical
Publication of CN112911626B publication Critical patent/CN112911626B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种基于多图卷积的无线网络流量预测方法,首先,在空间上构建相邻图、功能相似图和空域流量相关图,并利用图卷积网络提取空间上的特征;其次,在时域上构建近期、日周期和周周期相关流量,将三种时域流量输入到长短期记忆网络,最后加上注意力机制判断不同时刻流量的重要程度。并引入均方根、平均绝对误差和确定系数评估所提模型的预测性能。本发明方法具有建模合理,预测精度高等特点。

Description

基于多图卷积的无线网络流量预测方法
技术领域
本发明属于无线通信,图论和深度学习技术领域,特别涉及图卷积网络,长短期记忆网络,注意力机制等方面,尤其涉及一种基于多图卷积的无线网络流量预测方法。
背景技术
随着5G时代的到来,无线网络发生了巨大变化,特别是大量布局无线基站,使得无线蜂窝数据急剧上升,因此精确的无线网络流量预测对于运营商来说至关重要;同时面超密集的基站分布,要实现更为高效的流量预测是前所未有的挑战。要实现流量预测首先就要知道流量的时空特性及其相关数据的分布情况,对未来的流量进行合理,准确的预测。传统的流量预测方法在准确度和效率上都欠佳,随着人工智能的迅猛发展,各个领域都逐步探索将人工智能技术引人本领域的研究中。
对流量进行精准预测,能够实现基站能耗控制,流量异常检测,提前知道热点地区,从而为无限资源分配等提供合理的依据,进一步提升用户体验,建立良好的运营生态环境。利用人工智能技术能加快对流量的预测,并且预测精度高,流量预测是后续一系列智能优化的前提,因此流量预测至关重要。
发明内容
有鉴于此,本发明的目的在于提供一种基于多图卷积的无线网络流量预测方法,根据分析历史流量数据,挖掘流量的时空特性,构建与流量预测相关联的不同图信息,再利用图谱理论,人工智能技术对构建的图进行分析,最后提出三种流量预测评价指标,来评估流量预测的效果。
本发明构建多图卷积网络对无线流量进行预测。首先,在空间上构建相邻图、功能相似图和空域流量相关图,并利用图卷积网络提取空间上的特征;其次,在时域上构建近期、日周期和周周期相关流量,将三种时域流量输入到长短期记忆网络,最后加上注意力机制判断不同时刻流量的重要程度。并引入均方根、平均绝对误差和确定系数评估所提模型的预测性能。包括以下步骤:步骤S1:根据历史流量数据,从中选择与无线流量相关流量特征;步骤S2:分析流量时空特性,构建流量预测框架,主要包括构建相邻图,区域功能相似图,空间流量相关图这个三类流量相关信息图;时间特性主要构建三通道流量数据:之前Tr时隙的流量,日周期流量,周周期流量。步骤S3:构建多图的图卷积网络,长短期记忆网络,注意力机制等深度学习技术对流量进行预测。步骤S4:采用均方根、平均绝对误差和确定系数三种指标对预测流量进行评估。
本发明是一种构建多图的图卷积网络进行流量预测,通过设置以上步骤,实现了对流量的预测,且与其他类型的流量预测模型相对比,表现出更好的预测效果。为了对实现对流量的精准预测,首先对数据进行分析,把握与流量相关联的数据特征,根据分析构建了相邻图、区域功能相似图和空间流量相关图来描述与流量相关联的数据信息,并且引入三个时间维度信息:之前Tr时隙的流量模式,每天的流量模式,每个星期的流量模式,再利用图卷积网络、长短期记忆网络和注意力机制实现流量预测,最后采用均方根、平均绝对误差和确定系数三种指标对预测流量进行评估。本发明方法具有建模合理,预测精度高等特点。
本发明具体采用以下技术方案:
一种基于多图卷积的无线网络流量预测方法,其特征在于,包括以下步骤:
步骤S1:根据历史流量数据,从中选择与无线流量相关的流量特征用于预测t+1时刻的流量;
步骤S2:分析流量时空特性,构建流量预测框架:包括构建空间特性的:相邻图、区域功能相似图和空间流量相关图;以及构建时间特性的三通道流量数据:之前Tr时隙的流量、日周期流量和周周期流量;
步骤S3:构建多图的图卷积网络、多通道的长短期记忆网络和注意力机制;其中,注意力机制对流量序列重要程度的不同进行权重的自动匹配。
优选地,还包括:步骤S4:采用均方根、平均绝对误差和确定系数三种指标对预测流量进行评估。
优选地,步骤S1具体包括以下步骤:
步骤S11:将历史流量数据的所属地点网格化;
步骤S12:将每个网格的蜂窝流量信息由时空序列表示。
优选地,在步骤S1中,每个网格包含的数据有三种:短信服务、语音电话和上网流量;数据包括每个网格ID,时间戳,收发短信和呼入呼出的信息;并将时间间隔设置成一小时。
优选地,在步骤S1中,利用的数据还包括:各网格区域的(建筑)兴趣点,社交活动数量和基站分布数量。
在步骤S1中,可以标识每个时隙t各个地区的流量服务类型,并且构建矩阵Xt,标识每个地区的兴趣点,构建矩阵P;标识每个地区的基站数量,构建矩B。
优选地,在步骤S2中,构建相邻图,功能相似图和空间流量相关图具体包括以下过程:
图用G=(V,A)表示,其中,V表示图的节点即每个网格,A表示邻接矩阵,三种图的邻接矩阵如下:
相邻图GN=(V,AN)中网格节点h和网格节点w之间的邻接矩阵中的元素
Figure BDA0002926144150000031
利用这两个网格的欧氏距离来表示:
Figure BDA0002926144150000032
其中,||·||代表二范数,||vh-vw||表示节点h,w之间的欧氏距离,σ表示标准差;
功能相似图GF=(V,AF)中网格节点h和网格节点w之间的邻接矩阵中的元素
Figure BDA0002926144150000033
利用余弦相似函数的计算结果来表示:
Figure BDA0002926144150000034
其中,<·>代表内积,||·||代表二范数,rh和rw分别为节点h和w的特征向量;
空间流量相关图GS=(V,AS)中网格节点h和网格节点w之间的邻接矩阵中的元素
Figure BDA0002926144150000035
利用两个网格流量之间的皮尔逊系数来表示:
Figure BDA0002926144150000036
其中,ρ(·)代表皮尔逊系数,vh,vm分别表示节点h和w上的流量序列。
优选地,在步骤S2中,构建三通道流量数据具体包括以下过程:
之前Tr时隙的流量:根据流量的时域连续性原则,下一时隙的流量必然与之前Tr个时隙相关,由此构建流量向量Xr
Figure BDA0002926144150000041
之前Td天的日周期流量Xd,例如要预测周三上午8点的流量,就要用周三之前Td天上午8点的流量构成,其数学表达为:
Figure BDA0002926144150000042
其中,TP代表流量序列的长度,Td代表日周期模块流量的天数;
之前Tw周的周周期流量,例如要预测周三上午8点的流量,就要用到之前Tw个周三上午8点的流量构成,其数学表达为:
Figure BDA0002926144150000043
其中,Tw代表周周期模块流量的周数。
在步骤S2之中,通过分析流量时空特性,将每个网格当作图的节点,网格之间的特征关系用邻接矩阵表示。考虑到流量预测与多个维度空间特性有关,根据用户在一段时间内的活动范围有限,由此可以构建与当前节点相邻的相邻图,从而发现当前节点的流量与相邻节点的关系;根据每个区域(网格)在某些时间内POI相似的地方应该会具有相似的流量特性,因此可以根据每个区域功能相似的节点构建功能相似图;由于相邻图只体现了位置相关性,因此也可以构建空间流量相关图来描述流量的空间相关特性。在时间域,根据流量的时域连续性原则,下一时隙的流量必然与前几个时隙流量相关,并且与每天和每周相同时隙的流量相关。
其具体实现的过程如下:
1)构建多图:根据图论,图可以用节点和邻接矩阵表示,即G=(V,A),相邻图GN=(V,AN),区域功能相似图GF=(V,AF),空间流量相关图GS=(V,As)。相邻图利用两个节点之间的欧式距离来构建邻接矩阵,节点h和w的欧式距离为||vh-vw||,功能相似图利用余弦相似函数描述,空间流量相关图利用两个网格流量之间的皮尔逊系数描述。
2)在时间域中利用离散傅立叶变换去观察流量的频率分布;关键信息集中在前Tr时隙的流量,日周期流量,周周期流量。
优选地,在步骤S3中,构建多图的图卷积网络对流量进行预测具体包括:
根据定义的邻接矩阵,得到拉普拉斯矩阵L=D-A,并归一化拉普拉斯矩阵为L=IN-D-1/2AD-1/2=U∧UT
其中,IN为单位矩阵,D∈RV×V为度矩阵,是对角矩阵,对角线上的元素代表该节点与其他节点连接的个数;邻接矩阵A∈RV×V是对称矩阵,矩阵U是归一化拉普拉斯矩阵的特征向量,A∈RV×V是特征值组成的对角矩阵,此外RV×V表示维度为v×v的实数集;
进一步将图x与卷积核进行卷积写成:
gθ*Gx=gθ(U∧UT)x=Ugθ(∧)UTx
其中,*G代表图卷积,gθ是关于拉普拉斯矩阵的特征值的函数,gθ(∧)可以用切比雪夫多项式Tk(x)近似:
Figure BDA0002926144150000051
其中,
Figure BDA0002926144150000052
max是拉普拉斯矩阵的最大特征值,θk是切比雪夫数;
因为切比雪夫多项式为:Tk(x)=2xTk-1(x)-Tk-2(x),T0(x)=1,Tk-1=(x),公式gθ*Gx=gθ(U∧UT)x=Ugθ(∧)UTx重写为:
Figure BDA0002926144150000053
其中,
Figure BDA0002926144150000054
优选地,在步骤S3中,构建长短期记忆网络对流量进行预测具体包括:
采用两层长短期记忆网络,将Xr,Xd,Xw输入到长短期记忆网络中;所述长短期记忆网络由遗忘门ft,输入门it,输出门ot和当前细胞状态ct组成。
优选地,在步骤S3中,构建注意力机制对流量进行预测具体包括:
在LSTM中嵌入注意力机制,分数st=(s1,s2,…,st)代表在不同时隙数据的重要程度,在时隙t给定数据集X,则:
Figure BDA0002926144150000055
其中,Us,Wxs,Whs是学习参数,bs是偏量,
Figure BDA0002926144150000056
是长短期记忆网络隐藏层输出,tanh作为激活函数;注意力权重表示为:
Figure BDA0002926144150000061
是对st的归一化,权值越大越重要;在时隙t,长短期记忆网络的隐状态
Figure BDA0002926144150000065
输出和权重和Ht为:
Figure BDA0002926144150000062
关注权重α取决于输入X和隐变量
Figure BDA0002926144150000063
所以取决于当前时刻也与前一时刻有关系;注意力权重越大,对预测结果影响越大。
在步骤S3当中,图卷积网络用来提取流量的空间相关性,图卷积网络概括的将数据结构转化成图数据结构的卷积操作。在每个时隙,采取基于图谱理论的图卷积处理信号,具体地说,利用频谱方法分析图的拓扑属性,例如图的连通性等,通过聚合邻接节点的信息来提取相关的时空特征。长短期记忆网络(LSTM)用来描述流量的时间相关性,长短期记忆网络是通过连接多个单元而形成的递归神经网络,提供了一种学习序列之间具有长期依赖关系的实用方法。特别适合处理具有序列关系的数据,流量具有序列性,因此长短期记忆网络很合适用于流量的预测。虽然长短期记忆网络适合用于流量预测,但是流量预测首先依赖的是流量特征的提取,而长短期记忆网络并不能提取不同时隙流量序列的重要程度,因此引入注意力机制(attention mechanism)通过自动分配不同的权重来区分不同时刻流量序列的重要性。
具体步骤如下:
1、为挖掘空域流量特征,构建多图卷积网络,根据图论需要得到图的度矩阵D和邻接矩阵A,邻接矩阵上面已经论述,邻接矩阵是对称矩阵;度矩阵就是每个节点和其他节点相连接的个数,是对角矩阵,从而可以得到拉普拉斯矩阵L=D-A,归一化形式为
Figure BDA0002926144150000064
2、建立长短期记忆网络,长短期记忆网络包括遗忘门ft,输入门it和输出门ot,细胞状态ct。遗忘门的功能是决定应丢弃或保留哪些信息,包含了当前的输入信号xt,上一时隙的细胞状态ct-1,和上一时隙隐藏状态的输出ht-1,并将保留下来的信息存放在当先细胞中ct。当前细胞状态:首先,前一层的细胞状态与遗忘向量逐点相乘,如果它接近0的值,意味着在新的细胞状态中,这些信息是需要丢弃掉的。然后再将该值与输入门的输出值逐点相加,将神经网络发现的新信息更新到细胞状态中去,至此,就得到了更新后的细胞状态。输入门用于更新细胞状态,首先,将前一层隐藏状态的信息和当前输入的信息传递sigmoid函数中去。将值调整到0到1之间来决定要更新哪些信息,0表示不重要,1表示重要。输入门包含当前输入信息,上一时隙的输出和细胞状态。输出门用来确定下一个隐藏状态的值,隐藏状态包含了先前输入的信息;输出们包括当前输入信息,上一时隙的输出,当前细胞状态。
3、在长短期记忆网络的基础上嵌入注意力机制:由于在不同的时隙流量序列的重要程度不同,因此引入注意力机制对流量序列重要程度的不同进行权重的自动分配。
与现有技术相比,本发明及其优选方案实现了对流量的预测,且与其他类型的流量预测模型相对比,表现出更好的预测效果。为了对实现对流量的精准预测,首先对数据进行分析,把握与流量相关联的数据特征,根据分析构建了相邻图、区域功能相似图和空间流量相关图来描述与流量相关联的数据信息,并且引入三个时间维度信息:之前Tr时隙的流量模式,每天的流量模式,每个星期的流量模式,再利用图卷积网络、长短期记忆网络和注意力机制实现流量预测,最后采用均方根、平均绝对误差和确定系数三种指标对预测流量进行评估。本发明方法具有建模合理,预测精度高等特点。
附图说明
下面结合附图和具体实施方式对本发明进一步详细的说明:
图1为本发明实施例流量预测框架示意图;
图2为本发明实施例多图卷积网络示意图;
图3为本发明实施例长短期记忆网络和注意力机制示意图;
图4为本发明实施例不同算法的RMSE,MAE,R2指标示意图。
具体实施方式
为让本专利的特征和优点能更明显易懂,下文特举实施例,作详细说明如下:
本实施例提供一种基于多图卷积的无线网络流量预测方法,具体步骤如下步骤实现:
步骤S1:根据历史流量数据,从中选择与无线流量高度相关流量特征用于预测t+1时刻的流量。
1)本实施例采用的历史流量数据是2013.01.11到2014.01.01每间隔十分钟米兰的数据集。将米兰城市分划成100×100网格,每个网格面积大约是0.235×0.235km2。在每个网格中记录了三种流量:短信服务(SMS),语音电话(call)和上网流量(internet);数据包括每个网格ID,时间戳,收发短信,呼入呼出等信息。在本方案中将时间间隔设置成一小时。
2)为了描述每个网格的特征,引入描述网格相关数据:各网格区域的(建筑)兴趣点,社交活动数量,基站分布数量,其中兴趣点包行银行,咖啡馆,公园等12种兴趣点。每个网格记为(i,j),每个网格的兴趣点记为p(i,j)=[pBank,pbar,…plodging],整个城市的兴趣点记为P
Figure BDA0002926144150000081
每个网格的基站分布数量记为b(i,,j),整个城市的基站数量分布为B
Figure BDA0002926144150000082
每个网格的社交活动数量代表用户依赖网络的服务程度,每个网格的社交活动数量记为s(i,j),整个城市的社交活动表示为S
Figure BDA0002926144150000083
步骤S2:分析流量时空特性,构建流量预测框架,空间特性主要包括构建相邻图,区域功能相似图,空间流量相关图这个三类流量相关信息图;时间特性主要构建三通道流量数据:之前Tr时隙的流量,日周期流量,周周期流量。
1)本实施例流量预测框架如图1所示,首先分析流量预测相关的信息,构建相邻图,功能相似图和空间流量相关图。图可以用G=(V,A),表示,其中V表示图的节点,A表示邻接矩阵,在本方案中V表示每个网格,三种图的邻接矩阵如下。
相邻图GN=(V,AN)中网格节点h和网格节点w之间的邻接矩阵中的元素
Figure BDA0002926144150000091
利用这两个网格的欧氏距离来表示:
Figure BDA0002926144150000092
其中,||·||代表二范数,||vh-vw||表示节点h,w之间的欧氏距离,σ表示标准差;节点之间距离越近,则表明这两个节点相关性越高。
功能相似图GF=(V,AF)中网格节点h和网格节点w之间的邻接矩阵中的元素
Figure BDA0002926144150000093
利用余弦相似函数的计算结果来表示:
Figure BDA0002926144150000094
<·>代表内积,||·||代表二范数,各网格区域的兴趣点矩阵P,社交活动数量矩阵S和基站分布数量B表示,每个网格的特征向量为ri,j=[pi,j,si,j,bi,j]。构建功能相似图可以了解具有相同功能的区域的流量使用情况,公式(5)中的值越大,说明网格的特性越相似。
空间流量相关图GS=(V,AS)中网格节点h和网格节点w之间的邻接矩阵的元素
Figure BDA0002926144150000095
利用两个网格流量之间的皮尔逊系数表示:
Figure BDA0002926144150000096
ρ(·)代表节皮尔逊系数,vh,vm分别表示节点h和w上的流量序列。空间流量相关图是利用流量数据的相关性构建的,进一步分析各个节点的流量相关性,皮尔逊系数的绝对值越大说明相关性越强。三幅图的构建方式如图1所示。
构建三通道流量数据,如图3所示,具体如下:之前Tr时隙的流量:根据流量的时域连续性原则,下一时隙的流量必然与之前Tr个时隙相关,由此构建流量向量Xr
Figure BDA0002926144150000097
之前Td的日周期流量Xd,例如要预测周三上午8点的流量,就要用周三之前Td天上午8点的流量构成,其数学表达为:
Figure BDA0002926144150000101
其中,TP代表流量序列的长度,Td代表日周期模块流量的天数
之前Tw周的周周期流量,例如要预测周三上午8点的流量,就要用到之前Tw个周三上午8点的流量构成,其数学表达为:
Figure BDA0002926144150000102
Tw代表周周期模块流量的周数,比如需要预测这个时刻的流量,则需要知道当前时刻的上个星期,前两个星期等的该时刻流量。
步骤S3:构建多图的图卷积网络,长短期记忆网络,注意力机制等深度学习技术对流量进行预测。
1)图卷积网络:如图2所示,本实施例利用图卷积网络发现流量的空间相关性。根据在步骤S2中定义的邻接矩阵,可以得到拉普拉斯矩阵L=D-A,归一化拉普拉斯矩阵为L=IN-D-1/2AD-1/2=U∧UT。IN为单位矩阵,D∈RV×V为度矩阵,是对角矩阵,对角线上的元素代表该节点与其他节点连接的个数;邻接矩阵A∈RV×V是对称矩阵,矩阵U是归一化拉普拉斯矩阵的特征向量,A∈RV×V是特征值组成的对角矩阵。根据傅里叶变换与拉普拉斯矩阵的关系可知,傅里叶变换基e-jωt对应图的傅里叶变换的基为UT,傅里叶逆变换基ejωt对应图的傅里叶变换的基为U,图的傅里叶变换矩阵形式为
Figure BDA0002926144150000103
其逆变换为
Figure BDA0002926144150000104
进一步图x与卷积核进行卷积可以写成:
gθ*Gx=gθ(U∧UT)x=Ugθ(∧)UTx (10)
*G代表图卷积,gθ是关于拉普拉斯矩阵的特征值的函数,gθ(∧)可以用切比雪夫多项式(Chebyshev polynomial)Tk(x)近似:
Figure BDA0002926144150000105
其中
Figure BDA0002926144150000106
max是拉普拉斯矩阵的最大特征值,θk是切比雪夫系数。
因为切比雪夫多项式为:Tk(x)=2xTk-1(x)-Tk-2(x),T0(x)=1,Tk-1=(x),公式(10)可以重写为:
Figure BDA0002926144150000111
其中
Figure BDA0002926144150000112
2)长短期记忆网络,如图2所示。本实施例采用两层长短期记忆网络,Xr,Xd,Xw输入到长短期记忆网络中。长短期记忆网络由遗忘门ft,输入门it,输出门ot和当前细胞状态ct组成。遗忘门的功能是决定应丢弃或保留哪些信息
Figure BDA0002926144150000113
输入门更新细胞状态,首先将前一层隐藏状态的信息和当前输入的信息传递到sigmoid函数中去。将值调整到0到1之间来决定要更新哪些信息,0表示不重要,1表示重要输入门包含当前输入信息,上一时隙的输出和细胞状态。
Figure BDA0002926144150000114
当先细胞状态:首先,前一层的细胞状态与遗忘向量逐点相乘。如果它接近0的值,意味着在新的细胞状态中,这些信息是需要丢弃掉的。然后再将该值与输入门的输出值逐点相加,将神经网络发现的新信息更新到细胞状态中去,至此,就得到了更新后的细胞状态。
Figure BDA0002926144150000115
输出门用来确定下一个隐藏状态的值,隐藏状态包含了先前输入的信息;输出们包括当前输入信息,上一时隙的输出,当前细胞状态。
Figure BDA0002926144150000116
其中
Figure BDA0002926144150000117
σ代表激活函数,
Figure BDA0002926144150000118
代表哈达玛积(Hadamard product),W代表权重矩阵,fi,it,ct,ot分别代表遗忘门的值,输入门的值,细胞状态的值,输出门的值;xt,ht分别代表输入向量和隐藏层输出向量;bi,bc,bo是偏置数(bias)。
3)注意力机制,如图3所示,该机制用于挖掘数据潜在特征,并且选择数据特征重要性程度。因为长短期记忆网络并不能识别数据的重要程度,所以在LSTM中嵌入注意力机制,分数st=(s1,s2,…,st)代表在不同时隙数据的重要程度,在时隙t给定数据集X,则:
Figure BDA0002926144150000121
Us,Wxs,Whs是学习参数,bs是偏量,
Figure BDA0002926144150000122
是长短期记忆网络隐藏层输出。注意力权重可以表示为:
Figure BDA0002926144150000123
是对st的归一化,权值越大越重要。在时隙t,长短期记忆网络的隐状态
Figure BDA00029261441500001210
输出和权重和Ht
Figure BDA0002926144150000124
关注权重α取决于输入X和隐变量
Figure BDA0002926144150000125
所以取决于当前时刻也与前一时刻有关系。注意力权重越大,对预测结果影响越大。
步骤S4:本实施例采用均方根、平均绝对误差和决定系数三种指标对预测流量进行评估。
均方根(RMSE)
Figure BDA0002926144150000126
平均绝对误差(MAE)
Figure BDA0002926144150000127
确定系数(R-Square)
Figure BDA0002926144150000128
Figure BDA0002926144150000129
是已知的数据流,μ是预测的流量,n是数据流的大小,
Figure BDA00029261441500001211
是数据流的均值。其评估结果如图4所示。
本专利不局限于上述最佳实施方式,任何人在本专利的启示下都可以得出其它各种形式的基于多图卷积的无线网络流量预测方法,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本专利的涵盖范围。

Claims (10)

1.一种基于多图卷积的无线网络流量预测方法,其特征在于,包括以下步骤:
步骤S1:根据历史流量数据,从中选择与无线流量相关的流量特征用于预测t+1时刻的流量;
步骤S2:分析流量时空特性,构建流量预测框架:包括构建空间特性的:相邻图、区域功能相似图和空间流量相关图;以及构建时间特性的三通道流量数据:之前Tr时隙的流量、日周期流量和周周期流量;
步骤S3:构建多图的图卷积网络、多通道的长短期记忆网络和注意力机制;其中,注意力机制对流量序列重要程度的不同进行权重的自动匹配。
2.根据权利要求1所述的基于多图卷积的无线网络流量预测方法,其特征在于:还包括:步骤S4:采用均方根、平均绝对误差和确定系数三种指标对预测流量进行评估。
3.根据权利要求1所述的基于多图卷积的无线网络流量预测方法,其特征在于:步骤S1具体包括以下步骤:
步骤S11:将历史流量数据的所属地点网格化;
步骤S12:将每个网格的蜂窝流量信息由时空序列表示。
4.根据权利要求3所述的基于多图卷积的无线网络流量预测方法,其特征在于:在步骤S1中,每个网格包含的数据有三种:短信服务、语音电话和上网流量;数据包括每个网格ID,时间戳,收发短信和呼入呼出的信息;并将时间间隔设置成一小时。
5.根据权利要求4所述的基于多图卷积的无线网络流量预测方法,其特征在于:在步骤S1中,利用的数据还包括:各网格区域的兴趣点,社交活动数量和基站分布数量。
6.根据权利要求3所述的基于多图卷积的无线网络流量预测方法,其特征在于:在步骤S2中,构建相邻图,功能相似图和空间流量相关图具体包括以下过程:
图用G=(V,A)表示,其中,V表示图的节点即每个网格,A表示邻接矩阵,三种图的邻接矩阵如下:
相邻图GN=(V,AN)中网格节点h和网格节点w之间的邻接矩阵中的元素
Figure FDA0002926144140000021
利用这两个网格的欧氏距离来表示:
Figure FDA0002926144140000022
其中,||·||代表二范数,||vh-vw||表示节点h,w之间的欧氏距离,σ表示标准差;
功能相似图GF=(V,AF)中网格节点h和网格节点w之间的邻接矩阵中的元素
Figure FDA0002926144140000023
利用余弦相似函数的计算结果来表示:
Figure FDA0002926144140000024
其中,<·>代表内积,||·||代表二范数,rh和rw分别为节点h和w的特征向量;
空间流量相关图GS=(V,AS)中网格节点h和网格节点w之间的邻接矩阵中的元素
Figure FDA0002926144140000025
利用两个网格流量之间的皮尔逊系数来表示:
Figure FDA0002926144140000026
其中,ρ(·)代表皮尔逊系数,vh,vm分别表示节点h和w上的流量序列。
7.根据权利要求6所述的基于多图卷积的无线网络流量预测方法,其特征在于:在步骤S2中,构建三通道流量数据具体包括以下过程:
之前Tr时隙的流量Xr:根据流量的时域连续性原则,下一时隙的流量必然与之前Tr个时隙相关,由此构建流量向量Xr
Figure FDA0002926144140000027
之前Td天的日周期流量Xd,其数学表达为:
Figure FDA0002926144140000028
其中,TP代表需要预测的流量序列长度,Td代表日周期模块流量的天数;
之前Tw周的周周期流量Xw,其数学表达为:
Figure FDA0002926144140000031
其中,Tw代表周周期模块流量的周数。
8.根据权利要求7所述的基于多图卷积的无线网络流量预测方法,其特征在于:在步骤S3中,构建多图的图卷积网络对流量进行预测,其中图卷积算法的具体步骤包括:
根据定义的邻接矩阵,得到拉普拉斯矩阵L=D-A,并归一化拉普拉斯矩阵为L=IN-D-1/ 2AD-1/2=U∧UT
其中,IN为单位矩阵,D∈RV×V为度矩阵,是对角矩阵,对角线上的元素代表该节点与其他节点连接的个数;邻接矩阵A∈RV×V是对称矩阵,矩阵U是归一化拉普拉斯矩阵的特征向量,A∈RV×V是特征值组成的对角矩阵,此外RV×V表示维度为v×v的实数集;
进一步将图x与卷积核进行卷积写成:
gθ*Gx=gθ(U∧UT)x=Ugθ(∧)UTx
其中,*G代表图卷积运算,gθ是关于拉普拉斯矩阵的特征值的函数,gθ(∧)可以用切比雪夫多项式Tk(x)近似:
Figure FDA0002926144140000032
其中,
Figure FDA0002926144140000033
max是拉普拉斯矩阵的最大特征值,θk是切比雪夫系数;
因为切比雪夫多项式为:Tk(x)=2xTk-1(x)-Tk-2(x),T0(x)=1,Tk-1=(x),公式gθ*Gx=gθ(U∧UT)x=Ugθ(∧)UTx重写为:
Figure FDA0002926144140000034
其中,
Figure FDA0002926144140000035
9.根据权利要求8所述的基于多图卷积的无线网络流量预测方法,其特征在于:在步骤S3中,构建多通道的长短期记忆网络对流量进行预测具体包括:
采用两层长短期记忆网络,将Xr,Xd,Xw输入到长短期记忆网络中;所述长短期记忆网络由遗忘门ft,输入门it,输出门ot和当前细胞状态ct组成。
10.根据权利要求6所述的基于多图卷积的无线网络流量预测方法,其特征在于:在步骤S3中,构建注意力机制对流量序列重要程度的不同进行权重的自动匹配,具体步骤包括:
在LSTM中嵌入注意力机制,分数st=(s1,s2,…,st)代表在不同时隙数据的重要程度,在时隙t给定数据集X,则:
Figure FDA0002926144140000041
其中,Us,Wxs,Whs是学习参数,bs是偏量,
Figure FDA0002926144140000042
是长短期记忆网络隐藏层输出,tanh作为激活函数;注意力权重表示为:
Figure FDA0002926144140000043
是对st的归一化,权值越大越重要;在时隙t,长短期记忆网络的隐状态
Figure FDA0002926144140000046
输出和权重和Ht为:
Figure FDA0002926144140000044
关注权重α取决于输入X和隐变量
Figure FDA0002926144140000045
所以取决于当前时刻也与前一时刻有关系;注意力权重越大,对预测结果影响越大。
CN202110134411.XA 2021-02-01 2021-02-01 基于多图卷积的无线网络流量预测方法 Active CN112911626B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110134411.XA CN112911626B (zh) 2021-02-01 2021-02-01 基于多图卷积的无线网络流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110134411.XA CN112911626B (zh) 2021-02-01 2021-02-01 基于多图卷积的无线网络流量预测方法

Publications (2)

Publication Number Publication Date
CN112911626A true CN112911626A (zh) 2021-06-04
CN112911626B CN112911626B (zh) 2022-05-31

Family

ID=76122185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110134411.XA Active CN112911626B (zh) 2021-02-01 2021-02-01 基于多图卷积的无线网络流量预测方法

Country Status (1)

Country Link
CN (1) CN112911626B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114007228A (zh) * 2021-11-01 2022-02-01 天津大学 基于异构图神经网络流量预测的基站智能控制方法
CN114158085A (zh) * 2021-11-18 2022-03-08 湖北工业大学 一种基于时空聚合图卷积网络的移动蜂窝流量高效预测方法
CN114362858A (zh) * 2021-12-27 2022-04-15 天翼物联科技有限公司 基于图卷积的窄带物联网基站负载预测方法、系统和介质
CN115242663A (zh) * 2022-07-29 2022-10-25 西安电子科技大学 基于时间相关图卷积的虚拟网络流量预测方法
CN115549823A (zh) * 2022-11-23 2022-12-30 中国人民解放军战略支援部队航天工程大学 一种无线电环境地图预测方法
US12047250B2 (en) * 2021-11-29 2024-07-23 Research & Business Foundation Sungkyunkwan University Graph embedding-based virtual network mapping method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991713A (zh) * 2019-11-21 2020-04-10 杭州电子科技大学 基于多图卷积和gru的不规则区域流量预测方法
CN111563611A (zh) * 2020-04-13 2020-08-21 北京工业大学 面向图卷积网络的云数据中心可再生能源时空预测方法
CN111918321A (zh) * 2020-07-22 2020-11-10 湖北工业大学 一种基于时空注意卷积网络的移动流量预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991713A (zh) * 2019-11-21 2020-04-10 杭州电子科技大学 基于多图卷积和gru的不规则区域流量预测方法
CN111563611A (zh) * 2020-04-13 2020-08-21 北京工业大学 面向图卷积网络的云数据中心可再生能源时空预测方法
CN111918321A (zh) * 2020-07-22 2020-11-10 湖北工业大学 一种基于时空注意卷积网络的移动流量预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JINLONG GUO 等: "A Multi-step Traffic Speed Forecasting Model Based on Graph Convolutional LSTM", 《2019 CHINESE AUTOMATION CONGRESS (CAC)》 *
UDITA PAUL 等: "Traffic-profile and machine learning based regional data center design and operation for 5G network", 《JOURNAL OF COMMUNICATIONS AND NETWORKS》 *
李昊天等: "单时序特征图卷积网络融合预测方法", 《计算机与现代化》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114007228A (zh) * 2021-11-01 2022-02-01 天津大学 基于异构图神经网络流量预测的基站智能控制方法
CN114007228B (zh) * 2021-11-01 2023-04-07 天津大学 基于异构图神经网络流量预测的基站智能控制方法
CN114158085A (zh) * 2021-11-18 2022-03-08 湖北工业大学 一种基于时空聚合图卷积网络的移动蜂窝流量高效预测方法
US12047250B2 (en) * 2021-11-29 2024-07-23 Research & Business Foundation Sungkyunkwan University Graph embedding-based virtual network mapping method
CN114362858A (zh) * 2021-12-27 2022-04-15 天翼物联科技有限公司 基于图卷积的窄带物联网基站负载预测方法、系统和介质
CN114362858B (zh) * 2021-12-27 2023-09-26 天翼物联科技有限公司 基于图卷积的窄带物联网基站负载预测方法、系统和介质
CN115242663A (zh) * 2022-07-29 2022-10-25 西安电子科技大学 基于时间相关图卷积的虚拟网络流量预测方法
CN115549823A (zh) * 2022-11-23 2022-12-30 中国人民解放军战略支援部队航天工程大学 一种无线电环境地图预测方法

Also Published As

Publication number Publication date
CN112911626B (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
CN112911626B (zh) 基于多图卷积的无线网络流量预测方法
CN110263280B (zh) 一种基于多视图的动态链路预测深度模型及应用
CN112561191B (zh) 预测模型的训练、预测方法、装置、设备、程序和介质
CN113705959B (zh) 网络资源分配方法及电子设备
CN110210644A (zh) 基于深度神经网络集成的交通流量预测方法
CN109598936B (zh) 一种基于动态stknn模型的短时交通预测方法
CN113313947A (zh) 短期交通预测图卷积网络的路况评估方法
Samikwa et al. Flood prediction using IoT and artificial neural networks with edge computing
CN112910711B (zh) 一种基于自注意力卷积网络的无线业务流量预测方法、设备及介质
CN113762595B (zh) 通行时间预测模型训练方法、通行时间预测方法及设备
CN111242395B (zh) 用于od数据的预测模型构建方法及装置
CN110267292A (zh) 基于三维卷积神经网络的蜂窝网络流量预测方法
CN114202122A (zh) 基于马尔可夫聚类图注意力网络的城市交通流量预测方法
CN112801411B (zh) 一种基于生成对抗网络的网络流量预测方法
CN111242292A (zh) 基于深度时空网络的od数据预测方法及系统
CN112766240B (zh) 基于时空关系的残差多图卷积人群分布预测方法及系统
CN114021811A (zh) 基于注意力改进的交通预测方法及计算机介质
CN114265913A (zh) 工业物联网边缘设备上基于联邦学习的空时预测算法
CN115051925B (zh) 一种基于迁移学习的时空序列预测方法
Jiang et al. Crowd flow prediction for social internet-of-things systems based on the mobile network big data
Rubio et al. Adaptive non-parametric identification of dense areas using cell phone records for urban analysis
CN111865690B (zh) 基于网络结构和时序的机会网络链路预测方法
Wu A Novel Artificial Neural Network Ensemble Model Based on K--Nearest Neighbor Nonparametric Estimation of Regression Function and Its Application for Rainfall Forecasting
CN111935766B (zh) 一种基于全局空间依赖性的无线网络流量预测方法
CN117295093B (zh) 一种基于数据驱动的终端业务流量行为建模方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant