CN108965017B - 一种网络流量预测方法和装置 - Google Patents
一种网络流量预测方法和装置 Download PDFInfo
- Publication number
- CN108965017B CN108965017B CN201810845310.1A CN201810845310A CN108965017B CN 108965017 B CN108965017 B CN 108965017B CN 201810845310 A CN201810845310 A CN 201810845310A CN 108965017 B CN108965017 B CN 108965017B
- Authority
- CN
- China
- Prior art keywords
- time
- base station
- data
- model
- bayesian
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000009826 distribution Methods 0.000 claims abstract description 78
- 238000012549 training Methods 0.000 claims abstract description 53
- 238000012544 monitoring process Methods 0.000 claims abstract description 38
- 239000011159 matrix material Substances 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 13
- 230000001413 cellular effect Effects 0.000 abstract description 26
- 238000004891 communication Methods 0.000 abstract description 13
- 230000005059 dormancy Effects 0.000 abstract description 11
- 230000008569 process Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/06—Testing, supervising or monitoring using simulated traffic
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请实施例提供了一种网络流量预测方法和装置,涉及通信领域,能够用于预测蜂窝网络流量的时空分布信息,以便指导蜂窝网络的部署和休眠策略,从而保证通信质量和能效平衡。该方案包括:计算设备获取训练数据,训练数据包括目标区域中的至少两个基站在第一时间间隔内的流量监测数据;计算设备根据训练数据建立贝叶斯时空模型;计算设备基于贝叶斯时空模型预测目标区域中的至少一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据,第一时间间隔与第二时间间隔不同。本申请应用于蜂窝网络中对网络流量的时空分布特性进行预测的场景中。
Description
技术领域
本申请涉及通信领域,尤其涉及一种网络流量预测方法和装置。
背景技术
为了保证通信质量和能效平衡,第五代移动通信技术(5Generation,5G)通信中采用了超密集组网(Ultra Dense Deployment,UDN)和基站休眠技术。其中,UDN的实施需要获取蜂窝网络流量的空间分布特性来制定部署策略,基站休眠的实施需要获取蜂窝网络流量的时间分布特性来制定休眠策略,而蜂窝网络流量建模和预测可以通过预测蜂窝网络流量的时空分布特性,为UDN和基站休眠提供参考信息。
现有的蜂窝网络流量预测要么只对空间分布进行建模,要么仅对某一时刻或者某一时间段内的业务进行空间分布拟合或者进行理论分析。例如,Lognorm分布模型给出了一定区域范围内流量分布的整体统计规律,并没有体现流量在空间距离上的相关性,也缺乏相应的流量分布解析表达式。Exponential分布模型不能刻画当前异构无线网络环境中流量分布呈现出的多峰值分布规律。截断二维余弦变换分布模型只是针对某一特定区域特定时间下快照下的流量空间模型,并不具有普适意义。快速傅里叶变换用正弦函数叠加拟合分布模型利用区域内每天的总业务量具有明显的周期性进行预测。时间序列预测建模适合短期预测,适宜预测目标的基本趋势在某一水平上下波动。相关分析预测建模对中长期预测准确性较差,并且需要较多的现实统计数据和纯数学公式的推导,后期需要结合环境的变化进行修正。
在实现上述蜂窝网络流量建模和预测的过程中,发明人发现现有技术中至少存在如下问题:
现有的蜂窝网络流量预测算法要么局限于预测某区域总体的流量变化,要么只对某一时刻的空间分布进行拟合或者建模,均与实际情况有较大出入,不能很好地指导异构蜂窝网络的部署和休眠策略。因此,亟需提出一种针对蜂窝网络流量的时空分布信息的预测方法。
发明内容
本申请的实施例提供一种网络流量预测方法和装置,能够用于预测蜂窝网络流量的时空分布信息,以便指导蜂窝网络的部署和休眠策略,从而保证通信质量和能效平衡。
为达到上述目的,本申请的实施例采用如下技术方案:
一种网络流量预测方法,包括:
计算设备获取训练数据,训练数据包括目标区域中的至少两个基站在第一时间间隔内的流量监测数据;
计算设备根据训练数据建立贝叶斯时空模型;
计算设备基于贝叶斯时空模型预测目标区域中的至少一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据,第一时间间隔与第二时间间隔不同。
一种计算设备,包括:
获取单元,用于获取训练数据,训练数据包括目标区域中的至少两个基站在第一时间间隔内的流量监测数据;
处理单元,用于根据训练数据建立贝叶斯时空模型;
处理单元,还用于基于贝叶斯时空模型预测目标区域中的至少一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据,第一时间间隔与第二时间间隔不同。
本申请实施例提供的网络流量预测方法和装置,可以预测出目标区域中的至少一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据,从而可以较为准确的得出目标区域的流量空间分布预测,能够用于预测蜂窝网络流量的时空分布信息,以便指导蜂窝网络的部署和休眠策略,从而保证通信质量和能效平衡。
附图说明
图1为本申请实施例提供的一种通信系统架构示意图;
图2为本申请实施例提供的一种网络流量预测方法的流程示意图;
图3为本申请实施例提供的一种目标区域在第七天24小时的流量均值分布图;
图4为本申请实施例提供的一种目标区域在第七天24小时的流量标准差分布图;
图5为本申请实施例提供的一种计算设备的结构示意图。
具体实施方式
下面结合附图对本申请实施例提供的网络流量预测方法和装置进行详细描述。
为了下述各实施例的描述清楚简洁,首先给出相关概念或技术的简要介绍:
训练数据:用于训练贝叶斯模型的流量数据,包括目标区域中的至少两个基站在第一时间间隔内的流量监测数据(流量监测值)。目标区域可以是预先确定的。流量监测数据是基站采集到的流量数据。一个基站的流量监测值和流量真实值之间可以存在一定的监测误差,流量的真实值是指网络中实际消耗的流量。
预测数据:根据贝叶斯模型预测得到的流量数据,可以包括目标区域中的至少一个基站在第三时间间隔内的流量数据,第三时间间隔包含于第二时间间隔。
测试数据:用于校对预测数据是否符合预设条件,包括目标区域中的至少一个基站在第三时间间隔内的流量监测数据。例如,某一天的网络流量的预测数据应该和该天的测试数据接近,否则需要对贝叶斯模型进行调整,以便对于同一时间间隔的预测数据能够接近该时间间隔的测试数据,从而使贝叶斯模型预测得到的数据更准确。
其中,第一时间间隔与第二时间间隔不同,第三时间间隔可以等于或包含于第二时间间隔。例如,假设第一时间间隔为第一周的前6天,第二时间间隔可以包括第一周的第7天,第二周、第三周等等。第三时间间隔可以仅包括第一周的第7天。其中,第一周可以是指定的任一周(例如2018年5月的第一周),第二周可以是第一周的下一周,第三周的概念类似。
单位矩阵:一种方阵,从左上角到右下角的对角线(即主对角线)上的元素均为1以外全都为0。在矩阵的乘法中,单位矩阵的作用如同数的乘法中的1。
相关系数矩阵;也叫相关矩阵,由矩阵各列间的相关系数构成。其中,相关矩阵第i行第j列的元素是原矩阵第i列和第j列的相关系数。
误差方差:是指随机因素引起的实验误差大小的方差。
本申请实施例应用于蜂窝网络中对网络流量的时空分布特性进行预测的场景中。其中,蜂窝网络可以为全球移动通信系统(global system for mobile communication,GSM)、码分多址(code division multiple access,CDMA)网络、宽带码分多址(widebandcode division multiple access,WCDMA)、长期演进(Long Term Evolution,LTE)网络或5G网络等。
本申请实施例的架构如图1所示,包括至少两个基站(例如,包括基站1、基站2和基站3)、数据采集设备和计算设备。在一种可能的设计中,数据采集设备可以和计算设备集成在一起。其中,基站可以产生流量数据,数据采集设备可以用于从至少两个基站获取流量监测数据,计算设备用于从数据采集设备站获取流量监测数据(即训练数据);根据训练数据建立贝叶斯时空模型;基于贝叶斯时空模型预测网络流量的时空分布信息。
进一步的,计算设备可以根据测试数据确定由贝叶斯时空模型预测得到的流量数据是否满足预设条件,测试数据可以是计算设备从数据采集设备得到的。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。其中,在本申请的描述中,除非另有说明,“多个”是指两个或多于两个。另外,为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系;在公式中,字符“/”,表示前后关联对象是一种“相除”的关系。
需要说明的是,本申请实施例中,“的(of)”,“相应的(corresponding,relevant)”和“对应的(corresponding)”有时可以混用,应当指出的是,在不强调其区别时,其所要表达的含义是一致的。
本申请中,矢量/矩阵用加粗的正体/斜体字母表示,标量用非加粗的斜体/正体表示。
本申请实施例提供一种网络流量预测方法,如图2所示,包括:
201、计算设备获取训练数据,训练数据包括目标区域中的至少两个基站在第一时间间隔内的流量监测数据。
在一种可能的设计中,计算设备可以从数据采集设备获取训练数据。数据采集设备可以实时采集至少两个基站的流量监测数据并存储,或者在被触发的条件下(例如接收到计算设备发送的请求)采集至少两个基站的流量监测数据,例如采集至少两个基站在第一时间间隔内(例如第一周的前6天)的流量监测数据。
202、计算设备根据训练数据建立贝叶斯时空模型。
计算设备可以基于随机过程理论,根据训练数据生成贝叶斯时空模型的基础模型。其中,随机过程可以包括高斯过程(Gaussian process,GP)、自回归过程(Autoregressive,AR)和高斯预测过程(Gaussian prediction process,GPP)。基于GP的贝叶斯时空模型运算量小,在数据量大的时候具有运算优势。基于AR的贝叶斯时空模型相较于基于GP的贝叶斯时空模型考虑了时间相关性的影响。基于GPP的贝叶斯时空模型在基于AR的贝叶斯时空模型基础上考虑了参考点的插值,提高了预测精度。
下面以基于GPP生成贝叶斯时空模型的基础模型的过程为例进行说明。由于基于GPP的贝叶斯时空模型是从基于GP和基于AR的贝叶斯时空模型中得到的,因此下文中在介绍基于GPP的贝叶斯时空模型之前先介绍基于GP和基于AR的贝叶斯时空模型的基本形式。
基于GP的贝叶斯时空模型可由公式(1)和(2)描述:
Glt=Rlt+εlt (1)
Rlt=Xltβ+ηlt (2)
其中,Glt=(Gl(s1,t),…,Gl(sn,t))T,表示训练数据,也可以称为流量监测值矩阵,包括第一时间间隔内至少两个基站中每个基站的流量监测值。si表示基站站址,i=1,2,3,...,n,n是基站个数,l和t是时间维度,l表示较长的时间(例如,天),t表示较短的时间(例如,小时)。l=1,2,...,r;t=1,2,...,T1。Gl(si,t)表示第i个基站在l和t两个时间维度的流量监测值,例如G2(s3,21)表示基站s3在第二天的第21小时的流量监测值。
Rlt=(Rl(s1,t),…,Rl(sn,t))T,表示流量真实值矩阵,包括第一时间间隔内至少两个基站中每个基站的流量真实值。Rl(si,t)表示第i个基站在l和t两个时间维度的流量真实值。
εlt=(εl(s1,t),…,εl(sn,t))T,表示误差矩阵,用于描述流量监测值和流量真实值之间的误差。对于不同的空间位置,其服从独立正态分布也就是说,εl(s1,t),…,εl(sn,t)的平均值为0,方差为其中,是基站(站址)对应的固定空间方差,In是n阶单位矩阵。
Xlt是一个(n×p)维的协变量矩阵,p是协变量个数。协变量是可能影响预测数据的变量。例如基站的环境变量(风力、温度、湿度等)。
β=(β1,…,βp)T,是协变量矩阵的相关系数矩阵,是一个(p×1)维的矩阵。
ηlt=(ηl(s1,t),…,ηl(sn,t))T,描述待插值变量的时空特征对流量真实值的影响。其中,待插值变量即参考节点,是根据n个基站之间的空间位置信息确定的。对于不同的时间点,其服从互相独立的正态分布N~(0,∑η)。其中,表示第n个基站的固定空间方差。Sη是基站空间相关矩阵,其矩阵元素可由Matern相关函数获得,如公式(3):
其中,κ(si,sj,φ,υ)表示Sη中第i行,第j列的值。si,sj是至少两个基站中任意两个相邻的基站的站址,参数φ控制相关性的衰变率,参数υ控制随机域的平滑性;Kυ是υ的第二类贝塞尔函数;Γ(υ)是标准伽马函数;||si-sj||是至少两个基站中每两个基站之间的距离。
基于AR的贝叶斯时空模型是基于GP的贝叶斯时空模型得到的,可由下面的公式(4)和(5)表示:
Glt=Rlt+εlt (4)
Rlt=ρRlt-1+Xltβ+ηlt (5)
其中,ρ∈(-1,1),用于描述流量真实值的时间相关性。其余参数的相关描述可以参考上文的相关说明,在此不再赘述。可以理解的是,当ρ=0的时候,基于AR的贝叶斯时空模型等同于基于GP的贝叶斯时空模型。
基于GPP的贝叶斯时空模型是在基于AR的贝叶斯时空模型的基础上做出改进得到的,如公式(6)所示:
Glt=Xltβ+Hylt+εlt (6)
其中,P是一个(n×m)维的互相关矩阵,用于描述n个基站(s1,s2,...,sn)和m个参考节点间的相关性和随机性。n、m为大于等于1的整数。m个参考节点是根据n个基站之间的空间位置关系确定的。Sη是关于ylt(y)的(m×m)维的相关矩阵。ylt的定义如公式(7)所示:
ylt=ρylt-1+ηlt (7)
基于GPP的贝叶斯时空模型需要考虑初始值yl0。yl0包括n个基站和m个参考节点对应的初始时刻的流量真实值。对于l=1,2,3,...,r,yl0服从独立正态分布:其中,表示yl0对应的相关矩阵S0的矩阵元素可以根据公式(3)得到。
进一步的,计算设备可以根据贝叶斯时空模型的基础模型和参数的先验分布得到贝叶斯时空模型的参数的后验分布。具体的,计算设备可以根据参数的先验分布、训练数据、贝叶斯时空模型的参数、至少一个基站对应的固定空间方差、至少一个基站和至少一个参考节点对应的流量真实值确定贝叶斯时空模型的参数的后验分布;其中,至少一个参考节点是根据至少一个基站的位置信息确定的。
示例性的,本申请实施例提供一种计算贝叶斯时空模型的参数的后验分布的实现方式,如公式(8)所示:
其中,一维向量θ表征贝叶斯时空模型的参数,可以包括以下至少一个:φ、υ、β、ρ和即贝叶斯时空模型的参数的先验分布可以用logf(θ)表征。参数的后验分布可以用logf(θ,y,g*|g)表征;g和g*分别表示训练数据和缺失的流量监测值。其中,缺失的流量监测值可以根据训练数据得到。其余参数的相关描述参考上文相关说明。
203、计算设备基于贝叶斯时空模型预测网络流量在第二时间间隔内的时空分布信息,第一时间间隔与第二时间间隔不同。
计算设备可以根据参数的后验分布预测第二时间间隔内网络流量的时空分布信息,即预测目标地区中的至少一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据。具体的,计算设备可以首先根据训练数据确定贝叶斯时空模型的参数;而后,计算设备根据贝叶斯时空模型的参数确定目标区域中的至少一个基站和至少一个参考节点的流量真实数据;然后,计算设备根据至少一个基站和至少一个参考节点的流量真实数据以及至少一个基站对应的固定空间方差确定至少一个基站中的任一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据。
下面以确定Gl(s0,t0)的过程为例进行说明,其中s0表示目标区域中的任一个基站,可以是至少两个基站中的任一个基站,也可以是目标区域中的某一参考点基站(插值点基站)。t0表示第二时间间隔内的某一时刻或某一时间段。如公式(9)所示:
其中,f(Gl(s0,t0)|g)表示在条件g下的待预测基站s0在待预测时刻t0的流量数据;g表示训练数据;表示在条件下待预测基站s0在待预测时刻t0的流量数据;yl(s0,t0)表示所述目标区域中的至少一个基站和至少一个参考节点的流量真实数据;表示所述至少一个基站的固定空间方差;f(yl(s0,t0)|θ,y,g*)表示在条件(θ,y,g*)下yl(s0,t0)的值,θ表示所述贝叶斯时空模型的参数;g*表示缺失的流量监测数据;f(θ,y,g*|g)表示在条件g下的(θ,y,g*)的值。
可以理解的是,可以根据训练数据获取(θ,y,g*)的值,而后根据(θ,y,g*)的值确定yl(s0,t0)的值;最后,根据yl(s0,t0)和的值确定Gl(s0,t0)的值。示例性的,可以通过参数的后验分布得到随机样本θ(j)和y(j),j=1,2,3,...,J。其中,J是马尔科夫蒙特卡洛(MCMC)计算方法(计算机方法)的迭代总次数。然后通过贝叶斯插值从y=(yl(s1,t1),yl(s2,t2),…,yl(sn,tn)中得到yl(s0,t0)的一个样本yl (j)(s0,t0),而后可以从得到一个样本Gl (j)(s0,t0),通过MCMC计算方法进行最后一次迭代后,可以得到最终的流量预测数据(预测值)。
204、计算设备根据测试数据确定预测数据是否满足预设条件。
假设第三时间间隔包括第一周的第7天。可以将第一周的第7天的测试数据(监测数据,可以从基站采集得到的流量数据)与第一周的第7天的预测数据(即根据上述贝叶斯模型预测得到的第一周的第7天的流量数据)进行对比,以确定预测数据是否满足预设条件。预设条件可以包括以下条件(指标)中的至少一个:预设的均方根误差(Root MeanSquare Error,RMSE)要求、预设的平均绝对误差(Mean Absolute Error,MAE)要求,以及预设的拟合指数(Index of Agreement,IA)要求。RMSE和MAE可以反映流量预测值与流量监测值之间在数值上的偏差。IA可以反映流量预测值与流量监测值之间的一致性。其计算公式分别为公式(10),(11)和(12):
在实际应用中,假设第三时间间隔为第一周的第7天,目标区域(研究区域)包括中心城区、乡镇和郊区,在中心城区、乡镇和郊区各选择5个基站,对这些基站在第一周的第7天的测试数据与基于贝叶斯模型预测得到第一周的第7天的预测数据进行分析。其中,中心城区的RMSE、MAE和IA分别为:57.92Mb,42.38Mb和0.96;乡镇的RMSE、MAE和IA分别为32.15Mb,18.60Mb和0.94;郊区的RMSE、MAE和IA分别为:21.26Mb,13.80Mb和0.93。中心城区的RMSE和MAE分别为57.92Mb和42.38Mb,均高于郊区和乡镇。这是因为中心城区基站的流量可以达到2000-2500Mb(较高水平),而郊区的流量则普遍位于1000-1500Mb(中间水平)之间,乡镇更是低于1000Mb(较低水平)。相较于基数而言,上述误差是较小的,且是合理的。三者的IA均高于0.9,可以说明预测结果与真实值之间具有较好的一致性。
在一种可能的应用中,可以基于贝叶斯时空模型预测得到的流量数据得出目标区域内每小时的流量空间分布预测图,从而有助于研究蜂窝流量的空间分布随时间的变化规律,即蜂窝网络流量的时空分布信息。示例性的,以目标区域包括某中心城区、某乡镇和某郊区为例,将基于贝叶斯模型预测得到的第七天的流量数据集中进行处理,可以得到目标区域在第七天24小时的流量均值分布图(如图3所示)和流量标准差分布图(如图4所示)。其中,图3中的任一点对应的数值表示该点在第七天的流量的统计平均值,表征该地点流量的平均水平。图4中的任一点对应的数值表示该地点在第七天的流量的统计标准差值,表征该地点在第七天流量的波动水平。其中,中心城区的纬度范围可以包括39.1-39,经度范围可以包括117-117.4。可见,由于中心城区作为人口密集区,业务热点,流量的平均水平比较高,同时由于中心城区主要为商业区,白天流动人口多,流量大,夜晚流动人口相应减少,流量相对也减少,所以一天内流量波动较大。乡镇和郊区分布在中心城区的周围,其流量水平较低,流量波动也较小。可见,基于本申请实施例提供的贝叶斯模型可以较为准确的得出研究区域的流量空间分布预测,能够用于预测蜂窝网络流量的时空分布信息,以便指导异构蜂窝网络的部署和休眠策略,从而保证通信质量和能效平衡。
可选的,若时空分布信息的精度不满足预设条件,计算设备重新建立贝叶斯时空模型并基于重新建立的贝叶斯时空模型重新获取网络流量的时空分布信息。
由此,基于本申请实施例提供的贝叶斯模型,可以预测出目标区域中的至少一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据,从而可以较为准确的得出目标区域的流量空间分布预测,能够用于预测蜂窝网络流量的时空分布信息,以便指导异构蜂窝网络的部署和休眠策略,从而保证通信质量和能效平衡。
本申请实施例提供一种计算设备,如图5所示,包括:获取单元501和处理单元502,其中:
获取单元501,用于获取训练数据,训练数据包括目标区域中的至少两个基站在第一时间间隔内的流量监测数据;
处理单元502,用于根据训练数据建立贝叶斯时空模型;
处理单元502,还用于基于贝叶斯时空模型预测目标区域中的至少一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据,第一时间间隔与第二时间间隔不同。
可选的,处理单元502还用于:根据测试数据确定预测数据是否满足预设条件,测试数据包括目标区域中的至少一个基站在第三时间间隔内的流量监测数据,预测数据包括根据贝叶斯时空模型预测得到的目标区域中的至少一个基站在第三时间间隔内的流量数据,第三时间间隔包含于第二时间间隔;若确定预测数据不满足预设条件,重新建立贝叶斯时空模型并基于重新建立的贝叶斯时空模型重新预测目标区域的流量数据。
可选的,处理单元502用于:根据训练数据生成贝叶斯时空模型的基础模型,并设定贝叶斯时空模型的参数的先验分布,贝叶斯时空模型的参数是根据训练数据得到的;根据贝叶斯时空模型的基础模型和参数的先验分布得到贝叶斯时空模型的参数的后验分布;根据贝叶斯时空模型的参数的后验分布预测目标区域中的至少一个基站在第二时间间隔内的任一时刻的网络流量。
可选的,处理单元502用于:根据贝叶斯时空模型的参数、参数的先验分布、训练数据、至少一个基站对应的固定空间方差以及至少一个基站和至少一个参考节点对应的流量真实值确定贝叶斯时空模型的参数的后验分布;其中,至少一个参考节点是根据至少一个基站的位置信息确定的。
可选的,处理单元502用于:根据训练数据确定贝叶斯时空模型的参数;根据贝叶斯时空模型的参数确定目标区域中的至少一个基站和至少一个参考节点的流量真实数据;根据至少一个基站和至少一个参考节点的流量真实数据以及至少一个基站对应的固定空间方差确定至少一个基站中的任一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据。
可选的,处理单元502还可以用于进行如下计算:
其中,logf(θ,y,g*|g)表示贝叶斯时空模型的参数的后验分布;logf(θ)表示所述贝叶斯时空模型的参数的先验分布;θ表示所述贝叶斯时空模型的参数;g和g*分别表示训练数据和缺失的流量监测数据;表示基站对应的固定空间方差;l和t表示不同的时间单位;l=1,2,...,r;t=1,2,...,T1;Glt表示训练数据;Xlt是(n×p)维的协变量矩阵,n表示基站数目,p表示协变量数目;β是(p×1)维的相关系数矩阵;P表示(n×m)维的互相关矩阵,用于描述n个基站(s1,s2,...,sn)和m个参考节点间的相关性和随机性;ylt=ρylt-1+ηlt,ρ∈(-1,1),用于描述n个基站和m个参考节点对应的流量真实值;ηlt表示m个参考节点的时空特征对流量真实值的影响;表示第n个基站的固定空间方差;Sη是关于ylt的(m×m)维的相关矩阵;表示yl0对应的yl0表示ylt的初始值。
可选的,处理单元502还可以用于进行如下计算:
其中,f(Gl(s0,t0)|g)表示在条件g下的待预测基站s0在待预测时刻t0的流量数据;g表示训练数据;表示在条件下待预测基站s0在待预测时刻t0的流量数据;yl(s0,t0)表示所述目标区域中的至少一个基站和至少一个参考节点的流量真实数据;表示所述至少一个基站的固定空间方差;f(yl(s0,t0)|θ,y,g*)表示在条件(θ,y,g*)下yl(s0,t0)的值,θ表示所述贝叶斯时空模型的参数;g*表示缺失的流量监测数据;f(θ,y,g*|g)表示在条件g下的(θ,y,g*)的值。
由此,基于计算设备确定的贝叶斯模型,可以预测出目标区域中的至少一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据,从而可以较为准确的得出目标区域的流量空间分布预测,能够用于预测蜂窝网络流量的时空分布信息,以便指导异构蜂窝网络的部署和休眠策略,从而保证通信质量和能效平衡。
需要说明的是,在具体实现过程中,上述如图2所示的网络流量预测方法所执行的各步骤均可以通过硬件形式的处理器执行存储器中存储的软件形式的计算机执行指令实现,为避免重复,此处不再赘述。而上述网络流量预测方法所执行的动作所对应的程序均可以以软件形式存储于该网络流量预测方法实施的存储器中,以便于处理器调用执行以上各个模块对应的操作。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (12)
1.一种网络流量预测方法,其特征在于,包括:
计算设备获取训练数据,所述训练数据包括目标区域中的至少两个基站在第一时间间隔内的流量监测数据;
所述计算设备根据所述训练数据建立贝叶斯时空模型;
所述计算设备基于所述贝叶斯时空模型预测所述目标区域中的至少一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据,所述第一时间间隔与所述第二时间间隔不同;
所述计算设备基于所述贝叶斯时空模型预测所述目标区域中的至少一个基站在第二时间间隔内的任一时刻的网络流量,包括:
所述计算设备根据所述训练数据生成所述贝叶斯时空模型的基础模型,并设定所述贝叶斯时空模型的参数的先验分布,所述贝叶斯时空模型的参数是根据所述训练数据得到的;
所述计算设备根据所述贝叶斯时空模型的基础模型和所述参数的先验分布得到所述贝叶斯时空模型的参数的后验分布;
所述计算设备根据所述贝叶斯时空模型的参数的后验分布预测所述目标区域中的至少一个基站在第二时间间隔内的任一时刻的网络流量。
2.根据权利要求1所述的网络流量预测方法,其特征在于,所述方法还包括:
所述计算设备根据测试数据确定预测数据是否满足预设条件;所述测试数据包括所述目标区域中的至少一个基站在第三时间间隔内的流量监测数据,所述预测数据包括根据所述贝叶斯时空模型预测得到的所述目标区域中的所述至少一个基站在第三时间间隔内的流量数据,所述第三时间间隔包含于所述第二时间间隔;
若确定预测数据不满足预设条件,所述计算设备重新建立贝叶斯时空模型并基于所述重新建立的贝叶斯时空模型重新预测所述目标区域的流量数据。
3.根据权利要求2所述的网络流量预测方法,其特征在于,所述计算设备根据所述贝叶斯时空模型的基础模型和所述参数的先验分布得到所述贝叶斯时空模型的参数的后验分布包括:
所述计算设备根据所述贝叶斯时空模型的参数、所述参数的先验分布、所述训练数据、所述至少一个基站对应的固定空间方差以及所述至少一个基站和至少一个参考节点对应的流量真实值确定所述贝叶斯时空模型的参数的后验分布;其中,所述至少一个参考节点是根据所述至少一个基站的位置信息确定的。
4.根据权利要求3所述的网络流量预测方法,其特征在于,所述计算设备基于所述贝叶斯时空模型预测所述目标区域中的至少一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据包括:
所述计算设备根据所述训练数据确定所述贝叶斯时空模型的参数;
所述计算设备根据所述贝叶斯时空模型的参数确定所述目标区域中的至少一个基站和所述至少一个参考节点的流量真实数据;
所述计算设备根据所述至少一个基站和所述至少一个参考节点的流量真实数据以及所述至少一个基站对应的固定空间方差确定所述至少一个基站中的任一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据。
5.根据权利要求3所述的网络流量预测方法,其特征在于,所述计算设备根据所述贝叶斯时空模型的基础模型和所述参数的先验分布得到所述贝叶斯时空模型的参数的后验分布包括:
其中,logf(θ,y,g*|g)表示所述贝叶斯时空模型的参数的后验分布;logf(θ)表示所述贝叶斯时空模型的参数的先验分布;θ表示所述贝叶斯时空模型的参数;g和g*分别表示训练数据和缺失的流量监测数据;表示基站对应的固定空间方差;l和t表示不同的时间单位;l=1,2,...,r;t=1,2,...,T1;Glt表示训练数据;Xlt是(n×p)维的协变量矩阵,n表示基站数目,p表示协变量数目;β是(p×1)维的相关系数矩阵;P表示(n×m)维的互相关矩阵,用于描述n个基站(s1,s2,...,sn)和m个参考节点 间的相关性和随机性;ylt=ρylt-1+ηlt,ρ∈(-1,1),用于描述n个基站和m个参考节点对应的流量真实值;ηlt表示m个参考节点的时空特征对流量真实值的影响;表示第n个基站的固定空间方差;Sη是关于ylt的(m×m)维的相关矩阵;表示yl0对应的yl0表示ylt的初始值。
6.根据权利要求3所述的网络流量预测方法,其特征在于,所述计算设备基于所述贝叶斯时空模型预测所述目标区域中的至少一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据包括:
7.一种计算设备,其特征在于,包括:
获取单元,用于获取训练数据,所述训练数据包括目标区域中的至少两个基站在第一时间间隔内的流量监测数据;
处理单元,用于根据所述训练数据建立贝叶斯时空模型;
所述处理单元,还用于基于所述贝叶斯时空模型预测所述目标区域中的至少一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据,所述第一时间间隔与所述第二时间间隔不同;
所述处理单元用于:
根据所述训练数据生成所述贝叶斯时空模型的基础模型,并设定所述贝叶斯时空模型的参数的先验分布,所述贝叶斯时空模型的参数是根据所述训练数据得到的;
根据所述贝叶斯时空模型的基础模型和所述参数的先验分布得到所述贝叶斯时空模型的参数的后验分布;
根据所述贝叶斯时空模型的参数的后验分布预测所述目标区域中的至少一个基站在第二时间间隔内的任一时刻的网络流量。
8.根据权利要求7所述的计算设备,其特征在于,所述处理单元还用于:
根据测试数据确定预测数据是否满足预设条件;所述测试数据包括所述目标区域中的至少一个基站在第三时间间隔内的流量监测数据,所述预测数据包括根据所述贝叶斯时空模型预测得到的所述目标区域中的所述至少一个基站在第三时间间隔内的流量数据,所述第三时间间隔包含于所述第二时间间隔;
若确定预测数据不满足预设条件,重新建立贝叶斯时空模型并基于所述重新建立的贝叶斯时空模型重新预测所述目标区域的流量数据。
9.根据权利要求8所述的计算设备,其特征在于,所述处理单元用于:
根据所述贝叶斯时空模型的参数、所述参数的先验分布、所述训练数据、所述至少一个基站对应的固定空间方差以及所述至少一个基站和至少一个参考节点对应的流量真实值确定所述贝叶斯时空模型的参数的后验分布;其中,所述至少一个参考节点是根据所述至少一个基站的位置信息确定的。
10.根据权利要求9所述的计算设备,其特征在于,所述处理单元用于:
根据所述训练数据确定所述贝叶斯时空模型的参数;
根据所述贝叶斯时空模型的参数确定所述目标区域中的至少一个基站和所述至少一个参考节点的流量真实数据;
根据所述至少一个基站和所述至少一个参考节点的流量真实数据以及所述至少一个基站对应的固定空间方差确定所述至少一个基站中的任一个基站在第二时间间隔内的任一时刻或任一时间段的流量数据。
11.根据权利要求9所述的计算设备,其特征在于,
其中,logf(θ,y,g*|g)表示所述贝叶斯时空模型的参数的后验分布;logf(θ)表示所述贝叶斯时空模型的参数的先验分布;θ表示所述贝叶斯时空模型的参数;g和g*分别表示训练数据和缺失的流量监测数据;表示基站对应的固定空间方差;l和t表示不同的时间单位;l=1,2,...,r;t=1,2,...,T1;Glt表示训练数据;Xlt是(n×p)维的协变量矩阵,n表示基站数目,p表示协变量数目;β是(p×1)维的相关系数矩阵;P表示(n×m)维的互相关矩阵,用于描述n个基站(s1,s2,...,sn)和m个参考节点 间的相关性和随机性;ylt=ρylt-1+ηlt,ρ∈(-1,1),用于描述n个基站和m个参考节点对应的流量真实值;ηlt表示m个参考节点的时空特征对流量真实值的影响;表示第n个基站的固定空间方差;Sη是关于ylt的(m×m)维的相关矩阵;表示yl0对应的yl0表示ylt的初始值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810845310.1A CN108965017B (zh) | 2018-07-27 | 2018-07-27 | 一种网络流量预测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810845310.1A CN108965017B (zh) | 2018-07-27 | 2018-07-27 | 一种网络流量预测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108965017A CN108965017A (zh) | 2018-12-07 |
CN108965017B true CN108965017B (zh) | 2021-05-25 |
Family
ID=64465845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810845310.1A Active CN108965017B (zh) | 2018-07-27 | 2018-07-27 | 一种网络流量预测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108965017B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111294812B (zh) * | 2018-12-10 | 2022-12-13 | 中兴通讯股份有限公司 | 一种资源扩容规划的方法及系统 |
CN111239718B (zh) * | 2020-01-17 | 2022-11-15 | 电子科技大学 | 一种基于单星辐射源的多基站目标定位方法 |
CN113256044B (zh) * | 2020-02-13 | 2023-08-15 | 中国移动通信集团广东有限公司 | 一种策略的确定方法、装置及电子设备 |
CN112291807B (zh) * | 2020-10-15 | 2022-09-23 | 山东科技大学 | 一种基于深度迁移学习和跨域数据融合的无线蜂窝网络流量预测方法 |
CN114900441B (zh) * | 2022-04-29 | 2024-04-26 | 华为技术有限公司 | 网络性能预测方法,性能预测模型训练方法及相关装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107483251A (zh) * | 2017-08-22 | 2017-12-15 | 国网辽宁省电力有限公司辽阳供电公司 | 一种基于分布式探针监测的网络业务异常侦测方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9253045B2 (en) * | 2006-11-17 | 2016-02-02 | Riverbed Technology, Inc. | Modeling and simulating flow propagation in dynamic bandwidth systems |
CN102982386A (zh) * | 2012-09-07 | 2013-03-20 | 浙江大学 | 一种基于空时压缩感知的蜂窝网络流量预测方法 |
CN106301957B (zh) * | 2016-09-29 | 2019-09-17 | 北京奇艺世纪科技有限公司 | 一种网络流量峰值的预测方法及装置 |
-
2018
- 2018-07-27 CN CN201810845310.1A patent/CN108965017B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107483251A (zh) * | 2017-08-22 | 2017-12-15 | 国网辽宁省电力有限公司辽阳供电公司 | 一种基于分布式探针监测的网络业务异常侦测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108965017A (zh) | 2018-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108965017B (zh) | 一种网络流量预测方法和装置 | |
CN107657015B (zh) | 一种兴趣点推荐方法、装置、电子设备及存储介质 | |
Tencaliec et al. | Flexible semiparametric generalized Pareto modeling of the entire range of rainfall amount | |
Si et al. | Mobility prediction in cellular network using hidden markov model | |
WO2017076154A1 (zh) | 网络事件预测以及建立网络事件预测模型的方法和装置 | |
CN113035366B (zh) | 密接人群识别方法、装置、电子设备及存储介质 | |
CN104461821A (zh) | 一种虚拟机监控预警方法及系统 | |
CN114462722B (zh) | 新能源发电功率轻量化高精度云预测系统、方法和装置 | |
CN114330935A (zh) | 基于多种结合策略集成学习的新能源功率预测方法和系统 | |
JP5628745B2 (ja) | トラヒック予測方法及び装置及びプログラム | |
CN112668238A (zh) | 一种降雨量处理方法、装置、设备和存储介质 | |
CN111800807A (zh) | 一种基站用户数量告警的方法及装置 | |
CN108270929A (zh) | 网络话务量预测方法及装置 | |
CN114338416B (zh) | 一种时空多指标预测方法、装置和存储介质 | |
CN112261609B (zh) | 毫米波车联网资源分配方法、装置、电子设备及存储介质 | |
KR102391607B1 (ko) | 폭염 중기예보 시스템 및 그 방법 | |
CN117252436A (zh) | 一种土地利用变化生态风险分区的方法和系统 | |
CN117332896A (zh) | 多层集成学习的新能源小时间尺度功率预测方法及系统 | |
CN114501518B (zh) | 流量预测方法、装置、设备、介质和程序产品 | |
CN117117833A (zh) | 光伏输出功率预测方法、装置、电子设备及存储介质 | |
CN116316617A (zh) | 多场站智能融合的新能源发电功率区域预测方法和系统 | |
CN113723006B (zh) | 一种基于ls-svm的单台站地球变化磁场建模预测方法及系统 | |
Ma et al. | Cellular Network Traffic Prediction Based on Correlation ConvLSTM and Self-Attention Network | |
CN115169089A (zh) | 基于核密度估计和copula的风电功率概率预测方法和装置 | |
Skøien et al. | Regionalization of post-processed ensemble runoff forecasts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |