CN110474808B - 一种流量预测方法及装置 - Google Patents
一种流量预测方法及装置 Download PDFInfo
- Publication number
- CN110474808B CN110474808B CN201910770111.3A CN201910770111A CN110474808B CN 110474808 B CN110474808 B CN 110474808B CN 201910770111 A CN201910770111 A CN 201910770111A CN 110474808 B CN110474808 B CN 110474808B
- Authority
- CN
- China
- Prior art keywords
- flow
- date
- preset
- prediction
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 239000011159 matrix material Substances 0.000 claims abstract description 75
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims description 41
- 230000015654 memory Effects 0.000 claims description 21
- 238000003860 storage Methods 0.000 claims description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 10
- 239000000126 substance Substances 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 7
- 238000000513 principal component analysis Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000004891 communication Methods 0.000 abstract description 13
- 230000008569 process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000005192 partition Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明的实施例公开一种流量预测方法及装置,涉及通信技术领域。能够解决现有技术中无法解决突发流量的预测问题。该方法包括:根据获取的预设区域内至少一个基站的原始数据按照预设时间顺序排列生成至少一个特征矩阵;对至少一个特征矩阵进行聚类生成至少一组聚类数据簇;提取每组聚类数据簇中的特征矩阵中的预定日期的流量序列以及基础的流量序列;将预定日期的流量序列以及基础的流量序列分别对预设网络模型进行训练生成预定日期预测模型以及基础预测模型;将所需预测的预定日期时间以及基站标识输入预定日期预测模型以及基础预测模型获得的预定日期预测流量值以及基础预测流量值根据预设公式计算生成预测流量值。本发明实施例应用于网络系统。
Description
技术领域
本发明的实施例涉及通信技术领域,尤其涉及一种流量预测方法及装置。
背景技术
随着无线通信技术的不断发展,伴随着无线通信网络衍生出的应用日趋丰富,通过网络中传输的视频、音频、图像数据日趋增多。与此同时,移动蜂窝网络基站的负荷日渐增大,为了保证用户体验,对于容量不够的基站需要进行扩容处理,流量预测可以为网络的规划管理以及维护提供参考数据。流量预测的数据源来自于基站的历史流量数据,目前而言,流量预测的技术方案大致分为三步:数据清洗、数据预处理、模型训练。
现有的流量预测方案包括差分移动平均自回归模型,多层感知器,时间递归神经网络,长短期记忆人工神经网络等技术。这些主流技术在用于时序数据平缓,上升下降稳定的情况下效果较好,但针对由于节假日等特殊日期造成的突发流量则无法进行预测。
发明内容
本发明的实施例提供一种流量预测方法及装置,能够解决现有技术中无法解决突发流量的预测问题。
为达到上述目的,本发明采用如下技术方案:
第一方面,提供一种流量预测方法,该方法包括:获取预设区域内至少一个基站的原始数据,并根据至少一个基站的原始数据按照预设时间顺序排列生成至少一个特征矩阵;其中原始数据包括:时间、小区名称、小区双工模式、本地小区标志、完整度、无线资源控制RRC(radio resource control)连接请求次数、上行流量、下行流量;特征矩阵与基站一一对应;对至少一个特征矩阵进行聚类生成至少一组聚类数据簇;提取每组聚类数据簇中的特征矩阵中的预定日期的流量序列以及基础的流量序列;其中流量序列包括以下任一项:上行流量序列以及下行流量序列;流量序列中的流量数据按照预设时间顺序进行排序;基础的流量序列包括特征矩阵中时间对应的流量数据;将预定日期的流量序列以及基础的流量序列分别对预设网络模型进行训练生成预定日期预测模型以及基础预测模型;将所需预测的预定日期时间以及基站标识输入预定日期预测模型以及基础预测模型获得预定日期预测流量值以及基础预测流量值;将预定日期预测流量值以及基础预测流量值根据预设公式计算生成预测流量值。
在上述方法中,考虑到每个基站内小区的流量在每个时间的前后存在增大或减小的变化趋势;则将获取的预设区域内至少一个基站的原始数据按照预设时间顺序排列生成至少一个特征矩阵;以便获得相邻时间流量变化的规律。另外,由于突发流量大多在于工作日和休息日的交替之际产生,并且预定日期流量和工作日流量存在着相关性;因此,本发明通过对至少一个特征矩阵进行聚类生成至少一组聚类数据簇;并将从提取每组聚类数据簇中的特征矩阵中的仅包含预定日期的流量序列以及包含所有时间基础的流量序列分别训练预设网络模型,从而获得预定日期预测模型以及基础预测模型两种流量预测模型;最后,为了提高预定日期等时期突发流量的预测精度,将预定日期预测模型以及基础预测模型需要预测的基站在预定日期产生的预定日期预测流量值以及基础预测流量值根据预设公式综合计算获得预测流量值。因此,本发明实施例通过提供一种基于基站流量的时空相关性并通过聚类方法训练生成的流量预测模型来解决突发流量的预测问题,并能够提高预测值的精度。
第二方面,提供一种流量预测装置,该流量预测装置包括:获取单元,用于获取预设区域内至少一个基站的原始数据;处理单元,用于根据获取单元获取的至少一个基站的原始数据按照预设时间顺序排列生成至少一个特征矩阵;其中原始数据包括:时间、小区名称、小区双工模式、本地小区标志、完整度、无线资源控制RRC连接请求次数、上行流量、下行流量;特征矩阵与基站一一对应;处理单元,还用于对至少一个特征矩阵进行聚类生成至少一组聚类数据簇;处理单元,还用于提取每组聚类数据簇中的特征矩阵中的预定日期的流量序列以及基础的流量序列;其中流量序列包括以下任一项:上行流量序列以及下行流量序列;流量序列中的流量数据按照预设时间顺序进行排序;基础的流量序列包括特征矩阵中时间对应的流量数据;预定日期包括节假日;处理单元,还用于将预定日期的流量序列以及基础的流量序列分别对预设网络模型进行训练生成预定日期预测模型以及基础预测模型;处理单元,还用于将所需预测的预定日期时间以及基站标识输入预定日期预测模型以及基础预测模型获得预定日期预测流量值以及基础预测流量值;处理单元,还用于将预定日期预测流量值以及基础预测流量值根据预设公式计算生成预测流量值。
可以理解地,上述提供的流量预测装置用于执行上文所提供的第一方面对应的方法,因此,其所能达到的有益效果可参考上文第一方面对应的方法以及下文具体实施方式中对应的方案的有益效果,此处不再赘述。
第三方面,提供了一种流量预测装置,该流量预测装置的结构中包括处理器和存储器,存储器用于与处理器耦合,保存该流量预测装置必要的程序指令和数据,处理器用于执行存储器中存储的程序指令,使得该流量预测装置执行第一方面的方法。
第四方面,提供一种计算机存储介质,计算机存储介质中存储有计算机程序代码,当计算机程序代码在流量预测装置上运行时,使得该流量预测装置执行上述第一方面的方法。
第五方面,提供一种计算机程序产品,该计算机程序产品储存有上述计算机软件指令,当计算机软件指令在流量预测装置上运行时,使得该流量预测装置执行如上述第一方面的方法的程序。
附图说明
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种流量预测方法的架构图;
图2为本发明实施例提供的一种聚类方法的流程示意图;
图3为本发明的实施例提供的一种流量预测装置的结构示意图;
图4为本发明的实施例提供的又一种流量预测装置的结构示意图;
图5为本发明的实施例提供的再一种流量预测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
还需要说明的是,本发明实施例中,“的(英文:of)”,“相应的(英文:corresponding,relevant)”和“对应的(英文:corresponding)”有时可以混用,应当指出的是,在不强调其区别时,其所要表达的含义是一致的。
为了便于清楚描述本发明实施例的技术方案,在本发明的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。
在通信网络优化中,网络流量分析与预测是非常重要的环节,对网络资源的优化配置具有重要意义。流量预测准确与否,预测结果的可解释性以及预测结果与实际流量数据是否相符,都直接影响网络的投资和建设规模。现有的流量预测方案包括差分移动平均自回归模型,多层感知器,时间递归神经网络,长短期记忆人工神经网络等技术。这些主流技术在用于时序数据平缓,上升下降稳定的情况下效果较好,但针对由于节假日等特殊日期造成的突发流量则无法进行预测。
针对上述现有技术存在的问题,参照图1,本发明实施例提供一种流量预测方法,该方法包括:
101、获取预设区域内至少一个基站的原始数据,并根据至少一个基站的原始数据按照预设时间顺序排列生成至少一个特征矩阵。
其中,原始数据包括:时间、小区名称、小区双工模式、本地小区标志、完整度、无线资源控制RRC连接请求次数、上行流量、下行流量;特征矩阵与基站一一对应。
102、对至少一个特征矩阵进行聚类生成至少一组聚类数据簇。
可选的,在步骤102之前还包括:
S1、对至少一个特征矩阵进行数据预处理;其中数据预处理包括数据填充以及数值转换。
另外,本发明实施例提供一种数据预处理的一种可能的实现方式,具体的,从基站采集到的原始数据包含着较高的维度,如时间、小区名称、小区双工模式、本地小区标志、完整度、无线资源控制RRC连接请求次数、上行流量、下行流量等多个维度。其中有很多非数值数据,例如时间,其中时间可以表示为采集信息的时间或者流量(包括上行流量或者下行流量)生成或统计的时间。首先每个基站采集得到的小区信息分别按照预设时间顺序(如时间先后顺序)排列成特征矩阵。基站的特征矩阵可以用式(1)表示:
Di={di1,di2,...,dim}T i∈{1,2,...,N}, (1)
式(1)中Di表示第i个基站的特征矩阵,也称作时间序列矩阵,其中m表示基站采集原始数据的总次数;N表示基站的总个数。
式(1)中dik表示第i个基站在第k次采集数据所得到的原始数据向量,其可以用式(2)表示:
dik=(xik1,xik2,...,xikh), (2)
式(2)中h表示采集原始数据的维度(行数)。
处理缺失数据(数据填充)是采用临近均值法进行填充。假设数据xikj表示第i个基站在第k次采集数据中的第j维(行),是一个缺失数据,其填充可用式(3)表示。
然后进行数据标准化,即将数据转为标准正态分布的数据,其转化公式如(4)所示:
经过数据标准化,数据服从标准正态分布,消除了数据的量纲对后续计算产生的影响。对于第i个基站而言,经过标准化的数据表示为式(5)所示。
Di'={di1',di2',...,dim'}T i∈{1,2,...,n}, (5)
可选的,在步骤102之前还包括:
S2、根据主成分分析算法对至少一个特征矩阵进行数据降维。
另外,本发明实施例提供一种数据降维的实现方式,具体的,根据上述实施例提供的一种数据处理的实现方式最终获得的Di'是一个m*h的特征矩阵。由于h个维度中不同的维度对基站特征的贡献量不一致,而且过高的维度使得在聚类过程中的计算量过大,因此需要将h维的数据降到l维(l≤h)。在该过程中采用主成分分析(principal componentanalysis,PCA)进行数据降维的操作。具体如下:
PCA的第一步需要求解特征矩阵的协方差矩阵C,如式(6)所示。
经过变换,其协方差矩阵C是一个h*h的方阵。
对协方差C做特征值分解。
CU=UΛ;
其中U={u1,u2,...,uh}是特征向量集合,Λ=diag(λ1,λ2,...,λh)为特征值。可以利用前l个特征向量将一个h维的数据向l维主成分方向投影为:
Di l=Di'Ul, (8);
设协方差C的特征根λ1≥λ2≥...≥λh,定义第k个主成分的贡献率为:
一般而言,为了达到降维的目的,并且将信息损失降到最低,依据式(9),l需要满足如下条件:
经过降维之后,第i个基站的数据矩阵转变为Di l,是一个m*l的矩阵,其中l≤h。
可选的,步骤102具体包括:根据K-Trend聚类算法对至少一个特征矩阵进行聚类生成至少一组聚类数据簇。
另外,本发明实施例提供一种利用K-Trend聚类算法对至少一个特征矩阵进行聚类的实现方式示例,对于给定的特征矩阵D={X1,X2,...,Xl}是一个m*l的矩阵。其中每一个列向量X=(x1,x2,...,xm)是一个长度为m的时间序列。为了得到序列的变化趋势,该时间序列的导数定义为:
其中,可以表示基站某特征矩阵的第h个时间段的流量变化趋势,表示导数序列。同理其他基站长度为m的特征矩阵Y=(y1,y2,...,ym)也可得到相应的导数序列对于两个不同序列的变化趋势差异可以由以下公式度量:
式(11)即可度量两个特征矩阵的不相似度,将趋势信息与经典距离计算方式相结合,可以得出基于趋势信息的基站特征矩阵距离度量TBD,如下所示。
其中矩阵T=diag(2-t(X,Y))。
对于基站i和基站j而言,其序列矩阵由Di和Dj描述,其距离由以下公式描述。
通过式(13)计算的距离表征了基站之间的时空相关性。对于全部基站而言,需要明确更新聚类中心的迭代方式,在更新聚类中的迭代步骤中找到一个矩阵使得数据簇内的其他矩阵的平方距离之和最小,则该矩阵可被成为类簇中心,则新的类簇中心满足:
其中,Di是第k个类簇pk中的序列矩阵。对式(14)进行迭代求解即可完成聚类过程。其中聚类效果用轮廓系数评价:
其中,b(i)是特征矩阵i到其他数据簇的平均不相似程度的最小值,a(i)是特征矩阵i到统一数据簇内其他序列的不相似程度的平均值。
此外,参照图2,本发明实施例根据上述的聚类方法进行如下聚类过程详述,具体如下:
201、设置最大迭代次数step、类簇数目k以及初始轮廓系数。跳转至步骤202。
202、将至少一个特征矩阵随机分配到k个类簇中,形成初始类簇划分。跳转至步骤203。
203、计算k个类簇中心。跳转至步骤203。
204、计算特征矩阵到k个类簇中心的距离,生成新类簇划分。跳转至步骤205。
205、判断初始类簇划分是否等于新类簇划分。若等于则跳转至步骤206,若不等于则跳转至步骤212。
206、计算新轮廓系数。跳转至步骤207。
207、判断新轮廓系数是否大于初始轮廓系数。若大于跳转至步骤208,若不大于则跳转至步骤209。
208、利用新轮廓系数的值更新初始轮廓系数,并根据新轮廓系数计算新初始类簇划分以及新类簇中心。跳转至步骤209。
209、令k-1替换k。跳转至步骤210。
210、判断k是否等于1。若是则跳转至步骤211。若否则跳转至步骤203。
211、输出新聚类划分。
212、令新类簇划分替换初始类簇划分。跳转至步骤213。
213、确定已完成的迭代次数step1是否等于step。若是则跳转至步骤206,否则跳转至步骤214。
214、令step1+1替换step1。跳转至步骤203。
103、提取每组聚类数据簇中的特征矩阵中的预定日期的流量序列以及基础的流量序列。
其中,流量序列包括以下任一项:上行流量序列以及下行流量序列;流量序列中的流量数据按照预设时间顺序进行排序;基础的流量序列包括特征矩阵中时间对应的流量数据;预定日期包括节假日。
104、将预定日期的流量序列以及基础的流量序列分别对预设网络模型进行训练生成预定日期预测模型以及基础预测模型。
105、将所需预测的预定日期时间以及基站标识输入预定日期预测模型以及基础预测模型获得预定日期预测流量值以及基础预测流量值。
106、将预定日期预测流量值以及基础预测流量值根据预设公式计算生成预测流量值。
可选的,步骤106具体包括:
将预定日期预测流量值以及基础预测流量值按照公式计算生成预测流量值:
Ot=ωtYt (1)+(1-ωt)Yt (2);
其中, 其中,表示历史预定日期T的基础预测流量值;表示历史预定日期T的预定日期预测流量值;YT表示历史预定日期T的真实流量值;Yt (1)表示所需预测的预定日期t的基础预测流量值;Yt (2)表示所需预测的预定日期t的预定日期预测流量值;ωt表示基础预测模型的权重。
具体的,将n个基站聚成了K个类簇,分别称为C1,C2,...,Ck,其中类簇Ci中包含有ni个基站,其中i∈[1,2,...,K]。对每一个类簇分别训练预测模型。
突发流量大多在于预定日期与相邻日期的交替之际产生;如工作日和休息日,但事实上,节假日流量等预定日期的流量和相邻日期的流量存在着相关性。因此本发明实施例在原始流量序列中提取预定日期的流量序列以及基础的流量序列,得到两个流量序列。分别训练预测,并针对在最后综合两者预测结果,具体操作步骤如下。
其中Bm为该类簇中第m个基站的特征矩阵。其后将训练集使用长短期记忆网络(Long Short-Term Memory,LSTM)网络进行训练得到预定日期预测模型以及基础预测模型两个模型。
显然,基础预测模型对于节假日等预定日期的流量的预测存在着较大的误差,但是其保留了节假日流量等预定日期的流量和相邻工作日流量的相关性的信息,为了提高突发流量的预测精度,需要再综合两个模型对预定日期的预测结果。另外,基于步骤106中,根据公式(16)计算生成历史预定日期T的预测流量值:
历史预测流量值的误差为e=OT-YT,其中,需要满足:
|e|≤min(|e(1)|,|e(2)|), (17)
在上述方法中,考虑到每个基站内小区的流量在每个时间的前后存在增大或减小的变化趋势;则将获取的预设区域内至少一个基站的原始数据按照预设时间顺序排列生成至少一个特征矩阵;以便获得相邻时间流量变化的规律。另外,由于突发流量大多在于工作日和休息日的交替之际产生,并且预定日期流量和工作日流量存在着相关性;因此,本发明通过对至少一个特征矩阵进行聚类生成至少一组聚类数据簇;并将从提取每组聚类数据簇中的特征矩阵中的仅包含预定日期的流量序列以及包含所有时间基础的流量序列分别训练预设网络模型,从而获得预定日期预测模型以及基础预测模型两种流量预测模型;最后,为了提高预定日期等时期突发流量的预测精度,将预定日期预测模型以及基础预测模型需要预测的基站在预定日期产生的预定日期预测流量值以及基础预测流量值根据预设公式综合计算获得预测流量值。因此,本发明实施例通过提供一种基于基站流量的时空相关性并通过聚类方法训练生成的流量预测模型来解决突发流量的预测问题,并能够提高预测值的精度。
本发明实施例可以根据上述方法实施例对流量预测装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本发明实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用对应各个功能划分各个功能模块的情况下,图3给出了上述实施例中涉及的流量预测装置30的一种可能的结构示意图,该流量预测装置30包括:
获取单元301,用于获取预设区域内至少一个基站的原始数据。
处理单元302,用于根据获取单元301获取的至少一个基站的原始数据按照预设时间顺序排列生成至少一个特征矩阵;其中原始数据包括:日期、时间、小区名称、小区双工模式、本地小区标志、完整度、无线资源控制RRC连接请求次数、上行流量、下行流量;特征矩阵与基站一一对应。
处理单元302,还用于对至少一个特征矩阵进行聚类生成至少一组聚类数据簇。
处理单元302,还用于提取每组聚类数据簇中的特征矩阵中的预定日期的流量序列以及基础的流量序列;其中流量序列包括以下任一项:上行流量序列以及下行流量序列;流量序列中的流量数据按照预设时间顺序进行排序;基础的流量序列包括特征矩阵中时间对应的流量数据;预定日期包括节假日。
处理单元302,还用于将预定日期的流量序列以及基础的流量序列分别对预设网络模型进行训练生成预定日期预测模型以及基础预测模型。
处理单元302,还用于将所需预测的预定日期时间以及基站标识输入预定日期预测模型以及基础预测模型获得预定日期预测流量值以及基础预测流量值。
处理单元302,还用于将预定日期预测流量值以及基础预测流量值根据预设公式计算生成预测流量值。
在一种示例性的方案中,处理单元302,还用于对获取单元301获取的至少一个特征矩阵进行数据预处理;其中数据预处理包括数据填充以及数值转换。
在一种示例性的方案中,处理单元302,还用于根据主成分分析算法对至少一个特征矩阵进行数据降维。
在一种示例性的方案中,处理单元302,具体用于根据K-Trend聚类算法对至少一个特征矩阵进行聚类生成至少一组聚类数据簇。
在一种示例性的方案中,处理单元302,具体用于将预定日期预测流量值以及基础预测流量值按照公式计算生成预测流量值:
Ot=ωtYt (1)+(1-ωt)Yt (2);
其中, 其中,表示历史预定日期T的基础预测流量值;表示历史预定日期T的预定日期预测流量值;YT表示历史预定日期T的真实流量值;Yt (1)表示所需预测的预定日期t的基础预测流量值;Yt (2)表示所需预测的预定日期t的预定日期预测流量值;ωt表示基础预测模型的权重。
由于本发明实施例中的流量预测装置可以应用于实施上述方法实施例,因此,其所能获得的技术效果也可参考上述方法实施例,本发明实施例在此不再赘述。
在采用集成的单元的情况下,图4示出了上述实施例中所涉及的流量预测装置30的一种可能的结构示意图。流量预测装置30包括:处理模块401、通信模块402和存储模块403。处理模块401用于对流量预测装置30的动作进行控制管理,例如,处理模块401用于支持流量预测装置30执行图1中的过程102~106。通信模块402用于支持流量预测装置30与其他实体的通信。存储模块403用于存储流量预测装置30的程序代码和数据。
其中,处理模块401可以是处理器或控制器,例如可以是中央处理器(centralprocessing unit,CPU),通用处理器,数字信号处理器(digital signal processor,DSP),专用集成电路(application-specific integrated circuit,ASIC),现场可编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。通信模块402可以是收发器、收发电路或通信接口等。存储模块403可以是存储器。
当处理模块401为如图5所示的处理器,通信模块402为图5的收发器,存储模块403为图5的存储器时,本申请实施例所涉及的流量预测装置30可以为如下的流量预测装置30。
参照图5所示,该流量预测装置30包括:处理器501、收发器502、存储器503和总线504。
其中,处理器501、收发器502、存储器503通过总线504相互连接;总线504可以是外设部件互连标准(peripheral component interconnect,PCI)总线或扩展工业标准结构(extended industry standard architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
处理器501可以是一个通用中央处理器(central processing unit,CPU),微处理器,特定应用集成电路(application-apecificintegratedcircuit,ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。
存储器503可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、只读光盘(compact disc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
其中,存储器503用于存储执行本申请方案的应用程序代码,并由处理器501来控制执行。收发器502用于接收外部设备输入的内容,处理器501用于执行存储器503中存储的应用程序代码,从而实现本申请实施例中的流量预测方法。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
本发明实施例还提供一种计算机程序产品,该计算机程序产品可直接加载到存储器中,并含有软件代码,该计算机程序产品经由计算机载入并执行后能够实现上述的流量预测方法。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (12)
1.一种流量预测方法,其特征在于,包括:
获取预设区域内至少一个基站的原始数据,并根据所述至少一个基站的原始数据按照预设时间顺序排列生成至少一个特征矩阵;其中所述原始数据包括:时间、小区名称、小区双工模式、本地小区标志、完整度、无线资源控制RRC连接请求次数、上行流量、下行流量;所述特征矩阵与所述基站一一对应;
对所述至少一个特征矩阵进行聚类生成至少一组聚类数据簇;
提取每组聚类数据簇中的所述特征矩阵中的预定日期的流量序列以及基础的流量序列;其中流量序列包括以下任一项:上行流量序列以及下行流量序列;所述流量序列中的流量数据按照所述预设时间顺序进行排序;所述基础的流量序列包括所述特征矩阵中所述时间对应的流量数据;所述预定日期包括节假日;
将所述预定日期的流量序列以及所述基础的流量序列分别对预设网络模型进行训练生成预定日期预测模型以及基础预测模型;
将所需预测的预定日期时间以及基站标识输入所述预定日期预测模型以及基础预测模型获得预定日期预测流量值以及基础预测流量值;
将所述预定日期预测流量值以及所述基础预测流量值根据预设公式计算生成预测流量值。
2.根据权利要求1所述的流量预测方法,其特征在于,所述对所述至少一个特征矩阵进行聚类生成至少一组聚类数据簇之前,还包括:
对所述至少一个特征矩阵进行数据预处理;其中所述数据预处理包括数据填充以及数值转换。
3.根据权利要求1所述的流量预测方法,其特征在于,所述对所述至少一个特征矩阵进行聚类生成至少一组聚类数据簇之前,还包括:
根据主成分分析算法对所述至少一个特征矩阵进行数据降维。
4.根据权利要求1所述的流量预测方法,其特征在于,所述对所述至少一个特征矩阵进行聚类生成至少一组聚类数据簇,具体包括:
根据K-Trend聚类算法对所述至少一个特征矩阵进行聚类生成至少一组聚类数据簇。
6.一种流量预测装置,其特征在于,包括:
获取单元,用于获取预设区域内至少一个基站的原始数据;
处理单元,用于根据所述获取单元获取的所述至少一个基站的原始数据按照预设时间顺序排列生成至少一个特征矩阵;其中所述原始数据包括:日期、时间、小区名称、小区双工模式、本地小区标志、完整度、无线资源控制RRC连接请求次数、上行流量、下行流量;所述特征矩阵与所述基站一一对应;
所述处理单元,还用于对所述至少一个特征矩阵进行聚类生成至少一组聚类数据簇;
所述处理单元,还用于提取每组聚类数据簇中的所述特征矩阵中的预定日期的流量序列以及基础的流量序列;其中流量序列包括以下任一项:上行流量序列以及下行流量序列;所述流量序列中的流量数据按照所述预设时间顺序进行排序;所述基础的流量序列包括所述特征矩阵中所述时间对应的流量数据;所述预定日期包括节假日;
所述处理单元,还用于将所述预定日期的流量序列以及所述基础的流量序列分别对预设网络模型进行训练生成预定日期预测模型以及基础预测模型;
所述处理单元,还用于将所需预测的预定日期时间以及基站标识输入所述预定日期预测模型以及基础预测模型获得预定日期预测流量值以及基础预测流量值;
所述处理单元,还用于将所述预定日期预测流量值以及所述基础预测流量值根据预设公式计算生成预测流量值。
7.根据权利要求6所述的流量预测装置,其特征在于,包括:
所述处理单元,还用于对所述获取单元获取的所述至少一个特征矩阵进行数据预处理;其中所述数据预处理包括数据填充以及数值转换。
8.根据权利要求6所述的流量预测装置,其特征在于,包括:
所述处理单元,还用于根据主成分分析算法对所述至少一个特征矩阵进行数据降维。
9.根据权利要求6所述的流量预测装置,其特征在于,包括:
所述处理单元,具体用于根据K-Trend聚类算法对所述至少一个特征矩阵进行聚类生成至少一组聚类数据簇。
11.一种流量预测装置,其特征在于,所述流量预测装置的结构中包括处理器和存储器,存储器用于与处理器耦合,保存所述流量预测装置必要的程序指令和数据,处理器用于执行存储器中存储的程序指令,使得所述流量预测装置执行如权利要求1-5任一项所述的流量预测方法。
12.一种计算机存储介质,其特征在于,计算机存储介质中存储有计算机程序代码,当计算机程序代码在流量预测装置上运行时,使得所述流量预测装置执行如权利要求1-5任一项所述的流量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910770111.3A CN110474808B (zh) | 2019-08-20 | 2019-08-20 | 一种流量预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910770111.3A CN110474808B (zh) | 2019-08-20 | 2019-08-20 | 一种流量预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110474808A CN110474808A (zh) | 2019-11-19 |
CN110474808B true CN110474808B (zh) | 2022-02-18 |
Family
ID=68512955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910770111.3A Active CN110474808B (zh) | 2019-08-20 | 2019-08-20 | 一种流量预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110474808B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111030869B (zh) * | 2019-12-20 | 2022-09-20 | 锐捷网络股份有限公司 | 一种网络流量的预测方法及预测装置 |
CN110798365B (zh) * | 2020-01-06 | 2020-04-07 | 支付宝(杭州)信息技术有限公司 | 基于神经网络的流量预测方法及装置 |
CN114205853A (zh) * | 2020-09-02 | 2022-03-18 | 中兴通讯股份有限公司 | 流量预测方法、流量预测模型建立方法和存储介质 |
CN112801411B (zh) * | 2021-02-26 | 2024-02-09 | 南京工业大学 | 一种基于生成对抗网络的网络流量预测方法 |
CN113691993B (zh) * | 2021-07-23 | 2024-01-05 | 山东师范大学 | 基于图神经网络的5g连通簇基站群流量预测方法及系统 |
CN113810226B (zh) * | 2021-09-07 | 2022-05-03 | 清华大学 | 结合离散特征编码和聚类修正的广域网单点流量预测方法 |
CN115907181B (zh) * | 2022-12-01 | 2023-06-23 | 郑州铁路职业技术学院 | 一种城市轨道交通乘客流量预测方法及系统 |
CN115696533B (zh) * | 2023-01-03 | 2023-05-09 | 杭州纵横通信股份有限公司 | 一种基于5g的通信基站能耗优化方法与设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105340311A (zh) * | 2014-06-05 | 2016-02-17 | 华为技术有限公司 | 网络设备、网络业务预测装置和方法 |
CN107171848A (zh) * | 2017-05-27 | 2017-09-15 | 华为技术有限公司 | 一种流量预测方法和装置 |
CN108062561A (zh) * | 2017-12-05 | 2018-05-22 | 华南理工大学 | 一种基于长短时记忆网络模型的短时数据流预测方法 |
CN109327844A (zh) * | 2018-11-27 | 2019-02-12 | 中国联合网络通信集团有限公司 | 一种小区扩容方法及装置 |
CN109495318A (zh) * | 2018-12-17 | 2019-03-19 | 广东宜通世纪科技股份有限公司 | 一种移动通信网络流量预测方法、装置及可读存储介质 |
CN109711865A (zh) * | 2018-12-07 | 2019-05-03 | 恒安嘉新(北京)科技股份公司 | 一种基于用户行为挖掘的移动通信网流量精细化预测的方法 |
CN110139299A (zh) * | 2019-05-14 | 2019-08-16 | 鹰潭泰尔物联网研究中心 | 一种蜂窝网络中基站流量的聚类分析方法 |
-
2019
- 2019-08-20 CN CN201910770111.3A patent/CN110474808B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105340311A (zh) * | 2014-06-05 | 2016-02-17 | 华为技术有限公司 | 网络设备、网络业务预测装置和方法 |
CN107171848A (zh) * | 2017-05-27 | 2017-09-15 | 华为技术有限公司 | 一种流量预测方法和装置 |
CN108062561A (zh) * | 2017-12-05 | 2018-05-22 | 华南理工大学 | 一种基于长短时记忆网络模型的短时数据流预测方法 |
CN109327844A (zh) * | 2018-11-27 | 2019-02-12 | 中国联合网络通信集团有限公司 | 一种小区扩容方法及装置 |
CN109711865A (zh) * | 2018-12-07 | 2019-05-03 | 恒安嘉新(北京)科技股份公司 | 一种基于用户行为挖掘的移动通信网流量精细化预测的方法 |
CN109495318A (zh) * | 2018-12-17 | 2019-03-19 | 广东宜通世纪科技股份有限公司 | 一种移动通信网络流量预测方法、装置及可读存储介质 |
CN110139299A (zh) * | 2019-05-14 | 2019-08-16 | 鹰潭泰尔物联网研究中心 | 一种蜂窝网络中基站流量的聚类分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110474808A (zh) | 2019-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110474808B (zh) | 一种流量预测方法及装置 | |
WO2021129086A1 (zh) | 流量预测方法、装置以及存储介质 | |
US10963802B1 (en) | Distributed decision variable tuning system for machine learning | |
CN107358268A (zh) | 用于数据聚类分组的方法、装置、电子设备及可读介质 | |
WO2023134188A1 (zh) | 指标确定方法、装置、电子设备和计算机可读介质 | |
CN110020739B (zh) | 用于数据处理的方法、装置、电子设备及计算机可读介质 | |
CN112396231A (zh) | 针对时空数据的建模方法、装置、电子设备及可读介质 | |
CN116684330A (zh) | 基于人工智能的流量预测方法、装置、设备及存储介质 | |
CN115130894A (zh) | 基于人工智能的生产规划方法、装置、计算机设备及介质 | |
CN113962874A (zh) | 母线负荷模型的训练方法、装置、设备及存储介质 | |
CN113283576B (zh) | 一种基于鲸鱼算法优化lstm的频谱感知方法 | |
CN111160614B (zh) | 资源转移预测模型的训练方法、装置及计算设备 | |
CN108509984A (zh) | 激活值量化训练方法及装置 | |
Konnov et al. | Application of the conditional gradient method to resource allocation in wireless networks | |
CN113935407A (zh) | 一种异常行为识别模型确定方法及装置 | |
Xiao et al. | Enhanced-xgb: An online service resource demand forecasting method for colocation data centers | |
US20200279199A1 (en) | Generating a completion prediction of a task | |
CN111178637A (zh) | 一种电网短期负荷预测方法和装置 | |
CN112104467B (zh) | 割接操作风险评级方法、装置及计算设备 | |
CN110443374B (zh) | 一种资源信息处理方法、装置及设备 | |
JP6959559B2 (ja) | データ数決定装置、データ数決定方法及びデータ数決定プログラム | |
EP4198831A1 (en) | Automated feature engineering for predictive modeling using deep reinforcement learning | |
CN112101611B (zh) | 房地产客户复购时间的预测方法、服务器及存储介质 | |
WO2023065309A1 (zh) | 一种电路设计方法及装置 | |
US20230394322A1 (en) | Server apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |