CN111294812A - 一种资源扩容规划的方法及系统 - Google Patents

一种资源扩容规划的方法及系统 Download PDF

Info

Publication number
CN111294812A
CN111294812A CN201811502347.0A CN201811502347A CN111294812A CN 111294812 A CN111294812 A CN 111294812A CN 201811502347 A CN201811502347 A CN 201811502347A CN 111294812 A CN111294812 A CN 111294812A
Authority
CN
China
Prior art keywords
base station
data
flow
network
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811502347.0A
Other languages
English (en)
Other versions
CN111294812B (zh
Inventor
唐春
叶德忠
吕海兵
巫忠正
周亮
魏昕
包秋霞
高赟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201811502347.0A priority Critical patent/CN111294812B/zh
Publication of CN111294812A publication Critical patent/CN111294812A/zh
Application granted granted Critical
Publication of CN111294812B publication Critical patent/CN111294812B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/18Network planning tools
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/22Traffic simulation tools or models

Abstract

本发明实施例提供一种资源扩容规划的方法及系统,包括:获取影响网络流量的特征数据,并对所述特征数据进行预处理,得到基于基站编号的数据时间序列;根据所述基于基站编号的数据时间序列,对基站进行特定区域画像;根据所述对基站进行的特定区域的画像,建立网络预测模型;根据所述画像及所述网络预测模型,生成并发送需要进行扩容的提示信息。本方案,网络流量预测准确,能及时使运营商知晓目标区域的基站的布置是否依然能满足该区域用户的上网需求,有效保证了目标区域的用户的网络畅通及良好的用户体验。

Description

一种资源扩容规划的方法及系统
技术领域
本发明涉及通信网络中网络流量分析技术领域,尤其涉及一种资源扩容规划的方法及系统。
背景技术
随着通信技术的发展,以智能终端为代表的通信市场呈现爆发式增长,尤其是大型的商业区、工业区及住宅区,预设时间段的通信量呈现爆发式的增长。
当运营商发现某区域的基站已经无法满足用户对网络的需求从而造成网络的拥堵时,统计历史流量、预测未来流量、设计网络布局及布置网络设备需要较长的时间。基于智能设备的网络吞吐量日益升高,且伴随着智能终端的数量日益增多,因此在此过程中,网络拥堵的现象依然存在甚至是日益严重。
为了解决上述问题,现有技术方案中设定有流量预测的机制,根据历史流量预测未来流量,然而,由于网络流量具有长相关性、自相关性以及突发连续性等诸多特性,由此造成网络流量的预测精度并不高。另外,网络流量的复杂行为特征不仅仅表现在时间尺度和统计特征上,还表现在空间尺度上。不同地域特点的网络流量趋势表现明显不同,需要模型学习到的特点也大不一样。虽然针对网络流量预测的模型有很多,但往往由于地理位置信息挖掘难度较高而难以在模型中加入空间尺度特征,从而导致网络预测整体效果较差。因此,网络预测的可信度并不高,从而造成在实际应用中并非根据流量预测实时重新布局网络设备或增加网络设备。
综上所述,现有技术方案中缺少一种有效的网络预测方法,从而可以使基于该网络预测重新布局网络设备或增加网络设备。
发明内容
本发明实施例的目的是提供一种资源扩容规划的方法及系统,以解决现有技术中缺少一种有效的网络预测方法,从而可以使基于该网络预测重新布局网络设备或增加网络设备的技术问题。
为解决上述技术问题,本发明实施例是这样实现的:
第一方面,本发明实施例提供一种资源扩容规划的方法,包括:
获取影响网络流量的特征数据,并对所述特征数据进行预处理,得到基于基站编号的数据时间序列;
根据所述基于基站编号的数据时间序列,对基站进行特定区域画像;
根据所述对基站进行的特定区域的画像,建立网络预测模型;
根据所述画像及所述网络预测模型,生成并发送需要进行扩容的提示信息。
在一个实施例中,所述获取影响网络流量的特征数据,并对所述特征数据进行预处理,得到基于基站编号的数据时间序列,包括:
从承载设备中获取基站的网络信息的原始数据;所述网络信息中包括流量信息;
从所述原始数据中挑选满足预设长度的原始数据,作为特征数据;
从所述特征数据中去除异常数据,得到基于基站编号的数据时间序列;
其中,所述异常数据为端口关闭造成的异常值,和/或所述网络信息中重复的流量值,和/或缺失比率大于预设值的基站的网络信息。
在一个实施例中,所述根据所述基于基站编号的数据时间序列,对基站进行特定区域画像,包括:
根据预设基站编号的基站的一组流量数据中的总流量数据最大值及总流量数据最小值对所述特定基站编号的基站的总流量数据做归一化处理;
选择目标区域的预设时间段的流量数据;
计算预设基站编号的基站的预设时间的距离矩阵;
根据所述预设时间的距离矩阵,确定特定基站编号的基站的累积距离矩阵,并根据所述累积距离矩阵确定特定基站编号的基站的时间数据序列与目标区域的流量数据之间的距离,得到包括基于特定基站编号、基站的名称及特定编号的基站的时间数据序列与目标区域的基站的流量数据的距离的数值对;
根据目标区域的名称确定有效阈值;
选择有效网络数据;其中,所述有效网络数据为基站序列与目标区域之间的流量数据之间的距离小于所述有效阈值的基站的网络数据。
在一个实施例中,所述根据所述对基站进行的特定区域的画像,建立网络预测模型,包括:
确定模型输入和模型输出;
根据所述有效网络数据得到基站的不同时间的网络流量值,确定训练输入样本、训练输出样本、测试输入样本及测试输出样本;
设定模型初始值,得到完成训练的加法模型;
确定损失函数,最小化损失函数,得到最优解模型;
确定XGBoost加法模型。
在一个实施例中,所述根据所述画像及所述网络预测模型,发送需要扩容的提示信息,包括:
获取预设时刻特定基站编号的基站的流量信息,确定所述预设时刻预设基站的流量数据中的预设时刻的基站流量的最大值;
根据容忍度对所述基站流量的最大值、基站流量的最小值进行判断,若所述基站流量的最大值满足预设要求,则发送需要扩容的提示信息。
第二方面,根据本发明实施例提供的一种资源扩容规划的系统,包括:
流量采集模块,用于获取影响网络流量的特征数据,并对所述特征数据进行预处理,得到基于基站编号的数据时间序列;
用户画像模块,用于根据所述基于基站编号的数据时间序列,对基站进行特定区域画像;
流量预测模块,用于根据所述对基站进行的特定区域的画像,建立网络预测模型;
提示信息生成模块,用于根据所述画像及所述网络预测模型,生成并发送需要进行扩容的提示信息。
在一个实施例中,所述流量采集模块,包括:
数据获取单元,用于从承载设备中获取基站的网络信息的原始数据;所述网络信息中包括流量信息;
数据挑选单元,用于从所述原始数据中挑选满足预设长度的原始数据,作为特征数据;
数据处理单元,从所述特征数据中去除异常数据,得到基于基站编号的数据时间序列;
其中,所述异常数据为端口关闭造成的异常值,和/或所述网络信息中重复的流量值,和/或缺失比率大于预设值的基站的网络信息。
在一个实施例中,所述用户画像模块,包括:
流量数据归一单元,用于根据预设基站编号的基站的一组流量数据中的总流量数据最大值及总流量数据最小值,对所述特定基站编号的基站的总流量数据做归一化处理;
目标流量选择单元,用于选择目标区域的预设时间段的流量数据;
距离计算单元,用于计算预设基站编号的基站的预设时间的距离矩阵;
数据对确定单元,用于根据所述预设时间的距离矩阵,确定特定基站编号的基站的累积距离矩阵,并根据所述累积距离矩阵确定特定基站编号的基站的时间数据序列与目标区域的流量数据之间的距离,得到包括基于特定基站编号、基站的名称及特定编号的基站的时间数据序列与目标区域的基站的流量数据的距离的数值对;
有效阈值确定单元,用于根据目标区域的名称确定有效阈值;
有效数据选择单元,用于选择有效网络数据;其中,所述有效网络数据为基站序列与目标区域之间的流量数据之间的距离小于所述有效阈值的基站的网络数据。
在一个实施例中,流量预测模块,包括:
输入、输出确定单元,用于确定模型输入和模型输出;
样本确定单元,用于根据所述有效网络数据得到基站的不同时间的网络流量值,确定训练输入样本、训练输出样本、测试输入样本及测试输出样本;
加法模型确定单元,设定模型初始值,得到完成训练的加法模型;
最优解模型生成导游,用于确定损失函数,最小化损失函数,得到最优解模型;
XGBoost加法模型确定单元,用于确定XGBoost加法模型。
在一个实施例中,所述提示信息生成模块,包括:
流量极限值获取单元,用于获取预设时刻特定基站编号的基站的流量信息,确定所述预设时刻预设基站的流量数据中的预设时刻的基站流量的最大值;
提示单元,用于根据容忍度对所述基站流量的最大值进行判断,若所述基站流量的最大值满足预设要求,则生成并发送需要扩容的提示信息。
第三方面,本发明实施例提供一种网络设备,包括存储器、处理器及在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述任一项所述的资源扩容规划的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的资源扩容规划的方法。
本发明实施例提供的资源扩容规划的方法,采用BTW的方法计算距离值以对基站进行特定区域的画像,然后基于极端梯度提升XGBoost建立网络流量预测模型,以对下一时刻的网络流量值进行预测,最后,根据流量预测结果与基站画像发送警告信息,网络流量预测准确,能及时使运营商知晓目标区域的基站的布置是否依然能满足该区域用户的上网需求,有效保证了目标区域的用户的网络畅通及良好的用户体验。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例中一种资源扩容规划的方法的流程图;
图2为本发明实施例中采用的画像方法与现有技术方案中的数据筛选方法的筛选前后的MAPE对比图;
图3为本发明实施例中采用的预测方法与现有技术方案中其他预测方案的预测效果对比示意图;
图4为本发明实施例中一种资源扩容规划的系统的模块图;
图5为本发明实施例中一种网络设备的模块图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种资源扩容规划的方法,应用于基站与核心网之间,实施方法包括:
步骤S102、获取影响网络流量的特征数据,并对所述特征数据进行预处理,得到基于基站编号的数据时间序列;
在本发明实施例中,所述特征数据中可包括三方面的数据,分别为时间信息、位置信息及网络中的流量信息。其中,时间信息包含:采集时间点time;位置信息包含:基站的名称Name,基站所在的城市city,基站所在城市下属行政区名称area1;网络中流量信息包括:基站特定编号noid,时间段内总流量数据kb,平均网络流量速度avgSpeed,最大网络流量速度maxSpeed,端口类型port_type,服务类型service_type。在此指出,上包括上述三方面的数据仅是为了便于描述,并非是对获取的特征数据中包括的数据类型的具体限定。
在本发明实施例中,对特征数据进行预处理,主要是去除不满足要求的数据,如异常数据、重复数据或者缺失比率比较高的基站的流量数据等,得到基于基站编号的数据时间序列,具体的,所述步骤S102包括:
1)从承载设备中获取基站的网络信息的原始数据;所述网络信息中包括流量信息;
2)从所述原始数据中挑选满足预设长度的原始数据,作为特征数据;
在一个实施例中,从所述原始数据中挑选固定时间长度的原始数据,作为特征数据,如挑选间隔1h的原始数据、挑选间隔30min的原始数据。其挑选的依据为获取的原始数据中的采集时间点time。
3)从所述特征数据中去除异常数据,得到基于基站编号的数据时间序列;
在本发明实施例中,原始数据记录中流量数据的异常数据较多,具体表现为:
1)异常关闭端口所造成的‘-99999999’值;
2)原始数据记录中网络的流量信息有较多的重复值,具体表现为连续一天或多天的流量信息值保持不变;
3)记录的不同特定基站编号noid的缺失程度,考虑缺失比率较大的基站的特征数据可能会因缺失程度较大导致后续的预测效果较差,选取缺失比率较小的特征数据用于后续流量预测,如缺失比率小于三分之一的特征数据用于后续流量预测;
4)得到处理后的基于特定基站编号的数据时间序列:
Ti={time,service_type,city,area1,Name,kb},0≤i≤L
其中,Ti为一条特征数据中所包含的信息,L为总的数据记录条数。
通过上述方法,可以得到基于特定基站编号的可用于后续流量预测的特征数据,基于特征数据是对原始数据经过长度选择、异常值去除后得到的数据,因此,采用本方案中的特征数据进行后续的流量预测的准确率较高。
步骤S104、根据所述基于特定基站编号的数据时间序列,对基站进行特定区域画像;
在本发明实施例中,根据得到的基于特定基站编号的数据时间序列,对基站进行特定区域画像,以完成基于特定基站编号的特定区域的特征数据的选取。
进一步地,在本发明实施例中,是基于DTW距离值完成特定区域的特征数据的选取。
在本发明实施例中,所述步骤S104具体包括:
1)根据预设基站编号的基站的一组流量数据中的总流量数据最大值及总流量数据最小值对所述特定基站编号的基站的总流量数据做归一化处理;
具体的,本发明实施例可采用如下计算公式完成流量数据的归一化处理:
Figure RE-GDA0001979281540000071
在上式中,kb为特定基站编号noid的总流量数据,kb.min表示这组流量数据的总流量数据最小值,kb.max表示这组流量数据的总榴莲数据最大值。 kb取值范围为[0,1]。
2)选择目标区域的预设时间段的流量数据;
在本发明实施例中,可以根据基站的名称Name选取目标区域,进而选取该目标区域的流量趋势数据
S0={KB}={kbi},i=0,1,…,23
其中,KB为目标区域的平均天流量数据,kbi表示一天中第i个小时的流量值,ki,0为归一化之后的流量,取值范围为[0,1]。
在此指出,上述选择是基于相邻两个采集时间点time之间间隔1h的原始数据而言,如果是相邻两个采集时间点time之间间隔0.5h,则可为
S0={KB}={kbi},i=0,1,…,46
其中,KB为目标典型区域的平均天流量数据,kbi表示一天中第i个小时的流量值,ki,0为归一化之后的流量,取值范围为[0,1]。
在此指出,选取两个特征数据之间的之间间隔可以依据实际需求而进行设定,上述两个例子仅为了便于描述,并非是对具体选取时间间隔的具体限定。
3)计算预设基站编号的基站的预设时间的距离矩阵;
在本发明实施例中,首先计算第n天的距离矩阵Mn,具体方式为:
第n天的距离矩阵Mn
Figure RE-GDA0001979281540000081
其中,
dni,j=|kbi-kbj,n|
dni,j表示目标典型区域的第i个流量值与基站的第n天的第j个流量值之间的欧氏距离,|·|表示求取绝对值;而:
Sn={kb}={kbi,n},i=0,1,…,M-1
其中,Sn表示基站第n天的总流量数据;M表示第n天的数据记录条数,由于数据预处理操作,数据记录或有缺失不一定为24条;kbi,n表示第n天的第i条流量记录。
在此指出,此处是基于相邻两个采集时间点time之间间隔1h而言,为了便于描述,本发明实施例以相邻两个采集时间点time之间间隔1h进行阐述。
4)根据所述预设时间的距离矩阵,确定特定基站编号的基站的累积距离矩阵MCn,并根据所述累积距离矩阵MCn确定特定基站编号的基站的时间数据序列与目标区域的流量数据之间的距离,得到包括基于特定基站编号、基站的名称及特定编号的基站的时间数据序列与目标区域的基站的流量数据的距离的数值对;
具体地,计算第n天的累积距离矩阵MCn的公式可为:
Figure RE-GDA0001979281540000091
其中,
Dni,j=dni,j+Min{Dni-1,j,Dni,j-1,Dni-1,j-1},Min{·}表示选择几者中的最小值。
在计算出累积距离矩阵MCn之后,计算特定基站编号的基站的时间数据序列与目标区域的流量数据之间的距离值
valn=Dn23,M-1
其中,valn表示特定编号的基站第n天的时间数据序列与目标区域的基站的流量数据之间的距离值,其中,val值越大表示序列之间的距离越大,相似度越低。
特定基站编号的基站与目标区域之间的整体距离值为:
Figure RE-GDA0001979281540000092
其中,N表示基站序列记录的总天数。
然后得到数据对:
{noid∶VAL,Name}
作为一种具体的实施方式,对于目标区域的选择可以是基于基站名称 Name,如从Name中截取关键字,当包含“广场”、“商场”、“商业”的基站判断为商业区的基站。同时,为其增加特征值is_comarea,若为商业区则设值为1,否则设值为0。
5)根据目标区域的基站的名称确定有效阈值;
具体可为,根据所述目标区域的基站
计算阈值可信度ρ(θ):
Figure RE-GDA0001979281540000093
num(θ)∶{noid:VAL<θ}
其中,NUM为经过关键字截取后is_comarea为1的noid数量及Name初判断为目标区域的基站数量;num(θ)表示出判断为目标区域的基站中DTW相似度值VAL小于θ的基站数量。可信度高于85%时为有效可信度,即此时的阈值θ为有效特定区域选取阈值,本发明中,若所述目标去为商业区,则所述有效阈值为4-5,如4,4.5或5。
6)选择有效网络数据;其中,所述有效网络数据为基站序列与目标区域之间的流量数据之间的距离小于所述有效阈值的基站的网络数据。
在本发明实施例中,可根据有效阈值θ获得筛选过后的目标区域的基站编号noid的名单
{noid∶VAL<θ}
至此,完成基于DTW距离值的特定区域基站数据选取。
步骤S106、根据所述对基站进行的特定区域的画像,建立网络预测模型;
1)确定模型输入和模型输出;
考虑到极端升降梯度XGBoost的算法特点,当输入为高维特征时模型的预测效果较好;且时间序列历史数据包含信息量较大,因此,优选新增加特征数据。
基于滑动平均窗口和时间分布获得新特征数据如下:
{beday∶前一天的同一时刻的网络流量值}
{beweek∶前一周的同一时刻的网络流量值}
{weekday∶星期特征,数值0到6表示周一至周日}
新增加的特征数据包括但不仅限于以上。
则增加特征数据后的数据记录为:
Ti={time,service_type,city,area1,beday,beweek,weekday,kb},0≤i≤L
划分模型输入和输出:
Figure RE-GDA0001979281540000101
其中,Xi为模型输入,Yi为模型输出。
2)根据所述有效网络数据得到基站的不同时间的网络流量值,确定训练输入样本、训练输出样本、测试输入样本及测试输出样本;
根据步骤S104可以得到特定编号的基站不同时刻的网络流量值,从而形成时间序列样本:
Xtrain={X1,X2,…,Xt-1},Xtest={Xt,Xt+1,…,XL-1}
Ytrain={Y1,Y2,…,Yt-1},Ytest={Yt,Yt+1,…,YL-1}
在上式中,Xtrain,Ytrain分别是训练输入和训练输出,Xtest,Ytest分别是测试输入和测试输出。
3)设定模型初始值,得到完成训练的加法模型;
在本发明实施例中,设定叶节点惩罚系数:γ=1,正则化参数:λ=0.1,树的个数:K=20,则
XGBoost模型定义为加法模型:
Figure RE-GDA0001979281540000111
其中,F(X;w)为最终训练完成的加法模型,简单来说XGBoost是一种有效的改进叠加树模型,X为输入样本数据,hk为单棵分类回归树,w是分类回归树的参数,α是每棵树的权重。
4)确定损失函数,最小化损失函数,得到最优解模型。
通过最小化损失函数求解最优模型:
Figure RE-GDA0001979281540000112
其中,损失函数L为:
Figure RE-GDA0001979281540000113
而,Ω(fk)为
Figure RE-GDA0001979281540000114
Figure RE-GDA0001979281540000115
其中,Nleaf表示决策树叶节点个数,通过惩罚措施限制决策树的复杂度, Yi为训练输出,
Figure RE-GDA0001979281540000116
为预测输出,||■||表示取范数。
5)确定XGBoost加法模型,具体为:
初始化f0
计算响应,方法为:
Figure RE-GDA0001979281540000117
学习第k棵树,方法为:
Figure RE-GDA0001979281540000121
Line search找步长,方法可为
Figure RE-GDA0001979281540000122
更新模型输出Fk
Fk=Fk-1*·hk(X;w*);
步骤S108、根据所述画像及所述网络预测模型,发送需要进行扩容的提示信息。
1)获取预设时刻特定基站编号的基站的流量信息,确定所述预设时刻预设基站的流量数据中的预设时刻的基站流量的最大值与最小值;
在本发明实施例中,
首先,可根据步骤S104,获得各个时刻的网络流量序列数据 (Xtrain,Ytrain);
然后,将(Xtrain,Ytrain)作为模型输入,带入步骤S106得出的XGBoost 模型中得到训练好的预测模型并得到模型预测输出
Figure RE-GDA0001979281540000123
然后,根据步骤S104可以得到基站数据与目标典型区域的距离值,从而根据距离值可以划分基站所归属的目标区域。
最后,结合基站所归属的目标区域的流量特点,设定Pmin(t)、Pmax(t)为 t时刻的基站流量最大值与最小值。
2)根据容忍度对所述基站流量的最大值、基站流量的最小值进行判断,若所述基站流量的最大值满足预设要求,则发送需要扩容的提示信息。
在本发明实施例中,当
Figure RE-GDA0001979281540000124
满足如下条件:
Figure RE-GDA0001979281540000125
则表明所述基站流量的最小值满足预设要求,可以进行适当调整,如对带宽进行调整,如将部分闲置带宽调节至其他区域;
Figure RE-GDA0001979281540000126
满足如下条件:
Figure RE-GDA0001979281540000127
则表明基站的流量最大值满足预设值,需要扩充网络设备,以缓解网络拥堵的技术问题,可给各运营商发送提示信息,以告知当前的网络设备已无法满足该区域的上网需求,如果想要保证畅通的网络及较好的用户体验感,则需要重新布局该区域的网络设备或添加其他的网络设备。
如下,列举一个具体实施例以阐述本方案相对于现有技术方案的有益效果:
本方案采用基于DTW计算相似度对基站进行特定区域画像,挖掘主观特征。所用的数据集可为通信网络中收集的33天共792条数据记录,通过步骤 S102和步骤S104筛选后作为通信网络的流量预测的训练数据和预测数据,选取其中前32天的流量数据作为模型的输入,第33天的24条流量数据作为模型输出,通过步骤S106训练出预测模型,通过步骤S108完成预测及扩容提醒。为了分析技术效果,采用平均绝对百分误差MAPE来对本发明方法和三种有代表性的现有方法——自回归积分滑动平均(ARIMA),随机森林(Random Forest) 和小波函数(WT)做对比。
图2为使用本发明的基于DTW相似度的方法筛选前后的各算法的预测 MAPE值的对比结果图。对比了几种传统的流量预测方法,包括ARIMA时间序列预测、RF机器学习预测方法以及WT小波函数分解预测方法。在数据筛选前的MAPE值,大数据条件下的整体预测有效值为一个平均体现值。可以发现,在筛选前XGBoost的预测效果就是最佳,但是与ARIMA、RF并不是具有很大的区别,而WT在本数据集上的表现不是很好。在经过了基于DTW的典型区域筛选之后,数据具有了统一特征。并且结果显示在筛选后的数据集上 XGBoost表现较为突出并且对比筛选之前的同一算法预测值也有较大提升。
图3为使用本发明的基于DTW相似度的方法筛选前后的各算法的预测效果的对比结果图。本发明对比了XGBoost、ARIMA、RF和WT四个预测方法。横坐标为对应的一天24个预测时刻,纵坐标为具体的对应的预测流量值。从图中可以明显看出,针对筛选后的特定区域数据集,XGBoost表现出了很好的学习能力。本发明的方法通过使用XGBoost预测模型,能够很好的学习到通信网络流量值的时间序列特性,有效地提高了预测准确度。
本发明实施例提供的资源扩容规划的方法,采用BTW的方法计算距离值以对基站进行特定区域的画像,然后基于极端梯度提升XGBoost建立网络流量预测模型,以对下一时刻的网络流量值进行预测,最后,根据流量预测结果与基站画像发送警告信息,网络流量预测准确,能及时使运营商知晓目标区域的基站的布置是否依然能满足该区域用户的上网需求,有效保证了目标区域的用户的网络畅通及良好的用户体验。
相应于本发明实施例提供的基于承载网络流量预测的资源扩容规划的方法,本发明实施例提供一种基于承载网络流量预测的资源扩容规划的系统,参见图4所示,所述系统包括:
流量采集模块42,用于获取影响网络流量的特征数据,并对所述特征数据进行预处理,得到基于基站编号的数据时间序列;
用户画像模块44,用于根据所述基于基站编号的数据时间序列,对基站进行特定区域画像;
流量预测模块46,用于根据所述对基站进行的特定区域的画像,建立网络预测模型;
提示信息生成模块48,用于根据所述画像及所述网络预测模型,生成并发送需要进行扩容的提示信息。
在一个实施例中,所述流量采集模块42,包括:
数据获取单元,用于从承载设备中获取基站的网络信息的原始数据;所述网络信息中包括流量信息;
数据挑选单元,用于从所述原始数据中挑选满足预设长度的原始数据,作为特征数据;
数据处理单元,从所述特征数据中去除异常数据,得到基于基站编号的数据时间序列;
其中,所述异常数据为端口关闭造成的异常值,和/或所述网络信息中重复的流量值,和/或缺失比率大于预设值的基站的网络信息。
在一个实施例中,所述用户画像模块44,包括:
流量数据归一单元,用于根据预设基站编号的基站的一组流量数据中的总流量数据最大值及总流量数据最小值,对所述特定基站编号的基站的总流量数据做归一化处理;
目标流量选择单元,用于选择目标区域的预设时间段的流量数据;
距离计算单元,用于计算预设基站编号的基站的预设时间的距离矩阵;
数据对确定单元,用于根据所述预设时间的距离矩阵,确定特定基站编号的基站的累积距离矩阵,并根据所述累积距离矩阵确定特定基站编号的基站的时间数据序列与目标区域的流量数据之间的距离,得到包括基于特定基站编号、基站的名称及特定编号的基站的时间数据序列与目标区域的基站的流量数据的距离的数值对;
有效阈值确定单元,用于根据目标区域的名称确定有效阈值;
有效数据选择单元,用于选择有效网络数据;其中,所述有效网络数据为基站序列与目标区域之间的流量数据之间的距离小于所述有效阈值的基站的网络数据。
在一个实施例中,所述流量预测模块46,包括:
输入、输出确定单元,用于确定模型输入和模型输出;
样本确定单元,用于根据所述有效网络数据得到基站的不同时间的网络流量值,确定训练输入样本、训练输出样本、测试输入样本及测试输出样本;
加法模型确定单元,设定模型初始值,得到完成训练的加法模型;
最优解模型生成导游,用于确定损失函数,最小化损失函数,得到最优解模型;
XGBoost加法模型确定单元,用于确定XGBoost加法模型。
在一个实施例中,所述提示信息生成模块48,包括:
流量极限值获取单元,用于获取预设时刻特定基站编号的基站的流量信息,确定所述预设时刻预设基站的流量数据中的预设时刻的基站流量的最大值;
提示单元,用于根据容忍度对所述基站流量的最大值进行判断,若所述基站流量的最大值满足预设要求,则生成并发送需要扩容的提示信息。
本发明实施例提供的资源扩容规划的系统,用户画像模块44采用BTW的方法计算距离值以对基站进行特定区域的画像,然后流量预测模块46基于极端梯度提升XGBoost建立网络流量预测模型,以对下一时刻的网络流量值进行预测,最后,提示信息生成模块48根据流量预测结果与基站画像发送警告信息,网络流量预测准确,能及时使运营商知晓目标区域的基站的布置是否依然能满足该区域用户的上网需求,有效保证了目标区域的用户的网络畅通及良好的用户体验。
相应于本发明实施例提供的资源扩容规划的方法、系统,本发明实施例提供一种网络设备,参见图5所示,网络设备包括处理器510、收发机520、存储器530和总线接口。其中:
在本发明实施例中,网络设备500还包括:存储在存储器530上并可在所述处理器510上运行的计算机程序,所述计算机程序被所述处理器510执行时实现上述图1所示的方法中的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
在图5中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器 510代表的一个或多个处理器和存储器530代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机520可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元。
处理器510负责管理总线架构和通常的处理,存储器530可以存储处理器 510在执行操作时所使用的数据。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (12)

1.一种资源扩容规划的方法,其特征在于,包括:
获取影响网络流量的特征数据,并对所述特征数据进行预处理,得到基于基站编号的数据时间序列;
根据所述基于基站编号的数据时间序列,对基站进行特定区域画像;
根据所述对基站进行的特定区域的画像,建立网络预测模型;
根据所述画像及所述网络预测模型,生成并发送需要进行扩容的提示信息。
2.根据权利要求1所述的方法,其特征在于,所述获取影响网络流量的特征数据,并对所述特征数据进行预处理,得到基于基站编号的数据时间序列,包括:
从承载设备中获取基站的网络信息的原始数据;所述网络信息中包括流量信息;
从所述原始数据中挑选满足预设长度的原始数据,作为特征数据;
从所述特征数据中去除异常数据,得到基于基站编号的数据时间序列;
其中,所述异常数据为端口关闭造成的异常值,和/或所述网络信息中重复的流量值,和/或缺失比率大于预设值的基站的网络信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述基于基站编号的数据时间序列,对基站进行特定区域画像,包括:
根据预设基站编号的基站的一组流量数据中的总流量数据最大值及总流量数据最小值对所述特定基站编号的基站的总流量数据做归一化处理;
选择目标区域的预设时间段的流量数据;
计算预设基站编号的基站的预设时间的距离矩阵;
根据所述预设时间的距离矩阵,确定特定基站编号的基站的累积距离矩阵,并根据所述累积距离矩阵确定特定基站编号的基站的时间数据序列与目标区域的流量数据之间的距离,得到包括基于特定基站编号、基站的名称及特定编号的基站的时间数据序列与目标区域的基站的流量数据的距离的数值对;
根据目标区域的名称确定有效阈值;
选择有效网络数据;其中,所述有效网络数据为基站序列与目标区域之间的流量数据之间的距离小于所述有效阈值的基站的网络数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述对基站进行的特定区域的画像,建立网络预测模型,包括:
确定模型输入和模型输出;
根据所述有效网络数据得到基站的不同时间的网络流量值,确定训练输入样本、训练输出样本、测试输入样本及测试输出样本;
设定模型初始值,得到完成训练的加法模型;
确定损失函数,最小化损失函数,得到最优解模型;
确定XGBoost加法模型。
5.根据权利要求1所述的方法,其特征在于,所述根据所述画像及所述网络预测模型,发送需要扩容的提示信息,包括:
获取预设时刻特定基站编号的基站的流量信息,确定所述预设时刻预设基站的流量数据中的预设时刻的基站流量的最大值;
根据容忍度对所述基站流量的最大值进行判断,若所述基站流量的最大值满足预设要求,则发送需要扩容的提示信息。
6.一种资源扩容规划的系统,其特征在于,包括:
流量采集模块,用于获取影响网络流量的特征数据,并对所述特征数据进行预处理,得到基于基站编号的数据时间序列;
用户画像模块,用于根据所述基于基站编号的数据时间序列,对基站进行特定区域画像;
流量预测模块,用于根据所述对基站进行的特定区域的画像,建立网络预测模型;
提示信息生成模块,用于根据所述画像及所述网络预测模型,生成并发送需要进行扩容的提示信息。
7.根据权利要求6所述的系统,其特征在于,所述流量采集模块,包括:
数据获取单元,用于从承载设备中获取基站的网络信息的原始数据;所述网络信息中包括流量信息;
数据挑选单元,用于从所述原始数据中挑选满足预设长度的原始数据,作为特征数据;
数据处理单元,从所述特征数据中去除异常数据,得到基于基站编号的数据时间序列;
其中,所述异常数据为端口关闭造成的异常值,和/或所述网络信息中重复的流量值,和/或缺失比率大于预设值的基站的网络信息。
8.根据权利要求6所述的系统,其特征在于,所述用户画像模块,包括:
流量数据归一单元,用于根据预设基站编号的基站的一组流量数据中的总流量数据最大值及总流量数据最小值,对所述特定基站编号的基站的总流量数据做归一化处理;
目标流量选择单元,用于选择目标区域的预设时间段的流量数据;
距离计算单元,用于计算预设基站编号的基站的预设时间的距离矩阵;
数据对确定单元,用于根据所述预设时间的距离矩阵,确定特定基站编号的基站的累积距离矩阵,并根据所述累积距离矩阵确定特定基站编号的基站的时间数据序列与目标区域的流量数据之间的距离,得到包括基于特定基站编号、基站的名称及特定编号的基站的时间数据序列与目标区域的基站的流量数据的距离的数值对;
有效阈值确定单元,用于根据目标区域的名称确定有效阈值;
有效数据选择单元,用于选择有效网络数据;其中,所述有效网络数据为基站序列与目标区域之间的流量数据之间的距离小于所述有效阈值的基站的网络数据。
9.根据权利要求6所述的系统,其特征在于,流量预测模块,包括:
输入、输出确定单元,用于确定模型输入和模型输出;
样本确定单元,用于根据所述有效网络数据得到基站的不同时间的网络流量值,确定训练输入样本、训练输出样本、测试输入样本及测试输出样本;
加法模型确定单元,设定模型初始值,得到完成训练的加法模型;
最优解模型生成导游,用于确定损失函数,最小化损失函数,得到最优解模型;
XGBoost加法模型确定单元,用于确定XGBoost加法模型。
10.根据权利要求6所述的系统,其特征在于,所述提示信息生成模块,包括:
流量极限值获取单元,用于获取预设时刻特定基站编号的基站的流量信息,确定所述预设时刻预设基站的流量数据中的预设时刻的基站流量的最大值;
提示单元,用于根据容忍度对所述基站流量的最大值进行判断,若所述基站流量的最大值满足预设要求,则生成并发送需要扩容的提示信息。
11.一种网络设备,其特征在于,包括存储器、处理器及在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现权利要求1-5中任一项所述的资源扩容规划的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的资源扩容规划的方法。
CN201811502347.0A 2018-12-10 2018-12-10 一种资源扩容规划的方法及系统 Active CN111294812B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811502347.0A CN111294812B (zh) 2018-12-10 2018-12-10 一种资源扩容规划的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811502347.0A CN111294812B (zh) 2018-12-10 2018-12-10 一种资源扩容规划的方法及系统

Publications (2)

Publication Number Publication Date
CN111294812A true CN111294812A (zh) 2020-06-16
CN111294812B CN111294812B (zh) 2022-12-13

Family

ID=71028038

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811502347.0A Active CN111294812B (zh) 2018-12-10 2018-12-10 一种资源扩容规划的方法及系统

Country Status (1)

Country Link
CN (1) CN111294812B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111836270A (zh) * 2020-07-16 2020-10-27 中国联合网络通信集团有限公司 5g基站频率规划方法及装置
CN111866896A (zh) * 2020-07-17 2020-10-30 中国联合网络通信集团有限公司 基站位置确定方法、装置、设备以及存储介质
CN113207151A (zh) * 2021-07-05 2021-08-03 中兴通讯股份有限公司 数据流量的控制方法、系统、服务器及业务管理节点
CN113726558A (zh) * 2021-08-09 2021-11-30 国网福建省电力有限公司 基于随机森林算法的网络设备流量预测系统
CN113762421A (zh) * 2021-10-22 2021-12-07 中国联合网络通信集团有限公司 分类模型的训练方法、流量分析方法、装置及设备
CN113766008A (zh) * 2021-08-06 2021-12-07 苏州浪潮智能科技有限公司 mcs下动态调整存储容量的方法、系统、终端及存储介质
CN114374983A (zh) * 2021-12-29 2022-04-19 中国电信股份有限公司 一种基站流量预测方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106301984A (zh) * 2015-06-01 2017-01-04 中国移动通信集团公司 一种移动通信网络容量预测方法和装置
CN108271165A (zh) * 2016-12-30 2018-07-10 中国移动通信集团浙江有限公司 一种基站网络信号覆盖状态的预测方法及系统
CN108901033A (zh) * 2018-06-20 2018-11-27 南京邮电大学 基于回声状态网络的基站流量预测方法
CN108966238A (zh) * 2017-05-18 2018-12-07 上海大唐移动通信设备有限公司 一种网络扩容方法和装置
CN108965017A (zh) * 2018-07-27 2018-12-07 中国联合网络通信集团有限公司 一种网络流量预测方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106301984A (zh) * 2015-06-01 2017-01-04 中国移动通信集团公司 一种移动通信网络容量预测方法和装置
CN108271165A (zh) * 2016-12-30 2018-07-10 中国移动通信集团浙江有限公司 一种基站网络信号覆盖状态的预测方法及系统
CN108966238A (zh) * 2017-05-18 2018-12-07 上海大唐移动通信设备有限公司 一种网络扩容方法和装置
CN108901033A (zh) * 2018-06-20 2018-11-27 南京邮电大学 基于回声状态网络的基站流量预测方法
CN108965017A (zh) * 2018-07-27 2018-12-07 中国联合网络通信集团有限公司 一种网络流量预测方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李浩等: "TD-LTE网络扩容策略及方法探讨", 《邮电设计技术》 *
陈竹: "移动数据网络流量监测预警系统的设计与实现", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111836270A (zh) * 2020-07-16 2020-10-27 中国联合网络通信集团有限公司 5g基站频率规划方法及装置
CN111836270B (zh) * 2020-07-16 2022-09-20 中国联合网络通信集团有限公司 5g基站频率规划方法及装置
CN111866896A (zh) * 2020-07-17 2020-10-30 中国联合网络通信集团有限公司 基站位置确定方法、装置、设备以及存储介质
CN111866896B (zh) * 2020-07-17 2023-02-28 中国联合网络通信集团有限公司 基站位置确定方法、装置、设备以及存储介质
CN113207151A (zh) * 2021-07-05 2021-08-03 中兴通讯股份有限公司 数据流量的控制方法、系统、服务器及业务管理节点
WO2023280034A1 (zh) * 2021-07-05 2023-01-12 中兴通讯股份有限公司 数据流量的控制方法、系统、服务器及业务管理节点
CN113766008A (zh) * 2021-08-06 2021-12-07 苏州浪潮智能科技有限公司 mcs下动态调整存储容量的方法、系统、终端及存储介质
CN113726558A (zh) * 2021-08-09 2021-11-30 国网福建省电力有限公司 基于随机森林算法的网络设备流量预测系统
CN113762421A (zh) * 2021-10-22 2021-12-07 中国联合网络通信集团有限公司 分类模型的训练方法、流量分析方法、装置及设备
CN113762421B (zh) * 2021-10-22 2024-03-15 中国联合网络通信集团有限公司 分类模型的训练方法、流量分析方法、装置及设备
CN114374983A (zh) * 2021-12-29 2022-04-19 中国电信股份有限公司 一种基站流量预测方法、装置及电子设备

Also Published As

Publication number Publication date
CN111294812B (zh) 2022-12-13

Similar Documents

Publication Publication Date Title
CN111294812B (zh) 一种资源扩容规划的方法及系统
CN109587713B (zh) 一种基于arima模型的网络指标预测方法、装置及存储介质
WO2021129086A1 (zh) 流量预测方法、装置以及存储介质
CN112054943B (zh) 一种移动网络基站流量预测方法
CN112532746B (zh) 一种云边协同感知的方法及系统
WO2022001918A1 (zh) 构建预测模型的方法、装置、计算设备和存储介质
CN113746696A (zh) 网络流量预测方法、设备、存储介质及装置
Zhang et al. Latency prediction for delay-sensitive v2x applications in mobile cloud/edge computing systems
CN111901134B (zh) 一种基于循环神经网络模型rnn的预测网络质量的方法和装置
CN107133268B (zh) 一种用于Web服务推荐的协同过滤方法
CN113344470B (zh) 一种基于区块链的供电系统智能管理方法
Gao et al. A deep learning framework with spatial-temporal attention mechanism for cellular traffic prediction
CN117201410B (zh) 用于物联网的流量管理方法及系统
CN113825165B (zh) 基于时间图网络的5g切片网络拥塞预警方法及装置
CN113541986B (zh) 5g切片的故障预测方法、装置及计算设备
CN108521435B (zh) 一种用户网络行为画像的方法及系统
CN115146292A (zh) 一种树模型构建方法、装置、电子设备及存储介质
EP0883067A1 (en) A method and apparatus for determining how many input values of a time series of data are required for forecasting a future value of the time series
CN114615693A (zh) 网络容量预测方法、装置、电子设备及计算机存储介质
CN114529096A (zh) 基于三元闭包图嵌入的社交网络链路预测方法及系统
CN115348179B (zh) 网络流量边界预测方法、装置、设备及介质
CN112637904A (zh) 负载均衡方法、装置及计算设备
WO2022156743A1 (zh) 特征构建方法和装置、模型训练方法和装置、设备、介质
LIU et al. A case study on intelligent operation system for wireless networks
CN116957166B (zh) 一种基于鸿蒙系统的隧道交通情况预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant