CN112787878B - 一种网络指标的预测方法及电子设备 - Google Patents
一种网络指标的预测方法及电子设备 Download PDFInfo
- Publication number
- CN112787878B CN112787878B CN201911088694.8A CN201911088694A CN112787878B CN 112787878 B CN112787878 B CN 112787878B CN 201911088694 A CN201911088694 A CN 201911088694A CN 112787878 B CN112787878 B CN 112787878B
- Authority
- CN
- China
- Prior art keywords
- network
- model
- historical
- period
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
Abstract
本发明实施例提供一种网络指标的预测方法及电子设备,其中方法包括:获取待预测的网络指标的特征数据;将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值;其中,所述指标预测模型由位于第一层的至少两个第一模型和位于第二层的第二模型融合得到,且预先以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值进行训练得到;所述第二历史时段为所述第一历史时段之后的未来预设时段。本发明实施例保证了预测的准确性。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种网络指标的预测方法及电子设备。
背景技术
在现有技术中,在对网络指标进行评估时,一种是根据网络工程师的工作经验进行粗略估计,另一种是机房工作人员按照历史数据求和或均值等简单数理统计方法进行估计。
但是针对第一种方式,工程师工作量较大,问题分析难度较高,且时效性不足,准确度较差,成本较高;而针对第二种方式,统计手段过于简单,过分依赖近期数据,导致趋势判断滞后,往往不能达到快速解决现场问题的需求。此外,由于网络指标较多,手动操作获取无法适应改变,这可能导致网络吞吐量和基站的运行效率均无法达到最佳状态。
发明内容
本发明实施例提供一种网络指标的预测方法及电子设备,以提高网络指标的预测准确性。
本发明实施例提供一种网络指标的预测方法,包括:
获取待预测的网络指标的特征数据;
将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值;
其中,所述指标预测模型由位于第一层的至少两个第一模型和位于第二层的第二模型融合得到,且预先以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值进行训练得到;所述第二历史时段为所述第一历史时段之后的未来预设时段。
本发明实施例提供一种网络指标的预测装置,包括:
第一获取模块,用于获取待预测的网络指标的特征数据;
第二获取模块,用于将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值;
其中,所述指标预测模型由位于第一层的至少两个第一模型和位于第二层的第二模型融合得到,且预先以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值进行训练得到;所述第二历史时段为所述第一历史时段之后的未来预设时段。
本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现所述的网络指标的预测方法的步骤。
本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的网络指标的预测方法的步骤。
本发明实施例提供的网络指标的预测方法及电子设备,通过获取待预测的网络指标的特征数据,并将特征数据输入至由第一层的至少两个第一模型和第二层的第二模型融合得到指标预测模型中,得到指标预测模型输出的在未来预设时段内的网络指标值,基于指标预测模型由两层融合得到,具有较高的预测准确性和鲁棒性,从而保证了预测结果的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中网络指标的预测方法的步骤流程图;
图2为本发明实施例中训练得到指标预测模型的步骤流程图;
图3为本发明实施例中第一小区的预测示意图;
图4为本发明实施例中第二小区的预测示意图;
图5为本发明实施例中网络指标的预测装置的模块框图;
图6为本发明实施例中电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例针对现有技术中对网络指标的预测准确性较差的问题,基于网络历史时序数据对机器学习算法进行持续训练,掘数据内部的变化趋势及规律,通过多算法融合提升精度和容错率,从而预测未来一段时间的网络指标建议值。此外,本实施例将弹性网络回归(ElasticNet)、支持向量回归(Support Vactor Regerssion,SVR)、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)、极端梯度提升(eXtreme GradientBoosting,XGBoost)和随机森林算法(Random Forest)等算法中的至少两个,采用Stacking的方式进行算法融合,从而使得得出的结果能够融合多个算法的优势,预测结果更为准确,鲁棒性更强,对现场环境中突变的环境有更强的容错性,从而确保网络持续稳定高效的运行。
下面,对本发明实施例进行具体介绍。
如图1所示,为本发明实施例中网络指标的预测方法的步骤流程图,该方法包括如下步骤:
步骤101:获取待预测的网络指标的特征数据。
在本步骤中,具体的,在需要对网络指标进行预测时,可以获取待预测的网络指标的特征数据。
具体的,该特征数据可以包括第一预设历史时段内的历史网络指标值以及第二预设历史时段内与网络指标相关的类别数据,其中第二预设历史时段与网络指标的预测时间之间具有预设对应关系。
具体的,在此并不具体限定第一预设历史时段的具体时限,例如该第一预设历史时段可以为当前时间之前的历史第5天至历史第3天,还可以为当前时间之前的历史第2个月至历史第1个月,即在此可以根据实际需求选择第一预设历史时段。
在此需要说明的是,与网络指标相关的类别数据可以为包括月、旬、周和天等的时间类别型变量数据,还可以为天气、风力、突发事件、节日庆典等数据,即可以将对网络指标产生影响的数据确定为与网络指标相关的类别数据。
此外,基于类别数据的时效性,所获取的类别数据的第二预设历史时段应与网络指标的预测时间之间具有预设对应关系。
例如,第二预设历史时段与网络指标的预测时间之间具有相隔3天的预设对应关系,即此时假设网络指标的预测时间为当前时间之后的未来第2天,则第二预设历史时段可以为当前时间之前的历史第1天;此外,假设网络指标的预测时间为当前时间之后的未来第1天至第2天,则第二预设历史时段可以为当前时间之前的历史第1天和历史第2天。
当然,第二预设历史时段与网络指标的预测时间之间的预设对应关系并不仅限于上述举例,即在此并不具体限定该预设对应关系的具体内容。
步骤102:将特征数据输入至指标预测模型中,得到指标预测模型输出的在未来预设时段内的网络指标值。
在本步骤中,具体的,本实施例需要预先获取得到指标预测模型。
其中,该指标预测模型可以由位于第一层的至少两个第一模型和位于第二层的第二模型融合得到,且预先以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值进行训练得到;第二历史时段为第一历史时段之后的未来预设时段。
通过以第一历史时段内的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值进行训练,且第二历史时段为第一历史时段之后的未来预设时段,使得在通过训练好的指标预测模型在预测未来预设时段内的网络指标值时,基于预测时间间隔的一致性,且基于历史时序数据对机器学习算法的持续训练,能够最大限度的保证预测的准确性;此外,指标预测模型由位于第一层的至少两个第一模型和位于第二层的第二模型融合得到,实现了基于多算法模型融合以提升预测的精度和容错率。
基于此,本步骤将特征数据输入至指标预测模型中,并得到指标预测模型输出的在未来预设时段内的网络指标值,使得所得到的网络指标值能够融合多个算法模型的优势,进而使得预测结果的准确度更高,鲁棒性更强,对现场环境中突变的环境有更强的容错性,进而使得能够确保网络持续稳定高效的运行。
此外,进一步需要说明的是,本实施例在将特征数据输入至指标预测模型中,得到指标预测模型输出的在未来预设时段内的网络指标值之前,还需要对网络指标的特征数据进行预处理,下面针对特征数据的预处理过程进行说明。
其一,在将特征数据输入至指标预测模型中,得到指标预测模型输出的在未来预设时段内的网络指标值之前,当第一预设历史时段内存在重复历史网络指标值和/或异常历史网络指标值时,可以对重复历史网络指标值和/或异常历史网络指标值进行剔除操作。
具体的,重复历史网络指标值指的是同时间段的数值相同而造成的记录冗余,异常历史网络指标值指的是与历史记录波动范围不匹配的偶然突增突降,例如本实施例可以将于平均值偏差超过三倍标准差的测定值确定为异常历史网络指标值。针对上述重复历史网络指标值和/或异常历史网络指标值,可以采用直接剔除的方式进行处理,以保证特征数据的准确性。
此外,当第一预设历史时段内存在缺失有历史网络指标值的时间点时,可以通过下述公式,计算得到时间点所对应的历史网络指标值并进行回填操作:
Vt=β*Vt-1+(1-β)*θt,0≤β<1;
其中,Vt表示时间点所对应的历史网络指标值,Vt-1表示时间点之前的相邻时间点所对应的历史网络指标值,θt表示预设数值,β表示系数。
具体的,通过上述公式,可以实现固定窗口的滑动平均值回填,当然,该固定窗口的大小可以为连续三个或多个时间点,在此并不对此进行限定。
此外,具体的,存在缺失有历史网络指标值的时间点,可能是行记录的缺失,即由于基站关机、暂停或更新升级等原因而造成的某一个或几个时间节点无数值记录;还可能是异常值的剔除导致。针对此,通过上述公式计算得到的历史网络指标值,并对缺失有历史网络指标值的时间点进行回填操作,保证了数据时序的连续性。
其二,在将特征数据输入至指标预测模型中,得到指标预测模型输出的在未来预设时段内的网络指标值之前,还可以对第一预设历史时段内的历史网络指标值进行标准化处理,从而得到标准化后的历史网络指标值。
具体的,由于原始数据的浮动范围较大容易导致模型拟合时间长且预测效果差,标准化处理能够将原始数据的波动限定在某一区间,因此本实施例通过对第一预设历史时段内的历史网络指标值进行标准化处理,使得标准化后的历史网络指标值能够变为均值为0,标准差为1的正态分布数据,从而提高预测效果。
在此需要说明的是,进行标准化处理的历史网络指标值可以是对重复值、异常值和缺失值进行处理后的值,从而保证历史网络指标值的准确性。
其二,在将特征数据输入至指标预测模型中,得到指标预测模型输出的在未来预设时段内的网络指标值之前,还可以通过独热(one-hot)编码,将类别数据转换为连续型变量数据。
具体的,由于作为历史网络指标值的时序数据具有较强的数据周期特征,此时在特征数据中增加第二预设历史时段内与网络指标相关的类别数据,能够提高预测的准确性。
例如,该类别数据可以为月旬周天等类别型变量。
此外,具体的,由于类别数据为不连续数据,本实施例可以采用one-hot编码的方式,将类别数据转换为连续型变量。
这样,通过上述方式对特征数据中的历史网络指标值以及与网络指标相关的类别数据进行处理,保证了特征数据的准确性。
另外,进一步地,如图2所示,本实施例在将特征数据输入至指标预测模型中,得到指标预测模型输出的在未来预设时段内的网络指标值之前,还需要训练得到该指标预测模型;具体的,训练过程包括如下步骤:
步骤201:以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值,对至少两个第一模型进行训练,得到训练好的至少两个第一模型;
在本步骤中,具体的,本实施例在训练得到指标预测模型时,可以先获取第一历史时段的网络指标的样本特征数据以及第二历史时段内的网络指标值,并以第一历史时段的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值对至少两个第一模型进行训练。
当然,该网络指标的样本特征数据包括第一历史时段中,处于第一历史子时段内的历史网络指标值和处于第二历史子时段内与网络指标相关的类别数据,且第二历史子时段与第二历史时段之间具有预设对应关系。
该预设对应关系可以为第二历史子时段与第二历史时段之间间隔固定时间,例如间隔2天。
例如,假设第一历史时段为当前时间之前的历史第10天至历史第3天时间段,第二历史时段为当前时间之前的历史第2天,则第一历史子时段可以为历史第第10天至历史第4天,第二历史子时间段可以为历史第4天。
此外,与网络指标相关的类别数据可以为包括月、旬、周和天等的时间类别型变量数据,还可以为天气、风力、突发事件、节日庆典等数据,即可以将对网络指标产生影响的数据确定为与网络指标相关的类别数据。通过构造与网络指标相关的类别数据,有助于挖掘周期性规律,使得模型训练的精度更高。
在此需要说明的是,在获取到第一历史时段的网络指标的样本特征数据时,可以对该样本特征数据进行预处理,包括对异常值、缺失值和重复值的处理以及对类别数据的处理,具体可以参见前述对特征数据的处理过程,在此不再进行详细赘述。
另外,具体的,第一模型包括下述模型中的至少两个:ElasticNet模型、GBDT模型、SVR模型、XGBoost模型、RF模型;第二模型为线性回归模型。
具体的,本步骤使用处理好的训练样本分别对ElasticNet模型、GBDT模型、SVR模型、XGBoost模型和RF模型中的至少两个模型进行单模型训练,从而得到训练好的至少两个单第一模型。
在此说明的是,可以将同一时间点的目标值定义为一组数据,分别对上述至少两个模型进行训练和调参,从而保证训练的一致性。
步骤202:通过Stacking策略,对训练好的至少两个第一模型和第二模型进行融合,得到融合后模型。
在本步骤中,具体的,第二模型为线性回归模型。
模型融合即构建并结合多个模型来完成学习任务,不同的模型具有差异性,而模型融合可以使其发挥出各个模型的优势,让相对较弱的模型通过某种策略结合起来,达到比较强的模型,从而使得融合后模型的效果优于各个单模型。
本步骤的模型融合通过双层Stacking策略,即第一层为ElasticNet模型、GBDT模型、SVR模型、XGBoost模型和RF模型中的至少两个,且采用五折交叉验证进行算法优选,第二层为线性回归算法。
即Stacking算法过程可以为,以ElasticNet模型、GBDT模型、SVR模型、XGBoost模型和RF模型中的至少两个模型为Stacking的第一层,并对已有的数据集进行K折交叉验证,然后对第一层的模型的K折交叉验证后的输出结果进行保存和合并;再然后指定Staking第二层的预测算法为线性回归,将所保存的输出结果进行再训练,得到训练好的融合后模型。
步骤203:通过测试集,对融合后模型进行测试,得到测试结果。
具体的,在测试集中,以第一历史时段的网络指标的样本特征数据为测试样本,以第二历史时段内的网络指标值为目标值,且测试样本中的样本特征数据与训练样本中的样本特征数据不同,即测试集区分于训练集,从而确保测试的真实准确性。
在本步骤中,可以通过测试集对融合后模型进行测试,即将测试集中的样本特征数据先后经过融合后模型的第一层和第二层进行预测,并得到测试结果。
此时,当测试结果指示融合后模型输出的预测值的精度大于预设值时,则将融合后模型确定为指标预测模型。即可以将融合后模型输出的预测值与真实值进行比较,从而得到精度指标。
具体的,本实施例可以通过对称平均绝对百分误差对预测值的精度进行表示;或者,通过平均绝对误差对预测值的精度进行表示。
其中,在通过对称平均绝对百分误差对预测值的精度进行表示时,可以通过下述公式,对预测值的精度进行表示:
并在通过平均绝对误差对所述预测值的精度进行表示时,通过下述公式,对预测值的精度进行表示:
通过上述对称平均绝对百分误差(Symmetric Mean Absolute PercentageError,SMAPE)对精度指标进行评估,反映了误差相对真实值的百分比;此外,通过平均绝对误差(Mean Absolute Error,MAE)对精度指标进行评估,反映了预测值与真实值之间的差值大小。当然,上述两种判定方式均为预测值与真实值越接近,误差越小,指标值越接近于0。
这样,通过上述步骤训练得到指标预测模型,使得指标预测模型的预测结果更为准确,鲁棒性更强,从而使得在通过该指标预测模型对网络指标进行预测时,能够保证网络持续稳定高效的运行。
此外,还需要说明的是,本实施例可以通过上述训练过程,针对不同的预测时间训练不同的指标预测模型,例如当预测时间为未来第1天时,训练得到针对该预测时间的指标预测模型,当预测时间为未来第2天时,训练得到针对该预测时间的指标预测模型,从而保证每个预测时间的预测准确性。
当然,在此需要说明的是,网络指标可以包括下述中的任意一个:上行物理资源块(PRB)、下行PRB、无线连接成功率、无线资源控制(RRC)连接成功率、上行流量、下行流量、参考信号接收功率(PSRP)、参考信号接收质量(RSRQ)、RRC建立成功率、演进的无线接入承载(ERAB)建立成功率、掉话率和切换成功率等。
这样,本实施例通过位于第一层的至少两个第一模型和位于第二层的第二模型融合得到指标预测模型,然后将获取到的待预测网络指标的特征数据输入至指标预测模型中,得到指标预测模型输出的在未来预设时段内的网络指标值,基于指标预测模型由两层融合得到,具有较高的预测准确性和鲁棒性,从而保证了预测结果的准确性。
下面通过具体实例对上述实施例进行说明。
假设网络指标为流量峰值,且需要预测未来7天的单日流量峰值。
在该示例中,先获取基站小区的流量统计数据,例如包括网关接口、日期、小区、城市、运营商、上行数据、下行数据、上行物理资源块、下行物理资源块、无线使用率、无线连接率、无线资源控制连接率、无线资源控制连接最大数和无线资源控制连接平均数等。此外,所获取的统计数据可以为历史28天时间的数据。
然后,对流量统计数据进行数据预处理,即将重复值和异常值进行剔除操作,时间序列补齐操作和缺失值滑动平均回填操作等。
此外,对进行预处理后的流量统计数据进行归一化处理,然后构造月旬周等时间特征作为与网络指标相关的类别数据。
然后,采用上述实施例中通过Stacking策略融合得到的指标预测模型预测未来7天的单日流量峰值。具体的,该指标预测模型的第一层为RF模型、GBDT模型和XGBoost模型,第二层为线性回归,且第一层采用五折交叉验证进行算法优选。此外,待输入至该指标预测模型的特征数据包括历史连续28天的单日流量峰值以及预测时间点的月旬周天时间特征,该月旬周时间特征作为类别数据,为类别型变量,因此可以对该部分特征采用one-hot编码将其转为连续型变量。
由于需要预测未来7天的单日流量峰值,此时针对每个小区可以建立7个指标预测模型,每天对应1个指标预测模型,即分别预测未来1至7的单日流量峰值。此时,每个指标预测模型的训练集合测试集的划分比例可以为4:1,并且为了避免模型训练过程中因数据的局部相关性而造成拟合结果的偏颇,采用混乱排序的方式将数据样本的排列顺序打乱。
此外,就单一小区的单个模型而言,算法的输入特征格式可以定义为,历史28天时序峰值及对应预测标签的月旬周特征的one-hot编码,共32个特征;标签格式为未来某天的流量峰值。此时,特征滑窗数据格式可以如下:
[从第1天到第14天数据+第15天数据]
[从第1天到第14天数据+第16天数据]
......
[从第1天到第14天数据+第21天数据]
[从第2天到第15天数据+第16天数据]
[从第2天到第15天数据+第17天数据]
......
[从第2天到第15天数据+第22天数据]
即分别通过上述第一组数据(从第1天到第14天数据)中的7个数据,分别依次预测未来1至7天的单日流量峰值,通过上述第二组数据(从第2天到第15天数据)中的7个数据,分别依次预测未来1至7天的单日流量峰值。此外,以第一组数据中的第一个数据为例进行解释说明,第1天至第14天数据为时序峰值数据,第15天数据为月旬周数据。
具体的,参见图3和图4,为第一小区和第二小区未来7天流量峰值的预测值和真实值对比,其中图中星号表示真实值,与星号在时间上相对应的折线表示预测值;从图中可以发现,数据波动较大且无明显规律的情况下,指标预测模型具有一定的预测结果,且大多数时间点有较高的预测精度,只有少数的几个时间点有较小偏差;同时,在数据波动较小且规律较明显的情况下,指标预测模型能够准确的判定未来的数据变化方向和变化值,从而达到较高精度的预测结果。
另外,为了展示本实施例中指标预测模型预测单日流量峰值的准确性,分别采用本实施例中的指标预测模型、常规的时间序列预测算法(ARIMA)和深度神经网络(LSTM)算法对5个小区进行预测对比试验。此时,对比结果参见下表所示:
算法模型 | SMAPE | MAE |
ARIMA | 0.485 | 59.90M |
LSTM | 小数据量不适用 | 小数据量不适用 |
指标预测模型 | 0.349 | 47.78M |
通过上述表格可以看出,本实施例中经过Stacking融合得到的指标预测模型对小区流量峰值的预测更为准确。
此外,如图5所示,为本发明实施例中网络指标的预测装置的模块框图,该装置包括:
第一获取模块501,用于获取待预测的网络指标的特征数据;
第二获取模块502,用于将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值;
其中,所述指标预测模型由位于第一层的至少两个第一模型和位于第二层的第二模型融合得到,且预先以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值进行训练得到;所述第二历史时段为所述第一历史时段之后的未来预设时段。
可选地,还包括:
第三获取模块,用于以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值,对所述至少两个第一模型进行训练,得到训练好的至少两个第一模型;
第四获取模块,用于通过Stacking策略,对训练好的至少两个第一模型和所述第二模型进行融合,得到融合后模型;
确定模块,用于通过测试集,对所述融合后模型进行测试,得到测试结果,并当所述测试结果指示所述融合后模型输出的预测值的精度大于预设值时,将所述融合后模型确定为所述指标预测模型;
其中在所述测试集中,以第一历史时段的网络指标的样本特征数据为测试样本,以第二历史时段内的网络指标值为目标值,且所述测试样本中的样本特征数据与所述训练样本中的样本特征数据不同。
在此需要说明的是,本实施例中的装置能够实现上述方法实施例中的所有方法步骤,并能够达到相同的技术效果,在此不再对本装置中与方法实施例中的相同部分及相同技术效果进行赘述。
另外,如图6所示,为本发明实施例提供的电子设备的实体结构示意图,该电子设备可以包括:处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储在存储器630上并可在处理器610上运行的计算机程序,以执行如下步骤:
获取待预测的网络指标的特征数据;将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值;其中,所述指标预测模型由位于第一层的至少两个第一模型和位于第二层的第二模型融合得到,且预先以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值进行训练得到;所述第二历史时段为所述第一历史时段之后的未来预设时段。
可选地,所述特征数据包括第一预设历史时段内的历史网络指标值以及第二预设历史时段内与网络指标相关的类别数据,其中所述第二预设历史时段与所述网络指标的预测时间之间具有预设对应关系。
可选地,所述将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值之前,所述处理器执行所述程序时还实现如下步骤:当所述第一预设历史时段内存在重复历史网络指标值和/或异常历史网络指标值时,对所述重复历史网络指标值和/或异常历史网络指标值进行剔除操作;当所述第一预设历史时段内存在缺失有历史网络指标值的时间点时,通过下述公式,计算得到所述时间点所对应的历史网络指标值并进行回填操作:
Vt=β*Vt-1+(1-β)*θt,0≤β<1;
其中,Vt表示所述时间点所对应的历史网络指标值,Vt-1表示所述时间点之前的相邻时间点所对应的历史网络指标值,θt表示预设数值,β表示系数。
可选地,所述将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值之前,所述处理器执行所述程序时还实现如下步骤:对所述第一预设历史时段内的历史网络指标值进行标准化处理,得到标准化后的历史网络指标值。
可选地,所述将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值之前,所述处理器执行所述程序时还实现如下步骤:通过独热one-hot编码,将所述类别数据转换为连续型变量数据。
可选地,所述处理器执行所述程序时还实现如下步骤:以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值,对所述至少两个第一模型进行训练,得到训练好的至少两个第一模型;通过Stacking策略,对训练好的至少两个第一模型和所述第二模型进行融合,得到融合后模型;通过测试集,对所述融合后模型进行测试,得到测试结果,并当所述测试结果指示所述融合后模型输出的预测值的精度大于预设值时,将所述融合后模型确定为所述指标预测模型;其中在所述测试集中,以第一历史时段的网络指标的样本特征数据为测试样本,以第二历史时段内的网络指标值为目标值,且所述测试样本中的样本特征数据与所述训练样本中的样本特征数据不同。
可选地,所述处理器执行所述程序时还实现如下步骤:通过对称平均绝对百分误差对所述预测值的精度进行表示;或者,通过平均绝对误差对所述预测值的精度进行表示。
可选地,所述通过对称平均绝对百分误差对所述预测值的精度进行表示,包括:通过下述公式,对所述预测值的精度进行表示:
所述通过平均绝对误差对所述预测值的精度进行表示,包括:通过下述公式,对所述预测值的精度进行表示:
可选地,所述第一模型包括下述模型中的至少两个:弹性网络回归ElasticNet模型、梯度提升决策树GBDT模型、支持向量回归SVR模型、极端梯度提升XGBoost模型、随机森林算法RF模型;所述第二模型为线性回归模型。
可选地,所述网络指标包括下述中的任意一个:上行物理资源块PRB、下行PRB、无线连接成功率、无线资源控制RRC连接成功率、上行流量、下行流量、参考信号接收功率PSRP、参考信号接收质量RSRQ、RRC建立成功率、演进的无线接入承载ERAB建立成功率、掉话率、切换成功率。
在此需要说明的是,本实施例中的电子设备能够实现上述方法实施例中的所有方法步骤,并能够达到相同的技术效果,在此不再对本电子设备中与方法实施例中的相同部分及相同技术效果进行赘述。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各实施例提供的方法步骤。
在此需要说明的是,本实施例中的非暂态计算机可读存储介质能够实现上述方法实施例中的所有方法步骤,并能够达到相同的技术效果,在此不再对本非暂态计算机可读存储介质中与方法实施例中的相同部分及相同技术效果进行赘述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (16)
1.一种网络指标的预测方法,其特征在于,包括:
获取待预测的网络指标的特征数据;
将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值;
其中,所述指标预测模型由位于第一层的至少两个第一模型和位于第二层的第二模型融合得到,且预先以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值进行训练得到;所述第二历史时段为所述第一历史时段之后的未来预设时段;
所述特征数据包括第一预设历史时段内的历史网络指标值以及第二预设历史时段内与网络指标相关的类别数据,其中所述第二预设历史时段与所述网络指标的预测时间之间具有预设对应关系;
所述第一模型包括下述模型中的至少两个:弹性网络回归ElasticNet模型、梯度提升决策树GBDT模型、支持向量回归SVR模型、极端梯度提升XGBoost模型、随机森林算法RF模型;所述第二模型为线性回归模型;
所述网络指标包括下述中的任意一个:上行物理资源块PRB、下行PRB、无线连接成功率、无线资源控制RRC连接成功率、上行流量、下行流量、参考信号接收功率PSRP、参考信号接收质量RSRQ、RRC建立成功率、演进的无线接入承载ERAB建立成功率、掉话率、切换成功率。
2.根据权利要求1所述的网络指标的预测方法,其特征在于,所述将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值之前,还包括:
当所述第一预设历史时段内存在重复历史网络指标值和/或异常历史网络指标值时,对所述重复历史网络指标值和/或异常历史网络指标值进行剔除操作;
当所述第一预设历史时段内存在缺失有历史网络指标值的时间点时,通过下述公式,计算得到所述时间点所对应的历史网络指标值并进行回填操作:
Vt=β*Vt-1+(1-β)*θt,0≤β<1;
其中,Vt表示所述时间点所对应的历史网络指标值,Vt-1表示所述时间点之前的相邻时间点所对应的历史网络指标值,θt表示预设数值,β表示系数。
3.根据权利要求1所述的网络指标的预测方法,其特征在于,所述将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值之前,还包括:
对所述第一预设历史时段内的历史网络指标值进行标准化处理,得到标准化后的历史网络指标值。
4.根据权利要求1所述的网络指标的预测方法,其特征在于,所述将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值之前,还包括:
通过独热one-hot编码,将所述类别数据转换为连续型变量数据。
5.根据权利要求1所述的网络指标的预测方法,其特征在于,还包括:
以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值,对所述至少两个第一模型进行训练,得到训练好的至少两个第一模型;
通过Stacking策略,对训练好的至少两个第一模型和所述第二模型进行融合,得到融合后模型;
通过测试集,对所述融合后模型进行测试,得到测试结果,并当所述测试结果指示所述融合后模型输出的预测值的精度大于预设值时,将所述融合后模型确定为所述指标预测模型;
其中在所述测试集中,以第一历史时段的网络指标的样本特征数据为测试样本,以第二历史时段内的网络指标值为目标值,且所述测试样本中的样本特征数据与所述训练样本中的样本特征数据不同。
6.根据权利要求5所述的网络指标的预测方法,其特征在于,还包括:
通过对称平均绝对百分误差对所述预测值的精度进行表示;或者,
通过平均绝对误差对所述预测值的精度进行表示。
8.一种网络指标的预测装置,其特征在于,包括:
第一获取模块,用于获取待预测的网络指标的特征数据;
第二获取模块,用于将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值;
其中,所述指标预测模型由位于第一层的至少两个第一模型和位于第二层的第二模型融合得到,且预先以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值进行训练得到;所述第二历史时段为所述第一历史时段之后的未来预设时段;
所述特征数据包括第一预设历史时段内的历史网络指标值以及第二预设历史时段内与网络指标相关的类别数据,其中所述第二预设历史时段与所述网络指标的预测时间之间具有预设对应关系;
所述第一模型包括下述模型中的至少两个:弹性网络回归ElasticNet模型、梯度提升决策树GBDT模型、支持向量回归SVR模型、极端梯度提升XGBoost模型、随机森林算法RF模型;所述第二模型为线性回归模型;
所述网络指标包括下述中的任意一个:上行物理资源块PRB、下行PRB、无线连接成功率、无线资源控制RRC连接成功率、上行流量、下行流量、参考信号接收功率PSRP、参考信号接收质量RSRQ、RRC建立成功率、演进的无线接入承载ERAB建立成功率、掉话率、切换成功率。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如下步骤:
获取待预测的网络指标的特征数据;
将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值;
其中,所述指标预测模型由位于第一层的至少两个第一模型和位于第二层的第二模型融合得到,且预先以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值进行训练得到;所述第二历史时段为所述第一历史时段之后的未来预设时段;
所述特征数据包括第一预设历史时段内的历史网络指标值以及第二预设历史时段内与网络指标相关的类别数据,其中所述第二预设历史时段与所述网络指标的预测时间之间具有预设对应关系;
所述第一模型包括下述模型中的至少两个:弹性网络回归ElasticNet模型、梯度提升决策树GBDT模型、支持向量回归SVR模型、极端梯度提升XGBoost模型、随机森林算法RF模型;所述第二模型为线性回归模型;
所述网络指标包括下述中的任意一个:上行物理资源块PRB、下行PRB、无线连接成功率、无线资源控制RRC连接成功率、上行流量、下行流量、参考信号接收功率PSRP、参考信号接收质量RSRQ、RRC建立成功率、演进的无线接入承载ERAB建立成功率、掉话率、切换成功率。
10.根据权利要求9所述的电子设备,其特征在于,所述将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值之前,所述处理器执行所述程序时还实现如下步骤:
当所述第一预设历史时段内存在重复历史网络指标值和/或异常历史网络指标值时,对所述重复历史网络指标值和/或异常历史网络指标值进行剔除操作;
当所述第一预设历史时段内存在缺失有历史网络指标值的时间点时,通过下述公式,计算得到所述时间点所对应的历史网络指标值并进行回填操作:
Vt=β*Vt-1+(1-β)*θt,0≤β<1;
其中,Vt表示所述时间点所对应的历史网络指标值,Vt-1表示所述时间点之前的相邻时间点所对应的历史网络指标值,θt表示预设数值,β表示系数。
11.根据权利要求9所述的电子设备,其特征在于,所述将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值之前,所述处理器执行所述程序时还实现如下步骤:
对所述第一预设历史时段内的历史网络指标值进行标准化处理,得到标准化后的历史网络指标值。
12.根据权利要求9所述的电子设备,其特征在于,所述将所述特征数据输入至指标预测模型中,得到所述指标预测模型输出的在未来预设时段内的网络指标值之前,所述处理器执行所述程序时还实现如下步骤:
通过独热one-hot编码,将所述类别数据转换为连续型变量数据。
13.根据权利要求9所述的电子设备,其特征在于,所述处理器执行所述程序时还实现如下步骤:
以第一历史时段的网络指标的样本特征数据为训练样本,以第二历史时段内的网络指标值为目标值,对所述至少两个第一模型进行训练,得到训练好的至少两个第一模型;
通过Stacking策略,对训练好的至少两个第一模型和所述第二模型进行融合,得到融合后模型;
通过测试集,对所述融合后模型进行测试,得到测试结果,并当所述测试结果指示所述融合后模型输出的预测值的精度大于预设值时,将所述融合后模型确定为所述指标预测模型;
其中在所述测试集中,以第一历史时段的网络指标的样本特征数据为测试样本,以第二历史时段内的网络指标值为目标值,且所述测试样本中的样本特征数据与所述训练样本中的样本特征数据不同。
14.根据权利要求13所述的电子设备,其特征在于,所述处理器执行所述程序时还实现如下步骤:
通过对称平均绝对百分误差对所述预测值的精度进行表示;或者,
通过平均绝对误差对所述预测值的精度进行表示。
16.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911088694.8A CN112787878B (zh) | 2019-11-08 | 2019-11-08 | 一种网络指标的预测方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911088694.8A CN112787878B (zh) | 2019-11-08 | 2019-11-08 | 一种网络指标的预测方法及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112787878A CN112787878A (zh) | 2021-05-11 |
CN112787878B true CN112787878B (zh) | 2023-03-14 |
Family
ID=75748393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911088694.8A Active CN112787878B (zh) | 2019-11-08 | 2019-11-08 | 一种网络指标的预测方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112787878B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113487425A (zh) * | 2021-08-03 | 2021-10-08 | 北京神州数字科技有限公司 | 基于历史数据的日间流动性状况回溯方法及系统 |
CN113866659A (zh) * | 2021-09-26 | 2021-12-31 | 中国华能集团清洁能源技术研究院有限公司 | 一种基于机器学习和安时积分法的锂电池soh预测方法 |
CN114926104A (zh) * | 2022-07-21 | 2022-08-19 | 青岛华正信息技术股份有限公司 | 工业互联网平台发展指数监测方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6735580B1 (en) * | 1999-08-26 | 2004-05-11 | Westport Financial Llc | Artificial neural network based universal time series |
CN106447489A (zh) * | 2016-09-12 | 2017-02-22 | 中山大学 | 一种基于部分堆栈融合的用户信用评估模型 |
CN108089962A (zh) * | 2017-11-13 | 2018-05-29 | 北京奇艺世纪科技有限公司 | 一种异常检测方法、装置及电子设备 |
CN108363714A (zh) * | 2017-12-21 | 2018-08-03 | 北京至信普林科技有限公司 | 一种方便数据分析人员使用的集成机器学习的方法及系统 |
CN108631817A (zh) * | 2018-05-10 | 2018-10-09 | 东北大学 | 一种基于时频分析和径向神经网络进行跳频信号频段预测的方法 |
CN109086927A (zh) * | 2018-07-26 | 2018-12-25 | 同济大学 | 结合大数据舆情分析与融合模型的多因子交易方法 |
CN109460514A (zh) * | 2018-11-02 | 2019-03-12 | 北京京东尚科信息技术有限公司 | 用于推送信息的方法和装置 |
CN109698836A (zh) * | 2019-02-01 | 2019-04-30 | 重庆邮电大学 | 一种基于深度学习的无线局域网入侵检测方法和系统 |
CN109783586A (zh) * | 2019-01-21 | 2019-05-21 | 福州大学 | 基于聚类重采样的水军评论检测系统及方法 |
CN109803222A (zh) * | 2018-12-13 | 2019-05-24 | 北京市天元网络技术股份有限公司 | 无线小区性能指标预测方法及装置 |
CN110322085A (zh) * | 2018-03-29 | 2019-10-11 | 北京九章云极科技有限公司 | 一种客户流失预测方法和装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9818136B1 (en) * | 2003-02-05 | 2017-11-14 | Steven M. Hoffberg | System and method for determining contingent relevance |
US20170076216A1 (en) * | 2015-09-10 | 2017-03-16 | Siemens Aktiengesellschaft | Maintenance event planning using adaptive predictive methodologies |
CN105631532A (zh) * | 2015-12-07 | 2016-06-01 | 江苏省电力公司检修分公司 | 一种基于模糊决策的神经网络模型电力系统负荷预测方法 |
CN110288238A (zh) * | 2019-06-26 | 2019-09-27 | 南京擎盾信息科技有限公司 | 一种基于社会宏观经济指标的联动神经网络模型的案件趋势动态预测方法 |
-
2019
- 2019-11-08 CN CN201911088694.8A patent/CN112787878B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6735580B1 (en) * | 1999-08-26 | 2004-05-11 | Westport Financial Llc | Artificial neural network based universal time series |
CN106447489A (zh) * | 2016-09-12 | 2017-02-22 | 中山大学 | 一种基于部分堆栈融合的用户信用评估模型 |
CN108089962A (zh) * | 2017-11-13 | 2018-05-29 | 北京奇艺世纪科技有限公司 | 一种异常检测方法、装置及电子设备 |
CN108363714A (zh) * | 2017-12-21 | 2018-08-03 | 北京至信普林科技有限公司 | 一种方便数据分析人员使用的集成机器学习的方法及系统 |
CN110322085A (zh) * | 2018-03-29 | 2019-10-11 | 北京九章云极科技有限公司 | 一种客户流失预测方法和装置 |
CN108631817A (zh) * | 2018-05-10 | 2018-10-09 | 东北大学 | 一种基于时频分析和径向神经网络进行跳频信号频段预测的方法 |
CN109086927A (zh) * | 2018-07-26 | 2018-12-25 | 同济大学 | 结合大数据舆情分析与融合模型的多因子交易方法 |
CN109460514A (zh) * | 2018-11-02 | 2019-03-12 | 北京京东尚科信息技术有限公司 | 用于推送信息的方法和装置 |
CN109803222A (zh) * | 2018-12-13 | 2019-05-24 | 北京市天元网络技术股份有限公司 | 无线小区性能指标预测方法及装置 |
CN109783586A (zh) * | 2019-01-21 | 2019-05-21 | 福州大学 | 基于聚类重采样的水军评论检测系统及方法 |
CN109698836A (zh) * | 2019-02-01 | 2019-04-30 | 重庆邮电大学 | 一种基于深度学习的无线局域网入侵检测方法和系统 |
Non-Patent Citations (1)
Title |
---|
"城市道路交通流量短时预测的研究";刘丽娜,;《中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑)》;20110315(第3期);C034-551起第2.5小节 * |
Also Published As
Publication number | Publication date |
---|---|
CN112787878A (zh) | 2021-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112787878B (zh) | 一种网络指标的预测方法及电子设备 | |
US11409347B2 (en) | Method, system and storage medium for predicting power load probability density based on deep learning | |
CN110662245B (zh) | 基于深度学习的基站负荷预警方法及装置 | |
JP2020017952A (ja) | 警告するための方法と装置 | |
CN106126391A (zh) | 系统监控方法和装置 | |
EP4047878A1 (en) | Traffic prediction method, device, and storage medium | |
US20230420938A1 (en) | Load forecasting for electrical equipment using machine learning | |
CN105550100A (zh) | 一种信息系统故障自动恢复的方法及系统 | |
CN105325023A (zh) | 用于小区异常检测的方法和网络设备 | |
CN109495327B (zh) | 一种基于大数据分析的用户活动异常检测和流量预测方法 | |
CN105740975A (zh) | 一种基于数据关联关系的设备缺陷评估与预测方法 | |
CN108549955B (zh) | 一种充电桩异常率确定方法及装置 | |
US20240037677A1 (en) | Method for power consumption analysis and troubleshooting of production line based on industrial internet of things, system and storage medium thereof | |
CN106682159A (zh) | 一种阈值配置方法 | |
CN109118012A (zh) | 一种工业动态多维度能耗成本预测方法、系统、存储介质和终端 | |
CN111680841A (zh) | 基于主成分分析的短期负荷预测方法、系统及终端设备 | |
CN105471647A (zh) | 一种电力通信网故障定位方法 | |
CN111178725A (zh) | 一种基于层次分析法的保护设备状态预警方法 | |
CN111881961A (zh) | 基于数据挖掘的配电网故障风险等级预测方法 | |
US20240060605A1 (en) | Method, internet of things (iot) system, and storage medium for smart gas abnormal data analysis | |
US20230367935A1 (en) | Methods, internet of things systems, and storage mediums for management of pipeline network inspection based on smart gas geographic information systems | |
CN114138601A (zh) | 一种业务告警方法、装置、设备及存储介质 | |
CN111614520B (zh) | 一种基于机器学习算法的idc流量数据预测方法及装置 | |
CN109978299B (zh) | 用于海上风电业务的数据分析方法、装置和存储介质 | |
CN113344290B (zh) | 基于U-Net网络的次季节降水气象预报订正方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |