CN115209441A

CN115209441A - 基站退服告警预测方法、装置、设备及存储介质

Info

Publication number: CN115209441A
Application number: CN202110386101.7A
Authority: CN
Inventors: 王西点; 高鹏; 王亚楠; 高峰; 徐晶; 王磊; 刘武韬; 贾子寒; 聂臻霖; 石铎; 吴晓曦; 王国治; 刘大洋; 马敏; 程楠; 沈骜
Original assignee: China Mobile Communications Group Co Ltd; China Mobile Group Design Institute Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; China Mobile Group Design Institute Co Ltd
Priority date: 2021-04-09
Filing date: 2021-04-09
Publication date: 2022-10-18

Abstract

本发明公开一种基站退服告警预测方法、装置、设备及存储介质，该方法包括：根据待预测基站在预设时段内的历史运维数据中的告警数据进行词向量编码获得告警特征序列；通过预设滑动窗口对告警特征序列进行滑动采样以及特征添加获得告警预测样本；通过预设退服告警预测模型根据告警预测样本进行基站退服告警预测。由于是通过对基于待预测基站的历史告警数据生成的告警特征序列进行采样和特征添加来生成告警预测样本，然后利用预先训练的退服告警预测模型根据告警预测样本进行基站退服告警预测，相比于现有的凭借技术人员的经验进行基站退服预测的方式，本发明上述方式有效利用了待预测基站的历史告警数据，保证了预测结果的准确性和可靠性。

Description

基站退服告警预测方法、装置、设备及存储介质

技术领域

本发明涉及网络通信技术领域，尤其涉及一种基站退服告警预测方法、装置、设备及存储介质。

背景技术

通信基站是移动通信系统中最关键的一个节点，一旦某个通信基站出现退服，则该基站天线覆盖范围内的信号会中断或者变弱，无法为信号覆盖区域提供无线服务，严重影响到用户的感知体验。

当前基站退服处理多是在退服告警已经发生，基站停止服务后被动应对，主要是依靠人工经验和互联网技术手段。当基站设备由于天馈故障、传输故障、载频故障、停电、高温等原因导致基站停止服务时，设备将产生退服告警并上报给网管系统，再由网管系统同步到集中故障管理平台。运维人员根据设备维护手册以及过往处理经验，制定运维方案，远端通过设备重启、参数重配置、现场通过更换设备、电池等手段，达到排除故障，使基站恢复服务的目的。

随着无线通信技术的快速迭代和网络规模的不断扩大，用户对网络质量的要求越来越高，被动响应式的基站告警处理方式己越来越满足不了运营商对网络告警，尤其是退服告警的管理需求。而仅凭借技术人员的经验进行基站退服的预测，往往比较粗放，过于简单，不能达到高效、精准的预测效果。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供了一种基站退服告警预测方法、装置、设备及存储介质，旨在解决现有的退服告警预测大部分依靠经验来进行粗粒度估计，预测准确性不高的技术问题。

为实现上述目的，本发明提供了一种基站退服告警预测方法，所述方法包括以下步骤：

获取待预测基站在预设时段内的历史运维数据；

根据所述历史运维数据中的告警数据进行词向量编码，获得告警特征序列；

通过预设滑动窗口对所述告警特征序列进行滑动采样，获得初始告警样本；

根据所述历史运维数据为所述初始告警预测样本添加特征，获得告警预测样本；

通过预设退服告警预测模型根据所述告警预测样本进行基站退服告警预测。

优选地，所述根据所述历史运维数据中的告警数据进行词向量编码，获得告警特征序列的步骤，包括：

根据所述历史运维数据中的告警数据确定所述待预测基站的告警标识；

通过预设word2vec模型将所述告警标识映射为对应的告警词向量；

对所述告警词向量进行编码，获得告警特征序列。

优选地，所述告警词向量包含退服告警词向量和非退服告警词向量；

所述对所述告警词向量进行编码，获得告警特征序列的步骤，包括：

获取所述退服告警词向量和所述非退服告警词向量之间的词向量相似度；

根据所述词向量相似度计算所述待预测基站的告警编码值；

根据所述告警编码值生成告警特征序列。

优选地，所述根据所述告警编码值生成告警特征序列的步骤，包括：

根据所述告警编码值统计所述待预测基站在单位时间周期内的告警编码值之和；

将所述告警编码值之和作为每一个单位时间周期所对应的告警特征值；

根据所述告警特征值构建所述待预测基站在所述预设时段内的告警特征序列。

优选地，所述根据所述历史运维数据为所述初始告警预测样本添加特征，获得告警预测样本的步骤，包括：

对所述历史运维数据进行分析，以获得所述待预测基站对应的历史退服特征和基站属性特征；

根据所述历史退服特征和所述基站属性特征为所述初始告警预测样本添加特征，获得告警预测样本。

优选地，所述预设退服告警预测模型包括：预设XGBoost模型和预设Lightgbm模型；

所述通过预设退服告警预测模型根据所述告警预测样本进行基站退服告警预测的步骤，包括：

对所述告警预测样本进行分组，获得预设数量的告警预测子样本集；

将所述告警预测子样本集分别输入至所述预设XGBoost模型和所述预设Lightgbm模型；

对所述预设XGBoost模型输出的第一预测结果和所述预设Lightgbm模型输出的第二预测结果进行加权求和，获得基站退服告警预测结果。

优选地，所述获取待预测基站在预设时段内的历史运维数据的步骤之前，所述方法还包括：

获取训练样本，并对所述训练样本进行GroupKFold分组，获得多个子样本集；

从多个所述子样本集中选取一子样本集作为模型测试集，将除所述模型测试集以外的子样本集作为模型训练集；

根据所述模型训练集分别对初始XGBoost模型和初始Lightgbm模型进行训练，获得预设XGBoost模型和预设Lightgbm模型。

优选地，所述初始XGBoost模型和所述初始Lightgbm模型中的二分类交叉熵损失函数为：

式中，Focal loss为二分类交叉熵损失函数，P_i为预测概率，α和γ为加权因子。

优选地，所述获取待预测基站在预设时段内的历史运维数据的步骤之前，还包括：

获取不同基站的历史运维数据；

根据所述不同基站的历史运维数据构建基站告警编码语料库；

基于所述基站告警编码语料库对初始word2vec模型进行迭代训练，获得预设word2vec模型。

优选地，所述根据所述不同基站的历史运维数据构建基站告警编码语料库的步骤，包括：

从所述不同基站的历史运维数据中获取各基站的原始告警数据；

对所述原始告警数据进行预处理，获得有效告警数据；

对所述有效告警数据进行聚合排序，并根据聚合排序后的告警数据生成告警序列；

根据所述告警序列构建基站告警编码语料库。

优选地，所述对所述原始告警数据进行预处理，获得有效告警数据的步骤，包括：

根据预设维度的告警字段对所述原始告警数据进行去重，获得获得待处理告警数据；

对所述待处理告警数据中的异常告警数据进行剔除，获得有效告警数据。

优选地，所述对所述对所述有效告警数据进行聚合排序，并根据聚合排序后的告警数据生成告警序列的步骤，包括：

将所述有效告警数据按基站标识聚合为不同的告警数据组；

对各所述告警数据组中的告警数据按告警发生时间的先后顺序进行排序，获得排序后的告警数据组；

根据所述排序后的告警数据组生成告警序列。

优选地，所述根据所述排序后的告警数据组生成告警序列的步骤，包括：

以所述排序后的告警数据组中的每一个退服告警为中心，将预设时间范围内的告警数据作为所述退服告警对应的告警组；

将所有退服告警对应的告警组合并，以获得告警序列。

此外，为实现上述目的，本发明还提出一种基站退服告警预测装置，所述基站退服告警预测装置包括：

数据获取模块，用于获取待预测基站在预设时段内的历史运维数据；

向量编码模块，用于根据所述历史运维数据中的告警数据进行词向量编码，获得告警特征序列；

窗口采样模块，用于通过预设滑动窗口对所述告警特征序列进行滑动采样，获得初始告警样本；

特征添加模块，用于根据所述历史运维数据为所述初始告警预测样本添加特征，获得告警预测样本；

告警预测模块，用于通过预设退服告警预测模型根据所述告警预测样本进行基站退服告警预测。

此外，为实现上述目的，本发明还提出一种基站退服告警预测设备，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基站退服告警预测程序，所述基站退服告警预测程序配置为实现如上文所述的基站退服告警预测方法的步骤。

此外，为实现上述目的，本发明还提出一种存储介质，所述存储介质上存储有基站退服告警预测程序，所述基站退服告警预测程序被处理器执行时实现如上文所述的基站退服告警预测方法的步骤。

本发明通过获取待预测基站在预设时段内的历史运维数据，根据历史运维数据中的告警数据进行词向量编码获得告警特征序列；然后通过预设滑动窗口对告警特征序列进行滑动采样，获得初始告警样本；再根据历史运维数据为初始告警预测样本添加特征，获得告警预测样本；最后通过预设退服告警预测模型根据告警预测样本进行基站退服告警预测。由于是通过对基于待预测基站的历史告警数据生成的告警特征序列进行采样和特征添加来生成告警预测样本，然后利用预先训练的退服告警预测模型根据生成的告警预测样本进行基站退服告警预测，相比于现有的凭借技术人员的经验进行基站退服预测的方式，本发明上述方式有效利用了待预测基站的历史告警数据，保证了预测结果的准确性和可靠性。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的基站退服告警预测设备的结构示意图；

图2为本发明基站退服告警预测方法第一实施例的流程示意图；

图3为本发明基站退服告警预测方法第一实施例中滑动窗口采样的示意图；

图4为本发明基站退服告警预测方法第二实施例的流程示意图；

图5为本发明基站退服告警预测方法第二实施例中word2vec模型的模型结构示意图；

图6为本发明基站退服告警预测方法第三实施例的流程示意图；

图7为本发明基站退服告警预测方法第四实施例的流程示意图；

图8为基于XGBoost模型和Lightgbm模型的基站退服告警预测流程示意图；

图9为本发明基站退服告警预测方法第五实施例的流程示意图；

图10为本发明基站退服告警预测装置第一实施例的结构框图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的基站退服告警预测设备结构示意图。

如图1所示，该基站退服告警预测设备可以包括：处理器1001，例如中央处理器(Central Processing Unit，CPU)，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity，WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory，RAM)存储器，也可以是稳定的非易失性存储器(Non-Volatile Memory，NVM)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的结构并不构成对基站退服告警预测设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及基站退服告警预测程序。

在图1所示的基站退服告警预测设备中，网络接口1004主要用于与网络服务器进行数据通信；用户接口1003主要用于与用户进行数据交互；本发明基站退服告警预测设备中的处理器1001、存储器1005可以设置在基站退服告警预测设备中，所述基站退服告警预测设备通过处理器1001调用存储器1005中存储的基站退服告警预测程序，并执行本发明实施例提供的基站退服告警预测方法。

本发明实施例提供了一种基站退服告警预测方法，参照图2，图2为本发明基站退服告警预测方法第一实施例的流程示意图。

本实施例中，所述基站退服告警预测方法包括以下步骤：

步骤S10：获取待预测基站在预设时段内的历史运维数据。

需要说明的是，本实施例方法的执行主体可以是具有数据处理、网络通信以及程序运行功能的计算服务设备，例如智能手机、平板电脑以及个人电脑等，或者是其他能够实现相同或相似功能的电子设备，本实施例对此不加以限制。

应理解的是，所述预设时段可根据实际预测需求确定，例如近一个月(30天)、三个月(90天)或半年(180天)等，本实施例不做限定。本实施例中所述历史运维数据可以包含基站的工参数据和告警数据。其中，告警数据可包含故障告警、动环告警、性能告警等各种类型的告警记录，这些告警记录描述了基站设备发生告警的时间、告警类别、基站名称等信息，可用于构建退服告警预测模型的训练样本集。所述工参数据可以是描述基站物理属性的数据，包括基站所在位置的经纬度、覆盖的区域、所属机房、基站名称、基站ID等信息。

在具体实现中，可先从待预测基站所属的网络管理系统中获取该待预测基站在预设时间段内的历史运维数据。

步骤S20：根据所述历史运维数据中的告警数据进行词向量编码，获得告警特征序列。

需要强调的是，为了实现对基站退服告警的准确预测，本实施例优选通过待预测基站的历史运维数据中包含的性能告警、环动告警、无线告警等告警数据、或者以这些告警数据为基础数据进行一系列处理后的数据作为预测依据来对待预测基站的未来一段时间发生退服告警的可能性进行预测。

需要说明的是，上述告警特征序列可以是由告警特征构成的、以告警特征对应的告警发生时间为顺序排列而成的数据对象，该告警特征可以通过具体的数值或者符号进行表征。例如告警特征1(10:00-11:00)-告警特征2(11:00-12:00)-告警特征3(12:00-13:00)等，本实施例对所述告警特征的表示形式不作具体限制。

实际应用中，技术人员通过对基站的(历史)告警数据进行分析后发现基站告警存在以下特点：1、大多数退服告警为突发类告警，即与之前发生的告警相关性较低，导致直接预测的难度增大；2、告警类型多，且告警发生的时间、发生的基站，没有明显规律；3、退服告警数量少，占比低：以某省市为例，当年7-8月共发生130316条告警，其中退服告警5854条，占比只有4.5％，存在严重的数据稀疏问题。结合上述实际情况，本实施例优选采用基于词向量的告警分析方法，即对告警数据进行词向量编码，一方面能够解决退服告警数据稀疏的问题，另一方面也能够提高退服告警预测的效率以及准确性。

应理解的是，词向量是指将语言中的词进行数学化表示的一种方式，具有良好的语义特性，是表示词语特征的常用方式。词向量基本思想是：通过对大量语料进行训练，将某种语言中的每个词语映射成一个固定长度的向量，一般而言这个长度远小于该语言词典的大小，通常在几十到几百维。所有这些向量一起构成了词向量空间，而每一个向量就可以视为该空间中的一个点。在这个空间上引入“距离”的度量，就可以根据词向量的距离来判断对应词语之间在句法、语义上的相似性。

应用到本实施例中，所述词向量编码可以是先将待处理数据进行向量化生成词向量空间，然后基于词向量空间对空间中的词向量进行向量编码，从而实现对待处理数据的特征提取和特征数学化表达的操作。

作为一种实现方式，本实施例中基于词向量空间进行编码可以是先计算词向量空间中退服告警词向量和非退服告警词向量之间的相似度，然后根据计算出的相似度计算编码值，再根据编码值确定告警特征，最后对告警特征进行排序获得告警特征序列。当然，本实施例对词向量进行编码的方式不局限于上述方式，所有能够对告警数据中不同种类的告警(例如退服告警或非退服告警)的特征进行提取和量化表达的方式均可应用到本实施例中实现告警特征序列的生成。

在具体实现中，可先提取待预测基站历史运维数据中的告警数据，然后根据这些告警数据确定该基站在过去一段时间内所发生的所有告警的告警标识(例如告警的名称或标题)，然后根据这些告警标识进行词向量编码，再根据编码结果获得告警特征序列。

步骤S30：通过预设滑动窗口对所述告警特征序列进行滑动采样，获得初始告警样本。

应理解的是，滑动窗口(法)，也称尺取法，用于解决一些查找满足一定条件的连续区间的性质(长度等)的问题。本实施例中所述预设滑动窗口的窗口大小可以设定为固定时长(例如168小时，即一周7*24h)，且每一次通过该滑动窗口进行采样的滑动间隔也可自行设置，例如24h、48h等。

如图3所示，图3为本发明基站退服告警预测方法第一实施例中滑动窗口采样的示意图。若滑动间隔设置为24h，则每一个采样周期内滑动采样的次数即为24h的整数倍。

在具体实现中，当告警特征序列确定后，可通过上述预设滑动窗口对告警特征序列进行滑动采样，获得初始告警样本。本实施例中采样的范围可以根据需要预测的天数决定，例如需要预测的天数为3天(即3*24h)后，若滚动时间间隔为24h，则滑动窗口需要滑动采样3次。

步骤S40：根据所述历史运维数据为所述初始告警预测样本添加特征，获得告警预测样本。

需要说明的是，本步骤中上述特征的添加可以是根据历史运维数据为初始告警样本添加待预测基站过往发生的退服特征、属性特征等数据的过程，本实施例通过添加特征能够丰富告警预测样本的数据维度，使得后续的退服告警预测结果更加准确。

需要说明的是，上述退服特征可以是根据历史运维数据分析出的、与基站退服情况相关的特征数据，例如基站历史运维数据中每种告警类型的发生次数、基站历史退服告警发生的天数比例、基站每种退服告警发生天数比例和/或该基站前1-3天是否发生了退服告警，前4-7天是否发生了退服告警等。另外，上述属性特征可以包含对每个基站的覆盖区域、所属机房、基站名称、基站id、小区名称等进行标签化处理后获得的数据，以及每个基站的覆盖区域数量、所属机房下的关联基站、小区名称数量等数据。本实施例中上述标签化处理的方式可以是通过labelencoder技术来实现。

步骤S50：通过预设退服告警预测模型根据所述告警预测样本进行基站退服告警预测。

应理解的是，基站在将来一段时间是否会发生退服告警属于一个二分类的问题，即预测结果只有发生或者不发生。因此本实施例中所述预设退服告警预测模型可以是根据海量的基站历史运维数据构建的退服告警预测样本所训练出的二分类模型，例如逻辑回归模型、梯度下降树(GBDT)等。

进一步地，考虑到GBDT由于非线性变换比较多，具有表达能力强，不需要进行复杂的特征工程和特征变换，预测精度高等优点。因此本实施例中上述预设退服告警预测模型优选为对GBDT进行训练后得到的模型。

应理解的是，GBDT由回归树、Gradient Boosting等两个主要概念组成。回归树的本质是对数据进行分类，每个节点会分成2个子节点。在形成二叉树的过程中，不断迭代寻找最佳分割点，最后形成一颗二叉树；Gradient Boosting首先会为每个训练样本赋予一样的权重值，在每一次迭代进行训练模型时，会提高分错样本的权重，降低分对样本的权重，从而在减少残差的梯度方向上训练一个新的模型，使得最终训练出的模型具有较高的预测精度。

具体实现中，在获取到待预测基站的告警预测样本后，即可将该告警预测样本输入至上述预设退服告警预测模型，然后根据模型输出的结果来确定待预测基站在预测的时间内发生退服告警的概率，以实现对待预测基站退服告警的准确预测。

本实施例通过获取待预测基站在预设时段内的历史运维数据，根据历史运维数据中的告警数据进行词向量编码获得告警特征序列；然后通过预设滑动窗口对告警特征序列进行滑动采样，获得初始告警样本；再根据历史运维数据为初始告警预测样本添加特征，获得告警预测样本；最后通过预设退服告警预测模型根据告警预测样本进行基站退服告警预测。由于是通过对基于待预测基站的历史告警数据生成的告警特征序列进行采样和特征添加来生成告警预测样本，然后通过预先训练的退服告警预测模型根据生成的告警预测样本进行基站退服告警预测，相比于现有的凭借技术人员的经验进行基站退服预测的方式，本实施例上述方式充分考虑待预测基站的历史告警数据，保证了预测结果的准确性和可靠性。

参考图4，图4为本发明基站退服告警预测方法第二实施例的流程示意图。

基于上述第一实施例，在本实施例中，所述步骤S20包括：

步骤S201：根据所述历史运维数据中的告警数据确定所述待预测基站的告警标识。

需要说明的是，本步骤中所述告警标识可以是能够对不同告警进行区分的标识性信息，例如告警的名称或标题等，本实施例中上述告警标识可以通过待预测基站历史运维数据中的告警数据确定，还可以人工输入。实际应用中，技术人员通过对大量基站的历史运维数据进行分析后发现，基站对应的告警标识有大概100多种，这些告警标识分别表示了100多种不同类型的基站告警。实际应用中为了节省预测时间，本实施例中上述告警标识的获取方式还可以是，由技术人员先根据历史运维数据中的告警数据分析出上述100多种告警标识，然后在进行基站退服告警预测时，直接将这些事先获得的100多种告警标识输入至训练好的预设word2vec模型中进行词向量编码即可。

步骤S202：通过预设word2vec模型将所述告警标识映射为对应的告警词向量。

实际应用中，考虑到word2vec是一种可以用来学习词向量的算法(模型)，其核心思想是利用简化的神经网络对靠近词语的上下文训练得到词的向量化表示。该算法能够在较短的时间内，从大规模语料库中学习到高质量的词向量，从而可以方便的计算词与词之间的语义相似性，并且这种相似性具有多角度并且支持线性运算。因此本实施例中，优选通过word2vec模型来对告警标识进行向量化。

应理解的是，word2vec模型主要包括CBOW(Continuous Bag of Words Model)和Skip-gram(Continuous Skip-gram Model)两种模型，分别通过上下文预测中心词和通过中心词预测上下文，将词语映射成一个多维稠密向量，其模型结构如图5所示，CBOW模型中输入层(w_t-c、w_t-c+1、w_t、w_t+c-1、w_t+c)、隐含层(X_wt)，输出层(w_t)；Skip-gram模型中输入层(w_t)、隐含层(X_wt)，输出层(w_t-c、w_t-c+1、w_t、w_t+c-1、w_t+c)。

在具体实现中，可通过预先训练的所述预设word2vec模型将告警标识映射为一一对应的告警词向量，也即将其与模型训练得到的权重矩阵相乘得到对应的告警词向量。

步骤S203：对所述告警词向量进行编码，获得告警特征序列。

需要说明的是，本步骤中对告警词向量进行编码，即将告警词向量转化为由具体数值(编码值)进行表示的过程。具体的编码规则本实施例不作限定。另外，本实施例中上述告警特征序列可以是由单位时间内基站所有告警的编码值计算出的数值(告警特征值)构成。例如，可以以小时为粒度，将每小时内所有告警的编码值进行累加，然后将累加值作为该小时对应的告警编码值，通过统计若干小时的告警编码值构建告警特征序列。

本实施例根据历史运维数据中的告警数据确定待预测基站的告警标识；然后通过预设word2vec模型将告警标识映射为对应的告警词向量；再对告警词向量进行编码，获得告警特征序列，能够快速、准确的对告警数据进行特征提取，保证后续告警预测的准确性。

进一步地，为了解决退服告警数据稀疏，导致退服告警预测结果不够准确的问题，本实施例优选采用非退服告警来对退服基站的特征进行刻画。为此本实施例将告警词向量划分为退服告警词向量和非退服告警词向量，相应地，上述步骤S203可包括：

S2031：获取所述退服告警词向量和所述非退服告警词向量之间的词向量相似度。

应理解的是，向量之间的相似度计算方法有多种，例如余弦相似度(cosine)计算方法、欧式距离(Euclidean)计算方法和皮尔逊相关系数(Pearson correlationcoefficient)计算方法等。具体相似度的计算方式的选用本实施例不作具体限定。

但进一步地，考虑到余弦相似度被广泛应用于计算文档数据的相似度，本实施例优选通过余弦相似度作为本步骤词向量相似度的计算方式。

应理解的是，对于余弦相似度而言，余弦值接近1，夹角趋于0，表明两个向量越相似，余弦值接近于0，夹角趋于90度，表明两个向量越不相似。因此，通过计算非退服告警向量与退服告警向量之间的余弦距离，可以得非退服告警与退服告警之间的相似度。

S2032：根据所述词向量相似度计算所述待预测基站的告警编码值。

在获取到上述词向量相似度后，即可根据下述公式(1)将这些词向量相似度进行累加，然后将累加结果作为待预测基站的告警编码值。

其中，所述公式(1)为：

式中，Ecode_i为告警编码值，j为第j类退服告警，i为第i类非退服告警，δ_ij为第i类非退服告警与第j类退服告警之间的词向量相似度。

S2033：根据所述告警编码值生成告警特征序列。

在具体实现中，为了实现退服告警的精细化预测，本实施例通过上述方式计算出待预测基站的告警编码值后，可将告警编码值以小时为粒度进行统计，然后根据统计结果将每小时内待预测基站的所有告警编码值整合(可以是进行求和)为该小时的告警特征值，再基于这些告警特征值构建告警特征序列。

本实施例通过上述方式充分考虑非退服告警与退服告警的相关性，包括每个退服告警周围的其他告警、相邻告警对退服告警的影响，通过建立退服告警上下文信息相关的词向量编码模型(即上述word2vec模型)，利用大量的非退服告警刻画退服基站的特征，从而解决退服告警稀疏，数据不足的问题。

进一步地，为了更加准确、高效的实现退服告警预测。本实施例中，上述步骤S2033可包括：根据所述告警编码值统计所述待预测基站在单位时间周期内的告警编码值之和；将所述告警编码值之和作为每一个单位时间周期所对应的告警特征值；根据所述告警特征值构建所述待预测基站在所述预设时段内的告警特征序列。

需要说明的是，上述单位时间周期可以根据实际情况设定，例如以小时为粒度，该周期可设置为1小时、2小时……n小时等。所述预设时段的具体数值也可以根据实际情况设定。例如，若单位时间周期为1小时，那么待预测基站在12:00-15：00内的告警特征序列则可以是由12:00-13:00对应的告警特征值a、13:00-14:00对应的告警特征值b，以及14:00-15:00对应的告警特征值c构成：“告警特征值a|告警特征值b|告警特征值c”。

在具体实现中，告警特征序列构建完成之后，即可基于该告警特征序列生成用于退服告警预测的预测样本，然后进行后续的预测操作。

参考图6，图6为本发明基站退服告警预测方法第三实施例的流程示意图。

基于上述第一实施例，在本实施例中，所述步骤430包括：

步骤S401：对所述历史运维数据进行分析，以获得所述待预测基站对应的历史退服特征和基站属性特征。

需要强调的是本实施例中，所述历史退服特征可以是根据待预测基站的历史运维数据分析出的、与基站退服情况相关的特征数据。例如，基站历史运维数据中每种告警类型的发生次数、基站历史退服告警发生的天数比例、基站每种退服告警发生天数比例和/或该基站前1-3天是否发生了退服告警，前4-7天是否发生了退服告警等。所述基站属性特征则可以包含对每个基站的覆盖区域、所属机房、基站名称、基站id、小区名称等进行标签化处理后获得的数据，以及每个基站的覆盖区域数量、所属机房下的关联基站、小区名称数量等数据。

在具体实现中，可以通过数据分析软件对历史运维数据进行分析，也是可以人工对历史运维数据进行分析。

步骤S402：根据所述历史退服特征和所述基站属性特征为所述初始告警预测样本添加特征，获得告警预测样本。

需要说明的是，所谓添加特征，即将获得的上述历史退服特征和基站属性特征添加到初始告警预测样本中，以提高预测准确性。

本实施例通过对历史运维数据进行分析，以获得待预测基站对应的历史退服特征和基站属性特征；然后根据历史退服特征和基站属性特征对初始告警预测样本进行特征添加，获得告警预测样本，能够充分考虑每一个基站的历史发生的退服告警的原因和特征，并以此为后续告警预测的基础，保证了预测结果的准确性。

参考图7，图7为本发明基站退服告警预测方法第四实施例的流程示意图。

值得说明的是，随着人工智能技术的快速发展，二分类模型中GBDT被广泛地应用于分类、排序、回归等问题，但其存在难以并行化处理、训练效率低、计算复杂度大等问题。

考虑到XGboost算法和Lightgbm算法既能够高效地实现GBDT算法，同时进行了算法和工程上的许多改进，在处理大规模数据上具有明显优势，且都支持并行运算并具有更高的准确率。因此，本实施例在GBDT的基础上优选通过XGboost和Lightgbm的二分类模型进行退服告警预测。由此，提出本发明基站退服告警预测方法第四实施例。

需要说明的是，XGboost算法和Lightgbm算法都是基于梯度下降树(GBDT)的提升方法。GBDT是集成算法中提升法(Boosting)的代表算法。集成算法通过将原始数据集分割成多个子数据集，将每个子数据集随机的分配给弱评估器，而每个弱评估器在上一轮弱评估器的残差基础上进行训练。经过多次迭代逐渐汇总所有弱评估器的建模结果，以获取比单个模型更好的回归或分类表现。

为了通过XGBoost模型和Lightgbm模型对退服告警进行准确预测，本实施例中，还需要在预测之前进行相应的模型训练，相应地，所述基站退服告警预测方法还包括以下步骤：

步骤S01：获取训练样本，并对所述训练样本进行GroupKFold分组，获得多个子样本集；

需要说明的是，本实施例中的训练样本都是添加了标签的样本，在具体实现中可根据需要预测的天数n对样本添加标签。如果训练样本对应的基站在预测的n天内发生退服告警则n对应设置为1，若未发生退服告警，则n对应设置为0。

在具体实现中，可对训练样本按照其所在周数进行分组，然后采用GroupKFold进行交叉验证，将原始样本分割成K个子样本集。

需要说明的是，训练样本周数的确定可以根据样本中各类数据产生的时间节点节点来确定，例如预测样本的时间跨度为1个月，则训练样本中的数据可根据数据产生时间的不同划分为第一周(数据)、第二周(数据)、第三周(数据)以及第四周(数据)。

考虑到，由于样本的构造方式导致时间相近的样本，其数据相似性也较高，训练得到的模型能够灵活地从这些样例中学习到特征，但遇到一个新的数据模型表现就较差。因此，本实施例通过采用GroupKFold进行交叉验证，能够有效避免同一周的样本同时出现在训练集和测试集上，从而提高了最终训练出的模型的泛化能力。

步骤S02：从多个所述子样本集中选取一子样本集作为模型测试集，将除所述模型测试集以外的子样本集作为模型训练集；

在具体实现中，对于分组后的子样本集，每一个单独的子样本集被保留作为验证模型的数据，其他K-1个样本集则用来训练XGBoost和Lightgbm模型，且保证同一周的样本不会同时出现在模型训练集和模型测试集上。

步骤S03：根据所述模型训练集分别对初始XGBoost模型和初始Lightgbm模型进行训练，获得预设XGBoost模型和预设Lightgbm模型。

在训练样本被分组后，为了使得每个子样本集均被验证一次，同时生成K个模型，需要重复执行上述步骤S02K次，在完成K个子模型的训练后，根据其在验证集上的精确率，再分配各个子模型的权重。

需要说明的是，为了解决训练样本中正负样本比例严重失衡的问题，本实施例采用改进后的初始XGBoost模型和改进后的初始Lightgbm模型进行退服告警预测模型训练。

具体的，可采用Focal loss代替传统的交叉熵损失函数，使得上述初始XGBoost模型和初始Lightgbm模型中的二分类交叉熵损失函数为：

式中，P_i为预测概率，α和γ为加权因子。

Focal loss通过引入加权因子α和γ对负样本和易分样本进行惩罚，其函数形式如下：

其中γ>0用于减少易分类样本的损失，使得模型更关注于困难的、错分的样本。例如γ＝2，对于正类样本而言，预测结果为0.95为简单样本，所以(1-0.95)的γ次方就较小，损失函数值也变得更小。而预测概率为0.3的样本其损失相对很大。因此通过加入具有平衡作用的加权因子α，加大正样本的权重，从而平衡正负样本本身的比例不均。

如图8所示，图8为基于XGBoost模型和Lightgbm模型的基站退服告警预测流程示意图。在获得退服告警样本(即上述训练样本)后，即可将退服告警样本按照其所在周数进行GroupKFold分组，然后根据分割成的子样本集的个数来进行XGBoost模型和Lightgbm模型的同步训练，在训练完成后根据根据每个子模型在验证集上的精确率分配各个子模型的权重，最终的预测结果则根据模型权重融合子模型输出的预测结果获得。

相应地，上述第一实施例中的步骤S40可包括：对所述告警预测样本进行分组，获得预设数量的告警预测子样本集；将所述告警预测子样本集分别输入至所述预设XGBoost模型和所述预设Lightgbm模型；对所述预设XGBoost模型输出的第一预测结果和所述预设Lightgbm模型输出的第二预测结果进行加权求和，获得基站退服告警预测结果。例如XGBoost模型输出的第一预测结果为(Y：70％，N：30％)，Lightgbm模型输出的第二预测结果为(Y：60％，N：40％)，XGBoost模型的权重为0.7，Lightgbm模型的权重为0.3，则最终的预测结果为(Y：70％*0.7+60％*0.3，N：30％*0.7+40％*0.3)＝(Y：67％，N：33％)。

本实施例通过获取训练样本，并对训练样本进行GroupKFold分组，获得多个子样本集；从多个子样本集中选取一子样本集作为模型测试集，将除模型测试集以外的子样本集作为模型训练集；根据所述模型训练集分别对初始XGBoost模型和初始Lightgbm模型进行训练，获得预设XGBoost模型和预设Lightgbm模型，实现了在XGBoost模型和Lightgbm模型的基础上，构建AI退服告警预测模型，同时通过对XGBoost模型和Lightgbm模型进行改进，即在模型损失函数中引入两项加权因子，降低了样本的不平衡对模型训练的影响，并在模型训练过程中，通过网格寻优和交叉验证技术优化模型参数，利用多模型预测结果融合提升了模型的泛化能力。

参考图9，图9为本发明基站退服告警预测方法第五实施例的流程示意图；

基于上述各实施例，提出本发明基站退服告警预测方法第五实施例。

本实施例提出的基站退服告警预测方法在上述步骤S10之前，还包括：

步骤S01'：获取不同基站的历史运维数据；

需要说明的是，为了快速准确的实现词向量编码，本实施例将根据不同基站的历史运维数据构建基站告警编码语料库，然后基于该语料库对word2vec模型进行训练。

本实施例中上述历史运维数据可以从网络管理系统中采集，主要包括基站的工参数据和告警数据。其中，告警数据可包含故障告警、动环告警、性能告警等各种类型告警记录，这些告警记录描述了基站设备发生告警的时间、告警类别、基站名称等信息，可用于构建退服告警预测模型的训练样本集。所述工参数据可以是描述基站物理属性的数据，包括基站所在位置的经纬度、覆盖的区域、所属机房、基站名称、基站ID等信息

步骤S02'：根据所述不同基站的历史运维数据构建基站告警编码语料库；

在具体实现中，可对不同基站的上述历史运维数据进行一定的处理(例如数据去噪、去重、缺失值填充等)之后，再根据处理之后的数据来构建基站告警编码语料库。

进一步地，考虑到基站的(历史)运维数据中存在许多重复数据和异常数据，这些数据都将直接影响模型训练的效果。因此，作为另一种实施方式，上述步骤S02'还可以包括：

步骤S021'：从所述不同基站的历史运维数据中获取各基站的原始告警数据；

需要说明的是，上述原始告警数据可以是描述基站设备发生告警的时间、告警类别、基站名称等信息的数据。通常情况下，原始告警数据中包含大量的重复告警和异常告警，这些数据都需要被剔除，以减少对模型训练的干扰。

步骤S022'：对所述原始告警数据进行预处理，获得有效告警数据。

需要说明的是，本步骤中对原始告警数据的预处理可以是进行重复数据的去除(即去重)和无效数据的剔除(即去噪)，从而获得有效告警数据。

为了保证有效数据的精确性和可靠性，本实施例还可以根据预设维度的告警字段对所述原始告警数据进行去重，获得获得待处理告警数据；然后对所述待处理告警数据中的异常告警数据进行剔除，获得有效告警数据。

其中，所述预设维度可以包含告警发生时间、告警结束时间、告警名称和/或告警网元等维度。上述异常告警数据的剔除可以是依据大量的历史告警数据和相关专家根据历史告警数据所总结的专家经验来实现。例如，通过对历史告警数据统计后，发现引起退服告警的原因大致有以下三类：

①设备层面：例如设备故障、网元异常等引起退服；

②业务层面：例如省内测试、载波调度等引起退服；

③人为因素：例如市电停电、物业纠纷等引起退服。

其中业务层面、人为因素等非网络自身原因引起的退服告警数据对模型训练预测会造成极大干扰。因此为了提升模型的有效性，将可能影响预测模型的告警数据定义为无效告警数据或异常告警数据，需要对其进行剔除。

相应地，本实施例中，所述异常告警数据包括但不限于：部分省内测试导致的告警的数据、不影响网络质量的告警的数据、每日夜间节电基站发生的告警的数据、载波调度时段内部分基站发生闪断的告警的数据。

步骤S023'：对所述有效告警数据进行聚合排序，并根据聚合排序后的告警数据生成告警序列。

需要说明的是，所谓聚合排序，可以是按照一定的规则(例如基站名称)对告警数据进行聚合，划分成不同的数据组；然后对这些数据组按照一定的顺序(例如告警发生的时间)进行排序的过程。

进一步地，考虑到退服告警预测的对象都是网络基站，而不同的网络基站的告警规律可能并不相同，因此通过每个基站的历史告警数据对该基站将来的退服告警情况进行预测，能够使得预测结果更加准确、客观且具有针对性。因此，本实施例中，可将所述有效告警数据按基站标识聚合为不同的告警数据组；然后对各所述告警数据组中的告警数据按告警发生时间的先后顺序进行排序，获得排序后的告警数据组；再根据所述排序后的告警数据组生成告警序列。其中，所述基站标识可以是基站名称或者基站ID等。

需要说明的是，为了保持数据的一致性，需要对每个告警数据组的告警时间范围进行统一。具体可先统计每个告警数据组中告警发生的最早日期D_first和最晚日期D_last，然后根据最早日期D_first和最晚日期D_last来确定告警时间范围。在告警时间范围统一后，即可对各告警数据组中的告警数据按告警发生时间的先后顺序进行排序，获得排序后的告警数据组，然后以小时为粒度，统计对排序后的告警数据组进行进一步的划分，同时对无告警数据的小时时段使用零值进行填充(即缺失项填充)，最后再根据填充后的告警数据组生成告警序列。

进一步地，为保证告警组中告警数据的时间跨度不至于太大，本实施例中可以以所述排序后的告警数据组中的每一个退服告警为中心，将预设时间范围内的告警数据作为所述退服告警对应的告警组，然后将所有退服告警对应的告警组合并以获得告警序列。例如，可以以每一个退服告警为中心，取其之前7天和之后2天，共十天的所有告警数据按顺序排列作为一个告警组，然后将所有基站的告警组合并，生成包含退服告警及其先后发生的同站告警的告警序列。当然，此处告警组的获取方式仅做举例，并不表示具体限定。

步骤S024'：根据所述告警序列构建基站告警编码语料库。

在获得上述告警序列后，即可根据上述告警序列构建基站告警编码语料库。

步骤S03'：基于所述基站告警编码语料库对初始word2vec模型进行迭代训练，获得预设word2vec模型。

应理解的是，在基站告警编码语料库构建完成后，即可基于基站告警编码语料库中的告警序列对初始word2vec模型进行迭代训练，以获得训练后的word2vec模型。

本实施例利用基站级别的故障、性能、动环告警等历史告警数据，对历史告警数据进行序列化和基于word2vec的词向量建模分析，全面挖掘了次要告警和退服告警数据的内在关联关系，提高了退服告警预测的准确性。

此外，本发明实施例还提出一种存储介质，所述存储介质上存储有基站退服告警预测程序，所述基站退服告警预测程序被处理器执行时实现如上文所述的基站退服告警预测方法的步骤。

参照图10，图10为本发明基站退服告警预测装置第一实施例的结构框图。

如图10所示，本发明实施例提出的基站退服告警预测装置包括：

数据获取模块101，用于获取待预测基站在预设时段内的历史运维数据；

向量编码模块102，用于根据所述历史运维数据中的告警数据进行词向量编码，获得告警特征序列；

窗口采样模块103，用于通过预设滑动窗口对所述告警特征序列进行滑动采样，获得初始告警样本；

特征添加模块104，用于根据所述历史运维数据为所述初始告警预测样本添加特征，获得告警预测样本；

告警预测模块105，用于通过预设退服告警预测模型根据所述告警预测样本进行基站退服告警预测。

进一步地，本发明基站退服告警预测装置的其他实施例或具体实现方式可参照上述各方法实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基站退服告警预测方法，其特征在于，所述基站退服告警预测方法包括：

获取待预测基站在预设时段内的历史运维数据；

2.如权利要求1所述的基站退服告警预测方法，其特征在于，所述根据所述历史运维数据中的告警数据进行词向量编码，获得告警特征序列的步骤，包括：

对所述告警词向量进行编码，获得告警特征序列。

3.如权利要求2所述的基站退服告警预测方法，其特征在于，所述告警词向量包含退服告警词向量和非退服告警词向量；

根据所述词向量相似度计算所述待预测基站的告警编码值；

根据所述告警编码值生成告警特征序列。

4.如权利要求3所述的基站退服告警预测方法，其特征在于，所述根据所述告警编码值生成告警特征序列的步骤，包括：

5.如权利要求1至4任一项所述的基站退服告警预测方法，其特征在于，所述根据所述历史运维数据为所述初始告警预测样本添加特征，获得告警预测样本的步骤，包括：

6.如权利要求1至4任一项所述的基站退服告警预测方法，其特征在于，所述预设退服告警预测模型包括：预设XGBoost模型和预设Lightgbm模型；

7.如权利要求6所述的基站退服告警预测方法，其特征在于，所述获取待预测基站在预设时段内的历史运维数据的步骤之前，所述方法还包括：

8.如权利要求7所述的基站退服告警预测方法，其特征在于，所述初始XGBoost模型和所述初始Lightgbm模型中的二分类交叉熵损失函数为：

9.如权利要求1至4任一项所述的基站退服告警预测方法，其特征在于，所述获取待预测基站在预设时段内的历史运维数据的步骤之前，还包括：

获取不同基站的历史运维数据；

10.如权利要求9所述的基站退服告警预测方法，其特征在于，所述根据所述不同基站的历史运维数据构建基站告警编码语料库的步骤，包括：

对所述原始告警数据进行预处理，获得有效告警数据；

根据所述告警序列构建基站告警编码语料库。

11.如权利要求10所述的基站退服告警预测方法，其特征在于，所述对所述原始告警数据进行预处理，获得有效告警数据的步骤，包括：

12.如权利要求10所述的基站退服告警预测方法，其特征在于，所述对所述对所述有效告警数据进行聚合排序，并根据聚合排序后的告警数据生成告警序列的步骤，包括：

将所述有效告警数据按基站标识聚合为不同的告警数据组；

根据所述排序后的告警数据组生成告警序列。

13.如权利要求12所述的基站退服告警预测方法，其特征在于，所述根据所述排序后的告警数据组生成告警序列的步骤，包括：

将所有退服告警对应的告警组合并，以获得告警序列。

14.一种基站退服告警预测装置，其特征在于，所述基站退服告警预测装置包括：

15.一种基站退服告警预测设备，其特征在于，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基站退服告警预测程序，所述基站退服告警预测程序配置为实现如权利要求1至13中任一项所述的基站退服告警预测方法的步骤。

16.一种存储介质，其特征在于，所述存储介质上存储有基站退服告警预测程序，所述基站退服告警预测程序被处理器执行时实现如权利要求1至13任一项所述的基站退服告警预测方法的步骤。