CN112888008B

CN112888008B - 基站异常检测方法、装置、设备及存储介质

Info

Publication number: CN112888008B
Application number: CN202110029166.6A
Authority: CN
Inventors: 张柯楠; 赵振崇
Original assignee: Shenzhen ZNV Technology Co Ltd; Nanjing ZNV Software Co Ltd
Current assignee: Shenzhen ZNV Technology Co Ltd; Nanjing ZNV Software Co Ltd
Priority date: 2021-01-08
Filing date: 2021-01-08
Publication date: 2023-05-26
Anticipated expiration: 2041-01-08
Also published as: CN112888008A

Abstract

本申请公开一种基站异常检测方法、装置、设备及存储介质，方法包括：获取多个不同区域的基站在设定时间内的告警信息和设备特征信息；将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合；将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合；基于所述告警信息关联集合和所述异常特征基站集合分析基站的工作状态。本申请旨在解决现有主要依靠人工路测和采集到的告警信息对基站是否异常做出判断，该传统手段效率低下的问题。

Description

基站异常检测方法、装置、设备及存储介质

技术领域

本申请涉及基站检测领域，尤其涉及一种基站异常检测方法、装置、设备及存储介质。

背景技术

目前的基站异常检测手法较为单一，主要依靠人工路测和采集到的告警信息对基站是否异常做出判断，该传统手段效率低下，而导致无法及时处理异常基站，影响用户体验。

上述内容仅用于辅助理解本申请的技术方案，并不代表承认上述内容是现有技术。

发明内容

本申请实施例提供一种基站异常检测方法、装置、设备及存储介质，旨在解决现有主要依靠人工路测和采集到的告警信息对基站是否异常做出判断，该传统手段效率低下的问题。

本申请实施例提供了一种基站异常检测方法，包括：

获取多个不同区域的基站在设定时间内的告警信息和设备特征信息；

将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合；将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合；

基于所述告警信息关联集合和所述异常特征基站集合分析基站的工作状态。

在一些实施例中，所述将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合，包括：

对缺失重要特征数据的告警信息进行摘除，对缺失非重要特征数据的告警信息进行均值填充；

选取经过摘除和填充的有效告警信息，并根据时间进行排序；

将所述有效告警信息输入至少两个关联算法，判断所述至少两个关联算法的计算结果是否符合经验值；

若符合经验值，则将所述至少两个关联算法的计算结果取并集得出属于频繁序列或频繁项集的不同基站的告警信息关联集合。

在一些实施例中，基站异常检测方法还包括：

若不符合经验值，则重新设置所述至少两个关联算法的可信度和支持度进行重新计算，直到所述至少两个关联算法的计算结果符合经验值。

在一些实施例中，所述至少两个关联算法至少包括：FP-Growth算法、prefixSpan算法以及Apriori算法中的至少两个关联算法。

在一些实施例中，所述将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合，包括：

对缺失重要特征数据的设备特征信息进行摘除，对缺失非重要特征数据的设备特征信息进行均值填充；

选取经过摘除和填充的有效设备特征信息，将所述有效设备特征信息输入分布式t-sne降维算法，得出降维后的设备特征信息，并将降维后的设备特征信息通过普里姆算法评估降维后的设备特征信息是否聚集，在特征散点图查找并得出具有异常的设备特征信息的异常特征基站集合；

判断得出的异常特征基站集合中的异常特征基站是否符合预期；

若符合预期，则输出具有异常的设备特征信息的异常特征基站集合。

在一些实施例中，基站异常检测方法还包括：若不符合预期，则重新设置所述分布式t-sne降维算法的困惑度、学习速率、迭代次数中的至少一种参数，直到得出的异常特征基站集合中的异常特征基站符合预期。

在一些实施例中，所述将所述有效设备特征信息输入分布式t-sne降维算法，得出降维后的设备特征信息，包括：

获取有效设备特征信息；

设置初始化低维数据、迭代次数、学习速率以及动量；

基于所述有效设备特征信息计算高维空间分布概率；

基于所述有效设备特征信息计算低维空间分布概率；

基于所述高维空间分布概率和所述低维空间分布概率计算梯度；

根据所述初始化低维数据、所述迭代次数、所述学习速率、所述动量以及所述梯度计算得到降维后的设备特征信息。

本申请提出一种基站异常检测装置，所述装置包括：

获取模块，用于获取多个不同区域的基站在设定时间内的告警信息和设备特征信息；

关联模块，用于将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合；

降维模块，用于将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合；

分析模块，用于基于所述告警信息关联集合和所述异常特征基站集合分析基站的工作状态。

本申请提出一种基站异常检测设备，所述设备包括处理器、与所述处理器电连接的存储器及存储在所述存储器上并可在所述处理器上运行的基站异常检测程序；所述基站异常检测程序被所述处理器执行时实现所述的基站异常检测方法的步骤。

本申请还提出一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现所述的基站异常检测方法中的步骤。

本申请的实施例通过获取多个不同区域的基站在设定时间内的告警信息和设备特征信息，将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合，将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合，最后基于所述告警信息关联集合和所述异常特征基站集合分析基站的工作状态。通过计算出属于频繁序列或频繁项集的不同基站的告警信息关联集合以及有异常的设备特征信息的异常特征基站集合，当异常基站发生某一告警信息时，维修人员根据告警信息关联集合中的其他的告警信息也可相应地检查与其他告警信息关联对应的基站硬件和软件设置，从而能够较为准确的判断和评估基站的工作状态，为排查问题站点提供方向，提高基站检测的工作效率。

附图说明

图1为本申请的基站异常检测设备的一实施例的硬件框架图；

图2为本申请的基站异常检测方法的一实施例的流程框图；

图3为图2中步骤S210的一实施例的流程框图；

图4为图2中步骤S210的另一实施例的流程框图；

图5为图2中步骤S220的一实施例的流程框图；

图6为图2中步骤S220的另一实施例的流程框图；

图7为图5或图6中步骤S222的一实施例的流程框图；

图8为本申请的基站异常检测装置的一实施例的模块示意图。

具体实施方式

为了更好的理解上述技术方案，下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

关联算法：关联就是把两个或两个以上在意义上有密切联系的项组合在一起。关联规则：用于从大量数据中挖掘出有价值的数据项之间的相关关系。

项集：是指若干个项的集合。频繁模式是指数据集中频繁出现的项集、序列或子结构。频繁项集是指支持度大于等于最小支持度(min_sup)的集合。其中支持度是指某个集合在所有事务中出现的频率。

序列数据：由若干数据项集组成的序列。如果某个序列A所有的项集在序列B中的项集都可以找到，则A就是B的子序列。频繁序列：频繁出现的子序列。

因此，当前需要解决现有主要依靠人工路测和采集到的告警信息对基站是否异常做出判断，该传统手段效率低下的问题。鉴于此，本申请提出一种基站异常检测方法、装置、设备及存储介质。

请参照图1，下面介绍一种基站异常检测设备，该基站异常检测设备可以包括：处理器1001，例如CPU，存储器1005，用户接口1003，网络接口1004，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选包括无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中出示的基站异常检测设备结构并不构成对基站异常检测设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基站异常检测程序。其中，操作系统是管理和控制基站异常检测设备硬件和软件资源的程序，支持基站异常检测程序以及其它软件或程序的运行。

在图1所示的基站异常检测设备中，网络接口1004主要用于后台服务器，与后台服务器进行数据通信；处理器1001可以用于调用存储器1005中存储的基站异常检测程序，并执行如上所述的基站异常检测方法的步骤。

在一实施例中，处理器1001可以用于调用存储器1005中存储的基站异常检测程序，并执行以所述方法包括：

所述将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合，包括：

基站异常检测方法还包括：

所述至少两个关联算法至少包括：FP-Growth算法、prefixSpan算法以及Apriori算法中的至少两个关联算法。

所述将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合，包括：

基站异常检测方法还包括：若不符合预期，则重新设置所述分布式t-sne降维算法的困惑度、学习速率、迭代次数中的至少一种参数，直到得出的异常特征基站集合中的异常特征基站符合预期。

所述将所述有效设备特征信息输入分布式t-sne降维算法，得出降维后的设备特征信息，包括：

获取有效设备特征信息；

设置初始化低维数据、迭代次数、学习速率以及动量；

基于所述有效设备特征信息计算高维空间分布概率；

基于所述有效设备特征信息计算低维空间分布概率；

本申请的基站异常检测设备通过获取多个不同区域的基站在设定时间内的告警信息和设备特征信息，将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合，将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合，最后基于所述告警信息关联集合和所述异常特征基站集合分析基站的工作状态。通过计算出属于频繁序列或频繁项集的不同基站的告警信息关联集合以及有异常的设备特征信息的异常特征基站集合，当异常基站发生某一告警信息时，维修人员根据告警信息关联集合中的其他的告警信息也可相应地检查与其他告警信息关联对应的基站硬件和软件设置，从而能够较为准确的判断和评估基站的工作状态，为排查问题站点提供方向，提高基站检测的工作效率。

请参照图2，基于上述基站异常检测设备硬件架构，下面提出本申请的基站异常检测方法的实施例一，所述基站异常检测方法包括以下步骤：

S100、获取多个不同区域的基站在设定时间内的告警信息和设备特征信息；

具体地，不同区域的基站可以是一个地级市范围内所有不同区域的基站。设定时间内可以根据实际的需要设置，例如，设定时间可以是一个小时，一天或者一周等。

告警信息可以包括各种基站常见的告警信息。例如processor failure(处理器故障告警)、hard reset(复位困难告警)、transmitter synthesizer failure(发射合成器故障告警)、power supply failure(停电告警)等。此外，值得一提的是，告警信息一次可包括一个或多个。例如告警信息可能只包括处理器故障告警，或者可能同时包括处理器故障告警、复位困难告警和发射合成器故障告警。当发生多个同时报警基站说明存在多项故障需要维修人员进行维修。

设备特征信息是反映基站的特征指标。具体地，设备特征信息可包括温度，高度，锚点方位角，电子下倾角、机械下倾角，覆盖率，连接建立成功率，单用户下行NR峰值速率，单用户上行NR峰值速率，平均告警级别，告警数量等。

S200、将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合；将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合；

具体地，步骤S200包括：步骤S210：将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合；以及步骤S220：将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合。应理解，本实施例中的步骤S210和步骤S220并行执行。

下面进一步描述步骤S210：将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合。

关联算法，又叫关联规则算法，关联规则就是支持度和信任度分别满足用户给定阈值的规则。将设定时间内的告警信息作为输入到至少两个关联算法中，根据至少两个关联算法的计算结果可得出属于频繁序列或频繁项集的不同基站的告警信息关联集合。其中至少两个关联算法可选用多种关联算法。例如至少两个关联算法包括：FP-Growth算法、prefixSpan算法以及Apriori算法中的至少两个关联算法。

例如，将基站A一天时间内的告警信息分别输入FP-Growth算法和prefixSpan算法。其中FP-Growth算法和prefixSpan算法的支持度可根据实际情况设置。比如设置支持度为50％。对于FP-Growth算法，可将一天时间内的告警信息全部输入FP-Growth算法得出符合支持度的频繁项集，例如基站A通过FP-Growth算法得到的频繁项集为{处理器故障告警}、{处理器故障告警、复位困难告警}、{处理器故障告警、复位困难告警、发射合成器故障告警}。重复上述方法可得到其他基站属于频繁项集的告警信息。

对于prefixSpan算法，可将基站A一天时间内的告警信息全部输入prefixSpan算法得出符合支持度的频繁序列。例如基站A通过prefixSpan算法得到的频繁序列为<处理器故障告警>、<处理器故障告警、停电告警>、<处理器故障告警、复位困难告警、发射合成器故障告警>。重复上述方法可得到其他基站属于频繁序列的告警信息。

那么通过综合FP-Growth算法和prefixSpan算法两种算法得到属于频繁序列或频繁项集的不同基站的告警信息关联集合为{处理器故障告警}、{处理器故障告警、复位困难告警}、{处理器故障告警、复位困难告警、发射合成器故障告警}、<处理器故障告警、停电告警>。因此通过综合至少两个关联算法算出设定时间内的属于频繁序列或频繁项集的不同基站的告警信息关联集合，相比通过单个算法的计算结果更加完善，有效性更强。

下面进一步描述步骤S220：将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合。

具体地，将不同基站设定时间内的设备特征信息进行特征降维。其中，这里的特征将维算法可采用多种，如sne降维算法、t-sne降维算法等。将降维后的设备特征信息进行可视化，得到特征散点图，从特征散点图中从提取设备特征信息异常的基站。

S300、基于所述告警信息关联集合和所述异常特征基站集合分析基站的工作状态。

基于步骤S210得到的属于频繁序列或频繁项集的不同基站的告警信息关联集合，以及根据步骤S220得到的具有异常的设备特征信息的异常特征基站集合，可得出异常基站对应的告警信息关联集合，当异常基站发生某一告警信息时，维修人员根据告警信息关联集合中的其他的告警信息也可相应地检查与其他告警信息关联对应的基站硬件和软件设置，从而能够较为准确的判断和评估基站的工作状态，为排查问题站点提供方向，提高基站检测的工作效率。例如得到的异常的设备特征信息的基站包括基站A，而基站A的处理器特征异常，通过得到的告警信息关联集合中发现与处理器故障告警相关联的告警包括发射合成器故障告警、停电告警和复位困难告警。因此维修人员就相应的检查基站A的发生发射合成器故障告警、停电告警和复位困难告警的对应的硬件和软件，准确的判断和评估基站的工作状态，为排查问题站点提供方向，提高基站检测的工作效率。

本实施例通过获取多个不同区域的基站在设定时间内的告警信息和设备特征信息，将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合，将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合，最后基于所述告警信息关联集合和所述异常特征基站集合分析基站的工作状态。通过计算出属于频繁序列或频繁项集的不同基站的告警信息关联集合以及有异常的设备特征信息的异常特征基站集合，当异常基站发生某一告警信息时，维修人员根据告警信息关联集合中的其他的告警信息也可相应地检查与其他告警信息关联对应的基站硬件和软件设置，从而能够较为准确的判断和评估基站的工作状态，为排查问题站点提供方向，提高基站检测的工作效率。

在一些实施例中，请参照图3，步骤S210具体包括如下步骤：

S211、对缺失重要特征数据的告警信息进行摘除，对缺失非重要特征数据的告警信息进行均值填充；

具体地，对缺失重要特征数据的告警信息进行摘除，例如可对缺少基站名称和基站所在地点的告警信息进行摘除，因为从这种告警信息无法得到发生告警的基站信息。对缺失非重要特征数据的告警信息进行均值填充，例如可以对缺乏发生时间的告警信息进行均值填充，例如统一填充12:00。由于缺乏非重要特征数据并不影响获知基站发生的告警信息，因此可以进行均值填充。

S212、选取经过摘除和填充的有效告警信息，并根据时间进行排序；

依照时间顺序对经过摘除和填充的有效告警信息进行排序。

S213、将所述有效告警信息输入至少两个关联算法，判断所述至少两个关联算法的计算结果是否符合经验值；

具体地，可以通过SQL语句的选择指令选取有效告警信息，对于关联算法，数据的预处理方式为聚合一天内或者一个小时内的所有告警信息。FP-growth算法输入数据可为无序状态，可直接输入list类型，输入格式为List<Object1>类型，其中Object1表示一天内或者一个小时内的所有告警信息。

PrefixSpan算法若有相同时间点的告警信息，需将相同时间点告警信息存放在一个list中作为输入list中的一个元素，比FP-growth算法多做一步聚合操作，输入类型需要预处理为List<List<Object2>>类型。Object2表示相同时间点发生的告警信息。例如同时发生的处理器故障告警和停电告警。

S214、若符合经验值，则将所述至少两个关联算法的计算结果取并集得出属于频繁序列或频繁项集的不同基站的告警信息关联集合。

具体地，若通过FP-growth算法算出的频繁项集的告警信息关联集合中存在10个告警信息。设置经验值为70％，例如10个告警信息中有7个以上符合预期则可以得出属于频繁序列或频繁项集的不同基站的告警信息关联集合。PrefixSpan算法的得出的频繁序列是否符合经验值的原理类似，在此不赘述。通过将FP-growth算法和PrefixSpan算法的计算结果取并集得到不同基站的告警信息关联集合。通过至少两个关联算法进行计算，有利于提高不同基站的告警信息关联集合的有效性。

另外，在一些实施例中，请参照图4，步骤S210还包括步骤S215、若不符合经验值，则重新设置所述至少两个关联算法的可信度和支持度进行重新计算，直到所述至少两个关联算法的计算结果符合经验值。

当经验值小于70％，说明FP-growth算法或PrefixSpan算法得出的频繁项集或频繁序列不符合预期，需要重新设置可信度和支持度进行重新计算，直到FP-growth算法或PrefixSpan算法的计算结果符合经验值。通过重新设置FP-growth算法或PrefixSpan算法的可信度和支持度，可对关联算法计算结果的有效性进一步优化，得到更符合期望的告警信息关联集合。

在一些实施例中，请参照图5，步骤S220具体包括如下步骤：

S221、对缺失重要特征数据的设备特征信息进行摘除，对缺失非重要特征数据的设备特征信息进行均值填充；

与步骤S211同理，对缺失重要特征数据的告警信息进行摘除，例如可对缺少基站名称和基站所在地点的设备特征信息进行摘除。对缺失非重要特征数据的设备特征信息进行均值填充，例如可以对缺乏发生时间的设备特征信息进行均值填充，例如统一填充12:00。

S222、选取经过摘除和填充的有效设备特征信息，将所述有效设备特征信息输入分布式t-sne降维算法，得出降维后的设备特征信息，并将降维后的设备特征信息通过普里姆算法评估降维后的设备特征信息是否聚集，在特征散点图查找并得出具有异常的设备特征信息的异常特征基站集合；

具体地，将所述有效设备特征信息输入分布式t-sne降维算法，得出降维后的设备特征信息，再使用普里姆算法评估降维后的设备特征信息是否聚集，即评估哪些是聚集的点，哪些是离散的点。并从特征散点图中离散的点(或者说非聚合点)得出具有异常的设备特征信息的异常特征基站。

例如，经过分布式t-sne降维算法出来的结果是基站A＝(0.1，0.2，0.3)，基站B＝(0.2，0.15，0.01)。那么经过普里姆算法得出来的结果就是基站A＝(0.1，0.2，0.3，1)；基站B＝(0.2，0.15，0.01，2)。新增的基站A的数字1表示经过普里姆算法得出来的基站A的分类，新增的基站B的数字2表示经过普里姆算法得出来的基站B的分类。若大部分基站都属于数字1所在的分类，数字2分类的基站即是离散的点。数字2分类的基站即是异常的设备特征信息的异常特征基站。通过将数字1分类的基站和数字2分类的基站在特征散点图上用不同的颜色区分，从而进一步找出离散的点，得出具有异常的设备特征信息的异常特征基站。

由于有效设备特征信息包括多种设备特征信息，通过降维后降低设备特征的个数，再使用普里姆算法评估降维后的设备特征信息是否聚集，便于从特征散点图查找并得出异常的设备特征信息，从而得出的异常特征基站集合。

S223、判断得出的异常特征基站集合中的异常特征基站是否符合预期；

S224、若符合预期，则输出具有异常的设备特征信息的异常特征基站集合。

通过分布式t-sne降维算法计算出异常特征基站后，还需判断得出的异常特征基站是否符合预期。要是得出的异常特征基站实际出现频繁告警，说明分布式t-sne降维算法计算结果准确。输出具有异常的设备特征信息的异常特征基站集合。

在一些实施例中，请参照图6，步骤S220还包括步骤S225:

若不符合预期，则重新设置所述分布式t-sne降维算法的困惑度、学习速率、迭代次数中的至少一种参数，直到得出的异常特征基站集合中的异常特征基站符合预期。通过设置分布式t-sne降维算法的困惑度、学习速率、迭代次数中的至少一种参数，可以提高分布式t-sne降维算法计算结果的准确性，进一步优化设备特征信息的降维结果。提高后续计算分布式t-sne降维算法的工作效率。

在一些实施例中，请参照图7，将所述有效设备特征信息输入分布式t-sne降维算法，得出降维后的设备特征信息，包括：

S2221、获取有效设备特征信息；

获取有效设备特征信息，X＝x₁,...x_n；其中x₁...x_n表示基站的各个设备特征信息。

S2222、设置初始化低维数据、迭代次数、学习速率以及动量；

初始化低维数据Y可通过随机分布初始化。设置迭代次数T，学习速率η，动量α(t)。

S2223、基于所述有效设备特征信息计算高维空间分布概率；

分布式t-sne降维算法是先将欧几里得距离转换为条件概率来表达点与点之间的相似度。具体来说，给定一组n个高维的有效设备特征信息X＝x₁,...x_n。分布式t-sne降维算法首先是计算高维空间分布概率p_j|i，高维空间分布概率正比于数据点x_i与x_j之间的相似度，x_i与x_j越相似，概率值p_j|i越大。在本算法中，使用高维欧几里得距离表示相似性的高维空间分布概率p_j|i：

参数是σ_i，对于不同的点x_i取值不一样，通常取值为以数据点x_i为中心的高斯均方差。为了确定不同数据点x_i对应的σ_i，t-sne降维算法使用困惑度概念以及二分搜索方式寻求最优σ_i。困惑度公式如下：

分布式t-sne降维算法可以通过困惑度确定有效近邻点个数。

S2224、基于所述有效设备特征信息计算低维空间分布概率；

通过公式

计算低维空间分布概率q_j|i；

S2225、基于所述高维空间分布概率和所述低维空间分布概率计算梯度；

通过公式

计算梯度，其中p_j|i＝p_ij，q_j|i＝q_ij；

S2226、根据所述初始化低维数据、所述迭代次数、所述学习速率、所述动量以及所述梯度计算得到降维后的设备特征信息。

将迭代次数T，学习速率η，动量α(t)，梯度代入下面的公式：

并且从t＝1到迭代次数T，更新上述公式，得出的降维后的设备特征信息用Y^T＝y₁,…,y_n表示。需注意，当t＝1时，Y¹对应着步骤S322设置的初始化低维数据Y。此时Y^t-1，Y^t-2都等于0。

通过t-sne分布式编程，在二分搜索寻求σ_i时进行分布式加速。使用spark分布式矩阵计算，在进行大数据量概率矩阵求解时实现分布式提速。该分布式算法缓解降维算法固有的消耗内存的缺点。

请参照图8，本申请提出一种基站异常检测装置，所述装置包括：获取模块101、关联模块102、降维模块103、分析模块104。

获取模块101，用于获取多个不同区域的基站在设定时间内的告警信息和设备特征信息；

关联模块102，用于将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合；

降维模块103，用于将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合；

分析模块104，用于基于所述告警信息关联集合和所述异常特征基站集合分析基站的工作状态。

其中，基站异常检测装置的各个功能模块实现的步骤可参照本申请基站异常检测方法的各个实施例，此处不再赘述。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

应当注意的是，在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本申请可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种基站异常检测方法，其特征在于，包括：

将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合；

将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合；

其中，所述将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合，包括：

其中，所述将所述有效设备特征信息输入分布式t-sne降维算法，得出降维后的设备特征信息，包括：

获取有效设备特征信息；

设置初始化低维数据、迭代次数、学习速率以及动量；

基于所述有效设备特征信息计算高维空间分布概率；

基于所述有效设备特征信息计算低维空间分布概率；

根据所述初始化低维数据、所述迭代次数、所述学习速率、所述动量以及所述梯度计算得到降维后的设备特征信息；

2.根据权利要求1所述的方法，其特征在于，所述将所述告警信息输入至少两个关联算法，根据所述至少两个关联算法的计算结果得出属于频繁序列或频繁项集的不同基站的告警信息关联集合，包括：

3.根据权利要求2所述的方法，其特征在于，还包括：

4.根据权利要求1-3任一项所述的方法，其特征在于，所述至少两个关联算法包括：FP-Growth算法、prefixSpan算法以及Apriori算法中的至少两个关联算法。

5.根据权利要求1所述的方法，其特征在于，在所述将所述设备特征信息进行特征降维得到具有异常的设备特征信息的异常特征基站集合之后，还包括：

6.根据权利要求5所述的方法，其特征在于，还包括：

若不符合预期，则重新设置所述分布式t-sne降维算法的困惑度、学习速率、迭代次数中的至少一种参数，直到得出的异常特征基站集合中的异常特征基站符合预期。

7.一种基站异常检测装置，其特征在于，所述装置包括：

还用于对缺失重要特征数据的设备特征信息进行摘除，对缺失非重要特征数据的设备特征信息进行均值填充；

还用于获取有效设备特征信息；

设置初始化低维数据、迭代次数、学习速率以及动量；

基于所述有效设备特征信息计算高维空间分布概率；

基于所述有效设备特征信息计算低维空间分布概率；

8.一种基站异常检测设备，其特征在于，所述设备包括处理器、与所述处理器电连接的存储器及存储在所述存储器上并可在所述处理器上运行的基站异常检测程序；所述基站异常检测程序被所述处理器执行时实现如权利要求1至6任一项所述的基站异常检测方法的步骤。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如权利要求1至6中任一项所述的基站异常检测方法中的步骤。