WO2019179457A1

WO2019179457A1 - 一种确定网络设备的状态的方法及装置

Info

Publication number: WO2019179457A1
Application number: PCT/CN2019/078832
Authority: WO
Inventors: 高云鹏; 谢于明; 肖欣; 张亮
Original assignee: 华为技术有限公司
Priority date: 2018-03-22
Filing date: 2019-03-20
Publication date: 2019-09-26
Also published as: US20210006481A1; EP3761566A1; US11405294B2; CA3094557A1; CA3094557C; KR20200128144A; JP7081741B2; KR102455332B1; CN110300008A; CN110300008B; EP3761566A4; RU2020134150A; RU2020134150A3; EP3761566B1; JP2021516511A

Abstract

一种确定网络设备的状态的方法及装置，用以解决现有技术中确定网络设备的状态的准确性较低的问题。预警分析设备获取预设时长内网络设备的多个目标关键绩效指标KPI数据，以及获取多个特征信息，根据每个特征信息对所述多个目标KPI数据进行处理，生成每个特征信息对应的元素，并将生成的所述多个特征信息对应的元素组成所述特征向量，并根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态。这样，通过分析一段时间内的多个目标KPI数据来确定网络设备的状态，而不仅仅通过一个时刻的数据来确定所述网络设备的状态，可以使得确定的网络设备的准确性较高，从而可以减少预警的遗漏。

Description

一种确定网络设备的状态的方法及装置

本申请要求于2018年03月22日提交中国国家知识产权局、申请号为201810241478.1、申请名称为“一种确定网络设备的状态的方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及通信技术领域，尤其涉及一种确定网络设备的状态的方法及装置。

背景技术

随着通信技术的不断发展，网络系统的复杂性日益增加，网络设备的可靠性问题来带的维护成本变得越来越大，因此，为了减少网络设备出现故障之后再去维护而造成的成本较大的问题，可以在网络设备出现故障隐患即将出现故障时进行预警，因此监控网络设备的状态尤为重要。

目前，在现有的网络系统运维中，通常针对网络设备的业务性能数据建立阈值报警体系，通过设置不同的阈值范围监控网络上设备的状态。具体的，在某个时刻通过判断网络设备的业务性能数据指标值所属的设定阈值范围对应的状态，确定该网络设备的当前状态。

但是在实际中，例如，一个处于故障隐患状态的网络设备在工作时，可能在某一时刻处于正常工作状态，在另一时刻处于故障隐患状态。所以，显然，在上述方法中，对于一个存在故障隐患的网络设备，如果在该网络设备处于正常工作状态的时刻只会判断该网络设备正常，不能识别到该网络设备有故障隐患，而导致遗漏预警。因此，上述方法确定网络设备的状态的准确性较低。

发明内容

本申请提供一种确定网络设备的状态的方法及装置，用以解决现有技术中确定网络设备的状态的准确性较低的问题。

第一方面，本申请提供了一种确定网络设备的状态的方法，该方法包括：

预警分析设备获取预设时长内网络设备的多个目标关键绩效指标(key performance indicators，KPI)数据，以及获取多个特征信息，根据每个特征信息对所述多个目标KPI数据进行处理，生成每个特征信息对应的元素，并将生成的所述多个特征信息对应的元素组成所述特征向量，并根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态；其中，任一个特征信息用于表征特征向量中所述特征信息对应的元素的计算方式。

上述方法，通过分析一段时间内的多个目标KPI数据来确定网络设备的状态，而不仅仅通过一个时刻的数据来确定所述网络设备的状态，可以使得确定的网络设备的准确性较高，从而可以减少预警的遗漏。

在一种可能的设计中，所述预警分析设备在根据预设的预警分析模型，对所述特征向量进行分析之前，需要生成所述预警分析模型，具体方法可以为：所述预警分析设备获取所述网络设备的不同状态对应的特征向量样本，并对每种状态以及该网络设备状态对应的特征向量样本进行逻辑回归处理，得到所述预警分析模型。

通过上述方法，所述预警分析设备可以生成所述预警分析模型，以使所属预警分析设备后续根据所述预警分析模型确定所述网络设备的状态。

在一种可能的设计中，所述预警分析设备根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态，具体方法可以为：所述预警分析设备根据所述预警分析模型，对所述特征向量进行分析，确定所述网络设备处于每种状态的概率值，将每个概率值与预设的该概率值对应的状态的基准值相乘，得到多个乘积值；然后所述预警分析设备将所述多个乘积值相加，得到状态指示值，并确定所述状态指示值所属的设定指示值范围，将所述设定指示值范围对应的状态作为所述网络设备的状态。

通过上述方法，所述预警分析设备可以准确地确定所述网络设备的状态，以使后续根据所述网络设备的状态进行相应地维护。

在一种可能的设计中，所述预警分析设备获取所述预设时长内网络设备的多个目标KPI数据，具体方法可以为：所述预警分析设备接收网管设备持续发送的所述网络设备的KPI数据，并从接收的所述KPI数据中，获取所述预设时长内的多个目标KPI数据。

通过上述方法，所述预警分析可以根据实际需求获取预设时长内多个目标KPI数据，以使所述预警分析设备后续根据所述多个KPI数据确定特征向量。

在一种可能的设计中，所述网络设备可以但不限于为波分设备、路由器、分组传送网设备等。这样，所述预警分析设备可以确定多种网络设备的状态，以使对不同的网络设备进行相应地维护。

在一种可能的设计中，所述预警分析设备在确定了所述网络设备的状态后，可以将确定的所述网络设备的状态通过可视化展示设备展示给用户，以使用户能准确地识别所述网络设备的当前状态，从而根据所述网络设备的状态进行相应维护。

第二方面，本申请还提供了一种预警分析设备，该预警分析设备具有实现上述方法实例中预警分析设备的功能。所述功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中，所述预警分析设备的结构中包括获取单元和处理单元，这些单元可以执行上述方法示例中的相应功能，具体参见方法示例中的详细描述，此处不做赘述。

在一个可能的设计中，所述预警分析设备的结构中包括存储器和处理器，可选的还包括通信接口，所述通信接口用于与网络系统中的其他设备进行通信交互，所述处理器被配置为支持所述预警分析设备执行上述方法中相应的功能。所述存储器与所述处理器耦合，其保存所述预警分析设备必要的程序指令和数据。

第三方面，本申请还提供了一种网络系统，所述网络系统中包括网络设备层、网管层、预警分析层和可视化展示层，具体包括上述设计中提及的预警分析设备、网络设备和网管设备和可视化展示设备。

第四方面，本申请还提供了一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令在被所述计算机调用时用于使所述计算机执行上述任一种方法。

第五方面，本申请还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一种方法。

第六方面，本申请还提供了一种芯片，所述芯片与存储器相连，用于读取并执行所述存储器中存储的程序指令，以实现上述任一种方法。

附图说明

图1为本申请提供的一种网络系统的架构示意图；

图2为本申请提供的一种确定网络设备的状态的方法的流程图；

图3为本申请提供的一种去除纠前误码率异常点的示意图；

图4为本申请提供的一种预警分析模型的生成过程的示意图；

图5为本申请提供的一种预警分析设备的结构示意图；

图6为本申请提供的一种预警分析设备的结构图。

具体实施方式

下面将结合附图对本申请作进一步地详细描述。

本申请实施例提供一种确定网络设备的状态的方法及装置，用以解决现有技术中确定网络设备的状态的准确性较低的问题。其中，本申请所述方法和装置基于同一发明构思，由于方法及装置解决问题的原理相似，因此装置与方法的实施可以相互参见，重复之处不再赘述。

以下，对本申请中的部分用语进行解释说明，以便于本领域技术人员理解。

1)、网络设备，是为用户提供业务服务的设备，所述网络设备可以有多种状态，例如正常工作状态、低风险状态、高风险状态、故障状态等等，其中，所述低风险状态和所述高风险状态均可以认为是故障隐患状态。所述网络设备可以但不限于为波分设备、路由器、分组传送网设备等。

2)、预警分析设备，是通过分析网络设备的KPI数据来确定所述网络设备的状态的设备。所述预警分析设备可以为一个服务器，或者为多个服务器组成的集群。

3)、网管设备，是用于采集网络设备的KPI数据，并将采集的所述KPI数据传送给预警分析设备的设备。

4)、KPI数据，是用于表征网络设备的业务性能的数据，不同的网络设备的KPI数据不同。

5)、本申请实施例涉及的多个，是指两个或两个以上。

为了更加清晰地描述本申请实施例的技术方案，下面结合附图，对本申请实施例提供的确定网络设备的状态的方法及装置进行详细说明。

图1示出了本申请实施例提供的确定网络设备的状态的方法适用的一种可能的网络系统的架构，所述网络系统的架构中包括网络设备层、网管层、预警分析层和可视化展示层，其中：

所述网络设备层包括多个网络设备，分别为用户提供不同的业务服务。例如，所述网络设备层可以包括波分设备、路由器、分组传送网设备等网络设备。

所述网管层包括多个网管设备，用于采集网络设备层中任一个网络设备的KPI数据，并将采集的所述KPI数据传输至所述预警分析层，以使所述预警分析层中的预警分析设备分析对所述KPI数据进行分析以确定所述网络设备的状态。其中，所述网管层可以通过标准的公共对象请求代理体系结构(common object request broker architecture，CORBA)北向接口从所述网络设备层中采集网络设备的KPI数据；然后，所述网管层可以通过文件传输协议(file transfer protocol，FTP)将采集的所述网络设备的所述KPI数据发送给所述预警分析层。

所述预警分析层包括预警分析设备，所述预警分析设备可以为一个服务器，或者为多个服务器组成的集群。所述预警分析层中的预警分析设备通过分析所述网管层传输的KPI数据来确定对应的网络设备的状态，并将确定的所述网络设备的状态通过所述可视化展示层向用户展示。

所述可视化展示层用于实现人机交互。所述可视化展示层中包括至少一个可视化展示设备，用户可以通过所述可视化展示层中的所述至少一个可视化展示设备展示的任一个网络设备的状态，来识别所述网络设备的业务可靠性，并针对所述网络设备的不同状态进行相应的维护。例如，当确定所述网络设备处于故障隐患状态时，可以提前对所述网络设备进行相应维护，以避免所述网络设备出现故障而导致业务中断，这样可以提高用户业务体验。

本申请实施例提供的一种确定网络设备的状态的方法，适用于如图1所示的网络系统。参阅图2所示，该方法的具体流程包括：

步骤201、预警分析设备获取预设时长内网络设备的多个目标KPI数据。

在一种可选的实施方式中，所述预警分析设备执行步骤201时，具体方法可以为：所述预警分析设备接收网管设备持续发送的所述网络设备的KPI数据，如图2中的步骤200所示；然后所述预警分析设备从接收的所述KPI数据中，获取所述预设时长内的所述多个KPI数据。具体的，所述预设时长可以是所述预警分析设备每次接收到KPI数据的时刻起之前的预设时长。

在具体实现时，由于网络设备有多种，因此不同的网络设备有不同的KPI数据，而所述网络设备可以是波分设备、路由器、分组传送网设备等等中的任一种。

例如，所述网络设备是波分设备时，所述波分设备的KPI数据可以是纠前误码率和纠后误码率。其中，误码率指的是发生误码的位数与传输的总位数之比。可选的，误码率可以是纠前误码率或者纠后误码率。

前向纠错(forward error correction，FEC)算法可以检测出错误比特的数量，并且纠正其中一部分的错误，因此，使用FEC算法之前的误码率就是纠前误码率，而使用FEC算法纠错之后得到的误码率就是纠后误码率。

具体的，误码率可以通过一个是整数的误码参数来体现，比如说误码参数是6，那么代表的是误码率是10的-6次方；而误码率是0的时候代表没有误码，为了后续的分析，误码率为0时，可以通过误码参数13表示，即表示误码率是10的-13次方，表示接近于0。在这里，其它网络设备的KPI数据这里不再一一列举。

步骤202、所述预警分析设备获取多个特征信息，任一个特征信息用于表征特征向量中所述特征信息对应的元素的计算方式。

具体的，所述预警分析设备针对所述网络设备预设了分析所述网络设备的状态时所需的特征向量中每个元素对应的特征信息，因此所述预警分析设备在获取到所述多个目标KPI数据后，可以获取所述多个特征信息，以使所述预警分析设备可以准确执行后续步骤203。

仍以所述网络设备为波分设备为例进行说明，所述预警分析设备针对所述波分设备预设的特征向量中依次包括业务中断次数、KPI趋势劣化最差值、波动值最差值、波动值平均值、门限距离度最差值和门限距离度平均值。其中，业务中断次数、KPI趋势劣化最差值、波动值最差值、波动值平均值、门限距离度最差值和门限距离度平均值即可以认为是多个特征信息，这样可以采用大数据技术对KPI数据进行分析，来根据每个特征信息得到对应的元素，最终组成包含6个元素的特征向量。

例如，具体的，每个特征信息可以表征的对应元素的计算方式可以如下：所述预警分析设备可以根据所述波分设备的多个目标KPI数据中的多个纠后误码率判断出所述波分设备在预设时长内的每个采集点是否为故障，然后计算出在预设时长内的业务中断次数，所述业务中断次数可以为正整数；可以根据多个纠前误码率计算出所述波分设备在预设时长内的每个采集点的波动值、KPI趋势值和门限距离度，再根据波动值计算在预设时长内的波动值最差值和波动值平均值，根据门限距离度计算在预设时长内的门限距离度最差值和门限距离度平均值，这四个特征值取值可以是在[0,100]的正实数，根据KPI趋势值计算出在预设时长内的KPI趋势值最差值，即得到KPI趋势劣化最差值，所述KPI趋势劣化最差值可以取值为任意实数。

其中，每个特征信息表征的计算方式中所述的预设时长可以相同，即为所述预设时长；也可以是不相同的时长，具体可以是所述预设时长中的一部分时长，例如，获取所述多个目标KPI的所述预设时长可以是30天，而业务中断次数涉及的预设时长可以是30天，波动值最差值、波动值平均值、门限距离度最差值和门限距离度平均值涉及的预设时长可以是1天，KPI趋势劣化最差值涉及的预设时长可以是7天，其中1天和7天均是所述预设时长30天中的一部分时长。

步骤203、所述预警分析设备根据每个特征信息对所述多个目标KPI数据进行处理，生成每个特征信息对应的元素。

在一种可选的实施方式中，所述预警分析设备根据每个特征信息对所述多个目标KPI数据进行处理，生成每个特征信息对应的元素，具体可以根据每个特征信息表征的该特征信息对应的元素的计算方式，得到该元素。

例如，仍以所述网络设备为波分设备为例进行说明，结合步骤202中的描述，具体对每个元素的计算得到过程进行如下说明：

A、业务中断次数：

首先，所述预警分析设备通过纠后误码率(记为aft)来判断波分设备是否为故障，故障记为f，f的计算方法可以如以下公式一所示：

其中，aft等于13(即纠后误码率为0)时，f为1表示波分设备故障，即业务中断；aft不等于13时，f为0表示波分设备未故障，即业务未中断；其中，具体的，公式2中描述的13，为体现纠后误码率为0时的误码参数为13；

然后，所述预警分析设备计算出所述波分设备在预设时长内(可以为30天)发生业务中断的次数，记业务中断次数为fault，fault的计算方法可以如以下公式二所示：

B、波动值最差值和波动值平均值：

具体的，所述预警分析设备可以先对所述波分设备的多个纠前误码率的异常值和噪声部分进行处理，计算出多个纠前误码率在第一预设时长内(可以为30天)的稳态值，并实时计算当前时刻点的纠前误码率与稳态值的距离，根据距离的远近判断波动值，最后计算出第二预设时长内(可以为1天)每个点的波动值的最差值和平均值。具体的计算过程可以如下：

所述预警分析设备具体可以采用3西格玛(sigma，σ)原则去除多个纠前误码率数据的异常点，如图3所示，在[u-3σ,u+3σ]之外的纠前误码率数据为异常点，其中u为纠前误码率的期望值；以及，所述预警分析设备可以采用性能评价进程代数(ferformance evaluation process algebra，FEPA)算法分析方法去除所述多个纠前误码率的噪声，然后所述预警分析设备对预设时长内去除异常点和噪声后的多个纠前误码率计算平均值，得到稳态值；之后所述预警分析设备根据每个采样点的纠前误码率与稳态值的差值计算每个采样点的波动值dev，具体可以采用以下公式三：

其中，公式三中x为每个采样点的纠前误码率，

为稳态值；最后根据得到的每个点的波动值，计算预设时长内的波动值最差值dev_min，和波动值平均值dev_avg，具体可以分别采用以下公式四和公式五：

dev_min＝min(dev ₁,dev ₂,dev ₃...dev _n) 公式四；

其中上述公式四和公式五中的n为预设时长内纠前误码率的采样个数。

C、门限距离度最差值和门限距离度平均值：

具体的，所述预警分析设备配置所述波分设备本身所能支持的纠前误码率门限，当纠前误码率高于所述波分设备的硬件特性门限时，纠前误码率与所述硬件特性门限越近，所述波分设备的可靠性越差，此时所述波分设备的门限距离度S如以下公式六所示；当纠前误码率低于所述硬件特性门限时，该设备的门限距离度为0，如公式六所示：

其中，公式六中x为纠前误码率，x _max为预设时长内纠前误码率的最大值，v为所述硬件特性门限；

然后，所述预警分析设备计算预设时长内的门限距离度最差值S_min和门限距离度平均值S_avg，分别采用如下公式七和公式八：

S_min＝min(S ₁,S ₂,S ₃...S _m) 公式七；

其中，公式八和公式九中的m为预设时长内纠前误码率的采样个数。

D、KPI趋势劣化最差值：

具体的，所述预警分析设备对预设时长内(可以为7天)的KPI数据进行指数加权移动平均值(exponentially weighted moving average，EWMA)处理，然后做线性拟合处理，得到所述KPI趋势劣化最差值，记为slope。

通过上述方法，可以得到每个特征信息对应的元素，从而可以得到所述特征向量。

步骤204、所述预警分析设备将生成的所述多个特征信息对应的元素组成所述特征向量，并根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态。

具体的，通过上述步骤203可以得到组成所述特征向量的多个元素，所述预警分析可直接将所述多个元素组成所述特征向量。例如，以所述网络设备为波分设备为例，通过上述步骤203中举例中得到的所述波分设备涉及的多个特征信息对应的元素fault、slope、dev_avg、dev_min、S_avg、S_min，所述预警分析设备可以组成特征向量T＝{fault，slope，dev_avg，dev_min，S_avg，S_min}。进而，所述预警分析设备可以根据预设的预警分析模型，对所述特征向量进行分析，确定所述波分设备的状态。

在一种可选的实施方式中，所述预警分析设备在根据预设的预警分析模型，对所述特征向量进行分析之前，还要生成所述预警分析模型，具体的所属预警分析设备生成所述预警分析模型的过程可以为：所述预警分析设备获取所述网络设备的不同状态对应的特征向量样本；所述预警分析设备对每种状态以及该状态对应的特征向量样本进行逻辑回归处理，得到所述预警分析模型。

具体的，所述网络设备的状态可以包括正常工作状态(也可以称之为健康状态)、低风险状态、高风险状态、故障状态。例如，以波分设备为例，通过经验值知道：

所述波分设备处于正常工作状态时，对应的特征向量中，在预设时长内出现过故障，波分值最差值和波分值平均值、门限距离度最差值和门限距离度平均值都是90以上，KPI趋势劣化最差值大于0，这样对应所述正常工作状态的特征向量可以是{0,0.1,100,100,100,100}；

所述波分设备处于低风险状态时，对应的特征向量中，比所述波分设备处于正常工作状态时特征向量的值差一些，比如在预设时长内没有出现过故障或者只发生过一次故障，波动值最差值和波动值平均值、门限距离度最差值和门限距离度平均值都低于90，但是波动值平均值和门限距离度平均值都在70以上，KPI趋势劣化最差值是非负数，这样对应所述低风险状态的特征向量可以是{0,0.02,81.52,71.89,83.46,71}；

所述波分设备处于高风险状态时，对应的特征向量中，比所述波分设备处于低风险状态时特征向量的值差一些，比如在预设时长内发生故障的次数大于2，波动值平均值和门限距离度平均值都在70以下，KPI趋势劣化最差值小于0，这样对应所述高风险状态的特征向量可以是{5,-4.91,66.1,0,24.43,0}；

所述波分设备处于故障状态时，对应的特征向量中，在预设时长内出现故障的次数大于5，波动值最差值和波动值平均值都在40以下，门限距离度最差值和门限距离度平均值都是0，KPI趋势劣化最差值小于0，这样对应所述故障状态的特征向量可以是{8,-2.64,28.01,27.06,0,0}。

通过上述描述的已知的不同状态对应的特征向量，可以得知每种状态对应的特征向量样本，所述预警分析设备对每种状态以及该状态对应的特征向量样本基于逻辑回归算法进行模型训练，可以生成所述预警分析模型。具体的，所述预警分析模型的输入为网络设备的特征向量，输出结果为根据输入的特征向量所述网络设备被判定为处于每种状态的概率值，即可以得到多个概率值，从而可以基于所述多个概率值判断所述网络设备的状态。例如，所述波分设备对应的所述预警分析模型的生成过程可以如图4所示。

在一种可选的实施方式中，所述预警分析设备根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态，具体方法可以为：所述预警分析设备根据所述预警分析模型，对所述特征向量进行分析，确定所述网络设备处于每种状态的概率值，将每个概率值与预设的该概率值对应的状态的基准值相乘，得到多个乘积值；并将所述多个乘积值相加，得到状态指示值；所述预警分析设备确定所述状态指示值所属的设定指示值范围，将所述设定指示值范围对应的状态作为所述网络设备的状态。

例如，所述预警分析设备通过所述预设的预警分析模型对确定的特征向量进行分析，得到的多个概率值为{g1,g2,g3,g4}，其中g1为所述网络设备处于故障状态的概率，g2为所述网络设备处于高风险状态的概率，g3为所述网络设备处于低风险状态的概率，g4为所述网络设备处于正常工作状态的设备的概率。其中，每种状态对应一个基准值，上述四种状态对应的基准值可以分别记为h1，h2，h3，h4，其中每个基准值的均对应一个取值范围，例如，h1对应[9,10]，h2对应[6.5,7.5]，h3对应[2.5,3.5]，h4对应[0,0.5]。假设，在确定所述网络设备的状态的过程中，预设的每种状态对应的基准值分别为10,7,3,0，然后结合分析特征向量得到的所述网络上设备处于每种状态对应的概率值g1,g2,g3,g4，可以通过以下公式九得到所述状态指示值Z：

Z＝g1*10+g2*7+g3*3+g4*0 公式九；

进一步的，状态指示值所属的范围不同，对应的状态也不同，其中，状态指示值的取值在可以在[0,10]中，其中，配置第一中间值和第二中间值将所述状态指示值的取值分成三个范围，即[0，第一中间值)、[第一中间值，第二中间值]、(第二中间值， 10]，其中三个设定的指示值范围分别对应不同的状态。可选的，所述第一中间值可以在[6.8,7.2]中设定，所述第二中间值可以在[8,9]中设定，这样可以使得确定的网络设备的状态更加准确。

例如，如公式十所示：当得到Z后，当Z属于[0，第一中间值)时，确定所述网络设备处于正常工作状态；当Z属于[第一中间值，第二中间值]时，所述网络设备处于故障隐患状态(包括高风险状态和低风险状态)；当Z属于(第二中间值，10]时，所述网络设备处于故障状态。

这样通过上述方法，所述预警设备就可以通过确定所述状态指示值所属的设定指示值范围，进而确定所述设定指示值范围对应的状态，从而可以确定所述网络设备的状态。

在一种可选的实施方式中，所述预警分析设备在确定了所述网络设备的状态后，可以如图2中的步骤205所示，将确定的所述网络设备的状态通过可视化展示设备展示给用户，以使用户能准确地识别所述网络设备的当前状态，从而根据所述网络设备的状态进行相应维护。

在一种可选的实施方式中，所述预警分析设备可以根据实际需求判断最终确定的所述网络设备的状态是否是用户所急需了解的状态，而只向用户展示用户所关注的状态。例如，用户关注网络设备是否处于故障隐患状态，所述预警分析设备通过本申请实施例提供的方法确定了所述网络设备的状态之后，进一步确定所述网络设备是否处于故障隐患状态，当确定所述网络设备处于故障隐患状态时，将所述网络设备的状态展示给用户，这样可以使得用户提前在所述网络设备故障之前，对所述网络设备进行维护，避免所述网络设备出现故障而导致业务中断，这样可以提高用户业务体验。

采用本申请实施例提供的确定网络设备的状态的方法，预警分析设备获取预设时长内网络设备的多个目标关键绩效指标KPI数据，以及获取多个特征信息，根据每个特征信息对所述多个目标KPI数据进行处理，生成每个特征信息对应的元素，并将生成的所述多个特征信息对应的元素组成所述特征向量，并根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态。这样，通过分析一段时间内的多个目标KPI数据来确定网络设备的状态，而不仅仅通过一个时刻的数据来确定所述网络设备的状态，可以使得确定的网络设备的准确性较高，从而可以减少预警的遗漏。

基于以上实施例，本申请实施例还提供了一种预警分析设备，该预警分析设备应用于如图1所示的网络系统中的预警分析设备，用于实现如图2所示的确定网络设备的状态的方法。参阅图5所示，该预警分析设备500包括：获取单元501和处理单元502，其中：

所述获取单元501，用于获取预设时长内网络设备的多个目标KPI数据，以及获取多个特征信息，其中，任一个特征信息用于表征特征向量中所述特征信息对应的元素的计算方式；

所述处理单元502，用于根据每个特征信息对所述多个目标KPI数据进行处理，生成每个特征信息对应的元素，将生成的所述多个特征信息对应的元素组成所述特征向量，并根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态。

在一种可选的实施方式中，所述处理单元502在根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态时，具体用于：根据所述预警分析模型，对所述特征向量进行分析，确定所述网络设备处于每种状态的概率值；将每个概率值与预设的该概率值对应的状态的基准值相乘，得到多个乘积值，并将所述多个乘积值相加，得到状态指示值；确定所述状态指示值所属的设定指示值范围，将所述设定指示值范围对应的状态作为所述网络设备的状态。

在一种可选的实时方式中，所述获取单元501还用于获取所述网络设备的不同网络设备状态对应的特征向量样本；所述处理器502在根据预设的预警分析模型，对所述特征向量进行分析之前，还用于生成所述预警分析模型：在所述获取单元501获取所述网络设备的不同网络设备状态对应的特征向量样本后，对每种网络设备状态以及该网络设备状态对应的特征向量样本进行逻辑回归处理，得到所述预警分析模型。

在一种可选的实施方式中，所述预警分析设备500还包括：接收单元，用于接收网管设备持续发送的所述网络设备的KPI数据；所述获取单元501在获取所述预设时长内网络设备的多个目标KPI数据时，具体用于：从所述接收单元接收的所述KPI数据中，获取所述预设时长内的所述多个目标KPI数据。

在一种可选的实施方式中，所述网络设备可以为波分设备、路由器、分组传送网设备等。

采用本申请实施例提供的预警分析设备，获取预设时长内网络设备的多个目标关键绩效指标KPI数据，以及获取多个特征信息，根据每个特征信息对所述多个目标KPI数据进行处理，生成每个特征信息对应的元素，并将生成的所述多个特征信息对应的元素组成所述特征向量，并根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态。这样，通过分析一段时间内的多个目标KPI数据来确定网络设备的状态，而不仅仅通过一个时刻的数据来确定所述网络设备的状态，可以使得确定的网络设备的准确性较高，从而可以减少预警的遗漏。

需要说明的是，本申请实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。在本申请的实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

基于以上实施例，本申请实施例还提供了一种预警分析设备，所述预警分析设备应用于如图1所示的网络系统中的预警分析设备，用于实现如图2所示的确定网络设备的状态的方法。参阅图6所示，所述预警分析设备600包括：处理器602和存储器603，其中：

所述处理器602可以是中央处理器(central processing unit，CPU)，网络处理器(network processor，NP)或者CPU和NP的组合。所述处理器602还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit，ASIC)，可编程逻辑器件(programmable logic device，PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device，CPLD)，现场可编程逻辑门阵列(field-programmable gate array，FPGA)，通用阵列逻辑(generic array logic，GAL)或其任意组合。

所述处理器602和所述存储器603之间相互连接。可选的，所述处理器602和所述存储器603通过总线604相互连接；所述总线604可以是外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

所述预警分析设备600在实现如图2所示的确定网络设备的状态的方法时：

所述处理器602，用于获取预设时长内网络设备的多个目标关键绩效指标KPI数据；

获取多个特征信息，任一个特征信息用于表征特征向量中所述特征信息对应的元素的计算方式；

根据每个特征信息对所述多个目标KPI数据进行处理，生成每个特征信息对应的元素；

所述预警分析设备将生成的所述多个特征信息对应的元素组成所述特征向量，并根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态。

所述存储器603，用于存放程序等。具体地，程序可以包括程序代码，该程序代码包括计算机操作指令。所述存储器603可能包括RAM，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。所述处理器602执行所述存储器603所存放的应用程序，实现上述功能，从而实现如图2所示的确定网络设备的状态的方法。

在一种可选的实施方式中，所述处理器602，在根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态时，具体用于：根据所述预警分析模型，对所述特征向量进行分析，确定所述网络设备处于每种状态的概率值；将每个概率值与预设的该概率值对应的状态的基准值相乘，得到多个乘积值，并将所述多个乘积值相加，得到状态指示值；确定所述状态指示值所属的设定指示值范围，将所述设定指示值范围对应的状态作为所述网络设备的状态。

在一种可选的实施方式中，所述处理器602，在根据预设的预警分析模型，对所述特征向量进行分析之前，还用于生成所述预警分析模型：获取所述网络设备的不同网络设备状态对应的特征向量样本；对每种网络设备状态以及该网络设备状态对应的特征向量样本进行逻辑回归处理，得到所述预警分析模型。

在一种可选的实施方式中，所述预警分析设备600还包括：通信接口601，用于接收数据；所述处理器602，在获取所述预设时长内网络设备的多个目标KPI数据时，具体用于：控制所述通信接口601接收网管设备持续发送的所述网络设备的KPI数据；从接收的所述KPI数据中，获取所述预设时长内的多个目标KPI数据。

综上所述，通过本申请实施例提供一种确定网络设备的状态的方法及装置，预警分析设备，获取预设时长内网络设备的多个目标关键绩效指标KPI数据，以及获取多个特征信息，根据每个特征信息对所述多个目标KPI数据进行处理，生成每个特征信息对应的元素，并将生成的所述多个特征信息对应的元素组成所述特征向量，并根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态。这样，通过分析一段时间内的多个目标KPI数据来确定网络设备的状态，而不仅仅通过一个时刻的数据来确定所述网络设备的状态，可以使得确定的网络设备的准确性较高，从而可以减少预警的遗漏。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请实施例的范围。这样，倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

一种确定网络设备的状态的方法，其特征在于，包括：

预警分析设备获取预设时长内网络设备的多个目标关键绩效指标KPI数据；

所述预警分析设备获取多个特征信息，任一个特征信息用于表征特征向量中所述特征信息对应的元素的计算方式；

所述预警分析设备根据每个特征信息对所述多个目标KPI数据进行处理，生成每个特征信息对应的元素；

所述预警分析设备将生成的所述多个特征信息对应的元素组成所述特征向量，并根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态。
如权利要求1所述的方法，其特征在于，所述预警分析设备根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态，包括：

所述预警分析设备根据所述预警分析模型，对所述特征向量进行分析，确定所述网络设备处于每种状态的概率值；

所述预警分析设备将每个概率值与预设的该概率值对应的状态的基准值相乘，得到多个乘积值；

所述预警分析设备将所述多个乘积值相加，得到状态指示值；

所述预警分析设备确定所述状态指示值所属的设定指示值范围，将所述设定指示值范围对应的状态作为所述网络设备的状态。
如权利要求1或2所述的方法，其特征在于，所述预警分析设备在根据预设的预警分析模型，对所述特征向量进行分析之前，所述方法还包括：

所述预警分析设备生成所述预警分析模型：

所述预警分析设备获取所述网络设备的不同状态对应的特征向量样本；

所述预警分析设备对每种状态以及该网络设备状态对应的特征向量样本进行逻辑回归处理，得到所述预警分析模型。
如权利要求1-3任一项所述的方法，其特征在于，所述预警分析设备获取所述预设时长内网络设备的多个目标KPI数据，包括：

所述预警分析设备接收网管设备持续发送的所述网络设备的KPI数据；

所述预警分析设备从接收的所述KPI数据中，获取所述预设时长内的多个目标KPI数据。
如权利要求1-4任一项所述的方法，其特征在于，所述网络设备为以下任一种设备：波分设备、路由器、分组传送网设备。
一种预警分析设备，其特征在于，包括：

存储器，用于存储程序指令；

处理器，用于调用所述存储器中的程序指令以执行下述方法：

获取预设时长内网络设备的多个目标关键绩效指标KPI数据；

获取多个特征信息，任一个特征信息用于表征特征向量中所述特征信息对应的元素的计算方式；

根据每个特征信息对所述多个目标KPI数据进行处理，生成每个特征信息对应的元素；

将生成的所述多个特征信息对应的元素组成所述特征向量，并根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态。
如权利要求6所述的预警分析设备，其特征在于，所述处理器，在根据预设的预警分析模型，对所述特征向量进行分析，确定所述网络设备的状态时，具体用于：

根据所述预警分析模型，对所述特征向量进行分析，确定所述网络设备处于每种状态的概率值；

将每个概率值与预设的该概率值对应的状态的基准值相乘，得到多个乘积值；

将所述多个乘积值相加，得到状态指示值；

确定所述状态指示值所属的设定指示值范围，将所述设定指示值范围对应的状态作为所述网络设备的状态。
如权利要求6或7所述的预警分析设备，其特征在于，所述处理器，在根据预设的预警分析模型，对所述特征向量进行分析之前，还用于：

生成所述预警分析模型：

获取所述网络设备的不同状态对应的特征向量样本；

对每种网络设备状态以及该状态对应的特征向量样本进行逻辑回归处理，得到所述预警分析模型。
如权利要求6-8任一项所述的预警分析设备，其特征在于，所述预警分析设备还包括：

通信接口，用于接收数据；

所述处理器，在获取所述预设时长内网络设备的多个目标KPI数据时，具体用于：

控制所述通信接口接收网管设备持续发送的所述网络设备的KPI数据；

从接收的所述KPI数据中，获取所述预设时长内的多个目标KPI数据。
如权利要求6-9任一项所述的预警分析设备，其特征在于，所述网络设备为以下任一种设备：波分设备、路由器、分组传送网设备。
一种计算机存储介质，其特征在于，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令在被所述计算机调用时用于使所述计算机执行权利要求1-5任一项所述的方法。
一种包含指令的计算机程序产品，其特征在于，当所述计算机程序产品在计算机上运行时，使得计算机执行权利要求1-5任一项所述的方法。
一种芯片，其特征在于，所述芯片与存储器相连，用于读取并执行所述存储器中存储的程序指令，以实现权利要求1-5任一项所述的方法。